Fediverse search system

Fediver

beta version

【Unicode】の検索結果


まぁ、UTF-8が覇権を握っている現代においての機種依存文字とはUnicodeに含まれない文字と言うことで良いだろう
例えば、KPS 9566には最高指導者の名前を表すための専用の"김"の文字があるけど、これはUnicodeには含まれてない


カスタム絵文字→ライセンスが……ちくちく言葉が……
Unicode絵文字→不適切な使い方が……肌色の表示が……

やっぱ人類には早すぎる機能だったか!


トルコのお守りでさいきん(?)追加された絵文字なのね

The nazar was added to Unicode as U+1F9FF 🧿 NAZAR AMULET in 2018
https://en.wikipedia.org/wiki/Nazar_(amulet)


☭が内部の文字コードを推測するのに有用な文字であることに気付いた

  1. 🫠を入れて通るか
    通る→Unicodeでサロゲートペア対応
    通らない→2へ

  2. ☭を入れて通るか
    通る→Unicodeだけどサロゲートペア非対応
    通らない→JISコード


東アジアの土着文字コードでキリル文字が全角として定義されてるからといって, 国際規格のUnicodeで勝手に全角にしていいわけがない


@natumi_kaoru そもそもUnicodeのEast Asian Widthでキリル文字はNeutralもしくはAmbiguousになってる
勝手に日本人が全角にするべきじゃない





unicode絵文字に河童ないのか 👺はあるのに


@Kazemidori_x86 大量にある

  1. 文字の割り当てに一部ASCII互換性がない
    0x5C: バックスラッシュが円マークになる
    0x7E: チルダがオーバーラインになる

  2. ASCIIにない文字をエンコードしたとき, 2バイト目にASCII文字であり得るコードが出ることがある
    特に致命的なのが, 0x5Cが出てきうること
    0x5Cはプログラミング言語でエスケープ文字として使われるから, 思わぬ不具合が発生する

  3. 2バイトに世界の言語が収まるわけがない
    Unicodeが犯した失敗をもう一度繰り返す?


2019年3月、ついに任意のUnicode絵文字リアクションを送ることができるようになり、それまでの🍣派と🍮派の対立は解消された……

RE:
https://misskey.nokotaro.com/notes/5c7bd35e8a23de0838d6e7c3


tohoho-web.com/wwwxx042.htm

撚 で「ハートマーク」を表示することができます。

この記述がかなり奇妙で, 63889は16進数でF991になるのだが, U+F991は"撚"という文字に割り当たってる
ある者は「これはShift-JISのコードポイントではないか」と言うが, HTMLの仕様書を調べたところ, ページのエンコーディングに関係なく数値文字参照に書く数値はUnicodeのコードポイントのようだ
ここから辿ってみると, この仕様書における「コードポイント」の意味に辿り着ける

結局, 撚が何故ハートマークを表現するのかわからなかった


Unicodeはالله أكبر(アッラーは偉大なり)を3文字で表現できる
ﷲ ﷳ


お、直った直った!

システムロケールの設定で「ベータ:ワールドワイド言語サポートでUnicode UTF-8 を使用」をオンにするとダメみたい。

古いプログラムだとこの設定入れると文字化けするっぽい。

しかし、なんでこの設定入れたんだろう……?
なんかで必要だったはずなんだけどw