【Unicode】の検索結果
まぁ、UTF-8が覇権を握っている現代においての機種依存文字とはUnicodeに含まれない文字と言うことで良いだろう
例えば、KPS 9566には最高指導者の名前を表すための専用の"김"の文字があるけど、これはUnicodeには含まれてない
カスタム絵文字→ライセンスが……ちくちく言葉が……
Unicode絵文字→不適切な使い方が……肌色の表示が……
やっぱ人類には早すぎる機能だったか!
トルコのお守りでさいきん(?)追加された絵文字なのね
The nazar was added to Unicode as U+1F9FF 🧿 NAZAR AMULET in 2018https://en.wikipedia.org/wiki/Nazar_(amulet)
☭が内部の文字コードを推測するのに有用な文字であることに気付いた
🫠を入れて通るか
通る→Unicodeでサロゲートペア対応
通らない→2へ☭を入れて通るか
通る→Unicodeだけどサロゲートペア非対応
通らない→JISコード
東アジアの土着文字コードでキリル文字が全角として定義されてるからといって, 国際規格のUnicodeで勝手に全角にしていいわけがない
@natumi_kaoru そもそもUnicodeのEast Asian Widthでキリル文字はNeutralもしくはAmbiguousになってる
勝手に日本人が全角にするべきじゃない
微妙に使い所のよくわからないUnicode絵文字
🈂️
なお, 絵文字の発祥の地である日本では未だに行政システムのUnicode化も済んでいないし, 通帳の明細に関しては半角カナしか使えない模様
https://gigazine.net/news/20201227-emoji-utf-8/
@Kazemidori_x86 大量にある
文字の割り当てに一部ASCII互換性がない
0x5C: バックスラッシュが円マークになる
0x7E: チルダがオーバーラインになるASCIIにない文字をエンコードしたとき, 2バイト目にASCII文字であり得るコードが出ることがある
特に致命的なのが, 0x5Cが出てきうること
0x5Cはプログラミング言語でエスケープ文字として使われるから, 思わぬ不具合が発生する2バイトに世界の言語が収まるわけがない
Unicodeが犯した失敗をもう一度繰り返す?
2019年3月、ついに任意のUnicode絵文字リアクションを送ることができるようになり、それまでの🍣派と🍮派の対立は解消された……
RE: https://misskey.nokotaro.com/notes/5c7bd35e8a23de0838d6e7c3
https://www.tohoho-web.com/wwwxx042.htm
撚
で「ハートマーク」を表示することができます。
この記述がかなり奇妙で, 63889は16進数でF991になるのだが, U+F991は"撚"という文字に割り当たってる
ある者は「これはShift-JISのコードポイントではないか」と言うが, HTMLの仕様書を調べたところ, ページのエンコーディングに関係なく数値文字参照に書く数値はUnicodeのコードポイントのようだ
ここから辿ってみると, この仕様書における「コードポイント」の意味に辿り着ける
結局, 撚
が何故ハートマークを表現するのかわからなかった
Unicodeはالله أكبر(アッラーは偉大なり)を3文字で表現できる
ﷲ ﷳ
お、直った直った!
システムロケールの設定で「ベータ:ワールドワイド言語サポートでUnicode UTF-8 を使用」をオンにするとダメみたい。
古いプログラムだとこの設定入れると文字化けするっぽい。
しかし、なんでこの設定入れたんだろう……?
なんかで必要だったはずなんだけどw