ってニュースの見出しが見えるけど、2^24の1文字3Bytesでも十分だったな。UTF-8エンコードを考えるとなおさら。
17214486 journal leiqunniの日記: 「Unicode 15」リリース、合計の文字数は15万点近くに 3 日記 by leiqunni 2023年09月07日 0時42分 ってニュースの見出しが見えるけど、2^24の1文字3Bytesでも十分だったな。UTF-8エンコードを考えるとなおさら。
可変長イクナイ (スコア:0)
3バイトだとメモリからのロードが面倒だったり境界またぎでパフォーマンス落ちたり。
まあ今では無視できる程度の話ですが。
Re:可変長イクナイ (スコア:3)
外人が作るテキストエディタはだいたい内部コードがUTF-8なんですよね。
WindowsかJavaのソフトだとUTF-16なんですが。
ワイからしたら可変長のUTF-8は気持ち良くないんですけど、
外人はcharで処理してやがる。ucharですらない。
UTF-8が良くできてて、そのバイトがマルチバイト文字の何バイト目かすぐ分かるから、
基本ASCIIで考えてそこの部分だけど後から考えるんでしょうな。
ファイル名もchar* fileと書いとけば、システムがUTF-8なら問題ないし。
ワイは日本人だから、wchar_tにするか、UTF-16かUTF-32かでずっと前に進めてない。。
Re:可変長イクナイ (スコア:1)