パスワードを忘れた? アカウント作成
17214486 journal
日記

leiqunniの日記: 「Unicode 15」リリース、合計の文字数は15万点近くに 3

日記 by leiqunni

ってニュースの見出しが見えるけど、
2^24の1文字3Bytesでも十分だったな。
UTF-8エンコードを考えるとなおさら。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2023年09月07日 22時01分 (#4524897)

    3バイトだとメモリからのロードが面倒だったり境界またぎでパフォーマンス落ちたり。
    まあ今では無視できる程度の話ですが。

    • 外人が作るテキストエディタはだいたい内部コードがUTF-8なんですよね。
      WindowsかJavaのソフトだとUTF-16なんですが。
      ワイからしたら可変長のUTF-8は気持ち良くないんですけど、
      外人はcharで処理してやがる。ucharですらない。

      UTF-8が良くできてて、そのバイトがマルチバイト文字の何バイト目かすぐ分かるから、
      基本ASCIIで考えてそこの部分だけど後から考えるんでしょうな。
      ファイル名もchar* fileと書いとけば、システムがUTF-8なら問題ないし。

      ワイは日本人だから、wchar_tにするか、UTF-16かUTF-32かでずっと前に進めてない。。

      親コメント
    • by nekopon (1483) on 2023年09月08日 8時40分 (#4525034) 日記
      x86「なんだと」
      親コメント
typodupeerror

長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds

読み込み中...