パスワードを忘れた? アカウント作成
305060 journal

yasuokaの日記: 濁点つきの変体仮名 2

日記 by yasuoka

思うところあって、JTC1/SC2/WG2 N3698をチェックしなおしてみたのだが、やはり、この変体仮名提案はあまりスジが良くない。戸籍統一文字に含まれている変体仮名168字と較べてみても、少なくとも900180900240900700は、N3698には含まれていない。また、U+1B0xxへの追加ってのも、新たな変体仮名が「発見」された場合に仮名の順序が狂ってしまう、という点でイマイチだ。通常の「仮名」(U+30xx)にVariation Selectorをくっつける形での符号化の方が、まだマシな気がする。

ただ、その場合、濁点つきの変体仮名をどうするか、という問題があるのは確かだ。たとえば「ば」の変体仮名の場合に、「は」(U+306F)にVariation Selectorを付けた後で濁点(U+3099)を付けるのか、それとも「ば」(U+3070)にVariation Selectorを直接付けるのか、という点は考慮の余地があるだろう。私(安岡孝一)個人としては、「ば」(U+3070)にVariation Selectorを付ける方がフォントの実装が楽そうだと思うのだけど、「U+306F U+3099」にVariation Selectorを付けた場合との等価性判定がヤヤコシイかな…。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
  • by emk (30939) on 2011年03月09日 20時49分 (#1915199) 日記

    「ば」はdecomposable characterですし、濁点(U+3099)はcombining characterですから、考えるまでもなく「は」+VS+濁点しかありえないと思うのですが。
    それより「者」をくずした変体仮名と「波」をくずした仮名を同じbase characterで表していいのかどうかが気になります。個人的には、もととなった漢字が違うものはU+1B0xxに符号化したいです。ソートはUCAで何とかするってことで。どのみちU+3094..U+3096とかU+30F7..U+30FAとかU+1B000..U+1B001のソートで必要になりますし。

    • ところがですね、実際の戸籍とかを見ていくと、くずし元がハッキリしない変体仮名があったり、濁点が左上についている(ように見える)変体仮名があったりするのです。でも、そういうのでも、いつかは符号化しなきゃいけないし…。
      親コメント
typodupeerror

日々是ハック也 -- あるハードコアバイナリアン

読み込み中...