パスワードを忘れた? アカウント作成
17619 journal

yasuokaの日記: IVDのダブリ 2

日記 by yasuoka
Ideographic Variation Database2007年12月14日版をチェックしていたところ、Adobe-Japan1のCID+13912がダブって収録されているのに気づいた。「U+9039 U+E0101」と「U+9054 U+E0101」の2個所にある。これ、たぶんU+9054の方が正しいんだけど、どうしてダブってるんだろ?

あと、ざっと見てみたところ、CID+13383が「U+4F75 U+E0101」ってのは正直、気に入らない。やっぱり「U+5002 U+E0101」でしょ。同様にCID+8436、CID+13356、CID+13989、CID+13725、CID+13370なんかも、それぞれU+5BEC、U+613C、U+665A、U+9115、U+93ADに移したいところだ。とりあえずKen Lundeには連絡しておくけど、移したらマズイ事情でもあるのかしら?

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by emk (30939) on 2008年01月09日 21時02分 (#1277859) 日記

    移したらマズイ事情でもあるのかしら?

    わかってて言ってるとしか思えませんが、そりゃ正式リリースされてから移したらマズイに決まってるでしょう。

    http://www.unicode.org/ivd/index.html [unicode.org]

    Once released, a version is immutable.

    http://www.unicode.org/reports/tr37/ [unicode.org]

    To guarantee the stability of texts using registered IVSes, the association between an IVS and a glyphic subset is permanent: an IVS is never reassigned to another glyphic subset.

    もし公開レビューでも同じことを言ったのにスルーされたのでしたらすみません。

    • by yasuoka (21275) on 2008年01月10日 10時41分 (#1278124) 日記
      ま、実は以前も個人的には聞いてみたんですけど、結局のところは「歴史的理由」でダメだったみたいです。 たとえばCID+13383だと、「倂」(U+5002)と「併」(U+4F75)の可能性があるけど、CID+13383はそもそもAdobe-Japan1-4に『標準校正必携』から採用された字だから、「併」の異体字を意図していたと考えるべきだろう、というのがKenの見解なのです。

      でもさすがにCID+13912だけは、「わざわざダブらせる」っていう大技で対応してくれたんだけどなぁ…。

      親コメント
typodupeerror

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

読み込み中...