パスワードを忘れた? アカウント作成
506789 journal

yasuokaの日記: JIS X 0212-1990とJIS X 0213:2004 5

日記 by yasuoka
中田敦の『VistaでUnicode以外の選択肢はなかったのか?──京大の安岡助教授が語る』(日経ITPro, 2006年12月26日)を読みなおしていて、図1に

第3/第4水準漢字は補助漢字を包含する

とあったので、さすがにギョッとなった。そんなこと、私、語ってないぞ。『JIS X 0212とJIS X 0213』(京都大学大型計算機センター第64回研究セミナー報告, 2000年3月24日, pp.19-46)にも書いたとおり、JIS X 0212-1990の文字のうち3144字程度はJIS X 0213:2000に含まれていない。ここで「程度」と書いたのにはわけがあって、「嶲」「殩」「瓯」「籩」「鳦」などのように、JIS X 0212とJIS X 0213で包摂関係がないにもかかわらず、Unicodeが共有されているというヤヤコシイ字があるからだ。さらには、JIS X 0213:2000とJIS X 0213:2004との間で追加された10字のうち、「瘦」と「繫」の2字がJIS X 0212に含まれているが、「瘦」の方はJIS X 0212と微妙に字体が違う、というヤヤコシサだ。こういうヤヤコシイ字があるために、JIS X 0213:2004の第三・第四水準漢字ですら、XPとVistaで字体が変わってしまうものがある(ここの図4とここの図8)のだが、Surrogate Pairまわりの話の方が記者さんの耳触りがよかったのか、そっちばかり書かれてしまった。文字合成についても、JIS X 0213とUnicodeでRound Trip Conversionが崩壊している点(ここの図16)も、ちゃんと話したんだけどな。EUC-JIS-2004は「半角カナ」を除けばJIS X 0213:2004の本体に規定されてるってのも話したのに、Shift_JIS-2004ばっかり強調した論調になってるし。この記事には、他にもツッコミどころが山ほどあるが

安岡氏:2004年の改正で難しかったのは,表外漢字字体表の通りに字形を変更すると,Unicodeと対応できなくなる文字が存在したことです。

そんなこと、語ってないってば。「Unicodeとの対応が変わってしまう文字が存在した」でしょ。うーむ、どうしたらいいのやら…。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

最初のバージョンは常に打ち捨てられる。

読み込み中...