yasuokaの日記: JIS X 0212-1990とJIS X 0213:2004 5
第3/第4水準漢字は補助漢字を包含する
とあったので、さすがにギョッとなった。そんなこと、私、語ってないぞ。『JIS X 0212とJIS X 0213』(京都大学大型計算機センター第64回研究セミナー報告, 2000年3月24日, pp.19-46)にも書いたとおり、JIS X 0212-1990の文字のうち3144字程度はJIS X 0213:2000に含まれていない。ここで「程度」と書いたのにはわけがあって、「嶲」「殩」「瓯」「籩」「鳦」などのように、JIS X 0212とJIS X 0213で包摂関係がないにもかかわらず、Unicodeが共有されているというヤヤコシイ字があるからだ。さらには、JIS X 0213:2000とJIS X 0213:2004との間で追加された10字のうち、「瘦」と「繫」の2字がJIS X 0212に含まれているが、「瘦」の方はJIS X 0212と微妙に字体が違う、というヤヤコシサだ。こういうヤヤコシイ字があるために、JIS X 0213:2004の第三・第四水準漢字ですら、XPとVistaで字体が変わってしまうものがある(ここの図4とここの図8)のだが、Surrogate Pairまわりの話の方が記者さんの耳触りがよかったのか、そっちばかり書かれてしまった。文字合成についても、JIS X 0213とUnicodeでRound Trip Conversionが崩壊している点(ここの図16)も、ちゃんと話したんだけどな。EUC-JIS-2004は「半角カナ」を除けばJIS X 0213:2004の本体に規定されてるってのも話したのに、Shift_JIS-2004ばっかり強調した論調になってるし。この記事には、他にもツッコミどころが山ほどあるが
安岡氏:2004年の改正で難しかったのは,表外漢字字体表の通りに字形を変更すると,Unicodeと対応できなくなる文字が存在したことです。
そんなこと、語ってないってば。「Unicodeとの対応が変わってしまう文字が存在した」でしょ。うーむ、どうしたらいいのやら…。
通りすがりで恐縮ですが (スコア:0)
平河町じゃなくて今は白金 (スコア:1)
Re:平河町じゃなくて今は白金 (スコア:1)
文字コード問題って
1.みんなが問題を認識して
2.アプリをこつこつ直していく
という作業が必要なのですが、Webにおかしな文字コード解説が氾濫していて1が非常に困難、という大問題
(すくなくとも僕は大問題だと思う)があります。
それにあの記事のままだと安岡さんの名誉のためにもならんような・・・・
Re:平河町じゃなくて今は白金 (スコア:1)
Re:平河町じゃなくて今は白金 (スコア:1)