パスワードを忘れた? アカウント作成
344428 journal

yasuokaの日記: UCSにない通用規範漢字 4

日記 by yasuoka

思うところあって、朱一星の『漢字の国際コード規格をどう考えるべきか』(京都外国語大学研究論叢, 76号(2011年1月), pp.211-223)を読んでみたのだが、文字コード規格に対する現状認識に誤りが多く、かなりひどいシロモノだった。中でも『通用規範漢字表(征求意見稿)』(2009年8月12日)に関する以下のくだりは、特にひどい誤りが書かれていたので、ここに晒しておくことにする。

(勑)、(噁)、(勣)、(頫)、(驩)、(鑪)

該当簡化字が存在しないため,「簡化字総表」また「印刷通用漢字字形表」に準じて新規に生成するであろう(例示は全て繁体字)。
上記一覧表は筆者がネットで公開された情報に基いて作成したもので,対応簡化字は最終的な確定字体ではないが,それでもかなりの確率で次のことが言える。… 6文字は今までの簡化字との整合性からすれば,新たに簡化字が生成されることになる。
中国は,前世紀から一貫して文字整理の努力を行ってきた。それとは裏腹に,「勑」以下のいわゆる「類推簡化字」が現在のUnicodeにもGBコードにも存在しないため,新「漢字表」 の措置は,漢字の「絶対字数」の更なる増加に繋がる。極少数の漢字ではあるが,漢字数の益々の増加 と正誤関係の煩雑さを増幅させる恐れはある。

6867「𠡠」はU+20860に収録されている。6995「𪟝」もU+2A7DDに収録されている。7526「𫖯」もU+2B5AFに収録されている。7664「⿰口恶」・8262「⿰马雚」・7075「⿰钅卢」が現時点のUCSに収録されていないのは事実だが、それを言うなら4003「⿰火区」・6521「⿰讠于」・6554「⿰氵万」など、少なくとも150字がUCSに含まれておらず、これらに言及しないのは片手落ちだ。というか朱一星は、『通用規範漢字表(征求意見稿)』8300字とUnicodeを突き合わせてみる、という基本的作業すらやらずに、この論考を書いているように思える。

しかも、このような議論の方向であれば、当然IICoreに対する言及もあってしかるべきだ、と思うのだが、朱一星の論考ではWikipediaを引いただけ、というオソマツさだ。そのうえで、新たな文字コードらしきものを提案しているのだが、そもそも現状認識が不十分きわまりないため、砂上の楼閣としか言いようのないシロモノになってしまっている。現状の文字コードに対する批判をもとに、新たな文字コードを提案する、というのは、もちろん、研究者がやるべき仕事の一つだが、それならそれで、きっちりとした批判をもとにやるべきだと思う。

この議論は、yasuoka (21275)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
  • すみません、↑で「少なくとも150字がUCSに含まれておらず」と書いたのですが、再チェックしてみたところ133字でした。ごめんなさい。一覧表を今日の日記 [srad.jp]に載せましたので、よければごらん下さい。

    • 初めまして,朱一星です。研究所から先生のご意見を廻してきました。
      ご指摘ありがとうございます。

      お名前はかねがね伺っておりました。大変敬服しております。

      確かに,ご指摘の通り,自ら確認の作業をサボりました・・・反省します。
      但し,本意は「新漢字表」に「類推新簡体字」の採用で収拾が付かないのではと懸念を表し,字数の多寡というより,Extension D,Extension Eに収録かどうかというより,「造字」であることに問題があります。(国際規格にそのような新漢字を次々詰め込むのも,問題視すべきではないかと小生は思うのですが)。

      ちなみに,同様の「新簡体字」は256字でした。
      これは「通用規範漢字表」の説明で触れているので,自らはまだ逐一確認したわけではありませんが(汗)。

      IICOREのほうですが,問題(繁体字簡体字を同一次元で扱う)をそのまま引き継いでいるようで,残念に思います。
      個人的には,符号化文字基本集合(BUCS)は注目に値すると思うが,日本だけでは良さが現れないでしょうね。
      今後ともご叱咤ご指導のほど,よろしくお願いします。

      親コメント
      • 7月15日の日記 [srad.jp]でもコメントしたのですが…

        但し,本意は「新漢字表」に「類推新簡体字」の採用で収拾が付かないのではと懸念を表し,字数の多寡というより,Extension D,Extension Eに収録かどうかというより,「造字」であることに問題があります。

        そのあたりを問題視されるのなら、なぜ逆に、3640「阪」や7649「⿰石肯」あるいは6824「⿰土夅」を問題視なさらないのか、私には甚だ疑問です。とりあえず一度『通用規範漢字表(征求意見稿)』8300字を、一字のこらず全てちゃんと吟味なさることを強くオススメいたします。

        親コメント
        • 各々の漢字を精査してから,それぞれ適切かどうかを論じるのは大切だというご意見,ごもっともだと思います。
          特に日本では,歴代文字コードの異同を緻密に比較されているところから見ると,当然な作業だと思われるでしょう。

          ただ,コメントにある安岡先生の「疑問」とはいったい何でしょうか,今ひとつよく伝わりません。3640「阪」は造字ではないので,同列に論じられないでしょう。(若しかしたらフォント表現のことでしょうか?)。7649「⿰石肯」は先生のコメントのように地名であるなら,「類推簡体造字」とも言えませんね。
          ・・・勿論,これでほかに問題はないという意味ではありませんが。

          一方,そもそも09年時点の通用規範漢字表(徴求意見稿)の意図は明確ではないため,矛盾と思われる基準が世間のブーイングを招いています。
          一字ずつ検証するまでもない(?)というか,前提となるはずの文字方針の揺れに疑問を呈したわけであります。

          そもそも中国では,日本と違って,漢字については1字ずつ小刻みに改正するのではなく,方針を決めてからドンと実行するような方法でやってきたからです。

          拙稿を全部お読みになれば分かるように,漢字が「廃止」から「継承」へ変わるなか,より漢字の使用実態に合う簡体字政策や,日本・中国・台湾など「異漢字系」同士でもよりスムーズに,社会一般感覚に合う符号化の方法を選択すべく,いろいろ模索しています。かなり挑戦的ではありますが,決して無謀ではないと思います。

          そのためにも,IRGの動向をより正確に把握すべきだというお言葉も,真摯に受けとめたいと思います。

          親コメント
typodupeerror

私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike

読み込み中...