人名等の6万種の漢字を市販コンピュータで扱える1万種の漢字に置き換える縮退マップ公開、意見募集 44
ストーリー by hylom
あなたの名前は表示できる? 部門より
あなたの名前は表示できる? 部門より
独立行政法人情報処理推進機構(IPA)が、「人名などの正確な表記が求められる行政の実務に必要な約6万種の漢字」を一般的なPCで表示できるJIS X 0213の約1万種の漢字に置き換えるためのマッピングデータ「縮退マップ(検証版)」を公開した(ZDNet Japan)。
行政の実務などでは人名などの正確な表記が必要になるため、それらの漢字を正確に表せるフォントや文字データなどが開発されている。しかし、一般的なPCやスマートフォンなどではそれら文字データは利用できないことが多く、またそこまで正確な表記が必要ではない場合も多い。そこで、これらを変換するためのマッピングデータを開発したという。
ざっとチェックしてみたのですけど (スコア:5, 参考になる)
Re:ざっとチェックしてみたのですけど (スコア:2)
文書「縮退マップ利用ガイド」では「2.4 縮退候補を示さない場合」で対応づけが適切でないと判断したものが約三万文字、不明な文字が約四百文字、としていますね。
http://mojikiban.ipa.go.jp/contents/2015/03/MJShrinkMapGuideV1.0.pdf [ipa.go.jp]
Re: (スコア:0)
縮退マップ利用ガイド [pdf形式, 0.6MByte] [ipa.go.jp]
によると、
2.4. 縮退候補を示さない場合
(ア) 辞書の上で、固有の意味等を持つ文字であると判断され、JIS文字集合に属する別の文字へ対応付けることは適切ではないと判断したもの。
このような文字は約30,000文字ありました。
(イ) 辞書に見出すことができず、読み、意味等も不
旧字体=正字? (スコア:5, 興味深い)
うちの苗字が高○(以下、新字体)というのだけど、本来は髙○(以下、旧字体)と書く。これが曲者で、いま「本来は」と書いたのだけど、それが本当なのかどうかがどうも分からない。
高校生の頃だったか、それまでずっと新字体を使ってきたのだけど、高校卒業にあたってオヤジが「卒業証書は正式な字で書いてもらえ」というので卒業証には旧字体が使われている。その後、大学に進んで自動車免許を取得する時にも旧字体で申告して旧字体で許可が降りた。
一方、役所関係はというと、平成のいつ頃からだったか旧字体から新字体への移行が自動で行われたとのことで、戸籍も住民票もどちらも新字体に変更されている。従って、現在は通常身分証明に使う免許証は旧字体、住民票は新字体となっていて、一致していない。
役所に問い合わせると、新字体を旧字体に直すには裁判所に願い出て変更許可の審判をもらわないといけないとのこと。免許証の方は未確認だが、おそらく戸籍謄本と住民票を持って行けば新字体に変えてくれるだろう。
問題は、果たしてどちらの字体が「正しい」のか?に尽きると思うのだけど、これが最初に書いたようによく分からないのだ。オヤジを問い詰めると、「小さい頃からそう言われていた」というところに行き着いた。誰に言われていたのかは親からということになるんだろうが、既にこの世を去っていて確認できない。オジキに問い合わせると、まったく同じことを言う。それはそうなのかもしれないが、間違って使っていた可能性も否定しきれない。実際、オジキの言い分はこうだった。曰く、「辞書には(旧字体が)『正字』として載っている」。
思うのだが、この「正字」という言葉がかなり誤解されているのではないかと。最近新字体・旧字体の問題で悩んでその手の本を色々調べて知ったのだが、漢字の「正字」というのは「正しい字」のことではない。いくつか異体字がある中で、それを一義的に代表させる文字としましょうというくらいの意味しかない。他の字体・新字体が「新しく作った字」「正式ではない字」であったり、ましてや「正しくない、間違っている字」なわけでは決してない。
なのに、「正字」などという用語をあてがってしまったために、旧字体=本来の字、新字体=押し付けられた間違った字、という認識を持っている人・家系がけっこうあるのではないか。過去帳をたどっていけば、実際に使っていた字体は解明できるだろうが、それとて寺の住職が使っていた字体にすぎないわけだし、それが確定的な証拠となるのかどうか。
新字体・旧字体の別がある苗字の方々、どんな経験をお持ちですか?
Re:旧字体=正字? (スコア:2, 参考になる)
苗字が真○なんだけど、戸籍上は祖父母は眞、父母は眞の上がヒじゃなくて十になっている、そして俺は真。
どうも調べていくと、祖父母の眞が本来の家系の字らしいんだけど、父母が結婚した時に誤って上が十の眞で新戸籍を作成したらしい。
そして、俺が結婚して戸籍を作る時に、「父母の字は誤字という扱いになっているので、真か眞に変更できますよ」と言われ、真にしてもらった。
また、真の後の○は同じ読みの苗字ではあまり使われない漢字(例えば、佐藤さんに対する佐東さんみたいな)なんだが、これもよく調べていくと、祖父母の代で登録を誤っていて、家系の字はよくある方の漢字だった。
どうやら、村が市に吸収された大昔の合併の時に、役場が漢字を間違えたらしい。
母方の親戚でカタカナの名前なんだけど、濁点が抜けていた人もいた。
スズ子なのにスス子になっていたような感じ。
これは、結婚時におかしくなっていた。
まあ、戸籍ってのは数10年前までお役人の手書きだったので、意外といい加減だということだ。
Re:旧字体=正字? (スコア:1)
常用漢字を出したときに現在生きている人の名前の漢字も表外の漢字使用禁止で強制的に変えさせればよかったのに、妙にこだわって、正字だ、誤字だ、点があるだないだ、くっついてる離れてるなんてこだわるから、おかしなことになっている。文字は道具であり、記号だ。固有名称にしかつかわれていないような字体はいらん。
Re: (スコア:0)
手書き署名用として使用するなら認めてもいいけれど、戸籍や住民票、事務処理用には、書体や字体を限定することを強制してもよいのではないか。手書き署名用については、特定の個人が署名したことがわかればいいというレベルのものなので、ある程度自由でも構わない。事務処理用の公の表記については、公共性と合理性を優先して限定すべきだろう。
Re: (スコア:0)
固有名称にしか使われていないような字体はいらんってことは、
大坂とか、崎玉とか、愛姫とか、岐ふとかにするのかな・・・
崎京線とか坂神高速道路とか坂神タイガースなどにも影響しそうだ。
Re:旧字体=正字? (スコア:1)
私の名前は「○髙」の形式なのですが
MS-IME系では昔から人名辞書とか使わなくても
旧字でそのまま一発変換可能。ありがたいことです。
でもLotusNotesで壮絶な文字化けされて
(当時のバージョンでは髙の字があるだけで中国語判定されてしまう)
以降は使いたくないのですが、
変換出来ちゃうのでほかの人が使っちゃうのですね。
困ったものです。
Re:旧字体=正字? (スコア:1)
平成のいつ頃からだったか旧字体から新字体への移行が自動で行われたとのことで
これ、問題なければ変えますよって、その時オヤジさんの所に通知が来てるはず。その時言えば違ったかもしれない。
ただ、「髙」は使えたはず。だから本当に「髙」だったなら言えば修正してもらえるかもしれない。
しかし元の手書きの戸籍にはちょっと違う字がかかれてた可能性もある。
一度、電子化前の画像化されて保存されてるものの写し、原戸籍謄本と言うのを取り寄せてみたら?
参考:
http://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1065110120 [yahoo.co.jp]
「平成2年10月20日から平成6年11月15日までの間」に結婚とか転籍とかしたのなら原戸籍も「高」のはずで、
前の記録(結婚なら親の原戸籍謄本、転籍なら除籍謄本)とか見れば分かると思う。
Re:旧字体=正字? (スコア:1)
似たような経緯で役所に問い合わせたことがあります。引っ越しを何度も繰り返していて、当時の住居地の役所を特定するのも大変だったけど、現住地の役所に履歴が全部残っていて(当たり前)そこから問い合わせまでしてくれました。そのような通知を出したはずだとも言われましたが、記憶にも記録にも残っていないです。おそらく、担当者が字体の違いに気づかずに異字体で登録してしまったのだろうと理解しました。
Re:旧字体=正字? (スコア:1)
髙は旧字体ではなく高の異体字。それも昔から。
新字体が出来て旧字体が異体字とされたとかではない。
自分は戸籍上「髙」だけど、基本的に同一の字と見なされるし「高」で困ったこともなし。
なりすまし防止用に署名の際には一定のルールで使い分けたりしているので、むしろ複数の字体があることが便利だったりする。
Re: (スコア:0)
「字体が違うのでお前の署名ではない」と裁判で証拠にされる可能性があるのでそれは危険。
Re: (スコア:0)
# それなんて伊達正宗
Re: (スコア:0)
政府関係だから「常用漢字の通用字体=正字」ですよ。
名前は画像で管理すればいい (スコア:1)
どうせ当て字も増えてるんだから、データベースにはカナだけでいいでしょ。
個人の検索等はカナorマイナンバーを使えばいいんだから。
Re: (スコア:0)
それを実現するには戸籍にそもそもよみがなが登録されていないという巨大な問題があってだな
Re:名前は画像で管理すればいい (スコア:1)
スクラッチで出来るわけでもなく、予算や既存資産などいろんなしがらみもありそうですしね。
マイナンバー導入で思い切ったシステム刷新が出来ればいいんですけど。
無理 (スコア:0)
えだなし [ipa.go.jp]→十 [ipa.go.jp]
みたく「似ているからこれで良くね?」的な縮退もないようだね。
そういうのは、みんな★とか✡とか下駄記号(〓)にしちゃうのか。
Re:無理 (スコア:1)
いっそ特別な待遇の人たちと同じように通名を普段使うようにしておいて、本名(漢字)はこっそり本籍にしまっておけばOK。
マズイことがあれば、通名替えるだけで気分一新できるし。
Re: (スコア:0)
えだなしはExtension EでついにUCSに追加されたのか。
まぁ起源が向うなので (スコア:0)
こちらで色々とやると色々とヤバイのは分かるので、
前世紀からの流れ的にこの辺のマッピングでしょうがない(走召糸色木亥火暴)
"castigat ridendo mores" "Saxum volutum non obducitur musco"
Re: (スコア:0)
こちらで色々あって増えちゃったものも結構あるんで......
起源が誤字とか、ロゴマーク的にいじったとか、縁起担いだものとか...
歴史の重みというものはあれど、整理する方向でお願いしたいものです。
また使えないテーブル一個作るのかよ (スコア:0)
迷惑でしかないな
Re: (スコア:0)
解決の方向がおかしい。
一般的な環境で6万字使えるようにするか、
行政で使う文字を1万字ちょいに縮退されるかどっちかじゃないかな。
Re:また使えないテーブル一個作るのかよ (スコア:2)
「一般的な環境で6万字使えるようにする」だと、ttf/otf形式のフォントファイルの制限「1つのフォントファイルに格納できるグリフ数は最大65536個」で色々問題が出そうな気も……
Re: (スコア:0)
それよりもメモリ(特にVRAM)の問題の方が切実。
Re: (スコア:0)
中国のGB18030を見習って実装を強制したりします?
余計なことをせんでいい (スコア:0)
全部画像にしちゃえ!
# サイズの問題は無視
yasuoka氏の反応が待たれる (スコア:0)
素人目には、UCSやIVSにMJ文字が追加されるまでの繋ぎとしては妥当な方向性だと思うが、yasuoka氏の意見を聞きたい。
Re:yasuoka氏の反応が待たれる (スコア:1)
四時間以上前(#2791755)に一次所見を述べておられます
Re:yasuoka氏の反応が待たれる (スコア:2)
一般的の範囲はどのくらい? (スコア:0)
> 一般的なPCで表示できるJIS X 0213の約1万種の漢字に
> 一般的なPCやスマートフォンなどでは
私のスマートフォン、JIS X 0213に完全対応してないんですよね
去年出たばかりなのに。
UnicodeでBMP以外のコードポイントに変換される文字
(いわゆるサロゲートペアの文字)
303字は全滅みたいです。
Unicodeで全部出るんじゃないの? (スコア:0)
スマホのUnicodeアプリであらゆる異体字が表示できてるけど。
Re: (スコア:0)
だから、Unicodeを扱えないレガシーなシステム用にデータ変換するためだよ。
そういうシステムは未だに結構動いているんです。
超漢字で解決するのでは? (スコア:0)
超漢字(http://www.chokanji.com/ckv.html)を使いましょう。
国産OSなのでサポートも安心。
あなたの名前は正しい漢字で表示されるべきです。
あなたの名前を間違った漢字に置き換える必要はありません。
絵文字か落書きか、ただの書き損じだろ (スコア:0)
そんなもんにアイデンティティを求めなきゃならないような連中を優遇してやる必要は無い。
Re:不親切極まりない (スコア:2)
jsonという時点でものすごい親切ですよ。
流石IPA。
これが並の官公庁だったら、謎のCSVもどきとか殺意を覚えるフォーマットにされていただろう。
Re: (スコア:0)
すぐ隣りのストーリーではIPAの監督官庁である経産省さえもExcelファイルにしている始末ですからね。
Re: (スコア:0)
#2791834 みたいなのを見るとExcelのほうが面倒な人から文句出なくていいんじゃないですかね
経済産業省は一般人も見るでしょうし
Re:不親切極まりない (スコア:2)
一般人に向けて変換候補などの妥当性に関する意見を募集しているのでなく、開発者向けにこのような縮退マップを策定しようとしているがどう思う?という意見募集でしょう
JSONで配布されるのをありがたいと思える人以外にはあまり関係のない話なのかと
Re: (スコア:0)
端的に言ってあなたのような一般の利用者向けのものじゃないということです。
これは開発者向けのものですよ。
スキーマ定義は用意してあるのでそれ見て好きなように利用しなさいってことです。
Re: (スコア:0)
jsonが何か2種以上の知識が無いと無理ですね