みんなで作る「姓と名」 123
ストーリー by Oliver
登録情報なんて忘れた 部門より
登録情報なんて忘れた 部門より
kamuy 曰く、 "ジャストシステム ユーザーズ・インフォメーション (メール配信) から。多種多様な読み・当て字を許容する日本語ですが、ちょっと変わった読みの人名を入力しようとして巧いこと候補が出ずに手こずってしまったり、そもそも無茶すぎる読みでとても変換できそうもない当て字に出くわしたり、と、たま~にストレスフルな体験をすることがありますね。そんなときには漢字を一字ずつ並べていくか、或いは単語登録してしまうか、ということになる訳ですが、どうせならその登録辞書をみんなで共有しようと云うのは当然出てくる発想です。そんな発想をオフィシャルにサポートしているのがJUSTSYSTEMのみんなで作った辞書:姓・名。
以前からみんなで作るATOK辞書として募集はしておりましたが、この度その成果がダウンロード(登録ユーザ限定)できるようになったようです。登録ユーザだけに限定しておきながら「みんな」ってのもなんだかなーと思いますが、同時に略称-学校名と略称-地名の募集も開始されましたので、興味のある方は参加してみましょう。(投稿するだけなら登録不要なようです)
…ところで、例示されている「芹華」、「真鈴」、「詩乃」って、…"
27人の大豆生田 (スコア:3, 参考になる)
「大豆生田」という名字には27通りの読み方 [gunma-ct.ac.jp]が有るそうで, どの読み方を入力してもちゃんと候補に出るようにするのはしんどそうですね.
Re:27人の大豆生田 (スコア:2)
小学校のころは一学年に必ず何人か大豆生田(おおまめうだ)さんがいました。
由緒正しい姓なのかな?
[udon]
i-dic (スコア:2, 興味深い)
pine-apple
Re:i-dic (スコア:1)
# ならお前の娘につけてやれ、と言われても困るけど。
# 娘以前に、母になってくれる人が出来ないと。
*-----------------------*
-- ウソ八百検索エンジン --
Re:i-dic (スコア:1)
姓名のつながり。 (スコア:2, 興味深い)
新たなツリーで書いておきます。
最近のATOKは、有名人に関しては優先的につながるような
ヒントデータを持ってるようです。
松任谷由実、とか、木村拓哉、とか一発変換します。
これは辞書のテキスト出力では見られないし、
ユーザーも入れたり訂正したりできないようなきがするのですけど、
気のせいかもしれません。
Re:姓名のつながり。 (スコア:1)
必要な知人の名前がなかなか出ないで、いらついた時があります。
基本辞書から嫌いな有名人の名前を削除できるようにならんかなと
いつも思います。
#あるDOSのシステムで「まさお」と入れると「(^’^)」と変換
されて脱力した覚えがあります。
現在の登録リスト (スコア:1)
どうせみんなから集めた物なんだし、そこの所を公開してくれればみんながハッピーになっていい気がするんだけど…。
まぁでもそうすると、「ATOKにはこれがある!」見たいな売りには使えなくなるから無理か:-P
Re:現在の登録リスト (スコア:1)
Re:現在の登録リスト (スコア:1)
せっかくですので登録(の前段としての投稿を)してはいただけないでしょうか? 二百件ほど。
って、さすがにソレは大変ですね。
…んーと、ココにコメントとして一覧を貼り付けるとか、どうでしょうか?
もし公開されたなら、投稿しちゃろうかと考えているヒマ人が少なくともココに一人はおりますよ(笑)
#もちろん、投稿が済んだ後は、自前の辞書にも放り込みますが。
#ですので、もし公開されるなら「読み Tab 単語 Tab 品詞」の体裁でお願いします(笑)
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:現在の登録リスト (スコア:1)
片っ端から登録すると、今のATOKでも結構変換精度が落ちてしまうでしょう(実際、15から?付属されている人名辞書を標準辞書セットに組み込むと、だいぶ精度が落ちたように感じられました)。ですから、いくら人名辞書を別にしても、多くのユーザーに利用してもらおうとするとその頃合いが難しいんじゃないかと。
自分自身で登録していく場合は、自分自身の用途に完全にあったものばかりを登録していくせいか、ATOKの場合、変換精度が目に見えて落ちるようなことはないんですけどね。私も数千語登録しています [nifty.com]。
Re:適応型IMEが欲しい (スコア:1)
プロパティの作り込みで何ができるかというと、入力・変換キー操作のアサインや適用する辞書の設定、学習機能の学習強度・頻度の制御、文体の設定など。他にも色々ありますが、これらの設定をアプリケーション毎に割り振ったりも出来ます。
(ファイルやディレクトリ毎の設定は出来ないかも? なので、自動切り替えは出来ない?)
で、私は簡易な方法として、「F5」キーで人名関連の辞書を適用するように設定してます。
コレなら、今回のような大量の人名がまとめて加わったとしても、普段使いの分はユーザ登録辞書からの通常変換で、特殊な読みについては人名辞書からのF5変換で、という感じで、仕分けることが出来ます。
試しに、「みんなで作った辞書」を普段使いとして設定して変換を試してみましたが、なんかもう、あまりにも大量の候補が出まくってしまって、確かに効率が落ちますね、こりゃ(笑)
#オレの知り合いにこんなハイカラな名前のヤツァいねーよ(爆)
#とか。
あと、ご存じかもしれませんが、医療関係などの専門性の高い辞書自体は既に販売されているようです。
ATOKパワーアップツール [atok.com]
これらの専門辞書も、キーアサインを工夫すればどんなアプリケーションでのどんな局面であっても、一発変換できますね。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:適応型IMEが欲しい (スコア:1)
プロパティや辞書は標準セット1本で勝負する。
とゆー妙なこだわりを持っているのは私くらいのものなのだろうか...。ただ単に面倒なことが嫌いという噂もある :-)
Re:現在の登録リスト (スコア:1)
わたしの場合は,人名は単独の辞書で管理しているのですが,
登録単語は,人名だけでおよそ11万件ぐらいです.
歴史上の人物なども入っているので,登録単語数の3割弱が女性のような気がします.
「芹華」「真鈴」「詩乃」ってのが出るかどうか試してみましたら,アッサリ出ました(汗)
「木保」「迫田」は出ましたが,「井佐原」「小町谷」は分割されてしまいますね.
この辞書,インプッドメソッドを入れ代え立ち代えして10年以上使ってまして,
長年月の間に,フリーで出回ってる人名辞書をマージしたりもしてるためだと思います.
#ちなみに人名辞書の変換優先順位を下げているので,弊害は出ていません.
#ちなみに上記環境は,MacOS9,ことえり2です.
#まぁ,あくまでも個人事例ということで.
Re:現在の登録リスト (スコア:1)
で、公開の可否はさておき、早速吐き出させた一覧を見てみたのですが、何ともはや(笑)
皆さんよく考えておられるようですなぁ…
ついでですので、自前で鍛えた辞書からも同様にして人名分を抜き出してみました…
あ゛~、濃いねぇ(笑)
マンガ作家や絵描き作家のヒトとか(こうして並べると、物書き系の作家って、そんなにとんでもない名前ばかりではないですな)、諸々の作品に登場する人物名称とか、イヤ、我ながらすごい一覧で。
で、一覧を出したついでですので、それらの名前についてガンガン投稿しておきました。百数十個(爆)
アレゲな名前とかを投稿しようとしたモノが投稿済みであったりしても、怒らないで下さい。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:現在の登録リスト (スコア:1)
ATOK単語ファイルを受け付けてくれると、楽なんですけどね...(^^;
Re:現在の登録リスト (スコア:1)
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
これこそ (スコア:1)
日本語フォントと一緒に無料でね。
超御約束ながら・・・ (スコア:1)
それはともかく、有料でいいのでcsvかなんかにして一般にも公開して欲しいなぁと
思います。固有名詞、地名の類は発音と漢字が別認識で、ぽんと言われた時に
変換に大分苦労するので。
#ことえり使いゆえに「一般」と主張してみるID
-----
スケーター12号〜(┌ ┌ ┌ ´Д`)┘
芹華といえば (スコア:1)
「豊田せりか」「豊田かりな」という双子のちっちゃい女の子が
テープカットしてたのを思い出しました。(漢字失念)
#今ググったらゲームキャラとかAV女優とかばっかり;
#今ちょうど高校生ぐらいの多感な年頃だろうに…。
Re:芹華といえば (スコア:1)
セリカとコロナを無料で贈呈されたという話を15年ほど昔に聞いた覚えが。
#「本田拓斗」とか「鈴木乃窓」なら、それぞれのディーラーで貰えるんかぁ?(苦笑)
/* Kachou Utumi
I'm Not Rich... */
Re:芹華といえば (スコア:2)
#でたらめに珍走風味で(笑)
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:芹華といえば (スコア:1)
Re:芹華といえば (スコア:1)
工場の立ち上げか何万台生産記念かだったと思うけど。
そう言われるとお父さんが記念に車を貰ってたような気が…。
#さすがにタダではくれないでしょうね
インターネット誕生以前のニュース検索がこんなに難しいとは;
Re:芹華といえば (スコア:1, おもしろおかしい)
私の友人は、有名人と同じ名前ではありませんが、病院や銀行で呼ばれるのはとても恥ずかしいと言っていました。
彼の名前は「山田太郎」
「山田太郎は記入例ですのでご自分のお名前をお書きください」とか言われる事もしばしばとか。
とりあえず「一太郎でなくて良かったな」と励ましておきました。
# 全然励ましになってないけど
Re:同姓同名 (スコア:1)
この前、筋肉番付だったか体育王国だったか、土曜の夜の
そういう番組に「山口百恵」さんっていう小学生の女の子が
出てました。
そのあと、ひとしきりそれが自分の周りで話題になりました。
自分だってあの番組ほとんど見ないのに覚えてるんだから、
周りからのインパクトは大きいんでしょうね。
(でも周りの小学生は知らないのかな。)
こんなときこそ住基ネット (スコア:1, すばらしい洞察)
日本人全員を網羅した辞書ができるよ。
マジレスしちゃうと、 (スコア:1)
住基ネットってどうしてるんだろう?
May the source be with you... always.
Re:マジレスしちゃうと、 (スコア:1)
これについてのコラムがありました。
それによると、「統一文字コード」と呼ばれるunicodeに準じた
文字コード体系で対応していて、文字集合としてJIS第1~4水準、
Windowsの外字、許容自体(俗字、旧漢字2万1千語を
用いているそうです。
同記事の中で以下のサイトが紹介されていましたので載せておき
ます。
ほら貝:文字コードからみた住基ネットの問題点
[horagai.com]
まぁ結果はともかく募集することに意義があるんだろう (スコア:1, 参考になる)
珍しい苗字を集めたページはよくありますね。
凄い苗字の大集合 [infoweb.ne.jp]
こことか。
名前は無限に増えていくからキリ無さそうだ。
とろやんほーすつき (スコア:1)
で、向こうで適当にフィルタして辞書を作る、と
で、最後は起動時にネットワーク越しに辞書の更新分を触って持ってきてくれると
あー最近の流行り的には winny で広域分散なんですかそうですか
徹夜で測定で凄く眠いので ID
「それがどうした、おれたちには関係ない」
Re:とろやんほーすつき (スコア:1)
それだと、間違いや勘違い、ネタまで登録されてしまう罠。
手動で行ったとしてそれが間違ってないって保証もないのだけどね。
日本民族衰亡の危機 (スコア:3, おもしろおかしい)
>元ネタは解りませんが何系から引っ張ってきたのかは十分察せられます。
さいきんはきわめてユニークな名前 [google.co.jp](その実例 [2ch.net])を子供につけることが
感性を理性よりも重んずるタイプの両親たち [google.co.jp]の間で流行しているようなので
その一環である可能性もあるのではなかろうかと思われます。
注:『実例』を読んでしまい頭痛がしてきても本投稿者は一切責任を取らないのでそのつもりで。
Re:日本民族衰亡の危機 (スコア:1)
そういう珍奇な読み・当て字がデフォルトで変換候補に出るようになると、
さらなる珍が出現するとしか思えないんだよなぁ。
Re:日本民族衰亡の危機 (スコア:1)
#「と」好きなのでID
Re:日本民族衰亡の危機 (スコア:1, 参考になる)
転職時に履歴書の名前からググられたら確実に落とされそうです;
メールアドレスでググってくれると結構まともなんですけどね…
親には感謝しています。「ググれる名前をありがとう」と。
実名でWebに残る行動を取る時は良い意味で緊張感があります。
Re:日本民族衰亡の危機 (スコア:1)
「だいや」「もんど」
だったと思います。
なんでも、時差の関係でオーストラリアで生まれだとか。
そういう辞書大歓迎! (スコア:1)
もちろん用途にもよるでしょうから、それこそ戸籍法で認められた名前だけを集めた辞書などと「実名でも存在するかもしれないけど文学等や作家名でよく見られる名前」を集めた辞書を分けて提供するという手もあるでしょうし。(戸籍法といっても裁判所の裁量があればOKだろうとかのツッコミは無しに願います。とりあえずすでに認められて戸籍に登録されているものという意味で使ってます。)
#「えー」を変換すると「∀」も出てくる我が家のATOK(笑)
Re:そういう辞書大歓迎! (スコア:1)
問題がありますね。
戸籍には読みが登録されてない(んでしたよね?)ので、戸籍からカナ漢字変換辞書を作ることはできません。
次に、戸籍法(正確には、その施行規則)で認められた名前、というと、
常用漢字[1945字] ∪ 所謂人名漢字[285字] ∪ ひらがな ∪ カタカナ
からなる文字集合からなる任意の文字列ということになりますね(笑)。可算無限集合です。
確かに(才フトピ) (スコア:2, 参考になる)
こんな事も可能。 [216.239.57.104]
>係員がひとしきりキーボードをたたいて、変更はあーっさり終了した。
>こうして私の戸籍名(の仮名)“真彦”の読み方は、「“まさひこ”」から「“まお”」になった。
>※今後、予期せぬ問題が発生する可能性もあります。参考にされる場合には、自己責任でお願いする旨、特にお断わり申し上げます。
凄い事やる人がいるもんだなあ…
うちも母(役所の戸籍課勤め)に「苗字の濁点、よく間違えられるでしょ。変えたら?」と言われたことがありますが。
Re:そういう辞書大歓迎! (スコア:1)
>つまり、現在実在の名前に変換できる辞書(業務向き)と、架空や歴史上の人物名に変換できる、より範囲の広い辞書。
まさにこれです。書き方が足りませんでした。
蛇足。
そういえば上の方で「苗字の濁点」の話が出てましたが、私の本名もぜんぜん難読ではないものの『地方によって一般的に濁点が付いたり、付かなかったり』というものなので、出身地では濁点が付かず現在住んでいる東京では濁点が付いて呼ばれています。慣れてる人はもちろんちゃんと呼んでくれますが。これも戸籍上ではど~でもいい事なのね、いや私自身あまり気にしてないんですけど(笑)
#なお、前の書き込みで「半分半分以上」と書いたのは「半分以上」の間違いです。「1/4」という意味に受け取る人もいないでしょうけど…。
Re:つまりそういう辞書を作れ、と (スコア:1)
娘の同級生にも吐夢君がいたな。
信ずる者は掬われる。
Re:つまりそういう辞書を作れ、と (スコア:1)
#私はまだまだ夢見がちだそうです・・
Re:つまりそういう辞書を作れ、と (スコア:1, オフトピック)
「トムとジェリー」のトムはトーマスですね。確か。
</すごいオフトピ>
じゃあトミフェブは(略) (スコア:2, 参考になる)
あのThomasson(スペル違うかも)は姓ですし。
##353619 [srad.jp]がネタなのか、本気で勘違いしているのか判別しかねながらもIDで
Re:個人情報 (スコア:1, 興味深い)
そうしたら「私の名字は日本でも一つしかない名字。NTTの電話帳に掲載されていたものをそのままもってきたのだろうが、電話帳から取下げるようにすでにNTTに連絡済である。
不特定多数の人間に私の名字が晒されるのはプライバシーの侵害だ」
なんてクレームが飛んできたことがありました。
危惧されている状況はあるかもしれないですね。
Re:そのまんま東 (スコア:1)
珍しい発音というのは「原」を「ばる」と読む事なんだろうか。
九州の地名 [machibbs.com]では、そう珍しくもないような気がするんだけど。
/* Kachou Utumi
I'm Not Rich... */
Re:森鴎外 (スコア:1)
長男:在波(あるふぁ)
長女:紅多(べーた)
次女:紅甘(がんま)
次男:出誕(でるた)
だそうです。
# アルファがベータをカッパらったらイプシロンできるまで、あとちょっとだ。
# がんばれ内田春菊(?)
Re:森鴎外 (スコア:1)
悪魔はダメでも河童はOKということで前例がありますしね.
与謝野晶子 (スコア:1)
アウギュスト
エレンヌ
っていう名前をつけたらしい。(→家系図 [yosano.gr.jp])
他の子は普通の名前なのに、なぜ二人だけ?