パスワードを忘れた? アカウント作成
6059 story

みんなで作る「姓と名」 123

ストーリー by Oliver
登録情報なんて忘れた 部門より

kamuy 曰く、 "ジャストシステム ユーザーズ・インフォメーション (メール配信) から。多種多様な読み・当て字を許容する日本語ですが、ちょっと変わった読みの人名を入力しようとして巧いこと候補が出ずに手こずってしまったり、そもそも無茶すぎる読みでとても変換できそうもない当て字に出くわしたり、と、たま~にストレスフルな体験をすることがありますね。そんなときには漢字を一字ずつ並べていくか、或いは単語登録してしまうか、ということになる訳ですが、どうせならその登録辞書をみんなで共有しようと云うのは当然出てくる発想です。そんな発想をオフィシャルにサポートしているのがJUSTSYSTEMのみんなで作った辞書:姓・名
以前からみんなで作るATOK辞書として募集はしておりましたが、この度その成果がダウンロード(登録ユーザ限定)できるようになったようです。登録ユーザだけに限定しておきながら「みんな」ってのもなんだかなーと思いますが、同時に略称-学校名略称-地名の募集も開始されましたので、興味のある方は参加してみましょう。(投稿するだけなら登録不要なようです)
…ところで、例示されている「芹華」、「真鈴」、「詩乃」って、…"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 27人の大豆生田 (スコア:3, 参考になる)

    by SteppingWind (2654) on 2003年07月07日 17時43分 (#353638)

    「大豆生田」という名字には27通りの読み方 [gunma-ct.ac.jp]が有るそうで, どの読み方を入力してもちゃんと候補に出るようにするのはしんどそうですね.

  • i-dic (スコア:2, 興味深い)

    by pine-apple (2987) on 2003年07月07日 17時06分 (#353617) 日記
    i-dic [vector.co.jp]を公式に組み込んでくれると便利なのに

    --
    pine-apple
  • by Shidho (5649) on 2003年07月08日 0時21分 (#353923) 日記
    どこにつなげようかと思ったのですが微妙につながらないので
    新たなツリーで書いておきます。

    最近のATOKは、有名人に関しては優先的につながるような
    ヒントデータを持ってるようです。

    松任谷由実、とか、木村拓哉、とか一発変換します。

    これは辞書のテキスト出力では見られないし、
    ユーザーも入れたり訂正したりできないようなきがするのですけど、
    気のせいかもしれません。
    • 余計なもの になりそうですが、嫌いな有名人が一発で変換されて
      必要な知人の名前がなかなか出ないで、いらついた時があります。
      基本辞書から嫌いな有名人の名前を削除できるようにならんかなと
      いつも思います。

      #あるDOSのシステムで「まさお」と入れると「(^’^)」と変換
      されて脱力した覚えがあります。
      親コメント
  • by Fortune (6210) on 2003年07月07日 16時52分 (#353613) 日記
    これって、現在の登録単語数は分かるけど、どんな単語(姓名&読み)が登録されてるかって、分からないのかな?
    どうせみんなから集めた物なんだし、そこの所を公開してくれればみんながハッピーになっていい気がするんだけど…。

    まぁでもそうすると、「ATOKにはこれがある!」見たいな売りには使えなくなるから無理か:-P
    • ATOK の辞書だと、システム辞書だろうと登録単語を吐き出せます。でも ATOK13-16 使ってて人名にはかなり不満がある。困って自前の辞書に登録してあるのが、200 名ほど。いま 13 の自前辞書でちょっと眺めてみましたが、反高橋とか纐纈が出ないのはまぁ我慢するとしても、ちょっとめずらしめの名前、例えば木保、井佐原、小町谷、迫田など結構出ません。
      親コメント
      • おお、ずいぶんと素晴らしい資産をお持ちのようですね。
        せっかくですので登録(の前段としての投稿を)してはいただけないでしょうか? 二百件ほど。

        って、さすがにソレは大変ですね。
        …んーと、ココにコメントとして一覧を貼り付けるとか、どうでしょうか?
        もし公開されたなら、投稿しちゃろうかと考えているヒマ人が少なくともココに一人はおりますよ(笑)

        #もちろん、投稿が済んだ後は、自前の辞書にも放り込みますが。
        #ですので、もし公開されるなら「読み Tab 単語 Tab 品詞」の体裁でお願いします(笑)
        --
        -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
        親コメント
      • by fukapon (4131) on 2003年07月07日 19時54分 (#353756)

         片っ端から登録すると、今のATOKでも結構変換精度が落ちてしまうでしょう(実際、15から?付属されている人名辞書を標準辞書セットに組み込むと、だいぶ精度が落ちたように感じられました)。ですから、いくら人名辞書を別にしても、多くのユーザーに利用してもらおうとするとその頃合いが難しいんじゃないかと。

         自分自身で登録していく場合は、自分自身の用途に完全にあったものばかりを登録していくせいか、ATOKの場合、変換精度が目に見えて落ちるようなことはないんですけどね。私も数千語登録しています [nifty.com]。

        親コメント
      • ちょうど今し方まで自分の辞書のメインテナンスをしていたところでした.
        わたしの場合は,人名は単独の辞書で管理しているのですが,
        登録単語は,人名だけでおよそ11万件ぐらいです.
        歴史上の人物なども入っているので,登録単語数の3割弱が女性のような気がします.

        「芹華」「真鈴」「詩乃」ってのが出るかどうか試してみましたら,アッサリ出ました(汗)
        「木保」「迫田」は出ましたが,「井佐原」「小町谷」は分割されてしまいますね.

        この辞書,インプッドメソッドを入れ代え立ち代えして10年以上使ってまして,
        長年月の間に,フリーで出回ってる人名辞書をマージしたりもしてるためだと思います.

        #ちなみに人名辞書の変換優先順位を下げているので,弊害は出ていません.
        #ちなみに上記環境は,MacOS9,ことえり2です.
        #まぁ,あくまでも個人事例ということで.
        親コメント
    • 登録ユーザなら、ダウンロードしてきた辞書ファイルを元に一覧を吐き出させることは可能ですので、登録済み一覧は作れますね。ソレを公開して良いものかどうかは… 使用条件的にはいけるのか? それとも、提供されているファイルそのものでなくて、ソレを元に内容を書き出したファイルも公開できないのかな?

      で、公開の可否はさておき、早速吐き出させた一覧を見てみたのですが、何ともはや(笑)
      皆さんよく考えておられるようですなぁ…

      ついでですので、自前で鍛えた辞書からも同様にして人名分を抜き出してみました…
      あ゛~、濃いねぇ(笑)
      マンガ作家や絵描き作家のヒトとか(こうして並べると、物書き系の作家って、そんなにとんでもない名前ばかりではないですな)、諸々の作品に登場する人物名称とか、イヤ、我ながらすごい一覧で。
      で、一覧を出したついでですので、それらの名前についてガンガン投稿しておきました。百数十個(爆)
      アレゲな名前とかを投稿しようとしたモノが投稿済みであったりしても、怒らないで下さい。
      --
      -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
      親コメント
  • by kizaki (16591) on 2003年07月07日 16時54分 (#353614)
    登録ユーザーのみなんて言わず、オープンソース(笑)で政府が先導する必要ありかも。
    日本語フォントと一緒に無料でね。
  •  担当者はアレゲ趣味・・・・・?

     それはともかく、有料でいいのでcsvかなんかにして一般にも公開して欲しいなぁと
    思います。固有名詞、地名の類は発音と漢字が別認識で、ぽんと言われた時に
    変換に大分苦労するので。

    #ことえり使いゆえに「一般」と主張してみるID
    --

    -----
    スケーター12号〜(┌  ┌  ┌  ´Д`)┘
  • by tux (14291) on 2003年07月07日 17時43分 (#353637)
    10年くらい前ですが、トヨタの工場の記念式典か何かで
    「豊田せりか」「豊田かりな」という双子のちっちゃい女の子が
    テープカットしてたのを思い出しました。(漢字失念)

    #今ググったらゲームキャラとかAV女優とかばっかり;
    #今ちょうど高校生ぐらいの多感な年頃だろうに…。
    • 「豊田せりか」「豊田ころな」という別の姉妹の親がトヨタのディーラーで商談してたら、結局ディーラーから
      セリカとコロナを無料で贈呈されたという話を15年ほど昔に聞いた覚えが。

      #「本田拓斗」とか「鈴木乃窓」なら、それぞれのディーラーで貰えるんかぁ?(苦笑)
      --

      /* Kachou Utumi
      I'm Not Rich... */
      親コメント
  • by Anonymous Coward on 2003年07月07日 18時14分 (#353664)
    住基ネットで集めた情報を元に総務省が辞書を作れば良いのに。
    日本人全員を網羅した辞書ができるよ。
  • by Anonymous Coward on 2003年07月07日 18時50分 (#353704)
    で、次バージョンで「彼方の名前も一発変換」って売りにすると。

    珍しい苗字を集めたページはよくありますね。
    凄い苗字の大集合 [infoweb.ne.jp]
    こことか。

    名前は無限に増えていくからキリ無さそうだ。
  • 単語登録すると次の起動時にでも販売元(?)へ新規分を転送してくれるとかすると楽なのに
    で、向こうで適当にフィルタして辞書を作る、と

    で、最後は起動時にネットワーク越しに辞書の更新分を触って持ってきてくれると

    あー最近の流行り的には winny で広域分散なんですかそうですか

    徹夜で測定で凄く眠いので ID
    --
    「それがどうした、おれたちには関係ない」
typodupeerror

「毎々お世話になっております。仕様書を頂きたく。」「拝承」 -- ある会社の日常

読み込み中...