kazekiriによる
2007年06月29日 10時32分の掲載
引き算かよ部門より。
引き算かよ部門より。
ultrageek 曰く、
パーソナルメディアが、難読字や異体字、記号などを、文字を構成するへんやつくり、関連字情報から検索し、Wordなどのアプリケーションへの入力支援を 行う「超漢字検索」を開発したとのこと(eetimes japan)。超漢字と名が付いているだけに、大漢和辞典の漢字からトンパ文字まで18万もの文字が検索可能となっているのだが、この製品の面白いところは検索方法にあり、 漢字の部品や部首、読み、画数、およびそれらの組み合わせで検索できる。さらにかけ算と引き算まで使え、「木*4」により「木」を4つ以上含む漢字を検索したり、「登-豆」にて「癶」が出てくるという。 漢字マニアなら欲しいかも?
関連ストーリー
超漢字、幻の神代文字「ホツマ文字」をサポート 32 コメント
この議論は賞味期限が過ぎたので、保存されている。
新たにコメントを書くことはできない。
ボケ (スコア:2, 参考になる)
この入力で漢字が表示されたときに、同時に読みや意味について表示されると嬉しいですね。
というかSKKで単漢字入力できない(読みがわからないとか)という出来事があり、自分の漢字忘れの激しさに激ヘコみ中。
# とりあえずコピー&ペーストでどうにかなったけど、IMEパッド含め入力補助がいつでも利用できるとはかぎらないしなー (ex.キオスク端末)
試す機会があれば、この機能も試してみたいです。
BOINC説明ページ(書きかけ) [wikispaces.com]
尹は何と読む? (スコア:2, 興味深い)
このシステムがあれば「伊-イ」で簡単に検索できそうですね。便利かも。
Re:IMEパッド手書き認識 (スコア:2, 参考になる)
親コメント
Cannaの表示順序 (オフトピック) (スコア:2)
Canna辞書の元になるファイルは下記の形式の行が並んだものです。
|『よみ (属性 変換+)+』
|例) あいすらんど #CN*12 アイスランド 愛撒倫 氷州 氷島
ここで出した例では『あいすらんど』という言葉を変換したときの最初の候補はアイスランドになり、次が愛撒倫になるわけです。
自分が良く使うものが最初に出てくるようにしたい場合は、最初から辞書をいじっておくかmkdic -fqで頻度辞書を作成して学習させる必要があります。頻度辞書を作ると自分が殆どやらない変換はだんだん出てこなくなると思いますよ。
それにしても、Cannaは音便を理解していないとしか思えない動きをすることがあるのでそこで時々いらいらしますね。
親コメント
IMEパッドでも (スコア:2, 参考になる)
実質部首変換と同じことができてます。
手書きの分むしろ今回のこれより便利かも。
引き算ができるのはそれなりに便利かもしれませんが
K/Bオンリーの人限定ツールという感じが。
誰も言わないから (スコア:2, おもしろおかしい)
二*三で六が出てくるんですね。
Re:誰も言わないから (スコア:2, おもしろおかしい)
親コメント
Tコードにおける部首変換 (スコア:2, 興味深い)
http://www.sato.kuis.kyoto-u.ac.jp/~yuse/tcode/kw/doc/kanchoku.html#label-23 [kyoto-u.ac.jp]
古い実装ではメモリ上の都合もあって、ひとつの漢字について2つの部品のみを定義し、その組合せをアルゴリズム的に計算して合成を行っていました(主に実装上のメモリ制約からこうなっていました)。その後、漢字に含まれる部品をもっと多く記述するアルゴリズムが開発され、現在のEmacs用実装tc.elでは後者が使われています。個人的な感覚では前者の方が好みですが、それは同じ字を日に何度も入力する使い方が多く、慣れるとterseでquickな方が楽になるからだと考えています。あるかないかわからない字をたまに入力するにはvariationが多くてverboseな方がよいでしょう。これは、日常的に入力する文字を指定するための手段(Tコードの部首変換や四角号碼)なのか、普段めったに使わない文字のための検索手段(超漢字検索)なのかによって、要求が違うということが反映されているのだと思います。
漢字直接入力は人間の側の訓練を前提としたシステムであることが多く、検索システムとは別の思想、実装となっていて、その違いが結構面白いです。
参考文献・リンク:
・ 小野芳彦, Tコードの補助入力: 字形組み合せ法と交ぜ書き変換法, 情報処理学会論文誌 Vol. 31 No. 3, pp.404-414 (1990)
・ http://web.sfc.keio.ac.jp/~p92395kk/Input/t-code.html [keio.ac.jp]
・ Wikipedia 部首変換 [wikipedia.org]
漢字源思い出した (スコア:1, 興味深い)
http://www.bitway.ne.jp/gakken/kanjigen/ [bitway.ne.jp]
超漢字って、電子辞書のOSにぴったりな気がするんですけどね
電子辞書版をもっているはずなのでA.C.
ハイパー漢字検索と同じじゃね? (スコア:1, 参考になる)
読めない漢字の調べ方、入力の仕方といえば (スコア:1, 参考になる)
こちらの超漢字検索との関係はどうなっているのでしょうか。
アーヴ語欲しい (スコア:1)
#以前フォントはあっても文章を書くのにかなり苦労したので・・・
---
そろそろ次巻出してくださいよ
技術がすごいんじゃなくて (スコア:2, すばらしい洞察)
対応できるほど漢字のデータベースをがんばってきちんと作りました、って
いうところにあるのではないかな。
同じようなことができる(もしかするともっと優れているかもしれない)
某M鏡に比べるとトロンコードの方がライセンス的には使いやすいから、
ある意味では使い勝手がいいかもしれない。
とはいえ、資金繰りテクノロジーは確かに気になりますな。超漢字OSに しても、何がどうなっているのやら。
親コメント