kubota (64) の日記

2003 年 08 月 03 日
午前 05:04

NAIST

これから、茶筌 (ChaSen) で有名なNAISTまで日帰りで行ってきます。

そういや ChaSen ライセンス問題ってどうなったんだろう。せっかく mnoGoSearch から使えるようになってるのに。search.debian.org の CJK サポートの話です。サーチエンジンは自然言語解析を必要とするので、国際化がたいへん難しい分野です。というか、--with-extra-charsets をつけるだけで韓国語 (分かち書きする) はサポートされるのだから、あれだけ長い議論をしてるひまがあるのなら、とっととやってくれ。なぜ渋るのか理由が分からん。

最新の mnoGoSearch は 和布蕪 (MeCab) が使えるって話だけど、こっちはどうなんだろう。ChaSen の辞書を使うらしいけど、同様なライセンス問題を抱えていたりはしないのだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

最初のバージョンは常に打ち捨てられる。

処理中...