そういや ChaSen ライセンス問題ってどうなったんだろう。せっかく mnoGoSearch から使えるようになってるのに。search.debian.org の CJK サポートの話です。サーチエンジンは自然言語解析を必要とするので、国際化がたいへん難しい分野です。というか、--with-extra-charsets をつけるだけで韓国語 (分かち書きする) はサポートされるのだから、あれだけ長い議論をしてるひまがあるのなら、とっととやってくれ。なぜ渋るのか理由が分からん。
最新の mnoGoSearch は 和布蕪 (MeCab) が使えるって話だけど、こっちはどうなんだろう。ChaSen の辞書を使うらしいけど、同様なライセンス問題を抱えていたりはしないのだろうか。
最初のバージョンは常に打ち捨てられる。
帰ってきました (スコア:1)
ちなみに新幹線だったりします。
ipadicライセンス (スコア:1)
事情も同じです。
cannadicをChaSen/MeCab辞書に変換がするスクリプトは
できているので、それをITPするまで待ってください...
knok