パスワードを忘れた? アカウント作成
476757 journal

tabateeの日記: 機械学習を用いた統計的言語処理

日記 by tabatee
ATOK2008等のニュースリリースに「機械学習を用いた統計的言語処理」と明記してあります。機械学習は情報系の一分野で、変換エンジンの宣伝に使われるようになったというのはそれなりに重要なマイルストーンだと思います。
あと、ハイブリッドと書いてあると何と何のハイブリッドなんだろうかと気になります。多分、人手による微調整と「機械学習を用いた統計的言語処理」の混合ではないかと思います。(自信を持って断言する気はないです)

PC Watchの記事の記述がヒントになりそうですが、正直よくわかりません。
「「n文節最長一致法」を採用していたが、近年この手法による誤変換の発生が稀ではなくなってきた。」ってなんで近年になると誤変換が増えるんだと悩むところです。性能を上げるのが難しくなったという解釈とカバレッジを上げることで精度が落ちるという解釈を考えたんですが、何が正解でしょうか。
この手の記事を書く人ががんばってくれないと開発側がマジメに情報を出してくれなくなるので、改善してくれたら良いのですが…
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

日々是ハック也 -- あるハードコアバイナリアン

読み込み中...