aitoの日記: 5月11日(金)NL/SLP研究会@東京工業大学まとめ
【学生セッション3:学習・システム】
[9:30-12:00]
(2) 外国人の検索クエリに対する音訳手法の適用
辻理絵子,木村健,古宮嘉那子,小谷善行
外国人が日本語の情報を得るために英語(等)で入力した検索クエリを日本語クエリに変換する。ただし翻訳ではなくて、音で変換できる場合のみ。CMUDICTを使って英単語を音素列に直し、それを日本語の読みに自動変換。読み推定のためのモデルはBigram, HMM, CRFを検討。英語の音素と日本語のカナ文字との間でアライメントを取るのはちょっと無理がある気が。評価はなぜか主観評価。3つの手法の中ではHMMがよいが、適合率としては0.1前後。この方法では一旦単語を音素列にしてからカナ文字列にしているが、graphemeから直接変換したほうが良いのではないかと思った。