パスワードを忘れた? アカウント作成
258914 journal

aitoの日記: 9/28 Tue-Ses1-O3 Technologies for Learning and Education

日記 by aito
Discriminative Acoustic Model for Mispronunciation Detection and Diagnosis in Computer-Aided Pronuncuatiation Training (CUHK&MSRA)
発音誤り検出のために、誤りペアを識別する能力が最大になるようにHMMを識別学習する。False Acceptance, False Rejection, Diagnostic Errorの総和を最小化。適応及び誤り規則の自動学習も行う。方法は自動認識結果と書き起こしのマッチングによる。全体の精度は上がるがfalse acceptanceが悪化。

Automatic Pronunciation Scoring Using Learning to Rank and DP-based Score Segmentation (National Tsing Hua U)
発音スコアを付与するために、複数の方法によってスコアを算出し、それらを入力としてスコアの良さを決めるモデルを学習する。学習はLearning-to-Rankベースで、ツールはSVMRank。出力スコアは連続なので、それを1~5の整数に離散化する。離散化法はK-meansかDP。DPを使って離散化した方が生スコアよりもよい。相関で0.34ぐらい。

Automatic Derivation of Phonological Rules for Mispronunciation Detection in a Computer-Assisted Pronunciation Training System (CUHK)
発音誤り検出のためには文脈依存の誤りルールを使う。誤りルールから発音ネットワークを作って入力音声を認識。これを省力化するため、誤りルールの自動学習を提案。音素間距離を考慮したアラインメントで正解と実発音音素列の対応をとり、音素trigramを発音ルールとする。評価値に従って効果の高いルールを選ぶ。評価は「そのルールによって元の音素を推定したときのF値」。Recallとprecisionの重要度を調整するためのパラメータを入れる。最終的には手書きルールと同程度の性能。

Adapting a Duration Synthesis Model to Rate Children's Oral Reading Prosody (CMU)
著者がこないので Alan Black が代読。子供の文読み上げが上手かどうかの自動評価。評価基準は、大人の韻律に近いかどうか。そのために、大人の音声から音素継続長モデルを学習し、それを使って子供の音声を評価する。モデルは決定木で分割した正規分布(以前大河先生が使ったものと同じ)。ここから7通りのスコアを算出して組み合わせる。特定の大人音声からの学習だと特定の文解釈などに依存する可能性があるので、多くの音声から平均的な継続長モデルを学習する。Fluencyとの相関は0.57、comprehensionとの相関は0.36ぐらい。

Predicting Word Accuracy for the Automatic Speech Recognition of Non-native Speech (Educational Testing Service)
今認識した音声の単語正解精度を推定する。特徴量は、信頼度関連のもの(時間当たりの平均信頼度、低信頼度単語の比率など)、認識結果(機能語の割合など)、韻律(ピッチの標準偏差)、背景雑音指標など。組み合わせは線形回帰。韻律はあまり効いていなくて、発話速度が効いている(母語話者とは違う傾向:母語話者の場合は速いほど精度が低いが、非母語話者は速いほど精度がよい)。

A New Approach for Automatic Tone Error Detection in String Accented Mandarin Based on Dominant Set (CAS)
パス.
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

物事のやり方は一つではない -- Perlな人

読み込み中...