パスワードを忘れた? アカウント作成
239914 journal

aitoの日記: 2010年7月22日(木)SP&SLP研究会まとめ 午後前半

日記 by aito

○物まね音声の知覚的類似度を用いた音声の個人性知覚と音響特徴量の関係の検討
早大.森島先生のところの人らしい.「声が似ている」ということの物理的意味を調べるために,物まねの音声を使った.ターゲット音声とその「物まね」音声を一対比較で主観評価して主観評価値を計算する.また物理的な類似度を求め,重回帰で特徴選択.枠組みとしてはうちでやっている熱唱度の話と同じ.全体の重相関は0.2~0.4ぐらい.物理的特徴の扱いがちょっと乱暴な感じ(MFCCの平均値を使ったり).ここで言う「個人性」が何を意味するのか(同じ人が違うしゃべり方をしたものは同じなのかどうか)が不明確だった.

○韻律的特徴と対話的特徴を用いた怒り通話音声の抽出
NTTサイバー研.最近コールセンターの研究に力を入れている.今回はコールセンターでお客さんが怒っているかどうかを推定.対話の上での特徴(あいづちの頻度や沈黙の頻度など)を使う.こういう研究は生データを持っている機関しかできないよなあ.対話的特徴だけでも韻律の特徴に匹敵する識別性能があり,両方組み合わせるとF値で0.75ぐらい.対話の特徴が何かに有効に使われているのを初めて見たかもしれない.

○構造的特徴量に対する多段階の重回帰分析による発音評価
峯松先生のところの構造的特徴量研究.構造的特徴量のマトリクスを直接特徴量として使うと時限が大きいので,列ごとに重回帰分析でまとめてから,その結果をさらに重回帰で組み合わせる.教師データも複数使う.さらにHMMを使ったGOP(Goodness of Pronunciation)とも組み合わせると,従来手法以上の性能が得られる.

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」

読み込み中...