パスワードを忘れた? アカウント作成
258921 journal

aitoの日記: 9/28 Tue-Ses3 Phonetics/Language Processing

日記 by aito
ポスターで Phonetics を流した後、オーラルでLanguage Processing を聞く。

Tue-Ses3-P3: Phonetics
The Influence of Actual and Perceived Sexual Orientation on Diadochokinetic Rate in Women and Men (U of Minnesota)
ノーマルとゲイの男性の音声生成の違い。社会音声学(Sociophonetics)という分野らしい。Diadochokinetic Rateというのは,papapapa...のように音節をできるだけ早口でしゃべった時の発声速度のことで、構音障害のスクリーニングなどに使われるらしい。ノーマルとゲイの男性にそれをやらせると、/sa/と/sha/に関してだけゲイのほうが優位にDDK rateが高い(つまり早口)。英語での発声の男女差が関連しているというのだけど、ネイティブでないのでよくわからない。日本語では、語彙でなくて音声学レベルでのノーマルとゲイの違いってあるんだろうか。プロソディは違いそうだけど…面倒なことをいうとゲイとホモはどう違うとか、難しい世界に入りそう。

Measuring Basic Tempo Across Languages and Some Implications for Speech Rhythm (Alpen-Adria-U)
簡単な文を20種類ぐらい用意して、それを51ヶ国語に翻訳し、音節数を比較したという研究。ピークは韻律句あたりの音節数が5~6で、英語は5.77。最小はラムソ語(どこ?)の4.96、ベトナム語の4.91、タイ語の4.64。音素数が多い上に声調言語だからだろう。最大はテルグ語(どこ?)の10.96、第2位は日本語で10.23、第3位はロビアナ語(どこ?)とハワイ語の10.05。当然というか、音節の種類数と韻律句あたりの音節数には相関がある。最初聞いたときには実音声を使ったのかと思ったら、音声は関係なくて書いた言葉で音節を数えただけらしい。各言語のビットレートは?と質問したが、あまり計算したくなさそうだった。

Tue-Ses3-O2: Language Processing

Semi-Supervised Part-of-Speech Tagging in Speech Applications (LIUM)
品詞タグ付けの半教師あり学習。単語に対する品詞候補を列挙した辞書を使って、タグなしコーパスからベイズ的手法によってタグを推定し、それを学習データとする。これと未知語タグ付けを組み合わせてシステムを作ったが、やはり教師ありには劣る。後半は、Named-entity識別、意味役割タグ付けとか同音異義語識別などに品詞タグ(音声認識結果から推定)を使った場合と使わない場合について比較し、やはり品詞はあった方がよいという結果。音声認識結果を使う場合には、半教師あり学習は教師あり学習に匹敵する性能。

Memory-based Active Learning for French Broadcast News (LORIA)
確率モデルによる音声認識のパージングが目標。少ない学習データで高い性能を得るために、学習に必要なデータを動的に生成または選択するのがActive Learningらしい。文に対応する品詞列間の編集距離を使う。informativeness と representativeness の両方を考慮して、編集距離をベースとした2つの指標を組み合わせる。ランダムに学習データを選んだ場合よりも高性能。

Can Conversational Word Usage Be Used to Predict Speaker Demographics? (UCB)
対話データから話者の性別、年齢などを推定する。使うのは音声認識結果だけ。特徴は単語バイグラムの出現ベクトル。男性は女性の2倍 uh を言っているとか。MIRAによる分類で、性別分類は80%ぐらい。年齢、学歴は両端は比較的よく分類できる。

Prosodic Word-Based Error Correction in Speech Recognition Using Prosodic Word Expansion and Contextual Information (National Cheng Kung U)
中国語の韻律句ごとに、正しい単語列と認識誤り単語列の表を作っておいて、それを使って認識結果の訂正をする方法。単純な方法だが、機械翻訳などを使って訂正する方法よりも高性能。小さいタスクでないとうまくいかない気がする。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

人生の大半の問題はスルー力で解決する -- スルー力研究専門家

読み込み中...