パスワードを忘れた? アカウント作成
262256 journal

aitoの日記: 10月9日 PRMU/SP/WIT研究会@CEATEC 午前まとめ

日記 by aito
[招待講演]CEATEC JAPAN2010 アクセシビリティPLAZAの紹介(酒井英典・JBMIAアクセシビリティプロジェクト)
・CEATECでのアクセシビリティPLAZA展示の紹介。
・JBMIAは「(社)ビジネス機械・情報システム産業協会」の略で、その中の情報アクセシビリティ関連の活動の一環。ISO/IEC JTCのSIC28(事務機部門)と連携。事務機(コピー機など)のアクセシビリティ標準の提案をしている。
・アクセシビリティに関する国際動向の紹介。アメリカだけでなく、EUでも法整備が進みつつある。
・ISO/IEC 10779:2008「情報技術-高齢者及び障害者のための事務機器の使いやすさの指針」→JIS X8341シリーズへ。
・対応事例:複合機のアクセシビリティ対応
・今後は「高齢者」「身体障害者」から「知的障害者」「発達障害者」などへの対象拡大

テーマセッション

Buried Markov Modelを用いた構音障害者の音声認識の検討(神戸大)
有木先生のところ。構音障害者音声の認識だが、構音障害者の音声では、ΔMFCCがうまく効かないことがある。これまでの研究ではセグメント特徴量を使って性能改善を行ったが、今回はモデル自体の時間依存関係を変更してBMMを使ってみた。BMMの説明はよくわからなかったが、出力される特徴量の次元間の時間的相関を考慮するモデルのような気がした。なぜΔMFCCが効かないのか質問してみたが、Δ計算のフレーム幅の問題もあるようだった。BMMを使うべき理由がどうも納得できなかった。

無喉頭音声強調のための統計的声質変換技術(奈良先端大)
戸田先生。SCOPEプロジェクト成果の発表。喉頭を摘出した人の音声を、より自然な音声に変換する。変換方法は以前からやっている統計的声質変換。無喉頭音声(食道音声、電気音声、電気+NAM音声)から変換モデルによってF0を推定し、声を合成する。合成した声は、従来の代替発生法の音声と比べるとずいぶん改善されていて、スペクトルだけからF0を推定するのがそれなりにうまくいっていることがわかる。

iPadを利用した発音障がい者向け日常会話補助用音声合成装置(アルカディア)
平井さん。会話音声生成用の音声合成システム(ボイスエイド)。従来はPDA(Windows CE)上で実装していたが、画面が小さくて不便なので、iPad上に実装してみた。音声合成エンジンはネットワーク越し。方式はコーパスベース。合成をサーバで行うというのは開発上はメリットが大きいが、常時接続が前提というところはどうなんだろう。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...