パスワードを忘れた? アカウント作成
10029459 journal
日記

aitoの日記: 9月26日 音響学会2日目 音のデザインSS(I)~電気音響~音声B

日記 by aito

午後-前半(14:45~16:00)[アート・エンターテインメント分野における音のデザインI]座長 岩宮 眞一郎 副座長 川上 央

2-2-1 (招待講演)アート・エンターテインメント分野における音のデザインの動向 ○川上 央(日大・芸術),船場 ひさお(フェリス女学院大)
最初に音のデザイン調査研究委員会のスペシャルセッションのこれまでの流れについて説明。
音のデザインにおける制作と評価のループ。製品コンセプトと評価(シンボル)の関係。制作には規格やハードウェアなどの制限があり、その枠内で政策を行いつつ最終的に製品に落とし込んでいく。
JIS T0922 公共設備の音色に関するガイドライン。非常に独自性を出す余地が多い。
いくつかのサウンドインスタレーションの例。

2-2-2 (招待講演)体験型サウンドインスタレーションと音のデザイン ○松村 誠一郎(東京工科大学)
インスタレーションの定義とキーワード「空間」「鑑賞者と作品の明確な境界を揺るがす」に注目し、体験型サウンドインスタレーションの考え方について説明。体験型(サウンド)インスタレーションでは体験者が表現者になりうる。著者はもともとセガの体験型アーケードゲームのサウンドデザインを行っていた。そこから「競わない遊び場」としての体験型サウンドインスタレーションの制作を始めた。Max/MSPやProcessingなどの制作環境の登場により個人での制作が可能になってきた。次に、制作した5つの作品の紹介。展示の留意点として、耐久性、可動部分の少なさ、整備性、運用性などに注意している。

2-2-3 (招待講演)“音環境デザイン”プロジェクトの進め方と音環境デザインコーディネーターの役割 ○船場 ひさお(フェリス女学院大)
音環境デザインのプロジェクトとは、空間内の音を総合的に設計するプロセス。建築の音響設計、音響設備の整備、騒音制御からはじまって、そこで流れる音のデザイン、明瞭性の向上、さらにそのためのソフトウェアの製作とか音の出るオブジェのデザイン、音空間の創造まで。音環境デザインコーディネーターとは、音環境デザインを考えつつ全体を調整する役割の人。某タワーの音環境デザインのコーディネーター業務の例を紹介。実現される音環境のプレゼンテーション。

-----
午後-前半(15:15~16:30)[音響イベント検出] 座長 栗栖 清浩 副座長 髙橋 祐
2-1-13 聴覚注意を用いた実環境でのブレインマシンインタフェースに関する基礎検討 ☆石堂 なつみ(奈良先端大・情報),小川 剛史,森本 智志,兼村 厚範,丸山 雅紀,川鍋 一晃,石井 信(ATR),猿渡 洋,中村 哲(奈良先端大・情報)
脳波を使ったBMI。注意を向けたときにだけ現れる脳波P300に注目。操作したい機器に固有な音を定義し、操作する可能性のある機器から次々に音を出して、P300が観測されるタイミングによって操作したい機器を特定するというアイデア。このときに、実環境に近い環境でBMIがうまくいくか。実験を行ったのが実際のご家庭を模擬した「BMI House」って金があるなあATR。BMIハウスで実験をすると、隔離された実験室のようにはうまくいかない。単一チャネルよりも複数チャネル+線形判別を使ったほうが性能が高い。

2-1-14 周波数解析によるフロア及び靴の推定方式 ☆久野 琢也,△濱川 礼(中京大院情報科学研)
音を使った床と靴の推定。応用はマイクだけを使った歩行者のマッピングや施設の客層の自動集計など。フレーム幅500msで周波数分析し、パワースペクトルを盗聴量としてSVMで識別。環境は「研究室内」と「廊下」、靴は「スニーカー」と「スリッパ」のそれぞれ2つ。靴と床の組み合わせを単位として識別すると、精度は65%ぐらい。ナイーブな手法。もっと頑張れると思う。

------
午後-後半(16:30~17:45)[音声合成・符号化] 座長 志賀 芳則 副座長 橋本 佳
2-7-12 スパース近似と畳み込みカーネルを用いたガウス過程回帰に基づく音声合成 ☆郡山 知樹,能勢 隆,小林 隆夫(東工大)
HMMのような状態単位ではなく、フレームごとの特徴量の系列をガウス過程として生成するモデルによる音声合成。そのまま計算すると共分散の逆行列の計算が重いので、共分散にスパースネスを仮定して計算量を落とす(局所GP、PIC近似)。共分散行列(行、列の長さが系列長)のブロックを決定するために、コンテキストによるクラスタリングを使う。音素境界付近で隣接する音素のコンテキストを重み付きで重ねることにより(?)音素境界での不連続を防ぐ。デモ音声では違いは微妙。

2-7-13 複合ウェーブレットトラジェクトリモデルに基づく音声合成 ☆北条 伸克(東大院情報理工),亀岡 弘和(東大院情報理工 / NTT CS研),嵯峨山 茂樹(東大院情報理工)
早口で聞き取りにくい。複合ウェーブレットモデルはパワースペクトルをガウス混合分布によって表現するモデル(らしい)。スペクトル変化をガウス分布のパラメータ変動で表現するモデルで、それをHMMで駆動する。スペクトルを構成するガウス分布のことをフォルマントと呼ぶのは感心しない(誤解かな)。この発表では、区分定常でない系列生成のために、トラジェクトリモデルを考慮する。また、子音のスペクトルをうまく生成するために、有声音の生成モデルと無声音の生成モデルの足しあわせとして全体のスペクトルを構成する。

2-7-14 高パケットロス下における頑健なVoIP通信の実装と評価 ☆岡本 雅仁,伊藤 彰則(東北大院・工学研),長野 雄(東北大・電気通信研究機構)
当研究室の岡本君。G.729にインターリーブ処理をした時の音質と遅延のトレードオフによる会話のしやすさの主観評価。被験者が意外に遅延に対して鈍感。インターリーブは16パケットぐらいで十分で、それ以上長くても音質への貢献はほとんどない。

2-7-15 復号信号の特徴に応じたACELP用ポストフィルタの制御 ☆千葉 大将(筑波大院・システム情報工学),守谷 健弘,鎌本 優,原田 登(NTT・CS研),宮部 滋樹,山田 武志,牧野 昭二(筑波大院・システム情報工学)
音質向上のためのポストフィルタ。基本の方法は、500Hz以下のスペクトルのピッチ成分を強調するが、提案法ではカットオフ周波数をピッチ周波数に連動させる(要するに決められた個数の調波成分を強調することと同じ?)。提案法によってPESQ値は上がる。実際の音質改善は微妙。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

※ただしPHPを除く -- あるAdmin

読み込み中...