パスワードを忘れた? アカウント作成

こちらは、aitoさんのユーザページですよ。 今週も投票をしましたか?

1486533 journal
日記

aitoの日記: 2/4 SIGMUS&SIGSLPまとめ

日記 by aito

午前はMUSとSLPのパラレルセッション.私はSLPの方に参加.
MUS側ではうちの学生が参加しているので,あとでニコ生をチェックしよう.

2月4日(土)

●対話とインタラクション 【09:50-10:40】
(19)単一対話エージェントと複数対話エージェントを用いた音声対話システムの分析と評価
   藤堂祐樹,西村良太,山本一公,中川聖一
エージェントが複数(2体)いる対話システム.対象は雑談(うどんとラーメンのどちらが好きか).ユーザプロファイルは複数エージェント間で共有する.いろいろ制御しているが,どの程度一般的なのか疑問.エージェント表示はTVML,音声合成はGalateaTalk.主観評価の結果,「話しやすさ」「雑談らしさ」で3者対話の方が高評価.音声認識率と様々な指標の相関を見た結果,親しみは音声認識率に依存するが,雑談らしさはあまり関係ない.次回は「きのこの山vs.たけのこの里」でやるといいと思った.

1486526 journal
日記

aitoの日記: 2/3 SIGMUS&SIGSLPまとめ

日記 by aito

2月3日(金)

●スペシャルセッション「歌声情報処理最前線!!」第1部 【13:15-14:20】
(1) 自動学習により人間のように歌う音声合成システム―Sinsy―
   徳田恵一,大浦圭一郎
音声合成の現状とHMM音声合成の説明。感情音声合成と音声の補間・外挿。話者適応デモ。
歌声合成システムSinsyの説明。ニコ動への投稿作品の紹介。
Sinsyに対するフィードバックへのコメント.歌声のモデル補間.波音リツの中の人の声から話者適応した歌声デモ.

(2) アマチュア歌唱エンタテインメントのための熱唱度評価システムSEES
   大道竜之介,伊藤仁,牧野正三,伊藤彰則
大道君の名調子.SEESデモで飛び入りを募ったら本当に歌う人がフロアから来たのには驚いた.人間による熱唱度評価と知覚の分析,SEESの特長量と統合方法.熱唱度評価の時間長依存性,ビブラート能力と熱唱度の関係などについて質問があった.

969171 journal
日記

aitoの日記: 特別講演

日記 by aito

○アルゴリズミック・コンポジションの(不)可能性 (三輪眞弘:IAMAS)
【全体的にスライドなしのお話】
人間は「神」=「私を見つめるまなざし」から離れて生きることができるか.
三輪先生にとっての音楽:西洋世界で教会音楽と呼ばれていたものと類似.「奉納」としての音楽=宗教的儀式
音楽が宗教的であることと,現代に生きることとをどう整合させるか.
レヴィ=ストロースの文化人類学.構造主義.
「理に叶っている」その極限が論理学や数学.現代の人間は論理学や数学を信じている.(ただし相対主義的解釈)
「ありえたかもしれない音楽」の探求
日本民謡の音の遷移の確率分布に基づく作曲
コンピュータ語による文化の可能性.「コンピュータ語族」における民族音楽としての音楽はどういうものか.
逆シミュレーション音楽とは.作品“4-bit counter”上映.

968976 journal
日記

aitoの日記: 12/11 SIGMUS1日目午前まとめ

日記 by aito

○改造による新楽器の創造(SUAC)
長嶋先生.既存の楽器に加速度センサなどを付けて身体動作を取ったりするような改造を施すいろいろな例の紹介.物理コンピューティング/スケッチングと楽器の改造.エンタテインメントとしてのデザイン.ブラックボックスを組み合わせてデザインする(キーボードを分解してセンサにするとか).

昨日のコンサートでジャミーズ娘+が使っていた改造ジャミネータの紹介.スイッチの入力をArduinoで受けてMIDIで送信する.さらにネックに加速度センサとLEDを付けて,振り具合を送信すると同時にネックが光る.映像素材・音素材の編集の様子.1年生で楽器を改造して,Arduinoをプログラミングして,映像と音素材を作って演奏もするってすごいな.

797024 journal
日記

aitoの日記: 9月22日 音響学会3日目

日記 by aito

9月22日

ポスターセッション音声A(聞いたものだけ)
○残響にロバストな音声区間検出法とその比較評価(北陸先端大)
鵜木先生発表のはずだったのだが、台風で来られないということで代理発表。残響音声に対して「残響がなかったとしたときの」音声区間を切り出す。パワーエンベロープ回復処理でパワーの残響の影響を巻き戻すようなフィルタをかけ、あとは閾値で切り出し。従来法では本来の音声区間終了後にも音声区間と判定される部分が続くが、提案法ではその辺が改善するらしい。

○大学講義の音声認識のための音響・言語モデル適応に関する検討(京大)
三村さん。河原研って講義音声認識をやってなかったっけ?ともかく講義音声認識のためのモデル適応の効果を調べた。音響モデル適応は書き起こしがなくても何とかなる。言語モデル適応は前回までの講義内容の書き起こしを利用。本当はスライドの内容だけから適応ができるとよいとのこと。

795660 journal
日記

aitoの日記: 9月21日 音響学会2日目

日記 by aito

9月21日(水)

音響教育

○看護医療系専門学校の看護学科学生を対象とした病院の音環境に対する授業実践(大分大)
病院での音環境学習の実践報告。ICU内で発生する音の説明、実際の作業ででる音の測定、スピーチプライバシーなどについての解説。病院での騒音対策。

○千葉県における騒音・振動測定の教育訓練(千葉県)
千葉県での騒音振動測定講習会の紹介。初級3日間、中級2日間のコース。騒音レベルメーターの使い方など。苦情処理の実例紹介などがあるのがいかにも県の研修会らしい。

○佐賀県立宇宙科学館「平成15年春の企画展 音と響のテクノロジー」の概要と展示計画支援(九州大)
河原先生。企画展の記録。「音の科学」「音のテクノロジー」「響きのテクノロジー」に分けて展示。声道模型、ウェーブマシン、音叉、古い蓄音機、音記録メディアの変遷、スピーカーユニット、ホール音響設計模型、防音壁、防音室、ANC、DVDサラウンド。

795166 journal
日記

aitoの日記: 9月20日 音響学会1日目

日記 by aito

音声B [音声・オーディオ符号化]

☆スペクトログラムの振幅・位相量子化と範囲制限位相復元に基づく音響信号符号化の検討(東大)
嵯峨山研。スペクトログラムをオーディオ符号化に利用する。位相は適当に符号化して、復元には位相復元技術を使う。位相復元過程で、復元値が「もともとの位相があったはずの範囲」を越えたら元の範囲に戻す操作を行う。デコーディングには繰り返しが必要なので、リアルタイムデコーディングはできない。ビットレートはAACと比べればまだまだ。

☆時間冗長性を利用したオーディオロスレス符号化に関する研究(千葉工大)
ロスレス符号化で、LPC残差信号に対してLZ符号化的な方法を用い、残差をさらに圧縮する。LPC残差に現れるリズムパターンなどの規則性を利用するのが目的だったが、それがうまくいっていないのではないか。

349293 journal

aitoの日記: SIGMUS@関西学院大学 3日目まとめ

日記 by aito
7月29日(金)

■音楽検索・変換・同期
(17)トーン構造記述子を用いた高速背景音楽検索(ソニー)
テレビ放送のBGMから音楽を検索する技術.GracenoteのTrackIDは前景音への頑健性が足りない.また,1000万曲のデータベースとマッチングするためには高速なマッチングが必要.前景音はほとんどが音声なので,周波数成分が時間的に安定かどうかを利用して音声とそれ以外を分離する.また,持続性トーンを2bit/frameで表現して特徴量の情報量を削減する.マッチングはビットマスク的マッチングで,それほど工夫はないが速度は速いようだ.音楽と音声の分離方法については,似た発想のやり方を以前SIGMUSでもICASSPでも見たことあるなあ.
349025 journal

aitoの日記: SIGMUS@関西学院大学 2日目まとめ

日記 by aito
7月28日(木)

■印象・楽譜
(7) 歌詞と音響特徴量を用いた楽曲印象軌跡推定法の設計と評価(京都大)
奥乃研.印象からのプレイリスト作成を目標に,楽曲の印象を推定する.歌詞の情報も使うことと,印象の時間変化を求めるとことが特徴.印象モデルはRusselの円環モデル(快―不快,興奮―抑制の2次元).歌詞からの印象推定はMAP-PLSA,音響信号からの推定は重線形回帰で,特徴量はありがちなやつ142次元をPCAで22次元に圧縮したもの.データはビートルズ.ソーシャルタグと比較しているが,印象特徴の分散が大きいので,ちゃんと推定できているのかまだ不明な感じ.
348595 journal

aitoの日記: SIGMUS@関西学院大学 1日目まとめ

日記 by aito
7月27日(水)

今日は機械学習の日.最初に吉井さんと亀岡さんが機械学習の意義と応用範囲についてまじめに説明.

■「機械学習」特別セッション:チュートリアル1
(1) チュートリアル:ノンパラメトリックベイズ(吉井和佳:産総研)
吉井さんによるチュートリアル.確率分布とベイズ推定の基礎から丁寧に説明.固定次元ディリクレ分布から無限次元のディリクレ過程へ.棒折り過程.中華料理店過程.応用として,無限混合ガウス分布,PCFGへの応用.最近のトレンドとしてベータ過程の紹介.Infinite Factorial HMM.易しい説明だったと思うが,初心者にとっては時々出てくる数式がまったく意味不明な気がする.何も知らない人がどの程度理解できたかなあ.
typodupeerror

吾輩はリファレンスである。名前はまだ無い -- perlの中の人

読み込み中...