パスワードを忘れた? アカウント作成
9958710 journal
日記

aitoの日記: FIT2013 2日目 音楽情報処理(2)

日記 by aito

RE-001 奏者の意図したテンポ変動の推定に基づく演奏録音の自動伸縮修正法
◎小泉悠馬・伊藤克亘(法大)
船井ベストペーパー賞受賞の発表.アマチュア楽器奏者の演奏のテンポ変動を,自然なテンポ変動と奏法ミスによるテンポ変動に分離し,後者を除去することによって,未習熟な演奏者が「本当はこう演奏したかった」という演奏を生成する.発音時刻検出のために,パワー変化などではなくて新しい特徴量「複素メルスペクトルKL情報量」を利用する.パワーでなく音高変動だけがある場合(バイオリンなど)でもうまく音符のセグメンテーションが可能.「真のテンポ変動」(自然なテンポ変動)を求める際には,真のテンポ変動を多項式曲線で近似し,それ以外(奏法誤差)にガウス分布を仮定する.最後に「真のテンポ」に合うように信号を時間伸縮.

E-027 低周波数分解能スペクトル群からの高周波数分解能スペクトルの合成による複数分解能Gabor変換の計算量削減
◎高山亮輔・荒井秀一(東京都市大)
複数の窓長によるガボール変換の実現.単純にやると時間がかかるが,固定窓長でフーリエ変換したスペクトルに適当なガウス関数を畳み込むことで窓長の異なるガボール変換を実現することができる.このときの元のフレームシフトを間引くことで計算量を削減する.許容雑音パワーから,必要とされる間引き感覚や合成項数を計算する式を導いた.フーリエ変換にFFTを使うとき,単純な方法の約6割に計算量が削減される.

E-028 任意の言葉による楽曲検索のための楽曲特徴量の自動選択
◎頭川 愛・酒向慎司・北村 正(名工大)
任意の言葉と楽曲印象を同じ印象空間に写像することで,言葉から楽曲の検索をする.印象空間は14の感性語対からSD法で生成(2次元).任意といいつつ実は感性語だけのようで,最初に使った感性語を補間する単語を見つけることが研究の主眼らしい.また楽曲のありがちな特徴量を重回帰分析で印象空間に写像.楽曲の特徴量選択によって性能が向上.

E-029 習熟度に応じたバイオリン運指推定のための確率モデルとパラメータ学習
◎長田若奈・酒向慎司・北村 正(名工大)
HMMによるバイオリンの運指の自動推定.従来法では音高,音長を入力として,「可変度,表現度」をハイパーパラメータとして出力確率と遷移確率が決まるが,従来は確率を先験的に設定していた.今回は教本に出てきた運指から確率を学習し,平滑化としてディリクレ平滑化を使う.また,習熟度ごとに異なるモデルを学習する.教本を正解とした時の一致率と,専門家による主観評価の両方をやった.レベルが高いほうが推定が難しい.この発表がFIT奨励賞.

E-030 時間区間アノテーションの集約に基づく楽曲推薦システム
◎真野洋平(名大)・高田敏弘(名大/NTT)
Webサービスとして,音楽のある部分(時間)に対してコメントをつけられるシステムを提案.また,そのコメントの内容を使って楽曲要約,さらに楽曲推薦を行う.ダイジェスト生成では,区間ごとのコメント数が多い部分を使う.デモではJ-POPの推薦が行われる様子を見せてくれたが,曲が古い(ウルトラソウルとか,モーニング娘。の昔の曲とか).楽曲推薦では,各曲のダイジェスト区間の特徴量(MFCC)のEMDを計算して近いものから表示.「正解率」と「セレンディピティ」の両方に言及している(定量的評価はしてないが)ところに好感が持てる.

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

身近な人の偉大さは半減する -- あるアレゲ人

読み込み中...