パスワードを忘れた? アカウント作成
5970572 journal
日記

aitoの日記: 音楽情報科学研究会@金沢 2日目(8/10)まとめ (デモセッションを除く)

日記 by aito

○多重音基本周波数解析のための無限複合自己回帰モデル(産総研)
吉井さん。ノンパラベイズを使って音源数・音高数・音色数を事前に規定せずに多重音を複数の音に分解する。NMFを拡張して、音のスペクトログラムを一気にソースとフィルタとアクティベーションに分解する。ソースとフィルタの重みはガンマ過程で生成されると仮定。音量変化はガンマチェイン事前分布を使う。理論説明はあっさりしていて、基本事項の説明に時間を使うところはさすが。実際の分離結果では、重みの大きいフィルタ成分としてベース、2番目にボーカルのような分離が起こる。

○ベイジアン非負値調波因子分解と多重基本周波数推定への応用(京大)
奥乃研。多重音のF0推定。ガウス分布による調波構造のモデル化(LHA)と、NMFによる音源分離を組み合わせる。調波構造の各ピークの大きさや音高のとるべき値、調波成分のピークの幅などに制限を与える事前分布を仮定する。調波構造の事前分布の制限を決めるために、MIDI音源の調波構造を観測して、その調波成分が持つ関係を利用する(特性事前分布)。対象はピアノやギターなどの楽器音。要するに楽器の音の構造制約をモデルに組み込んだということか。

○楽譜の文脈自由2次元木構造表現に基づく多重音スペクトログラム生成モデルによる音響信号からの自動採譜(東大)
嵯峨山研。多重音解析とリズム解析(テンポ変動がある)を統一的に行う枠組み。楽譜生成プロセス、テンポ生成プロセス、スペクトログラム生成プロセスの3つの確率プロセスを組み合わせる。楽譜生成プロセスは時間方向の音の分割(音の細分化)と周波数方向の音の分割(和音)の両方を取り扱う。そのために2次元のCFGで分割をモデル化する。巨大なモデルだが、推定が難しそうだ。実験結果はまだまだな感じ。

○押弦制約と運指制約を用いたタブ譜自動生成システム(京大)
奥乃研。ギターに特化した自動採譜。従来の多重F0解析に、ギターの持つ制約(音の数、運指など)を入れる。押弦可能なパターンをあらかじめ列挙しておき、LHA法で推定した多重基本周波数の中で押弦可能パターンに合うものだけを使う。また、運指コストを定義し、各自国での複数の押弦パターン候補の中から、運指コストが最適な押弦パターン列を選択する。これらの制約によって、実際に演奏可能なタブ譜を生成することができ、音高推定性能も頑健になる。推定を楽器依存にして性能を上げるというのは一般性があって応用しやすいんじゃないだろうか。

☆スペシャルセッションのフォローアップ
午後最初の発表がキャンセルになったので、その時間を使って昨日のスペシャルセッションの続き。昨日は講演者がしゃべるだけで議論がぜんぜんなかったので、その部分を補完する企画。4人のパネリストが昨日言い残したことを一言ずつしゃべる。全体的には、「問題をよく理解した上でモデル化する」というのがメッセージだったと思う。

○隠れセミマルコフモデルと線形動的システムを組み合わせた音楽音響信号と楽譜の実時間アライメント手法(名工大)
北村研。スコアアライメントだが、演奏位置推定は現在の場所よりも少し過去について行い、同時にテンポ推定を行って、現在の演奏位置は過去の演奏位置とテンポから予測を行うというアイデア。楽譜はHSMMでモデル化する。テンポ推定は線形動的システム(LDS)で、カルマンフィルタによる推定。HMMで単純に推定する方法に比べてオンセットの検出率が向上。

○多声MIDI演奏の楽譜追跡における演奏の即興性のモデル化と自動伴奏への応用(東大)
嵯峨山研。通常のスコアアライメントの話から始めるのかと思いきや、「楽器とは何か」→「演奏に関する知識の一部を楽器側に持たせる」みたいな話の持っていき方でおもしろかった。最終的には自動伴奏のための楽譜追跡の話。この研究では装飾音と即興演奏への対応を扱う。入力はMIDIで、楽譜のモデル化はHMM。トリルやアルペジオは短い音符の自己遷移としてモデル化する。即興演奏(カデンツァ)は特定の終了和音が来たかどうかを観測する。

○ピアノ演奏補助情報からの独立を促す学習支援システムの構築(はこだて未来大)
竹川さん。これまでピアノ演奏学習支援システムを作ってきたが、今回はいかに支援システムから卒業するかがテーマ。支援システムをいかに使わなくてすむようにするかというのは大事な視点だと思う。ピアノの上にプロジェクタとカメラを設置して、鍵盤上に各種情報を投影する。次に打鍵すべき鍵盤、楽譜との対応など。楽譜を見ているか鍵盤を見ているかの情報(鍵盤目視ボール)を表示して、学習者が楽譜を見るように促す。評価実験の結果、鍵盤目視情報を提示した方が早くミスタッチが減る。

○弦楽器のための触弦認識システムの構築(神戸大)
塚本研。ギターの弦に指が触っている(触弦)押さえている(押弦)どちらでもない(離弦)の認識。初心者の学習支援や、実演奏からの採譜などに使える。弦とフレットの間に電圧をかけ、電流が流れるかどうかで押弦を検出する。また、弦の静電容量を測ることで触弦を検出する。作成システムをその場でデモ。押さえている・触れていることはわかるが、触っている場所まではわからないようだ。

○本番演奏における演奏テンポ制御のための心拍情報提示システムの構築(神戸大)
塚本研。本番演奏の時に心拍数が大きくなりすぎるとテンポが速くなっちゃうと仮定。実際に、平常状態からの心拍数のずれと演奏テンポとの間に高い相関がある。演奏テンポを適切にコントロールするため、演奏前に平常状態の心拍数からのずれを演奏者に提示する。心拍数を提示することで、演奏テンポを通常時に近くすることができた。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds

読み込み中...