パスワードを忘れた? アカウント作成
1486526 journal
日記

aitoの日記: 2/3 SIGMUS&SIGSLPまとめ

日記 by aito

2月3日(金)

●スペシャルセッション「歌声情報処理最前線!!」第1部 【13:15-14:20】
(1) 自動学習により人間のように歌う音声合成システム―Sinsy―
   徳田恵一,大浦圭一郎
音声合成の現状とHMM音声合成の説明。感情音声合成と音声の補間・外挿。話者適応デモ。
歌声合成システムSinsyの説明。ニコ動への投稿作品の紹介。
Sinsyに対するフィードバックへのコメント.歌声のモデル補間.波音リツの中の人の声から話者適応した歌声デモ.

(2) アマチュア歌唱エンタテインメントのための熱唱度評価システムSEES
   大道竜之介,伊藤仁,牧野正三,伊藤彰則
大道君の名調子.SEESデモで飛び入りを募ったら本当に歌う人がフロアから来たのには驚いた.人間による熱唱度評価と知覚の分析,SEESの特長量と統合方法.熱唱度評価の時間長依存性,ビブラート能力と熱唱度の関係などについて質問があった.

(3) 奄美大島民謡風歌声合成システム:グインレゾネータ
   村主大輔,馬場隆,森勢将雅,片寄晴弘
元ちとせ風歌声合成.歌声に奄美大島の歌唱法(グイン)を付加する.実際のグインのテンプレートを用意し,こぶしを入れる部分をそのテンプレートに従って変形する.グインを入れる場所については,事例ベースで推定するようだ(聞き逃した).推定には民謡を使ったのか?とか,ピッチとスペクトル(裏声化)以外の特徴はあるのか?などの質問があった.実システムとしては使いどころが限られるが,レゾネータシリーズとして様々な表情を付けるシステムにするつもりなのかな.

●スペシャルセッション「歌声情報処理最前線!!」第2部 【14:40-16:15】
(4) 歌声合成ソフトウェアVOCALOID3とVOCALOID Job Plugin
   剣持秀紀
VOCALOID歌声合成の基本の説明.周波数領域の接続点の平滑化や先行発声など.VOCALOID3の技術的な改良点:素片間の音色の補間(同じ音素の異なる音高のサンプル間で補間を行う),長い素片を使う(一部triphone),子音伸長の改良など.VOCALOID3使用デモはいつものキューティーハニー.隠し機能として,母音の無声化(音源にささやき声を使う),1音符複数発音などを紹介.次にJob pluginの説明(Luaを使う).Luaの全機能を使えるので,プラグインの計算をWebサービスとして提供するなども可能.すばらしい.

(5) 日刊VOCALOIDランキング:ランキング動画全自動生成システムとその運用
   rankingloid
「もはや日刊だけが頼り」でおなじみの日刊ボーカロイドランキングの開発者によるシステムと運用の説明.ランキング動画とは.ランキング動画作成作業とその問題点.全自動化には,除外判定とシーン選定が困難.日刊では選出ルールを機械的にする(タイトルにVOCALOID関連ワードが含まれる等).日刊はカオス.シーンは60秒~80秒目を固定で紹介.動画制作では,GUIベースのソフトをマウス制御で自動化(その後スクリプトベースになったようだ).60~80秒目は「適当に決めたら結構よかったのでそのまま」とのこと.動画の主要部分を固定で抽出するとどの辺の確率が高いのか,というのはテーマとしては面白そう.

(6) VocaWatcher:人間の歌唱時の表情を真似るヒューマノイドロボットの顔動作生成システム
   中野倫靖,後藤真孝,梶田秀司,松坂要佐,中岡慎一郎,横井一仁
HRP-4C未夢に実装された顔動作生成システム.内容については去年のCEATECで見たが,その他の部分もなかなか興味深い.「歌うロボット」が重要な応用だというのは独特な主張だが面白い.最初はVocaListenerの話,ブレスの検出と合成.次にVocaWatcherで,顔検出と分析にはFaceAPIというソフトを利用.HRP-4Cの首から上は11自由度で,それを制御する.瞬き,視線などについてはfaceAPIの検出領域を使って独自に認識している.口の空き具合はパーティクルフィルタを使って追跡する.最後には「歌うロボット研究」について熱い思いが語られる.

(7) ラップスタイル歌声合成の検討
   才野慶二郎,大浦圭一郎,橘誠,剣持秀紀,徳田恵一
motsuのラップスタイルを再現する歌声合成.最初に才野さんから説明.まずラップ歌唱の記譜法を定義するところから始める.基本音高から±2段階(マイナーペンタトニック)の五線譜に対して音符を置き,グリッサンド記号を付けたもの.後半は大浦さんが合成の話.合成にはHMMを使う.また,HMMで合成したパラメータをVOCALOIDパラメータに変換して合成する試みも行った.HMM合成による歌唱は結構それらしくできている.VOCALOIDに歌わせたものは「ラップ風のピッチを持った通常歌唱音声」なので声質変換などが必要そうだ.

●スペシャルセッション「歌声情報処理最前線!!」第3部 【16:35-18:00】
(8) 歌声のテクスチャに信号処理はどう迫るか
   河原英紀
iPad用のブックを使って説明.枚数が多すぎてすべてを説明するのは不可能なのだがそこに挑む河原先生カコイイ.スライドの動作は面白いのだが,いつものようにかいつまんだ説明.位相と群遅延の説明.複数音源を分析する手法には興味があるのだが,詳細は良くわからないので予稿を読まなければならない(予稿にも書いてなかった気がするが).非常に短い単位での高精度F0推定方法.中川先生の「スペクトルとピッチのどちらに感情成分がより多く含まれるか」というのは面白い問いだ.

(9) 協調的創造活動支援を目的とした歌声合成基盤技術の研究開発
   森勢将雅,河原英紀,小川真
ニコ動などの創作の協調活動が,歌声合成システムでも起きるのかを試してみたというのがテーマ.創作支援のためにライセンスフリーな分析合成系をわざわざ発明し,公開して誰かが使ってくれるのを待ってみた.その結果,次のv.Connectを含む3種類の歌声合成システムが作られた.森勢さんが事前に「フザケた発表」とか言ってた割には普通の良い発表だったと思う.WORLDを使ったリサンプラの名前が「エターナルフォースブリザードリサンプラ」(相手は死ぬ)だったところぐらいか.

(10)v.Connect:ユーザが声色操作可能な歌声合成器
   小川真,矢崎俊志,阿部公輝
修羅場Pさん.CadenciiをGUIとして動く合成器v.Connectの説明.複数の声色を持つライブラリに対して,それをWORLD分析合成系で補間する.速度を速くするための実装とデータベース圧縮.データベースはOGG Vorbisで圧縮してその都度展開しているそうだ.実際には,複数の声色を軸として歌声の表情を変えるような使い方をしている.複数の声色の補間を,実際には調整パラメータのように使っているので,楽曲生成のためにはどういう声色ライブラリをそろえるべきなのかが気になった.

(11)歌唱における表現意図を考慮した歌声F0生成過程とその統計的モデリング
   大石康智,亀岡弘和,持橋大地,柏野邦夫
歌唱のF0成分の中から,歌唱者の意図(ビブラート,ポルタメント等)を分離する試み.これがうまくいけば,歌唱F0は楽譜通りの成分+生理的変動成分+歌唱意図成分に分離することができるようになるだろう.藤崎モデルに類似した「表現指令」というものを仮定する.指令をHMMで生成して,それが2次系を駆動して実際のF0成分ができるというモデル.推定はEM.どこまでが意図的なのかについていろいろ質問があった.また,ビブラートは振動なのか指令なのかが興味深いという複数の質問者からの指摘があった.

夜セッション

SF作家の野尻さん,クリプトンの伊藤社長,ドワンゴの戀塚さん,ヤマハの剣持さんによるセッション.司会は後藤さん.

・野尻さん:地球外文明との音楽交流を実現する無人探査機の考察.恒星間無人探査機SIGMUS-1計画.音楽による異星人との交流は未知との遭遇みたいな?異星の原住民の「音楽」を自動解析するテクノロジーって難しそうだなあ.ディスカッションの途中から後藤さんが暴走.
・伊藤社長:バーチャル・インスツルメント(ソフト音源)の話.サンプリング周波数や量子化ビット数を上げていくと容量が増大し,メモリにロードできなくなる.再生側でハードディスクストリーミング技術などを利用.これが現代のメロトロンという説明にはちょっと微笑みがこぼれる.2次創作とピアプロの話.ホーカロイド曲を聴いている視聴者層のボリュームゾーンは圧倒的に10代女子.日本だけ30~40代男性がやや多い.
・戀塚さん:ニコニコ動画の紹介.音声技術の使いどころ:コメントの音声化,音声によるコメント.楽曲情報抽出,音声インデクシング.鑑賞時間節約のための技術.今北産業テクノロジー.
・剣持さん:VOCALOIDの歌は誰の歌?VOCALOIDの「歌い方」のモデル化.VOCALOIDキーボード.歌詞のある歌をリアルタイム演奏するむずかしさ.歌における歌詞とは何か.歌詞についての理解を深める必要性.

野尻さんの質疑応答で時間が足りなくなり,プレゼンを一通りやった後で飲み会に突入.
319(みーく)号室で酒を飲みながらエンドレス議論大会.私は1時ごろ撤退.

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

※ただしPHPを除く -- あるAdmin

読み込み中...