パスワードを忘れた? アカウント作成
9905897 journal
日記

aitoの日記: 9月1日(日)SIGMUS@東大 午後まとめ

日記 by aito

■歌声情報処理最前線!!! 第2部(13:30-15:00)
(22)混合ガウス過程に基づく歌声音量軌跡の生成過程モデル
   大石 康智,亀岡 弘和,持橋 大地,柏野 邦夫
歌声の音量のモデル化.いくつかの歌唱についてパワー軌跡の例が出たが,結構軌跡が違うところが面白い.特定歌唱者のパワー軌跡をモデル化し,楽譜に対してパワー軌跡を対応付け,最終的には新規の音符に対してパワー変動軌跡を生成するのが目標.軌跡のモデル化には混合ガウス過程回帰を使う.入力変数は音符コンテキスト(あるフレームの音符内位置,音高,音長からなるベクトル).学習はMCMC-EMアルゴリズム.混合分布にすることで予測性能が向上する.音量のダイナミクスへの影響を見たとき,音符の音長より音高の方が強いというのが面白かった.

(23)トピックモデルを用いた歌声特徴量の分析
   中野 倫靖,吉井 和佳,後藤 真孝
歌声から抽出する特徴量をLDAで分析する.このとき,楽曲やフレーズが文書,特徴量をVQしたコードベクトルが単語になる.ピッチシフトした歌声が誰の歌声と近いのかが分析できるところが面白い.平井堅と一青窈の近さが数値的に明らかに.その他,「ピッチシフトすると似ている」関係が次々と発見されているところも面白い.

(24)スペクトルモーフィングによるグロウル系統の歌唱音声合成
   Bonada Jordi,Blaauw Merlijn,才野 慶二郎,久湊 裕司
「うなり」などの「グロウル系統」の音声合成.主な対象は,我々が読んでいたところのポップグロウルに相当する.基本的なアイデアは,グロウル的な実音声をあらかじめ用意しておき,その励振源をそのまま使いつつ,音高・音色を別な歌声のものに挿げ替えることでグロウル発声をシミュレートする.音高を合わせるのに,調波成分とその周辺を切り張りすることで非線形にスペクトルを伸縮する.スペクトル概形を合わせるには,F0に同期した周波数区間を設定して,区間ごとに一様に振幅を増減する.ここまでで元の(グロウルでない)音声と,音高・音色を合わせたグロウル音声は同期しているので,元音声との間でモーフィングができ,音声の任意の位置のグロウルっぽさを自由に設定できる.

(25)異なった時間軸を持つ複数の歌声の実時間モーフィングについて
   河原 英紀,森勢 将雅,坂野 秀樹
3つ以上の音声の間でのモーフィングの定式化.パラメータ補間のやり方に3種類の方法を考案したのが新しい点で,一般の値を持つパラメータは線形補間,非負パラメータは対数線形補間,単調増加するパラメータ(時間軸とか)は微分係数を対数線形補間する.

■歌声情報処理最前線!!! 招待講演 (15:10-16:20)
(26)歌声合成技術とその未来
   剣持 秀紀
・歌声合成方式の歴史
・歌声合成システムに求められるもの  了解性,自然性,操作性
・VOCALOIDの基本的合成方式
・なぜ合成された歌声を聴くのか?
 歌手がいないので,作曲者→聴き手
・新しい楽器と新しい音楽
・グロウル表現(上の才野さんの発表),複数ライブラリ間のモーフィング
・歌声合成でしか実現できないこと
        亡くなった歌手の再現 植木等など

(27)国境を超えて拡がるボカロムーブメン卜の現状と課題
   伊藤 博之
・VOCALOIDムーブメントが海外でどのように受け入れられているか,解決すべき課題点
・2011の様子
 トヨタCMでの初音ミク使用 ミク支持層がカローラの客層と重なっていた
 MIKUNOPOLIS LA,Mikupa in Singapore
 Google Chrome CM
・2012の様子
 MIT, 北京大学,エジンバラ大での講義
 大感謝祭Live Viewing in 上海
  中国の場合は役所の申請が必要 生中継は認められていない
 上海CCG Expo 展示即売 上海はリン・レンのコスプレが多い
 香港公演 コンサート終了後コスプレ撮影会になだれ込む 1/3程度は中国本土から参加と思われる
 Mikupa in 台湾 声援が熱い 男性が多く,やや年齢が高い(日本と香港の中間)
  尖閣問題の時期だったが,特に問題なし
 初音ミクイラストにCCライセンス付与
  ピアプロキャラクターライセンス(PCL)は日本の状況に即して制定している→海外向け翻訳・改訂が難しい→CCに参加
・2013の様子
 CLASH Indonesia
 SXSW Austin, TX パネルディスカッション
 Japan Expo Paris 講演
 Anime Expo LA
 マジカルミライ(横浜アリーナ) ライブビューイングを海外8地域23会場で開催
・どういう人がファンなのか
 アメリカのデータ 男:女=6:4 10代女子が最も多い
 Facebook Hatsune Mikuの友達 女が55% ほとんど24歳以下 ほとんどがアメリカで最近はメキシコ・東南アジアが増加
  北米では10代女子,南米では10代男子が多い
 微博ではミクは35万フォロワー フォロワーは男:女=58:42
 中国ポータル soso.com 日本の女性アーティストで2位 総合ランクで247位
・海外でのファン活動
 コスプレが多い
 MMDコンサート,自国文化へのアレンジ(ちまきミクとか),ミクケーキ
 コスタリカにファンが多い?:平和+ネット完備→オタクが増える
 中国に著作権意識が芽生え始める
・課題
 制作環境 Mac対応でないと無視される VSTi対応
  PiaproStudio開発
 商流づくり (KARENT)欧米,中国,韓国,東南アジアでも配信
 クールジャパンの低迷
 海外のクリエイターやファンについて日本人がバッシングしてはいけない

■歌声情報処理最前線!!! 招待講演 (16:40-17:50)
(28)技術交差点~「Project DIVA」と「ミクの日感謝祭」~
   大崎 誠
Project DIVA,ミクの日感謝祭の技術関係.
・Project DIVA Arcadeの技術
 アニメーション
  バーチャファイター以来培ってきた技術を使用
  Inverse Kinematicの利用でCGの破たんを回避
  モーションキャプチャを利用,リアリティ向上
 グラフィックス(OpenGL,IBL)
  バーチャファイター5はLinuxベースだったのでOpenGLを利用
  アンチエイリアス,Sub-surface scattering,non photo-realistic rendering
 物理計算
  1/64sに耐える物理演算
  髪の毛の揺れ,服の動き
  個別に外力設定が可能(風など)
 アニメーションと物理計算の「シンクロ」が「全体のリアリティ向上」に一番重要
・ミクの日感謝祭
 Project DIVA Arcade (Windows XP Embedded) から出力
 画面解像度を向上
 ゲームベースで1/60でレンダリング
 実際の手順
  セットリスト決定
   原曲のゲームのモーションを利用
  曲間つなぎ,新曲ではモーションキャプチャーでモーション作成
  モーションデータのブラッシュアップ
   モーションデザイナーの仕事
   エモーショナルな部分には時間がかかる
  揺れもの設定
   単純に物理計算だと気持ちのいいアニメーションにならない
  口パク設定
   スクリプトでプランナーが設定
  ディラッドボードに映して映像チェック
  本番
・技術交差点 音声合成技術とCG技術が出会うとき

(29)初音ミクが増える事の可能性~声や歌の可能性が増えるという技術の視点と,露出が増えていることによるビジネスの視点の隙間から~
   佐々木 渉
・初音ミクの商業/ビジネス面の現象を振り返る
 バーチャルアイドル的な物については同じようなことが起きる可能性がある
・初期(2006~2008)
 VOCALOID製品(MEIKO/KAITO)
 VOCALOID2,初音ミク発売,異例の大ヒット
 イラスト,CG増加 ピアプロ,pixiv,MMDなどのリリース
 初音ミクの多様なチューニング(Lat式など),Project DIVAの衣装を公募(ユーザー主導)
・2007~2008の企画提案
 フィギュアメーカー5社以上
 ゲームメーカー4社以上
 音楽出版5社以上
 書籍出版5社以上 アンソロジーコミック等
 芸能事務所・代理店 2件 アーティストとしての事務所所属の打診
 アニメ化・実写化 3件
 アニメライブ 1件 アニソン作家のオリジナル中心
 その他 体脂肪計,ミニ四駆,ブリキのおもちゃ,グッズ等
 活動する作家の邪魔・モチベーション低下の原因にならないこと,ファンのニーズに最低限答えてくれることが基準
・当時の課題の一例:初音ミクのトークについて
 企業からの問い合わせ
  しゃべれるのであれば商品宣伝に直接使える,アニメキャラクター,タレント展開
  →喋ると歌がかすんでしまうのではないかという判断をした
・2009~
 音楽CDの成功 ビジネス的な可能性・価値が論じられるようになる
 アニメPV,MMDの発展 若い視聴者とクリエイターの増加→コミュニティの細分化
 セガによるライブの成功→メディア露出の増加
 グッドスマイルレーシングのサポータービジネスの成功 など
 北米トヨタとのプロモーション展開,LAライブ,ChromeのCM
・2009以降
 物語化(高速ボカロック) 活動多角化
 企業コンテンツ,DIVA,ねんどろいど等の一般化
 一般ファンの増加
 ニコ動の中のキラーコンテンツの減少
 TVコマーシャルの効果が薄くなる
・クリエイターとのかかわりをさらに学んでいくことの重要性
 初音ミクがなぜここまで好意的にみられているのか分析できていない
 クリエイターのさまざまな思い
・企業として意識しなければいけないこと
 Webカルチャーに乗っかって「バズれば良い」という発想は,Webカルチャーの繊細さをつぶす
 企業はWebカルチャーと違う営利組織であることを認識すべき
 Webカルチャーと企業が協力するときには,企業は営利目的であることを認識すべき
 Webカルチャーを扱う企業は「ある意味で,権利が明確でない人気を預かって使わせてもらっている」ことを認識すべき
・今後の課題
 来年以降VOCALOID製品をどう売っていくか
  ニコ動に投稿しないクリエイターは何をしているのか
 初音ミクのプロジェクトがマルチクライアント化
 クリエイターのアマチュアとプロの境目がなくなってきている
  コミュニケーション方法や事故防止
 初音ミクの見え方:シンセサイザー,アンドロイド由来 技術との親和性
  音楽・動画以外で初音ミクを下支えしている要素と連携する必要

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds

読み込み中...