nabeshinによる
2008年05月02日 13時10分の掲載
アウトプットがわかりやすいと意欲がわく部門より。
アウトプットがわかりやすいと意欲がわく部門より。
ITmedia Newsの記事によると、「初音ミク」を人間のように自然に歌わせる「ぼかりす」なる技術が話題になっている。ボーカロイドにおける細かいパラメータ調整、いわゆる「神調教」を自動化する技術のようで、ニコ動に投稿されたデモを聞くと、音程の揺らぎ感などがあって、かなり「人間的」な歌い方になっている。もっとも一部には「不気味の谷」なんてコメントもあった。
他のコメントによると「人間が歌った声からパラメータを抽出する」技術を使っているらしく、気になったのは、この技術を開発したのがあの産業総合技術研究所(産総研)らしいという点。5月末には、音楽情報科学研究会が開催する第75回研究発表会において、「VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステムの提案」なる研究発表が行われる。産総研といえば恐竜ロボットを造ってみたり、人型ロボットを踊らせてみたりする一方でアスベストを無害化してみたりと、色々やってるので不思議では無いと言えば無いのだが。また、この発表会の予定にある「ニコニコ動画における映像要約とサビ検出の試み」ってのは一体?(^_^;
関連ストーリー
壁から剥離せずにアスベストを無害化 34 コメント
産総研とNEDOが恐竜型ロボットを開発 29 コメント
人力ボーカロイド支援ツール「UTAU」 26 コメント
HRP-2は踊りの名手 56 コメント
「がくっぽいど」、7月末に発売 30 コメント
この議論は賞味期限が過ぎたので、保存されている。
新たにコメントを書くことはできない。
2ch有志による解析について (スコア:5, 参考になる)
2chにおいて「400氏」が人力での「ぼかりす調整」の再現に挑戦し
mp3とvsqをアップロードしています。
詳細は以下のブログをどうぞ。
人生は是勉学の事: 400氏のVSQファイル解析
http://akira-izumi.cocolog-nifty.com/patent/2008/05/400vsq_6746.html
肝は人間の歌唱での発語、アクセントなどをより具体的に
ボーカロイドのパラメータに反映させてやることのようです。
なお、「400氏」の手法は他のボーカロイドにも適用できます。
「400氏」のVSQファイルを「リン」で再生したmp3を聞きましたが、
独特な癖が消えて自然で明瞭な歌唱になっていたことが印象的でした。
神調教って (スコア:4, おもしろおかしい)
関連 (スコア:4, 参考になる)
後藤さん関係のスラド過去の記事
http://slashdot.jp/science/article.pl?sid=04/06/12/2311218 [slashdot.jp]
研究発表の資料、そのうち読んでみたいなぁ。
この件で一番すごいと思ったこと (スコア:4, 興味深い)
4/30の昼くらいに存在を知ったんですがその時点ですでにVocaListenerというキーワードがいろんなブログで広まりつつある状態でした。
問題の動画の投稿日が4/28の夕方で、投稿者コメントは「この調教結果を聞いてみて頂けますか?まだちょっと不自然なところがあるのですが、楽しんで頂ければ幸いです。これからもロングバージョンとか別の曲とか、どんどん投稿していきたいと思いますので、よろしくお願いします!」と、出自を示す情報はいっさいなし。
たった一日でよくここまでの情報にたどり着いたもんだ……。
//ソリッドファイター完全版 [fukkan.com]復刊賛同者募集中/
Re:この件で一番すごいと思ったこと (スコア:3, 参考になる)
投稿者だけができる作業は、タグを変更・削除されないようにロックすることだけです。ちなみに、タグ自体は10個まで登録できて、4つまでロックできます。
#普通は、アップロード直後に自分でタグをいくつか登録して、それをロックします。
#中には、後から閲覧者によって登録されたタグもロックしてるケースもあるようですが
//ソリッドファイター完全版 [fukkan.com]復刊賛同者募集中/
親コメント
権利関係 (スコア:2, おもしろおかしい)
この技術を悪用すると… (スコア:2, 興味深い)
結局 (スコア:1)
微妙… (スコア:1)
Re:微妙… (スコア:4, 参考になる)
万再生が1件程度の下手くそですがミク打ち込みやっとります。ぼかりすのサンプルを聴いてみましたが、音程・音量・ビブラートは良いと思います。私にはこんな打ち込み無理です(T_T) ただ、人力調整に比べてサンプルの滑舌はあまり良くなく(調整対象外なんでしょうか?)、そのあたりが不気味の谷と言われる原因の一つじゃないかと推測しています。
しかし、ぼかりすのサンプルで決定的にダメなのは、萌えな(ry
ぼかりすは自然すぎて、VOCALOIDとしてのキャラクター性をスポイルしている気がするんですよね。無
論、リアルさを求めるなら正しい方向ではあると思いますが、それなら人間が歌えば良いわけですし。
オリジナルでもカバーでも、"VOCALOIDの曲"を作るなら、求められるのは、曲のコンセプトとVOCALOIDのキャラクター性を基礎においた、機械っぽさと人間っぽさのバランスの取り方なんだと思います。
>ニコニコ動画における映像要約とサビ検出の試み
野球中継からハイライトを抽出する研究の対象差し替え版と予想。
親コメント
Re:微妙… (スコア:2, 興味深い)
人気を博している作品はどれもとんでもない手間ひまをかけて調整しているようです。
逆にアクセスの少ないものを聴いてみると分かりますが、ミクはただ音程を打ち込んだだけではいかにも音声合成な歌声(しかも場合によっては音痴)しかでません。
その手間のかかる作業の大部分を自動化できるというところがポイントでしょう。
親コメント
Re:微妙… (スコア:2, 興味深い)
元から人工的に作られた音声の方が聞き易くても不思議ではありません。
親コメント
Re:対照実験 (スコア:2)
親コメント
Re:調教 (スコア:1, おもしろおかしい)
親コメント
Re:調教 (スコア:2, おもしろおかしい)
たとえば「馬の調教」と聞いて眉をひそめる人はいませんよね?
きっとあなたはこの「発声ソフト」を女の子だと認識しているのでしょう
(少しうらやましい気もします)。
親コメント
Re:「人間が歌った声から抽出されたパラメータ」の著作権は? (スコア:1)
専用ソフトとして作った方が効率的でよさげだと思います。
(声質を別人のものに変えるソフトとして)
話題性という意味では、初音ミクにする必要があったのかもしれませんが。
親コメント
絶望しなくていいです。ここで聞けます。 (スコア:1)
clausemitz - Twitter始めたお(^ω^)→ http://twitter.com/clausemitz
親コメント
難しければ難しいほど萌えてくる (スコア:1)
歌わせ方を工夫して生声にどれだけ近づけられるか、あるいは逆に癖を生かした作曲を行うか、
そのあたりは使用者の腕の見せ所でしょうし、
だからこそ見事な「調教」をやってのけた人に惜しみなき賛辞が贈られるのでしょう。
そういう意味では、PSGやFM音源による作曲、ドット絵などに近いかも。
#OPLLとOPNAが今でも好きなID
親コメント