どこまで人間に迫れるか、部門より。
昨年5月、歌声合成ソフトウェアでより自然の歌唱を可能にする謎の技術、VocaListenerのデモがあったことはご記憶の方も多いだろう。長いこと続報がなかったが、これがついに世に出るようだ(産業技術総合研究所の「歌声合成パラメーター推定技術 VocaListenerを実現」)。
詳細はリンク先を見ていただきたいが、特徴として3点が挙げられている。
- 「このように歌わせたい」と歌ってVocaListenerに入力すれば、そのニュアンスをまねた歌声が合成可能
- 従来のように歌声合成パラメーターを人手で長時間調整せずに、人間らしい自然な歌声を誰でも容易に合成できる
- 歌声合成ソフトウェアやその音源(歌手の声)を切り替えても自動的に同じ歌い方で合成可能
歌声合成ソフトウェアというと、最近ではまず初音ミクが思い浮かぶが、あれはたどたどしいところも含めて個性になっている面もあるように思う。ということで今回の技術の需要がどのくらいあるのかは判らないが、技術的には大変興味深い。
また、RBBの記事によると、「初音ミクや鈴音リンがこぶしを効かせて歌い上げているムービーが公開されている」のだそうだ。…ん? 鈴音?
そのほか、INTERNET Watchの記事に、一般向けサービスの実用化で共同開発をしているというヤマハ側のコメントも載っている。
『初音ミク』や『がくっぽいど』などを使用した楽曲が話題になり、歌声合成ソフトウェアの認知が急速に高まる中で、さらにリアルな歌声を合成させたい、もっと手軽に歌声を合成してみたいというユーザーが増えている
インターネット上でVocalListenerをWebサービスとして利用できる「Netぼかりす」のα版が現在開発されているそうで、一部のクリエイターにはすでに試用されているそうだ。
「歌います。聴いてください」(という、歌でない台詞) (スコア:2)
これ、歌唱以外の分野への応用も気になります。「ボカロ喋らせ師」(ボーカロイドに普通の会話をさせている人)向けにも使えるのでしょうかね。
将来的に、映画吹き替えやアニメ制作は、声データ提供する人と演技する人で分業になったりして。
# 大塚明夫の声に、若本規夫の喋り方…とか。
コメントを書く
Re:「歌います。聴いてください」(という、歌でない台詞) (スコア:5, 興味深い)
一応、話し声にも対応できてはいます。デモ曲の冒頭「聞いてください」などは実際に Vocalistner の機能で実現されています。
ただ、話し声の場合は明確なメロディがない分、難しい部分もあります。思わず漏れるうめき声とかため息など、歌唱用の音素からはどうしても再現しにくい部分もあるそうです。
コメントを書く
親コメント
Re:「歌います。聴いてください」(という、歌でない台詞) (スコア:2)
あれま! そういったものは音素が別なんですか。
息継ぎ音ならCVシリーズでも収録されているようですが、会話ではそういったデータが他にもいっぱい必要ですよ、ということですね。うーむ、声優の分業にはまだまだハードルが高そうか。(よかった…)
コメントを書く
親コメント
世に出るとは? (スコア:2, 参考になる)
世に出る、とは何を指しているのでしょうか。
「Netぼかりす」のα版が公開されるってところ?
ぼかりすが産総研の成果の一環なのは知られているし、機能や情報はこの一年間で少しずつ
もれ聞こえてきてるから、タイトルと本文に齟齬を感じる。
コメントを書く
Netぼかりすα (スコア:2, 興味深い)
ニコ動に数曲アップされているのを聞きました。
Vocaloid の音声データを元歌の音声データで変調する技術ということで、まんまその通りの作品でした。
まあ、どの曲も Net ぼかりすがどういう処理をするのか、ということで作られたデモなのだから、当たり前ですけど。
特に興味深いのは男性だったらココはこう歌うだろうな、という癖がかなりの強さで Vocaloid の音声に反映されていることです。
つまり、女性だったらこう歌うだろうな、という歌い方でなければ女性 Vocaloid の下地とするには不向きだという事ですね。
それを逆手に?とったソウルフルなナンバーに和田アキ子風歌唱法の元歌+ Vocaloid, Net ぼかりすαという曲もありましたが、
やっぱり男性の歌唱法が強く残っているせいで、声質とのギャップがどうしても耳につきます。
関係ないけど、動画中のコメントに不気味の谷に関するものが散見されたのは面白かった。いろんな人が見てるんですね。
コメントを書く
MikuMikuDanceの人の・・・ (スコア:1)
なんちゃってツールが思い浮かびました。
http://www.geocities.jp/higuchuu4/ [geocities.jp]
これも、ある程度の編集作業は必要そうですが・・・
コメントを書く
初音と鈴音(off topic) (スコア:1)
和音と鈴音は某作品chu [wikipedia.org]では親子ですが、
RBBの人はその作品を読んでいたんですかね。
コメントを書く
音痴 (スコア:1, おもしろおかしい)
>「このように歌わせたい」と歌ってVocaListenerに入力すれば、そのニュアンスをまねた歌声が合成可能
音痴なので涙が出てきた。
私のパラメータだと何でもジャイアンリサイタル
コメントを書く
Re:音痴 (スコア:2)
音程の揺れを半音単位に寄せる補正が出来るみたいですよ。
もしかしたら「歌の上手い自分」の歌を聴けるかもしれません。
ニュアンスの込め方まで補正できるかどうかは分かりませんが。
コメントを書く
親コメント
新しいコミュニティの発展はあるかも? (スコア:1)
最近になってニコ動界隈が分かってきたのですが、
ボカロオリジナル曲
→誰かが歌う
→合成して擬似合唱
というのがスタンダードのようですね。
ぼかりすが本格活用されだしたら
ボカロオリジナル曲
→誰かが歌う
→ぼかりすで歌い手の特徴そのままに、ボカロがセルフ(?)カバー
という新しい流れが出来るのでしょう。
// ゴムさんとかよっぺいさんとか、あの辺の台詞回しをボカロが完璧に再現したら悶え苦しむな、きっと。(:>^
コメントを書く
Re:パラメータ (スコア:3, おもしろおかしい)
破産して自分の「歌いパラメータ」を差し押さえられてしまった歌手とか出てきそうな予感。
#演目を質に入れた噺家さんってのがいたっけ?
コメントを書く
親コメント
Re:パラメータ (スコア:2)
しかし、「声」と「歌唱」が分離してしまうと、ほんとに権利関係ってどうなるのでしょうね。どちらも、従来の著作権でいうところの「実演家」の範疇に入るのでしょうか。それもなんだか違うような。
「歌いパラメータ」を差し押さえなんて事例も、出てこないとも限らないかもしれません。
# 医療(脳死問題)や生命科学でもそうですが、新しい技術が出てくると
# 古い法律で想定していなかったような問題が色々出てくる。
コメントを書く
親コメント
Re:パラメータ (スコア:1)
山ほどできそうな気がするんですが、どうなんでしょうねぇ。
で、つきつめていくと歌手の個性はちょっとした数字の羅列でしかなくなって
数KBとかのたいしたことない量に収まってしまったりとか。
パラダイムシフトが訪れる~みたいな。
まぁ全くの妄想ですが。
コメントを書く
親コメント
Re:パラメータ (スコア:3, 参考になる)
そもそも、こういった研究の目的は
・歌の上手い下手とは?
・歌唱の特徴とはなにか?
・個性とは?
といったことを、いかにして計算可能にするかも目標のうちなんでしょうから、
当然の流れかもしれませんね。
感性をいかに定量化するかってのは、工学方面では
いつも目的の一つでありますです
コメントを書く
親コメント