パスワードを忘れた? アカウント作成
181033 story
テクノロジー

アップロードされた楽譜に基づいて歌声を生成する「Sinsy」 11

ストーリー by hylom
謎多し 部門より

あるAnonymous Coward 曰く、

「初音ミク」の登場を契機に、「歌声を合成する」サービスやソフトが急速に話題になっている今日この頃ですが、今度は「アップロードされた楽譜(MusicXML)に基づいて自由な歌声を生成するHMM歌声合成システム、Sinsy(しぃんしぃ)」が登場しました。

このWebサービスは、「MusicXML」形式で歌詞とメロディを記述したファイルをアップロードすると、それに応じた音声合成結果がWAVE形式で生成されるというもの。

サイトにデモが用意されているほか、ニコニコ動画でもこのシステムを使って合成した歌声が掲載されています。

このSinsy、「隠れマルコフモデル」を使った新しい歌声合成システムとのことで、パラメータ調節なしに自然な歌声を合成する、というのが特徴のようだ。色々と謎の部分が多いが、ITmediaの松尾公也氏のブログで情報がまとめられている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • うしろうしろ (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2010年01月06日 13時12分 (#1698535)
    > 今度は「アップロードされた楽譜(MusicXML)に基づいて自由な歌声を生成する
    ...
    > このSinsy、「隠れマルコフモデル」を使った新しい歌声合成システムとのことで

    サーバーの後ろでマルコフさんがパラメータ調整をやっている姿を想像しました。
    • by Anonymous Coward

      どっちかっつーと、ブラックボックスの中でマルコフの野郎が何をしてるか予想してる感じ

      • by Anonymous Coward
        アップロードされた楽譜にあわせて歌を歌うマルコフさんが隠れているのです
  • by Anonymous Coward on 2010年01月06日 17時54分 (#1698726)

    ニコニコ動画に掲載されたサンプル見てみたけど
    「クラシック専門の人にポップスを歌わせたような」
    なんともいえない奇妙な印象。
    本家サイトのサンプルはさほど奇妙に感じないので、
    ジャンルによって合う合わないが分かれるのかも。
    「設定不要で便利」と「多様な用途に対応」は
    トレードオフだしね。

  • by ddc (14170) on 2010年01月06日 19時48分 (#1698778) 日記

    何だか戦後のラジオ放送っぽく聞こえる…

    • by Mistbow (12027) on 2010年01月07日 1時35分 (#1698942)
       サンプルを聴いた瞬間に、頭の中にワウフラッターという単語が浮かんでしまいました。
       何か、テープの伸びたカセットを聞いているような、中心のずれたレコードを聴いているような。
       音になめらかさが足りないので聞きづらいという印象です。
      親コメント
  • by Anonymous Coward on 2010年01月06日 15時10分 (#1698602)
    メイドさんSinsy(しぃんしぃ)と空目してみる。
    • by Anonymous Coward
      あたしゃ怒るとメガネがビカビカ光る人かと思ったですよ多美子さん
  • by Anonymous Coward on 2010年01月06日 22時33分 (#1698855)

    キャラ絵はまだですか

  • by Anonymous Coward on 2010年01月07日 1時31分 (#1698941)

    この5年ぐらい追ってないですが、10年近く前ぐらいからHMM音声合成系って結構論文でてましたし、最低限の音声合成ツールキットは公開されていました。当時はあんまりいい音質ではなかったですが、処理のシンプルさや、音声認識の各手法を使って音質変換とかできるのが面白くて、一時期遊んでました。モデル自体の改造とかも結構容易で楽しかったです。

    今回のようなサービスを見ると、久しぶりに遊びながら論文追ってみたくなります。
    5年も経ってるし根本的な所も結構代わっているんだろうなぁ・・。

    HMM音声合成系以外でも、遊べる要素がある研究はどんどんサービス化していってもらいたいです。

typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...