パスワードを忘れた? アカウント作成
8236 story

“アニメ声”で自然に喋る音声合成技術、富士通が新開発 135

ストーリー by GetSet
「アニメ声」は自然なのか? 部門より

Anonymous Coward曰く、"ITmediaの記事によれば、富士通研究所がアニメキャラクターのような特徴的なしゃべり方も再現できるという音声合成技術を開発した、と報道している。
イントネーション、リズム、声の高さなどの「韻律情報」を高精度に抽出してデータベース化する技術を組み込み、このデータを音声合成技術に入れて雰囲気を出すというものだが、果たしてアニメ声が自然なのかは疑問だ。方言ならばまだ意味がありそうだが。結果は今年中に製品化するということだが、もうちょっと世間的に自然なサンプルを使って欲しいなぁ(長島語録風とか)。それともITmediaだからこそ、こういう報道なのだろうか?"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • たまたま (スコア:3, すばらしい洞察)

    by Anonymous Coward on 2004年05月27日 18時12分 (#557224)
    できてしい、誰かが「アニメ声に似てる」と言い出し、それが思いのほか面白かったに100カノッサ。

    昔、TIが音声合成を使った商品を出したときも「すごい!テキサス訛りを再現してる」と話題になったけど、実はそれしかできなかったという話を聞いたことがある(w
    • Re:たまたま (スコア:1, 興味深い)

      by Anonymous Coward on 2004年05月27日 18時32分 (#557236)
      わしも一票>たまたま

      Speak&Spellの声を聞いて感動したよなぁ~。
      PC-6001MK2のプリセット音声と読み上げとの落差に落胆した記憶も…。
      MZ-80K/Cに無理やり喋らせたり…。
      音声読み上げのSHARP製の時計も買ったよなぁ。

      ジジイの思い出話ですまんのぉ。
      親コメント
  • by noah_0xff (17645) on 2004年05月27日 19時37分 (#557269)
    いつぞや、どこかで自然に喋らす技術ができると
    有名人の声でエロいことを代わりに言わすことができるんで、
    倫理規定に違反するんじゃないのか、という話を聞きました。

    この技術が一般化すれば、そうなるのは確実だと思うので
    その辺りは大丈夫なんでしょうか、と疑問に思ったり。

  • これが (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2004年05月27日 17時50分 (#557195)
    新経営方針か!
  • これぞユビキタス (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2004年05月27日 18時01分 (#557206)
    将来の家電はこれで全部喋るわけだよ。
    朝起きると、、、、、

    「ご主人様おはようございます!」「おはようございます!」
    「ご主人様おはようございます!」「おはようございます!」
    「ご主人様おはようございます!」「おはようございます!」
    「今日はご機嫌はいかがですか?」「さぁさ、お食事にしましょう!」

    _| ̄|○
  • 新たな「オレオレ」詐欺 (スコア:2, おもしろおかしい)

    by fix (20730) on 2004年05月27日 20時17分 (#557291)
    ある日、一人暮らしのオタの元に、
    「お兄ちゃん、助けて。○○の口座に××円振り込んでほしいの。
    助けてくれたら○○してあげる」
    とあのキャラの声で…。
    その声に我を忘れたオタたちが銀行に列をなしてしまう光景が目に浮かびます。

  • 東芝 (スコア:2, 参考になる)

    by sham (4555) on 2004年05月27日 20時44分 (#557305)
    の音声合成ミドルウェアと比べてどうなんでしょ?
    N.U.D.E.@ [xbox.com]
    ゲーム内のせりふが全て音声合成でつくられていて、TVのCMなどは、けっこうキてますよ~。
  • by uud (22192) on 2004年05月28日 3時25分 (#557515)
    音声入出力方式標準化委員会 [jeita.or.jp]
    ここでリストアップされているところが同分野の競合他社みたいなもの?

    社内ベンチャー?の(株)アニモというのが取扱ってるFineSpeech(数十万)ですが
    とりあえずはこれに採用されるのでしょう。
    システムとかでなく安価で市場に出れば買いたいと思う人もいるだろうけど
    この場合個人的に遊び心で手を出せるのは他社製品(ViaVoiceとか)。
    でも同ジャンルのこういうラインアップ [nttx.co.jp]に平然と載ったりするのは、どのような狙いがあるのか?
    こういったことはこれひとつに限ったことではないようにも思えますが。ていうかこの会社の全て?

    とりあえず個人が遊べるレベルのものも出してほしいです。
    そういうテイスト(方向を間違わない条件で)が欲しい。
  • これで (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2004年05月27日 17時04分 (#557150)
    大山のぶ代引退も大丈夫ですね!

    #カツオの声に違和感なのでAC
    • by Yar-ihcAs (19735) on 2004年05月27日 17時15分 (#557161)
      ルパンも元に戻ると期待しても良いのですか?
      親コメント
    • Re:これで (スコア:1, 興味深い)

      by Anonymous Coward on 2004年05月27日 17時16分 (#557162)
      つーか、すでに逝去されてしまった声優さんの声から特徴を抽出して、
      いろいろセリフをしゃべらせたりとか。
      応用範囲、広そう。

      でもその場合、著作権とか肖像権とか、そこらへんはどうなるんだろう?
      親コメント
      • Re:これで (スコア:1, おもしろおかしい)

        by Anonymous Coward on 2004年05月27日 18時15分 (#557225)
        > でもその場合、著作権とか肖像権とか、そこらへんはどうなるんだろう?

        ミッキーマウス以降の著作権は、永遠に保護されます。

        親コメント
      • by signed-coward (17953) on 2004年05月27日 23時50分 (#557415) 日記
        過去の台詞を色々合わせて……っていうのは、
        少し前に石原裕次郎とか松田優作とかでやってて、
        CMとかで使ってたのを見た記憶があります。
        あれはどこに許可取ったのかなぁ……。

        この技術で、他にも色々できるようになると、
        親コメントみたいなことも可能になるかもしれませんね~。
        親コメント
    • by Sakura Avalon (12557) on 2004年05月27日 18時50分 (#557247)
      これで小西寛子、丹下さくらが声優として復活してもらえるわけですね☆

      #活動の場が分かっている丹下さくら→SAKURA [wonder-net.net]はまだしも、TV・舞台などの顔出しすら見かけなくなってしまった小西さんはいったいいずこに~!
      親コメント
    • 往年の広川太一郎のMr.Booやプロ野球珍プレイ好プレイが再現できれば…

      #御大はまだ健在ですが、流石に往年の様な喋りはもう無理なようで…
      --

      /* Kachou Utumi
      I'm Not Rich... */
      親コメント
  • サンプルボイスは当然 (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2004年05月27日 17時19分 (#557164)
    お兄ちゃんですか?

    # お兄ちゃまがいいとかあにぃがいいとか
    # お兄様がいいとかおにいたまがいいとか
    # 兄上様がいいとかにいさまがいいとか
    # アニキがいいとか兄くんがいいとか
    # 兄君がいいとか兄チャマがいいとか
    # 兄やがいいとかいう意見もありそうなのでAC

    ## ゼェゼェ… 誰か添削よろしく…
  • …… (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2004年05月27日 17時19分 (#557165)
    これ [srad.jp]は本当だったのか。
  • 「これで新作のセーラームーン セーラースターズがつくれるね」
    「10年後くらいには生身の声優なんていなくなるかもね」
    「声優業界もリストラが一層進むのかな」
    「声優の生活を奪うような技術はゆるせん」

    #「今度は本物のヴァーチャルアイドル誕生か?」(笑)
    #ダテキョー、おみま(ny
    • 声優の顔を見てがっくり、なんてことが減るのは相当先でしょうが、どうでも良いちょい役とかは案外近いうちに置き換わってゆくかもしれませんね。
      親コメント
      • シンセサイザー  というかDTM音源の音で音楽が済んでしまう感覚かな。。

        でもまぁ、どんなに音源が発達しても生楽器が無くなったりはしないように、生身の人間も残っていくんでないかな。

        # FM音源の魔術師みたく、パラメータを自在に操る「ボイスアーティスト」みたいな職業が出来そうだ。
        親コメント
        • マーケティングのことを考えると、名前と顔を立てる意味合いでも、声優業そのものが無くなることは無いと思います (声優そのものがキャラクターとしてカリスマ性を持てば、アニメ作品の宣伝にも使える)。但し、その声優さんが本当に「声優」として働くかは別として。

          声優という声優がやたらとかわいい娘さんばかりになったら、「じつはもう実作業してるのは機械なのかも」と思い初めていいかも。。。

          # んなわきゃないので ID 。。。そうともいい切れんか?

          --
          むらちより/あい/をこめて。
          親コメント
      • by Anonymous Coward on 2004年05月27日 17時47分 (#557191)
         声優の役者たる所以は、演じるキャラクターの性格や状況などを
        鑑みて、それぞれの場面でどのような「演技」をするかに掛かって
        来るかと思いますが、こういうので置き換えるとなると・・・

        現在?監督「そこは、『おにぃちゃま~』って、こういう感じで」
        将来?監督「『おにぃちゃま~』・・・んじゃ、あと声あわせは
              音響さんよろしく」

        顔を見てがっくりどころじゃすまなくなりますな
        親コメント
      • どうでもいいちょい役はたいてい、
        一人二役とか三役とか四役といった形で賄われていますが
        それを駆逐できますかね?このシステム。

        #凡例:千葉繁、林原めぐみ
        #古いか…
        親コメント
  • by Anonymous Coward on 2004年05月27日 19時12分 (#557258)
    リアルタイムで肉声からイントネーション、リズム、
    声の高さなどを抽出して、それをもとに他人の声を合成
    これでネカマの人も安心してボイスチャットにできますね

    なんてことを思い立って音声処理を一月ほど前から勉強中

    #職場からなのでAC
    #AshLama
    • >リアルタイムで肉声からイントネーション、リズム、
      >声の高さなどを抽出して、それをもとに他人の声を合成

      これができれば音声を更に圧縮できますね。
      電話も、解析して、音声パターンと会話内容データに分解して
      受手側で音声合成する時代がきそうだ。
      親コメント
    • 映画JM [amazon.co.jp]で指人形でやってましたね。
      でもね、そこまでうまくはいかんのよ

      アニメ風になったのは活舌がよかったせいだろうと思います。
      人間の話し言葉は曖昧ではっきり発音していません。
      コンピュータの音声合成風というと不自然に聞えますが
      あの発音が一番はっきりとした発音の組み合わせです、
      しっかり発音していると思っている一般の発音はかなり崩れた発音です
      その中間にあるのがアニメだと思います。

      #波形を取り出して短い間のループを行うと曖昧すぎてわからなかったりします。
      #その曖昧な発音は脳が勝手に補完して理解しています。
      #そのためできそうでできなったのはこの辺になり
      #実現するには、発音そのものをフレキシブルに変形できる構造じゃないと
      #自然な言葉は話せないだろうと思います。
      親コメント
  • この記事からだけだと具体的にどうすごいのかよく分かりません。

    「肉声から韻律情報」なんてのは昨今当たり前の話で、
    その後の合成時に失われる自然性をどのように回復したかが
    問題になるかと思います。

    「あらかじめ大量に集めとけ。イントネーションなんざ知らん」ならすでに CHATR があるし...
    #と、毎回この手の話題だと書いている気がする

    「イントネーションこみで大量に集めろ」なら上手く行きそうだけど、
    それだと「簡単に再現」とは言い難い。

    「少ない音素片情報から自然な合成」ができたんだとしたら、そこを強調するはずだけど、そうも読めない。

    あとは…「アニメキャラ」というところに着目するなら、
    信号処理的に「キャラクターっぽい」変換をするライブラリなり
    開発ツールでも作ったのかな?これなら少量の音声データから
    いろいろ合成できる。
    でも話者性は保存できないしなあ…。

    …って、この記事のどこにも話者性が保存されるとは書いてないじゃん。
    このへん [srad.jp]ってぜんぜん的外れなのでは?
typodupeerror

犯人はmoriwaka -- Anonymous Coward

読み込み中...