IBMが自社の音声認識ソフトウェアをオープンソース化 57
ストーリー by wakatono
競争と改良のるつぼへ 部門より
競争と改良のるつぼへ 部門より
skimsr 曰く、 "IBMが自社の音声認識関連ソフトウェアをオープンソース化すると発表した(タレコミ時点ではまだIBMからのニュースリリースは出ていない)。音声認識ソフトウェアをApache Software Foundationへ,音声編集ソフトウェアをEclipse Foundationへそれぞれ公開するとのこと。NewYork Timesの記事は,今回のオープンソース化の理由を,自社製品のWebSphereと競合しMS Speech Server 2004を擁するMicrosoft Windows .Netに対抗するため,と分析している。参考:/.本家の記事。
ちなみに,IBMの音声認識ソフトウェアに関する最近のニュースとしては他にも,Opera 7.60プレビュー版への搭載,米国ホンダのカーナビシステムへの搭載がある。
オープンソースの音声認識ソフトウェアとしては,Intelも音声認識ソフトウェア(AVSR: audio-visual speech recognition)をオープンソース化して公開している。日本でも大規模連続音声認識エンジンJuliusがオープンソースソフトウェアとして開発されている。"
ViaVoiceじゃないみたい。 (スコア:4, 参考になる)
One collection of speech software for handling basic words for dates, time and locations, like cities and states, will go to the Apache Software Foundation.
とあるので、提供されるのは日付、時間、地名などの単語認識のエンジンとデータベースではないでしょうか。
ViaVoiceは限られた単語のみだけではなく、文章でも認識できる、いわゆる「大語彙連続音声認識」と呼ばれる音声認識器なので、残念ながら今回提供されるのはViaVoiceそのものではないかもしれません。もしかしたらViaVoiceのエンジン+単語データベースかもしれませんが、いずれにせよ、連続音声用のデータベースがないと文章認識には使えません。
The company is also contributing speech-editing tools to a second open-source group, the Eclipse Foundation.
ところで、こちらの「speech-editing tools」は何でしょうね?
Re:ViaVoiceじゃないみたい。 (スコア:1)
とりあえず補足リンク:
IBMのプレスリリース [ibm.com]と,ITmediaの日本語速報記事 [itmedia.co.jp]。
タレコミ時点ではよく分からなかったのですが,ここでオープンソース化されるのは,音声で操作可能なWebアプリケーションの開発/実行環境,という事のようです。応用先はWebアプリケーションだけでは無いのかもしれませんが…。
今回オープンソース化されるのは,私の理解では:
で,前者をEclipseへ,後者をApacheへ,それぞれ寄付する事を提案しているようです。
後者は "Reusable Dialog Components (RDCs)" と呼ばれているものだそうです。詳細はよく分かりませんが,単語/コマンド音声認識なのだと思います。
御約束 (スコア:2, おもしろおかしい)
Just use the keyboard.
Keyboard. How quaint.
せつめい! (スコア:1)
Scottyが20世紀のコンピュータを使ったところ.
Scottyがコンピュータに呼びかけて、
マウスをマイクして、
技術者に「キーボードを使うんだ」って
言われるところです.
やなぎ
字面じゃなく論旨を読もう。モデレートはそれからだ
Re:せつめい! (スコア:1)
Star Trek IV The Voyage Home (邦題: 故郷への長い道)
ですね。1986年の劇場公開作品。
使ってたのは Macintosh SE か Macintosh Classic だったかと。
Re:せつめい! (スコア:1)
やなぎ
字面じゃなく論旨を読もう。モデレートはそれからだ
使い道 (スコア:1, 参考になる)
とりあえず使い道としてざっと思いつくのは
とかですかねぇ。
折角だからIBMが思いもつかなかった使い方で使い倒すぐらいの勢いでいきたいもんです。
Re:使い道 (スコア:1)
And now for something completely different...
テープおこし (スコア:1)
リアルタイムでなくて、ちょっと時間がかかってもいい。
CNN (スコア:1)
Re:使い道 (スコア:1)
Re:使い道 (スコア:0)
Re:使い道 (スコア:0)
Re:使い道 (スコア:0)
はやくPhotoshopで使いたい (スコア:0)
左手の疲労が低減しそう。
ViaVoiceの販売・サポート元について (スコア:1)
ボイスらんど [ibm.com]
スキャンソフト株式会社・IBM ViaVoice日本語版ホームページ [scansoft.co.jp]
但し、これに関してはViaVoice V10以降となります。
Super Souya
予想 (スコア:1)
Re:予想 (スコア:1)
使い物になってたのかは知りません。
# ViaVoiceでorzしたことあるのでID
---にょろ~ん
Re:予想 (スコア:1)
自分の名前に書き換えできるものだと、呼びかけを代名詞にしたようなモノ(「君(キミ)」やら「先生」やら「お兄ちゃん」やら、「兄チャマ」やら「兄様」やら(笑))とか、名前の部分を抜かして音録りしたものとか、そんなのがほとんどで、そうでないのは主人公の名前は決め打ちで固定されているわけで。
移入しやすい作品なら代名詞とか主人公の名前とかで呼ばれてもいけますが(爆)、テキストには自分の名前が出ているのに音声では呼びかけが無かったりすると結構萎えるもので(笑)
ソコをうまい具合に合成できるならばかなり有用ではありますが、モノがモノだけに半端なものはかえって萎え萎えになってしまうわけで、実現はかなり難しいとは思いますけどね…
単に名前の音を呼ばせるだけでなく愛称とかにも対応しなくてはならないし、情感のこもった呼びかけにする必要も出てくるわけですし。
#あと、ただでさえ軽く扱われがちな声優さんが、更に軽く見られそうなのも気になりますね。
#…ハリウッド俳優がCGキャラを固辞したってハナシもありましたな、そういえば。
ところで、音声認識によるこの手のゲームって、テキストウィンドウの科白をマイクに向かって読み上げないと先に進めないとか?
…ただでさえアレなのに、更にアレな感じになってしまうな(笑)
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:予想 (スコア:2, 興味深い)
オンライン(とかハガキとか)でユーザー登録してもらって、
その際に呼んでほしい文字列を指定しておいて、一週間後とかの
一定期間後に声優が吹き込んだ音声データをインストールする
プログラムのURLが送られてくる、みたいなシステム作ればいいんとちゃいますかねー。
#でもそしたら変な愛称を言わせる奴が続出しそうな予感
Re:予想 (スコア:1)
ただし、あんまりブレイクしなかったというか……他社は採用していませんね。音声用にディスク丸ごと1枚ぐらい使ってたからかな?(w
--- どちらなりとご自由に --- --
Re:予想 (スコア:0)
# 女の子には萌えなかったのは秘密だ。
Re:予想 (スコア:1)
最近 Julius を利用したデスクトップアクセサリが公開されましたけど、家族が居るとかなり恥ずかしいです。
さらにはエロゲだったらもう憤死ものかと^^;
出力と違ってどうしても外部に漏れますし。
Re:予想(スコア:-1,下品) (スコア:0)
ああ、確かに声はティッシュの中には収まらnqあwせdrftgyふじこlp;@:「」
#マジでそう読んだ_ト ̄|○
Re:予想 (スコア:0)
見てみたいのだけど、どこにある何てソフトですか?
Re:予想 (スコア:1)
とりあえず (スコア:1)
認識してコマンドを実行……とかやってみた人いるんかな?
さらに、電話をはさんでやるとか、テキスト読み上げ→音声認識→テキスト読み上げ→音声認識
→(以下略)とか無駄なことやってみるとか……
Re:とりあえず (スコア:1)
これを聖書で13回繰り返すと、隠されたメッセージが出てきます。
ΩΩ Ω<な、なんだってー
伝言ゲームのあげく (スコア:1)
rm -rf /
_| ̄」○・・・・・いやだよそれ。 (スコア:0)
開発ブースがあったら面白いかも・・
オペレータ:読み上げ開始
システム:カイシシマス
オペレータ:拝啓貴社ますますご発展の・・・EtcEtc
システム:ハイケイ・・・・EtcEtc
開発ブース:わー!なんじゃこりゃー!!
システム:ワー!ナンジャコリャー!!
開発ブース:デバッグ!デバッグ!
システム:デバッグをカイシシマス。
自社製品? (スコア:0)
5年前くらいに使ってみて、だみだこりゃと思って投げ出した覚えがあるんですが、最近はどうなってるんですか?
Re:自社製品? (スコア:2, すばらしい洞察)
その時は、入力デバイスとして、キーボードの替わりとして使う事を想定していたので、認識しやすいように、抑揚をつけて方言を使わずに話す事の方がハードルが高かもしれないと当時感じました。:P
Re:自社製品? (スコア:1)
Re:自社製品? (スコア:1, おもしろおかしい)
ViaVoiceでなにがつらかったと言えば、余計なことは一切言えないこと。。。
「えーと」 -> 「ええと」
「あっ、違!」 -> 「あ血が」
とか・・・。少なくとも推敲しながら文章を書いていくソフトではなかったですね。
紙に書いておいて一気に読み上げるのが最も適した使い方かも。
そういう場合の認識率は思った以上に高かった記憶があります。
Re:自社製品? (スコア:2, 参考になる)
http://www.honco.net/9905/in-mizukami-j.html
Re:自社製品? (スコア:2, 参考になる)
その時の名前は VoiceType だったなんて事を記憶している人は
今や OS/2 ユーザーだけなんだろうなぁ(苦笑)
OS/2 Warp4 に同梱(無料)でした。
もっとも日本語化が遅れてあとからダウンロード提供だった。
後に Fix 入った Warp4 with VoiceType ってパッケージでは
最初から日本語版が入ってましたね。
#マシンスペックもあって入れた事ありませんけど(^_^;
特許の壁 (スコア:0)
この上で作業するんなら(IBMなら保有特許も多そうだし)目くじら立てられることもなさそう。
あぁ、違うな、特許ってもともと公開技術か。
研究はやりやすくなりそうですか?>研究者の人。
Re:特許の壁 (スコア:0)
ローカライズって難しい? (スコア:0)
これってもちろん英語のDB持って英語を認識するんですよね?
「Opera 7.60」を単純に日本語化する場合に比べて、
「Opera 7.60 上の ViaVoice」の日本語化ってかなりコストかかりそう。
オープンソース化は良いけど、Opera の無料版にも
『英語圏以外の人間がメリットを感じられるカタチで』載せれるのかな?
Re:ローカライズって難しい? (スコア:1)
IBMのSDK高杉だったしな (スコア:0)
IBM は、SDK に 150000円 [ibm.com] もとるなんてやっていたし。
企業はいいかもしれないけど、個人がホビーユーズで利用するのにそりゃねーだろ、
な金額だしなぁ。等身大フィギュアが買えるぞ(w
で、お互いの認識力を見ると、どっちもかわらないバカなんで、
同じバカなら、安いほうがいいし。
#Juliusにしては、論外のバカなんで、熟成するのを待つ(放置の方向)で(w
Re:IBMのSDK高杉だったしな (スコア:0, オフトピック)
> 企業はいいかもしれないけど、個人がホビーユーズで利用するのにそりゃねーだろ、
> な金額だしなぁ。等身大フィギュアが買えるぞ(w
150000円で等身大フィギュアって買えるものなの???
#…と焦点のずれた質問をしてみる(汗)
Re:IBMのSDK高杉だったしな (スコア:0)
#ActiveXたんまりだったけど
Re:IBMのSDK高杉だったしな (スコア:0)
歌詞表示 (スコア:0)
自動で歌詞を表示させる機能がつくといいなぁ。
もちろん、英語らしきものを含む歌詞に備えて
ジャパニーズイングリッシュにもばっちり対応。
ついでに外国語を日本語化するソラミミ機能付き。
Re:歌詞表示 (スコア:0)
Eclipse ProjectによるProject Proposal (スコア:0)
Re:なんかさぁ最近・・・ (スコア:0)
囲い込みというか、妙に印象が良くて心配になるのは分かる。
心配な方は Linux only ではなく、 (スコア:0)
Re:最近・・・SONYの方が・・・ (スコア:0)
APPLEはそれしようとしてたけど、お金なくなってきて一部UNIX
IBMは顧客層を広げるためにLINUXを生かしてる部分と
MSによる支配が嫌いで影響量を下げたかったり、
IBMはPC総