VoiceXML 2.0 CR公開 22
ストーリー by yourCat
お喋りネットサーフ 部門より
お喋りネットサーフ 部門より
KAMUI曰く、 "Mainichi INTERACTIVEの記事に依ると、W3Cは音声を使ってウェブにアクセスする為の技術仕様「VoiceXML 2.0」の勧告候補を公開した。
VoiceXML はその名が示す通り XMLベースのウェブページ記述言語。各種の音声処理を可能にするもので音声ナビゲーションなどに利用出来ると言う。W3C では他に,音声合成記述言語「SSML」などその他の音声処理用記述言語も開発中。
最近「布団でネット」なのですが,マウス操作の為に腕だけは出さねばならず寒いのです。「寝たままウェブ巡り」が出来るのは何時頃ですか?(笑)"
音声UIはごろ寝ネットサーフ以外にも、バリア・フリー、デジタル・デバイド解消、限定的な環境での利用など、有望な技術だ。W3Cはこの勧告候補 (Candidate Recommendation) について4月10まで意見を求めている。(…)
もっとも、ZDNNの記事では知的所有権の問題を指摘している。W3C発ではないVoiceXML 1.0はRAND (Reasonable And Non-Discriminatory ) ポリシーだったが、その影響が出ているようだ。W3Cはその後RAND廃止を謳ったが、そう簡単に話は進まない。うまくまとまるといいのだが。
なお、部門名はタレコミ原題を拝借した。
特許が鍵らしい (スコア:2, 参考になる)
Re:特許が鍵らしい (スコア:0)
トップでは省略されてる部分なので気がつかなかったんだろうけど。
寝たままウェブ巡り (スコア:2, おもしろおかしい)
寝言は危険 (スコア:2, おもしろおかしい)
# chmod go-x ~/.mozilla すると、それはそれで…
Re:寝たままウェブ巡り (スコア:1)
キーボードが使えなくなるので、ブラインド
を覚えました。ラッコ状態。
布団のなかでは、光学マウスが快適です。
Re:寝たままウェブ巡り (スコア:1)
Re:寝たままウェブ巡り (スコア:1)
#「HP-GLのデータをPC-6022で出しても意味無いんだから、ESP/Pageに変換するしかないよ」と寝言で
#喚いた事あったそうな…
/* Kachou Utumi
I'm Not Rich... */
ワイヤレス光学式マウス(オフトピ) (スコア:2, おもしろおかしい)
Re:ワイヤレス光学式マウス(オフトピ) (スコア:1)
有線でも布団から手を出さなくてもいいですし、平面も必要ないですし。
大幅仕様変更? (スコア:1, 参考になる)
Re:大幅仕様変更? (スコア:1, すばらしい洞察)
読みたくなったんですね?
だけどこう言うのって実際は・・・ (スコア:1, 興味深い)
マイク (スコア:1)
知らない人に110番通報されかねない内容ですな(笑)
----
のうみそきんにく、いぇーい
そのゲームのシステム (スコア:1, おもしろおかしい)
あ、あとプレイする勇者も必要だ
Re:そのゲームのシステム (スコア:1)
アダルトビデオに革命? 音声認識インタラクティブDVD [hotwired.co.jp]
DVDのインタラクティブ機能を使ったアダルトビデオの映像切り替えに,音声認識を使おうという話です。米国のビデオ制作会社が2003年1月を目処に開発を進めているそうなので,もう出ているのかも。
Re:だけどこう言うのって実際は・・・ (スコア:0)
「タブ、タブ、クリック、ページダウン」
とかボソボソ言ってたらさぞかし気味悪がられるでしょう。
たぶ(「プレビュー」へカーソル移動)
たぶ(形
Re:だけどこう言うのって実際は・・・ (スコア:0)
# お隣さんに不審がられようとしったこっちゃねぇっ!
でも (スコア:1)
Re:でも (スコア:3, 参考になる)
以下,曖昧な知識で書くので,間違いがあればご勘弁&ご指摘下さい>識者な方。
VoiceXML自体は,「(○○というアクションをまず起こして,)△△と発声されたら,××というアクションを起こす」という対話の流れを記述するだけのものです。Webブラウジングなら,「リンクリストを表示して,あるリンクが発声により選択されれば,そのリンク先にとぶ」という感じですね。で,実際の使用では,音声認識エンジンと,(VoiceXMLを解釈して)アクションを実行するアプリが必要になります。
コールセンタの電話自動応答やCRM向けに,音声自動応答サーバが製品化されています。いくつかの製品では対話の流れを記述するためにVoiceXMLを利用しています。
MSが主導している SALT+.NET Speech SDK [srad.jp] は,.NET Speech SDKの部分で,アクションを実行するアプリを実装できます。音声認識エンジンもMS製のものが込みになっているはずです。
…イマイチ元発言の疑問に答えられていないような気がしますが,VoiceXMLはさておき,SALTに関して言えば,そのうち音声でブラウジングできるIEがリリースされるんだろうなあ,とか思っています。
さて。VoiceXMLを用いて音声認識アプリを作る場合,使うエンジンは何でも良い訳です。しかし,エンジンによって,グラマー(語彙リスト)の記述方法も異なりますし,エンジン特有の機能(オプション)なんかもあります。以前聞いた話だと,VoiceXMLではこの辺をどう指定するのか,特に決められていないそうです(使う音声認識エンジンに合わせて記述しわけるか,独自拡張するか)。VoiceXML 2.0ではこの辺どうなっているのでしょうか。
# というか,勧告案を読めば分かる話なので,週末にゆっくり読みます。
Re:でも (スコア:1, おもしろおかしい)
Re:でも (スコア:1)
Mozillaはすでに対応したみたいですね (スコア:0)
別にMozillaが対応してるわけじゃないか。
まぁ一応。