パスワードを忘れた? アカウント作成
4864 story

VoiceXML 2.0 CR公開 22

ストーリー by yourCat
お喋りネットサーフ 部門より

KAMUI曰く、 "Mainichi INTERACTIVEの記事に依ると、W3Cは音声を使ってウェブにアクセスする為の技術仕様「VoiceXML 2.0」の勧告候補を公開した。
VoiceXML はその名が示す通り XMLベースのウェブページ記述言語。各種の音声処理を可能にするもので音声ナビゲーションなどに利用出来ると言う。W3C では他に,音声合成記述言語「SSML」などその他の音声処理用記述言語も開発中。
最近「布団でネット」なのですが,マウス操作の為に腕だけは出さねばならず寒いのです。「寝たままウェブ巡り」が出来るのは何時頃ですか?(笑)"

音声UIはごろ寝ネットサーフ以外にも、バリア・フリー、デジタル・デバイド解消、限定的な環境での利用など、有望な技術だ。W3Cはこの勧告候補 (Candidate Recommendation) について4月10まで意見を求めている。(…)

もっとも、ZDNNの記事では知的所有権の問題を指摘している。W3C発ではないVoiceXML 1.0はRAND (Reasonable And Non-Discriminatory ) ポリシーだったが、その影響が出ているようだ。W3Cはその後RAND廃止を謳ったが、そう簡単に話は進まない。うまくまとまるといいのだが。
なお、部門名はタレコミ原題を拝借した。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 特許が鍵らしい (スコア:2, 参考になる)

    by CoinToss (12345) on 2003年01月31日 12時13分 (#247805)
    ZDNetの記事 [zdnet.co.jp]によると、一部の企業や団体がこの Voice XML に関して知的所有権を主張しているらしく、この問題がクリアにならない限り勧告にはならないみたいです。W3C も専門の特許顧問グループを設立して意見をまとめようとしているらしいです。
    • by Anonymous Coward
      それ、タレコミの最後に載ってるよ(w
      トップでは省略されてる部分なので気がつかなかったんだろうけど。
  • 寝たままウェブ巡り (スコア:2, おもしろおかしい)

    by yasuo.m (11796) on 2003年01月31日 12時19分 (#247809)
    寝言でウェブ巡りしてしまいそうな予感・・・。
  • by MATSU (11741) on 2003年01月31日 12時43分 (#247823)
    ワイヤレス光学式マウス使えば布団の中でもマウス操作可能です。
  • 大幅仕様変更? (スコア:1, 参考になる)

    by Anonymous Coward on 2003年01月31日 13時04分 (#247834)
    以前から予告はされていましたが、 この仕様変更による互換性問題には不安を感じます。 Incompatibly Modified Elements のリストの長さはかなり痛い。 dtmfタグなどは予告通り消滅してくれましたが、 多くの環境ではこの予告に従っていたでしょうからトラブルは小さいと予想。 今の考えれば1.0がdraftで2.0が1.0という状態。 仕様書のサイズが倍以上に肥大してるのはつらいところ。 もう読みたくないサイズの限度を越えました。
  • by Anonymous Coward on 2003年01月31日 13時05分 (#247836)
    シーマンみたく、周りにだれもいない時しかできない予感。
  • by bushidoh (12670) on 2003年01月31日 14時14分 (#247890)
    XML だけあっても喋れないなあ。それを使うには何が必要なんだ。
    • Re:でも (スコア:3, 参考になる)

      by skimsr (9280) on 2003年02月01日 1時41分 (#248348) ホームページ 日記
      >XML だけあっても喋れないなあ。それを使うには何が必要なんだ。

      以下,曖昧な知識で書くので,間違いがあればご勘弁&ご指摘下さい>識者な方。

      VoiceXML自体は,「(○○というアクションをまず起こして,)△△と発声されたら,××というアクションを起こす」という対話の流れを記述するだけのものです。Webブラウジングなら,「リンクリストを表示して,あるリンクが発声により選択されれば,そのリンク先にとぶ」という感じですね。で,実際の使用では,音声認識エンジンと,(VoiceXMLを解釈して)アクションを実行するアプリが必要になります。

      コールセンタの電話自動応答やCRM向けに,音声自動応答サーバが製品化されています。いくつかの製品では対話の流れを記述するためにVoiceXMLを利用しています。

      MSが主導している SALT+.NET Speech SDK [srad.jp] は,.NET Speech SDKの部分で,アクションを実行するアプリを実装できます。音声認識エンジンもMS製のものが込みになっているはずです。

      …イマイチ元発言の疑問に答えられていないような気がしますが,VoiceXMLはさておき,SALTに関して言えば,そのうち音声でブラウジングできるIEがリリースされるんだろうなあ,とか思っています。

      さて。VoiceXMLを用いて音声認識アプリを作る場合,使うエンジンは何でも良い訳です。しかし,エンジンによって,グラマー(語彙リスト)の記述方法も異なりますし,エンジン特有の機能(オプション)なんかもあります。以前聞いた話だと,VoiceXMLではこの辺をどう指定するのか,特に決められていないそうです(使う音声認識エンジンに合わせて記述しわけるか,独自拡張するか)。VoiceXML 2.0ではこの辺どうなっているのでしょうか。
      # というか,勧告案を読めば分かる話なので,週末にゆっくり読みます。
      親コメント
    • Re:でも (スコア:1, おもしろおかしい)

      by Anonymous Coward on 2003年01月31日 16時59分 (#247998)
      貴方が喋った通りに各アプリケーションを操作する貴方の手が必要です。(をい)
      親コメント
  • by Anonymous Coward on 2003年01月31日 17時09分 (#248003)
    vBrowse [mozdev.org]

    別にMozillaが対応してるわけじゃないか。
    まぁ一応。
typodupeerror

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

読み込み中...