パスワードを忘れた? アカウント作成
1994215 journal
日記

aitoの日記: 2012/2/9 SP・PRMU共催研究会1日目午前

日記 by aito

・CRFを用いたTVの興味市長区間の推定方法(NHK技研)
苗村さん。テレビを見ているときのユーザの顔向きや表情など(以前の内容)、人物の動作情報に加えて、視聴・操作履歴によって視聴者の興味(主に「番組のどこの部分に興味を持っているか」)を推定する。操作リモコンはタブレットPCを想定。認識手法はLatent Dynamic CRF(隠れ層があるCRF)。5秒程度のセグメントから特徴量の統計を取って、そこから素性を生成する。実験では、一度被験者にテレビを見せた後、もう一度見せてどこに興味があったかをラベリングさせる。結果として、画像だけの情報より操作情報だけの方が性能が高く、画像と操作情報を組み合わせるとさらに性能向上。識別率はオープンで71%ぐらい。ルールベース(画像情報のみ)の性能が案外良くて、画像情報+CRFより高性能。データが少ないせいだろう。

・非言語情報を用いたHMMによるユーザ発話前内部状態の推定(東北大)
当研究室の千葉君。対話システムから話しかけられたユーザが困っているかどうかの識別。困っている人を、さらに「なにをいわれたか理解できない」人と、「どう答えたらいいか考えている」人に分類する。特徴量は音声(無音、フィラー、有声休止)と画像(顔向き)。以前の固定長の特徴ベクトルを使った識別に比べ、HMMを使った系列認識にした部分が新しいところ(性能は少し低下)。

・時空間系列パターンのスポッティング認識(会津大)
岡先生。動画像からまとまって動いている部分をスポッティング認識する枠組み。時間と空間の強い相互作用を仮定したDPの枠組みであることを強調していた。基本的に時空間の連続DPだが、ピクセル値をそのまま使うのではなく、リファレンスに関してはピクセルのまとまりの軌跡を使うようだ。その軌跡はあらかじめ作っておくということらしい。それでも入力映像の(x,y,t)に対してリファレンスの時間軸τを対応させるので4次元のマッチングが必要。大変そうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

人生の大半の問題はスルー力で解決する -- スルー力研究専門家

読み込み中...