パスワードを忘れた? アカウント作成
239997 journal

aitoの日記: 2010年7月22日(木)SP&SLP研究会まとめ 特別企画

日記 by aito
内容を要約できなかったのでキーワードの羅列.

○音楽情報の検索
KDDI帆足さん.音楽検索全体の紹介.
・厳密検索(音楽認識,ハミング検索) vs. 曖昧検索(音楽推薦的)
・厳密検索はおよそ実用レベル.曖昧検索に注目
・曖昧検索:タグ付与(ジャンル分類とか)vs. 類似楽曲検索
・初期:音楽の信号を対象とした検索 MFCCなどを利用,音楽理論は無視
・音楽ならではの特徴の利用:テンポ,ビート,クロマ
・各種の特徴解析ツールについて
・自動音楽分類の意義と手法
・にたうた検索について.http://nitauta2.kddilabs.jp/
・Webマイニングを活用した検索
        Last.fm 音楽のソーシャルタグ共有
                LSAによってソーシャルタグのノイズを抑制
        オートタギング(cold-start問題への対応)→
                協調フィルタリングやレーティングのほうが音響的特徴量より高精度
・Webマイニングの問題点:音楽の地域性,ユーザによる差異
・音楽の可視化:音響的特徴,Web情報の利用
・今後の展開
        音楽検索の実現例が少ない
        ユーザ志向の検索:ユーザ別の手法
        携帯端末向け検索:音楽クラウドへの入り口
        再生状況に応じた検索
帆足さんの歌声が聞けたのが最大の収穫か.

○画像・映像の認識と意味的検索
電通大の柳井先生.
・画像の認識と検索
        実用レベルは「キーワード検索」「位置検索」
        研究レベル:コンテンツベース画像・映像検索
        なぜ内容検索は普及しないか?
                意味が考慮できない,すでに十分なタグつき画像がある
                例外:ヤフオクの類似画像検索 ジャンルを絞れば有効
        内容検索が必要な場面
                自分で撮った写真,映像の場面検索など
        2種類の内容検索:見た目の類似性 vs. 意味的な類似性
        意味の認識:一般物体認識 物体のカテゴリー名を認識する
・物体認識
        bag-of-featuresの登場(2004),機械学習手法の発展,学習データの入手容易化
        「カテゴリの認識」(一般物体認識)と「同一物体の認識」(特定物体認識)
        特定物体認識:変形がなければ90%程度認識可能 ランドマーク画像検索に応用
                局所不変特徴量の利用
                特徴点に基づく対応の検索
        一般物体認識:
                局所特徴量→ベクトル量子化→ヒストグラム
                Caltech dataset 101カテゴリで80%以上の認識精度
・画像認識の新しい方向
        大量データによるNearest Neighborアプローチ
        多数クラス問題 1000クラスぐらい
        時空間特徴の特徴量化 bag-of-video-word
                動画の中で特定の動作をしている部分を切り出せる
・意味的映像検索
        TRECVIDの概要と結果について
        意味的検索の方法:高次概念抽出+結果の統合
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
typodupeerror

人生の大半の問題はスルー力で解決する -- スルー力研究専門家

読み込み中...