2010年7月22日(木)SP&SLP研究会まとめ　特別企画 | aitoの日記

aitoの日記： 2010年7月22日(木)SP&SLP研究会まとめ　特別企画 0

日記 by aito 2010年07月22日 20時16分

内容を要約できなかったのでキーワードの羅列．

○音楽情報の検索
KDDI帆足さん．音楽検索全体の紹介．
・厳密検索（音楽認識，ハミング検索) vs. 曖昧検索(音楽推薦的)
・厳密検索はおよそ実用レベル．曖昧検索に注目
・曖昧検索：タグ付与(ジャンル分類とか)vs. 類似楽曲検索
・初期：音楽の信号を対象とした検索　MFCCなどを利用，音楽理論は無視
・音楽ならではの特徴の利用：テンポ，ビート，クロマ
・各種の特徴解析ツールについて
・自動音楽分類の意義と手法
・にたうた検索について．http://nitauta2.kddilabs.jp/
・Webマイニングを活用した検索
Last.fm 音楽のソーシャルタグ共有
LSAによってソーシャルタグのノイズを抑制
オートタギング(cold-start問題への対応)→
協調フィルタリングやレーティングのほうが音響的特徴量より高精度
・Webマイニングの問題点：音楽の地域性，ユーザによる差異
・音楽の可視化：音響的特徴，Web情報の利用
・今後の展開
音楽検索の実現例が少ない
ユーザ志向の検索：ユーザ別の手法
携帯端末向け検索：音楽クラウドへの入り口
再生状況に応じた検索
帆足さんの歌声が聞けたのが最大の収穫か．

○画像・映像の認識と意味的検索
電通大の柳井先生．
・画像の認識と検索
実用レベルは「キーワード検索｣「位置検索」
研究レベル：コンテンツベース画像・映像検索
なぜ内容検索は普及しないか？
意味が考慮できない，すでに十分なタグつき画像がある
例外：ヤフオクの類似画像検索　ジャンルを絞れば有効
内容検索が必要な場面
自分で撮った写真，映像の場面検索など
2種類の内容検索：見た目の類似性 vs. 意味的な類似性
意味の認識：一般物体認識　物体のカテゴリー名を認識する
・物体認識
bag-of-featuresの登場(2004)，機械学習手法の発展，学習データの入手容易化
「カテゴリの認識」(一般物体認識)と「同一物体の認識｣(特定物体認識)
特定物体認識：変形がなければ90%程度認識可能　ランドマーク画像検索に応用
局所不変特徴量の利用
特徴点に基づく対応の検索
一般物体認識：
局所特徴量→ベクトル量子化→ヒストグラム
Caltech dataset 101カテゴリで80%以上の認識精度
・画像認識の新しい方向
大量データによるNearest Neighborアプローチ
多数クラス問題 1000クラスぐらい
時空間特徴の特徴量化 bag-of-video-word
動画の中で特定の動作をしている部分を切り出せる
・意味的映像検索
TRECVIDの概要と結果について
意味的検索の方法：高次概念抽出＋結果の統合

aitoの日記： 2010年7月22日(木)SP&SLP研究会まとめ　特別企画 0

2010年7月22日(木)SP&SLP研究会まとめ　特別企画 More ログイン

スラド

2010年7月22日(木)SP&SLP研究会まとめ 特別企画 More ログイン

2010年7月22日(木)SP&SLP研究会まとめ　特別企画 More ログイン