aitoの日記: 2010年7月22日(木)SP&SLP研究会まとめ 特別企画
日記 by
aito
内容を要約できなかったのでキーワードの羅列.
○音楽情報の検索
KDDI帆足さん.音楽検索全体の紹介.
・厳密検索(音楽認識,ハミング検索) vs. 曖昧検索(音楽推薦的)
・厳密検索はおよそ実用レベル.曖昧検索に注目
・曖昧検索:タグ付与(ジャンル分類とか)vs. 類似楽曲検索
・初期:音楽の信号を対象とした検索 MFCCなどを利用,音楽理論は無視
・音楽ならではの特徴の利用:テンポ,ビート,クロマ
・各種の特徴解析ツールについて
・自動音楽分類の意義と手法
・にたうた検索について.http://nitauta2.kddilabs.jp/
・Webマイニングを活用した検索
Last.fm 音楽のソーシャルタグ共有
LSAによってソーシャルタグのノイズを抑制
オートタギング(cold-start問題への対応)→
協調フィルタリングやレーティングのほうが音響的特徴量より高精度
・Webマイニングの問題点:音楽の地域性,ユーザによる差異
・音楽の可視化:音響的特徴,Web情報の利用
・今後の展開
音楽検索の実現例が少ない
ユーザ志向の検索:ユーザ別の手法
携帯端末向け検索:音楽クラウドへの入り口
再生状況に応じた検索
帆足さんの歌声が聞けたのが最大の収穫か.
○画像・映像の認識と意味的検索
電通大の柳井先生.
・画像の認識と検索
実用レベルは「キーワード検索」「位置検索」
研究レベル:コンテンツベース画像・映像検索
なぜ内容検索は普及しないか?
意味が考慮できない,すでに十分なタグつき画像がある
例外:ヤフオクの類似画像検索 ジャンルを絞れば有効
内容検索が必要な場面
自分で撮った写真,映像の場面検索など
2種類の内容検索:見た目の類似性 vs. 意味的な類似性
意味の認識:一般物体認識 物体のカテゴリー名を認識する
・物体認識
bag-of-featuresの登場(2004),機械学習手法の発展,学習データの入手容易化
「カテゴリの認識」(一般物体認識)と「同一物体の認識」(特定物体認識)
特定物体認識:変形がなければ90%程度認識可能 ランドマーク画像検索に応用
局所不変特徴量の利用
特徴点に基づく対応の検索
一般物体認識:
局所特徴量→ベクトル量子化→ヒストグラム
Caltech dataset 101カテゴリで80%以上の認識精度
・画像認識の新しい方向
大量データによるNearest Neighborアプローチ
多数クラス問題 1000クラスぐらい
時空間特徴の特徴量化 bag-of-video-word
動画の中で特定の動作をしている部分を切り出せる
・意味的映像検索
TRECVIDの概要と結果について
意味的検索の方法:高次概念抽出+結果の統合
○音楽情報の検索
KDDI帆足さん.音楽検索全体の紹介.
・厳密検索(音楽認識,ハミング検索) vs. 曖昧検索(音楽推薦的)
・厳密検索はおよそ実用レベル.曖昧検索に注目
・曖昧検索:タグ付与(ジャンル分類とか)vs. 類似楽曲検索
・初期:音楽の信号を対象とした検索 MFCCなどを利用,音楽理論は無視
・音楽ならではの特徴の利用:テンポ,ビート,クロマ
・各種の特徴解析ツールについて
・自動音楽分類の意義と手法
・にたうた検索について.http://nitauta2.kddilabs.jp/
・Webマイニングを活用した検索
Last.fm 音楽のソーシャルタグ共有
LSAによってソーシャルタグのノイズを抑制
オートタギング(cold-start問題への対応)→
協調フィルタリングやレーティングのほうが音響的特徴量より高精度
・Webマイニングの問題点:音楽の地域性,ユーザによる差異
・音楽の可視化:音響的特徴,Web情報の利用
・今後の展開
音楽検索の実現例が少ない
ユーザ志向の検索:ユーザ別の手法
携帯端末向け検索:音楽クラウドへの入り口
再生状況に応じた検索
帆足さんの歌声が聞けたのが最大の収穫か.
○画像・映像の認識と意味的検索
電通大の柳井先生.
・画像の認識と検索
実用レベルは「キーワード検索」「位置検索」
研究レベル:コンテンツベース画像・映像検索
なぜ内容検索は普及しないか?
意味が考慮できない,すでに十分なタグつき画像がある
例外:ヤフオクの類似画像検索 ジャンルを絞れば有効
内容検索が必要な場面
自分で撮った写真,映像の場面検索など
2種類の内容検索:見た目の類似性 vs. 意味的な類似性
意味の認識:一般物体認識 物体のカテゴリー名を認識する
・物体認識
bag-of-featuresの登場(2004),機械学習手法の発展,学習データの入手容易化
「カテゴリの認識」(一般物体認識)と「同一物体の認識」(特定物体認識)
特定物体認識:変形がなければ90%程度認識可能 ランドマーク画像検索に応用
局所不変特徴量の利用
特徴点に基づく対応の検索
一般物体認識:
局所特徴量→ベクトル量子化→ヒストグラム
Caltech dataset 101カテゴリで80%以上の認識精度
・画像認識の新しい方向
大量データによるNearest Neighborアプローチ
多数クラス問題 1000クラスぐらい
時空間特徴の特徴量化 bag-of-video-word
動画の中で特定の動作をしている部分を切り出せる
・意味的映像検索
TRECVIDの概要と結果について
意味的検索の方法:高次概念抽出+結果の統合
2010年7月22日(木)SP&SLP研究会まとめ 特別企画 More ログイン