ページ内ジャンプ:

アレゲなニュースと雑談サイト

mhattaによる 2008年04月30日 8時00分の掲載
応用自在部門より

oddmake 曰く

TechCrunchの記事より。北京で開かれていたWWW2008の席上、Googleの研究者らがなかなか興味深い画像検索アルゴリズムの研究成果を披露したようだ(論文PDF)。 ユーザは画像を探す時、似たような画像を探していくものだという仮定を行い、確率的なvisual-hyperlinkというリンクが様々な画像の間にあると想定する。似通った画像間にはより訪問者が多いと想定され、より大きな重み付けがなされる。これに対してPageRankアルゴリズムを適用することにより、画像のRankを計算するのだという。現在のアルゴリズムでは、単語に対して妙な画像がひっかかってしまう場合が時々あるのだが、このアルゴリズムを利用することでユーザの満足度を向上できる結果が得られたとしている。これが実際にGoogleに採用されるか、採用されるにしてもにしてもそれが何時かはまだわからないが、実にアレゲでなかなか感心させられてしまう。

この議論は賞味期限が過ぎたので、保存されている。 新たにコメントを書くことはできない。
表示オプション しきい値:
  • 自分がもっている出所不明な画像ファイルのダウンロード元を調べる機能がほしい。
    同じような画像(イラストなら同じ作者のイラスト)が見つかる可能性が高い(というか、その作者のサイトが見つかる)。

    画像ファイルのMD5で検索したら、同じMD5をもつ画像が見つかると便利なんだけど。
  • イノベーションキッチン [deqwas.com]
    中の人に聞いたことあるのですが、ユーザが踏んだURLを元にユーザをグルーピングし、似たような嗜好を持つユーザ同士でのレコメンドを行うとか。
    音楽等データにしにくいサイトで、似たような楽曲を提案することもできるシステムとのこと。
    こちらは画像や音楽に特化してるわけではないらしいですけど、特許出願中らしいので日本でGoogleがリリースしても大丈夫でしょうか。
    Googleの規模でやってPageRankのアルゴリズムと組み合わせたら事情が違うかもしれませんけど。
    • タレコミの論文を少し読みましたが、
      ユーザーの行動を基準にして、ランキングするという話ではありません。

      現状での Google Image Search を使った検索で出力された
      Top-N の結果に関してだけ、画像の類似度に相当する重みを持った
      リンクを張り、そのネットワークを使って PageRank のような量を
      計算するという話です。

      タレコミ文が「ユーザの行動を基準として、画像をランキングする」と
      読めなくもないので(よく読むと違うのですが)誤解の元かもしれません。

      画像の類似度を使うだけではなく、
      同じクエリで検索される仲間同士を結合することで、
      画像が潜在的に持つ意味的なものもカバーできるという点が、
      シンプルで新しい点なのだと思います。

      ていうか、えー、そんなシンプルな考え方で
      ほんとに大丈夫かなー、という気も。
      • 論文ナナメに読んでみましたが、

        あるユーザーが検索結果中の画像u を見た次に画像v を見たらそれは画像が類似してるからだと見なして

        >画像の類似度に相当する重みを持ったリンクを張り、

        ってことかと思いました。

        >画像の類似度を使うだけではなく、
        >同じクエリで検索される仲間同士を結合することで、
        >画像が潜在的に持つ意味的なものもカバーできるという点が、

        ではなく、

        同じクエリで検索された中でユーザーがクリックしたもの同士を仲間として仮想的な hyperlink で結合して
        Page Rank を計算することで、画像が潜在的に持つ意味的な類似度や重要度をカバーしたランキングを行う

        つまりユーザーの行動を利用して画像をランキングしてるように思います。
    • 2個のコメント が現在のしきい値以下です。
  • 関連検索 (スコア:1, おもしろおかしい)

    Anonymous Coward : 2008年04月30日 0時42分 (#1337526)
    肌色に特化した画像検索とかできるんでしょうか。

    # この画像を検索した人はこんな画像も検索しています。
  • そういや中学生くらいのころRPGやってて
    「フレッシュ」ゴーレムを,新しいゴーレムなんだ,
    と勘違いしていた俺.

    #肉は flesh
    --
    屍体メモ [windy.cx]
    • Re:フレッシュ (スコア:1, おもしろおかしい)

      Anonymous Coward : 2008年04月30日 12時13分 (#1337766)
      まだ駆け出しの頃、ファイルの内容をディスクに書き出すために、

      flush(fp);

      とするところを、

      flash(fp);

      と書いてしまい、
      実行時にはファイルが凄まじい勢いで輝いてしまった。
    • 1個のコメント が現在のしきい値以下です。
  • ホントは画像そのもののメタデータ記述領域に
    正しいメタデータが書いてあればいいんですけどねぇ.

    Office 系文書のプロパティにでたらめな情報が書いてある
    ことが多いように,直接&頻繁に目に触れるデータじゃないと
    まともな情報は記述されないんだろうなぁ.

    #日付くらいならデジカメが自動で埋め込むかな
    --
    屍体メモ [windy.cx]
  • adeu (2937) : 2008年04月30日 10時25分 (#1337665)
    狙って書いているんでしょうけど、いちおう、肌色系はfleshね。
  • 5個のコメント が現在のしきい値以下です。