ブラックボックス部門より。
あるAnonymous Coward 曰く、
「甲子園」というキーワードでGoogle検索を行うと、ページ中には「甲子園」という単語が含まれていないNHKのサイトがトップに表示されるそうです(現在では阪神甲子園球場がトップ、続いてNHKのサイト)。
いっぽう、Yahoo! JapanではNHKのサイトはトップ10には含まれず、阪神甲子園球場がトップでした。また、LiveSearchではトップに「甲子園のニュース検索結果」が表示され、続いて「阪神甲子園球場」、NHKのサイトが表示されます。また、「koushien」で検索するとGoogleとYahoo! JapanはNHKのサイトがトップ、Live Searchでは「www.koushien.jp」がトップでした。
自分の推測としては、純粋にアルゴリズムの結果だとするなら、URLから内容の理解をしようとしている事、ローマ字・日本語変換を行っている事、元からNHKのランクが高い事、2006年辺りは甲子園という文字が存在した等が複合的に作用した事がNHKのセンバツページが高くなった理由だと思います。
ただし、「kousien」で検索した場合は検索結果が大きく異なる点から、NHKのサイトはURLの「koushien」というキーワードが大きく影響している可能性が高いと思われる。ともあれ、検索結果の表示順序の不思議さが感じられる例と言えるだろう。
リンクのラベル (スコア:4, 参考になる)
このページへのリンクにだけ含まれているキーワード: 甲子園 [72.14.235.132] ってことじゃないの?
コメントを書く
最近のGoogle先生は (スコア:2)
ユーザーの検索履歴からの反映に重きを置いている気もします
あとGoogleアカウントを持っている人の場合,その検索履歴から最もらしいサイトをランク付けしてるとか
特に集合知を重視してるGoogle先生のことだから,こういう風になるのもある種自然かも
#あれっ?もしかしてそういう話じゃない!?
コメントを書く
マイクソロフト (スコア:2)
前例 [google.co.jp]もありましたしね。もっとも最近はトップではないようだけど。
コメントを書く
metaに含まれているような (スコア:2, すばらしい洞察)
に含まれているので
> ページ中には「甲子園」という単語が含まれていない
が間違い、というだけじゃないの?
コメントを書く
Googleの検索については他のコメントで解説されてるので割愛 (スコア:2, 興味深い)
以前スラドにもコメントした内容ですが、
ローマ字略語で画像検索結果の比較実験を行ったとき、
LiveサーチやYahoo!検索は、貼られたリンクやページ内容よりも、画像ファイル名自体を優先していましたね。
そして、Liveサーチは日本語で検索しても海外サイトのほうを優先する傾向にありました。
Yahoo!では、日本のサイトのほうが優先される傾向にありました。
その三つの中では結局、Googleがいちばんクセが無く使いやすいアルゴリズムだとおもいましたね。
ψアレゲな事を真面目にやることこそアレゲだと思う。
コメントを書く
単純なキーワード照合だけやってるわけじゃないでしょ (スコア:1, 興味深い)
リンク単位でメタデータ持たせてるんじゃないの。
少なくともマルチメディア検索では必須だし。
コメントを書く
以前読んだドキュメントでは (スコア:1, すばらしい洞察)
相互リンクを主成分解析してモード順に並べた、っていうのを見た記憶がありますが。
それだと、リンク先に検索ワードがある・ないに関わらず上位モードに出たら検索上位に出るはずです。
#酔ってて上手く説明できなくてごめんなさい。
#「スラッシュならここ!」みたいなリンクの張り方されてて
#リンク先に「スラッシュ」についての言及が特にされてなくても
#そういうリンクが大量にあれば「スラッシュ」でぐぐると上位にでるようなシステムです
検索上位と検索ワードとの乖離って別に今に始まったことではないのでは?
#酔ってて別の問題と勘違いしてる??
コメントを書く
Re:以前読んだドキュメントでは (スコア:2, おもしろおかしい)
> 関連付けられていることが条件です。これはサイト解説者の責任ではありません。
これはあれですか、悪用すると 「悲惨な失敗」とあのヒトを結び付けることができちゃったりする例のアレ [bbc.co.uk]ですか。
閾値は 0 で
コメントを書く
親コメント
昔は… (スコア:1)
「著作権ゴロ」JASRACがトップに来てたりしたのに。
今のGoogleさんは来ないんだね。
------------ ながぬこ
コメントを書く
Re:昔は… (スコア:5, おもしろおかしい)
コメントを書く
親コメント
Re:昔は… (スコア:4, おもしろおかしい)
エロデータ、でアイ・オー・データ機器(IODATA) がトップになるのはGoogle先生だけ!!
コメントを書く
親コメント
リンクによるものだと思いますが (スコア:1)
元記事中では
「アンカーテキスト”甲子園”でリンクを受けているようですが、ページランクが4なのでそれほど被リンクが強いという訳ではありません」
と言及していますが、この推測が不正確なのではないでしょうか。
つまり、被リンク数自体が特段多いわけではないからページランクは4けど、「甲子園」というワードでリンクされている数が圧倒的に多いとか、そういう理屈なのかなと。
コメントを書く
sぁshどt (スコア:1, 参考になる)
「すらど」でも「surado」でも「sぁshどt」でもOKなグーグルさんですから。
コメントを書く
そんな事なら (スコア:1)
コメントを書く
Re:Googleはそんなに賢いのかなぁ (スコア:3, 興味深い)
>公式ページでない、更新ができない、
>ほとんど何も書かれていない
あなたのサイトの問題は、そのような点にはありません。
リンクを踏んだら、閲覧者が予想していない広告を表示する
という点こそが、問題なのだと主張します。
// いきなり、こんなページ [itrack.it]を見せ付けられた、
// 私の身にもなってください。(無害だが一応閲覧注意
// 端末にお茶吹いたじゃないですか。
コメントを書く
親コメント
Re:日本語版Googleは使い物にならない状態 (スコア:1, 参考になる)
コメントを書く
親コメント
Re:うざい歌丸 (スコア:1)
まぁ、一番有名なのは「いいえ [google.co.jp]」ですよね。
未だに鉄板
コメントを書く
親コメント
Re:うざい歌丸 (スコア:4, おもしろおかしい)
コメントを書く
親コメント
Re:うざい歌丸 (スコア:2)
もしや [google.co.jp]とおもったら、なるほど!
コメントを書く
親コメント
Re:日本語版Googleは使い物にならない状態 (スコア:2, すばらしい洞察)
検索サイトもどきの検索結果がぞろぞろ出まくるのが激しく鬱陶しい。
検索結果を見るだけで同じ本文内容がぞろぞろと
コメントを書く
親コメント
Re:Googleはそんなに賢いのかなぁ (スコア:2, おもしろおかしい)
「OS/2 masakun [google.co.jp]」で検索すると、凄まじい電波を発した自己紹介 [72.14.235.132]がトップに来るので、Googleって大変優秀なのだなあと思いますー。
コメントを書く
親コメント
Re:Googleはそんなに賢いのかなぁ (スコア:1, 興味深い)
ここ1、2年、Googleは何かの公式サイトを探す検索エンジンではなくなっている気がする。
特に海外物は日本語ページを除外しようが英語モードに切り替えようが、なかなか出てこなくてどこかの孫引きでないと全然近づかないことが…
コメントを書く
親コメント