Googleの対抗馬登場

Googleの対抗馬登場 10

ストーリー by wakatono 2001年07月27日 13時27分
でもまたβテスト中部門より

yuki-kun 曰く，"Japan.internet.comの記事によると、Teoma SearchのBeta Testが始まっている。GoogleとTeomaの比較を抜粋すると、Google ではWEB全体のリンク構造を解析して全部にページランクをつける。その後ユーザーが検索をかけたときに、検索語に合致するサイト群を抽出、ページランク順に表示する、というアプローチをとっている。それに対し、TEOMA のアプローチは逆であり、TEOMAでは「まず検索語にマッチするサイト群を抽出」する。その後に Google と同じように「その検索語に合致したサイト群だけで」リンク構造を解析し、その中で表示順を決める。この方法だとより関連のあるページ群の中でのリンク構造を反映しているため、より検索精度が高くなる。という事らしい。検索結果の表示方法も秀逸、一度試してみて欲しい。なお、今のところ日本語を入力しても検索結果が出てこないようだ。"

今後が楽しみだ。早いうちに多言語対応もきっちりやってほしいな。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索10コメント Log In/Create an Account

Re:結果だけはほとんどGoogle (スコア:2, 参考になる)

by atmark (3747) on 2001年07月27日 14時09分 (#9847)

> NTT-Xもみならって欲しいね、こういうの:p
NTT未来ねっと研究所のODiNも一応Googleの真似をしたアルゴリズムを使っています。といってもこのプロジェクト自体はNTTが始めたものではありませんが。
私もいくつか試してみました (スコア:2, 興味深い)

by kamuy (1690) on 2001年07月27日 14時20分 (#9850) ホームページ日記

アルゴリズムは良いものである様には思いましたが、
実際の検索結果は、まだまだ大した物でもないですね。確かに。
多言語化が進んでいない(ひょっとして出来ない?)というのも大いに問題ありますが、
クロール要求を出す方法を見つけられなかったので、ここら辺もまだまだ「ベータテスト」ですね。

Googleの対抗としてはどうでしょう。
やはり既にプールしている膨大なデータという強力な資産がありますし、
あすこほどの技術集団であれば、同様の仕組みを作り込むのにも
対して時間はかからないような気がするので、程なくキャッチアップしてくるかも。

いずれにしても、本サービス開始が楽しみですね。

--
-+- 想像力を超え｢創造力｣をも凌駕する、それが『妄想力』!! -+-
Re:私もいくつか試してみました (スコア:2, 興味深い)

by G7 (3009) on 2001年07月27日 14時41分 (#9854)

>同様の仕組みを作り込むのにも

彼ら(どっちも)が特許とかで「アイデアという限られた資源」を
枯渇させたりしませんように…
ほんとにベターなアルゴリズムなの？ (スコア:2, すばらしい洞察)

by pirozeau (3321) on 2001年07月27日 15時20分 (#9863)

元記事じゃ「これだけで検索精度がぐっと高くなることは容易に想像がつくであろう」とか書いてるけど、ホントにそう？

特定の単語にマッチしたサイト群の中でのPageRankとゆーことは、「特定の単語」を含まないけど関連するサイト群との関係は無視することになるわけだから、一概に良いアルゴリズムだとは言えない気がするんだけど。

PageRankと全く同じ計算をやっているとも思えないので、なんか別の方法でハイパーリンク構造の分析をしてると思うんだけど、それが分からないとなんともなあ。

PageRankの場合は、「リンクの一つをランダムに選択しつつネットサーフィンするという仮想的なWebユーザーを考えた時に、あるページを閲覧するユーザーがどれだけいると予測されるか？」を求めているという、非常に真っ当な数字なんだけど、このTeomaはどうなんだろ？
結果だけはほとんどGoogle (スコア:1)

by bravo (1225) <bravoNO@SPAMresourcez.org> on 2001年07月27日 13時45分 (#9843) ホームページ日記

ヒット数の違いはあるけど、メジャーなサイト、人気のあるサイトはヒットしやすいのはGoogleとおんなじですね。
多言語対応してくれるといい感じでしょうね。長い目で見ないとこれについてはあんまり言うことって無いかも。期待の新星ってやつで。

NTT-Xもみならって欲しいね、こういうの:p
Re:私もいくつか試してみました (スコア:1)

by fukapon (4131) on 2001年07月27日 15時53分 (#9866)

確か、Googleもテスト期間があったと思うんですが、そのころはやっぱり、データベースが貧弱で満足な検索結果が出ないこともありました。試してみると、今のTEOMAもそんな感じですね。

まぁ、アルゴリズムはおもしろいと思うので、今後、運用していく中でデータベースが大きく、強力になっていくことを期待しています。
検索の精度は？ (スコア:1)

by hokrin (slashdot) (1312) on 2001年07月27日 16時44分 (#9878) 日記

＞今後が楽しみだ。早いうちに多言語対応もきっちりやってほしいな。

日本語対応する際、検索の精度って、採用するシソーラスに依存するのかな？新しい単語へはどうやって対応するのだろう？
Re:ほんとにベターなアルゴリズムなの？ (スコア:1)

by yamajun (2791) <yamajunNO@SPAMofug.net> on 2001年07月27日 17時45分 (#9899) ホームページ

特定の単語にマッチしたサイト群の中でのPageRankとゆーことは、「特定の単語」を
含まないけど関連するサイト群との関係は無視することになるわけだから、
一概に良いアルゴリズムだとは言えない気がするんだけど。

google使っててたまに検索に使った単語が見当たらないページを
拾っちゃうことがあったけど、そういうことだったのか。
Teomaのアルゴリズムが特定の単語を「含む」ことを前提とした
データベースの構築を行なうならばそういうこともなくなるかも...

# でも、エロサイトの単語羅列攻撃に弱くなってたりするかも :-P
teoma agent (スコア:1)

by tma20 (3064) on 2001年07月28日 0時02分 (#9939)

ってなんだ？
キャッシュがないから (スコア:0)

by Anonymous Coward on 2001年07月28日 10時34分 (#9990)

ポータルとしての利便性はアルゴリズムだろうけど、「まず Google で」の理由はキャッシュを見れることにある。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

Googleの対抗馬登場 10

Googleの対抗馬登場 More ログイン

Re:結果だけはほとんどGoogle (スコア:2, 参考になる)

私もいくつか試してみました (スコア:2, 興味深い)

Re:私もいくつか試してみました (スコア:2, 興味深い)

ほんとにベターなアルゴリズムなの？ (スコア:2, すばらしい洞察)

結果だけはほとんどGoogle (スコア:1)

Re:私もいくつか試してみました (スコア:1)

検索の精度は？ (スコア:1)

Re:ほんとにベターなアルゴリズムなの？ (スコア:1)

teoma agent (スコア:1)

キャッシュがないから (スコア:0)

スラド