don_z80曰く、"人民日報日文版によると、『これまで世界最大能力だった「グーグル」(Google)の1.7倍に相当』する能力の検索エンジン、Openfindが台湾で開発されたらしい。たった70台のサーバで35億ページもの内容を収集・検索しているのが売りということだが、実際の使い心地はいかに?"
調べてみました。 (スコア:2, 参考になる)
Openfind 92
Google 11,300,000
サーチ「台湾」
Openfind 5
Google 4,100,000
サーチ「POSIX」
Openfind 5,564
Google 1,520,000
さぁ?優秀なのかな。
.::.:... .::....: .::...:: .::.:.:: .::..:.: .:::..:.
I 1 2 B H4[keR. :-)
Re:調べてみました。 (スコア:2, 参考になる)
Openfind にはまだ多言語検索は酷のようなので…(数字の後はトップになったURL)
http://www.openfind.com/ [openfind.com] vs http://www.google.com/ [google.com] 共に全言語から検索
# UNIX のトップが両者 GNU て…(笑)
Re:調べてみました。パート2 (スコア:2, 参考になる)
www.openfind.com 565,745
www.openfind.com.tw 5564
なぜだ。同じDBを検索しているのではないのか。
.::.:... .::....: .::...:: .::.:.:: .::..:.: .:::..:.
I 1 2 B H4[keR. :-)
Re:調べてみました。 (スコア:2, 参考になる)
google.com 9,070,000件 (検索時間 英語版:0.18秒 日本語版0.05秒)
openfine.com 12,501,505件 (検索時間 0.035秒)
openfind.com.tw 962,220件
キーワード「Windows」
google.com 50,500,000件 (検索時間 0.06秒)
openfine.com 79,472,219件 (検索時間 0.393秒)
openfind.com.tw 425,796件
openfind.comのほうは最新β版でopenfind.com.twのほうが正式版?
Re:調べてみました。 (スコア:1)
どうやらそのようです。 [openfind.com]
#でも正式版と同じ35億ページをインデックスしていると
#書いてますけどね…?
Re:調べてみました。 (スコア:1, 参考になる)
>Openfind 5
>Google 4,100,000
旧字体の、
「臺灣」または「台灣」
で検索すると、たくさん引っかかります
Re:調べてみました。 (スコア:0)
http://www.openfind.com/cgi-bin/gaisweb.cgi?q=%82%A4%82%F1%82%B1&p=1&l=3&m=100&g=1&u=en
トップは…
「きょうのわんこ」
検索スピード (スコア:2, すばらしい洞察)
Google ならほとんどを 0.1 秒前後で検索しますが…
何が高性能かというと (スコア:2, すばらしい洞察)
元ネタでは、
>この検索エンジンは、70台のサーバーを使い、35億ページの検索が可能
一方、
>サーバー1万台以上を使って20億7千万ページの検索にサーバー1万台以上が必要なグーグル
と言っているので、googleよりはるかに少ない台数のサーバで
より沢山のサイトの検索が出来る、よって高性能である、と
言いたいのでしょう。
けど (スコア:1)
解析能力は
検索能力に比例しないと言ってみるテスト
GOOGLEの方が優秀なような気が。使ってみたところ・・。
Re:けど (スコア:4, 参考になる)
保持ページ数がGoogleの1.7倍なだけで、能力がとは言えないと思います。
これ [zdnet.co.jp]を読む限り、能力的に1.7倍とは言えないでしょう。
Re:けど (スコア:3, 興味深い)
ある意味優秀。
ちなみにGoogle [google.co.jp]は検索エンジンやhoge日本語版などが上の方に出てきますね。
脳味噌腐乱中…
Re:けど (スコア:2, 参考になる)
結局インデックスされているページ数の大小ではなく、“どう表示順位をつけるか”の部分で優秀さは決まりますよね。Googleの方が圧倒的に「求めている情報に早くたどりつける」と感じます。
使用言語に依存しない、という意味でGoogleの「ページランク」は偉大な発見だったんだなぁ、とあらためて感心しました。
#Openfindも「Score」というランク付けをしているようですが
#どういう内容なのかは不明
Re:けど (スコア:1, 参考になる)
フジテレビを検索しても飯島直子のサイトがヒットするし、使えない。
Re:けど (スコア:1)
個人的にはこの検索エンジンプロジェクトが気になるなあ。
Re:けど (スコア:1)
Re:けど (スコア:0)
Googleの良さは余計なものが付いていないところにもある。
日本語でマイナーなヲタネタを検索しても、何も出てこなかった。
こちらはすっきりしてますね (スコア:1, 参考になる)
英語版にもなっていますし。
http://www.openfind.com/ [openfind.com]各国版 (スコア:2, 参考になる)
http://www.cybersolutions.co.jp/product/of/ [cybersolutions.co.jp]
また、openfind.jpというドメインもここの会社が取得しているようです。
いまはアクセス制限がかかっているようですが。
Re:けど (スコア:1)
Re:けど (スコア:1, 興味深い)
トップページのソースをに、余計な改行コードさえもないのを見たとき。
そこまでこだわってトップページを軽くしてるのにはビックリした。
Re:けど (スコア:0)
モーニング娘 -> 検索できず
松浦亜弥 -> 検索できず
スラッシュドット -> まともなのがひっかからず
2ちゃんねる -> まともなのがひっかからず
小泉純一郎 -> 中国語の新聞が2つひっかかる
ぜんぜん駄目だね
台湾で自称Googleを上回る検索エンジン誕生 (スコア:1, すばらしい洞察)
と一瞬思った。
日本語の修飾関係って難しいね。
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:2, 参考になる)
台湾で「自称Google」を上回る検索エンジン誕生
と読んでしまいました。
台湾で自称「Googleを上回る検索エンジン」誕生
ですね。
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:0)
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:1)
私がタレコんだときは「台湾でgoogleを上回る検索エンジン誕生」と書いたはずなんですが、Oliverが"自称"を付け加えてくれたみたいですね。
まあ、ちょっとわかりにくい位置に付け加えちゃったみたいですが……
#と、責任回避してみるテスト
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:1)
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:1)
Oliverに感謝
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:1)
ただ、他の人が指摘しているように、
1:「自称」をどこにつけるのが日本語として最も適切かを考慮する
2:括弧で括って単語の結合優先順位(ぉ)を適切に変更する
の、どちらかを行うべきではありましたね。
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:1)
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:0)
(1)実体はどうあれ、自らこうだと称すこと。「―音楽家」
(2)代名詞のうち、話し手が自らをさしていう語。一人称。
(3)自慢すること。「我より外に心も剛に案も深き者あらじ、と―して/義経記 5」
この場合(3)で使い方的には謝ってないかも。
Re:台湾で自称Googleを上回る検索エンジン誕生 (スコア:0)
訂正 この場合(3)で使い方的には誤ってないかも。
人民日報 (スコア:1, すばらしい洞察)
自国の政策の成果とは何も関係の無い台湾の技術的な成果までプロパガンダに使ってしまう大陸のやりかたもどうかという気が…
Re:人民日報 (スコア:1)
-- for whom are you alive?
Re:人民日報 (スコア:1)
/* Kachou Utumi
I'm Not Rich... */
Re:人民日報 (スコア:0)
両岸問題(と台湾では書いてあった)なんてひょっとしたら知らないのかも知れませんね。
Re:人民日報 (スコア:1)
当該の位置に「台湾省」と書かれていました。
Re:人民日報 (スコア:1)
国民党政権時代の話なので今は違うかもしれませんが。
うじゃうじゃ
Re:人民日報 (スコア:0)
検索を試そうとしたら (スコア:1)
# ふ~ん。Apacheの1.3.26を使っているのかぁと、いらぬ知識をつけてしまった。
あ、今見たら
って文字列が出てきた…。
関係ない話ですが (スコア:1)
たんなる偶然なのか、それとも台湾ができるだけまんなかにある映像を探した結果がこれなのか...
地球の画像でよくあるのは、例えばここで使われている [nasa.gov]、アフリカが写っているものが多いように思いますが。(たぶん、自由に使っていい画像のなかでは比較的見栄えがするのが理由だと思います)
そういうのも確かにあるけど、 (スコア:1)
土産店などで販売もされていますが、
実際に使われているのは北が上の地図ですよ。
どちらかというとリンク禁止問題だけれども、検索サイ (スコア:1)
デンマークでリンク禁止の仮命令。
いやな流れですな。
腐ったロボット (スコア:0)
Re:腐ったロボット (スコア:3, 参考になる)
同じく私も deny リストに入れています。 ロボットとしては出来が悪過ぎ。
"Openfind data gatherer, Openbot/3.0+(robot-response@openfind.com.tw;+http://www.openfind.com.tw/robot.html)" を名乗っていて、手元で確認できる限りでは 66.237.60.{5,42,43,44,46} からアクセスに来ています。
robots.txt に
で拒否できるらしいですが、 分散アクセスしてると言いながら、 数秒を置かずにアクセスしに来てたので 信用してません。
Re:腐ったロボット (スコア:1)
リクエストの間隔が短すぎです。
私はアクセスもとをホスト名で見ていたのですが、openfind.com.twなドメインだけでなく、*****.edu.twなドメインからも同じロボットがまわって来たりして今ひとつよくわかりません。
アクセス制限を回避するためにedu.twなドメインを使っているのか、などと勘繰ってもいるのですが。(さすがにそれはないか...)
Re:腐ったロボット (スコア:1, おもしろおかしい)
Re:腐ったロボット (スコア:1)
先行者クンは中華人民共和国(CN)のほうなので、中華民国・台湾 (TW) ではございません、と突っ込んでみる。
Re:腐ったロボット (スコア:1)
先月の中旬ごろに Openfind のロボットが私の家の Web Server にも多量のアクセスをしていました。 ハイパー日記システム使っているのですが。「なんじゃこれ」というぐらいに index.cgi に引数指定して実行しまくっていましたね。 私の日記根こそぎ検索対象になっていると思うと... はずかしぃ。
Re:腐ったロボット (スコア:1)
めんどくさいので robot.txt は置いてないけど.