独創的検索サイトKensaku.jpが復活へ 39
ストーリー by yourCat
正式運用が待ち遠しい 部門より
正式運用が待ち遠しい 部門より
okkakii曰く、 "INTERNET Watchの記事によると、AAA!CAFEを運営する有限会社トリプルエーコミュニケーションズがkensaku.jpの検索技術を継承し、サービスを開始したとのこと。
kensaku.jpは昨年12月末でサービスが停止しており、日本人による日本語サーチエンジンは少なくなっていた。これによって日本の検索サービスは変化すると思われる。
私も一回検索してみたが、kensaku.jpそのものといった感じでほとんど復活ではないかと思う。"
恥ずかしながらkensaku.jpを知らなかったが、N-gram方式は日本語検索の盲点をついた面白いエンジンだ。現在AAA!CAFE上でベータ・テストを行っている。(プレス・リリース)
Search Engine Optimization (スコア:2, 参考になる)
検索漏れがなくても精度がこれじゃね・・・
そういえばそのGoogleも精度を上げるためOpen Directory Project [dmoz.org]の参加者を募っているみたいですな。
やっぱり、人の手ですかな。
それに関連して、職場でSEOの話になり、それまでSEOという言葉を知らなかったが(その手法自体はよくやってたんだけど)いろいろ探してみるとSEO関連のコンサルタント会社が
http://www.seojapan.com/ [seojapan.com]とか
http://www.auncon.co.jp/ [auncon.co.jp]とか
http://www.seoglobal.com/ [seoglobal.com]など、でてくるでてくる。
で、やっぱりこれでご飯は食べていけるのでしょうか?
国産の検索サービス (スコア:2, おもしろおかしい)
くりそつ (スコア:1)
Re:くりそつ (スコア:1)
ロゴがボケボケなのは、なんとかならないの?
使ってみて気づいた点
Re:くりそつ (スコア:1)
いちおう Google との違いとして打ち出せるかも?
Re:くりそつ (スコア:1)
どんな検索エンジンを持っているにしても、結局はデータベースの規模が大きい方がより優位に立てる訳ですが、そのデータベースの構築には相応の時間が掛かりますので、どうしても先行者有利が効いてきますからね。
逆に、この「N-gram方式」のような、ある意味で「言語依存」な検索手法を開発・実装できるのはGoogle(英語圏)以外の立場に立つ者故、みたいなところがあるかと。
なかなか無理な相談かも知れませんが、うまいこと手を組んでくれませんかねぇ…
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:くりそつ (スコア:1)
ところで、検索を試してみましたが、N-gramらしくrecallは高いみたい
ですが、precisionを上げる方法を別途考えないといけないでしょうね。
Re:くりそつ (スコア:1)
「分かち書きをしない」「表記が揺れまくり」
という日本語特有の単語を抽出し辛い状況がN-gram等の技術を求めていたという感じで。
で、それはGoogleエンジニアの大半を占めていそうな
「分かち書きをする」「表記が揺れようがない」
言語圏の人たちからはあまり要求されなさそうな技術であり、当然Googleでも重要視されていないのではないか、と。
だからこそ日本語環境で実用化が為されたのではないか、つまりは必要性という面で言語依存していたのではないか、ということを言いたかった訳です。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:くりそつ (スコア:1)
Re:くりそつ (スコア:1)
うお? そうなんですか… 知りませんでした…
でも、具体的にどんな感じになるのかが考えつかないので、出来れば代表的な例とかを挙げて頂きたく。
(誤記とか用語の違いとかではないんですよね…)
んでは、ココでの揺れってのは長音の有無とかその辺の話ってコトでお願いします。
-+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
Re:くりそつ (スコア:0)
color/colour;とか、スペルミスの処理とかも全文検索のときは非常に重要ですよね。複数形、単数形だって「ゆれ」ちゃー「ゆれ」だし。問題はそれを機械的に処理しやすいかしにくいか?
日本語だって、「データ」か「データー」かなんて話は、文字種で分離し、sort/uniqすればコスト安く処理できます。
Re:くりそつ (スコア:0)
Re:くりそつ (スコア:0)
Re:くりそつ (スコア:0)
Re:くりそつ (スコア:1)
スケールする事を示しただけでも論文にはなりますから。
(発表では「それだけ?」ってつっこまれるだろうけど)
kensakuが一番手だったのかどうかは知りませんが…
information retrievalという分野自体が知名度低いのは
やっぱり宣伝不足かなぁ。検索エンジン以外にキラーアプリ
がないってのもあるけど。
Re:くりそつ (スコア:0)
欧米の言語が、日本語にくらべ「表現のゆれがすくない」というのは思いこみかと。
Re:くりそつ (スコア:0)
Re:くりそつ (スコア:0)
有名ですとも、 (スコア:0, オフトピック)
#あなたは何人のテロリストを、そう、面接したことがある?(だったっけ?)
Re:くりそつ (スコア:1, 参考になる)
Google知る前からkensaku.jp(昔は.orgだった)使ってたけどね。
Re:くりそつ (スコア:0)
もとい最近のgoogleの増長ブリをみ
Re:くりそつ (スコア:2, 参考になる)
一時期は検索.jp、そのまえはRingringと名乗ってました。
(っつーか、InternetWatchの記事にちゃんと書いてありますよ)
早稲田の学生さんがやってた検索エンジンで、卒業後も商用化の道を探してたらしいのですがしばらくして結局閉じてしまいました。
こういった形で復活するのは嬉しい限りです。
へりくつ (スコア:1)
検索した後 (スコア:1)
なんだこれ? (スコア:1)
(2002/06/18 19:50現在)
このサイトは、こういう動作で正しいの?
Re:なんだこれ? (スコア:0)
このネタで思いだしたら (スコア:1)
http://www.teoma.com
こういう新しいところにも頑張って欲しいですね。
千里眼 (スコア:0)
Re:千里眼 (スコア:1)
それも1999年の3月31日に終了しました。
ODINは今でも残っているのかなぁ。
Re:千里眼 (スコア:1)
ODINも休止しました (スコア:1)
時々使っていたのですが... これで昔(1995年ぐらいか?)からの
サーチエンジンはほとんどなくなってしまいました。
Re:千里眼 (スコア:0)
この会社 (スコア:0)
サイト全体がかなり怪しげですよね。
Namazuはどうなった (スコア:0)
Namazu [namazu.org]から乗換えたのでしょうかね。
なぜAAAなのかと言うと (スコア:0)
Re:なぜAAAなのかと言うと (スコア:1)
-- 雪のない富士山もきれいだな
多ページ検索できるようになった (スコア:0)
これでちょっとは見やすく&検索しやすくなるなあ
Re:文体がアレだなぁ・・・(T/O) (スコア:1)
多分、文を書いてるうちにカット&ペースト、修飾語が付け加えられて、ああなってるんだろうね。
最後に読み返してないのか?>担当者