パスワードを忘れた? アカウント作成
3220 story

独創的検索サイトKensaku.jpが復活へ 39

ストーリー by yourCat
正式運用が待ち遠しい 部門より

okkakii曰く、 "INTERNET Watchの記事によると、AAA!CAFEを運営する有限会社トリプルエーコミュニケーションズがkensaku.jpの検索技術を継承し、サービスを開始したとのこと。
kensaku.jpは昨年12月末でサービスが停止しており、日本人による日本語サーチエンジンは少なくなっていた。これによって日本の検索サービスは変化すると思われる。
私も一回検索してみたが、kensaku.jpそのものといった感じでほとんど復活ではないかと思う。"

恥ずかしながらkensaku.jpを知らなかったが、N-gram方式は日本語検索の盲点をついた面白いエンジンだ。現在AAA!CAFE上でベータ・テストを行っている。(プレス・リリース)

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Transponder (6045) on 2002年06月18日 9時10分 (#109152) ホームページ 日記
    ベータ版を試しましたがGoogleより精度が・・・
    検索漏れがなくても精度がこれじゃね・・・

    そういえばそのGoogleも精度を上げるためOpen Directory Project [dmoz.org]の参加者を募っているみたいですな。
    やっぱり、人の手ですかな。

    それに関連して、職場でSEOの話になり、それまでSEOという言葉を知らなかったが(その手法自体はよくやってたんだけど)いろいろ探してみるとSEO関連のコンサルタント会社が

    http://www.seojapan.com/ [seojapan.com]とか
    http://www.auncon.co.jp/ [auncon.co.jp]とか
    http://www.seoglobal.com/ [seoglobal.com]など、でてくるでてくる。

    で、やっぱりこれでご飯は食べていけるのでしょうか?
    --

    # I will work seriously this year!

  • 国産の検索サービス (スコア:2, おもしろおかしい)

    by goji (949) on 2002年06月18日 23時18分 (#109676) ホームページ 日記
    もう、はやぶさ [8823.net]くらいしか思いつかんですわ。
  • by akiu (7087) on 2002年06月18日 8時44分 (#109139) 日記
    ページがgoogleにそっくりなのはやぱし挑戦(挑発?)しているということなのだろうか。
    • by moonwolf (7862) on 2002年06月18日 9時28分 (#109160) ホームページ

      ロゴがボケボケなのは、なんとかならないの?

      使ってみて気づいた点

      • 検索結果が多かった場合に「次のページ」を表示することが出来ない
      • 半角英数で検索しても全角として扱われている
      • 「データ」と「データー」を区別出来ない
      • 漏れは確かにないが、適合性が低い
      Googleで見つからない場合の補助としてしか使い道は無い。メインにはなれないでしょう。
      親コメント
    • 真似てるかどうかは別としても、Google好きな私としてはこの手の技術については、是非Googleと技術提携するとかして、データベースの充実(新技術(?)開発側)と検索能力の向上(Google側)を図って欲しくなります。
      どんな検索エンジンを持っているにしても、結局はデータベースの規模が大きい方がより優位に立てる訳ですが、そのデータベースの構築には相応の時間が掛かりますので、どうしても先行者有利が効いてきますからね。
      逆に、この「N-gram方式」のような、ある意味で「言語依存」な検索手法を開発・実装できるのはGoogle(英語圏)以外の立場に立つ者故、みたいなところがあるかと。

      なかなか無理な相談かも知れませんが、うまいこと手を組んでくれませんかねぇ…
      --
      -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
      親コメント
      • by sgr (2035) on 2002年06月18日 10時46分 (#109216) 日記
        N-gramを使った検索方式自体は言語非依存のような気がするのですが…。
        ところで、検索を試してみましたが、N-gramらしくrecallは高いみたい
        ですが、precisionを上げる方法を別途考えないといけないでしょうね。
        親コメント
        • by kamuy (1690) on 2002年06月18日 12時22分 (#109296) ホームページ 日記
          検索方式としては言語に依存しないのでしょうが、
          「分かち書きをしない」「表記が揺れまくり」
          という日本語特有の単語を抽出し辛い状況がN-gram等の技術を求めていたという感じで。
          で、それはGoogleエンジニアの大半を占めていそうな
          「分かち書きをする」「表記が揺れようがない」
          言語圏の人たちからはあまり要求されなさそうな技術であり、当然Googleでも重要視されていないのではないか、と。
          だからこそ日本語環境で実用化が為されたのではないか、つまりは必要性という面で言語依存していたのではないか、ということを言いたかった訳です。
          --
          -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
          親コメント
          • by sgr (2035) on 2002年06月18日 13時09分 (#109345) 日記
            表記のゆれの問題は、日本語だろうと英語だろうとありますね。
            親コメント
            • >表記のゆれの問題は、日本語だろうと英語だろうとありますね。
              うお? そうなんですか… 知りませんでした…
              でも、具体的にどんな感じになるのかが考えつかないので、出来れば代表的な例とかを挙げて頂きたく。
              (誤記とか用語の違いとかではないんですよね…)

              んでは、ココでの揺れってのは長音の有無とかその辺の話ってコトでお願いします。
              --
              -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
              親コメント
              • by Anonymous Coward
                誰か表記のゆれというのを定義してください。

                color/colour;とか、スペルミスの処理とかも全文検索のときは非常に重要ですよね。複数形、単数形だって「ゆれ」ちゃー「ゆれ」だし。問題はそれを機械的に処理しやすいかしにくいか?

                日本語だって、「データ」か「データー」かなんて話は、文字種で分離し、sort/uniqすればコスト安く処理できます。

            • by Anonymous Coward
              完全に同意。
            • by Anonymous Coward
              あるかないか、というような単純な話は誰もしてないと思うが。
        • by Anonymous Coward
          独創的ってあるけれども、information retrievalの世界では実に古くからある手法だってことを、たれこんだ人も、コメントを付けてる人も全然知らないんでしょうね。(下手したらinformation retrievalっていうしっかりした分野が存在することさえ知らないのかも)
          • by oltio (3848) on 2002年06月18日 12時07分 (#109285) 日記
            まぁまぁ、N-gramを日本語で、Web検索エンジン規模で
            スケールする事を示しただけでも論文にはなりますから。
            (発表では「それだけ?」ってつっこまれるだろうけど)
            kensakuが一番手だったのかどうかは知りませんが…

            information retrievalという分野自体が知名度低いのは
            やっぱり宣伝不足かなぁ。検索エンジン以外にキラーアプリ
            がないってのもあるけど。
            親コメント
            • by Anonymous Coward
              N-Gramは日本語の処理にてきしているというのは既知の事実かと思っていましたが。

              欧米の言語が、日本語にくらべ「表現のゆれがすくない」というのは思いこみかと。

              • by Anonymous Coward
                欧米の言語が、日本語にくらべ「表現のゆれがすくない」というのは思いこみかと。
                じゃ、Porter stemmerに相当するような日本語用の確立された前処理ってあるんでしょうか?
          • by Anonymous Coward
            そういう時はそれに関する解説なりリソースへのポインタなりをしめしてトピックを補足するなりよ。そこが単なるニュースサイトとの違いなんだから。
          • 「未来世紀ブラジル」で知りました。(嘘)

            #あなたは何人のテロリストを、そう、面接したことがある?(だったっけ?)
    • Re:くりそつ (スコア:1, 参考になる)

      by Anonymous Coward on 2002年06月18日 10時16分 (#109198)
      http://web.archive.org/web/*/http://kensaku.org

      Google知る前からkensaku.jp(昔は.orgだった)使ってたけどね。
      親コメント
      • by Anonymous Coward
        kensaku.orgの前の名前もあった(検索デスクでは別の呼び方も併記してたというか)ような気がするのですが思い出せないです(あっ煽りじゃないですよ kensaku.org様の方が歴史が長いってことを補強する意見って事で


        もとい最近のgoogleの増長ブリをみ
        • Re:くりそつ (スコア:2, 参考になる)

          by simon (1336) on 2002年06月19日 1時38分 (#109764)
          kensaku.orgの前の名前もあった(検索デスクでは別の呼び方も併記してたというか)ような気がするのですが

          一時期は検索.jp、そのまえはRingringと名乗ってました。
          (っつーか、InternetWatchの記事にちゃんと書いてありますよ)
          早稲田の学生さんがやってた検索エンジンで、卒業後も商用化の道を探してたらしいのですがしばらくして結局閉じてしまいました。

          こういった形で復活するのは嬉しい限りです。
          親コメント
    • by Landie(GRG) (6950) on 2002年06月18日 12時28分 (#109305) ホームページ
      突き詰めれば同じ形になる。収斂進化ってやつですね。
      親コメント
  • by officepig (3266) on 2002年06月18日 10時46分 (#109219) 日記
    入力ウィンドウの英数字がいちいち全角に化けるというのはちょっと嫌。
  • by yasiyasi (5450) on 2002年06月18日 19時53分 (#109588)
    タレコミのリンク(http://www.aaacafe.ne.jp/)をクリックしたら、ブラウザ(Internetサムライ)がなんか変な名前のファイル「aaacafe.ne[1]-/」をダウンロードしようとするんで、おっかなくて開けない・・・。
    (2002/06/18 19:50現在)

    このサイトは、こういう動作で正しいの?

  • teoma search、ベータ版でなくなってるんですね。

    http://www.teoma.com

    こういう新しいところにも頑張って欲しいですね。
  • by Anonymous Coward on 2002年06月18日 10時59分 (#109225)
    ねぇ、千里眼ってどこ行ったの?
  • by Anonymous Coward on 2002年06月18日 12時44分 (#109324)
    自称無料掲示板の大手らしいのですが、
    サイト全体がかなり怪しげですよね。
  • by Anonymous Coward on 2002年06月18日 17時57分 (#109523)
    AAA!CAFEの全文検索エンジンですが、
    Namazu [namazu.org]から乗換えたのでしょうかね。
  • by Anonymous Coward on 2002年06月18日 18時52分 (#109569)
    「検索エンジンで一番上に表示されるから」と、社長さんから聞いた気がするなぁ…
  • by Anonymous Coward on 2002年06月26日 3時28分 (#113731)
    多ページ検索できるようになったみたい。
    これでちょっとは見やすく&検索しやすくなるなあ
typodupeerror

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

読み込み中...