パスワードを忘れた? アカウント作成
4307 story

検索は「絞り込み」から「知識の発展」へ 27

ストーリー by yourCat
検索サーフィン 部門より

torus曰く、 " 『今日の雑学+(プラス)』によると、 『といえばサーバ』を応用した初の「といえば検索」エンジン4im.netが公開された。

「従来の検索エンジンが、キーワードをもとに多くのインターネッ ト情報から検索結果を「絞り込む」ことに主眼が置かれていたのに 対し、「DATASECTION Technology(特許申請中)」は、自然文をも とにその意味と価値を解析し、「AといえばB」「Aに似たものはB」 のように、検索結果を「ひろげて」いきます」 (プレスリリースより)

ライコスなどが採用している検索エンジンWiseNutWiseGuideでも関連キーワードの提示がされたりするが、4im.netはもっと進んで関連 (があるかもしれない) ページの提示に特化し、「回答を求めて検索するサイトではなく、ブレーンストーミングするような感覚で自分の発想を広げていく」という点が面白い。"

類似度の判別方法自体は別段珍しくもないが、絞り込みの試行錯誤を文脈で置き換えようというその使い方が面白い。ネットサーフィンに似て、寄り道を楽しむ感覚が気持ちいいぞ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by hentaihakase (11366) on 2002年11月14日 9時19分 (#200343) ホームページ
    こないだ公開された国立情報学研究所のwebcatplus [nii.ac.jp]になんとなく機能が似ている気がしました.

    webcatplus の方は
    検索対象がNacsisCATに登録されている図書のデータに限定されてはいるんですけどね.
    こちらの方は検索エンジンが公開 [nii.ac.jp]されていますので
    その気があれば自分のサーバーで実装出来そう.
    • by Anonymous Coward
      視覚化は別として、理論的にはまったく陳腐なようですね。これだけ(とは思えないけれど)で商売できるとしたら、すごい驚き。
      • by Anonymous Coward on 2002年11月14日 12時25分 (#200423)
        どんな陳腐な理論であっても、それが有用であり、かつ、実装されていれば充分に商売になります。

        反対に、どんな高度な理論であっても、それが役に立たなかったり、机上の空論だったりすると、あんまり商売にはなりません。
        親コメント
  • 使ってみた感想 (スコア:2, 参考になる)

    by lancerseven (11292) on 2002年11月14日 9時23分 (#200345)
    検索時に使う文章が長ければ長いほど威力を発揮するみたいですね、単語だと検索結果が数件しか出なかったけどニューストピックなどの長文ではたくさんの検索結果が出てくるようです。(って元ページにもかいてあったかな?)

    企画文書などに添付する参考資料を作成する際に重宝するのでは?
    • 割と濃い目のページが出てきますね。どういうルールでやってるのかな。 英語のページが日本語で出てくるは翻訳してからインデックシングしているのか。

      初めての(詳しくない)トピックの概要を調べるには良さそうですね。概要をこっちみて、細かい情報は google で集める、なんて住み分けすれば便利な感じ。けっこう使えるかも。

      --
      親コメント
      • by torus (9980) on 2002年11月14日 10時49分 (#200377) ホームページ 日記
        ここで出てくるページは、 みんな「今日の雑学+」の小橋さんが自分で集めて簡単な表題をつけたものなので、 一定の濃度が保たれるんだと思います。

        逆に、普通の検索エンジンみたいにウェブ上の情報を無差別に取ってきてたら、 どうでもいい検索結果ばっかりになりそう。

        人力検索エンジンというのがいくつかありますが、 (ここ [hatena.ne.jp]とか、 ここ [8823.net]とか) 4im.net はこの人力検索エンジン支援っていう感じがします。 つまり、情報を集めるのはあくまで人間だということで。

        --
        use Test::More 'no_plan';
        親コメント
    • by Anonymous Coward
      面白いっすね。
      4imの名前通り、マーケティング資料を作る際にえらい重宝しそうです。

      個人で払える額なら有料サービスでも登録するかもかも。
      • by Anonymous Coward
        宣伝必死だな。

        マジレスするとまだまだチューニングが足りない。
        サービスに出せる段階じゃないと思う。
        コンセプトはいいけど応用段階でコケるのはよくあるので
        注意すべし。
        • by Anonymous Coward
          #200348のACですが、
          単純な感想書いたら宣伝要員にされちまいましたね(笑)
          技術が陳腐だ、と書いた人と同一人物かな?

          検索で出てくる情報が基本的にマーケッター向けのデータが
          ほとんどだったので、技術寄りの人にはつまんないのかなぁ。

          私は開発もやりつつ営業もやるので(弱小企業なんてそんなもん)
          営業に出る前に、顧客のニュースリリースでも突っ込んで、関連する
          業界のマーケットデ
          • by kyle (3923) on 2002年11月14日 15時27分 (#200491) 日記
            検索で出てくる情報が基本的にマーケッター向けのデータが
            ほとんどだったので、技術寄りの人にはつまんないのかなぁ。

            そうかも。「カテゴリー」を見てもアレゲ度が低いし。日経とか
            大好き愛読な人には重宝かも?

            親コメント
            • /. の過去のストーリーと、 一定以上のスコアの書き込み、 それから、それらからのリンク先を突っ込めば、 アレゲ度かなり高いものになりそうですねぇ。

              だれを満足させるためのものかっていうのをはっきりさせておくのも重要だと思います。

              --
              use Test::More 'no_plan';
              親コメント
    • by Anonymous Coward
      紹介文が気持ち悪かった。
  • 意味を解析 (スコア:2, 興味深い)

    by take0m (4948) on 2002年11月14日 11時08分 (#200390) 日記
    長文ほど威力を発揮するのは、こういう系統の検索エンジンだと同じですよね。ConceptBaseもおんなじ感じです。

    あと、このサイトに意味を解析とありますけど、ほんとうに意味解析まで処理しているのでしょうか?

    「たばこが好き」
    「たばこが嫌い」
    「たばこが好きではない」

    の検索結果を見比べてみたのですが・・・

    なんとなく、形態素解析して、重みつけて終わりみたいにも感じました。それを「意味の解析」と呼んでいる気がします。
    「意味解析」ではなく、「意味の解析」
    • Re:意味を解析 (スコア:4, 参考になる)

      by dan kamiyubi (6091) on 2002年11月14日 12時01分 (#200416) ホームページ 日記
      たぶんスコアづけに寄与するのは名詞だけで、 形容詞や動詞は無視なんじゃないのかなあ。

      こういうのって、特徴量ベクトルつくるのは形態素解析、同義語類義語、TF・IDF、 類似度はベクトルの内積かユークリッド距離、って誰がどうやってもやる事はだいたい枯れているので、 あとはどういう演出で売るのかってところにきてるんじゃないでしょうか。

      「○○といえば××」っていうのはちょっと目を引いた。 ナレッジなんとかなどというよりは分かりやすい感じ。

      親コメント
  • 関心空間 (スコア:2, 参考になる)

    by unagi (2663) on 2002年11月14日 11時15分 (#200393) 日記
    サーチエンジンではありませんが。
    関心空間 [kanshin.com]
    というのも、言葉から言葉を連想して繋げていけて面白いです。
  • by Anonymous Coward on 2002年11月14日 9時59分 (#200355)
    こんなのもありますよね。

    http://www.googlism.com/index.htm
  • by Anonymous Coward on 2002年11月14日 12時23分 (#200421)
    Opera6.05では文字化けしますね。
    Framesetを記述しているHTMLのキャラクタセットがShit-jisで、その中に入るHTMLのキャラクタセットがeuc-jpだからでしょうか・・・。 # オフトピなのでAC
  • 「桶屋が儲かる」にたどりつける(かもしれない)システム
    という理解でいいんでしょうか?
  • by Anonymous Coward on 2002年11月14日 8時50分 (#200332)
    検索ページの右側に、
    「今日のIT業界」from Slashdot.jp
    を見つけて、それは何か間違ってるなぁ…と思いますた。
  • by Anonymous Coward on 2002年11月14日 14時48分 (#200479)
    『「80年代アイドルの河合奈保子のいま」といえば』 で出てくるサイト情報の関連性がよくわからん。
typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...