パスワードを忘れた? アカウント作成
11034 story

Hyper Estraier 1.0.0リリース 37

ストーリー by yoosee
全文検索は次のステージへ 部門より

あるAnonymous Coward曰く、"新生/.jpでも採用されている全文検索エンジンHyper Estraierが1.0.0をリリースした。作者の平林幹雄氏が、母体にあたるEstraier終息後に今年の3月から急ピッチで開発を進めてきたもの。特徴としては

  • N-gram方式による漏れのない検索
  • 大量の文書を高速でindexできる
  • P2Pによる文書情報の共有
  • フレーズ、属性、類似検索をサポート
など盛りだくさん。Windows用のバイナリも用意されており、xdoc2txtなどと連携することでPDFや*.doc形式の文書なども気軽に検索できる環 境を構築できる。
Webベースでの利用が多いようだが、コマンドラインツールであるestcmdやJava、Rubyなどのバインディングを利用することでローカルな環境でも使いでは十分。タレコミ子はGoogle Desktop Search使うにはマシンパワーが足りずこちらに流れたが、全く不足なく使えている。正式リリースを期に一気にブレイクなるか?"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 参考リンク (スコア:4, 参考になる)

    by Anonymous Coward on 2005年10月17日 9時34分 (#815363)
    ITmediaの紹介記事 [itmedia.co.jp]
    2004年未踏ソフトウェアの採択案件評価書 [ipa.go.jp]
    Oliver氏による機能評価 [srad.jp]

    クライアントとしては
    gdestraier(GNOME上でのデスクトップサーチ) [no-ip.com]
    Windows上でのめぼしいクライアントはないけどこんなんがひっかかった
    Hyper Estraier Mode(xyzzyのLispアプリケーション) [august.oor.jp]

    言語バインディングはJava、Rubyの他、PHP、Python、Perlなどある模様。
    • by okkez (28826) on 2005年10月17日 20時07分 (#815679) ホームページ
      PHPで使ってみたかったけど、何か色々とめんどくさそうなので諦めた。
      親コメント
    • Re:参考リンク (スコア:1, 参考になる)

      by Anonymous Coward on 2005年10月17日 20時49分 (#815705)
      > gdestraier(GNOME上でのデスクトップサーチ)

      GNOMEと言えば何といってもBeagle [beaglewiki.org]が有名ですけど、あっちはインデクサにApache Lucene [apache.org]のC#移植版であるDotLucene [dotlucene.net]を使っているということもあってMonoアプリになってますし、いろいろ入れなければならないコンポーネントも多いので、あまり気軽に試せるようなものではないですね。gdestraierが発展していってBeagleの強力な対抗馬になると面白いのですけど。
      親コメント
      • by Anonymous Coward
        Beagleはinotify対応がミソだと思うんだが、gdestraierの場合ググると『inotifyとかfam使えばオッケー』みたいな話は引っかかるけど現状どうなの?

        • Re:参考リンク (スコア:2, 参考になる)

          by kai_kamome (4560) on 2005年10月17日 23時08分 (#815809) ホームページ 日記
          > gdestraierの場合ググると『inotifyとかfam使えばオッケー』みたいな話は引っかかるけど現状どうなの?

          対応できてません。
          ってか、わたし自身インクリメンタル更新無くてもなんとかなってるせいが、
          いまいちモチベーションが上がらず、手つかずなのが現状。

          # 他にも、メール検索したいけど、特定メッセージをメーラで開く方法が判らなくて
          # 燃えつきる寸前だったりする。
          --
          wild wild computing
          親コメント
  • by dorifer (514) on 2005年10月18日 1時14分 (#815900) 日記
    作者氏の「開発メモ」http://qdbm.sourceforge.net/mikio/rbbs.cgi [sourceforge.net]もいろいろ参考になります。
    --
    IN EARTH AND SKIE AND SEA STRANGE THYNGES THER BE.
  • ページ下部の (スコア:2, 参考になる)

    by kai_kamome (4560) on 2005年10月17日 9時50分 (#815372) ホームページ 日記
    > 新生/.jpでも採用されている

    ??? ストーリーのページ下部にある検索ボックス使うと、
    namazu.cgi呼ぼうとして404になりますが....
    --
    wild wild computing
  • ネーミング (スコア:1, 興味深い)

    by Anonymous Coward on 2005年10月17日 10時20分 (#815392)
    「Namazuとはちゃうねんど」と言いたい気持ちはわからんでもないが
    インパクトのない名前で損してる気がするのは俺だけではあるまい。
    「Hyperついただろ」ってそういう問題ぢゃなくってさ
  • by Anonymous Coward on 2005年10月17日 13時29分 (#815505)
    > 新生/.jpでも採用されている

    (少なくとも日本語では)使えないって評価でOK?
    • 使ってみたよ (スコア:3, 参考になる)

      by Anonymous Coward on 2005年10月17日 14時23分 (#815525)
      debianパッケージになってたんで早速使ってみた。
      家庭内サーバにあるHTMLマニュアルを今まで使ってきたNamazuと比較で。

      1. 検索速度めちゃはやっ。初めてGoogle使ったときのような軽快さ。
      2. インデックス作成も結構早い

      日本語も問題なかったし、/. で検索してみたとき感じた
      「変なストップワードでも入ってんじゃない」もまったくなかった。過去のnamazu用のコードがまだ残ってるんじゃないかな?

      本家デモサイト [osdn.jp]で評価してあげて。なんかHyperEstraierが、カワイソス。

      親コメント
    • ただのHTMLだと面白くないので
      ふたば型画像掲示板、Pukiwiki、Anthologys.cgiに対応してみた。
      http://www.nijiura.com/estseek/estseek.cgi

      日本語の検索は全く問題ないけど、
      AutherやTitleも本文に入れておかないと
      メインのフレーズ検索でヒットしてくれないみたい。
      十分早いので満足。ただ手抜き運用なので毎回インデクスをゼロから作り直し。
      2000ドキュメントで2分ほどかかるね。
      親コメント
  • by tuneo (2938) on 2005年10月17日 16時09分 (#815568) ホームページ 日記
    > 全文検索エンジンHyper Estraierが1.0.0をリリースした。
    日本語おかしくないですか?

    俺なら「全文検索エンジンHyper Estraierの1.0.0がリリースされた」と書く。
  • 読み方!! (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2005年10月17日 19時45分 (#815664)
    なんて読むのか解らないからリアルで宣伝しようが無いんですよ。
    つか、この手のって間違ってると馬鹿だと思われそうで怖くて口にも出来ないっす。
    • Re:読み方!! (スコア:3, 参考になる)

      by apt (28270) on 2005年10月17日 20時38分 (#815694) 日記
      FAQ [sourceforge.net]によれば、作者もよく分からないけれども「ハイパーエストレイア」と発音しているそうです。
      古いフランス語で「迷う」とか「はぐれる」とかいう意味の言葉だとか。
      親コメント
      • Re:読み方!! (スコア:3, 参考になる)

        by crouton (9) on 2005年10月18日 9時16分 (#815996)

        半年ほど前に専門家(父ともいう)にたずねてみたところ、エトレイェ、が妥当ではないかとのことでした。

        そのときのメモ

        俗ラテン語、古代フランス語、中世フランス語などで綴り字の読み方にかなり変化があるので、一概に決めつけられない。 古くは全文字をそのまま読んでいたけれど、次第に読まない文字や二重母音の短母音化などの変化が生じたので、どの時代かというのが本当は大事。

        最後の結論は、どこかにそう書いてあったというわけではなく、そう読むのが一番自然だろうという意味。

        est-のsはかなり早い時代から読まなくなっていたはずなので、estrange(étrange:エトランジュ:奇妙な:strange)とかestablir(établir:エタブリール:設立する/to establish)などと同様、読まないでおいてもいいだろう。

        aiは、二重母音としてアイと読むのか、エと読むのかは時代によって違いがあるが、母音の次に来るiはyと同価だったらしく、結局-ierは-yerと同じということになる。

        以上から、estraierはétrayerと綴るのと同じ。なので発音は、métayer(メテイェ:/metεje/:小作農)と同じような形になるので、結論としては、エトレイェ(/etrεje/)。当たらずといえども遠からずか?

        --
        "Quidquid latine dictum sit, altum videtur."
        親コメント
    • by ueno-t (3169) on 2005年10月17日 20時04分 (#815676)
      作者自身がまだ読み方知らない、って言ってますしね。
      勝手に「えすとれや」と呼んではいますが。
      親コメント
      • by Anonymous Coward
        一瞬、ゲーム作品のYs(イース) [wikipedia.org]がフランス語源なので、作中の架空地名であるエステリアかな、
        と思ったんですが、それはesteriorでした。

        「この単語、なんて読むんだろう?」と書くと、(信憑性はともかくとして)おそらくこんな読みじゃないかといった意見が
        そのうちに返ってくるような、国籍を問わないコミュニティがあるといいですね。
        (すでにあるのかもしれませんが。)

      • by Anonymous Coward
        山田くーん。椅子とれや!
    • by Anonymous Coward
      >なんて読むのか解らないからリアルで宣伝しようが無いんですよ。
      「えすと」「はいぱーえすと」で必要かつ充分です。
  • by Anonymous Coward on 2005年10月17日 9時12分 (#815349)
    いつ対応しますか?
  • by Anonymous Coward on 2005年10月17日 12時03分 (#815459)
    無理ですかねやっぱり.
    見たところPure Rubyもどうやら,Hyper EstraierのRuby実装ではなくて,
    Hyper EstraierのP2P機能のRubyインターフェースのようですし.
  • by Anonymous Coward on 2005年10月17日 12時37分 (#815482)
    Hyper Estraierのページを開いたら、
    「Hyper Estraier: 共同体的全文検索系」
    とか出てきたよ。

    なにかと思ったら、
    Hyper Estraier: a full-text search system for communities
    の直訳なんだな。
  • by Anonymous Coward on 2005年10月20日 7時37分 (#817119)
    以下引用
    ■概要
     Hyper Estraierを検索エンジンに使用した、Windows用のデスクトップ検索ツールです。

     指定したディレクトリの配下の、次の種類のファイルから全文検索を行えます。
     ・テキストファイル
     ・HTMLファイル
     ・電子メールファイル(拡張子が「.eml」「.mime」「.mht」「.mhtml」のもの)
     ・Wordファイル
     ・Excelファイル
     ・PowerPointファイル
     ・pdfファイル

     類似ツールとして、Hyper Estraier Modeがあります。
     DesktopHEをおすすめするユーザーも、Hyper Estraier Modeと同じです。

    DesktopHE
    http://freemind.s57.xrea.com/desktophe/
typodupeerror

UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア

読み込み中...