Hyper Estraier 1.0.0リリース 37
ストーリー by yoosee
全文検索は次のステージへ 部門より
全文検索は次のステージへ 部門より
あるAnonymous Coward曰く、"新生/.jpでも採用されている全文検索エンジンHyper Estraierが1.0.0をリリースした。作者の平林幹雄氏が、母体にあたるEstraier終息後に今年の3月から急ピッチで開発を進めてきたもの。特徴としては
- N-gram方式による漏れのない検索
- 大量の文書を高速でindexできる
- P2Pによる文書情報の共有
- フレーズ、属性、類似検索をサポート
Webベースでの利用が多いようだが、コマンドラインツールであるestcmdやJava、Rubyなどのバインディングを利用することでローカルな環境でも使いでは十分。タレコミ子はGoogle Desktop Search使うにはマシンパワーが足りずこちらに流れたが、全く不足なく使えている。正式リリースを期に一気にブレイクなるか?"
参考リンク (スコア:4, 参考になる)
2004年未踏ソフトウェアの採択案件評価書 [ipa.go.jp]
Oliver氏による機能評価 [srad.jp]
クライアントとしては
gdestraier(GNOME上でのデスクトップサーチ) [no-ip.com]
Windows上でのめぼしいクライアントはないけどこんなんがひっかかった
Hyper Estraier Mode(xyzzyのLispアプリケーション) [august.oor.jp]
言語バインディングはJava、Rubyの他、PHP、Python、Perlなどある模様。
Re:参考リンク (スコア:1)
Re:参考リンク (スコア:1, 参考になる)
GNOMEと言えば何といってもBeagle [beaglewiki.org]が有名ですけど、あっちはインデクサにApache Lucene [apache.org]のC#移植版であるDotLucene [dotlucene.net]を使っているということもあってMonoアプリになってますし、いろいろ入れなければならないコンポーネントも多いので、あまり気軽に試せるようなものではないですね。gdestraierが発展していってBeagleの強力な対抗馬になると面白いのですけど。
Re:参考リンク (スコア:0)
Re:参考リンク (スコア:2, 参考になる)
対応できてません。
ってか、わたし自身インクリメンタル更新無くてもなんとかなってるせいが、
いまいちモチベーションが上がらず、手つかずなのが現状。
# 他にも、メール検索したいけど、特定メッセージをメーラで開く方法が判らなくて
# 燃えつきる寸前だったりする。
wild wild computing
「開発メモ」在り (スコア:3, 参考になる)
IN EARTH AND SKIE AND SEA STRANGE THYNGES THER BE.
ページ下部の (スコア:2, 参考になる)
??? ストーリーのページ下部にある検索ボックス使うと、
namazu.cgi呼ぼうとして404になりますが....
wild wild computing
Re:ページ下部の (スコア:2, 参考になる)
Re:ページ下部の (スコア:1)
日本語がまだ通らないとか言ってる所を見ると、単にブリッジしてるだけでなくて、
search.plの中でくちゃくちゃやってるって事ですかね。
ノウハウのフィードバックがあるとうれしいかも。
# Movable Typeのプラグイン作ろうとして面倒になった人
wild wild computing
ネーミング (スコア:1, 興味深い)
インパクトのない名前で損してる気がするのは俺だけではあるまい。
「Hyperついただろ」ってそういう問題ぢゃなくってさ
実例を見ると (スコア:1, 興味深い)
(少なくとも日本語では)使えないって評価でOK?
使ってみたよ (スコア:3, 参考になる)
家庭内サーバにあるHTMLマニュアルを今まで使ってきたNamazuと比較で。
1. 検索速度めちゃはやっ。初めてGoogle使ったときのような軽快さ。
2. インデックス作成も結構早い
日本語も問題なかったし、/. で検索してみたとき感じた
「変なストップワードでも入ってんじゃない」もまったくなかった。過去のnamazu用のコードがまだ残ってるんじゃないかな?
本家デモサイト [osdn.jp]で評価してあげて。なんかHyperEstraierが、カワイソス。
Re:使ってみたよ (スコア:0)
(Hyper Estraierじゃなくて/.-Jが)使えないって評価でOK?
Re:使ってみたよ (スコア:1, 興味深い)
mod_estraier [sourceforge.net]も設置してあって、HTTPのプロクシに athlon64.fsij.org:8080 を
設定すると上記のデモサイトでWebブラウズの履歴が検索できる。
使ってみたよ(2) (スコア:1)
ふたば型画像掲示板、Pukiwiki、Anthologys.cgiに対応してみた。
http://www.nijiura.com/estseek/estseek.cgi
日本語の検索は全く問題ないけど、
AutherやTitleも本文に入れておかないと
メインのフレーズ検索でヒットしてくれないみたい。
十分早いので満足。ただ手抜き運用なので毎回インデクスをゼロから作り直し。
2000ドキュメントで2分ほどかかるね。
が、を? (スコア:1)
日本語おかしくないですか?
俺なら「全文検索エンジンHyper Estraierの1.0.0がリリースされた」と書く。
読み方!! (スコア:1, すばらしい洞察)
つか、この手のって間違ってると馬鹿だと思われそうで怖くて口にも出来ないっす。
Re:読み方!! (スコア:3, 参考になる)
古いフランス語で「迷う」とか「はぐれる」とかいう意味の言葉だとか。
Re:読み方!! (スコア:3, 参考になる)
半年ほど前に専門家(父ともいう)にたずねてみたところ、エトレイェ、が妥当ではないかとのことでした。
そのときのメモ
"Quidquid latine dictum sit, altum videtur."
Re:読み方!! (スコア:1, 参考になる)
Re:読み方!! (スコア:1)
勝手に「えすとれや」と呼んではいますが。
Re:読み方!! (スコア:0)
と思ったんですが、それはesteriorでした。
「この単語、なんて読むんだろう?」と書くと、(信憑性はともかくとして)おそらくこんな読みじゃないかといった意見が
そのうちに返ってくるような、国籍を問わないコミュニティがあるといいですね。
(すでにあるのかもしれませんが。)
Re:読み方!! (スコア:0)
Re:読み方!! (スコア:0)
「えすと」「はいぱーえすと」で必要かつ充分です。
風博士は (スコア:0)
Re:風博士は (スコア:0)
rubyのnative bindingをwindowsで使いたいのですが (スコア:0)
見たところPure Rubyもどうやら,Hyper EstraierのRuby実装ではなくて,
Hyper EstraierのP2P機能のRubyインターフェースのようですし.
中国語のページを開いちゃったかと思ったよ。 (スコア:0)
「Hyper Estraier: 共同体的全文検索系」
とか出てきたよ。
なにかと思ったら、
Hyper Estraier: a full-text search system for communities
の直訳なんだな。
Re:中国語のページを開いちゃったかと思ったよ。 (スコア:2, 興味深い)
全文検索のP2P機能って、世の中のサーバが増えれば増えるほど、検索速度がUPするってことなのかな。
それともローカルネットワーク内でちゃんと設定した場合の話なのか。
今ひとつよく分からん。
Re:中国語のページを開いちゃったかと思ったよ。 (スコア:1)
検索サーバ同士を連携させて、1つの巨大なインデックスとして扱う事が、文書本体や
データベースののコピーをしなくてもできるってのがすごいんじゃないかな?
wild wild computing
Windows用検索ツール (スコア:0)
DesktopHE
http://freemind.s57.xrea.com/desktophe/