大規模汎用連想検索エンジンを公開 9
ストーリー by yourCat
連想ゲームはできない 部門より
連想ゲームはできない 部門より
von_yosukeyan曰く、"日立製作所のプレスリリースによると、日立製作所と国立情報学研究所(NII)は、大規模な全文検索に対応した汎用連想型計算エンジン(GETA)を開発したと発表した。GETAはNIIで公開されている。
GETAは、「連想型計算エンジン」の名の通り単純なインデックス型全文検索エンジンではなく、単語のベクトル表現により文書間の関連性や類似性をもとに検索が可能なベクトル型全文検索エンジン。インデックスの圧縮やクラスタリングに対応することで、単独PCでは20万件程度、クラスタリング時には1,000万件程度のデータベースから類似検索が可能になるという。
ソースコードで配布されているので、必要環境についてはこちらを参照していただきたいが、FreeBSDの他に各種Linuxディストリビューション、Solaris、Digital UNIXなどで動作が確認されている。"
元ネタはどうしよう (スコア:1)
Re:元ネタはどうしよう (スコア:2, 参考になる)
論文というのは基本的には雑誌に掲載されるモノです。(また、発表後百年以上参照され続けるユニークな性質を持っています。)
そのため、論文集というものが発行されています。(電子化されていないモノも結構あったりしますが...)
出版社から論文集のCDを送ってもらって、ぶちこむだけです。
# テストは新聞記事で行ったみたいですが…
蛇足:
・お金と手間を掛けずに論文を読みたい場合
たいてい、大学とか研究機関では論文一覧 [google.com]を載せてますし、
こういう風に [jaeri.go.jp]論文全てを掲載している所もあります。
notice : I ignore an anonymous contribution.
それほど目新しくもないような (スコア:0)
既に動いている物でも、コンピュータサイエンスでは NEC ResearchIndex [nec.com] とか、宇宙物理ではNASA Astrophysics Data System [harvard.edu]とかには、類似論文検索機能がついてます。試してみてはいかがでしょう。
Re:元ネタはどうしよう (スコア:0)
Re:元ネタはどうしよう (スコア:0)
#手法は忘れたので AC
要は (スコア:1)
さらに言うなら、徳島大学ですかね
Jperlが必要ということは… (スコア:1)
Re:Jperlが必要ということは… (スコア:2, 参考になる)
仲間探し (スコア:1)
傾向、志向を持った人々を結びつけるシステムを実装
して欲しいなりよ。
IN EARTH AND SKIE AND SEA STRANGE THYNGES THER BE.