パスワードを忘れた? アカウント作成
9238 story
ストレージ

ドキュメントリポジトリ構築ツール使ってますか? 21

ストーリー by Oliver
発掘調査 部門より

Livingdead曰く、"研究室で成果物の公開のために実験的に何らかのリポジトリ構築ツールを使ってみようかという話で時々相談を受けます。どっかのリポジトリを使わせてもらえばいいじゃん、といわれそうですが、そこはそれ、自分の鯖でできることは自分の鯖でやってみたいのが人情(?)。そうすると、孤立してしまうことにもなりかねないので、将来的には OAI-PMH でのハーベスティングにも対応したほうがいいよな、ってことで GNU ePrintsdSpace を検討しています。 GNU ePrints は MySQL + mod_perl + Apache の環境で、dSpace は PostgreSQL + Tomcat + Apache の環境で動きますが、GNU ePrints のほうがお手軽なようです。
放り込む文献はほぼすべて LaTeX で作成したものなんですが、一番の不安はどれくらいお手軽に参考文献を処理できるか、ということ。最近話題になった Google の論文検索機能(「Google に論文検索機能が追加 」)などではどうやって文書内から引用情報や参考文献情報を抽出しているのか気になるところです。LaTeX -> DVI -> PDF と変換した際にも参考文献関係の情報はきっちりと受け継がれているものなんでしょうかね。BibTeX 用のエントリを自動的に作成してくれたりするとなおいいんですが。
/.Jer諸氏も仕事で、はたまた個人的に成果物を公表する機会が多い人がおられると思いますが、リポジトリ構築ツールって使っていらっしゃいますか?"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by maia (16220) on 2004年11月22日 20時01分 (#656181) 日記
    #メタデータ・ハーヴェスティングは、固定URLを持たない(データベースに格納された)ドキュメント用と理解してますが、合ってますかね。
    #LaTeXなら、XHTML化しちゃあいかんのですかね。

    話のポイントは、BibTexの構造性を汎用のXHTMLでどう活かせるのか?という事ですか? (PDFはどうしようもない気がする)
    この辺の解決の見通しがあるのならば、ぜひ知りたいところ。
    #RDFとか?
  • 商用ですが (スコア:2, 参考になる)

    by kilin28 (10167) on 2004年11月22日 21時41分 (#656221) 日記
    Oracle?Collaboration Suiteのファイルサーバーなんてどうでしょう?
    microsoftのは(SharePointServer?)よく知りませんが。
  • その前に (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2004年11月22日 17時27分 (#656130)
    内容と言われて、ぐさっと来た人、手をあげなさい。
  • GNU ePrints には HTML ファイルを文献としてデポジットすることもできますが、GNU ePrints はその文献を表示する時に HTTP ヘッダで UTF-8 を指定してくるので文字化けします。この辺、ちょっと改良の余地がありそうだな…
    --
    屍体メモ [windy.cx]
  • by Anonymous Coward on 2004年11月22日 16時46分 (#656117)
    論文レポジトリ構築ツールって、
    なんなのさ。
    XOOPSやZOPEみたいなコンテンツ管理ツールとは違うの?
    とりあえず、新作論文うpして、掲示板に

    (・∀・)ニヤニヤ

    とか書かれたら、ぶちきれる
    • CiteSeerとか (スコア:2, 参考になる)

      by Livingdead (18685) on 2004年11月22日 17時05分 (#656121) ホームページ 日記
      大規模&多機能なものでは CiteSeer [psu.edu]などがその例です。最近の流れとしてはもう少し小規模、たとえば組織単位でのリポジトリを用意して、成果物はそこで集積し、ドキュメントの情報(内容としては BibTeXエントリに書くもの+アブスト+キーワード) はOAI-PMHでもっと大規模な組織にハーベストしてもらう、というのがはやりつつあるようです。

      掲示板機能はありませんが、

      ------------
      第1章 はじめに
         …
         …
       (・∀・)ニヤニヤ [1]
         …
         …

      参考文献

      [1] Livingdead, "Night of the livingdead", Aug. 11, 2004, Available from http://www.example.com/ .
      ------------

      なんていうドキュメントを登録されちゃうかもしれません。
      --
      屍体メモ [windy.cx]
      親コメント
    • (・∀・)ニヤニヤ
  • by Anonymous Coward on 2004年11月22日 17時15分 (#656124)
    LaTeXのソースからDVIになるってどういう事か調べたほうがいいかと。
    組版って何かを調べるほうが先かな?
    • \special とかで DVI に埋め込めないのかなぁと思ったんですが、なかなか難しそうですね。

      ParaCite [eprints.org] などではテンプレートマッチングで抽出している [eprints.org]のだそうですが、まだParaTools のコードを読んでないので何をやってるのか分かってません。
      --
      屍体メモ [windy.cx]
      親コメント
      • hyperrefパッケージ [google.co.jp]などで適切なアンカーをPDF中に設置できれば、他のPDFやWebなどから文献情報に容易にアクセスできるようになるんじゃないでしょうかね。

        で、bibliographyにつけられたアンカーから次のアンカーまでの範囲のテキストを文献リストとして取り込むようにすれば、それなりに抽出できるのでは。

        # LaTeX以外の部分でどう実装するのかはわかりません。
        # 検索したら自分のページが4番めでびっくり。
        --
        Your 金銭的 potential. Our passion - Micro$oft

        Tsukitomo(月友)
        親コメント
        • by Anonymous Coward
          spires やcitebase はどうやってるんだろうかね?

          # spires は最近あか抜けた感じだけど、
          # arXiv なんかはどうにかならんのか、と思う。
          # The Internet みたいでイヤ。
      • しまった…なんか間違えて「 +1 しない」のチェックをわざわざはずしてしまった…鬱だ。
    • pstex, pdftex (スコア:1, 参考になる)

      by Anonymous Coward on 2004年11月22日 17時57分 (#656142)
      あぁ、それそれ。
      dvi2psって、デフォで参照のあるTeXフォントだけピックアップしたType3フォントを生成添付するか、あるいはラスタイメージに展開しちゃうから、検索エンジンでの検索が激しく困難なのよねぇ~。

      pstex経由で、外部フォント参照するps/pdfを生成しないとだめなんだっけ?

      #10年前の知識なのでAC
      親コメント
      • by Anonymous Coward
        dvipdfm(x)で大丈夫なんじゃ?
        • by Anonymous Coward
          真のプログラマは直接 PostScript を書く。

          # 嘘です。

          • by Anonymous Coward
            別にプログラマじゃないし。残念!!

            昔々は、NTTの風間さんとか、松下の楠瀬さんとか、都立大(当時)の櫻井せんせとか、論文書きながら、TeXhacksするつわものも居たの事だなぁ~。
            最近どうよ?国内のTeXhackerの様子
typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...