ページ内ジャンプ:

アレゲなニュースと雑談サイト

Acanthopanaxによる 2004年12月07日 21時34分の掲載
まだ始まっていなかった部門より。

mew曰く、"NIKKEI NETの記事より。2006年から国立国会図書館がウェブサイトの収集を始めるそうです。収集対象となるサイトは当面はjpドメインのみで、一般利用者の閲覧も将来(前掲記事では「2008年をメドに」)認める方針とのこと。
この国会図書館主導の「日本版Internet Archive計画」につきましては、ここ/.-jpでも2002年9月の時点で既報(ストーリー:「国会図書館が .jpなウェブを全部保存する計画」)です。ですのでもうとっくに始まっているもんだと思っていたのですが、まだ始まっていなかったんですね。しかも実際の着手は、記事によればまだ一年以上先とのこと。このままずるずる延びていつの間にかうやむや、とは流石にならないと思いますが……。
なおタレコミ時点では、この件についての国立国会図書館のウェブサイトでの公式発表はまだ確認できていません。"

この議論は賞味期限が過ぎたので、保存されている。 新たにコメントを書くことはできない。
表示オプション しきい値:
  • Anonymous Coward : 2004年12月07日 21時46分 (#662928)
    ホームページ収集許諾だかなんだかで、 書類が送られてきて、判子を押して返事したのが、 2年前の事だったと思います。
  • 収録されたくないとか (スコア:2, すばらしい洞察)

    Xegnyph (9041) : 2004年12月08日 0時17分 (#663011) 日記
    言う人も出てくるんだろうな。
    Webページを公開しているという時点で、どっかの誰かが勝手に記録することに対しては文句を言えないんじゃないかと思うけど。
    それでもやっぱり「収録拒否」とか言う人も出てくるんだろうなぁ。

    #収録するのは勝手にすりゃいいと思うけど、それを第三者に公開するのは、どうなんだろう?
    #微妙なの?よくわからん。

    私なんぞはろくなページも作っていないので、収録されるもされないもほとんどどうでも良いのですけどね。
    --

    bye
    ATZ
    • 本家でも (スコア:2, 興味深い)

      GruenerSalon (25255) : 2004年12月08日 2時43分 (#663081)

      オリジナル(?)の The Wayback Machine [archive.org] では、
      最近、アーカイヴされていたサイトのページが裁判の際に有効な
      証拠として認定されたそうで、これを機に、企業を中心に 
      The Wayback Machine に収録されたサイトの削除をもとめる
      動きがでるのではないか、と懸念されてます。
      (これってタレコまれてたっけ? 念のため、参考記事 [stanford.edu]。)

      アーカイブの信頼性が認められることによって、ミッションの遂行が
      困難になるという逆説。

    • 2個のコメント が現在のしきい値以下です。
  • 全部保存 (スコア:2, すばらしい洞察)

    lunatic_sparc (15416) : 2004年12月08日 0時56分 (#663038)
    こないだのNTT西の個人情報丸見え、ってのも保存対象になってたら楽しそう。♪
  • タレコミ文のNIKKEIの記事によれば、データベースの更新は一年に一回みたいですね。

    > 随時更新などによりデータが消滅していることを懸念

    してるにも関わらず、

    > 毎年1月から3カ月程度かけて、その時点の内容を読み取る

    ことしかしない、というのは、矛盾してる気がするなぁ。
    特にコンピュータ系の、技術文書(とか解説サイト)は、
    年に何度もバージョンアップなどに応じて更新されると
    思われるので、一年前のページを閲覧できたからって
    得るものは少ないような。

    # 一年前は、それはひどいHTMLを書いていたのでID。
    # そして収集され始める頃にはもう学校にはいない…ハズ。
    --
    Your 金銭的 potential. Our passion - Micro$oft

    Tsukitomo(月友)
  • aquaforest (17246) : 2004年12月07日 23時53分 (#662993)
    日本語サイト全般まで範囲を広めて欲しいですね

    でないと、全然意味のないタダの税金の無駄遣いにしか思えないかも。
    でも、*.jpって言うことは、下層まできっちり保存するのかな?
    ウェブアーカイブと差別化を図って欲しいところです。
    --


    #きっと、可能性っていうのはその辺に落ちているんだけど
    #気がつかない物じゃないかなと思う。
  • google並みのロボット検索エンジンをひとつ作っておいて、
    キャッシュのスナップショットを保存すれば良いのではないかな。

    それとも、納本制度にする?

    民間のWebページがアップロードされたときは、文化財の蓄積及びその利用に資するため、公開者は、アップロードの日から30日以内に、最良版の完全なもの1ページを国立国会図書館に納入しなければならない…
  • 日本語も含むどんなドメインでも探せるし,通常の用途ではそれで 十分かと。
  • 「本字業の紹介(WARP)」 [ndl.go.jp]には、登録までの仕組みが推薦(自薦・他薦)->収集許諾依頼文書->自動収集ソフトウェア(ロボット)にて 収集なんて書いてありますね。
  • urabe (14966) : 2004年12月08日 10時54分 (#663192)
    ヤフージャパンに委託してみても良いのではと思います。

    ヤフージャパンに登録されているサイト対象にすればの話ですが、
    ・サイトのトップページに関しては晒すことが前提のはず
    ・ビジネスエクスプレスと言うのがあるにせよ、有用性とか独創性とかが審査されている
    ・登録されているのだからjp以外のドメインでも拾える

    おまけの効能として
    ・明らかに有用性がないサイトは最初っからアーカイブの対象外
    ・ヤフーに登録してあってもサイトが無くなっている場合のチェックもできる
    ・ついでにアダルトサイトとかに変身しているサイトのチェックもできる

    弊害は
    ・1つの企業の方針で登録されているサイトのアーカイブになってしまう
    ・有用でも登録されていないサイトはアーカイブされない
    ・金払えば、アーカイブされるような錯覚を起こす
    ・ヤフーの経営者が嫌いな人には良い顔されない


    他にも色々ありそう。
  • 3個のコメント が現在のしきい値以下です。