slashdot.jpも対象外部門より。
匿名の臆病者曰く、"国立国会図書館は、「インターネットが今や国民の知的活動の所産を記録し、公表、流通させる重要な媒体となっている」ことをふまえて、インターネット上のウェブサイトの網羅的な収集を検討していましたが、「全部集めて、全部公開する」という当初の方針が、jpドメインのうち、go、lg、ac、ed、orのセカンドレベルドメインを持つサイトのみを対象とするというものに方針転換されました(朝日新聞の記事)。
現在、国立国会図書館への納本の対象となっている出版物は、図書、小冊子、逐次刊行物、楽譜、地図、パッケージ系電子出版物などで、国会図書館法によって、国の諸機関、地方公共団体、独立行政法人等の出版物はその全てを納入する事に決められています。今回の対象は、ほぼこの範疇にあたるものです。" (つづく)
[追記] 「インターネット情報の収集・利用に関する制度化の考え方」(改訂版)には、「orドメインであっても、個人サイトを多く含むネットワークサービスは対象外とします」とある。
"民間の出版物の場合は、「文化財の蓄積及びその利用に資するため」、発行の日から30日以内に納本することになっていて、正当な理由なく納入をしなかったときは、その出版物の小売価額の5倍に相当する金額以下の過料がありえます(納本された媒体の費用と納本にかかった費用は、申請によって支払われます)。(参考:納本制度とは-国立国会図書館、 納本制度Q&A-国立国会図書館)
WEB上の情報を「全部集めて、全部公開する」ことに関しては、法務省や音楽、出版、ソフトウエア関連団体などが、著作権やプライバシーを侵害しているものが存在している点を指摘し、当初から反対を表明していましたが、現時点でjpドメインがついているサイト約9000万(ファイル数)の8割近くを占めている「個人(民間)」の分の収集については、今回の国会図書館法の改正案では見送られるそうです。
現在、国立国会図書館のWEBサイトには、インターネット情報の収集・利用に関する制度化の考え方について意見募集の結果についてという情報が掲載されています。
国立国会図書館では、平成17年4月14日から同4月27日まで、インターネット情報の収集・利用に関する制度化の考え方について意見募集を行いました。その結果、11件の御意見をいただきました。御協力ありがとうございました。
また、「ネットには当時の人々の動きや考えが膨大な情報として載っている。すべて残したいが、理解が得られるところから始めたい」、という国立国会図書館企画課としてのコメントも発表されています。
総務省が6月28日に公開した2005年の「情報通信に関する現状報告」(情報通信白書)によると、2004年末のインターネット人口は7948万人で、全人口の62.3%。ブロードバンド利用世帯は62%に達しています。ネットの効用として最も多く挙がったのが「生活に役だった」、「趣味が広がり、深まった」、「知識や能力が向上した」です。「ネットの効用」を感じさせてくれた多くの部分が、WEB上のファイル数の8割近くを占めている「個人(民間)」に負うものだった、と考えるのは妥当なところではないでしょうか。
WEBは、個人に印刷所、放送局、流通網、販売網を与えますが、「自分が何をしているのか」、「自分が提供している情報がその後どのように扱われているのか」という自覚が、それを利用している個人の側にも、そろそろきちんとした形で必要になっている、ということを考えさせられるような話です。"
過去の関連ストーリーとしては、「国会図書館が .jpなウェブを全部保存する計画」、「"Internet Archive 日本版"? 平成国立ネット図書館計画発表」、「日本版Internet Archiveは2006年から」がある。
中の人の意志に反して圧力が (スコア:5, すばらしい洞察)
1)「.jpドメイン」を持つウェブサイト
2) JPNIC管轄のIPアドレス
3) JPNICによってDNS逆引き管理されているIPアドレス
が対象となっています。当時もいくつかのブログで取り上げられていて、その中では歓迎する意見もおおかったのですが、著作権管理団体や新聞社、雑誌協会あたりが今回強硬に反対したのでしょう。特に文化庁などからの天下りのこともあって、結局は彼らの意見に従わざるを得ないというのが現状のようです。
こんな中途半端なことをやるなら、やらない方がまだましだとおもいます。だいたい go.jp や lg.jp で発信されるものなんて、国立国会図書館からのクロールじゃなくて現状の納本制度と同じ枠組みで納めさせればいいだけなんですよ。
次の世代のひとたちがこうやって保存された情報を見て、うれしいんでしょうかね?本当に巷の人々の文化を後世に伝えるという主旨からはほど遠いような気がします。だいたい、公文書的なものしか集めないなら、国会図書館の存在意義なんて無いんですよ。国立公文書館ってのがあるんですから。それこそ予算の無駄遣いです。
立派な箱物と、そこそこの技術(中の人には失礼!)と、大量の予算と、潤沢な(過剰な?)人員はあると思われるので、あとは馬鹿な議員のいいなりにならなけりゃならない点を何とかすれば、意義ある税金の使い方になるのになぁ。
同館による「電子図書館中期計画2004 [ndl.go.jp]」では「NDLウェブ・アーカイブ(仮称)インターネット上のウェブ情報は、可能な限り、発信時と同様な構造をもったウェブ・アーカイブとしてサイト単位に収集し、時系列的認識が可能な形で蓄積・保存・提供する。 」とありますし、上に挙げた調査も実際に行われいるわけで(僕が管理しているWebサーバにもクローラが来ました)、「さ~準備ができた、集めよう!」とおもったら上から待ったがかかった、ってことなのかな?議員先生&利権団体お得意の、「当たり障り無いように総論賛成、土壇場で各論反対」がまたしても出たか、という感じです。
「著作権が・・・」「有害情報が・・・・」なんてことで文化的価値がある「かもしれない」情報を保存しないなんてことやってて、国会図書館の理念が実現できるのかなぁ。僕が住んでる自治体でもタイムカプセルを埋めようなんてことをやってて、入れるものの候補を募集してたりしますが、市幹部の最終判断によって100年後にタイムカプセルを開けてみたら市報しか入ってなかった、なんてことになったらつまんないとおもうんですよ。
ペーストビン [windy.cx]
coが抜けたのは (スコア:2, おもしろおかしい)
go、lg、ac、ed、or限定 (スコア:1)
「愛」も「萌え」も定義は広い。 押井徳馬(・(T)・)
Re:go、lg、ac、ed、or限定 (スコア:2)
国立国会図書館の「インターネット情報の収集・利用に関する制度化の考え方」(改訂版) [ndl.go.jp]には、「orドメインであっても、個人サイトを多く含むネットワークサービスは対象外とします」とありますので、or.jpドメインのプロバイダも除外されるのではないでしょうか。
親コメント
Re:go、lg、ac、ed、or限定 (スコア:2)
親コメント
Re:go、lg、ac、ed、or限定 (スコア:2, 興味深い)
そーいやmetroやprefやcityな地域ドメインは収集対象にならないのでしょうか。
親コメント
ネ研 (スコア:1)
それなら、ま、いっか。
パンが無いなら作ればいいのに
アレゲなページを後世に残すには (スコア:1)
違法なものが混ざっているから集めない (スコア:1)
今では違法となってしまった本も所蔵しているのに、
WWW だと集めないというのは滑稽です。
TomOne
Re:違法なものが混ざっているから集めない (スコア:2, 参考になる)
そうですね.データの収集はするが一般公開はせず,研究者等に限って公開するとか,国会図書館内での閲覧のみとするという次善(三善くらいか?)の策もあったはずです.その上でより広い範囲への公開方法を模索していく,という方法もありますよね.ひょっとすると,jp ドメインの全ページを収集するだけのシステム構築をする予算がひねり出せそうもない,というのが本当の理由だったりして,と邪推したくなります.
今回のシステムの目的とはややずれるかも知れませんが,網羅的に収集していれば,「有害な」情報を掲載していたり著作権を侵害しているページ数の推移といった調査も,(原理的には)可能になるはずなのに……そのような調査からある種の政策の効果を判定したり,政策立案の参考にするというのは公益に適うと思うんですがね.
親コメント
誰だ?反対意見を提出したの? (スコア:1)
とりあえずクレームを付ける。
>照会先: 国立国会図書館総務部企画課企画係
> ファクシミリ電話番号:03‐3581‐0768
ここにFAXすれば届くだろうし。
文化財であるなら100年、200年先のことを考えて
収集すべきである。著作権とか個人情報とか些末な
ことはおいておいて、可能な限り全部収集すべきだろう。
たかが11件の意見。一応 民主国家を標榜しているので
多数意見が集まれば変わるかな?
やなぎ
字面じゃなく論旨を読もう。モデレートはそれからだ
企業では (スコア:3, すばらしい洞察)
古い製品などのサイトは簡単に潰す企業ですが、そのサイトの(画像や文章などの)権利を絶対に手放そうとはしないし、その上古い情報に、自分たちに不利になる情報が残される可能性があるとなれば……。
いつでも消せる、いつでも改竄できるのがWeb情報の利点。
「古い情報がない」といって困る利用者がいたとしても、会社にとっては大した問題ではない。
親コメント
是非 (スコア:1, おもしろおかしい)
# もうないって
Re:保存してほしい場合 (スコア:1)
親コメント
もともとはそうだったらしい・・・ (スコア:1, 参考になる)
立法機関だけに議員さんにはめっぽう弱いみたいです。
親コメント
復元への壁(Re:保存してほしい場合) (スコア:2, 参考になる)
の4に、
>閲覧及び印刷出力を想定します。ダウンロードは不可とします。
ということなので、
個人が個人のサイトを復元するには、スキャナが必須になりそうな予感。
仮にHTML(など)を紙に出力できても、
一から再入力するよりは、文字認識で楽をしたい規模になるだろうし。
# デジカメでスナップショットを持ち帰るのはデジタル万引きといわれそうだ。
親コメント
Re:あいかわらず (スコア:1, 参考になる)
国会図書館法を改正すると書いてあるので、日本の法律が及ぶであろう範囲では
無断複製にはならない(ならなくなる)ということでしょう。
親コメント
Re:あいかわらず (スコア:1)
親コメント
Re:貴殿にそれを言う資格はあるのか…。 (スコア:1)
asahi.comには、jpドメインで9000万ページって書いてありますけど、Googleはbillion単位で保管してるっぽいし、国会図書館の場合、毎秒いくらの検索もかからないわけで。。。べらぼーな金ださなくても、出来ると思いますが。
だけど、ウェブは本みたいに、この文書は出されて終わりってわけでなく(改訂はありますが)、変わりすぎるので、どうやって、保管するかが問題ですが。
親コメント
Re:保存してほしい場合 (スコア:1)
自分の生きた証(ただしアレゲ)が未来永劫、国会図書館に
残るというのはなかなかそそられるものがあります。
ただ、若気の至りには注意しなきゃならないけど。
親コメント
商業誌と同人誌 (スコア:1)
ということは、
- go、lg、ac、ed、orのセカンドレベルドメインを持つサイト=商業誌
- 個人が持つホームページ=同人誌
ということになるのですかね。『月面兎兵器ミーナ』2007年1月13日から放送開始
親コメント