国会図書館が.jpなウェブを全部保存する計画 81
ストーリー by Oliver
是非とも広く一般公開 部門より
是非とも広く一般公開 部門より
sora曰く、"朝日新聞によると、国会図書館がウェブ上の情報を収集するようになるようだ。記事を素直に読めば、jp ドメインのページを全て収集するのがひとまずの目標らしい。The Internet Archive の jp ドメインオンリー版といったところだろうか。
しかし、いわゆる個人サイトも対象とするならば、それは出版で言うならば同人誌やミニコミ誌にあたるもので、それは国会図書館への『納本』の対象になるのか? という問題もある。また、日本人が日本人向けに運営しているサイトで com ドメインや net ドメイン、to ドメイン等他国のドメインを用いて運営しているものも多くある。そういったサイトへの対応はどうするつもりなのだろうか……"
リンクのお願いメール (スコア:3, 参考になる)
さらに返信時にの記入フォームがまた桁外れに長く、 データベースのURLに始まって作成者・公開日・60字程度の内容説明・連絡先住所・電話番号など入力項目は17もあります。 さすが国会図書館です。
データベース御担当者殿
データベースへのリンク等についてのお願い
国立国会図書館では、電子図書館事業の一つとして、平成14年10月の国立国会図書館
関西館開館にあわせて、インターネット上の各種データベース・サイトを案内する「国立
国会図書館データベース・ナビゲーション・サービス」を計画しております。(この事業に
ついての詳細は、国立国会図書館ホームページ を御参照ください。)
つきましては、本サービスの趣旨に御理解を賜り、貴機関/貴殿が提供されている
データベース「XXXXXXXXXX 」 にリンクを設けさせていただ
きますとともに、貴データベースに関する情報を御提供くださいますようお願い申し上げ
ます。
御多用中誠に恐縮ですが、下記の<返信フォーム>に御記入の上、平成14年09月11日(水)
までに、メールにて御返信願えれば幸いです。
今後、サーバの入れ替えやホームページの更新等データベースのURLが変更された場合、
またデータベースの名称や御連絡先に訂正・変更があった場合は、その都度メールにて御連
絡いただければ適宜修正いたします。また新規データベースが公開される場合や他のデー
タベースが存在する場合も、御一報いただければありがたく存じます。
なお依頼メールは、データベース毎に送付しております。お手数ですが、個別に御返信
願います。
責任者以外の方にこのメールをお送りした場合には、御面倒でも責任者の方に御転送く
ださいますようお願い申し上げます。
国立国会図書館 関西館 事業部 電子図書館課 ネットワーク情報係
担当:XX XX
メールアドレス: xxx@xxxx.xx.xx
(返信フォーム記入方法)
○各々の項目について御確認をお願いいたします。一部の項目につきましては、あらかじ
め情報を作成させていただいておりますが、誤りや不適切な部分がございましたら、お手
数ですが、修正をお願いいたします。以下の≪データベースに関する情報≫の内容につき
ましてはインターネット上で各項目の検索を可能とさせていただきます。なお、編集上の
都合で修正させていただく場合がございます。
【ご注意】半角カナは使用できません。
(返信フォーム)
返信先: xxxx@xx.xx
・
・
・
Re:リンクのお願いメール (スコア:1, おもしろおかしい)
それよりも、公開日なんて覚えてません。
日本人向け≠.jp (スコア:2, 興味深い)
例えば「2ちゃんねるを jp ドメインではない」という理由で外すと
情報の蓄積と言う点では問題ありと考えられるし。
かと言って「2ちゃんねるをアーカイブするのに税金が使われる」と
考えると,一寸複雑な気がしなくも無い(苦笑)
まぁ,私自身は2ちゃんねる偶に見に行くくらいなので尚更ね(^_^;
このタレコミ,私もやって落とされたクチです。
で,その中タレコミ文中でも一寸書いたんだけど
jpドメイン記録って事はスラドも対象になるって事ですわな。
後の世にフレーム見られるの一寸イヤンかも。みんな自重しませう(笑)
Re:日本人向け≠.jp (スコア:1)
人類が滅んでないとしてですけれども(w
しかし毎月4TBづつ増えるとして、いつでもアクセスできるようにするには、
どれくらい電気代かかるんでしょうか?
残せるものは恥ずかしい写真でも残せっ(爆言)! (スコア:2, おもしろおかしい)
聞いた話じゃCD-Rみたいな熱変化で記録する媒体は3~5年
MOなんかの光磁気ディスク関係は7~8年
磁気テープでも10年かそこいら
FD(みたいな低密度磁気媒体)だと15年かそこら
磁気記録媒体だと地磁気の影響で消磁するとかしないとか?
いっそのこと和紙 [edogawa-u.ac.jp]の紙パンチテープで1000年残して見る?
# 爆言のち漏電中… :D
Re:残せるものは恥ずかしい写真でも残せっ(爆言)! (スコア:1)
Re:残せるものは恥ずかしい写真でも残せっ(爆言)! (スコア:1)
Re:残せるものは恥ずかしい写真でも残せっ(爆言)! (スコア:1)
#初めなる神はLILOと呼ばれていた。世を統べる神KERNELを
#記憶世界HDDより呼び出し統治権を引き渡すと、お隠れになった。
Re:残せるものは恥ずかしい写真でも残せっ(爆言)! (スコア:1)
#アーカイブしたという既成事実さえできれば、実際には見返さ(せ)ないだろうから大丈夫(笑)
タブレット中毒者。
Re:日本人向け≠.jp (スコア:1)
コンピューターやソフトウェアでデータを素早く検索できても、それを利用するのは人な訳で、
そんなに集めても読む・見る時間ないんじゃないかと思ったり。
それとも未来はコンピューターが利用するのかな。
Re:日本人向け≠.jp (スコア:1, すばらしい洞察)
「担当者がトラブルは絶対起きないと言っているから、トラブルの心配はない」
「.jpのページを集めれば、日本のページは集まる」
………
なんかこう、何も考えない、調査も検証もしないでああしよう、こうすればいい、こんな計画はどうだなんてのが多くないですか? いかにも安直に、2を作るためには1と1を足せばいいんだ、みたいな。
こんな物事の進め方をしているようじゃ、何故国の借金が増えるばかりなのか、縦割り業務が改善されないのか等々、税金消費組織のやることなすこと全てがまともに機能しないのか何となく解るような気がします。
私らにできることは一体なんでしょうねえ…。技術者の立場で指導しようにも、彼らは実より名を優先しますからねえ。
www.nifty.com (スコア:1, すばらしい洞察)
小さいのは沢山あるでしょうけど、大物でも探すと他にもありそう。
Re:www.nifty.com (スコア:2, すばらしい洞察)
これがあったから朝日新聞はasahi.comなんだ!(勘違)
なんくるないさぁ〜♪
Re:www.nifty.com (スコア:1)
Re:日本人向け≠.jp (スコア:0)
archive.org じゃダメなんでしょうか・・・
しかもドメインだけじゃ(日本人向けか、という)内容まで分からないってのに。
#県知事選挙に行くのでAC
Re:日本人向け≠.jp (スコア:3, すばらしい洞察)
保存されています。そりゃもー100部も出ないような小規模な本から漫画雑誌まで。
で、そーゆーのも「無駄なこと」だと思いますか? 思わないのなら流通形態が違うだけのコンテンツをいかに保存するかについて無駄と無駄でないという線引きをどうやってきめるべきですか?
今回の保存にかかる範囲設定には疑問視するべき点はありますが
日々現れては失われていくコンテンツを保存することに意義がないとは
思えません
archive.org? 将来的に何の保証があるわけでもないのに他人任せにしてどーするよ。
蔵書 (スコア:3, 参考になる)
国会図書館は普通に出版されてない書籍も保存してくれます。 例えば、 すらっしゅぼっと じゃぽん みたいなものだって印刷して送りつければ蔵書として保存してくれます。国会図書館は資料を後世に残すための設備なので大事に保存してくれますよ。
Re:蔵書 (スコア:2, 参考になる)
国会図書館の納本制度の解説 [ndl.go.jp]とか。
Re:日本人向け≠.jp (スコア:1)
で、そーゆーのも「無駄なこと」だと思いますか? 思わないのなら流通形態が違うだけのコンテンツをいかに保存するかについて無駄と無駄でないという線引きをどうやってきめるべきですか?
「いままでそうだったから今後も同じ方針」という考え方を適用するとして、
現在、国会図書館が保存している書籍を保存することが「無駄でない」という前提で考えると、
書籍の場合、作者は個人だけど、発行人は出版社の代表。
ウェブページの場合、作者は個人だけど、発行人はプロバイダ(企業)の代表。
ってことで、個人ページも保存すべきなんですかね。
(なんかもっと適切な対応表が欲しいところだけど)
しかしまぁ、日本人向けのページかどうかっていうのは関係ない気がしますね。
日本在住の英語圏の方に向けた書籍や雑誌も日本で発行されていることもあることでしょうし。
「日本人(日本の企業)以外は.jp取ってないし、日本人(日本の企業)は.com取ってない」という前提をしょうがないけど受け入れれば、.jpだけすべて保存することは悪い気がしません。
# 現実問題として、そんなわけないから中途半端な保存なんてしてくれなくたっていいんだけど。
Re:日本人向け≠.jp (スコア:1)
基本的に初版本なのだろうか?増刷されたからといって、その都度納本してませんよね。
しかし、版によって修正されている本ってあるだろうし。
Re:国会図書館での書籍の保存(オフトピ) (スコア:1, 参考になる)
以外は入ってないらしい。
「納本を怠った際の罰則」もあるようだが、そもそも適用されたことがあるのかどうか知らん。
なお、メイントピックについては、「今更だけども、頑張ってね」と言うのが正直なところ。
落とし所としてはこんなもんだろうし、このために別事業体作られたりするよりは余程マシ。それに、今ならもう先行事例を検討対象にできるからお役所的にも通りがよい…
# ヤバいのでAC。
Re:国会図書館での書籍の保存(オフトピ) (スコア:2, 参考になる)
いえ、私が国会図書館に行って確かめたわけではありませんが、「アニメック」の編集長が私に面と向かってそういったのだから間違いないです。彼は確か献本しなくても罰則はないと言ってましたが、祖母コメント(っていうかなぁ…これの親の親コメントね)のリンクをたどって国会図書館のページを見ると罰則はあるようですね。笑っちゃうような額だけど。
うろ覚えですが、アメリカの場合は連邦議会図書館に献本しないと図書コードを振ってもらえない仕組みになっているので、普通のルートで流通させようとする本は必ず献本が集まるようになっているのだそうです。
あぁ、「ン」が消えてるんですよ。「ビーフン・カレー」ね。
Re:国会図書館での書籍の保存(オフトピ) (スコア:1)
2段落目を s/「アニメック」/その雑誌/ してください。
# って、もう遅いよ > 自分
あぁ、「ン」が消えてるんですよ。「ビーフン・カレー」ね。
Re:日本人向け≠.jp (スコア:1)
#私が某資料調査をやっていた頃 (10年くらい前)「Z室」(今は違う部屋になっているかもしれないけど) の本の収集状況ぼろぼろでした。小判講談雑誌なんて 1% も残ってません。普通の雑誌だと大宅文庫、という手もあるけど、こういうのは他に換えがないから困る。
えー。 (スコア:2, すばらしい洞察)
こんなことは物理的に可能なのかスラッシュドッターに
計算してみてほしいのだが。
数台程度のハードディスクでは書き込み速度でさえ、
ネットの日々の情報を記録するには間に合わないのでは。
容量が足りないのは当然ですが。
robots (スコア:1)
robots.txt
とか
<META NAME="robots" CONTENT="NOINDEX,NOFOLLOW">
を無視しちゃうんでしょうかねぇ。
Re:robots (スコア:1)
での保存と思われていますが、国の機関のやること。
そんな当たり前の方法が採られるワケがありません。
詰め所にアーカイブ職員が数十人体制でIEでブラウズ
しては内容を吟味、分類しては「名前を付けて保存」
をしていくのです。
従って、robots.txt や META タグなんていちいち
参照していられません。
#ガセネタなのでAC…にしようと思ったけどACにしない主義なのでそのまま
Re:robots (スコア:0)
検索エンジンに索引化されたくない場合として、適度にクローズドなサイトを作りたいという欲求があると思いますが、こ
エロサイトもかなあ (スコア:1)
がんばれ国会図書館。
Re:エロサイトもかなあ (スコア:1)
#以下自粛
エロ本も (スコア:1)
国会図書館。
裏はないでしょうけど。
あのぅ (スコア:1)
うすっぺらいコメントがあらわれた! ▼
待てよ (スコア:1)
だとしたら、顧客データを外部から見える場所に置きっぱなしにした企業のサイトに悪意でリンクをはられたら、そのデータが国会図書館に保存されることになるの?
Re:待てよ (スコア:1)
保存の対象となるのが自然でしょう。
公開したくない情報はイントラネット内に置くべき。
収集の容量 (スコア:1)
図書として保存するなら、ページの全文がその対象になるんだろうなぁ。
※検索エンジンの場合は、適当に千切っても平気だと思うけど。
一見普通の URI に見えて、実はプログラムが動いている (/. もそうだけど) ようなサイトは図書に当たるのかなぁ?
で、どんな URI がアクセスされても、必ず巨大なデータを出力するようにサイトを構築すると、あっという間に国会図書館の記憶領域がいっぱいになるような気が…。
あ、でも国会図書館の予算って事は、そんな庶民の考えは無駄なんでしょうね。
Re:収集の容量 (スコア:1)
へそまがり… (スコア:1)
納本制度により、出版物の発行者らに書籍などの納入を義務づけ
#国会図書館に届け出をしないと、jpが使えない事態になったらお笑いっすね。
Re:へそまがり… (スコア:1)
プロバイダのスペースで公開するにも国会図書館への申請書を提出しなきゃダメになるのか。
今みたいに申し込んだら即公開ってワケには行かなくなりますね(ぉ
# それとも注意書きに『自動的に国会図書館に登録されます』とか書かれるのか?
とりあえず (スコア:1)
ここから、.jp関係のデータを全部買い取るところからスタートですね。
国が事業として検索サービス開始? (スコア:0)
整理されていないと意味がないので、インデックス作って
検索できるようにしてみました。
これって、googleとかといっしょだよね?
まさか、国民がその検索サービス使うのに料金聴取ってことは
ないと思うが。
# 的外れかも知れないのでAC
Re:国が事業として検索サービス開始? (スコア:1)
>これって、googleとかといっしょだよね?
検索サービスつきかどうかは別として(単に保存閲覧だけに注目して)も同じこととして、
既存と同じ仕事(^^;であっても「お役所」ベースであると何か特別な価値なものになる、
という神話(ぷ)が、日本には有るらしいという恒例の話かも知れないなと思います。
FREEソフトと同じで、企業や個人では記録の永続性が「あてにならない」という意味では、
国がやってくれるのも悪くないなとは思いますが、裏返していえば、
国(によるそのサービス)の永続性もまた「あてになる」のかどうかが心配です。
神話性はともかく、こないだNHK教育でやってた日本人論論(メタ論)っぽい番組でも少し言っていましたが、
日本人は、タテの繋がりを重んじる一方で、ヨコの繋がりは重んじない傾向があるらしく、
たとえば企業と役所が同時に同じことをやっちゃうという無駄が頻繁に見られるのもソレなんだそうで。
そりゃそうと、
>内容による選別は避け、知的活動の総体を記録するべきだ
という言い回しが有るという点(だけ)はホっとしました。
あと、Googleにも有るキャッシュ拒絶機能(^^;みたいに、「保存されたくない」ニーズは、
どれくらい満たされるんでしょうね?
個人的には保存されない自由というものはあまり好きじゃない(世間様に一度さらしたものを引っ込めるのは変だと思う)
んで、そんな機能は無くてもいいと思っているんですが…
>(3)頻繁に更新される情報をどの時点で残すのが適切か
CVS(^^; 地上最大のリポジトリの出現っすかね。
まあなんにせよ、保存するってことはトラフィックが凄いことになりそうですけどね。
検索エンジンと国会図書館からのアクセスは却下するようなヘッダを書いておくとか(ぉ
Re:国が事業として検索サービス開始? (スコア:1)
# /robots.txtもDateも見ないで、毎週一回CDイメージを持って行くのはやめて欲すぃ>某隣国の検索サイト
# 回線は余裕なんだがサーバがショボいんだよぉ・・・
Re:国が事業として検索サービス開始? (スコア:0)
公開してある物を取得して、保存しておく自由は無いのですかね?
著作権者の指示に従って削除すべきなんでしょうか?
>保存するってことはトラフィックが凄いことになりそうですけどね。
従来の検索エンジンと、この辺何か違うんでしょうか?
というか、負荷はアチラの実装次第かと。
Re:無差別保存? (スコア:1)
と言うことは……
ネットカフェなどでHoops等の無料Webスペースを借りる。
↓
自分自身を誹謗中傷するホームページを開設。
↓
国会図書館がこれを保存。
↓
損害賠償を求め、国を相手取り民事で訴える
↓
多額の賠償金(゚д゚)ウマー
…というお金儲けしちゃっても(・∀・)イイ?
米国でビジネスモデル特許申請しても(・∀・)イイ?
# 「ブランコの乗り方」で特許がもらえる国だから、案外すんなり通ったりして(w
Re:無差別保存? (スコア:1)
Re:無差別保存? (スコア:1)
このネタの胆は「自作自演だとばれない匿名性の高さ」にあるので、
出版は無理かと……
Re:無差別保存? (スコア:1)
普通に考えて、金を払わないと閲覧できないようなページは、収集されないでしょう。
Re:無差別保存? (スコア:1)
本来、有料で購入するべき書籍を保管し、閲覧させているのが図書館だと思うのですが。。。
その延長線で考えるなら、有料サイトであろうと、保管し閲覧させるのが筋ではないかと。
俺は、どっちかというと、こう考える方が、普通だと思うのですが、Webサイトだと有料は除外とする方が普通というのは、どういう発想に基づいているのだろう?
written by こうふう
Re:要するに (スコア:1)
それはそうでしょうけれど、他国との利害関係を考えるとなかなか難しい点もあるかと。
例えば近ごろ話題の『ディープリンクを禁止している』海外の官庁サイト内のページにリンクがあった場合。
悪い言い方ですが個人ならなんとか(なんとでも)なります。
ですが、さすがに国家の機関が行うコトとなると……ねぇ。
申告制にして、外部へのリンクについてはその都度検討するというのが無難なんでしょうね。
Re:えー (スコア:1)
他の研究者には、無駄だなどと馬鹿にされつつ、いろいろなフォントで表示させてみたら、絵になっていたとか。
# 語り部 「そんなことより>>1よ、聞いてくれ。スレとは関係ないんだけどさ…」
タブレット中毒者。