パスワードを忘れた? アカウント作成
13350 story
Google

Google、200年の時を駆ける 41

ストーリー by mhatta
時をかけるギーク 部門より

Sakura Avalon曰く、"Internet Watchの記事によると、Googleが過去200年におよぶ新聞・雑誌記事検索の機能「Google News Archive Search」を公開したとの事です。

現状ではまだ英語といくつかの言語が中心で特にアジア圏の言語には対応できていないようですが、それでもじゅうぶんに面白くまた色んな方面で役にも立ちそうです。「Jack the Ripper」として切り裂きジャックの当時の生々しい記述を閲覧したり「london international exhibitions 1851」と検索してクリスタル・パレス(水晶宮)の話があったりとそれだけでも興味深いですが、真価を発揮するのはむしろ後年の書籍やWebにあまり書かれる事もない「(当時としては)日常的な事件」あたりの記事かもしれません。ちなみにアレゲな方面もと思って「ENIAC」で検索してみると、キッチリ1946年のTIME誌やオハイオのLima News(地方紙?)の記事が出てきます。

私は歴史などの専門ではないため、むしろ文芸方面に現実の事件や世相などをからめて検索する事が多いです。海外では図書館の縦断検索なども充実しつつあるようですが、日本では新聞社や会社単独での検索サービス以外では出遅れている感があります。なので日本でも各社を縦断的に検索できるサービスが登場してくれないだろうかと思いつつ、まずは先んじたGoogleに頑張ってもらって機能充実を期待したいです。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 世界的な事件 (スコア:3, 参考になる)

    by Anonymous Coward on 2006年09月08日 21時37分 (#1014865)
  • by johntheripper (21505) on 2006年09月08日 21時02分 (#1014842)
    ジャズの話題とかJack the Ripperとかで検索してみたんですが最後は結局有料サイトになって金払わなくてはならないはめになるようですね。

    チャーリーパーカーが死んだときって新聞に出たんだろうかが気になる。

    #そういう私は john the ripper
  • by crayfish (9255) on 2006年09月08日 21時32分 (#1014859)
    >日本でも各社を縦断的に検索できるサービスが登場してくれないだろうか

    G-Search [g-search.or.jp]では不足ですか? まぁ、有料ではありますが、個人でたまに使う分にはそう高いとも思いません。


    • by Anonymous Coward on 2006年09月09日 1時06分 (#1015023)
      個人的には逆の印象で、個人でたまにしか使わないサービスに
      年会費1,000円を払うのはちょっと抵抗があります。
      高いかどうかで言えば安いのですが、あくまで気分的な問題として。

      逆に、もし「ウェブマネー対応で検索1回につき100円」とかなら
      喜んで年10回以上は使うと思います。

      # ケータイでも月額サイトより買い切り対応サイトが好きなAC
      親コメント
    • こういうサービス、公共図書館で使えるとうれしいんだけどね。

      うちの市だとCD-ROM収録の新聞記事検索なんかすらないので、
      まずはそういうのでいいから始めてほしいんですが。
  • by Anonymous Coward on 2006年09月09日 10時37分 (#1015143)
    新聞とかTVとかで過去の報道を引用する場合、”当時は普通に使っていたけれど現在では不適切とされる表現”の部分を修整して使ってますよね。
    警察に連行される容疑者の映像を例にすると、昔は手錠まで映していましたが、その映像を引用する場合もボカシを入れていたりします。
    過去の新聞記事を引用する場合でも、現在では差別的表現とされる文言は他の言葉に置き換えて引用してたりしますし。
    表現の問題そのものを議論する際には敢えて元の素材のまま使ったりしますが、その場合でも注釈を入れるなどしています。
    過去の記録を生のまま提示するのではなく、現代の報道の基準に沿う形に加工しているわけです。

    ところが、検索結果として抽出された過去記事の場合、そういった加工が施されていないだろうと推察されます。
    もしそうだとすると、凄惨な犯行現場の写真やら、今の時代であれば当然秘匿されていたであろう個人情報やらも、生のまま出てくるわけです。

    後付の加工が施されていない過去データを、誰でもいつでも簡便に取得することができるとなると、報道メディアが敢えて再加工して流している意味は薄れてしまうわけで、ひいては現在のいわゆる自主規制というものにどれだけの意味や意義があるのかが問われるようになってくるのかな、と思います。

    海外の事例を知らないのですが、過去の報道記録を再利用する際は日本と同様に再加工しているのでしょうか。
    • >警察に連行される容疑者の映像を例にすると、昔は手錠まで映していましたが、その映像を引用する場合もボカシを入れていたりします。

      逆に修正や削除を加えることで余計な興味を抱かせてしまう弊害もあります。

      つい先日見たTV番組で、宴会の席でコーラ系とスポーツドリンク系のペットボトルが写り込んでいて、ボカシ修正が入っていました。

      私「なんだ、あの修正?」
      友「コカコーラとポカリじゃね?」
      私「スポンサーの商品じゃないからか? しかし不自然だよなあ。これじゃ逆効果だよ。すっげえ気になる」

      で、次のシーンではテーブルからそのペットボトルが無くなっていました。

      私「あ、取り除かれたw」
      私&友「www」

      ボカシさえ入っていなければ気にも留めなかったんですが。
      なんだか撮影の舞台裏を垣間見ました。番組制作のみなさん、結構苦労してそうですね。
      親コメント
    • by gigo (21150) on 2006年09月10日 15時27分 (#1015762)
      ところが、検索結果として抽出された過去記事の場合、そういった加工が施されていないだろうと推察されます。

      もし電子データがもとから存在するならそう言えるけど、これは昔の紙媒体のデータを電子化するという手が加わっています。Washington Postは本体をダウンロードする前に要約を見せていて、Newsarchive.comは画像pdfとそれをOCRで読み取ったデータを見せるようです。

      要約もOCRも人手じゃやってられない訳で、機械的にやるようにしていると思いますが、人手でやる時とは別のエラーが入りそうです。

      というか、データがあって初めてgoogleが検索を提供できるわけで、昔の新聞のデータをいっしょうけんめい電子化している新聞社が偉いんじゃないかと思います。瓦版も電子データを作れば検索できるようになるはずです。

      親コメント
    • by Anonymous Coward on 2006年09月09日 13時56分 (#1015211)
      >後付の加工が施されていない過去データを、誰でもいつでも簡便に取得することができるとなると、報道メディアが敢えて再加工して流している意味は薄れてしまうわけで、ひいては現在のいわゆる自主規制というものにどれだけの意味や意義があるのかが問われるようになってくるのかな、と思います。

      検索サイトで見るのと、TVや新聞に載せるのとは意味が違うと思います。
      検索サイトの場合、自分から探しに行くのですから、知りたい人が望んで見ている状態です、あまり問題は起きないでしょう。
      TVや新聞のようなマスメディアの場合、誰が見ているか判りません、中には見たくなかった人もいる可能性が高いのです。
      なので、メディアの自主規制は意味を失ったりしないと思います。
      親コメント
  • by Anonymous Coward on 2006年09月09日 16時40分 (#1015279)
    「ぐぐってトップに来たからほんとのことじゃね?」
    みたいな世相であることは、アレゲなひとであってもそれほど否定しないだろう。

    ところが、実際のところは、googleは政府の意向に沿って検閲 [impress.co.jp]を行っている。
    今度はそれが過去のできごとについても行われるようになったわけだ。
    我々は、彼らにとって都合のよい情報(古くは古事記など)を聞かされているのではないのだろうか?

    メディアリテラシ教育の充実が叫ばれる。
  • やっぱり大政奉還でしょ!
    • エマの時代のニュースを読みたいなぁと
      当時の社交界のことが分かったら楽しそうですね
      #タレコミ文のクリスタルパレスを読んで真っ先に思いついたのがこれでした
      親コメント
      • ごめんなさい。エマ→クリスタル・パレス→建設されたのは第一回ロンドン万博という思考の流れでちゃっかり検索してたのでした。という事で見事にネタはエマからです…。
        というかこの検索ができる前から、19世紀末~20世紀初頭のロンドン近辺の記事は普通のGoogle検索で探してたりします。あとmaid-servant関連も。

        昔の記事だとNewspaperARCHIVE.com [newspaperarchive.com]が出てくるのが多いですが、これの無料部分は紙面のOCRなので認識ミス多し!(紙面そのままは有料。)…でも、それを流し読みしながら普通の英文に自然に読み替えてしまっているあたり人間の認識力って凄いなとちょっと感心。携帯メールのギャル文字は読めないのに(笑)

        #本当は当時の広告なども見たいのですけどね。その意味では有料でも紙面スキャンやってるとこがあるのは助かります。
        親コメント
  • by Meth610 (31617) on 2006年09月09日 1時51分 (#1015038)
    Google Time Travelerとかいうものができたのかと思った。:-σ
    • >Google Time Travelerとかいうものができたのかと思った。:-σ

      タレコミ時はわざと「200年の時をかける」にしてたのですが、編集で漢字を付加されちゃいました。(部門名に使われてますが。)

      #Google「続Time Traveler」では、扉を開けると宇宙が見えます。(って書いても、意味通じない人が多いかも。ビデオ現存してませんし…。NHK少年ドラマシリーズネタです。)
      親コメント
  • 時代毎の (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2006年09月09日 2時03分 (#1015046)
    コーパス研究の元資料集めには使えそうですね。
    • 本人以外の方に一応、パロディーニュース専門サイトですからね!

      # Hot Wired Japanが無くなってから海外の情報に乏しいこの頃
  • 無題 (スコア:1, 興味深い)

    by Anonymous Coward on 2006年09月09日 15時02分 (#1015232)
    俺はかなり前に殺人を犯しているのだが、そういったのが見つかるとやばいです。刑務所から出ても粘着する人がたくさんいますから。
    • Re:無題 (スコア:1, 興味深い)

      by Anonymous Coward on 2006年09月10日 12時23分 (#1015672)
      私はでっち上げの「犯人」として掲載されている記事があります。ほんとに困ります。

      親コメント
  • typo? (スコア:1, 参考になる)

    by Anonymous Coward on 2006年09月11日 2時28分 (#1016061)
    >海外では図書館の縦断検索なども

     こういう場合は「横断検索」なのでは?

  • by Anonymous Coward on 2006年09月08日 21時45分 (#1014870)
    Japsで検索すると戦前のが出てきますね。
typodupeerror

一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy

読み込み中...