パスワードを忘れた? アカウント作成
6749 story

Amazon.comが書籍の全文検索サービス開始 32

ストーリー by yourCat
Webで立ち読み 部門より

MIYU曰く、"米Amazon.comが、販売している書籍を対象とする全文検索サービス「Search Inside the Book」を発表した (プレス・リリース日経BizTechの記事)。ネット上での書籍販売では、書籍の題名や著者名程度しか検索情報がなかったため、「それが果たして自分の必要とする本であるかどうかの判断が難しい」と言われていた。これに関し、今回のサービスでは書籍内の文章を検索して、発見されたキーワードを含む部分の“立ち読み”ができるようになっている。検索対象となるのは、190社以上の出版社の書籍12万冊以上、総ページ数は3,300万ページを超えるということだ。
一部ではサービスの悪用が懸念されているが、このような取り組みが広がってゆくことを希望する。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 過去ストーリー (スコア:2, 参考になる)

    by L.Nizah (7804) on 2003年10月24日 15時50分 (#420629)
  • ミステリーだと (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2003年10月24日 20時34分 (#420817)
    たとえば、あいまいな登場人物の名前しか記憶にない(あるいは人づてで聞いた)とき、それで検索したら

    「犯人はお前だ!」

    というところのテキストが出てきて、読む気(買う気)なくす、なんてありえないのかしら。
    • by G7 (3009) on 2003年10月25日 11時42分 (#421067)
      >読む気(買う気)なくす、なんてありえないのかしら。

      そのうち、「検索効率向上委員会」とか名乗る連中が、
      そういうデータが検索にひっかからないようにせねばならん!という
      主張をぶちあげはじめるわけですね。

      ああ、鬱陶しい。

      #批判の意味もこめてわざと(だよなあ)やっといた知人ページにも「文句」が来たらしい。
      #でもさ、ああいうものは「何を書くかは個人の(言論の)自由」だと思うんでG7
      親コメント
      • by kicchy (4711) on 2003年10月27日 16時04分 (#422023)
        >#批判の意味もこめてわざと(だよなあ)やっといた知人ページにも「文句」が来たらしい。
        >#でもさ、ああいうものは「何を書くかは個人の(言論の)自由」だと思うんでG7

        # 文句をいうのも自由かな、と思うのでID
        # やっぱ、見たらがっくり来るしねぇ
        親コメント
  • 辞書代わり (スコア:2, すばらしい洞察)

    by unchikun (14429) on 2003年10月24日 21時26分 (#420846)
    もしかして、辞書や百科事典を検索すると見せかけて、辞書代わりに使える?
  • 見果てぬ夢 (スコア:2, 興味深い)

    by MJ (791) on 2003年10月25日 0時17分 (#420936) 日記
    厳密に言わなくてもぜんぜん違いますけど、Xanadu [xanadu.com]の名前がフト頭をよぎりました。

    世界中で発行される書籍の全文検索・引用が可能になったとしたら、こんな便利なことはないなぁ、と。そういえば10年くらい前に考えたのを思い出しました。

    他のスレでも指摘されてますが、Amazonのような商用のサイトがあわや著作権ビジネスを崩壊させかねない(という指摘がもし業界からあれば、大げさだと言いたくなりますが)こんな機能を実装するのはやや驚きですが、個人的にはかなり好感触。
    --
    --Inquiring with pragma--@MJ
  • by take0m (4948) on 2003年10月24日 15時53分 (#420631) 日記
    内部犯行。

    3300万ページといっても、1ページ1,000文字としたら1KB。
    3300万ページで30GB程度のデータですよね。
    12万冊の情報をiPodで持ち出せますね。

    1冊1,000円換算で売却したら1億2,000万円。充分犯罪起こりうる金額ですよね。まあ、万全のセキュリティなのでしょうけど。
    • by parsley (5772) on 2003年10月24日 16時34分 (#420671) 日記
      問題は買う側と売り方。売れればそのとおりでしょうが。

      たった一冊でも沢山売れれ「ば」儲かるでしょう。

      # 人はそれをミリオンセラーと呼ぶ
      --
      Copyright (c) 2001-2014 Parsley, All rights reserved.
      親コメント
  • >12万冊以上、総ページ数は3,300万
    の書籍が既に電子化されてるってことですよね。
    検索サービスを始めたことより、それに耐えるデータが既に有ることのほうが驚きでした。

    当然、出版社側が編集作業用のデータを提供してるんでしょうけど……
    • たれこんだ時点で、
      てっきり出版社側が編集作業用のデータを提供してるのだろう
      と思って、疑いもしなかったのですが・・・・
      今見つけてしまいました。

        # これだけ原稿を書くことがデジタル化されているのに、
        # 出版社のデジタル化は遅れていて、12万冊の大半は、
        # アマゾンが実際にスキャナーでスキャンしたものだという

      ネタもと  置いときます [cnet.com]ので ごかんべんを。

      それにしても、これはカタログなのか、eBookなのか ?
      すでに米作家団体が 反発 [cnet.com]しています 。
      親コメント
  • by Futaro (2025) on 2003年10月24日 17時11分 (#420697) ホームページ 日記
    観光地案内とか、懸賞応募とかの雑誌などでこれができると、書店に行かなくても、自宅で「デジタル万引き」ができてしまうように思えるのですが、それは大丈夫なのかな?

    # あ、言わないほうがよかったかな?
    • ぜんぜん大丈夫じゃないみたいで、
      米国の作家団体Authors Guildが、会員の作家達に
      自分の作品を米Amazonのツールで表示させないよう 勧めています [cnet.com]。

      「1冊の分厚い本の中身を、100ページ以上連続して見ることができる」
      ということなので、ご指摘のようにガイドブック、料理の本などは
      軒並み危険にさらされるようです。

      利用する側としては便利なんですが、
      サービスには一定の制限が必要なのかもしれません。
      音楽と一緒で、提供してくれる人がいなくなると楽しめませんから。
      親コメント
    • by Anonymous Coward
      ># あ、言わないほうがよかったかな?

      うん。誰だって気づくYO!
  • これ、漫画は対象外ですよね?

    #漫画の「文字だけを立ち読み」ってのも、なんだか変な気分だし。

  • by kazuyan (17620) on 2003年10月24日 17時38分 (#420717)
    browseには立ち読みという意味もあるので、amazonのこのサービスにより完全なWeb Browsingが完成されたということ?
  • 本を買った人にはさらに高度な検索などのサービスを提供すれば面白いと思います。 本を持ってる人にしか意味がないようなサービスならば悪用できない でしょうし、そういうサービスのある書店で購入しようと考えるのでは。
    • 昔、二階堂黎人の「地獄の奇術師」てゆー小説を読んだ時、
      本文の中が索引だらけで色んなミステリー小説へのオマージュ
      としての解説が散りばめられていて、ミステリー初心者の
      私は取っ掛かりとして重宝しました。(本そのものは死ぬほど
      つまらんかったが)
      そういう検索とかができたら、暇なときに楽しめるかも。
      作家にとってはパクリ発覚で死活問題かも知れないけど。
      親コメント
      • > 作家にとってはパクリ発覚で死活問題かも知れないけど。
        逆にパクりやすくなるのでは?(w

        というか、パクリが発覚した位で評判を落とすようなら、その程度の技量でしかない、かと
        人の作品を換骨奪胎する位でなけりゃ、物書きとして、問題有では…。

  • by maruA2 (12520) on 2003年10月25日 20時18分 (#421235)
    どのようにして出版社の了解を得たんだろう?
    書籍の全文テキストを提供なんて権利持っている側にすればおっかなくて出来ない、というのは日本人の感覚なんでしょうか。

    検索はされるけどテキストは表示できないとか? でもそれだと訳分からないだろうし…
    • Re:アナログGoogle (スコア:2, 参考になる)

      by Anonymous Coward on 2003年10月26日 10時48分 (#421487)
      専門書出版社のものですが、日本の場合は多くの書籍で本文が電子化されて
      いないことの方が問題です。今でも、写植機で出力された「棒」を切った
      貼ったで作っている場合があります。ちょっと前までは大半の単行本が
      そうでした。写植機のデータは、印刷会社のものであり出版社のものでは
      ありません。出版社に残っているのは、アナログの版下だけです。

      ということで、欧米のようにTeXやsgmlの原稿が保存されていれば
      データベース化もしやすいでしょうが、日本の場合はちょっと古い
      書籍はOCRで取り込むという間抜けな作業が必要となり、コスト的に
      見合わないということになるでしょう。

      索引をネット上に公開するだけでも、読者の便になると思うのですが。
      親コメント
  • 10/23 米アマゾンが 「Search Inside the Book」 [amazon.com]サービスを開始する
    10/24 米国の作家団体である Authors Guildが会員の作家に
         サービスへの不参加を 呼びかける [cnet.com]メールを送る
    10/30 米アマゾンが
         「書籍全文検索で検索対象書籍の売上が9%増加した」と発表 [cnet.com]する
    10/31  Authors Guildが会員の作家に、
         アマゾンの印刷機能が停止されている事を連絡 [authorsguild.org]するメールを送る
    11/6  アマゾンがサービスを一部変更していると報道 [cnet.com]される

    書籍の全文検索サービスでは、Googleの参入(の噂?) [zdnet.co.jp]や、
    アマゾンジャパン社長のサービスの導入を検討している [cnet.com]というコメントも 報道されている

    参考記事
    CNET梅田望夫 氏の Blog [cnet.com] アマゾンが仕掛ける「書籍のグーグル」は成功するか
    CNETエキスパートの視点 [cnet.com] オンライン立ち読みはどこまで許されるか?
  • by Anonymous Coward on 2003年10月24日 17時14分 (#420699)
    > 一部ではサービスの悪用が懸念されているが

    一部とは具体的にどこのことでしょうか?
    また
    サービス悪用とは具体的にどのような悪用方法が懸念されているのでしょうか?
  • by Anonymous Coward on 2003年10月24日 18時00分 (#420733)
    プロローグの文章さえ分かったら、あとは次の文を予測して
    チビチビ検索して読破する人とか出てきたり…

    するわけないか。
typodupeerror

皆さんもソースを読むときに、行と行の間を読むような気持ちで見てほしい -- あるハッカー

読み込み中...