パスワードを忘れた? アカウント作成
16028 story
Google

グーグル八分発見システムが未到プロジェクトで採択 97

ストーリー by kazekiri
確かに未踏 部門より

あるAnonymous Coward 曰く、

ITproの記事によれば、IPAが採択した2007年度第II期の未踏ソフトウェア創造事業の30件のテーマの中に、「グーグル八分発見システムの開発」が含まれているとのことだ。どうやら、このテーマは、実際にグーグル八分に遭遇していた悪徳商法?マニアックスの管理人であるBeyond氏のものであるらしい。 悪徳商法?マニアックスサイトでのBeyond氏の書き込みに経緯が詳しく書かれているが、今のところ、開発するシステムはグーグル八分されているサイトを発見するという以上のことはよく分からない。 情報大航海プロジェクトがGoogle八分批判を行ったり、 Google自身もGoogle八分を認めるという状況もあるわけだが、未踏という小さな予算の枠でGoogleに立ち向かうというこの試みはちょっと応援したい。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2007年07月31日 17時55分 (#1198706)
    すでにBeyond氏は雑誌で、八分発見スクリプトなるものを公開しているわけで、それを拝見する限りでは未踏ではないと思いました。
    スクレイピングとテキストマッチングを行う程度の、スクリプト初心者でもかけるようなものであり、当人も書いていたと思いますが、
    全世界で八分にされていることを検出できないものでした。
    Google Ban Checker [comedywaltz.com]というのも同じ事をやっているものでしょうか。
    そして今回、未踏というからにはgoogleの文字列に頼らない手法で、GoogleのAPIや仕様に頼らないアプローチを提示するということ?
    現在発売中のハッカージャパン3月号に、「Google八分探索スクリプトを作ってみよう!」という記事を書きました。

    これは、グーグル八分表示が出た場合に、具体的にどのページが八分されているのかを調べることが出来るツールを開発する、ノウハウを書いたものです。腕に覚えのある方は、ぜひ読んでみて下さい。付録のDVD-ROMには、実際のツールが収録されていますので、試して遊ぶことも可能です。

    まあ、簡単にいえば、日本の検索結果とアメリカの検索結果を比較するという話なんですが、目視で比較するのは大変なので、プログラムを作ってみましょうということです。

    グーグルで探し物をして満足している人が大部分の今、「グーグルで見つからない情報」を見つける術を知っておくことは、大きなアドバンテージになるかと思います。
    http://beyond.2log.net/akutoku/topics/2007/0215.html
    • by Anonymous Coward on 2007年07月31日 18時05分 (#1198716)
      別に既に公開済みのものを継続開発するのは問題ないですよ。基本的に人材発掘なんだから。まあ、ただ、約一年後の彼の成果が気になるところですね...。
      親コメント
      • by Anonymous Coward on 2007年07月31日 18時29分 (#1198729)
        >公開済みのものを継続開発するのは問題ない
        すでに自力で一度出したものに、公費の支援を求めるのが悪いとは誰もいわないでしょう。
        (OSASKなんかもそういう経緯だったような気がします。)
        その公開済みのアプローチを見聞きする限りでは、そのまんま推し進めたところで
        すぐ煮詰まりそうで人材発掘的な余地が殆どないまま終わってしまう気がします。
        各国の検索結果を比較するというロジックだけでは、広がりがないですよね。
        どこかに、プロジェクトとして長期スパンで見届けようと思わせる、公費をかけて
        やりとげる価値があると思わせるアイデアを盛り込んだと思われるのですけど、、、
        どうでしょうね。
        親コメント
        • by Anonymous Coward on 2007年08月01日 9時52分 (#1199003)
          >公費をかけてやりとげる価値があると思わせるアイデアを
          >盛り込んだと思われるのですけど、、、

          きっと、スパム検索エンジンみたいに公開すると解析されて対策されちゃうから
          未公開なんですよ。
          親コメント
    • by Anonymous Coward on 2007年08月01日 10時25分 (#1199017)
      たしかにco.jpとcomで「グロービートジャパン株式会社 イオンド大学」で検索したときの結果が30件違ってますね。

      でも、これってgoogleが「現状では」国のドメインごとに八分フィルタをつけてたりそうでなかったりするから
      有効なのであって、仕様変更で使えなくなる可能性がありません?

      最終的には複数の検索エンジンに一度にクエリを放りつつその結果を見るような仕組みになるんですかね。
      千里眼とかODINとかの世代で一度にクエリを放る仕組みは見た気がしますがw
      あとは、その結果を時系列で分析してってところなんですかね。
      親コメント
  • 最大の危惧は (スコア:5, おもしろおかしい)

    せっかく発明したグーグル八分発見システムが
    グーグル八分によって見つけてもらえないこと
    だったりして…。

    --
    clausemitz
  • by akiraani (24305) on 2007年07月31日 18時19分 (#1198722) 日記
     少なくとも、過剰SEOなんかは適切に排除してもらわんとサーチエンジンの品質にかかわってくるし、Phishingサイトなんかはむしろ積極的にGoogle八分してくれるといろいろありがたい。

     問題なのは「言論統制や不祥事隠しを目的に申請されたGoogle八分」です。検閲だけしからん的な論調をよく見かけますが、基本的にGoogleは被害届を半機械的に処理しているだけで、思想や政治的意図があってやっているわけではないはずです。

     Google対策センターがやろうとしていることはGoogleに対する挑戦ではなく、Google八分システムを悪用している業者の摘発でしょう。
    --
    しもべは投稿を求める →スッポン放送局がくいつく →バンブラの新作が発売される
    • by Anonymous Coward on 2007年07月31日 18時33分 (#1198733)
      >思想や政治的意図があってやっているわけではない「はず」

      その通りだと思いたいですし、今のところそう願っていますが、単なる希望的観測です。
      親コメント
    • by Anonymous Coward on 2007年07月31日 18時53分 (#1198748)
      以前から言われてることだけど
      別に政治だろうが宗教だろうが何を基準に排除してもいいじゃん
      営利企業なんだから
      Googleが使えなくなったとこで別のサーチエンジンが出てくるだけでしょ
      むしろ何でもかんでもGoogleに頼る現状に危機感を持つくらいがちょうどいい
      親コメント
      • そんなあなたのために、"Goole's worst nightmare"ともいわれたSearch Wikia [wikia.com]でもどうぞ。
    • > 基本的にGoogleは被害届を半機械的に処理しているだけで、思想や政治的意図があってやっているわけではないはずです。

      「はず」だけど、そうなのかどうかを知っているのがGoogleだけなのを問題視しているんでしょ。

      個人的にはgooとかのblog/掲示板フィルタみたいに選択式にすることで、未フィルタの情報の取得できるようにしてほしいですね。
      理想を言えば、外部のフィルタリストをURIとかで指定できるようにしてくれればいいんだけど。

      グーグル八分発見システムよりP2PでみんながサーチエンジンサーバシステムがほしいAC
  • 「発見」だけなら… (スコア:4, すばらしい洞察)

    by kamuy (1690) on 2007年07月31日 17時33分 (#1198687) ホームページ 日記
    検索インデックスから除外されているという状態を「発見」するだけなら、別にGoogleに立ち向かうとか対抗するとか、そういうことでもないように思いますけども。
    特定のURLを指定して、それが除外されているかいないかを確認するなら、実現可能なのではないかと。

    #そこから更に「対策」までとなると大変そうですけどね
    --
    -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
    • by Anonymous Coward on 2007年07月31日 17時55分 (#1198707)
      でも、具体的にはどうやるのだろう。
      ちょー簡単に考えるなら、、、DNSをルートサーバからたどって逐一GoogleAPI叩いて、有り無しフラグを立てていく?
      それくらいの事で、Googleのインデックスに追いつくのか???
      松本零児かなにかのマンガで、長大な真鍮の手すりを磨いている女の人の話があった。端まで磨き終わることには、初めの頃のはもうさび始めていて、、、、、
      親コメント
      • そんなことしなくても、人力で調べてくれるサイトがあるじゃない?
        日本には。

        ネタによっては勝手に祭りにしてくれるし
  • by SNT (23129) on 2007年07月31日 18時30分 (#1198731)
    http://www.fmx.ics.saitama-u.ac.jp/8bu/ [saitama-u.ac.jp]
    悪徳商法で検索すると確かにヒットします。
    この手の操作を自動化するってことかなぁ。
  • Beyondかあ… (スコア:4, 興味深い)

    by Anonymous Coward on 2007年07月31日 19時44分 (#1198783)
    …正直言うと、俺の中では、beyondに対する評価は絶賛急下降中だったりするんだよなあ。

    悪マニで悪徳商法やディプロマミルを糾弾していただけの時期は、割と素直に応援してた。

    それが「Google八分」と言って騒ぎ出した頃は、「まぁそこまで騒がんでも」とは思いつつも、ある程度は納得してた。

    それが、イオンド大学(ディプロマミルやってて各所に圧力かけてるところ)がウィキペディアに絡んで、自分のところに不利な情報を消させた件で、ウィキペディアの管理者相手に絡み出した辺りから、「なんか、非難の矛先がおかしいんじゃないか?」と思うようになった。

    で、beyondが「ウィキペディアよりも『正しい』百科事典プロジェクト作ったる!」と言って、yourpediaを立ち上げたのを見て「ああ、少なくとも、この実行力や良し」と思ったのも束の間、ライセンス(GFDL)のことを全く理解せずに、どうどうと開きなおった宣言を見て、思いっきりずっこけた。

    んでまぁ、その後も、ハッカージャパンにウィキペディア非難記事を書いたり、あげくの果てには「ウィキペディア管理者がイオンド大学から金品授受を受けてる」なんて、いかにも怪しげな陰謀論をばらまいたりしてるのを見て、正直、俺はすっかり引いてしまってる←今ここ。

    まぁ最近は文科省が、ディグリーミルの実態把握に乗り出したということもあるし、この未踏採択もあるし、beyondには追い風が吹いてる状況なんだろうけど、こういう経緯をまざまざと見てるだけに、素直に応援できない俺ガイル。
    #これがウィキペディアとのごたごた以前ならば、まだ応援できたんだろうけど…
    • Re:Beyondかあ… (スコア:1, すばらしい洞察)

      by Anonymous Coward on 2007年07月31日 20時03分 (#1198793)
      追い風は勝手に吹くんじゃなくて、自ら動いて吹かすもの。
      ウィキペディアへの批判も含め、様々な媒体で積極的に活動している点が評価されたんでしょ。過去の採択例をみても、完全に無名な人は、ほとんど採択されていない。

      嫉妬で批判するのは、見苦しいよ。ねえ、ゆきちさん。
      親コメント
    • Re:Beyondかあ… (スコア:1, おもしろおかしい)

      by Anonymous Coward on 2007年08月01日 0時57分 (#1198930)
      Beyond氏の行動は相当あれだが、jawpがおかしいのは事実だよ。

      趣味一般板のウィキペディアスレでは少しでもルールを守らないものには罵詈雑言の嵐だし。
      親コメント
      • 趣味一般板のウィキペディアスレをjawpと同一視するの?
        あのスレをずっと見てるウィキペディアンなんて、ごく一部だよw
        まともに記事を書いてる執筆者はそんな暇なんてないし。

        ただ、Beyond氏が未踏で忙しくなって、jawp叩きを忘れてくれるなら、それは歓迎。jawpにはjawpの方針があるんだから、悪マニと同じやり方はできないんだが、それを理解せずに外部で叩き放題なのがいたわしくて見てられなかった。
        親コメント
  • 実用性に欠ける (スコア:3, すばらしい洞察)

    by Anonymous Coward on 2007年07月31日 20時51分 (#1198812)
    我々が本当に望んでいるものは何だ?!
    それは、Google八分で隠されるリンク先、などではない。
    画像検索のアダルトチェックをONにしたときに隠されてしまうもの、それこそが真に我々が求めるものだ!

    というわけで、ONとOFFの時の差分使った、効率がいい実用的なシステムを希望。
  • by pyon (1702) on 2007年08月01日 3時27分 (#1198959)

    自分が費用を負担している訳でもないサービスで、
    自分のページが出て来ない、と文句を云う理由が判らない。

    どこかの会社がプレスリリースをメディアに送りつけたけど、
    それが取り上げられなかった、とその会社が喚いたとして
    皆ここまで議論するのだろうか。

    Google は閲覧者に対して公平・公正・中立を謳っていない。

    ページの所有者は、

    Google のインデックスにコンテンツが登録されないようにする、またはインデックスからコンテンツを削除する方法を教えてください。 [google.com]

    から自分のページを検索結果に出さない事が出来るのだから
    そもそも謳えない。

    それをわきまえた上で Google を使用するべきでないだろうか。

    他に有意義な金の使い方があるだろうに。

    --
    -- pyon
    • Re:よく判らない。 (スコア:4, すばらしい洞察)

      by SNT (23129) on 2007年08月01日 8時18分 (#1198982)
      OSや検索エンジンはすでに社会インフラです。
      本来社会インフラは国家が維持、管理するものですが、現在はごく少数の企業に独占されている状態です。
      その少数の企業が暴走しないためにも、社会インフラは透明であるべきです。

      で、この考えがもうちょっといくと、コモンズの考え方になって、社会インフラはオープンソースにしろ。
      っていう形になるんだけど、さすがにそれは行きすぎだと思う。

      今回のは、透明でないことの証明をして、社会的にアピールするためのものだと思うので、自分は十分有意義な使い方だと思います。
      親コメント
      • by Anonymous Coward on 2007年08月01日 11時21分 (#1199045)
        > OSや検索エンジンはすでに社会インフラです。

        (´・ω・`)知らんがな
        こちらは最大普及をめざしはしたけど、普及したから公共扱いはひどかないかな。
        その社会インフラに対して君ら、税金でも納めてくれるんかいな。
        親コメント
        • by pineroot (2890) on 2007年08月01日 13時45分 (#1199091) ホームページ
          > 普及したから公共扱いはひどかないかな。

          シェア取ったらそれなりの社会的責任は当然あり、法律上そういうのを規制するのが独占禁止法 [wikipedia.org]じゃないだろうか?

          八分のケースだと優越的地位の濫用 [wikipedia.org]にはあたるのかなぁ。「検索結果を表示すること」が(検索結果との)「取引」に該当するかどうかが焦点だと思うが。
          該当するなら「知らんがな」ではすまん。
          親コメント
  • by Anonymous Coward on 2007年07月31日 17時48分 (#1198701)
    コレが採択されたってことは、コレのせいで涙を呑んだ人がいるってことで。
    • by Anonymous Coward on 2007年07月31日 18時16分 (#1198721)
      当たり前でしょう。あいつが立候補しなければ俺が当選したのに、とか言ってもどうしようも無い。

      あなたが、これよりももっと良いと考えたものがあったとしても
      ・審査員(通常は複数ですよね)は良いとは考えなかった。あなたの意見が少数派
      ・審査員に内容が伝わらなかった。書き方・アピールが悪かった
      など色々と考えられるわけです。

      ようするに「審査」というプロセスがあるわけで、そのあたりをきちんと理解しないと、勝手に悔しがって、自分は悪くない、悪いのは審査員だという、間違った方向に進んでしまう危険があると思います。
      親コメント
      • by Anonymous Coward on 2007年07月31日 18時38分 (#1198735)
        んな、誰でもわかるようなことを力説せんでもええでしょ。どんな企画が涙を呑んだのか、この企画がそれらとどう違うのか、ちゃんとそういう意味のあるところを力説せぇよ。
        親コメント
      • でも、世論として、「余り良い選択で無い様な・・・」って声が出ているって事は大切だとは思うけどね。

        でないと、一度お役人が決めたらはい、オシマイ。全て文句言うな、文句言う奴がオカシイって事になっちゃう。

        流石にあっちこっちで炎上してくれば、関係識者だってそのうち基準を見直さざるを得ないあろうから、声を上げること自体は間違ってないじゃないかな。

        #税金から出ているって事は、納税者は全員スポンサーなんだよ。

        親コメント
      • > 悪いのは審査員だという、間違った方向

        今までの採択ネタを見るとなぁ……
        • 採択毎にテーマに偏りがあるんだが...審査するのはPMだけじゃないのよね。PMがIPAサイドにプレゼンしつつ決めるらしい。まー、モノがよくてプレゼンもよくてちゃんとPMに伝わればPMが推してくれるから通りやすくはなるだろうが。もっとも、概念的に新しいと理解してもらうのも難しいので新しさに匹敵するプレゼン能力が必要なのも確かだ。

          俺ぁもう少しドキュメント蓄えたり練ったりするつもり。
          親コメント
    • by Anonymous Coward on 2007年07月31日 18時03分 (#1198711)
      つーか、公的な金を突っ込む先としては、もうちと考えて欲しいなぁ。

      やはりこういったイノベーションを推進する為のネタなんだから、技術の進歩性とかは大切だと思う。

      そもそも、コレってGoogleが廃業でもしたら全くもって役に立たないものじゃないかと。

      そんなGoogleベッタリなもんにカネ出す位なら、もっと名前は知られてなくとも独自性の有るものにカネ出せよな。

      親コメント
    • by Anonymous Coward on 2007年07月31日 18時04分 (#1198714)
      「未到プロジェクト」的にはこちらを選んで正解と思っているかもね。
      ニュースになったわけだから。
      親コメント
    • いいんじゃない?
      これより魅力がない提案だった、ってことなので。

  • by Anonymous Coward on 2007年07月31日 19時35分 (#1198774)
    意図的にgoogle八分になっている人もいるわけで。
    うちのサイトもそうですが、そういうサイトが
    見つけられて強制的にgoogle界に引っ張り出されるわけ?

    できればほっといてほしい。
    • Re:隠れている立場は (スコア:1, すばらしい洞察)

      by Anonymous Coward on 2007年08月01日 2時18分 (#1198948)
      > 意図的にgoogle八分になっている人もいるわけで。

      それは Google 八分と呼ばないと思います。
      あと、わざわざ Google に連絡とかしたんですか?
      Google の検索にひっかかりたくないだけなら、robots.txt とかで済むと思うんですが。
      そして、もちろん robots.txt や、
      あるいはサーバー側の処理で Google のクロウラーをハジいたりしてる場合、
      それは Google 八分とは呼びません。まったく別の話です。
      親コメント
typodupeerror

日本発のオープンソースソフトウェアは42件 -- ある官僚

読み込み中...