ページ内ジャンプ:

アレゲなニュースと雑談サイト

kazekiriによる 2007年07月31日 17時25分の掲載
確かに未踏部門より。

あるAnonymous Coward 曰く、

ITproの記事によれば、IPAが採択した2007年度第II期の未踏ソフトウェア創造事業の30件のテーマの中に、「グーグル八分発見システムの開発」が含まれているとのことだ。どうやら、このテーマは、実際にグーグル八分に遭遇していた悪徳商法?マニアックスの管理人であるBeyond氏のものであるらしい。 悪徳商法?マニアックスサイトでのBeyond氏の書き込みに経緯が詳しく書かれているが、今のところ、開発するシステムはグーグル八分されているサイトを発見するという以上のことはよく分からない。 情報大航海プロジェクトがGoogle八分批判を行ったり、 Google自身もGoogle八分を認めるという状況もあるわけだが、未踏という小さな予算の枠でGoogleに立ち向かうというこの試みはちょっと応援したい。

この議論は賞味期限が過ぎたので、保存されている。 新たにコメントを書くことはできない。
表示オプション しきい値:
  • Anonymous Coward : 2007年07月31日 17時55分 (#1198706)
    すでにBeyond氏は雑誌で、八分発見スクリプトなるものを公開しているわけで、それを拝見する限りでは未踏ではないと思いました。
    スクレイピングとテキストマッチングを行う程度の、スクリプト初心者でもかけるようなものであり、当人も書いていたと思いますが、
    全世界で八分にされていることを検出できないものでした。
    Google Ban Checker [comedywaltz.com]というのも同じ事をやっているものでしょうか。
    そして今回、未踏というからにはgoogleの文字列に頼らない手法で、GoogleのAPIや仕様に頼らないアプローチを提示するということ?
    現在発売中のハッカージャパン3月号に、「Google八分探索スクリプトを作ってみよう!」という記事を書きました。

    これは、グーグル八分表示が出た場合に、具体的にどのページが八分されているのかを調べることが出来るツールを開発する、ノウハウを書いたものです。腕に覚えのある方は、ぜひ読んでみて下さい。付録のDVD-ROMには、実際のツールが収録されていますので、試して遊ぶことも可能です。

    まあ、簡単にいえば、日本の検索結果とアメリカの検索結果を比較するという話なんですが、目視で比較するのは大変なので、プログラムを作ってみましょうということです。

    グーグルで探し物をして満足している人が大部分の今、「グーグルで見つからない情報」を見つける術を知っておくことは、大きなアドバンテージになるかと思います。
    http://beyond.2log.net/akutoku/topics/2007/0215.html
  • せっかく発明したグーグル八分発見システムが
    グーグル八分によって見つけてもらえないこと
    だったりして…。

    --
    clausemitz - Twitter始めたお(^ω^)→ http://twitter.com/clausemitz
  •  少なくとも、過剰SEOなんかは適切に排除してもらわんとサーチエンジンの品質にかかわってくるし、Phishingサイトなんかはむしろ積極的にGoogle八分してくれるといろいろありがたい。

     問題なのは「言論統制や不祥事隠しを目的に申請されたGoogle八分」です。検閲だけしからん的な論調をよく見かけますが、基本的にGoogleは被害届を半機械的に処理しているだけで、思想や政治的意図があってやっているわけではないはずです。

     Google対策センターがやろうとしていることはGoogleに対する挑戦ではなく、Google八分システムを悪用している業者の摘発でしょう。
    --

    //ソリッドファイター完全版 [fukkan.com]復刊賛同者募集中/

  • 「発見」だけなら… (スコア:4, すばらしい洞察)

    kamuy (1690) : 2007年07月31日 17時33分 (#1198687) ホームページ 日記
    検索インデックスから除外されているという状態を「発見」するだけなら、別にGoogleに立ち向かうとか対抗するとか、そういうことでもないように思いますけども。
    特定のURLを指定して、それが除外されているかいないかを確認するなら、実現可能なのではないかと。

    #そこから更に「対策」までとなると大変そうですけどね
    --
    -+- 想像力を超え「創造力」をも凌駕する、それが『妄想力』!! -+-
  • SNT (23129) : 2007年07月31日 18時30分 (#1198731)
    http://www.fmx.ics.saitama-u.ac.jp/8bu/ [saitama-u.ac.jp]
    悪徳商法で検索すると確かにヒットします。
    この手の操作を自動化するってことかなぁ。
    --
    賛同はACで。反論はIDで。カルマボーナスはチキン。
  • Beyondかあ… (スコア:4, 興味深い)

    Anonymous Coward : 2007年07月31日 19時44分 (#1198783)
    …正直言うと、俺の中では、beyondに対する評価は絶賛急下降中だったりするんだよなあ。

    悪マニで悪徳商法やディプロマミルを糾弾していただけの時期は、割と素直に応援してた。

    それが「Google八分」と言って騒ぎ出した頃は、「まぁそこまで騒がんでも」とは思いつつも、ある程度は納得してた。

    それが、イオンド大学(ディプロマミルやってて各所に圧力かけてるところ)がウィキペディアに絡んで、自分のところに不利な情報を消させた件で、ウィキペディアの管理者相手に絡み出した辺りから、「なんか、非難の矛先がおかしいんじゃないか?」と思うようになった。

    で、beyondが「ウィキペディアよりも『正しい』百科事典プロジェクト作ったる!」と言って、yourpediaを立ち上げたのを見て「ああ、少なくとも、この実行力や良し」と思ったのも束の間、ライセンス(GFDL)のことを全く理解せずに、どうどうと開きなおった宣言を見て、思いっきりずっこけた。

    んでまぁ、その後も、ハッカージャパンにウィキペディア非難記事を書いたり、あげくの果てには「ウィキペディア管理者がイオンド大学から金品授受を受けてる」なんて、いかにも怪しげな陰謀論をばらまいたりしてるのを見て、正直、俺はすっかり引いてしまってる←今ここ。

    まぁ最近は文科省が、ディグリーミルの実態把握に乗り出したということもあるし、この未踏採択もあるし、beyondには追い風が吹いてる状況なんだろうけど、こういう経緯をまざまざと見てるだけに、素直に応援できない俺ガイル。
    #これがウィキペディアとのごたごた以前ならば、まだ応援できたんだろうけど…
  • 実用性に欠ける (スコア:3, すばらしい洞察)

    Anonymous Coward : 2007年07月31日 20時51分 (#1198812)
    我々が本当に望んでいるものは何だ?!
    それは、Google八分で隠されるリンク先、などではない。
    画像検索のアダルトチェックをONにしたときに隠されてしまうもの、それこそが真に我々が求めるものだ!

    というわけで、ONとOFFの時の差分使った、効率がいい実用的なシステムを希望。
  • pyon (1702) : 2007年08月01日 3時27分 (#1198959)

    自分が費用を負担している訳でもないサービスで、
    自分のページが出て来ない、と文句を云う理由が判らない。

    どこかの会社がプレスリリースをメディアに送りつけたけど、
    それが取り上げられなかった、とその会社が喚いたとして
    皆ここまで議論するのだろうか。

    Google は閲覧者に対して公平・公正・中立を謳っていない。

    ページの所有者は、

    Google のインデックスにコンテンツが登録されないようにする、またはインデックスからコンテンツを削除する方法を教えてください。 [google.com]

    から自分のページを検索結果に出さない事が出来るのだから
    そもそも謳えない。

    それをわきまえた上で Google を使用するべきでないだろうか。

    他に有意義な金の使い方があるだろうに。

    --
    -- pyon
    • Re:よく判らない。 (スコア:4, すばらしい洞察)

      SNT (23129) : 2007年08月01日 8時18分 (#1198982)
      OSや検索エンジンはすでに社会インフラです。
      本来社会インフラは国家が維持、管理するものですが、現在はごく少数の企業に独占されている状態です。
      その少数の企業が暴走しないためにも、社会インフラは透明であるべきです。

      で、この考えがもうちょっといくと、コモンズの考え方になって、社会インフラはオープンソースにしろ。
      っていう形になるんだけど、さすがにそれは行きすぎだと思う。

      今回のは、透明でないことの証明をして、社会的にアピールするためのものだと思うので、自分は十分有意義な使い方だと思います。
      --
      賛同はACで。反論はIDで。カルマボーナスはチキン。
      • Anonymous Coward : 2007年08月01日 11時21分 (#1199045)
        > OSや検索エンジンはすでに社会インフラです。

        (´・ω・`)知らんがな
        こちらは最大普及をめざしはしたけど、普及したから公共扱いはひどかないかな。
        その社会インフラに対して君ら、税金でも納めてくれるんかいな。
      • 2個のコメント が現在のしきい値以下です。
  • Anonymous Coward : 2007年07月31日 18時03分 (#1198711)
    つーか、公的な金を突っ込む先としては、もうちと考えて欲しいなぁ。

    やはりこういったイノベーションを推進する為のネタなんだから、技術の進歩性とかは大切だと思う。

    そもそも、コレってGoogleが廃業でもしたら全くもって役に立たないものじゃないかと。

    そんなGoogleベッタリなもんにカネ出す位なら、もっと名前は知られてなくとも独自性の有るものにカネ出せよな。

  • Anonymous Coward : 2007年07月31日 18時04分 (#1198714)
    「未到プロジェクト」的にはこちらを選んで正解と思っているかもね。
    ニュースになったわけだから。
  • Anonymous Coward : 2007年07月31日 18時16分 (#1198721)
    当たり前でしょう。あいつが立候補しなければ俺が当選したのに、とか言ってもどうしようも無い。

    あなたが、これよりももっと良いと考えたものがあったとしても
    ・審査員(通常は複数ですよね)は良いとは考えなかった。あなたの意見が少数派
    ・審査員に内容が伝わらなかった。書き方・アピールが悪かった
    など色々と考えられるわけです。

    ようするに「審査」というプロセスがあるわけで、そのあたりをきちんと理解しないと、勝手に悔しがって、自分は悪くない、悪いのは審査員だという、間違った方向に進んでしまう危険があると思います。
  • Re:隠れている立場は (スコア:1, すばらしい洞察)

    Anonymous Coward : 2007年08月01日 2時18分 (#1198948)
    > 意図的にgoogle八分になっている人もいるわけで。

    それは Google 八分と呼ばないと思います。
    あと、わざわざ Google に連絡とかしたんですか?
    Google の検索にひっかかりたくないだけなら、robots.txt とかで済むと思うんですが。
    そして、もちろん robots.txt や、
    あるいはサーバー側の処理で Google のクロウラーをハジいたりしてる場合、
    それは Google 八分とは呼びません。まったく別の話です。
  • 見とう
    ございます
  • 7個のコメント が現在のしきい値以下です。