パスワードを忘れた? アカウント作成
21977 story
spam

国内ブログの4割がspam!? 39

ストーリー by mhatta
たしかにそういうの多いよな 部門より

bouzuman 曰く、

ニフティが スパムブログのフィルタリング技術を開発した というリリースを発表したが、その中でなんと国内ブログの4割がスパムだという調査結果が書かれている。

ニフティによると、スパムブログとは

アフィリエイトで広告収入を得ることや、特定のサイトへ誘導したりすることを目的として生成されるブログです。特定のキーワードを含む記事やニュースサイトなどから転載した記事を機械的に大量に生成して、各種検索サービスからアクセスされるようにすることもあり、コンテンツとして無意味なものだけでなく、一般のインターネットおよびブログサービスの利用者にとって迷惑になる場合もあります。
としており、当該リリースにはどのようなブログが該当するかという定義がおおまかに書かれている。

たしかにこのようなスパムブログに出会うことはまれにあるが、 4割というのはちょっと大げさな気がしないでもない。あなたのブログはどうかな?
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by eruchan (2221) on 2008年03月27日 13時30分 (#1320345)
    四割が妥当かどうかのデータは持っていないけど、数の比率として考えると、大げさとは限らないかもしれない。

    正常な 60% の多くは別の blog とのつながりを持ってネットワークを形成しているが、40% の spam blog は、孤立するか spam を悪用してリンクを引きこむか、せいぜい spam blog 同士のつながりしか無いはず。blog 読者は blog から blog のリンクを重視して読むことが多いし、spam blog へたどり着く確率は数の比率よりは少ないだろう。

    spam blog は、trackback spam とかコメントスパムみたいな手段で正常な 60% からのリンクを多く引っ張ろうと考えるだろうから、その手の spam を地道に潰していけばさらに spam blog は孤立する。高 PageRank なサイトからのリンクは特に潰すべき。
  • by Gokki (7023) on 2008年03月27日 15時16分 (#1320427) ホームページ
    たしかに調べ物をしているときに

    検索結果1番目→スパムブログa→目的のブログ
    検索結果2番目→スパムブログb→目的のブログ
    検索結果3番目→目的のブログ

    って感じで、検索結果から複数開くタブのうち
    4割はさっと見て「あーまたかよ」と思って閉じてる
    ような気がする。
  • by Vorspiel (2391) on 2008年03月27日 13時24分 (#1320339) ホームページ
    自分のblog(tDiary)のrefererを見ると、見たことも聞いたこともないようなサイトから飛んできてるのがぼつぼつ混じってます。うちみたいな辺境のblogにリンクしてるのはどんな人か、と見に行くとまさにniftyが定義しているようなspamサイトなわけで。

    昔はrefererを表示するようにしてましたが、まともな情報のないspamサイトどもにサービスしてやる義理はないのでかなり前に止めました。管理者(私)は編集ページを表示すれば見られるわけだし。

    >たしかにこのようなスパムブログに出会うことはまれにあるが、 4割というのはちょっと大げさな気がしないでもない。
    自分から見に行くblogを母集団にすれば1%もありゃしないでしょうけれど、spamサイトは機械生成で簡単に(?)作れるわけだから、国内のblog全体を母集団にすれば4割ってのもありえない率ではないのでは。

  • ここで (スコア:3, おもしろおかしい)

    by onikuya (17148) on 2008年03月27日 14時54分 (#1320409) 日記
    blog2.0の登場と
  • by Anonymous Coward on 2008年03月27日 13時24分 (#1320340)
    SPAM的なブログを大量に作って特定のページへのリンクを張って、ページランクなどをあげる サービスをSEO対策を手がける会社が裏メニュー的に顧客に提供してることはあるようです。
    アカウントの取得が容易だった某ポータルのブログの大半はそういった目的で作られてるブログ だという話も聞いたこともあります。
  • by Anonymous Coward on 2008年03月27日 16時44分 (#1320490)
    データベース更新の早さと網羅性の高さでYahoo!ブログ検索 [yahoo.co.jp]をよく使いますが、
    最近spamブログのフィルタリングが入ったらしく検索結果が劇的に変わりました。
    もともとGoogleはspamブログをある程度排除しているのでなかなか気がつきませんが(そして今Yahoo!ブログ検索を使っても排除されているのでなかなか実例を出せないのですが)実際多いですよspamブログ。

    たいてい手口としては、
    検索されそうなキーワード(「携帯」とか「スイーツ」とかみたいな)で適当に検索
    →検索に引っかかってきたサイト(blogなど)の文章を数センテンスずつ切り貼り(意味はまったく繋がっていない)
    →「○○(「携帯」とか「スイーツ」とか)について調べてみました」とかいうタイトルをつけて記事投稿

    というのを山のようなキーワードについて自動で行っているみたいです。
    フィルタリングされていない検索ツールで調べたいことを検索すると、これがまた膨大な数引っかかる上に人間フィルタリングでもチェックしそこねることもあって(検索結果に出てくるサマリ程度の抜粋では(他blogのコピペなので)意味が通っていたりする)実にうっとうしいことこの上ない。

    もうこういうことする奴全員死刑でいいよ('A`)ほんと
    • by t_mitz (35913) on 2008年03月27日 17時44分 (#1320530)
      同じYahooですが、
      Yahooニュースにくっついている、「この話題に関するブログ」も結構Spamっぽいのありますね。

      Yahooの記事が丸々貼ってあって、
      下部に広告文なんかが載ってるのもあるし。
      親コメント
    • by Anonymous Coward on 2008年03月27日 18時47分 (#1320562)
      そのような方法は、「ワードサラダ」と呼ばれています
      http://www.nikkeibp.co.jp/style/biz/abc/newword/070717_10th/
      親コメント
  • by Acha. (9497) on 2008年03月27日 17時23分 (#1320515)
    キーワードランキングの上位キーワード、例えば、
    昨日のYahoo急上昇キーワード [yahoo.co.jp]で1位の「劇団ひとり CM」で、

    Googleブログ検索 [google.co.jp]あたりで日付順表示 [google.co.jp]してみるといいです。

    ※たまにIFRAME使って強制的にアフィリエイトリンク踏ませるsplogがあるので、splogの確認には普段使うのとは別のブラウザがお勧め。ただしそのために確認用にIEをCookieダイアログ表示にして使うと、時々ダイアログ出ずにフリーズするのでこれも注意。damn IE!

    こんな感じで、カモを引っ掛ける網は大きければ大きいほどいいので、ランキング系のキーワードが真っ先に狙われます。人気の芸能人とかも。

    あと、エロ。
    例えばこんなの [google.co.jp]。 3×2のサムネイル付き(たまに無いのもある)のエロエントリは全て、自動生成のアフィリエイトスパムです。
    画像も紹介文もDMMの中身そのまま引っ張ってきてるだけ。この用途専用の自動生成ツールが存在します。

    車や滝の写真を背景にしたアヤシゲなブログパーツ時計を配布しているサイトにも注意。よそのブログの訪問者にアフィリエイト踏ませる細工入りです。
    • そうそう、ブログ検索を使うとわかるけど、4割どころか、もっと多いんじゃないかと思うくらいです。最近のエンジンは、どうにか除外する方向を強めているけど、今度は却って検索精度が落ちているくらいです。儲かっているのかはわからないんですが、ランニングコストが低いので、結果としては利益出ているんでしょうね。

      一番巧妙なのは、コメント欄までそれなりに埋めて、まるできちんと会話が成立しているかのような記事を作っているところですね。途中から区別ができなくなります。
      親コメント
  • by kanina (16615) on 2008年03月27日 17時50分 (#1320535) 日記
    seesaa.net、petitmall.jpあたりでしょうかね。
    以前トラックバックスパムがここのブログばかりだったので、ここからのトラックバックはドメインごと拒否したところ、スパムが劇的に減りました。(ここで「まともな」ブログやってる人たちには、ごめんなさい)

    スパムブログはトラックバックスパムを送信してくるので、閲覧者だけじゃなく他のブロガーにも迷惑になります。
    なんとか対策してほしいところ。

    refererを参照したところ、うちのブログに対するスパムブログ経由のアクセス数は全体の1%以下です。
    こんなアクセス数増じゃちっとも嬉しくない。
    • by Anonymous Coward
      fc2.comも多いですね。
      しかも、たちの悪いことにspam blogのほとんどがワンクリック詐欺サイトに誘導するようになってます。
      また、Googleの検索でも比較的上位にあがるものもありますから、特にエロい内容のものや読み込みに時間がかかるブログは要注意、スパムの可能性大です。

      こういうのは管理者の問題何でしょうかね・・・。ユーザ数が多いから対処できてないのかも。
  • 対処法 (スコア:2, 参考になる)

    by rudyard (19676) on 2008年03月28日 9時31分 (#1320829) ホームページ 日記
    スパムブログは、機械生成しているだけあって「すべて同じ形」をしています。
    なので、必ず登場する「特徴的な単語/フレーズ」を検索キーに含めると簡単に見つけ出すことができます。
    "トップカテゴリ" "特集リンク" あたりが顕著ですね。
    で、それらを「除外指定」してやれば、検索結果からスパムブログを排除することが可能なわけです。
  • こんな例か? (スコア:1, 興味深い)

    by Anonymous Coward on 2008年03月27日 1時17分 (#1320024)
    好きなアーティストが新譜紹介用のページを作ったので、私のブログのエントリにそのページへのリンクを貼ったら、最初の数日は私のブログも紹介ページのほうもGoogleで検索できたけど、ある日突然両方とも検索結果に出なくなった。他の人が各自のブログのエントリに貼った紹介は残ってたが。
    今は両方ともまた表示されるようになってるけどね。
    きっとスパム扱いされたんだろうな。

    ちなみにYahoo! Japanのほうではそういう現象は出てない。しかもGoogleでは私のブログのほうがアーティストのページより上にでてるが、ヤフーではアーティストのほうが最上位に出てて好ましい結果だ。
    • > ヤフーではアーティストのほうが最上位に出てて好ましい結果だ。

      該当ページが、ヤフーのディレクトリ内のページかは知りませんが、
      blog、掲示板、その他CGM全盛な現代こそ、ディレクトリ検索の有効性を再認識してもいいと思います。

      オフィシャルな情報を知りたいとき、非オフィシャルな情報を知りたいとき、
      どちらもあるわけです。
      Googleのように、ロボット検索のアルゴリズムを練り上げるのは、コスト対効果は良いと思いますが、
      SEOとのイタチごっこになる。
      だったら、ヤフーのように人力で集めたディレクトリ検索とロボット検索をハイブリッドする
      というのは理に適ってるように思います。でも、その国の文化に根ざしたスタッフを大量にかかえないと
      いけないので、Googleのような世界均一サービスのスタイルだと難しいですね。
  • by Anonymous Coward on 2008年03月27日 13時14分 (#1320325)
    9割 [wikipedia.org]って言っておけばもっと有名になったのにね。
  • by 127.0.0.1 (33105) on 2008年03月27日 13時23分 (#1320336) 日記
    この調子で行くと、8割9割がspamのblogになって、物知り顔でblogは死んだとか
    遅れているとかのたまう奴が現れるようになるのは、せいぜいあと1年2年ということか。
  • by Anonymous Coward on 2008年03月27日 13時03分 (#1320307)
    その例 http://srad.jp/~uid/journal [srad.jp]
  • by Anonymous Coward on 2008年03月27日 13時22分 (#1320335)
    アフィリエイトで広告収入を得ることや、特定のサイトへ誘導したりすることを目的として生成されるブログです 後者はともかく、前者はオタク系blogは全部になっちゃいそうだ
    目的じゃなくて(続けるための)手段の場合も多いだろうけど、部外者にはわからんよね。
    • by Stealth (5277) on 2008年03月27日 20時12分 (#1320629)

      前者はともかく、後者は web logging 的に何が問題で spam 的なものだと言えるのかが (言葉が足りないために) 分かりづらいですね。

      親コメント
    • by Anonymous Coward
      ここで書かれてるアフェリ目的のブログって自分で書いてるやつじゃなくて
      自動生成で大量にポストしてるゴミブログのことではないかと。
      実際に4割ぐらい有るよ。何しろ作る手間は全くかからないわけだし。
      さらにこの手のは自動で大量にスパムトラバやスパムコメントまで生成する……
      最近のトラバ・コメントの大半がこの手のスパムボットだったりして。

      言及トラバと関連内容トラバで議論していたり
      日記みたいにぐだらない内容のブログはいらないみたいな話とか
      そんなのはまだマシだったのだと今さらに思い知るぜ。
      • Mixiとかでマイミクじゃない足跡でプロフ一緒っての割と来るんでスルーしてるんですが
        リンク先一緒はともかく外部ブログの場合ブログ自体は別なものの中身一緒でアフィリエイトっての多いんで
        Spam4割でもそれくらいかなぁ・・・って感じですね。
        基本プロフの段階でスルーするんで自分が多いなーとは感じないですけど・・・
        多いだろうなって実感はあります。
        親コメント
  • by Anonymous Coward on 2008年03月27日 13時28分 (#1320343)
    はてなブックマーク [hatena.ne.jp]みたいなのもspamっぽい。
    ぐぐったりやふったりして引っかかってきたのがこれだと萎える。
    お前らのブックマークには興味はない!!

    -site:b.hatena.ne.jp
    しないと鬱陶しい。
    # "b." はいらない気がするけど…
    • by Anonymous Coward
      自分は商品について検索したときに、価格.com以下ざったな通販リスト・レビューサイトばかりが検索上位に並ぶのが非常にわずらわしいです。

      価格.comはまだいいんですよ。大体の商品にレビューか口コミはついていますから。
      それ以外のサイトは……。
      • by Anonymous Coward
        私も最近、得意分野じゃない商品を買うときに同じような経験をしました。
        購入するサイトはあらかじめ決めており、商品のレビューを知りたいのに、出てくるのは通販サイト、通販サイトへのリンク(価格比較)ばかり。
        キーワードに”レビュー”を追加してサイトを訪ねてみれば、レビュー(0)とか。
        通常のweb検索ではなく、ブログ検索ではどうかと試してみたら、4割どころか・・・。
  • by Anonymous Coward on 2008年03月27日 13時47分 (#1320361)
    検索する単語によりますが、商品名とか、サービス名なんかで検索するとSpam Blogが引っかかってうざいのなんのって…
    普通のアフィリエイト利用者には申し訳ないですが、誰かFirefoxの拡張でアフィリエイトリンクを判断して無効にするものを作ってくれないですかね。
    • by Anonymous Coward on 2008年03月27日 14時45分 (#1320401)
      Firefoxではないですが、Proxomitronを使ってばっさりと切ってます。あとはアドオンのAdblockも併用しています。
      親コメント
    • by Anonymous Coward
      うざいんだったらインターネットを使わなければいいんじゃない?

      使っているのにぶつぶつ言っているのはアナタですよ。

      アントワネット
  • by Anonymous Coward on 2008年03月27日 15時06分 (#1320414)
    blogの次は~~~だ!見たいな物が出来上がり、(以下永久ループ
  • by Anonymous Coward on 2008年03月27日 16時16分 (#1320471)
    有益なブログは全体の数パーセントでしょう。書き込み単位でならその内のさらに数パーセント。
    何か役にたったと思えるものも、実は一時情報へたどり着くための壁にしかなっていない事が多いのです。
    トータルで考えたら検索ノイズにしかなっていませんので、全部フィルタリングして貰った方が嬉しいです。

    全部フィルタリングするのと最適なフィルタリングの違いは誤差の範囲ぐらいしかない筈です。
    • by Anonymous Coward on 2008年03月28日 11時43分 (#1320881)
      そのとおりだと思うのだが、私が自分のブログに備忘録として2年程前に残しておいた某アプリのTipsが、いまだにアクセスされてたりするのを見ると、思わぬところで役に立つこともあるんだなと思う次第。
      当時、上手くいかないことがあって、解決法をあちこち探し回って、結局見つからなくて、試行錯誤してようやく解決した小技なんですがね…

      #そのエントリ以外は文字通り「ゴミ」しかないよ
      親コメント
  • by Anonymous Coward on 2008年03月27日 17時40分 (#1320526)
    サイト持ちの人はmyipneighbors [myipneighbors.com]なんかで自身のドメインをチェックしてみるといい。
    同じサーバにどんだけSPAMブログがあるかわかる。特にMovable Typeを使ったやつが。
    泣きたくなるよ・・・
  • by Anonymous Coward on 2008年03月29日 1時41分 (#1321365)
    サービス内の90%、全世界のブログのうちの4%はseesaaのsplogであるという驚愕のデータもあります。
    スパムが多いとこは何箇所かあるけど、seesaaは他の追随を許さない圧倒的な比率ですね。
    昔、テクノラティが「seesaaはスパムが多いね」って言ってたけど、ここまで来るとサービス自体がspamな気も。

    http://d.hatena.ne.jp/TAK_TAK/20071129 [hatena.ne.jp]
    • by Anonymous Coward
      TAK この統計調査をしたものです。 splog率では、seesaaは圧倒的ですが、 おそらく、splog量では、今はFC2の方が多いと思います。 たぶん、1日に 100000~200000エントリぐらい作られてます。
typodupeerror

コンピュータは旧約聖書の神に似ている、規則は多く、慈悲は無い -- Joseph Campbell

読み込み中...