国内ブログの4割がspam!? 39
ストーリー by mhatta
たしかにそういうの多いよな 部門より
たしかにそういうの多いよな 部門より
bouzuman 曰く、
ニフティが スパムブログのフィルタリング技術を開発した というリリースを発表したが、その中でなんと国内ブログの4割がスパムだという調査結果が書かれている。
ニフティによると、スパムブログとは
としており、当該リリースにはどのようなブログが該当するかという定義がおおまかに書かれている。アフィリエイトで広告収入を得ることや、特定のサイトへ誘導したりすることを目的として生成されるブログです。特定のキーワードを含む記事やニュースサイトなどから転載した記事を機械的に大量に生成して、各種検索サービスからアクセスされるようにすることもあり、コンテンツとして無意味なものだけでなく、一般のインターネットおよびブログサービスの利用者にとって迷惑になる場合もあります。
たしかにこのようなスパムブログに出会うことはまれにあるが、 4割というのはちょっと大げさな気がしないでもない。あなたのブログはどうかな?
blog 同士のつながり (スコア:4, 参考になる)
正常な 60% の多くは別の blog とのつながりを持ってネットワークを形成しているが、40% の spam blog は、孤立するか spam を悪用してリンクを引きこむか、せいぜい spam blog 同士のつながりしか無いはず。blog 読者は blog から blog のリンクを重視して読むことが多いし、spam blog へたどり着く確率は数の比率よりは少ないだろう。
spam blog は、trackback spam とかコメントスパムみたいな手段で正常な 60% からのリンクを多く引っ張ろうと考えるだろうから、その手の spam を地道に潰していけばさらに spam blog は孤立する。高 PageRank なサイトからのリンクは特に潰すべき。
調べ物の手順 (スコア:4, 興味深い)
検索結果1番目→スパムブログa→目的のブログ
検索結果2番目→スパムブログb→目的のブログ
検索結果3番目→目的のブログ
って感じで、検索結果から複数開くタブのうち
4割はさっと見て「あーまたかよ」と思って閉じてる
ような気がする。
自分の経験だと (スコア:3, 興味深い)
昔はrefererを表示するようにしてましたが、まともな情報のないspamサイトどもにサービスしてやる義理はないのでかなり前に止めました。管理者(私)は編集ページを表示すれば見られるわけだし。
>たしかにこのようなスパムブログに出会うことはまれにあるが、 4割というのはちょっと大げさな気がしないでもない。
自分から見に行くblogを母集団にすれば1%もありゃしないでしょうけれど、spamサイトは機械生成で簡単に(?)作れるわけだから、国内のblog全体を母集団にすれば4割ってのもありえない率ではないのでは。
ここで (スコア:3, おもしろおかしい)
対抗馬 (スコア:0)
有効なSEO対策 (スコア:2, 興味深い)
アカウントの取得が容易だった某ポータルのブログの大半はそういった目的で作られてるブログ だという話も聞いたこともあります。
Re: (スコア:0)
GoogleとかYahoo?
Re: (スコア:0)
Yahoo!ブログ検索 (スコア:2, 興味深い)
最近spamブログのフィルタリングが入ったらしく検索結果が劇的に変わりました。
もともとGoogleはspamブログをある程度排除しているのでなかなか気がつきませんが(そして今Yahoo!ブログ検索を使っても排除されているのでなかなか実例を出せないのですが)実際多いですよspamブログ。
たいてい手口としては、
検索されそうなキーワード(「携帯」とか「スイーツ」とかみたいな)で適当に検索
→検索に引っかかってきたサイト(blogなど)の文章を数センテンスずつ切り貼り(意味はまったく繋がっていない)
→「○○(「携帯」とか「スイーツ」とか)について調べてみました」とかいうタイトルをつけて記事投稿
というのを山のようなキーワードについて自動で行っているみたいです。
フィルタリングされていない検索ツールで調べたいことを検索すると、これがまた膨大な数引っかかる上に人間フィルタリングでもチェックしそこねることもあって(検索結果に出てくるサマリ程度の抜粋では(他blogのコピペなので)意味が通っていたりする)実にうっとうしいことこの上ない。
もうこういうことする奴全員死刑でいいよ('A`)ほんと
Re:Yahoo!ブログ検索 (スコア:1)
Yahooニュースにくっついている、「この話題に関するブログ」も結構Spamっぽいのありますね。
Yahooの記事が丸々貼ってあって、
下部に広告文なんかが載ってるのもあるし。
Re:Yahoo!ブログ検索 (スコア:1, 参考になる)
http://www.nikkeibp.co.jp/style/biz/abc/newword/070717_10th/
4割が大げさでない例 (スコア:2, 参考になる)
昨日のYahoo急上昇キーワード [yahoo.co.jp]で1位の「劇団ひとり CM」で、
Googleブログ検索 [google.co.jp]あたりで日付順表示 [google.co.jp]してみるといいです。
※たまにIFRAME使って強制的にアフィリエイトリンク踏ませるsplogがあるので、splogの確認には普段使うのとは別のブラウザがお勧め。ただしそのために確認用にIEをCookieダイアログ表示にして使うと、時々ダイアログ出ずにフリーズするのでこれも注意。damn IE!
こんな感じで、カモを引っ掛ける網は大きければ大きいほどいいので、ランキング系のキーワードが真っ先に狙われます。人気の芸能人とかも。
あと、エロ。
例えばこんなの [google.co.jp]。 3×2のサムネイル付き(たまに無いのもある)のエロエントリは全て、自動生成のアフィリエイトスパムです。
画像も紹介文もDMMの中身そのまま引っ張ってきてるだけ。この用途専用の自動生成ツールが存在します。
車や滝の写真を背景にしたアヤシゲなブログパーツ時計を配布しているサイトにも注意。よそのブログの訪問者にアフィリエイト踏ませる細工入りです。
Re:4割が大げさでない例 (スコア:1)
一番巧妙なのは、コメント欄までそれなりに埋めて、まるできちんと会話が成立しているかのような記事を作っているところですね。途中から区別ができなくなります。
スパムが多いブログサービス (スコア:2, 参考になる)
以前トラックバックスパムがここのブログばかりだったので、ここからのトラックバックはドメインごと拒否したところ、スパムが劇的に減りました。(ここで「まともな」ブログやってる人たちには、ごめんなさい)
スパムブログはトラックバックスパムを送信してくるので、閲覧者だけじゃなく他のブロガーにも迷惑になります。
なんとか対策してほしいところ。
refererを参照したところ、うちのブログに対するスパムブログ経由のアクセス数は全体の1%以下です。
こんなアクセス数増じゃちっとも嬉しくない。
Re: (スコア:0)
しかも、たちの悪いことにspam blogのほとんどがワンクリック詐欺サイトに誘導するようになってます。
また、Googleの検索でも比較的上位にあがるものもありますから、特にエロい内容のものや読み込みに時間がかかるブログは要注意、スパムの可能性大です。
こういうのは管理者の問題何でしょうかね・・・。ユーザ数が多いから対処できてないのかも。
対処法 (スコア:2, 参考になる)
なので、必ず登場する「特徴的な単語/フレーズ」を検索キーに含めると簡単に見つけ出すことができます。
"トップカテゴリ" "特集リンク" あたりが顕著ですね。
で、それらを「除外指定」してやれば、検索結果からスパムブログを排除することが可能なわけです。
こんな例か? (スコア:1, 興味深い)
今は両方ともまた表示されるようになってるけどね。
きっとスパム扱いされたんだろうな。
ちなみにYahoo! Japanのほうではそういう現象は出てない。しかもGoogleでは私のブログのほうがアーティストのページより上にでてるが、ヤフーではアーティストのほうが最上位に出てて好ましい結果だ。
ディレクトリ検索再び (スコア:0)
該当ページが、ヤフーのディレクトリ内のページかは知りませんが、
blog、掲示板、その他CGM全盛な現代こそ、ディレクトリ検索の有効性を再認識してもいいと思います。
オフィシャルな情報を知りたいとき、非オフィシャルな情報を知りたいとき、
どちらもあるわけです。
Googleのように、ロボット検索のアルゴリズムを練り上げるのは、コスト対効果は良いと思いますが、
SEOとのイタチごっこになる。
だったら、ヤフーのように人力で集めたディレクトリ検索とロボット検索をハイブリッドする
というのは理に適ってるように思います。でも、その国の文化に根ざしたスタッフを大量にかかえないと
いけないので、Googleのような世界均一サービスのスタイルだと難しいですね。
4割なんてケチ臭いこと言わないでおいて (スコア:1, 参考になる)
Re: (スコア:0)
この調子で行くと (スコア:1)
遅れているとかのたまう奴が現れるようになるのは、せいぜいあと1年2年ということか。
その例 (スコア:0)
スパムブログ? (スコア:0)
目的じゃなくて(続けるための)手段の場合も多いだろうけど、部外者にはわからんよね。
Re:スパムブログ? (スコア:1)
前者はともかく、後者は web logging 的に何が問題で spam 的なものだと言えるのかが (言葉が足りないために) 分かりづらいですね。
Re: (スコア:0)
自動生成で大量にポストしてるゴミブログのことではないかと。
実際に4割ぐらい有るよ。何しろ作る手間は全くかからないわけだし。
さらにこの手のは自動で大量にスパムトラバやスパムコメントまで生成する……
最近のトラバ・コメントの大半がこの手のスパムボットだったりして。
言及トラバと関連内容トラバで議論していたり
日記みたいにぐだらない内容のブログはいらないみたいな話とか
そんなのはまだマシだったのだと今さらに思い知るぜ。
Re:スパムブログ? (スコア:1)
リンク先一緒はともかく外部ブログの場合ブログ自体は別なものの中身一緒でアフィリエイトっての多いんで
Spam4割でもそれくらいかなぁ・・・って感じですね。
基本プロフの段階でスルーするんで自分が多いなーとは感じないですけど・・・
多いだろうなって実感はあります。
ブログじゃないけど (スコア:0)
ぐぐったりやふったりして引っかかってきたのがこれだと萎える。
お前らのブックマークには興味はない!!
-site:b.hatena.ne.jp
しないと鬱陶しい。
# "b." はいらない気がするけど…
Re: (スコア:0)
価格.comはまだいいんですよ。大体の商品にレビューか口コミはついていますから。
それ以外のサイトは……。
Re: (スコア:0)
購入するサイトはあらかじめ決めており、商品のレビューを知りたいのに、出てくるのは通販サイト、通販サイトへのリンク(価格比較)ばかり。
キーワードに”レビュー”を追加してサイトを訪ねてみれば、レビュー(0)とか。
通常のweb検索ではなく、ブログ検索ではどうかと試してみたら、4割どころか・・・。
Re:ブログじゃないけど (スコア:2, 参考になる)
検索 (スコア:0)
普通のアフィリエイト利用者には申し訳ないですが、誰かFirefoxの拡張でアフィリエイトリンクを判断して無効にするものを作ってくれないですかね。
アフィリ殺し (スコア:1, 興味深い)
Re: (スコア:0)
使っているのにぶつぶつ言っているのはアナタですよ。
アントワネット
んでその結果 (スコア:0)
Weblogは全部フィルタリングしても構わない (スコア:0)
何か役にたったと思えるものも、実は一時情報へたどり着くための壁にしかなっていない事が多いのです。
トータルで考えたら検索ノイズにしかなっていませんので、全部フィルタリングして貰った方が嬉しいです。
全部フィルタリングするのと最適なフィルタリングの違いは誤差の範囲ぐらいしかない筈です。
Re:Weblogは全部フィルタリングしても構わない (スコア:1, 興味深い)
当時、上手くいかないことがあって、解決法をあちこち探し回って、結局見つからなくて、試行錯誤してようやく解決した小技なんですがね…
#そのエントリ以外は文字通り「ゴミ」しかないよ
もっと多いはず (スコア:0)
同じサーバにどんだけSPAMブログがあるかわかる。特にMovable Typeを使ったやつが。
泣きたくなるよ・・・
90%がスパムなんてサービスも… (スコア:0)
スパムが多いとこは何箇所かあるけど、seesaaは他の追随を許さない圧倒的な比率ですね。
昔、テクノラティが「seesaaはスパムが多いね」って言ってたけど、ここまで来るとサービス自体がspamな気も。
http://d.hatena.ne.jp/TAK_TAK/20071129 [hatena.ne.jp]
Re: (スコア:0)