パスワードを忘れた? アカウント作成
14953 story

中国産検索エンジン「百度」が日本語検索サービスを開始 43

ストーリー by yoosee
多少は行儀良くなったようですが 部門より

x-AC 曰く、

去年末に日本の検索エンジン市場への参入を表明した、中国の検索エンジン「百度 (baidu.com)」だが、このほど日本語検索ページでのサービスを開始したようだ。 中国で百度をトップに押し上げる原動力になった、MP3 などの音楽ファイルの検索機能などは実装されていないようで、テキストと画像のみの検索になっている。 これで、オーストラリアのMooter、日本のSAGOOL、 そして百度と新興検索エンジン御三家のそろい踏みといった感じになったわけだが、 はたしてYahooとGoogleの2強体制にどれぐらい影響が与えられるだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by unchikun (14429) on 2007年03月22日 20時47分 (#1130296)
    おぉ、
    「悪徳商法?マニアックス」
    がトップに!!

    これでGooogle八分を気にしなくてすむね。
  • by Anonymous Coward on 2007年03月22日 11時35分 (#1129960)
    あのはた迷惑な baiduspider 動かしておいて、何をキレイごと抜かしとるんじゃ!
    ……と思ったら、いつの間にか方針 [baidu.jp]変えとったんだね。

    #とはいえ、一度染み付いた悪印象は拭いがたいものだが。
    • Re:botの方針変えたらしい (スコア:3, おもしろおかしい)

      by Anonymous Coward on 2007年03月22日 12時54分 (#1130020)
      まとめると、

      「日本の習慣にあわせて『お百度参り』をさせていたが、願いがかなわなかったので取り止めた」

      ということでよろしい?
      親コメント
    • by Anonymous Coward on 2007年03月22日 11時56分 (#1129977)
      あ、ホントだ。
      謝罪まで掲載してるのは好感持てるね。

      でも、やっぱ一度染み付いた悪印象は私もなかなか拭えません。
      htaccessの設定を変える気は当分無いな
      親コメント
      • >でも、やっぱ一度染み付いた悪印象は私もなかなか拭えません。

         いや、まったく。
         403を返しているのに以前収集したリストに従って数アクセス/秒 [homeunix.net]なんてされたら、いい感情は持てないです。

        >htaccessの設定を変える気は当分無いな

         同様に、robots.txtを変える気にはなれません。

        …が、

        122.152.128.48 - - [22/Mar/2007:17:06:20 +0900] "GET / HTTP/1.1" 200 12769 "-" "
        Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
        122.152.128.48 - - [22/Mar/2007:18:06:11 +0900] "GET / HTTP/1.1" 200 12769 "-" "
        Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
        122.152.128.48 - - [22/Mar/2007:19:05:34 +0900] "GET / HTTP/1.1" 200 12769 "-" "
        Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
        122.152.128.48 - - [22/Mar/2007:20:05:51 +0900] "GET / HTTP/1.1" 200 12769 "-" "
        Baiduspider+(+http://www.baidu.com/search/spider_jp.html)"
        あれれ?なんで?…と思ったら
        User-Agent: baiduspider
        Disallow: /
        となっていました。
         心優しいgooglebotやmsnbotは、"User-Agent: *"を、仕方ないなぁ"User-agent: *"なんでしょ?、と大目に見ていたようです。

         1時間おきに/を見に来るようなロボットはどうよ?と思うので、robotx.txtを訂正して、改めてbaiduspiderにはお引き取り願うことにしました。
        親コメント
        • by FTNS (17738) on 2007年03月23日 15時28分 (#1130715)
          私のhttpd.confを見ていたら、以下のような記述がありました
          当時相当に頭にきていたと思われます。
          ---
          :
          # Baiduspider
          # Chinese bad-behavior crawler
          Deny from 60.28.*.*
          :
          :
          SetEnvIf User-Agent "[Bb][Aa][Ii][Dd][Uu][Ss][Pp][Ii][Dd][Ee][Rr]" CrawlerAgent
          SetEnvIf User-Agent "http:¥/¥/www¥.baidu¥.com¥/" CrawlerAgent
          :
          :
          <Directory "/usr/local/www/***/data">
              AllowOverride ....
              Options ....

              Order deny,allow
              Deny from env=CrawlerAgent
          </Directory>
          ---
          今は....やっぱり開ける気はしません。
          今時衛星破壊実験やってしまうような国のサービスに、協力する義務も義理も人情も無い訳で。
          #中国で政府と無関係でインターネットサービスできると思えますか?
          --
          --- de FTNS.
          親コメント
      • by Anonymous Coward on 2007年03月22日 16時51分 (#1130163)
        個人的な意見ですが、

        baiduの横暴に腹を立てた多くの人は遮断してエラーすら返さなかった。
        サイトがエラーを返さないとtimeoutまで待機しなければならない。
        そういうサイトが増えすぎるとbotの運用に支障が出るようになる。
        そこで迂回するほどbaiduのbotは賢くない(笑
        時間帯的にアクセスピークを避けるのは、反省したからではなく日本語サイトがオープンしたから。
        要するにbaiduとしてはアクセスピーク時はリソースをbotに回すより検索利用者に回したい。
        もちろん各サイトの都合を考慮したからではない。
        ここ半年ほど狂ったようにbaiduが増えたのが日本語サイトのオープンに合わせたやっつけ仕事。
        一通り漁ったので、後は更新とるだけなのでそんなにbotをまわさなくて良い。

        やっちまえば勝ち的な考えをしているところとは付き合いきれない。
        親コメント
        • >やっちまえば勝ち的な考えをしているところとは付き合いきれない。

          ネット上のいろんなサービスが該当するんですが
      • >でも、やっぱ一度染み付いた悪印象は私もなかなか拭えません。

        ウチでは.htaccessで真っ向拒否してるんですが、何の気なしにドメインで検索したら見事に引っかかっていましたよ。
        それもつい5日前のキャッシュがしっかりと残っていました。

        あわててログをひっくり返したらこんなアクセスがでてきましたよ。
        122.152.128.47 - - [17/Mar/2007:13:24:49 +0900] "GET /security/ HTTP/1.1" 200 30806 "-"
        "Mozilla/4.0 (compatible; MSIE 5.0; Windows 98; DigExt)"
        …UA詐称してますかそうですか。

        しかもrobots.txtの「User-agent: baiduspider」を無視していたり、METAタグのNOARCHIVEまで無視していたり…。
        またタダでさえ馬鹿でかい.htaccessがまたでかくなるのか…。
        親コメント
    • 一時期、管理しているサイトのアクセスの90%が
      baiduspiderになったことを思い出しました。。。。
    • 自宅サーバの日記のカレンダー部分だと思うのだが、
      無限に深い URL に落ちながら、大量アクセスをかけてくれた。
      サーバの CPU 負荷が高くなり、最初はクラックされたと勘違いして
      すごく焦った。すでにパケットフィルタでアクセスを禁止してます。

      他の方、同様、パケットフィルタを戻すなんでないだろう。
      # MP3 データ検索なんて、節操の無いサービスがまかり通る所は
      # 相手にできん。
      ## といったら、YouTube のような節操の無いサービスがまかり通る Google は.....
  • これを機に百度・SAGOOL・MOOTERを試していて気付いたのは、
    自分が無意識のうちにGoogleの検索結果ならこうでるであろうと言う予測を頭に入れて検索していることでした。
    あぁ、いつのまにかGoogleに毒されてるなと思いましたよ。
    硬直した情報集めに喝を入れるには、非常にいいんじゃないでしょうか。

    「ザッと見た脊椎反射的感想」
    百度
    結構いい結果を吐く。特に、昔からあるサイトのプライオリティのプラス補正をかけていない様なので、意外と新鮮で興味深いサイトが並ぶ。
    SAGOOL
    サイト内のリンク構造とかを無視して脱線しすぎ。でも、逆にこれはこれで昔のGoogleの面白さを感じた。暇つぶしになる?
    MOOTER
    パッと見では特徴がよくわからない。Googleとそっくりな結果が多くて…。ブログフィルターかけても何か変。
    --
    =-=-= The Inelegance(無粋な人) =-=-=
    • >MOOTER
      >パッと見では特徴がよくわからない。Googleとそっくりな結果が多くて…。ブログフィルターかけても何か変。

      ギャー、思い切り重要な機能をスルーしていました。
      関連用語を自動でピックアップして絞れる機能は非常に面白いですね。
      自分の要求と合っていると、かなりサクサク情報に行き当たるというか、そうやって絞ってからこそ本領発揮の様で。

      でもまだ関連キーワードの収集が不十分な気配。これからか。
      --
      =-=-= The Inelegance(無粋な人) =-=-=
      親コメント
    • でも、ぶっちゃけ最近ぐぐると、ソーシャルブックマークやトラックバックばかり引っかかって、肝心の情報が上位に来ないような気がする。
  • さっそく (スコア:3, 興味深い)

    by Anonymous Coward on 2007年03月22日 11時25分 (#1129951)
    「天安門」で検索してみるとWikipediaの天安門事件のページが一番に #日本語向けには検閲は無いようで
    • Re:さっそく (スコア:2, 興味深い)

      by 9nu (12793) on 2007年03月22日 11時59分 (#1129980)
      チベットでの検索結果
      Google [google.co.jp]
      百度 [baidu.jp]

      こんなかんじでした
      --
      犬が犬であるように、猫でありたい
      親コメント
      • Re:さっそく (スコア:1, おもしろおかしい)

        by Anonymous Coward on 2007年03月22日 14時30分 (#1130086)
        #113077 [srad.jp]でSAGOOLが出されてたので
        そんなものあるんだーとサイトをたずねてみたのだが。

        今このキーワードが検索されてます
        チベット

        ……slashdotedしないことを祈る。
        親コメント
        • Re:さっそく (スコア:2, おもしろおかしい)

          by soltiox (25610) on 2007年03月22日 15時53分 (#1130120) 日記
          今見たら、「百度」とか「チベット」とかが・・・

          // まだ定時前だぞ!みんな仕事しろよ!
          //// 定時とやらが何時かは知らないけどね
          親コメント
        • by Anonymous Coward
          SAGOOLのこの機能っていずれspammerに悪用されるだろうな
          あと自分とか知人の名前で検索するのが恐い
    • by Anonymous Coward
      NGワードで弾くのは「検閲」じゃなくて「フィルタリング」ね。

      #中国本社にはキーワードのレポート上げるんだろうか
  • 見た感じ (スコア:2, 参考になる)

    by 127.0.0.1 (33105) on 2007年03月22日 13時30分 (#1130045) 日記
    見たところ、Googleクローンで広告がないって感じですね。
    検索結果については使い込んでいないのでよく分からない。
    現状ではGoogleから乗り換える必要性を感じない。
  • by Anonymous Coward on 2007年03月22日 14時42分 (#1130090)
    ダイナミックDNSサービス Dynamic DO!.jp 経由で
    百度から10日ほど前にメールが来てました
    クローラーで負荷かけてごめんなさい、これからはクロールを減らしますみたいなメールだった
  • by sen_nen (33420) on 2007年03月22日 15時57分 (#1130122)
    どうでも良いんだけどさ。

    日本語の会話の中で「百度」って出てきた時にはなんて発音すればいいんだろう。
    中国語の発音通りに「バイドゥ」?
    日本語の発音に合わせて「ヒャクド」?
  • by Daichi_K (3005) on 2007年03月22日 16時03分 (#1130126) 日記
    「中華」「BOT」「RMT」「ラグナロク」「マビノギ」「リネージュ」

    等で検索してみました(笑)

    ・・・大した面白くなかった(爆)

  • なんかページデザインがGoogleのパクリ臭くありません?
    トップページ [baidu.jp]はともかく、検索オプション [baidu.jp]までGoogleそっくりなのは・・・
    (参考:Googleの検索オプションページ [google.co.jp])

    #誰がどうやってもそうなるとは言えない似方加減
  • by Anonymous Coward on 2007年03月22日 11時30分 (#1129954)
    検索エンジンってなかなか独自価値を表現しづらい。
    敵失がないと牙城に食い込めないんじゃないかなぁ。
    • いやいや (スコア:4, 参考になる)

      by Anonymous Coward on 2007年03月22日 11時38分 (#1129962)

      中国では

      「百度の唯一のアドバンテージがmp3捜索なのに、それがなくなったらなんのとりえもな い」
      という話 [itmedia.co.jp]です。Winnyと同程度に普及する可能性はあると思います。

      JASRACとのガチンコバトルを期待(w

      親コメント
  • by Anonymous Coward on 2007年03月22日 16時48分 (#1130159)
    今のメジャーなブラウザは、基本的に検索エンジンと契約して、デフォルトのエンジンを決めています。メジャーな検索エンジンは、今はブラウザから多くのトラフィックを貰っています。ところが、これら新興検索エンジンは、おそらく、いまだにウェブブラウザと関係を持っていません。自社では提供しているかもしれないけど。

    なので、SAGOOLの人は、いますぐMS、MJ、OperaJPなどと営業するように。
  • >>中国産検索エンジン「百度」が日本語検索サービスを開始
    で、できれば百年持つという意味であれの名前にしてほしい
  • by Anonymous Coward on 2007年03月22日 19時52分 (#1130256)
    NAVER [cnet.com]のことを思い出してしまいましたよ。
typodupeerror

目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond

読み込み中...