本家インタビュー:Googleに訊け! 33
「ないと困る」サイトの裏事情は? 部門より
yh 曰く、 "ちょうど1年前、本家で募られたGoogleへの質問に同社のテクノロジ担当ディレクタであるクレイグ・シルバースタイン氏が回答を寄せている。Googleはその成功がなにかともてはやされており各所でその記事を読むことができるが、このインタビューは、本家のNerdたちの質問に答えたという点でユニークなものに仕上がっている。以下はそのインタビュー部分を訳出したもの。
今回も多くの方々との共同作業となりました、別に記して感謝申し上げます。"
"1) 前から思っていたけど
by lblack
Googleはいつも、市場への商品の投入が早く、そのソフトウェアは実によく練り上げられていて、それを支える背骨も常にしっかりしているように見えます。
新機軸を導入する原動力は何ですか? ハードウェア・チームが設計を改善してソフトウェア・チームの遊ぶ余地を広げているのか、あるいはソフトウェア・チームが「見てみろよ、こんなの作ったぞ」と言うとハードウェア・チームが機材を投下してそれを実装することになるわけですか?
何らかのレベルの協同作業が行われているのは承知していますが、完璧に一体になっているんですか、それともどちらかが事実上もう片方を引っ張っていっているのでしょうか。
クレイグ:
実際には、原動力になっているのはハードウェアでもソフトウェアでもなくて、製品です。私たちは周囲を見渡して、「次はどんなすごい製品を作ってやろう」と言って、その製品がうまく機能するためにはどういうソフトウェアとハードウェアが必要か見きわめるんです。その見きわめが「おお、コードが準備できて一般の使用に供するまでに2週間とかかりそうもないぞ、ということは、新しいマシンが2,000台必要なんだけど発注して届けてもらってインストールするための時間も十分あるわけだ」という具合にいけば――その、Googleに新機軸がはなばなしく出てくる環境というのはこんな感じなんです [:-)]。
2) ネットワーク管理ツール/技術
by kaladorn
Googleのサーバ群をサポートしているのはどんな技術ですか? 自動監視や障害報告にはどの種のツールが使われているのでしょうか? 自社製のものなのか、オープンソース、あるいは(スクリプトなどの)カスタマイズを加えた市販品なのでしょうか? もしネットワーク管理の範疇で「もっと改良できる、あるいはもっと良いツールがあるだろうに」と言えるような点がありましたら、それはどのような点でしょうか?
クレイグ:
サーバ群をサポートしている技術のほぼすべては自社製のものです。とても効率よくシステムを築いてきましたので、10,000台を超えるコンピュータも、両手で数えるほどのオペレータでメンテナンスできます。
もちろん、大規模な冗長性には大きな恩恵を受けています。多くの企業とは違い、コンピュータが1台、2台、あるいは100台死んだとしても、すぐに心配する必要はありません。死んだコンピュータのクローンはたくさんありますからね。
10,000台を超えるコンピュータを抱える上での一番の問題は、可視化に基づいた管理ツールが仕事の役に立たなくなるということです。UIがいくら優れていようと、効率的に機能するには(例えば間違った方向に)行き過ぎてしまうことが多々あるからです。このレベルになると、本当にプラスになるのは問題を指摘するだけのツールではなくて、それを直してくれるものです。もちろん、そのための一般的なツールを書くのは難しいことです。「問題を直す」ということは通常、非常にアプリケーション固有のものですから。
3) マーケット・リーダーとして…
by Marx_Mrvelous
あなたがたがLinuxメガクラスタを使ってらっしゃることは広く知られていますが、MSやSunやHPからそれらのプロプライエタリなOSに乗り換えてほしいとアプローチされたことはありませんか?
そうでないとは想像できません。1つのテクノロジに投資するのは大きな決断であったに違いありません。あなたがたは今お持ちの環境にご満足なのですか?
クレイグ:
いくつかのベンダからの接触はありましたが、私たちにとってLinuxを使う利点は非常に大きいです。私たちの開発者にとって非常になじみやすい環境なのです。Linuxでは、卓越したテクニカル・サポートが受けられます。(私たちはいつも、問題があった場合は、1つ1つのコードの作者にじかに話をつけます。それから、安価――私たちには10,000台以上のコンピュータがあり、非常に考慮する点です。
Linuxがここで動いているというのは、また、私たちの技術文化が理由でもあります。私たちの技術者は、カーネルの問題をデバッグする協力者たることを心地よく感じているのです。「ネットワークが遅いんです」だから誰かにどうにかさせようというようなバグ・レポートを上げる会社とっては、Linuxはおそらくまだ理想的な選択ではないのでしょう。
「なぜFreeBSD(ないし他のUNIXライクなOS)でなくてLinux なのか」という疑問もあるでしょう。この問題については、私たちは宗教的立場は取っていません。私たちは、まだスタンフォードにいた頃も――他のプロプライエタリなUNIX系OSはもちろんのこと――Linuxも使っていて、それで満足でした。他のオープンソースのUNIXライクなOSを使っていたとしても、同様に満足だったと思います。私たちにとってうまく動作するということについては、私たちはとても実用的な立場でいるのです。
4) Googleがカッコいいままでありつづけるのは
by rob_from_ca
どのようにしたら、短納期で結果を出すことを求める商売上の圧力を避けて、マーケティング的な視点をそのままあてはめることなく、良質で皆の納得いくようなアイディアを実現し続けていけるのでしょうか? Googleは検索エンジン技術が素晴らしいだけでなく、変わることなく「正しい」ことを続けています。ゴテゴテしてなく、軽いトップページ、テキストのみでも分かりやすい広告、興味深い研究プロジェクト等々…。これは、多くの検索エンジンの開始当初と同じですが、皆、「闇」の方へ行ってしまって「正しい」方法を捨ててしまっています。私は、決済権を持つ人からの圧力をうけつつ、良心的な(あるいは、単に常識的な)仕事を納得してすることに非常に困難を感じています。「上司のおもいつき」を受け入れるのではなく、よく考えて決めたことをやり遂げるのに何かいいアドバイスはありますか?
クレイグ:
それは、マスコミに悪い印象を抱くようなちょっと酷で鋭い質問ですね。でも、rob_from_caさんはマスコミの人ではない――ですよね?――ので、おいておきましょう。
対象をユーザ体験のみにレーザーのようにしぼった事業を始めるのは容易でも、企業として成長する中でそれを続けていくのは大変だと私も思います。
Googleがユーザにフォーカスしていく上で重要だったことが2つあります。ひとつは、創業者が会社の中で活動し続けていること。私たちの会社の基礎は彼らの活動から流れてくるものです。ラリー・ペイジの専門はユーザ・インタフェイスですし、それが、Googleのサイト・デザインや私たちのやっているすべてのプロジェクトに現れています。ラリーもサーゲイ・ブリンも、ユーザの方を向いていれば、――金銭を含めて――他のすべてのものがついてくると固く信じています。
もうひとつの重要なことは、あまり強調はできませんが、雇用です。私たちのユーザ中心主義に同意するだけじゃなくて、それを大事にしてくれる人を雇ってきています。今いえることは、バナーよりもテキスト主体の広告を独自開発の広告システムを使って表示していくという方針を、業務開発・営業担当副社長のオミッド・コーデスタニがいかに大事にしてくれたかということに、言い表せないほど感銘を受けていることです。今でこそ報われているけど、3年前はこの方針に全然自信がありませんでした。
5) GoogleとIPアドレス
by Anonymous Coward
なぜここ最近、Googleはバーチャル・ホストのサイトを冷遇しているのです? IPアドレスを取得するのが日々難しくなるなか、なぜGoogleは固定IPアドレスでないところからのリンクの関連づけをカットしてしまうのです? どうか否定するだけということはないようにしてください。インターネット・コミュニティはこれを説明するべきだと思うのです。
クレイグ:
否定するだけなのはだめですか? 他に選択肢はないのでしょうか?[:)] 実際には、Googleはバーチャル・ホストのドメインのサイトを扱っているし、それらとも固定IPアドレスのものと同様に関連づけています。もし、あなたのISPがバーチャル・ホスティングを正しく行っていれば、固定IPアドレスの場合でもバーチャル・ホストの場合でも違いはないのです。何パーセントかのISPがバーチャル・ホストの設定ミスをしているのを、毎月見つけているのですが、それらがこの根強い誤解をもたらしているのです。――迷信を晴らす機会を与えてくれてありがとう!
6) 学習の重みづけ
by jolshefsky
ウェブが成長していくにつれ、検索キーワードを関連するウェブサイトと対応づける手法は変らざるをえません。Googleのアルゴリズムは、検索にヒットした内容を、総体的な人気や、METAタグのキーワード、METAタグの記述、TITLEタグの中身、ページの中身、URLに含まれる文字列、等々に重みづけをして合計したものを順位づけに使っていると想像しています。
この重みづけはこれまでどのように変ってきたか、ちょっとだけ教えていただけませんか? その変化にびっくりするような転換はありましたか?
クレイグ:
a) 変ってないと思います。b) ノーコメントです。
7) 退化
by Have Blue
インターネットは分散システムだから単一障害が全体の障害とはならないと、いつも説明されます。一方で、Googleは情報の位置を探す方法として、抜きん出て有名な存在になりました。最近の検索技術によって、「ネットサーフ」は死語となりました。Googleを見るほうが、を見てまわるより簡単なのです。Googleが使えなければ、インターネットはずっとずっと使いにくいでしょう。
Googleはインターネットを無力化しうる急所であると思いますか? インデクスの肥大化競争を続けていくと、インターネットは中央集約型になりますか? また、それは悪いことでしょうか?
クレイグ:
インターネットが分散しているというのは事実ですが、インターネット・サービスについては事実ではありません。そのことについては、数年前にNetwork Solutionsがルート・ネームサーバの設定をしくじったことがありましたが、あれではっきりとわかりました。たしか、DNSが元通りに直るまでインターネットは基本的に使いものになりませんでした。
実際、検索エンジンが発展していくことが、インターネット(まぁ、この場合はですが)が中央集約化していくことの現れだとは思いません。仮にそうだとしたら、人々は集約化されたレジストリだけで、何であれ知りたいものを探すことができるでしょう。現状では、情報はのいたるところに広がっています。だから、Googleのようなインデクスを使うことではじめてすべてをまとめることができるのです。
8) 大手優先
by PenguinRadio
Googleの“ランキング”ポリシーは、トラフィックの小さなウェブサイトより“大手”サイトを優先しているのですか? Googleでは、“湾岸戦争”というキーワードでは、例えば、100%湾岸戦争だけを扱っているサイト(gulfwarveterans.com)よりもCNNの方が高いランキングを得ているというようなことなんですが。あなたがたは、小さなサイトに対して(例えば、有力大手の)の商業化を推進していると思いませんか?
クレイグ:
えぇっと、私がここで言いたいことは既にこの質問に対するSlashdotの議論で言い尽くされています。
ですが、自分の言葉で言いますと: Googleは実際にはトラフィック(“ヒット数”)解析をランキングで使っている訳ではありません。つまり、ランキングとは、各サイトがお互いにどの様にリンクしあっているかということを完全に元にしているのです。このアプローチのひとつの帰結として、gulfwarveterans.comの様にひとつのことに焦点を絞っているサイトでは、大手サイトに載っているような日々流れていくニュース・ストーリなどよりも、それゆえに多くのリンクをより集めやすいのです。
実のところ、“湾岸戦争”をGoogleで検索してみると、gulfwarveterans.comも含めて、湾岸戦争の復員兵を扱ったサイトの2つがトップ5に入るのですよ。
9) ドット・コム企業の変化?
by Telastyn
先日、Googleはいまだ型どおりの「スタートアップ」型企業だと聞きました。仕事をやり遂げる限りもたらされる士気。ホッケー、プール、(私の記憶が正しければ)Grateful Deadの元シェフ、などなど数多くの特典。
Googleでは、その成長の中でその雰囲気を維持してきたのでしょうか? 他所ではうまくいかないながらも?
クレイグ:
Googleを、そこで時間を過ごすのを好きになってもらえるような場所にしようと私たちはたくさんの注意を払っています。最近では、日本からマッサージ・チェアを輸入してきました。だから、マッサージ師の通常勤務時間外でもマッサージができるんです。(彼女たちだってそのチェアを使ってるんですよ!)
当初からこのように設けていました。(休憩室にはHealthy Choiceのグラノーラ・バーが置いてあります。これはサーゲイの案です。M&M'sも食べ放題です。これは私の案です。)私たちはそれを長所だと思っています。そういった取り組みは、損を招くのではなく生産性に資するのだ、と考えているのです。同僚と会議室で討論をするとしましょう。それでは、コミュニケーションはそのふたりだけ、とかなり限られたものとなってしまうのです。プールで遊びながら討論をするなら、すぐに会社の半分がそばに寄ってきてコメントする機会を持つことになるのです。
10) Googleの第1回プログラミング・コンテスト
by PK_ERTW
Googleでは、賞金が$10,000となる最初の「年間プログラムコンテスト」を開催しましたね。多くのスラッシュドットの読者は、それは単に、才能ある新人の獲得手段だろうと疑っています。で、このプロジェクトでは新人発掘が当初の目的だったのでしょうか? また、この結果を直接受けて誰か新しいプログラマを雇いましたか? その他の目標(PRや新規アイディアの創出など)は、何がありましたか?
クレイグ:
第一の目的は、楽しむことと、みんなに膨大な情報で何ができるかを考えてもらうことにありました。もし、みんなが検索やデータ・マイニングに分野に熱中してくれれば――誰もプログラムを送ってくれなかったとしても――、研究分野全体としては利益になるし、究極的にはGoogleもまた利益を得ることになるのです。
みんなが送ってくれたものが何であるにせよそれには私たちは非排他的権利しか持たないと、条件にうたわれているところから私たちの態度がうかがってもらえるでしょう。もし、プログラムから本当によいアイディアが出てきたなら、それを使いたいと望んだでしょう。また反対に、コンテストをコンサルテーションの代わりか何か(つまり、私たちが排他的権利を得るようなもの)として使ってはいません。さらに仮定ですが、良いプログラムを書いてきた作者が私たちのところで働きたいと言うなら、それは望外ですね。このプロジェクトに熱中したようなみんななら、私たちの文化に馴染めるって分かっていますから。
11) クレイグはもういいから
by Talisman
シルバースタインさん、悪気があるわけではないのですが、私はむしろシンディ[・マッキャフレー]についての興味があるんです! 美人で、成功しているオタクなんて稀にもいないじゃないですか!
これ、オフトピじゃありませんよね。シルバースタインさん、シンディが身体の線のわかるようなセーターを着るとどんなカンジなんですか?
クレイグ:
仮にもちょっとでも調べたならば、シンディがGoogleの企業広報担当副社長であることはわかりますよね。だから、彼女はGoogleへの問合せ、例えばこのインタビューみたいなものに積極的に対応する役割を担っています。実のところ、わたしがこれを書いているとき彼女が肩越しに見ています。で、これだけは言いたいのですが、彼女ってですね… おい、シンディ、なにすんだい。そのボタン押すんじゃない! おい! えrwく8ぽぁせwrv■■NO CARRIER"
国際化 (スコア:3, すばらしい洞察)
これでは、速いとか遅いとか、UI が優れているかどうかとか、そういう一切の議論以前に、日本人にとって存在しないも同然であり、Google が唯一の選択肢になってしまいます。
逆に、日本語の単語を検索できるようになっているということだけで、Google は日本において圧倒的な優位 (ナンバーワンどころかオンリーワン) を保つことができているわけです。
まあ、いまだに欧米では「国際化とは翻訳のことだ」といった幼稚な考え方が生きており、Google は幼稚じゃなかったということにすぎないのですが。
Re:国際化 (スコア:1, 興味深い)
どう考えてもアドレスにうろ覚えの2バイト文字書き込むよりgoogleツールバーにキーワード書き込む方が簡単ですよね。
結局何が必要かってのが見えてないんですよね。
国内の偉い人ってのは。
最後の質問 (スコア:2, すばらしい洞察)
Re:最後の質問 (スコア:2, 参考になる)
付け加えたといっても彼が勝手に作った質問ではなくて、 応募されて選ばれなかった質問の中にそういうコメントがあった [slashdot.org]のを、自ら引っ張り出して答えたみたいですよ。
google つながり (スコア:2, 参考になる)
一流ジャーナリストに「神」と書かせるGoogleのオーラ [cnetnetworks.jp]
それは、さておき、
google の監視システムに大変な興味がありますね。
UI が不要って言うなら、
OpenView とかはダメなんでしょうか?
どなたか優秀な監視システム知りません?
Re:google つながり (スコア:2, 参考になる)
「可視化に基づいた管理ツールが仕事の役に立たない」
といった部分で、アイコンがずらずら並ぶような管理システムでは
10,000台の監視はやってられないっていう意味にとらえました。
自分で修復してくれるシステムっていうのはステキですね。
-- yuno
Re:google つながり (スコア:2, 参考になる)
> OpenView とかはダメなんでしょうか?
台数があまりにも多いので、UIだと効率的に監視・管理できない、ということですよね。すくなくとも、Googleの環境ではOpenViewみたいなGUIツールは使えないって事でしょう。
多分、これはGUIツールの設計前提によるものだと思います。通常、こういったGUIツールは、いくつかの箇所に分散された数十~数百台の計算機を解り易く管理する事を目的に作られているのだと思います。そういったツールの場合、箇所ごとのマップが表示できたりとか、IPサブネット単位で表示できたりという機能が必要になるのだと思います。
一方、Googleのような環境ではおそらく、箇所ごとに表示する機能はともかくとして、IPサブネットごとに表示するような機能はあまり意味を成さないのではないかと思います。
また、一般的なツールの場合、GUIで表示する方が解り易い、というメリットを採る場合が多いと思いますが、Google環境では、TEXT表示の方が一覧できる情報密度が高い、というメリットを採るのではないでしょうか。
と、私の考えではこの程度のことしか思い浮かびませんが、ツッコミがあればどうぞ。
> どなたか優秀な監視システム知りません?
Scotty [utwente.nl]はどうでしょう?ダメか。
Re:google つながり (スコア:1)
どんなに見やすくしていてもある程度規模が大きくなると
単一のノードを探す時に結局IPアドレス等で検索したりします。
ましてや階層化が出来ないフラットなクラスタリングシステムだと
ひとつの窓にアイコンが10,000個も並んだらどうなるか・・・
って事で「GUI」は向いてないと。
OpenView自体はとても優秀なツールだと思いますよ。
ただ、何事も向き不向きがあるということで。
Re:google つながり (スコア:1)
今のところの難点ですね。
# 技量がないからかか。
自分で作った ping 監視や HTTP 監視は
ある程度スケジュールを入力できるようにしたんですけどね。
SNMP がらみも自分で作るとなると時間かかるな。
Re:google つながり (スコア:1)
この中に「社員全員(いまは800人から1000人の間)」と記述があるが、一体どんな仕事をしているのだろうか?
#オペレータは両手で数えるほどだし…。
Re:google つながり (スコア:3, おもしろおかしい)
Re:google つながり (スコア:2, 参考になる)
Facilities は重要だよ (スコア:1)
10,000台もマシンがあれば、日に数台は駄々こねたり拗ねてふて寝するのも出てくるだろうし。
それに、10,000台を接続するためのネットワーク機器の保守や、調子の悪い機器の交換や代替機の手配や管理。
キャリアと違って一カ所に集中しているとはいえ、それなりの台数の面倒見るためにはそれなりの人数は必要でしょうから。
--- どちらなりとご自由に --- --
Re:google つながり (スコア:1)
> 一流ジャーナリストに「神」と書かせるGoogleのオーラ [cnetnetworks.jp]
この記事のページの投稿システムがちょっと面白かったです。
見た目が同じなら、記者ごとに投稿システムを変えてもOKっていうスタンスですかね。
MovableTypeを使ってるみたいですけど、Trackbackで関連リンクが見れたりしてこういうのがBlogの強みなんだなあと思いました。
Re:google つながり (スコア:1)
1600x1600のスクリーンがいるよなぁ。。。
1万台もあったら (スコア:0)
10時間に1台は壊れる計算…でいいんでしたっけ?
# すげぇ!
Re:1万台もあったら (スコア:0)
ほんとに「消耗品」っていう表現がぴったりかもしれませんね。
Netscape(Re:google つながり (スコア:0)
社内の様子を語っている部分を読んでいると昔の Netscape社(当時)を思い出しました。
Netscape設立時は追い立てられるように猛烈な勢いでコードを書きつづけたようですね。 [cruel.org]
Googleの経営陣 (スコア:2, 参考になる)
Poolはビリヤード (スコア:2, すばらしい洞察)
> company has wandered by and had the opportunity to comment.
a game of poolといえば泳ぐプールではなく玉遊びの方でしょう。イギリスではbilliardというそうですがアメリカではpoolです。
Re:Poolはビリヤード (スコア:1)
7) 退化 [質問部]
- Googleを見るほうが、を見てまわるより簡単なのです。
+ Googleを通して見るほうが、Web自体を見るより簡単なのです。
あと、gives the press a bad name は、文字通り「マスコミに悪名を与える
(マスコミの名を落とす)」ではないかと……ほんとかな。
やっぱりどうでもいい部類ですが。
創業守勢 (スコア:2, すばらしい洞察)
偉大なブレイクスルーだと思います
「創業は易く守勢は難し」
という言葉がありますが
守だけでなく今の攻める姿勢を保ちつつ
頑張ってください
# google本社行ってみてー
# んでメシ食いたい
謝辞 (スコア:1)
各設問の訳文は下記のみなさまから頂戴いたしました(敬称略)。感謝申し上げます。( )内は設問の番号です。
zokkon (1)
float (2)
BAK&tiptree (3)
umq (4)(6)(7)(11)
tiptree (5)
tetsuya (8)
hayami (9)
Jadawin (10)
NO CARRIER (スコア:0)
10000台ものマシンを管理できているシステムというのは本当にすごいですね。成功してるけどガツガツしてるわけでもない、というのが成功の理由かもしれないな、と思うのでした。好きであり、楽しんでるからこそだそうで、うらやましい。
好きこそものの上手なれ、こうありたいものです。
Re:NO CARRIER (スコア:1)
このインタビューは,無手順でおこなわれたのか?
なんで DISCONNECT ではないのか?
ひょっとしてインタビューの相手は,コンピュータか?
(Googleの技術部門おそるべし.)
Re:NO CARRIER (スコア:1, 興味深い)
ニュアンスは、当人の意図しない状況により後が続けられなくなった…といったところです。
例えばこんな感じに使います
「13歳少女メイド! ああ、変なスイッチがhA・>娑`曾g;慂c>角?蹲{マノNO CARRIER」
DISCONNECTだと、意図的に回線を切った感じになって、ニュアンスがかわってしまいますし、文字化けのような異常感が出せなくなってしまいます。
ムリに考えての利用法は、こんな感じになるのでしょうか
「13歳少女メイド.... DISCONNECT」
つまり、逃げたっていうニュアンスですか。
NO CARRIERとDISCONNECTの違いは、NO CARRIERでは必ず文字化けを作る必要があるけれども、DISCONNECTは逆に文字化けを作ってはならないところだと考えます。
さて、少し関係ない話になりますが、私はいわいる「パソ通」が流行ってた頃、NO CARRIERをよく使いました。しかし、ソノママの文字列では使えなかった記憶があります。
理由は、一部の通信ソフトの自動巡回マクロにおいて、NO CARRIERという文字列を受信すると、DISCONNECTしてくれるものがあったためです。
そこで、半角スペース(0x20)を全角スペース(0x8140-SJIS)に置き換えて使ってました。
# これだけ書いておいて、実は、懐かしい表現を見つけて妙にうれしいと言いたいだけなのでAC
このページは漢字変換の壊れた... (スコア:0)
最後の「■■」はどこから来たのでしょうか?
シンディ (スコア:0)
野郎の性(さが)と云う事か…。
# 野郎なのでAC
Re:シンディたん (スコア:1, 参考になる)
Re:シンディ (スコア:0)
#大人なのでAC
Re:シンディ (スコア:0)
お 嬢 さ ん。
#そういうトコだけみのもんたを見習ってみる。
Re:シンディ (スコア:0)
>年増に萌えてこそ真の大人だ。
萌えなかったので逝ってくる…
いまだに (スコア:0)
# あ、米国はこの点に関しては遅れているんだったっけ。失礼。