パスワードを忘れた? アカウント作成
2223 story

Google Programming Contest開催 33

ストーリー by Oliver
スケーラビリティが鍵 部門より

shn 曰く、 "Googleでプログラミングコンテストが行われるそうです (ネタ元[impress])。生Webページ 90万件に対して「何か面白い事」をするコードを書け!との事
優勝者には、10000ドルの賞金と、米Google社への招待、それにもしかしたらGoogleで実際にコードが使われるかもしれないとのこと。言語はC++/Java、20億ページ分のデータに適用した時にも問題の無い時間で処理できる事、それを英語で説明できる事が条件で締切は2002年4月30日だそうです。
う、うずうずしてきました"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 誰が渡すか (スコア:2, すばらしい洞察)

    by oltio (3848) on 2002年02月08日 0時29分 (#60813) 日記

    20億ページに対してスケールするようなもので 面白い結果の出るようなアイディアを、たかだか 1万ドルであげちゃうなんてそんな太っ腹な人が いるだろうか。ケチくさい発想だけど、正直そう思います。 まだまだこの分野、金を出すところはいくらでもあるよ。

    • Re:誰が渡すか (スコア:3, すばらしい洞察)

      by L.star (163) on 2002年02月08日 1時11分 (#60826) ホームページ
      20億ページに対してスケールするようなもので 面白い結果の出るようなアイディアを、たかだか 1万ドルであげちゃうなんてそんな太っ腹な人が いるだろうか。
      あなたが十分有能な技術者で、万人から認められていて、自分の実力を遺憾なく発揮できる場所があるなら渡すべきではないでしょう。

      でも、あなたが企業に埋没している一プログラマーで、有能なのに埋没してしまっていているなら、こういう機会は自分の名声を勝ち取るチャンスですから、十分利用すべきです。

      アイデアを売るとはいえ、この規模のコンテストなら十分な名声もついてくるんじゃ、と思います。

      親コメント
    • by Anonymous Coward
      > まだまだこの分野、金を出すところはいくらでもあるよ。

      じゃ、例えばどこがだすのか教えてください。
      • by oltio (3848) on 2002年02月08日 3時32分 (#60857) 日記

        IBM,Intel,NTT,NEC,etc.

        といったところが、よくこの方面の研究に お金を出してきます。20億ページにスケーラブルに 展開できるという話になると高性能計算の分野にも 深く絡んでくるので、結構売り込みやすいのです。 まぁ、自由に使える金がポンと来る、という訳には 行きませんが、個人や小研究室では絶対に構築できないような 計算機環境やデータベースが使えるとか、結構な額の 研究費が使えるとかいったデカいメリットがあるのです。

        しかし、アルゴリズムのスケーラビリティを保証するのは 難しいよなぁ…

        親コメント
        • by Anonymous Coward on 2002年02月08日 18時14分 (#61022)
          えーと、自社の研究者に多くのお金を出している、という話ではなくて、今回のコンテストのように第三者に潤沢なfundingをしている所はどこか、という質問だったのですが。単なる高性能計算というキーワードだけで上記の会社に売り込める、というようなヨタ話なら止めてください。
          親コメント
        • by Anonymous Coward
          こっち [srad.jp]への返答はしないんですね =P
          • by oltio (3848) on 2002年02月08日 10時07分 (#60899) 日記

            「企業に埋没してる(有能)プログラマー」は そもそもこのコンテストの応募資格はねぇぞ。

            と返答しろとでも?

            親コメント
            • > 「企業に埋没してる(有能)プログラマー」はそもそもこのコンテストの応募資格はねぇぞ。

              企業として参加するのは不可と書いているだけで、サラリーマンプログラマ(Google社員を除く)が参加してはいけないとは書かれてなさそうですが。
  • by brake-handle (5065) on 2002年02月08日 1時02分 (#60822)
    • 文字コード単位でのエントロピを計算する
      昔Brownが計算したのだと文字単位で4bit弱だったかなぁ... 少なくともgoogleが持っているページはBrown Corpusよりも大きいだろうから、うまくやれば厳密な計算ができるかな?
    • 単語についてZiphの法則 [u-tokyo.ac.jp]を検証する(膠着語などは除外?)
      巨大なコーパスで遊んでみたいこと第2弾。
    • 互いのリンク構造を可視化してみたいなぁ。
      Googleの持ってるデータすべてに対してやって、この前話題になった3次元マップとか作ってみたり。
      親コメント
      • by oltio (3848) on 2002年02月08日 2時12分 (#60841) 日記

        www.cybergeography.org [cybergeography.org]

        中でも An Atlas Of Cyberspaces [cybergeography.org]

        親コメント
      • 元3次元マップ利用者ですが、経験上3次元マップが快適なのは要素数がある一定範囲内に収まっているときです。3次元マップにおいては、
        • 3次元空間の広さは扱う話題 (概念) の幅による
        • 密度は要素数による
        • 要素間距離は関連性 (リンク) による
        のですが、20億ページとなると広さと密度のバランスが取りにくいでしょう。そこで、解像度に応じてGoogle Rankでフィルターをかけるのがいいかと。マクロを見回すときはランクの高いものだけを表示し、ミクロに観察するときはランクの低いものも表示する、という具合に。
        3D処理はクライアント側になりますから、GoogleはMCFを吐き出すだけでよく、検索結果をHTMLで吐き出すのと大差なく実現できそうですね。あとはMCFを随時必要な分送信する仕組みさえあれば……MCFストリーミング?
        親コメント
      • 世の中にはほかのサイトのコピーを持っている、いわゆるミラーサイトがありますよね。これをgoogleが持っているwebページから掘り起こすというのは?

        Googleはキャッシュこそ持っていますが、それがup-to-dateとは限りません。その点ではミラーサイトが検索結果についてくると使いでがあるかなぁ。内容がダブった分を差し引くと、webページの数(異なり数?)ってどれぐらいまで減るんだか...

        親コメント
        • ミラーページである事の判定ってすっごく難しくて、 立派に(?)研究課題となっています。 いちいちマッチングを取ってると20億ページなんて 処理できませんし。

          Webページは収集してきたはいいのだけど、 ミラーページの選別除去とかHTML違反のページの処理を どうするかとか、悩ましいです。(コンテストのページから ダウンロードできるソースは参考になってます)

          親コメント
    • by Anonymous Coward on 2002年02月08日 2時50分 (#60852)
      > Ziphの法則

      引用元が間違ってるから仕方ないのでしょうが、Zipf's lawです。超有名なので覚えておきましょう。
      親コメント
    • この説明 [u-tokyo.ac.jp]を読んだ限りではどう考えてもトートロジー (同義反復) に思えるのですが、なにか内容のある法則なんでしょうか。(上の AC さんのコメントによると有名な法則だそうですので、きっときちんと内容のある法則なんでしょうが...)

      それとも、ぼくは、無粋なツッコミをしてしまっているのでしょうか...

      親コメント
  • かもしれませんねぇ。スケーラビリティーという点では。

    20億ページに適用できて、かつ、ウケを狙うってのは、非常に面白くて、挑戦し甲斐がありますな。

    どっかに、ネタが無いかなぁ。(笑)
    • たとえばさ、/.j チームで参加してみるとか。ここならきっとネタはあるけどコードはかけない、って人と、コードはかけるけどネタはない、ってひとがいるはず。oliver 日記あたりにみんなでネタを書き込んで(笑)、モデレータ達で代表選考するとか・・
  • 著作権 (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2002年02月07日 23時54分 (#60790)
    ルールをダウンロードしてないから、アレだけど、インプレスに依ればソースコードの権利は google のものなの??それって酷くないですか?google が買い取る権利を有する、ならまだしも。ソースコードは著作物ではないの??プログラマにはそんな意識はないのかしらん?
    • Re:著作権 (スコア:2, 参考になる)

      by shimpei (1499) on 2002年02月08日 0時21分 (#60806)
      元サイトより。
      With regard to the software and repository that you obtain for the Contest, you agree to the license terms as stated in files you download or receive. With regard to an entry you submit as part of the Contest, you grant Google a worldwide, perpetual, fully paid-up, non-exclusive license to make, sell, or use the technology related thereto, including but not limited to the software, algorithms, techniques, concepts, etc., associated with the entry.
      Googleが要求しているのは、BSDとほぼ同じような条件でコードをライセンスして貰うことだけで、著作権まで渡せとはどこにも書いてありません。Non-exclusive licenseですから、著作者がGoogle以外の第三者にライセンスを付与することも可能です。
      親コメント
    • Re:著作権 (スコア:2, 参考になる)

      by oltio (3848) on 2002年02月08日 0時25分 (#60811) 日記
      you grant Google a worldwide, perpetual, fully paid-up, non-exclusive license to make, sell, or use the technology related thereto, including but not limited to the software, algorithms, techniques, concepts, etc., associated with the entry.

      との事なので、完全に権利を剥奪される訳ではないようです。 ニュースグループ [google.com]でも同様の疑問が出ていて google側からの回答があります。

      親コメント
    • by bcom (4253) on 2002年02月08日 0時21分 (#60805)
      しかも、落選したソースも全部そーなのかな?
      下手に応募できんな・・・、よくよく考えたら応募する実力も英語力もないんで、そもそも応募できないが(w
      --
      # 人生のキャリーオーバー継続中
      親コメント
  • by Y2 (1614) on 2002年02月08日 0時42分 (#60817) ホームページ 日記
    電波ニュース [so-net.ne.jp]
    みたいなのを書けということか?
    --
    ---Y^2
typodupeerror

吾輩はリファレンスである。名前はまだ無い -- perlの中の人

読み込み中...