shn 曰く、 "Googleでプログラミングコンテストが行われるそうです (ネタ元[impress])。生Webページ 90万件に対して「何か面白い事」をするコードを書け!との事
優勝者には、10000ドルの賞金と、米Google社への招待、それにもしかしたらGoogleで実際にコードが使われるかもしれないとのこと。言語はC++/Java、20億ページ分のデータに適用した時にも問題の無い時間で処理できる事、それを英語で説明できる事が条件で締切は2002年4月30日だそうです。
う、うずうずしてきました"
誰が渡すか (スコア:2, すばらしい洞察)
20億ページに対してスケールするようなもので 面白い結果の出るようなアイディアを、たかだか 1万ドルであげちゃうなんてそんな太っ腹な人が いるだろうか。ケチくさい発想だけど、正直そう思います。 まだまだこの分野、金を出すところはいくらでもあるよ。
Re:誰が渡すか (スコア:3, すばらしい洞察)
でも、あなたが企業に埋没している一プログラマーで、有能なのに埋没してしまっていているなら、こういう機会は自分の名声を勝ち取るチャンスですから、十分利用すべきです。
アイデアを売るとはいえ、この規模のコンテストなら十分な名声もついてくるんじゃ、と思います。
Re:誰が渡すか (スコア:0)
じゃ、例えばどこがだすのか教えてください。
Re:誰が渡すか (スコア:1)
IBM,Intel,NTT,NEC,etc.
といったところが、よくこの方面の研究に お金を出してきます。20億ページにスケーラブルに 展開できるという話になると高性能計算の分野にも 深く絡んでくるので、結構売り込みやすいのです。 まぁ、自由に使える金がポンと来る、という訳には 行きませんが、個人や小研究室では絶対に構築できないような 計算機環境やデータベースが使えるとか、結構な額の 研究費が使えるとかいったデカいメリットがあるのです。
しかし、アルゴリズムのスケーラビリティを保証するのは 難しいよなぁ…
Re:誰が渡すか (スコア:1, 興味深い)
Re:誰が渡すか (スコア:1)
いや、fundingの実体験(及び知り合いの研究者の話) から書いてるんだが…そこまで勘違いはしてませんって。
Re:誰が渡すか (スコア:1)
すいません、コメントするところ間違えました。 また、私の#60899は私の勘違い(というか短絡思考)でした。 重ねてすいません。
Re:誰が渡すか (スコア:0)
Re:誰が渡すか (スコア:1)
「企業に埋没してる(有能)プログラマー」は そもそもこのコンテストの応募資格はねぇぞ。
と返答しろとでも?
Re:誰が渡すか (スコア:0)
企業として参加するのは不可と書いているだけで、サラリーマンプログラマ(Google社員を除く)が参加してはいけないとは書かれてなさそうですが。
誰かやりそうなこと (スコア:2, 興味深い)
Re:誰かやりそうなこと (スコア:1)
Googleの持ってるデータすべてに対してやって、この前話題になった3次元マップとか作ってみたり。
Re:誰かやりそうなこと (スコア:1)
www.cybergeography.org [cybergeography.org]
中でも An Atlas Of Cyberspaces [cybergeography.org]
Re:誰かやりそうなこと (スコア:1)
3D処理はクライアント側になりますから、GoogleはMCFを吐き出すだけでよく、検索結果をHTMLで吐き出すのと大差なく実現できそうですね。あとはMCFを随時必要な分送信する仕組みさえあれば……MCFストリーミング?
ハイパーリンク構造に対抗して (スコア:1)
世の中にはほかのサイトのコピーを持っている、いわゆるミラーサイトがありますよね。これをgoogleが持っているwebページから掘り起こすというのは?
Googleはキャッシュこそ持っていますが、それがup-to-dateとは限りません。その点ではミラーサイトが検索結果についてくると使いでがあるかなぁ。内容がダブった分を差し引くと、webページの数(異なり数?)ってどれぐらいまで減るんだか...
Re:ハイパーリンク構造に対抗して (スコア:1)
ミラーページである事の判定ってすっごく難しくて、 立派に(?)研究課題となっています。 いちいちマッチングを取ってると20億ページなんて 処理できませんし。
Webページは収集してきたはいいのだけど、 ミラーページの選別除去とかHTML違反のページの処理を どうするかとか、悩ましいです。(コンテストのページから ダウンロードできるソースは参考になってます)
Re:誰かやりそうなこと (スコア:1, 参考になる)
引用元が間違ってるから仕方ないのでしょうが、Zipf's lawです。超有名なので覚えておきましょう。
トートロジーじゃないの? (スコア:1)
この説明 [u-tokyo.ac.jp]を読んだ限りではどう考えてもトートロジー (同義反復) に思えるのですが、なにか内容のある法則なんでしょうか。(上の AC さんのコメントによると有名な法則だそうですので、きっときちんと内容のある法則なんでしょうが...)
それとも、ぼくは、無粋なツッコミをしてしまっているのでしょうか...
Re:トートロジーじゃないの? (スコア:1)
こちらの説明ならわかります。
Re:トートロジーじゃないの? (スコア:0)
しかしTF-IDFの説明なんかの前にはZipfの話は大抵でてくると思うのですが…
Re:トートロジーじゃないの? (スコア:0)
史上最大のソフトウェアコンテスト (スコア:1)
20億ページに適用できて、かつ、ウケを狙うってのは、非常に面白くて、挑戦し甲斐がありますな。
どっかに、ネタが無いかなぁ。(笑)
Re:史上最大のソフトウェアコンテスト (スコア:0)
著作権 (スコア:1, すばらしい洞察)
Re:著作権 (スコア:2, 参考になる)
Re:著作権 (スコア:2, 参考になる)
との事なので、完全に権利を剥奪される訳ではないようです。 ニュースグループ [google.com]でも同様の疑問が出ていて google側からの回答があります。
Re:著作権 (スコア:1)
下手に応募できんな・・・、よくよく考えたら応募する実力も英語力もないんで、そもそも応募できないが(w
# 人生のキャリーオーバー継続中
モデレートについて (スコア:1, 参考になる)
これはモデレードに文句を言うなという事ではなく、モデレードについて意見を言う場所(先)が無いって事が問題なのではという話です。
もちろんメタモデレードというシステムはありますけど、これは自分がおかしいと思ったモデレーションを評価できる訳ではありませんからねえ....。
Re:モデレートについて (スコア:1)
Re:モデレートについて (スコア:1)
あとは、それ自体が埋没(=議論が活かされない)してしまわないことを、祈るのみです。
なし (スコア:1)
みたいなのを書けということか?
---Y^2