フラッシュモブでスパコン、TOP500入りはならず 13
ストーリー by Oliver
明日があるさ 部門より
明日があるさ 部門より
otk曰く、"持ち寄ったPCをグリッド接続してスパコンTOP500へのランクインを目指そう!(/.J過去記事)というサンフランシスコ大学のイベント「FlashMob I」が3日、無事に開催されたそうです(HOT WIRED日本語版の記事)。 公式サイトの発表によれば、会場には700台を超えるPCが持ち寄られ、うち669台をネットワーク接続。Linpackベンチマークでピーク時性能180Gflops(256台使用)を出したものの1台のマシンで演算トラブルが発生、結局完全に稼働した記録としては77Gflops(150台使用)とのこと。残念ながらTOP500入りはできませんでしたが、「Instant Supercomputer」というカッコいいテーマは、とりあえず達成された…のかな? なお、会場の写真や持ち寄られたマシンのスペックなどのデータは、スライドでお楽しみいただけます。また公式サイトから、このイベントで使用した1CD LinuxのISOイメージもダウンロードできますので、好事家の方はどうぞ:)。"
カッコいい.. ですか? (スコア:0)
「インスタント」ですら無いように見えますしね。
Re:カッコいい.. ですか? (スコア:1)
(↑激しくつっこまれそうな悪寒)
でも、たま~に猛烈に恋しくなるんですよ。
後でやっぱり失望するってわかってても...
Kiyotan
Re:カッコいい.. ですか? (スコア:0)
なんか、逆に (スコア:0)
Re:なんか、逆に (スコア:0)
次回に期待? (スコア:0)
本体はもちろんの事、電源やネットワークも安定しないと厳しい感じだし。
Re:次回に期待? (スコア:3, 興味深い)
256並列でも結構上位に食い込んでるんです.ですからそういうまじめに
組んだPCクラスタと比較するとflash mob Iの計算効率の悪さがたいへん目立ちます.
おそらくネットワーク性能の悪さや並列計算の方法に問題があるとは思うのですが,
この手の問題を解決して並列化率を向上させない限り計算機の台数増加による
性能向上は期待できないでしょう.(アムダールの法則 [google.co.jp])
並列計算機の性能は足し算ではないんです.
で,このプロジェクトを趣味や娯楽でやってるならともかく
と本気で言ってるのなら今回の失敗の原因を分析して再挑戦してほしいですね.
#self madeクラスタを組んで研究に使っている方は/.jにもいると思うのですが,
#そういう方々はこのプロジェクトをどういう気持ちで見ていたんでしょう.
Re:次回に期待? (スコア:1, すばらしい洞察)
今回はどのくらいの並列化効率でした?>allyourbaseさん
Re:次回に期待? (スコア:2, 興味深い)
並列化率は全演算のうち並列実行できる演算の割合を示し,並列化効率は
逐次(非並列)実行と比較してどのくらいCPUを使えているかを示す尺度です.
並列実行すると通信のオーバーヘッドや同期待ち等でCPUの性能を使い切れなくなるので.
で,私に計算を振られても困るんですが一応…
今回は実際にはヘテロクラスタでしたが,各CPUの性能は同一と仮定してみます.
資料を一応見てみましたが,Pentium4の2GHzくらいにしときましょう.
このクラスだとLinpackは1GFlopsいくと思います.
で,150台で77GFlopsという数字を用いて計算しますと並列化効率は51%,
アムダール則を仮定すると並列化率は99.4%でしょうか.
CPUの能力を半分くらい無駄に捨てていることになるのかなぁ?
激しくどんぶり勘定なのでこれ以上のツッコミは勘弁してください.
私の聞いた話だとLinpackはチューンナップが非常に重要なベンチマークなので
そっち方面の工夫が今後必要になるのでしょう.
Re:次回に期待? (スコア:0)
あと、その、並列化率99.4%っていうのは、どうやると算出できるんでしょう???
嘘の垂れ流しはそろそろ止めてください。
並列化効率と並列化率も、急いでググったんでしょ?
Re:次回に期待? (スコア:1)
参考になります。コレ [flashmobcomputing.org]をみて低めに見積もってみたんですが。
> あと、その、並列化率99.4%っていうのは、どうやると算出できるんでしょう???
nプロセッサ並列によって得られた性能の向上率をSnとします。このとき
Sn=T1/Tn
となります。T1は1プロセッサでの演算時間。Tnはnプロセッサでの演算時間です。
また、アムダールの法則によれば並列化率をaとすると
Sn=1/(1-a+a/n)
と表すことができます。いまT1を適当に仮定し、nとTnにさっきのコメントの
値を入れますと並列化率aとなります。本来のaの定義とはちょっと違いますね。
> 嘘の垂れ流しはそろそろ止めてください。
返す言葉もございません。
> 並列化効率と並列化率も、急いでググったんでしょ?
あんまり分かってないので急いで地球シミュレーターの資料をひっくり返して探しました。
上の式はその資料に書いてあるものです。
Re:次回に期待? (スコア:1)
いや, 逆に台数が増えれば故障の起こる確率が上がるわけですから, 安定せずに測定不可なんてこともあるかも. 比較的電源変動に強くて, 少なくとも1回はメーカの検査を受けたはずのノートPCに限定とかすればいけるのかも.
# なんか真空管式計算機の話に似てきた気がする.
ソフトを頑張らないと (スコア:3, すばらしい洞察)
コモディティクラスタ(しかも品質の揃った新品でなく 個人の持ち寄りという信用ならないものの集積)なんだから 計算が終わるまで壊れないように祈るだけってのは 問題意識として間違ってないでしょうか。 という知見も今回の収穫かも。
ベンチマークだからLinpack自体はあまりいじれないだろうけど、 下位のライブラリ(BLASとか)に 故障耐性を持たせる研究が不可欠じゃないかな。