パスワードを忘れた? アカウント作成
7895 story

フラッシュモブでスパコン、TOP500入りはならず 13

ストーリー by Oliver
明日があるさ 部門より

otk曰く、"持ち寄ったPCをグリッド接続してスパコンTOP500へのランクインを目指そう!(/.J過去記事)というサンフランシスコ大学のイベント「FlashMob I」が3日、無事に開催されたそうです(HOT WIRED日本語版の記事)。 公式サイトの発表によれば、会場には700台を超えるPCが持ち寄られ、うち669台をネットワーク接続。Linpackベンチマークでピーク時性能180Gflops(256台使用)を出したものの1台のマシンで演算トラブルが発生、結局完全に稼働した記録としては77Gflops(150台使用)とのこと。残念ながらTOP500入りはできませんでしたが、「Instant Supercomputer」というカッコいいテーマは、とりあえず達成された…のかな? なお、会場の写真や持ち寄られたマシンのスペックなどのデータは、スライドでお楽しみいただけます。また公式サイトから、このイベントで使用した1CD LinuxのISOイメージもダウンロードできますので、好事家の方はどうぞ:)。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Anonymous Coward on 2004年04月06日 2時54分 (#527079)
    「Instant Supercomputer」?
    「インスタント」ですら無いように見えますしね。
  • by Anonymous Coward on 2004年04月06日 9時08分 (#527148)
    PCの安定性の無さを露呈させて終わった様にも思えるが...。
  • by Anonymous Coward on 2004年04月06日 10時25分 (#527174)
    768台とか1024台集めて稼働させないとランクイン出来なさそうな感じですね。
    本体はもちろんの事、電源やネットワークも安定しないと厳しい感じだし。
    • by allyourbase (14654) on 2004年04月06日 14時38分 (#527376) 日記
      top500 [top500.org]を見ると分かりますが,self madeのPCクラスタとしては128並列や
      256並列でも結構上位に食い込んでるんです.ですからそういうまじめに
      組んだPCクラスタと比較するとflash mob Iの計算効率の悪さがたいへん目立ちます.

      おそらくネットワーク性能の悪さや並列計算の方法に問題があるとは思うのですが,
      この手の問題を解決して並列化率を向上させない限り計算機の台数増加による
      性能向上は期待できないでしょう.(アムダールの法則 [google.co.jp])
      並列計算機の性能は足し算ではないんです.

      で,このプロジェクトを趣味や娯楽でやってるならともかく
      発起人は、Flashmobのコンセプトが最終的に世界の温暖化やAIDSなどの研究で、莫大な演算能力を必要とする問題の解決に導入されることを望んでいる。 [itmedia.co.jp]
      と本気で言ってるのなら今回の失敗の原因を分析して再挑戦してほしいですね.

      #self madeクラスタを組んで研究に使っている方は/.jにもいると思うのですが,
      #そういう方々はこのプロジェクトをどういう気持ちで見ていたんでしょう.
      親コメント
      • Re:次回に期待? (スコア:1, すばらしい洞察)

        by Anonymous Coward on 2004年04月06日 17時52分 (#527460)
        この場合、並列化率じゃなくて並列化効率。
        今回はどのくらいの並列化効率でした?>allyourbaseさん
        親コメント
        • by allyourbase (14654) on 2004年04月06日 20時37分 (#527536) 日記
          あーそうか,尺度としてはそちらが適切かも.
          並列化率は全演算のうち並列実行できる演算の割合を示し,並列化効率は
          逐次(非並列)実行と比較してどのくらいCPUを使えているかを示す尺度です.
          並列実行すると通信のオーバーヘッドや同期待ち等でCPUの性能を使い切れなくなるので.

          で,私に計算を振られても困るんですが一応…

          今回は実際にはヘテロクラスタでしたが,各CPUの性能は同一と仮定してみます.
          資料を一応見てみましたが,Pentium4の2GHzくらいにしときましょう.
          このクラスだとLinpackは1GFlopsいくと思います.
          で,150台で77GFlopsという数字を用いて計算しますと並列化効率は51%,
          アムダール則を仮定すると並列化率は99.4%でしょうか.
          CPUの能力を半分くらい無駄に捨てていることになるのかなぁ?
          激しくどんぶり勘定なのでこれ以上のツッコミは勘弁してください.

          私の聞いた話だとLinpackはチューンナップが非常に重要なベンチマークなので
          そっち方面の工夫が今後必要になるのでしょう.
          親コメント
          • by Anonymous Coward
            Pentium 4の2GHzなら、単体で、Linpack 2.4GFlopsくらいは出ます。

            あと、その、並列化率99.4%っていうのは、どうやると算出できるんでしょう???

            嘘の垂れ流しはそろそろ止めてください。

            並列化効率と並列化率も、急いでググったんでしょ?
            • by allyourbase (14654) on 2004年04月06日 23時06分 (#527587) 日記
              > Pentium 4の2GHzなら、単体で、Linpack 2.4GFlopsくらいは出ます。

              参考になります。コレ [flashmobcomputing.org]をみて低めに見積もってみたんですが。

              > あと、その、並列化率99.4%っていうのは、どうやると算出できるんでしょう???

              nプロセッサ並列によって得られた性能の向上率をSnとします。このとき
              Sn=T1/Tn
              となります。T1は1プロセッサでの演算時間。Tnはnプロセッサでの演算時間です。
              また、アムダールの法則によれば並列化率をaとすると
              Sn=1/(1-a+a/n)
              と表すことができます。いまT1を適当に仮定し、nとTnにさっきのコメントの
              値を入れますと並列化率aとなります。本来のaの定義とはちょっと違いますね。

              > 嘘の垂れ流しはそろそろ止めてください。

              返す言葉もございません。

              > 並列化効率と並列化率も、急いでググったんでしょ?

              あんまり分かってないので急いで地球シミュレーターの資料をひっくり返して探しました。
              上の式はその資料に書いてあるものです。
              親コメント
    • by SteppingWind (2654) on 2004年04月06日 10時57分 (#527198)

      いや, 逆に台数が増えれば故障の起こる確率が上がるわけですから, 安定せずに測定不可なんてこともあるかも. 比較的電源変動に強くて, 少なくとも1回はメーカの検査を受けたはずのノートPCに限定とかすればいけるのかも.

      # なんか真空管式計算機の話に似てきた気がする.

      親コメント
      • ソフトを頑張らないと (スコア:3, すばらしい洞察)

        by tmiura (6268) on 2004年04月06日 12時54分 (#527302) 日記

        コモディティクラスタ(しかも品質の揃った新品でなく 個人の持ち寄りという信用ならないものの集積)なんだから 計算が終わるまで壊れないように祈るだけってのは 問題意識として間違ってないでしょうか。 という知見も今回の収穫かも。

        ベンチマークだからLinpack自体はあまりいじれないだろうけど、 下位のライブラリ(BLASとか)に 故障耐性を持たせる研究が不可欠じゃないかな。

        親コメント
typodupeerror

日々是ハック也 -- あるハードコアバイナリアン

読み込み中...