パスワードを忘れた? アカウント作成
11135 story

Blue Gene/L、ついにフルスペックに 56

ストーリー by Acanthopanax
2倍8倍 部門より

あるAnonymous Coward曰く、"過去のストーリーで、Blue Gene/Lが地球シミュレータを抜いたことが話題になっていましたが、このときは8192ノードで予定の8分の1でした。それがついに完成し、65536ノードのシステムになりました。演算性能は280TFLOPSになっています。
Blue Gene/Lは、アメリカの安全保障を担うという(ような)理由で納入されたシステムですので、TOP500の首位を明け渡す日はかなり遠そうです。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by locate (5848) on 2005年10月30日 21時26分 (#822754) 日記
     BlueGeneが流体(または連続体)の計算に使えるか考えてみます。
     3次元空間で流体を1024x1024x1024の流体要素に分割したとして、
    要素数は1,073,741,824。これを65,536ノードで分割すると各ノード
    あたり 16,384要素。16,348の立方根を取ると約25なので、各ノードは
    25x25x25の流体要素を持つ流体を計算すれば良いことになります。
    このうち表面に位置する流体要素は別のノードから情報をもらわないと
    計算できません。25x25x25要素のうち表面にある要素数は3,458要素
    です。表面にある要素の割合は3,458/(25x25x25)=0.221 なので、全
    要素のうち約22%はノード内で計算できず、ノード間通信が必要になり
    ます。22%もあれば全計算のうちノード間通信が計算時間のほとんどを
    占めることになり、理論的なピーク性能はまず出ません。それどころか、
    数十分の一の速さとなるでしょう。
     つまり、ノード内のプロセッサ数が少なく、ノード数だけをやたら増
    やしたBlueGeneは流体計算には向いていないということになります。お
    そらくノード間通信機器も市販品を使っているだろうから、地球シミュ
    レータに比べると桁違いに遅いでしょう。(地球シミュレータはノード
    数640、ノード間通信速度12GB/sです。)
     ではBlueGeneがどういう計算に向いているかというと、ノード間の通
    信がほとんどない計算、つまりパラメータランに近い計算でしか、ピー
    ク性能は出ないでしょう。初期値を65535通り作って、それらを独立に
    各ノードに流すような計算です。これだと、PCを65536台並べてLANケー
    ブルをつなげた物と何ら変わりがないですね。
     もちろん厳密には計算アルゴリズムなどに依るので、ここでの単純な
    見積もり通りにはなりませんが、少なくともBlueGeneと地球シミュレー
    タが全く異なるタイプのスパコンであり、単純に比較できない事は分か
    るかと思います。
    • by oltio (3848) on 2005年10月30日 22時09分 (#822803) 日記
      いまどき 1024^3 というのも随分小さな要素数だと思いますが、それはともかくノード間通信はそこらの Giga-bit Ether よりかはかなり
      複雑なものになっています。(Giga-bit Ether も補助的に使われていますが)

      詳しくは IBM のジャーナルなど参照してください。
      親コメント
    •  ローレンス・リバモア国立研究所で使うっつってるんだから察しようよ。キノコ雲の形計算してもしょうがないんだから。
      親コメント
    • スーパーコンピュータのようにカスタマイズされチューニングされ、限界まで専用の速度が出るように作られた特殊なコンピュータは、もうすでに「世界一早いコンピュータ」という指標はふさわしくないということでしょうか。

      いずれ普通のPCにもそういう時代がくるのかな。
    • > おそらくノード間通信機器も市販品を使っているだろうから、

      何故? 非常に重要な部分を、このように曖昧な
      推測で片付けられても。ここが「非常に高速な専用品」であった
      場合は、地球シミュレータとの比較はどうなるのでしょうか。
      • > ここが「非常に高速な専用品」であった
        > 場合は、地球シミュレータとの比較はどうなるのでしょうか。

        計算速度は、ノード間通信の比率でほぼ決まってしまいます。
        ノード間通信が多ければ、計算速度は極端に遅くなります。
        そこがボトルネックになるからです。

        もし、ノード数もノード内計算速度も同じなら、ノード間通信速度
        が重要になりますが、BlueGeneのノード間通信速度は地球シミュレータ
        のそれの9分の1です。

        親コメント
      • それなりに高性能なものがCPU二つといっしょにワンチップになっとる。
    • >おそらくノード間通信機器も市販品を使っているだろうから
      と仮定して
      >LANケーブルをつなげた物と何ら変わりがないですね

      と結果をだす論法ですか?前半で計算した内容を
      >もちろん厳密には計算アルゴリズムなどに依るので、ここでの単純な見積もり通りにはなりませんが

      と否定しているので、結果として中身が無いんですね。
  • by onnoji (27294) on 2005年10月30日 11時13分 (#822439)
    意味があるか判りませんが、上位のを出してみた。(同じっぽいの省いてますが)
                       Rmax   Rpeak
      1:BlueGene/L           2.087  2.8
      2:BGW               2.228  2.8
      3:Columbia             5.105  6
      4:Earth-Simulator         7.004  8
      5:MareNostrum          5.816  8.78
      7:Thunder             2.915  5.6
    10:Red Storm, Cray XT3, 2.0 GHz 3.05  4
    11:Cray XT3, 2.4 GHz        3.78  4.8
    12:ASCI Q              1.694  2.5
    13:eServer pSeries p5 575 1.9 G  6.392  7.6
    14:System X             5.568  9.2

    #1ノードあたりという時点で何かアレなんですがID
  • by Anonymous Coward on 2005年10月30日 12時02分 (#822444)
    それはペンティアムMMX200Mhzと比べると 何倍の性能?

    ##2日ぶりにうんこでたよ、カズ君。
    • by typer (9666) on 2005年10月30日 18時20分 (#822617) 日記
      >それはペンティアムMMX200Mhzと比べると 何倍の性能?

      これ荒しかねぇ。もっともな疑問だと思うけど。

      で、http://performance.netlib.org/performance/html/PDSreports.html [netlib.org]
      なんて物を見つけたけど、N=100とか1000とか、よくわかりませんが、Pentium 200MHzクラスは0.1GFLOPSということでよろしいですか?で、同じような性能に、"Cray-1S"なんてあるんですが、これはかの有名な「クレイ1」でしょうか?
      もしそうなら、「インターネットも出来ないうんこ性能」と呼ばれそうな、この0.1GFLOPSを1クレイ15億と名付けたいですが。あっているか教えて!えろい先生!
      #10クレイ150億で/.を読む小市民より
      親コメント
  • by Anonymous Coward on 2005年10月30日 7時50分 (#822404)
    「海賊インベーダー・パイレーツ」
  • by KAMUI (3084) on 2005年10月30日 7時57分 (#822407) 日記
    ・・・16bit?(違)
  • 日本なら、(地球に優しく)少ないエネルギーでいかに計算するかってな、技術が生まれればいいですね。
  • by yanagi (6075) on 2005年10月31日 0時38分 (#822898) ホームページ 日記
    MTBF、MTTFがどのくらいか分かりませんが
    全ノードが使える期間はどのくらいあるんでしょうね。
    稼働率が0.99だと、1台の故障もないのは0.99^65535で
    8.9635067617210234943250440080409e-287
    0.9999だと0.0014246520124877113179958683656428

    これのメンテナンスを続けるIBMの苦労はかなりの
    モノではないかと思います。
    --
    やなぎ
    字面じゃなく論旨を読もう。モデレートはそれからだ
    • Re:稼働率 (スコア:2, 参考になる)

      by Anonymous Coward on 2005年10月31日 6時55分 (#822988)
      つeLiza

      安藤氏の古い解説によるとフルスペック時の目標MTBFは10日だそうです。
      これは自己修復込みでしょうから、長いのか短いのか…微妙。
      親コメント
    • by ko-ji.t (21285) on 2005年10月31日 2時01分 (#822947)
      1.ノードは最大で65536まで搭載できます
      2.プログラム時に使用できるのは搭載ノード数の255/256までです。
      3.よって、65536ノード搭載の場合、65280ノードまで使用可能です。

      とでもすればいいじゃないですか。
      Cellの7/8に比べれば十分効率的です。
      親コメント
  • by Anonymous Coward on 2005年10月31日 18時20分 (#823363)
    RegattaはCPUが壊れたからといって交換しようとすると
    CPUモジュール全体を交換しなければならないそうで
    で、モジュール全体というのは32個入りだそうで

    壊れてもとりあえずそのCPUはオフラインにしておいて放置
    というのが基本みたいだけど、どういうタイミングで交換するんだろうなぁ?
typodupeerror

UNIXはシンプルである。必要なのはそのシンプルさを理解する素質だけである -- Dennis Ritchie

読み込み中...