あるAnonymous Coward曰く、"過去のストーリーで、Blue Gene/Lが地球シミュレータを抜いたことが話題になっていましたが、このときは8192ノードで予定の8分の1でした。それがついに完成し、65536ノードのシステムになりました。演算性能は280TFLOPSになっています。
Blue Gene/Lは、アメリカの安全保障を担うという(ような)理由で納入されたシステムですので、TOP500の首位を明け渡す日はかなり遠そうです。"
さらに元を辿るとエジソンの頃まで遡れるので、「本来のBug」と言い切るのはどうかと。 コンピューター関係のバグに限って言えば、大変有名な「Bug」が歴史に残っています(1947年、Harvard MarkII のリレーに虫がはさまっていた)が、ただ、この頃にも障害・ミスのことを "bug" と言い表す習慣があったことは、この時のノート(件の虫がテープで貼られている)に "First actual case of bug being found" と書き沿えられていることからも明らかです。
ピーク性能はでるの? (スコア:5, 興味深い)
3次元空間で流体を1024x1024x1024の流体要素に分割したとして、
要素数は1,073,741,824。これを65,536ノードで分割すると各ノード
あたり 16,384要素。16,348の立方根を取ると約25なので、各ノードは
25x25x25の流体要素を持つ流体を計算すれば良いことになります。
このうち表面に位置する流体要素は別のノードから情報をもらわないと
計算できません。25x25x25要素のうち表面にある要素数は3,458要素
です。表面にある要素の割合は3,458/(25x25x25)=0.221 なので、全
要素のうち約22%はノード内で計算できず、ノード間通信が必要になり
ます。22%もあれば全計算のうちノード間通信が計算時間のほとんどを
占めることになり、理論的なピーク性能はまず出ません。それどころか、
数十分の一の速さとなるでしょう。
つまり、ノード内のプロセッサ数が少なく、ノード数だけをやたら増
やしたBlueGeneは流体計算には向いていないということになります。お
そらくノード間通信機器も市販品を使っているだろうから、地球シミュ
レータに比べると桁違いに遅いでしょう。(地球シミュレータはノード
数640、ノード間通信速度12GB/sです。)
ではBlueGeneがどういう計算に向いているかというと、ノード間の通
信がほとんどない計算、つまりパラメータランに近い計算でしか、ピー
ク性能は出ないでしょう。初期値を65535通り作って、それらを独立に
各ノードに流すような計算です。これだと、PCを65536台並べてLANケー
ブルをつなげた物と何ら変わりがないですね。
もちろん厳密には計算アルゴリズムなどに依るので、ここでの単純な
見積もり通りにはなりませんが、少なくともBlueGeneと地球シミュレー
タが全く異なるタイプのスパコンであり、単純に比較できない事は分か
るかと思います。
Re:ピーク性能はでるの? (スコア:2, 参考になる)
複雑なものになっています。(Giga-bit Ether も補助的に使われていますが)
詳しくは IBM のジャーナルなど参照してください。
Re:ピーク性能はでるの? (スコア:1, 参考になる)
Re:ピーク性能はでるの? (スコア:1)
> それはともかくノード間通信はそこらの Giga-bit Ether よりか
> はかなり複雑なものになっています。
1024^3がずいぶん少ないとは、どういう事でしょう?
どれくらいが計算できると思っていますか?
2048^3にしても、ノード間通信比率はほとんど変わりませんよ。
BlueGene/Lのノード間通信速度ですが1.4GB/s [nistep.go.jp]だそうです。
地球シミュレータと一桁違いますね。
Re:ピーク性能はでるの? (スコア:1)
Re:ピーク性能はでるの? (スコア:0)
いずれ普通のPCにもそういう時代がくるのかな。
Re:ピーク性能はでるの? (スコア:0)
何故? 非常に重要な部分を、このように曖昧な
推測で片付けられても。ここが「非常に高速な専用品」であった
場合は、地球シミュレータとの比較はどうなるのでしょうか。
Re:ピーク性能はでるの? (スコア:1)
> 場合は、地球シミュレータとの比較はどうなるのでしょうか。
計算速度は、ノード間通信の比率でほぼ決まってしまいます。
ノード間通信が多ければ、計算速度は極端に遅くなります。
そこがボトルネックになるからです。
もし、ノード数もノード内計算速度も同じなら、ノード間通信速度
が重要になりますが、BlueGeneのノード間通信速度は地球シミュレータ
のそれの9分の1です。
Re:ピーク性能はでるの? (スコア:0)
Re:ピーク性能はでるの? (スコア:0)
と仮定して
>LANケーブルをつなげた物と何ら変わりがないですね
と結果をだす論法ですか?前半で計算した内容を
>もちろん厳密には計算アルゴリズムなどに依るので、ここでの単純な見積もり通りにはなりませんが
と否定しているので、結果として中身が無いんですね。
1ノードあたりの数値とか・・・ (スコア:3, 参考になる)
Rmax Rpeak
1:BlueGene/L 2.087 2.8
2:BGW 2.228 2.8
3:Columbia 5.105 6
4:Earth-Simulator 7.004 8
5:MareNostrum 5.816 8.78
7:Thunder 2.915 5.6
10:Red Storm, Cray XT3, 2.0 GHz 3.05 4
11:Cray XT3, 2.4 GHz 3.78 4.8
12:ASCI Q 1.694 2.5
13:eServer pSeries p5 575 1.9 G 6.392 7.6
14:System X 5.568 9.2
#1ノードあたりという時点で何かアレなんですがID
教えて偉い人 (スコア:0)
Re:教えて偉い人 (スコア:3, おもしろおかしい)
Re:教えて偉い人 (スコア:1, 興味深い)
ノード辺りの性能が高いほうが、ノード間の通信が少なくてすむ。
つまり、実運用でのパフォーマンス低下が少ない可能性が高いのです。
#と、適当にいい加減なことを言ってみる
Re:教えて偉い人 (スコア:0)
ノード性能にみあった通信性能が要求されることもある。
BGはこちらのほうは不得手でES有利。
Re:1ノードあたりの数値とか・・・ (スコア:0)
Re:1ノードあたりの数値とか・・・ (スコア:3, 興味深い)
構造解析とかに使うのでしょうか。
一億ぐらいのセットでしたがこれの演算能力はどんなものでしょう。
さすがにAC
Re:1ノードあたりの数値とか・・・ (スコア:1)
Re:1ノードあたりの数値とか・・・ (スコア:0)
それは・・・・MMXで言うと (スコア:2, おもしろおかしい)
##2日ぶりにうんこでたよ、カズ君。
Re:それは・・・・MMXで言うと (スコア:2, 参考になる)
これ荒しかねぇ。もっともな疑問だと思うけど。
で、http://performance.netlib.org/performance/html/PDSreports.html [netlib.org]
なんて物を見つけたけど、N=100とか1000とか、よくわかりませんが、Pentium 200MHzクラスは0.1GFLOPSということでよろしいですか?で、同じような性能に、"Cray-1S"なんてあるんですが、これはかの有名な「クレイ1」でしょうか?
もしそうなら、「インターネットも出来ないうんこ性能」と呼ばれそうな、この0.1GFLOPSを1クレイ15億と名付けたいですが。あっているか教えて!えろい先生!
#10クレイ150億で/.を読む小市民より
Re:それは・・・・MMXで言うと (スコア:0)
最近のPCに慣れてると実行結果を想像するのも怖いなぁ。
これを使ってやってみたい (スコア:1, おもしろおかしい)
Re:これを使ってやってみたい (スコア:2, おもしろおかしい)
int main( void ){
printf( "hello world." );
}
-- gonta --
"May Macintosh be with you"
Re:これを使ってやってみたい (スコア:1)
脱線 (Re:これを使ってやってみたい) (スコア:1)
まあ、JIS X 3010 : 2003 によると、
だそうなので、規格上は合法だと言い返されればそれまでなのですけどね。 気持ち悪いということなら同意します。
Re:これを使ってやってみたい (スコア:0)
printf("hello world.\n");
だったな。
#確か GNU でも移植してた記憶が
Re:これを使ってやってみたい (スコア:1)
# まず65536個forkして...
Re:これを使ってやってみたい (スコア:1, 参考になる)
Re:これを使ってやってみたい (スコア:0)
デスクにMPI本は必須ですね。
Re:これを使ってやってみたい (スコア:0)
個人的にはMPIには未来は無いと思う.
地球シュミレータはスパコンと言うよりは専用コンピュータに近いと思うし,LINPACKが早いと言ってもそれを性能指標にしている事自体アレゲ過ぎる.
国策のスパコンもどうもまずは性能ありきのようだが,ユーザが使いやすい物を開発してもらいたいもんだ.
# 多分,人気ランキングと性能ランキングの順位は異なるはず
Re:これを使ってやってみたい (スコア:2, 参考になる)
古い資料 [linuxdevices.com]だが、計算ノードにはスクラッチから作った軽量のOSがのっていて、MPIの他、Co-arraysとUnified Pararell Cが使えて、シングルシステムイメージ(全体で1台のコンピュータに見える)の運用も考えられているらしい。
ときどき言われるように、生物系の小さいプロセス(プログラム)をたくさん走らせるのが目的なら、MPIで出来ないこともないが、高水準のAPIを使ったほうが効率が良いような気がするなあ。
Re:これを使ってやってみたい (スコア:1)
回路がショートしたり、技師が配線を1カ所だけ間違えたり、
太陽フレアの発生で宇宙線が異常に増えたりして、
意志を持ち始めたりしないだろうか。
その後は当然人類の粛正を始めるわけですが。
Re:これを使ってやってみたい (スコア:3, 参考になる)
最近はコーディングミス(チョンボ)をバグと呼んでいますが、
これが本来のBug [wikipedia.org]ですね。
Re:これを使ってやってみたい (スコア:3, 参考になる)
コンピューター関係のバグに限って言えば、大変有名な「Bug」が歴史に残っています(1947年、Harvard MarkII のリレーに虫がはさまっていた)が、ただ、この頃にも障害・ミスのことを "bug" と言い表す習慣があったことは、この時のノート(件の虫がテープで貼られている)に "First actual case of bug being found" と書き沿えられていることからも明らかです。
以上、英語版の Wikipedia [wikipedia.org] の記事を参考にしました。
bugの墓?w (スコア:2, 興味深い)
#実際に見た方います?
Re:bugの墓?w (スコア:0)
#いや、ちゃんと展示もあるのは知ってますよ。
Re:bugの墓?w (スコア:1)
"Quidquid latine dictum sit, altum videtur."
Re:これを使ってやってみたい (スコア:2, すばらしい洞察)
アメリカの安全保障を担うのなら既に人類の粛正だったり
Re:これを使ってやってみたい (スコア:1)
逆に人類に絶望して自殺(シャットダウン)するかも。
Re:これを使ってやってみたい (スコア:0)
# ハングアップ=首吊り
Re:これを使ってやってみたい (スコア:1, おもしろおかしい)
バグだよ、それは
65536ノード (スコア:1)
Re:65536ノード (スコア:1)
省資源でいかに計算するか・・も (スコア:1)
Re:省資源でいかに計算するか・・も (スコア:1, 興味深い)
稼働率 (スコア:1)
全ノードが使える期間はどのくらいあるんでしょうね。
稼働率が0.99だと、1台の故障もないのは0.99^65535で
8.9635067617210234943250440080409e-287
0.9999だと0.0014246520124877113179958683656428
これのメンテナンスを続けるIBMの苦労はかなりの
モノではないかと思います。
やなぎ
字面じゃなく論旨を読もう。モデレートはそれからだ
Re:稼働率 (スコア:2, 参考になる)
安藤氏の古い解説によるとフルスペック時の目標MTBFは10日だそうです。
これは自己修復込みでしょうから、長いのか短いのか…微妙。
そんなのは (スコア:1)
2.プログラム時に使用できるのは搭載ノード数の255/256までです。
3.よって、65536ノード搭載の場合、65280ノードまで使用可能です。
とでもすればいいじゃないですか。
Cellの7/8に比べれば十分効率的です。
壊れたとき~ (スコア:1, 興味深い)
CPUモジュール全体を交換しなければならないそうで
で、モジュール全体というのは32個入りだそうで
壊れてもとりあえずそのCPUはオフラインにしておいて放置
というのが基本みたいだけど、どういうタイミングで交換するんだろうなぁ?