2 PFLOPSを目指すGRAPE-DRスパコンプロジェクトが始動 87
葡萄型銀河シミュレータ 部門より
takuto 曰く、 "平成16年度の文部科学省の科学技術振興調整費の審査結果が発表され、2008年までに2PFLOPSのスーパーコンピュータの開発を目指すGRAPE-DRプロジェクト(東大、理研、NTTコミュニケーションズ、IBMなど)が採択されました。(文科省の課題名は“分散共有型研究データ利用基盤の整備”)
2PetaFLOPSと言えば、地球シミュレータの50倍というとてつもない計算速度ですが、アメリカでもオークリッジ国立研究所などで、PetaFLOPSマシンの開発を目指すプロジェクトが動き出し競争が激化しています。もちろん、GRAPE-DRも世界初のPetaFLOPSマシンになると説明しています。参考リンク:ITmediaの紹介記事"
chiba-f 曰く、 "密に結合された多数のGRAPE-DRチップを搭載したPCサーバとIPストレージ・ドライブを高速スイッチで結合したクラスタと、これらのクラスタを高速ネットワークで結合したシステムの開発を目指す。用いられるGRAPE-DRチップには1024個の演算プロセッサが含まれ、システム全体では2,097,152個にもなる。
このシステムの開発のもととなるGRAPEは当初、銀河系のような重力多体系の運動を計算するために作られた、重力を並列計算するための付加プロセッサである。GRAPEチップには重力計算プロセッサが多数含まれ、このチップを多数並列稼働させることにより、膨大な数の重力の同時計算が可能になる。このプロジェクトでは、GRAPEのパラメータを変えることにより重力と似た式で表わされる計算も高速に行えることに着目し、重力多体系のみならず、それ以外の研究への応用も目指す。研究テーマとして、流体力学シミュレーション、分子動力学、超高速質量分析データ探索などがあげられる。"
データフローかよ! (スコア:2, 興味深い)
いろいろ野心的とも言えるし大丈夫かとも言えるのですが、 プロセッサがデータフローですか!
びっくり。 そんな汎用性を持ち込んじゃって 専用計算機ならではの高速性が犠牲にならないのかしら。
リング一周のオーバヘッドや発火機構に使う待ち合わせ記憶の レイテンシが実はネックだったりとかに始まって 1980年代のデータフロー流行で出尽くしていた 演算器利用「効率」の高さの足を引っ張る要素いろいろを どのように解決するつもりなのか、 お手並み拝見ですね。
Re:データフローかよ! (スコア:0)
Re:データフローかよ! (スコア:1)
というか, 何かGRAPEの存在すら知らないような雰囲気が...
ただ, 今回の計画でキモになるのはコンパイラ? と言っていいのか各プロセッサ毎のデータやプログラムの関連付けを最適化するソフトウェアの部分だと思います. こうした分散型の処理の場合, 相互に関連性のあるデータを交換する効率を上げることが必要になります. 初期のGRAPEでは特定の問題用ということでデータ関連性とハード構成を1対1にしていたわけですが, 今回のは汎用性を狙っているので, 固定的なプロセッサマトリックスに対してプログラム/問題を解析した結果に合わせてデータや処理を割り付けるのかなと私は想像します.
まあ, 全てのHPCに言えることですが, 問題による得手不得手ってのはつきまとうでしょうけど.
Re:データフローかよ! (スコア:1)
わからん。
GRAPE-6までのアーキテクチャのどこいら辺がデータフローなんでしょうか?
完全なる固定パイプラインだと認識してたし、 今GRAPE-4(GRAPE-6はこれの1ボードを1チップに収めたんですよね?) の論文を読み直してもホストインタフェースより先には 動的な要素は一切見えないんですが。
Re:データフローかよ! (スコア:1)
全然知りませんでした。
商用ではたとえばシャープのDDMPぐらいしかない、程度の認識で。
どんな領域で使われてるんでしょうか?
Re:データフローかよ! (スコア:1)
ありがとうございます。 PE間の相互接続はそのように読めたのですが、 PE内のことまでは書かれてなかったので……
ということは、用語の使い方がかなり紛らわしいですね(わざとかな?)。 その昔、NECのImPPを「静的」データフローマシンと呼んでたわけですから。
牧野先生方面と平木先生方面のどっちのOBさんでしょうか?
IBMの名前はどこから? (スコア:1)
どこの資料にのってるのでしょうか?
#税金使うなら、日本企業にして欲しいとか思ったりする。
romfffromのコメント設定
AC-2、プラスモデ+3、閾値0、スコアを表示しない(推奨)、高い評価のコメントを親にする
Re:IBMの名前はどこから? (スコア:1)
(いわゆる外資の現地法人とは位置づけが違う)
ので、日本企業だと昔から思ってますが?
Re:IBMの名前はどこから? (スコア:1)
Re:IBMの名前はどこから? (スコア:0)
Re:IBMの名前はどこから? (スコア:1)
社史でも読んでみましょう。
Copyright (c) 2001-2014 Parsley, All rights reserved.
Re:IBMの名前はどこから? (スコア:1)
http://www-6.ibm.com/jp/ibm/english/index_g.html
romfffromのコメント設定
AC-2、プラスモデ+3、閾値0、スコアを表示しない(推奨)、高い評価のコメントを親にする
Re:IBMの名前はどこから? (スコア:1)
(HDD部門もさっぱりと日立に売り渡しましたし)
かつて富士通がコンピュータ開発でIBMに提携を申し入れたら、
「ウチは100%出資の子会社化しかしない。カエレ!!」と言われて
逆にIBMに一矢報いる思いで国産コンピュータ開発に邁進したと
いうエピソードがありました。
Re:IBMの名前はどこから? (スコア:0)
負け狼の台詞 (スコア:1, おもしろおかしい)
高速になればなるほど (スコア:1)
理想的には、材料で言うと分子動力学法によってFEM解析のスケールまで統一的に解けるような計算能力(ありえんか....)を期待したいですね。その前に統一理論の確立が先でしょうか。
optimized for /.
Re:高速になればなるほど (スコア:1, 参考になる)
分子数という点では古典MDなら数百万個までは扱えているはずですよ。現在はどちらかといえば、分子数云々より多体効果の取り込みやタイムステップの関係上トータルの時間スケールがミリ秒に遠く及ばないことの方が問題なのでは?
Re:高速になればなるほど (スコア:3, すばらしい洞察)
(※:bond, angle, torsion + vdw + eelでエネルギーをあらわすポテンシャル)
この問題を解決するために Cut Off 距離というものを設け、多体間がある距離よりも遠くなった場合は(実際には距離の二乗に反比例する関数なので、距離が遠くなったからといって0になることはないはずなのに)0とする近似をしてしまっています。
系の原子数が増えてくると、この多体間の相互作用を計算する回数が飛躍的に増大し、これが高分子蛋白質(特に膜蛋白質)のMDシミュレーションを難しくしている原因の1つになっています。
MD-GRAPEはこの多体間相互作用の項を計算する専用のチップだったと記憶しています。私が使ったことがある計算機では少なくともこの項の計算に関しては一般的なパソコンのCPUで計算させるよりも数十倍も速かったと思います。
MDシミュレーションの律速がMD-GRAPEで大幅に改善されるならば、MDがますます高速になるというのは間違っていないと思いますよ。
ついでに Cut off 距離を長くできるので、より正確なシミュレーションができるようになります。
Re:高速になればなるほど (スコア:1, 興味深い)
>ついでに Cut off 距離を長くできるので、より正確なシミュレーションができるようになります
上記アセチレンの例だとMDの結果は低温相では実測とは違い立方晶(Pa3)のほうが斜方晶(Cmca)よりも安定になる。原因は分子集合状態における電荷移動相互作用が現状のモデルでは表現できないからなんです。カットオフ距離の延長やエワルド和の採用では解決のしようがない問題なのです。
通常、力の計算は2体近似ですから計算量は分子数の2乗に比例しますので計算機の速度もそれは確かに重要なのは否定しませんが、モデル化が悪いと定性的にも誤った結果を出してしまいますよ。
Re:高速になればなるほど (スコア:1)
未だにこのモデルであらゆることが再現できたって決定的な答えは
出てないから、かな?
静的構造の再現は悪いけど動的性質は再現しているはず、とか
最近は水の計算ってどのくらいのことをやっているんですかねぇ
「それがどうした、おれたちには関係ない」
Re:高速になればなるほど (スコア:1)
Re:高速になればなるほど (スコア:1)
そういう意味では.分子の数がアボガドロ数を上回るような計算は無理ですよね?
それができて何がうれしいのかはよく分かりませんが.
FEMもMDも分からないのにコメントしてごめんなさい.
科学技術振興調整費審査結果のURL (スコア:1)
科学技術振興調整費 [mext.go.jp]についてのリンクを張り忘れました。GRAPE-DRは東大の平木先生による政策目標1のプロジェクトです。
IBMはプロジェクトのページには書かれていないのですが、文科省のページでの参画機関には名前があり、ハードウェアの開発担当のようです。
NTTコミュニケーションズ? (スコア:0)
Re:NTTコミュニケーションズ? (スコア:0)
# 歳がばれそうなので、AC
LINPACK (スコア:0)
LINPACKを実行させるとどの程度の位置にいるんでしょう?
Re:LINPACK (スコア:1, 参考になる)
例えば1秒間に計算可能な浮動小数点演算の数はアースシミュレータよりGRAPEの方が多いです。ゴードンベル賞とか、地球上で最も計算が速いマシンに贈られることになっていましたがGRAPEではなくてアースシミュレータに贈られていたので関係者は残念がっていましたよね。
でもGRAPEにLINPACKを計算させて速いスピードは出ない。というかそもそも土俵に立つこと自体が無理。新幹線は速いけどレールが無いところは走れない。
Re:LINPACK (スコア:1)
GRAPEでLinpackベンチは動かないそうです。
Re:LINPACK (スコア:0)
Re:LINPACK (スコア:1, すばらしい洞察)
ベクトル型のスーパコンピュータはベクトルデータの演算に特化してるので、LINPACK専用計算機みたいなものです。
というわけで、既に「LINPACK専用計算機が世界一をとっている」ようなものです。
Re:LINPACK (スコア:0)
それはGRAPEをスパコンと呼ぶときの禁句です.
Microsoft Internet Explorer 用に最適化されています (スコア:0)
OSはWindowsですか?
Re:Microsoft Internet Explorer 用に最適化されてい (スコア:0)
で、何するんですか? (スコア:0, 興味深い)
2の次のようなきがする。
地球シミュレータも今のところパッとした成果も出てないしね。
Re:で、何するんですか? (スコア:2, 参考になる)
「2002年ゴードン・ベル賞」を受賞:「地球シミュレータ」上で行ったスペクトル変換法による全球大気大循環シミュレーション(26.58Tflops) [jamstec.go.jp]
「地球シミュレータ」を用いて精密な地震シミュレーションに成功~
「2003年ゴードン・ベル賞」を受賞~ [jamstec.go.jp]
ま、こういうと多分「精密なシミュレーションだからナニ?」「賞が何ぼのモノ」とか言わはるんではないかと思われますけど。
もし、そう言わはりなさるのなら「パッとした成果」って何ですの。
#煽りなのでAC
Re:で、何するんですか? (スコア:1)
その道具を使って得られた、本来の学問的な成果を称える物ではない。
という事をlocateは言いたいのではないでしょうか。
私はくだらない成果だとは思っていません(念のため)
#「煽りなのでAC」は議論する上で卑怯だと思うのでID
Re:で、何するんですか? (スコア:1, 参考になる)
道具そのものではなく「道具が役にたったこと」をたたえるものなので、LINPACKベンチマーク等よりは学問的な成果を考慮していると思います。
Re:で、何するんですか? (スコア:1, すばらしい洞察)
Re:で、何するんですか? (スコア:1, 参考になる)
物質材料系でもたまーに使われてます.
パッとしてるかと言われると・・・まあ,もともと地味な分野なんで.
ただ,なんと言っても演算力は力ですよ.あればあるだけ有難い.
でもあまり使わせてもらえないんですよねえ.いや,うちらの分野の人より
もっとああいう大規模計算が必要な方々に使われるもので.当然ですが.
Re:で、何するんですか? (スコア:1, 興味深い)
Re:で、何するんですか? (スコア:2, 興味深い)
>何か取り立てて新しいことがあるわけでもの無いように見える。
気候モデリング関係しか知らないので、一面的かもしれませんがご容赦ください。
地球シミュレータで実現できたこととして、解像度(時間・空間)の上昇だけでなく、積分されている方程式に変更が加えられていることがあげられると思います。
「中の人」でないので詳しいことは分からないのですが、普通の「シミュレーション」(もしくは予測)が「現在⇒未来」の一方向の予測であるのに対して、地球シミュレータで行われている計算は「現在⇔未来」(実際には「過去のある時点⇒過去のそれより未来のある時点⇒過去への逆演算」)の再帰的な計算であるらしいです。
詳しいことは「中の人」に聞いていただきたいのですが、再帰計算を行うことで、観測データの誤差と(力学・熱力学)モデルの誤差を最小に持っていく(数学理論的な)裏づけがあります。
#私も説明を聞いたのですが、ここで言葉で説明するほど理解していないのが情けない。
ただ、この計算を行うにはかなりの計算機資源を必要とします。
大学レベルの資源ですと、小さな閉鎖海域での計算が目いっぱいらしいです。
地球シミュレータはこれを全球で、高分解能で計算できる資源を持っているらしいです。
#例えば、エルニーニョなどは全球で計算しないと意味がない。
これによって実現できるのは、モデルの誤差(パラメタライズしてきたもの等)と観測誤差等を最小したとして、気候の現象のメカニズムを明らかにできる(いつ、どこを観測すれば、数ヵ月後の日本の気象変化がわかるなど)、ということだそうです。
#中の人に近いところにいたので情報を聞いたのでAC.
Re:で、何するんですか? (スコア:1)
あっても足りないし...というかGRAPEの前身のWINEは銀河シミュレート専
用で、斥力も扱えるようにちょっと汎用化したのがWINEなんだわ。
#「アンクスの海賊」を思いだしちった。
Re:で、何するんですか? (スコア:1)
演算機の機構としてWINEはGRAPEの応用ではなかったっけ?
実際に何を計算してるかはともかく。
Re:で、何するんですか? (スコア:1, 参考になる)
重力・クーロン力専用->多項式近似で任意の中心力(三角関数も多項式近似で可能)->三角関数専用のWINEを分離
と発展してきて、最近はASIC開発が高価になってきたのでGRAPEにWINE機能を持たせるようです。
GRAPE-DRが専用パイプラインをやめた理由の一つは重力用だけでASICを作るのは割高になってきてコスト面で汎用CPUに対する優位性が下がっているからだそうです。
GRAPEというと専用パイプラインによる高速化ばかりが注目されてきましたが、通信量に比べ演算量が極端に多い、オペランドの一つが多数のパイプラインで共有できる、という計算に限定してフォンノイマンボトルネックを回避する、というだけでも汎用CPUに勝てるのでしょう。
Re:で、何するんですか? (スコア:0)
地球シミュレータと比較されても・・ (スコア:0)
は言いがたい所があります。特定の計算に
特化したハードウエアです。地球シミュレータの
ような汎用計算機と比較されても困ります。
簡単な比喩であげると、現在の技術ならZ80を10GHz
駆動させる事が可能でしょう。でもZ80でWindowsを
走らせるとなると、様々な制約、8bit, 64kbyteの壁、
浮動少数点演算ができないなどがあり、すごく苦労
しますよね。牧野先生は、Z80でスーパーコンピュータ
を作ったという事です。
Re:地球シミュレータと比較されても・・ (スコア:2, 興味深い)
Re:地球シミュレータと比較されても・・ (スコア:1)
汎用的なスパコンに比べてGRAPEが重力計算に特化しているのは,
劣っている点じゃなくて優れている点だと思うよ.なんせ専用ハードウェアの上で
計算が突っ走るんだから,汎用的なハードウェア上じゃ実現できないような速度がでるわけだし.
専用ハードウェアっていっても,いまじゃFPGAみたいなプログラマブルなデバイスを使えば
設計できるわけだから,これからこういった専用計算機は増えるんじゃないかな?
さすがに10GHz は無理では? (スコア:1)
回路のサイズから来る難しさを超えてFF等が間にあいません。90nm あたりの技術を使う限り、2GHz 程度が限界では? 勿論、stage 数を増やすなど各種の設計技法を使えば、clock だけを10GHz にできるかもしれませんが、それはすでにZ80 じゃない別のチップです。
もし10GHz Z80を作っているところがあれば教えてください。
そうかな? (スコア:1)
バイポーラや、ガリ砒素、ジョセフソンなど、10GHzのフリップフロップ動かせそうですけど・・・