東大が導入する国内最速スパコンの概要が明らかに 52
ストーリー by yosuke
もう一つのTのも気になる 部門より
もう一つのTのも気になる 部門より
gf1e 曰く、
日立のニュースリリースやPC Watchの記事より。東京大学情報基盤センターが導入する国内最高性能となるスパコンの概要が明らかになった。
クアッドコアOpteron(2.3GHz)4個を搭載したノード(HA8000-tc/RS425)952個を、ノード間接続にMyri-10Gを採用した高速多段クロスバーで接続したもので、理論ピーク性能は140TFLOPSとなる。OSはRedhat Linuxで、2008年6月に稼働予定。
ちなみに、東大情報基盤センターのセンター長である米澤明憲教授は、東工大のTSUBAMEで知られる松岡聡教授が東大で助手をしていた頃のボスである。
採用ベンダーは2006/12/25に発表されている。T2Kオープンスパコンの他のものは、理論性能95TFLOPSの筑波大学計算科学研究センターがCray Japan Inc.+Appro、61TFLOPSの京都大学学術情報メディアセンターが富士通となっている。
ここはひとつ (スコア:2, すばらしい洞察)
Re:ここはひとつ (スコア:1)
特性を考えて導入すれば、あながちネタとも言い切れないんでしょうね。
#個人的にはffmpegがSPE使ってくれるようになればいいな、、、なんて妄想してますが。
#壮大なストーリ。空転するアイディア。
Re:ここはひとつ (スコア:1)
「プレイステーション 3」 HDD 20GB/HDD 60GBモデル国内出荷完了のお知らせ
http://www.scei.co.jp/corporate/release/080110a.html [scei.co.jp]
Re: (スコア:0)
倍精度浮動小数点を扱おうとすると
性能ががた落ちって言うデータをどこかで見ましたが、
SCEの在庫の数はそれを補って余りあるほどあるんでしょうかね:-P
Re: (スコア:0)
>倍精度浮動小数点を扱おうとすると
>性能ががた落ちって言うデータをどこかで見ましたが、
それでもAMD64やItenium2より早いようにみえますが?
http://www.ne.jp/asahi/comp/tarusan/main148.htm [www.ne.jp]
Re: (スコア:0)
ノード数とTFLOPS (スコア:1)
Re:ノード数とTFLOPS (スコア:1, 参考になる)
Re: (スコア:0)
Re: (スコア:0)
Linuxベースのクラスタ・システムなどではMyricom製品はおなじみだと思うが,それでスパコンとは.........
大規模なベクトル演算やった時の実効性能はどの程度のものなんだろ?
ちなみに東大スパコンのMyri-10G(公称1Gbit/sec)多段クロスバー接続に対して,地球シミュレータ(ES)は
12.3Gbyte/secの単段クロスバー接続. 何だかんだ言われる古いESの方が転送能力の実力値は一桁上?
Re: (スコア:0)
Re: (スコア:0)
> 何だかんだ言われる古いESの方が転送能力の実力値は一桁上?
えーっとね 比べる対象が全く違うよ。
汎用品である 10G Ether と互換性をもった Myri-10G と 地球シミュレータを同じ土俵で比べてもねぇ
ついでに言うと、1対1の通信性能は演算性能との比で語られるべきものであって単体でみるものではないと思うけどね。
もちろん、それでみても地球シミュレータの方が良いのは明らかだけどお金の掛け方がちがうから...
あと Myri-10Gの公称は 双方向10Gbit/sec でSWと搭載マシンに良いものを使えば、おおよそ 2400MB/seccと公称の90%以上の速度が出るみたいだよ。
http://www.myri.com/scs/performance/MX-10G/MPICH-MX/bonded-NICs.html
Opteron (スコア:1, 興味深い)
intelのCPUと比べて何かスーパーコンピュータ向きなところがあるのでしょうか?。
Re:Opteron (スコア:2, 参考になる)
2,Registered DIMM採用による低コストと低発熱のメリット
3,CPU自体も安い?
Re:Opteron (スコア:1, 興味深い)
上記2つに加えて浮動小数演算の違いがあるのではないでしょうか。
もともとIntelのMMXが台頭してきた頃から、AMDは浮動小数演算の最適化を行ってきたので、AMDの方が有利なはずです。
AMDの問題はアプリケーション側がIntelのSSEを利用しているものが多いので、AMDもSSEを実装しなければならないという点です。
ただ研究用であれば、今までAMDのCPUを使っていることから考えて、アプリケーションが3DNOWに最適化されたものなのではないでしょうか。
なので、今後もスパコンを作る場合にはAMDのCPUが使われるのではないかと思います。
#あくまでも予想の範囲内ですがIDで
Re:Opteron (スコア:2, 参考になる)
> ただ研究用であれば、今までAMDのCPUを使っていることから考えて、アプリケーションが3DNOWに最適化されたものなのではないでしょうか。
3DNow!ってもう死語では?
MMX用の64bitレジスタを使って32bit単精度浮動小数点を2つSIMDするのがAMDの3DNow! [wikipedia.org]でしたが、
後発のIntelが出したSSE [wikipedia.org]はMMX用のレジスタを128bitに拡張して単精度×4をSIMDするものですので、SSEが使えるOpteronで3DNow!を使う意味はありません。
まあ、久々のAMD独自の機能拡張であるSSE5 [impress.co.jp]をサポートしたCPUが出てくれば、また話は変わってくると思います。
#AMDがSSE5って名前で新たな拡張命令セットを出したのは大胆だと思う。今後IntelがSSE5を発表したらすごく混乱しそう…
Re:Opteron (スコア:1)
Re: (スコア:0)
しかしインテルさんは5番目を飛ばして、いっきに10番目(X)に!
せkk
Re: (スコア:0)
Re:Opteron (スコア:1)
東工大のTSUBAMEは米ClearSpeedのCSX600アクセラレータボード [clearspeed.com]を後から追加して性能強化していますね。
ノード間通信のレイテンシが大きいので、1ノードの演算性能は大きければ大きいほど良いです。
# まあ、ノード単体では速度が足りないからこそクラスタを組んでるワケで。;-)
Re:Opteron (スコア:1, 参考になる)
Re:Opteron (スコア:1, 興味深い)
Re:Opteron (スコア:1)
いや、嘘ではない可能性も…
Re:Opteron (スコア:1)
FB-DIMMが熱い.
多くの科学技術計算ではCPUの速度に加えて, すでに指摘されているメモリのレイテンシ・帯域, それに容量が要求されます. となると, メモリにFB-DIMMを使ってトータルの発熱量が大きくなるXeonは, システムの実装密度や運用にかかる電力・冷却の面で不利になると思います.
Re: (スコア:0)
QPIリンクを4本備える上、メモリコントローラも内蔵ですから。
スパコンのアイドル時にBOINCを・・ (スコア:1)
平均的なパソコン何台分の能力あるのだろう
理論ピーク性能って (スコア:0)
理論ピーク性能って単純な掛け算ですか?
trivial independent な問題のときにだけ成り立つ性能?
Re:理論ピーク性能って (スコア:1, 参考になる)
> 理論ピーク性能って単純な掛け算ですか?
> trivial independent な問題のときにだけ成り立つ性能?
そそ
理論ピーク性能とかいうとそういう性能が出るように聞こえるけど
どっちかというと「どうがんばってもこれ以上の性能は出ません」という数値
実際のは実効ピーク性能とかいう
typo (スコア:0)
2007年ですよ〜
OSとミドルウェアは何かな?勝手に予想 (スコア:0)
石川先生が中心のようだからRHEL+SCoreかなと思ったんだけどSCoreは現状では32bitのみのようだし...
という事で私の予想は
本命: RHEL4 64bit版 + Myri-10G MX ドライバ + mpich-mx(or HP-MPI)
Myri-10G MXドライバであれば HP-MPIが動作するので各種アプリケーションがそのまま動作する可能性がく、計算センターでの用途としては本命。ただし、新規性や面白みに欠ける
対抗: RHEL4 64bit版 + Score 64bit版を新たに開発
現在はリリースされていないが、一時期はSCore64bit版が(ベータ扱いだが)存在していたため不可能ではないだろう
詳細が公表されていないのは開発が間に合わない場合に切り替えるためという邪推もできる
新規性はあるが、計算センターにはあまり向かなそうなので 対抗どまり
もちろん Myri-10G MXドライバも同時に動作するように開発している、もしくはDAPLなどのAPIが利用できるのであれば完璧だが...
大穴: RHEL4 32bit版 + Score 32bit版
仕様書から1nodeあたり32GBであると推測できる。1nodeあたり16coreなので1coreあたり2GBとなる。
MPIでの利用が前提であれば、1coreあたり1プロセスを起動させるので、1プロセスあたり2GBとなり、一応は32bitのメモリアクセス制限には引っかからない。
でも計算機センターのシステムとしては明らかに向かない。SCoreユーザーが非常に多い場合のみ成立するので大穴
Re:何に使うのん (スコア:1, おもしろおかしい)
Re: (スコア:0)
ファイル容量は、1桁1バイト換算で、10ペタバイトかな。
なんつーか、データ保存が困難な世界だな。どうやって保存するんだ?
実は保存してないのかもしれないな。
Re:何に使うのん (スコア:1)
数学的興味で数字の並び方などを調べたりするので,保存しているはずです.
そういう意味で,海外にも結果をほしがる人はいると思います.
Re: (スコア:0)
乱数だから算術圧縮あたりが一番効率良さそうですね。
10P桁 / log10(2) = 33.3Pbit
33.3Pbit/8bit = 4Pbyte
圧縮してもあんまり効率良くないですね。
Re: (スコア:0)
残念ながら復号はかなり時間がかかりますが。
Re:何に使うのん (スコア:1)
> ファイル容量は、1桁1バイト換算で、10ペタバイトかな。
10兆バイトは10テラバイト [google.co.jp]ですよ。
Re: (スコア:0)
計算ミスはおいておいて,以前どこかで,
(金田先生だったかは覚えてません)
1byte(0~255を表せる)あたり2桁づつ保存しているというのを
読んだ記憶あります.だから10T桁を5TByteで保存する事になり
ます.どうにか現実的な容量で保存できますかね.
東大の資料によると,HDDを1P以上搭載するみたいですので,
計算機センターの長時間の使用料を払う覚悟があれば,誰でも
10兆桁計算を実行できるかな.(そんなに長時間独占して貸し
てくれるかは知らないけど.)
Re: (スコア:0)
これまでの金田先生のおもちゃに比べてアーキテクチャが違い過ぎて、あの年齢にはやる気が起きるかどうか
金田先生の所の学生が使うならわかるけど
#最近あの人の学生へのツッコミ、的を外してばかりいるような気がしないでもない
#同じ専攻なので絶対AC
で、どこに置くんでしょうね
まさか浅野?
Re: (スコア:0)
前回の2002年の1兆桁の更新の時も日立の技術者の方々がかなり
のプログラムを担われたみたいですし、どちらかというと、金田先生
にはマネージメントの方で人力していただけたらと思います。ようは
企画の立案、人集め。内部関係者の特権を利用して、何らかの理由
を付けて、長時間スパコンを占有する許可を計算機センター長と掛
け合っていただく。って所でしょうか。
Re: (スコア:0)
Re: (スコア:0)
どこぞの地方大学と違って東京大学の大型計算機のCPU利用率はべらぼーに高いです。
Re: (スコア:0)
Re:何に使うのん (スコア:1, 興味深い)
すぐに忘れてしまうので、きちんと説明しましたよ
という証拠としてはいいけど
苦労はあまり報われない。
当事者は語る。
Re: (スコア:0)
とかできたらいいのに。融通きかなすぎ。
広報専任で雇われてない人に追加で押し付けるのはかわいそう。
Re:何に使うのん (スコア:1, 参考になる)
>とかできたらいいのに。
広報費も支出として認められてるんで、広報費込みで申請してあればできますよ。
Re:何に使うのん (スコア:1)
Re:何に使うのん (スコア:1, すばらしい洞察)
な~にも調べず「駄目だろう」なぞとほざくやつの意見にはカケラの価値も無いということ。
Re: (スコア:0)
Re:何に使うのん (スコア:1)
Re: (スコア:0)
「優秀さ」には、他人にわかりやすく説明する能力も含まれますので
そこらへんが定期的に試されていると考えてもいいでしょう。