パスワードを忘れた? アカウント作成
17726 story
スパコン

東大が導入する国内最速スパコンの概要が明らかに 52

ストーリー by yosuke
もう一つのTのも気になる 部門より

gf1e 曰く、

日立のニュースリリースPC Watchの記事より。東京大学情報基盤センターが導入する国内最高性能となるスパコンの概要が明らかになった。
クアッドコアOpteron(2.3GHz)4個を搭載したノード(HA8000-tc/RS425)952個を、ノード間接続にMyri-10Gを採用した高速多段クロスバーで接続したもので、理論ピーク性能は140TFLOPSとなる。OSはRedhat Linuxで、2008年6月に稼働予定。
ちなみに、東大情報基盤センターのセンター長である米澤明憲教授は、東工大のTSUBAMEで知られる松岡聡教授が東大で助手をしていた頃のボスである。

採用ベンダーは2006/12/25に発表されている。T2Kオープンスパコンの他のものは、理論性能95TFLOPSの筑波大学計算科学研究センターがCray Japan Inc.+Appro、61TFLOPSの京都大学学術情報メディアセンターが富士通となっている。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • ここはひとつ (スコア:2, すばらしい洞察)

    by Anonymous Coward on 2008年01月09日 1時57分 (#1277326)
    SCEがうなる在庫のPS3をつなげて、世界最高性能のスパコンを作るのにチャレンジして欲しいものだ。
  • by funya (14942) on 2008年01月09日 2時24分 (#1277332)
    ノード数は、TSUBAMEの5割増だけど、TFLOPSは3倍。なんかアクセラレータでも入っているのかな。
    • by Anonymous Coward on 2008年01月09日 2時43分 (#1277337)
      クアッドコアOpteronはFPU/SSEのユニットが倍になったからじゃない?
      親コメント
    • by Anonymous Coward
      CPU の性能がよいんでしょ。Linux だから TLB バグも OS で回避できるし
    • by Anonymous Coward
      それよりもMyricomのoff the shelfの通信ボードで国内最速スパコンが出来てしまうことの方が驚き.
      Linuxベースのクラスタ・システムなどではMyricom製品はおなじみだと思うが,それでスパコンとは.........
      大規模なベクトル演算やった時の実効性能はどの程度のものなんだろ?

      ちなみに東大スパコンのMyri-10G(公称1Gbit/sec)多段クロスバー接続に対して,地球シミュレータ(ES)は
      12.3Gbyte/secの単段クロスバー接続. 何だかんだ言われる古いESの方が転送能力の実力値は一桁上?
      • by Anonymous Coward
        東大スパコンにはベクトルユニットはついていないのでは.
      • by Anonymous Coward
        > ちなみに東大スパコンのMyri-10G(公称1Gbit/sec)多段クロスバー接続に対して,地球シミュレータ(ES)は
        >  何だかんだ言われる古いESの方が転送能力の実力値は一桁上?

        えーっとね 比べる対象が全く違うよ。
        汎用品である 10G Ether と互換性をもった Myri-10G と 地球シミュレータを同じ土俵で比べてもねぇ

        ついでに言うと、1対1の通信性能は演算性能との比で語られるべきものであって単体でみるものではないと思うけどね。
        もちろん、それでみても地球シミュレータの方が良いのは明らかだけどお金の掛け方がちがうから...

        あと Myri-10Gの公称は 双方向10Gbit/sec でSWと搭載マシンに良いものを使えば、おおよそ 2400MB/seccと公称の90%以上の速度が出るみたいだよ。

        http://www.myri.com/scs/performance/MX-10G/MPICH-MX/bonded-NICs.html
  • Opteron (スコア:1, 興味深い)

    by Anonymous Coward on 2008年01月09日 7時54分 (#1277375)
    どうして東工大のTUBAMEも含めてCPUはOpteronなんだろう。
    intelのCPUと比べて何かスーパーコンピュータ向きなところがあるのでしょうか?。
    • Re:Opteron (スコア:2, 参考になる)

      by xross_pon (34785) on 2008年01月09日 9時46分 (#1277406)
      1,CPUとMemoryダイレクトアクセスできることでのレイテンシが少ない
      2,Registered DIMM採用による低コストと低発熱のメリット
      3,CPU自体も安い?
      親コメント
      • Re:Opteron (スコア:1, 興味深い)

        by milito (34254) on 2008年01月09日 12時01分 (#1277462)
        >#1277406
        上記2つに加えて浮動小数演算の違いがあるのではないでしょうか。
        もともとIntelのMMXが台頭してきた頃から、AMDは浮動小数演算の最適化を行ってきたので、AMDの方が有利なはずです。
        AMDの問題はアプリケーション側がIntelのSSEを利用しているものが多いので、AMDもSSEを実装しなければならないという点です。
        ただ研究用であれば、今までAMDのCPUを使っていることから考えて、アプリケーションが3DNOWに最適化されたものなのではないでしょうか。
        なので、今後もスパコンを作る場合にはAMDのCPUが使われるのではないかと思います。

        #あくまでも予想の範囲内ですがIDで
        親コメント
        • Re:Opteron (スコア:2, 参考になる)

          by taka2 (14791) on 2008年01月09日 12時51分 (#1277482) ホームページ 日記
          > AMDの問題はアプリケーション側がIntelのSSEを利用しているものが多いので、AMDもSSEを実装しなければならないという点です。
          > ただ研究用であれば、今までAMDのCPUを使っていることから考えて、アプリケーションが3DNOWに最適化されたものなのではないでしょうか。

          3DNow!ってもう死語では?

          MMX用の64bitレジスタを使って32bit単精度浮動小数点を2つSIMDするのがAMDの3DNow! [wikipedia.org]でしたが、
          後発のIntelが出したSSE [wikipedia.org]はMMX用のレジスタを128bitに拡張して単精度×4をSIMDするものですので、SSEが使えるOpteronで3DNow!を使う意味はありません。

          まあ、久々のAMD独自の機能拡張であるSSE5 [impress.co.jp]をサポートしたCPUが出てくれば、また話は変わってくると思います。
          #AMDがSSE5って名前で新たな拡張命令セットを出したのは大胆だと思う。今後IntelがSSE5を発表したらすごく混乱しそう…
          親コメント
          • by KuRo-CaT (31239) on 2008年01月09日 14時04分 (#1277515)
            SSE6orSSE5iになるので大丈夫です
            親コメント
          • by Anonymous Coward
            >今後IntelがSSE5を発表したらすごく混乱しそう…

            しかしインテルさんは5番目を飛ばして、いっきに10番目(X)に!
            せkk
          • by Anonymous Coward
            追加すると、AMDのドキュメントでは「今後はSSEを使い、3DNow!は使うな」ということになっていたと、どこかで読んだ。
        • by Pravda (33859) on 2008年01月09日 12時48分 (#1277480) 日記

          東工大のTSUBAMEは米ClearSpeedのCSX600アクセラレータボード [clearspeed.com]を後から追加して性能強化していますね。

          ノード間通信のレイテンシが大きいので、1ノードの演算性能は大きければ大きいほど良いです。

          # まあ、ノード単体では速度が足りないからこそクラスタを組んでるワケで。;-)

          親コメント
    • Re:Opteron (スコア:1, 参考になる)

      by Anonymous Coward on 2008年01月09日 8時00分 (#1277376)
      メモリのレイテンシの低さ。
      親コメント
    • Re:Opteron (スコア:1, 興味深い)

      by Anonymous Coward on 2008年01月09日 10時42分 (#1277424)
      メモリコントローラ内蔵、そしてHyperTransportでCPU同士を直結するだけでマルチCPUを構成できるので、ベンダはノード間通信の面倒を見るだけでいいから。
      親コメント
    • by YABO (35259) on 2008年01月09日 12時18分 (#1277467)
      Intel嫌い。

      いや、嘘ではない可能性も…
      親コメント
    • by SteppingWind (2654) on 2008年01月09日 12時55分 (#1277484)

      FB-DIMMが熱い.

      多くの科学技術計算ではCPUの速度に加えて, すでに指摘されているメモリのレイテンシ・帯域, それに容量が要求されます. となると, メモリにFB-DIMMを使ってトータルの発熱量が大きくなるXeonは, システムの実装密度や運用にかかる電力・冷却の面で不利になると思います.

      親コメント
    • by Anonymous Coward
      Nehalem系のXeonであるBecktonあたりが出てくると話が変わってくる気がします。

      QPIリンクを4本備える上、メモリコントローラも内蔵ですから。
  • 世界のスパコンにBOINCを入れてアイドル時に解析させれば
    平均的なパソコン何台分の能力あるのだろう
  • by Anonymous Coward on 2008年01月09日 11時39分 (#1277452)
    >理論ピーク性能は140TFLOPSとなる

    理論ピーク性能って単純な掛け算ですか?
    trivial independent な問題のときにだけ成り立つ性能?
    • by Anonymous Coward on 2008年01月09日 15時39分 (#1277616)
      >> 理論ピーク性能は140TFLOPSとなる
      > 理論ピーク性能って単純な掛け算ですか?
      > trivial independent な問題のときにだけ成り立つ性能?

      そそ

      理論ピーク性能とかいうとそういう性能が出るように聞こえるけど
      どっちかというと「どうがんばってもこれ以上の性能は出ません」という数値

      実際のは実効ピーク性能とかいう
      親コメント
  • by Anonymous Coward on 2008年01月09日 21時43分 (#1277884)
    > 採用ベンダーは2006/12/25に発表されている。

    2007年ですよ〜
  • by Anonymous Coward on 2008年01月10日 3時09分 (#1278034)
    プレスリリースを読んでも詳しい事は全く書いてないんだよね(OSにRHELとはあるが詳細はない)

    石川先生が中心のようだからRHEL+SCoreかなと思ったんだけどSCoreは現状では32bitのみのようだし...
    という事で私の予想は

    本命: RHEL4 64bit版 + Myri-10G MX ドライバ + mpich-mx(or HP-MPI)
    Myri-10G MXドライバであれば HP-MPIが動作するので各種アプリケーションがそのまま動作する可能性がく、計算センターでの用途としては本命。ただし、新規性や面白みに欠ける

    対抗: RHEL4 64bit版 + Score 64bit版を新たに開発
    現在はリリースされていないが、一時期はSCore64bit版が(ベータ扱いだが)存在していたため不可能ではないだろう
    詳細が公表されていないのは開発が間に合わない場合に切り替えるためという邪推もできる
    新規性はあるが、計算センターにはあまり向かなそうなので 対抗どまり
    もちろん Myri-10G MXドライバも同時に動作するように開発している、もしくはDAPLなどのAPIが利用できるのであれば完璧だが...

    大穴: RHEL4 32bit版 + Score 32bit版
    仕様書から1nodeあたり32GBであると推測できる。1nodeあたり16coreなので1coreあたり2GBとなる。
    MPIでの利用が前提であれば、1coreあたり1プロセスを起動させるので、1プロセスあたり2GBとなり、一応は32bitのメモリアクセス制限には引っかからない。
    でも計算機センターのシステムとしては明らかに向かない。SCoreユーザーが非常に多い場合のみ成立するので大穴
typodupeerror

日本発のオープンソースソフトウェアは42件 -- ある官僚

読み込み中...