ページ内ジャンプ:

アレゲなニュースと雑談サイト

hylomによる 2009年11月27日 12時10分の掲載
こっちも1つの方向性、部門より。

あるAnonymous Coward 曰く、

長崎大学が理研らと共同で研究していた、GPUを演算ユニットとして使用したスーパーコンピュータが、IEEEのゴードン・ベル賞を受賞していたそうだ(西日本新聞論文要旨)。

このスパコンはGPUを760個並列に接続したもので、158TFLOPSの演算性能を発揮。地球シミュレータの122TFLOPSを上回ったという。また、開発費用は3800万円と安く、そのため今回の価格性能部門の受賞となった模様。

西日本新聞の写真を見る限り、一般的なPCのマザーボードにこれまた一般的なGPUを接続した構成で、マザーボードは棚にベタ置きと、確かにコストがかかっていなさそうな感じではある。

表示オプション しきい値:
  • 使用目的 (スコア:4, 興味深い)

    kikki (30639) : 2009年11月27日 14時01分 (#1679184)
    一連のスーパーコンピューター騒動でわかる一番の問題は、使用目的が大きく採り上げられてない点だと思います。

    スーパーコンピューターランキングで日本が30位にも入らなかった、という報道で開発能力云々が言われてますけど、
    一番の問題はスーパーコンピューターを活用するような目的・人が減っている事な気がします。
    ・目的がないからスーパーコンピューターが導入されない
    ・身近にスーパーコンピューターが無いから目的が思いつかない
    どちらが先かわかりませんが、負のスパイラルになってるのが一番怖いです。

    世界一のスーパーコンピューターがたった一台、でんと構えても状況が改善されるとは思えません。
    とにかく早く利用者と使用目的を育てる施策が重要だと思います。
    なので、現在のスーパーコンピューター事業には反対です。

    世界一のスーパーコンピューターを作ることで技術者が育つ、それは確かでしょう。
    けど技術は継続しないと廃れます。地球シミュレーターで一位をとって、その後の構想が無く、
    その後ずぶずぶと沈んでいった現在の状況を再び繰り返すだけに思えます。

    コンピューターは単なる道具だから、ハサミやナイフと同じ、使う目的が無ければ無用の長物、
    そんな当たり前のことが見えてない気がします。
    • leiqunni (8779) : 2009年11月27日 15時54分 (#1679280)

      >身近にスーパーコンピューターが無いから目的が思いつかない

      同じく、いやいや、そんな馬鹿な。
      あなたが/.を見てるPCは10年前のスパコンですよ?

      活用する目的、利用する人がいなければ意味がないというなら、
      宇宙事業なんて真っ先に切り捨てるところではないですか。

      使用目的に関わらず研究される必要性がある分野にこそ税金が投入されるべきです。
      京速が駄目なのは独自性もないのに高杉だから。

    • 1個のコメント が現在のしきい値以下です。
  • Anonymous Coward : 2009年11月27日 13時53分 (#1679176)

    タレコミにある論文の要旨を読んでみましたが、用途が多体問題と渦法を用いた乱流シミュレーションという事で、これまんまGRAPEが得意としていた領域ですよね。

    今後はGRAPEもGPUに淘汰されていく運命なんでしょうか。

  • Anonymous Coward : 2009年11月27日 12時26分 (#1679088)
    国内のスパコン開発は京速以外にもたくさんあるんですよ。それらに限られた予算をどう配分するかってとこが入口だと思う。東工大のTSUBAMEもTesla使ったハイブリッドですが、2010年度にTFlopsまで高速化する予定のようです。
  • Anonymous Coward : 2009年11月27日 12時53分 (#1679124)
    濱田先生も作成に加わったKNOPPIX for CUDAというのがあります。http://www.yasuoka.mech.keio.ac.jp/cuda/ [keio.ac.jp]これを使えばあなたも スパコンオーナー。
  • 安価で高性能な海外製を使うとか以前にこんな形で追い討ちされるとは予想外でしたね
    いやあ痛快

    #ああ言えばこう言う人がどう切り返すのか見ものですね
    • 日本でスパコン開発が必要な理由は、
      開発に伴う国内の半導体技術研究を支援する目的だと思うんだけど。
      ちがうんですか?

    • 2個のコメント が現在のしきい値以下です。
  • Re: バカバカしい (スコア:1, おもしろおかしい)

    Anonymous Coward : 2009年11月27日 13時03分 (#1679136)

    世界最大のMIPS数を誇るコンピュータなんて、Googleのデータセンタに決まってるじゃないか。
    Googleのサーバコンテナを積み上げたらESより速い汎用計算機ができるとでも?
    使ったプロセッサの処理能力を足し合わせりゃいいってもんじゃないんだよ。ちったぁ考えろよ。

    # 親コメがまだないのでここへ

    • 揶揄したつもりでしょーが、現実そうですよね。ちったぁ現実見ろよ。

      #PCサーバをクラスタリングしても世界一にはなれない。そんなふうに考えていた時期が俺にもありました。
      #よーし、ダーティキャラに徹しちゃうぞ!

      • Google のデータセンタってのは Google が扱おうとした問題に特化した
        データセンタなんで、それに適合しない問題というのは幾らでもあります。

        スーパーコンピュータってのはそれでどんな問題を扱うのかというのに
        応じて設計しなきゃいけないわけでやみくもに世界一を目指して開発
        するものではないです。

        Google だって別に世界一のデータセンタを作ることを目的に
        彼らのデータセンタを作ったわけではなく彼らの問題に対処する
        努力をしたところ結果として世界一のデータセンタが出来たわけです。

        だから事業仕分けでの「なぜ世界一?」突っ込みというのは
        とても正しいわけでそれに対する有効な反論というのは具体的に
        需要のある問題を提示することのはずです。

        率直に言って先日の著名科学者の方々の声明は的を外していると
        思います。

      • TOP500リストに載ることがスパコンの定義だとすれば(そんなのスパコンと呼べないって言われたくないので)、、

        東工大松岡研のAthlon搭載PCクラスタが「トップ500スパコン」にランクイン [nikkeibp.co.jp]

        すでに8年前につなげただけのPCで載りました。

        #次にお前は「昔の話じゃないか!」と言う

        • Re: バカバカしい (スコア:2, 参考になる)

          Anonymous Coward : 2009年11月28日 6時57分 (#1679801)

          はい、という訳で松岡研OBの私が来ましたよ。

          いや本当に Presto III には苦労させられましたよ、私は直接タッチしてませんでしたが。当時でもそれ程速いとは言えなかった Fast Ethernetで、普通にやったらどう考えても太刀打ちできない。2系統にして、ゼロコピー通信を使ってとにかく通信コストの低減にいそしみ、トポロジを色々試したりして、その隙にじゃんじゃんノードが壊れる(or 初期不良の発覚)。もちろんそんな構成でランクが維持できる訳もなく、すぐに1ノード2コア構成にしたりネットワークレイヤを Infiniband に変えたり、ハードウェア的にも「ただつないだだけ」からは遠くなっていった訳ですが。

          まぁ、遠目に見れば「ただつないだだけ」はその通りなんですけどね。データベースソフトウェアが「ただデータをHDDに書き込むだけ」というのと同程度には当たっています。

          #今回の長崎大の仕事は、今回のクラスタ構成にあわせた、N体問題ソルバの計算量を劇的に削減するアルゴリズムの提案にあるんだけど、見事にみんなにスルーされてハードウェア構成だけに話題が集中しているのが悲しい。

          • おっと、遅くなってしまいましたが(もう誰も読んでなかったりして)、

            ここにきてやっとなんでこんなに話が食い違ってるか気付きました。
            私は(ゼロから設計するに近い)ベクトル型と比べて、
            スカラ型は既製品だけ構築されるので、「つなぐだけ」と言っていました。
            少なくとも構築するにあたり、なにか専用ハードウェアを開発してないと思います。

            もちろん、接続する部分にしても苦労やノウハウがあったと思います。
            それが全くないとは思いません。

            私の価値観からしてみれば、ハードウェアの開発やミドルウェアのプログラミングに比べれば、
            そこは取るに足らない部分だと思いました。

            お互いが相対評価で会話してたので、ずれてしまったんですね。

        • 2個のコメント が現在のしきい値以下です。
      • 2個のコメント が現在のしきい値以下です。
    • 1個のコメント が現在のしきい値以下です。
  • Anonymous Coward : 2009年11月27日 13時14分 (#1679149)

    2008年の受賞がjaguarの409TFLOPSでしたから、今回の受賞
    では低価格・低消費電力が重視されたのでしょう。

  • 地球シミュレータから7年も経ったことを考えると、こんなものかもしれません。
    これもムーアの法則の一例かもね。
  • まだ、書き込みがないようなのでスパコン研究者の方が、今回の事業仕分けを
    どう感じたのかを記されたページを引用しますね。
    『スーパーコンピューンィングの将来(75. 2009/11 「仕分け」雑感 (2009/11/25) [artcompsci.org])』。
    今のx86系プロセッサを束ねたスパコンのコスト・メリットは、今後、失われていくという分析のようです。
    この方の分析が正しければ、スパコン批判側が「海外から安い機種を買ってくればいい」というのは、現状しかみていないと言えそうです。


    コンピュータによるシミュレーションが科学・技術の強力な手法であるので、研究基盤として、強力なコンピュータの作り方を研究する必要はあると思いますね。
  • <スパコン>長崎大の浜田助教、3800万円で日本一の速度達成 安くても作れ、事業仕分けにも一石? [yahoo.co.jp]

    > メーカーからの購入分だけでは足りず、実際に秋葉原でGPUを調達した

    えっと、長崎大の先生だよね? グラフィックボード買い付けにわざわざ秋葉ま
    で行ったの? 長崎では売ってないかもしれないけど、せめて福岡とか……

    --
    TomOne
  • Anonymous Coward : 2009年11月27日 12時33分 (#1679097)
    2chのニュー速あたりと変わらないのかスラドも…
    GPUを利用したのは確かに安くて速いんだけど精度の問題で
    利用できる範囲は非常に狭いです。
    地球コンピュータとこれを単純に速度だけ比べるというのは
    全く意味の無い比較
    • Anonymous Coward : 2009年11月27日 13時39分 (#1679163)
      単純な速度比較に意味がないんなら「一位になれなければ意味がない」という発言はなんだったの? 「単純な速度比較で一位になることに意味があるんですか?」って仕分け人に聞かれたら何て答えるつもりなの?
    • Anonymous Coward : 2009年11月27日 21時43分 (#1679600)

      事業仕分けのスパコン(スカラー)と今回のスパコン(GPU)はまったく別物。地球シミュレータ(ベクトル)も。

      GPUを用いた今回のやつは、例えば100個の足し算や引き算をまとめて一回とかでしちゃうので、
      スカラー型のスパコンに比べれば単純な性能は100倍とかになったりします。
      なので単体あたりの性能も500GFlopsとかって言われているけど、実際の科学技術計算とかでは
      そんなに単純な計算ばかりだけではなく、

      (A*((B+C)-D)*cos(E)-F)/G

      何て計算式があったときには、まずB+Cをし、次にAを掛けて・・・と1つずつしないとなると、
      GPUでは極端にスピードが落ちる。

      しかし、スカラー型は単純な足し算引き残だけではなく難しいアルゴリズムを用いた複雑な計算式を
      一回で解けるようにしていたり、複素数が使えたりとか小数点とか計算精度も高かったりします。

      GPUが得意なモニタは点の集まりで構成されており、3次元でこの部分が影になるから黒に近づけるとか、
      透明化しているように見えるために色を組み合わせるとか、の点々の計算が大量にあるから、そういう
      処理はGPUが得意。

      今のPCに乗っかっているCPUもネットしながら動画を見たり、音楽聞いたりと様々な計算をする必要があり、
      スカラー型です。曲を同じタイミングで100曲ながしたりとかしないよね??

      地球シミュレータのベクトル型もGPUと同じような動作を行いますが、地球を1km四方とかで区切って、
      同じような計算をいっぱいするから。

      地球シミュレータがGPUと違ってすごいのは、GPUは1個の数字が8桁までとかだけど、
      地球シミュレータは32桁まで大丈夫とかってなるわけです。
      8桁までの計算をするんだったら、GPUでもいいけど、32桁の計算をするんだったら、
      地球シミュレータしか無理となる。

      なんで、GPUは何で32桁にしないかというと、GPUとして使っているから、必要ないのです。
      通常の液晶ディスプレイは1677万色しか生成できず、1000億色まで生成できるといっても
      人間に判断できないので、作る必要が無いし、作ったら当然コストも高いし、電力も食う。

      もっと言うとでかい数字を大量にするとなったときに、メモリからCPUにデータを大量に送る
      必要がでてきて、GPU用のGDDR5なんていうグラフィックに最適化したDDRメモリを乗っけていますが、
      それでも速度的には限界。
      ベクトル型CPUにはもっと専門的なメモリからの転送手法が必要になってきます。
      しかし、そのような手法はとても難しく、地球シミュレータが最後のベクトル型でトレンド
      としては今はスカラー型が多くなってきている。
      でも、地球をシミュレーションするような気象関係の計算には、今でもベクトル型の方が有利。

      一般にも使われているGPUを使っている今回のやつは当然値段も安い。

    • taka2 (14791) : 2009年11月27日 14時12分 (#1679194)

      GPUは、速度は滅茶苦茶速いですけど、メモリが少ないので、性能を引き出すのがすごく難しいんですよ。
      以前書いたコメントからのコピペ [slashdot.jp]なので、1年以上前の情報ですが、

      姫野ベンチのCUDA最適化という例を挙げられてたんですが、
      CPUだけだとは実測1GFlopsぐらいなんですが、
      理論値600GFlopsのGPU4枚で、実測50GFlopsぐらい出せたとか。
      コアはたったの2%しか働いてない

      って感じ。それでも、GPUは単価が安いので数で攻めることができるわけですが、プログラミングの難易度は格段に高いと思います。
      ちょっとした違いで速度が大幅に変わってきます。

      今回の事例では、768GPUみたいですが、1GPUが1TFlopsとしても、
      ピーク768TFlopsで、実効158TFlopsと、20%もの性能を引き出してることになります。

      GPGPUでこれだけ性能を出せたのは、「扱っている多体問題がGPGPU向けだった」ってことと「プログラマが凄く頑張った」ってことは言えると思います。
      このコンピュータが、「どんな問題でもそれだけの性能が出せる」って考えてはダメでしょう。

      • 開発費とシステムの写真を見て、演算能力に対して帯域が小さなシステムで
        研究対象は(元から)GPGPU向けの問題だったのではと思いましたが、
        理研のプレスリリース [riken.go.jp]によると

        本研究においては、長崎大学に構築した大規模なGPUクラスタを利用し、その上に天文学向けにはツリー法、
        流体計算では高速多重極法と呼ばれる手法を実装しました。これらは実用的に用いられている高速な計算手法ですが、
        その反面複雑で並列化がしにくく、GPUによる並列化が難しかった手法です。
        しかし、新しく開発した「マルチウォーク法」により効率の良い並列化を可能とし、高い効率を得ることに成功しました。

        とのことで、プログラマが凄く優秀かつ凄く頑張って
        扱っている多体問題をGPGPU向けのアルゴリズムで解けるようにした、ではないでしょうか。

        GPGPUでのプログラミング能力と、GPGPU向きのアルゴリズムを考案する能力が揃わなければ
        これだけの成果は出なかったと思います。

        新しいアルゴリズムの開発が出来る問題ばかりではないでしょうし、出来るような人材がごろごろいるわけでもないでしょうから
        大規模な次世代スパコンの開発も行うべきだと思いますが、こういった人材を育てる方面にももっと予算を出して欲しいです。

        上手く育ってくれない例のほうが多いかもしれませんが、上手くいくと初めから分かっていれば
        国が予算を出さなくとも、余裕のある企業が手を出すでしょうし・・・

        # HTMLのプレスリリースの一部がダブっているのは、大事なことなので二回言いました?

        --
        単なる臆病者の Anonymous Cat です。略してACです。
      • 3個のコメント が現在のしきい値以下です。
    • 9個のコメント が現在のしきい値以下です。
  • Anonymous Coward : 2009年11月27日 19時51分 (#1679497)

    F1なんて2400ccだけど、トヨタのエスティマ(2400ccの)と同じですよ?

    F1カーと比較するなら、WRCカーにしときなさい。サーキットならF1カー、グラベルや雪上ならWRCカーが速い。

    #つまり、別種のものを比べる愚を冒してないか?の視点が必要。

    別種のものを比べること自体は愚かではない。愚かなのは、用途や使用条件の違うものを、ある一つの指標をもって、要・不要を語ること

  • >そして今回は、2000ccのエンジンで300馬力出しました
    >ってところじゃないかな。

    車で例えるなら、ピーキー過ぎて使えないとか、燃料効率が悪すぎるというのもありそうだな。

  • 御意。
    問題を解きたい研究者にとっては、結局、こういうのはバッドノウハウでしかないのです。
  • 8個のコメント が現在のしきい値以下です。