パスワードを忘れた? アカウント作成
4361 story

Xserveクラスタで217GFlops 15

ストーリー by yourCat
もとい、0.2TFlops 部門より

halo曰く、 "ZDNetの記事によると、Poochデベロッパー・Dauger Researchが、33基のApple Xservesクラスタで217GFlopsを達成をしたそうです。ベンチマークのルールが違うので比較することに意味があるのかわかりませんが、少し前の記事で話題に上がったスパコンのTop500 listでいうと342-3位くらいになるのかな。"

件のXServeクラスタは33台のDual 1GHzをOS X Server 10.2で動かしている。また、同じくPoochを使った76台のPower Mac G4 Dualで構成されたクラスタは、OS 9.2.1で動いており、こちらは233GFlopsを達成している。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by chiba-f (6867) on 2002年11月22日 1時08分 (#204773)
    altivecがサポートしているのは単精度実数(32bit、10進法で6桁くらい)のみです。ベクトルレジスタが128bitなので、4個の単精度実数を固まりとして処理できます。6桁の計算で十分なアプリケーションではその威力は絶大です。たとえば、この例 [nao.ac.jp]。
    いまどきの数値計算は、スパコンなども含めて、倍精度(64bit、10進法で16桁くらい)で行うのが普通です。6桁のレンジで足りない場合も多いからです。たとえば、Pov-ray MacではFAQ [povray.org]で(要するに)精度が足りないと書いています。
    PentiumのSSE2では倍精度実数を扱えるようですが、一度に2個なので、あまり有り難みがなさそうです。PowerPCでは倍精度のa+b*cの計算(行列の計算の基本演算はほとんどこの形)を一命令でできますし。
    実際には倍精度でも足りないことがあるので、ソフトウェアで多倍長計算します。とても遅いです。たとえば、MPFR [mpfr.org]などを使って。
    もっとも、ベクトルレジスタを256bitにして倍精度実数を4個同時に扱えるようにするのは、「コスト」の問題でできなかったのですが。(将来、「コスト」的に可能になったら実装されるでしょう。)
    それから、altivecを使った整数の多倍長計算、4倍精度計算はここ [apple.com]に記事があります。altivecで実数の(4倍精度より長い)多倍長演算を実装した例は知りません。倍精度でないとうまくいかないようです。(ちゃんと考えたわけではないのですが)
    • by SteppingWind (2654) on 2002年11月22日 11時07分 (#204914)

      要するに以前からよく言われていた, PS2による計算クラスタが現実的ではないということと同じ制限が現時点では有るということですね.

      で, ちょっと疑問なのですが, 現在のaltivecって何に使われることを想定しているんでしょう? やっぱりゲーム用以外だとリンク先に有るようなFFT等の様にDSP代わりに使うぐらいしか思いつかないです.

      親コメント
    • by maho (9810) on 2002年11月24日 21時08分 (#206192)
      Pentium 4 の SSE2 は高速です。2G Flops なんぞ軽く出します。Altivec は単精度ですか。それは残念です。SSE2 は倍精度ですし、BLAS は Alpha なんかをはるかに凌駕します。もちろんクロック比もありますが。こんなに安価で高速とはおそれいります。Intelさんには。
      親コメント
    • だとすると、ベンチマークは何ビットで行うのが最適なんだろう? ってな疑問も出てきます。
      理論的には、メモリの許す限りの精度で演算出来る訳ですし。
      (プロセッサの1命令で出来ないにせよ)

      2^nビットでの結果を、プロセッサ、もしく
  • by halo (12510) on 2002年11月22日 2時39分 (#204826) 日記
    以下、Appleのカタログ等を参考に。
    ネットワーク機材などは勘定に入れずに。

    値段:50万円×33台=1,650万円
    総消費電力:400W×33台=13,200W
    総重量:11.8kg×33台=389.4kg
    総容積:44mm×483mm×711mm×33台=約5立方m
    • by asukaibito (7656) on 2002年11月25日 14時34分 (#206577) ホームページ
      > 値段:50万円×33台=1,650万円
      > 総消費電力:400W×33台=13,200W
      > 総重量:11.8kg×33台=389.4kg
      > 総容積:44mm×483mm×711mm×33台=約5立方m

      総消費電力ですが、それは搭載している電源ユニットの容量でしょう。 定格で175W [apple.co.jp]とありますので、総消費電力はその半分程度の6,600W程度と見てよいのでは無いでしょうか?
      おそらくラックに載せているので、総重量もあと80Kgくらいはかかりますね。ちなみに36Uのラックの容積は約1立方メートルです。
      値段も、メモリ位は増設していそうなので、65万円~100万くらいの間になると思います。

      親コメント
  • by GSone (8994) on 2002年11月22日 1時17分 (#204785) 日記
    つい最近x86版OSX上でFinalCutProが動いているという噂を
    ここ [tcp-net.ad.jp]で見た覚えがあるのですが
    こいつでやった場合どんな結果が出るかのほうが興味があります。

  • by Anonymous Coward on 2002年11月21日 22時01分 (#204670)
    PS2だと1台6.2GFLOPSなので 217/6.2=35台になります。
    つまり、ゲーム機よりちょっとマシ程度です。なんてね。

    演算器のクロックを合計したものと、ちゃんとしたFPUとを
    比較すること自体間違っているが、単純に数字だけ比較すると
    たいしたことがないように思えてしまう。
    • by halo (12510) on 2002年11月21日 22時48分 (#204686) 日記
      Appleのページ [apple.co.jp]を見るとXserve(G4x2 1GHz)1台で15Gflopsだそうです。なので、単純計算だと15X33=495Gflopsとなります。

      これを限界値とすると、約44%ということになります。これが、クラスターの効率としてどの程度の評価になるのかはよくわかりません。

      ちなみに地球シミュレーターを同じ基準で評価すると、5784PS2になります。
      親コメント
    • by Anonymous Coward
      プレステと比較してどうするだよ
      PCの場合、ビデオカードの演算やサウンドカードの推定演算も含むでよろしいのでしょうかね。
      もしや、ビデオカードやサウンドカードも演算装置として利用できるシステム採用すればいい

      #もしかして画期的かもに1票!
      • by manny (5319) on 2002年11月22日 10時16分 (#204902)

        8bit CPUな「マイコン」時代には、フロッピーディスクドライブのコントローラに計算させたりとかいうプログラムもあったかと記憶しているので既に実現しているといえなくもないかも。AmigaとかPC-88あたりだったっけなぁ。
        といっても全然詳しくないので識者のツッコミに期待(^^;

        親コメント
        • by Anonymous Coward
          MEGA-CD ではメインよりサブ(CD側)のほうが速かった為にそちらに計算をさせるというのは当たり前だったという話です。それでも足りなきゃZ80にも... :-)

          # シルキーリップの店頭デモを見てMEGA-CDを買ったのでAC
typodupeerror

アレゲは一日にしてならず -- アレゲ見習い

読み込み中...