パスワードを忘れた? アカウント作成
4834 story

Athlon64のベンチマーク結果が続々と 96

ストーリー by Oliver
64bitだとどうだろう 部門より

nminoru 曰く、 "Hammer あらため Athlon64 の性能は、 AMD 自身が発表したベンチマーク結果しかなかったが、今年に入って Athlon64 を実際に入手したユーザーからの情報がネットに公開され始めた。
μthe inquirerこの記事によるとドイツのサイト C'tが 1.2GHz Athlon 64 のプロトタイプシステムで SPEC CPU2000 ベンチマークの計測を行ったようだ。
C't はSSE2 向けのコード最適化とIntel コンパイラを用いたバイナリで、 SPECint2000 で 719、SPECfp2000 で 755 というスコアを得ている (ドイツ語の記事結果のグラフ)。
(おそらく) 同一バイナリを Pentium4 2.2GHz 上で実行した結果は、 int2000 で 774、fp2000 で 677 。AMD 自身が発表した Hammer Opteron 2GHz のスコアはint2000 が 1,202、fp2000 が 1170。(注意:SPECcpu2000 はソースコードで配布されるベンチマークでありコンパイラのオプション等によって性能が左右される。またコードに対する最適化は認められていない。そのため C't の結果を他の SPECcpu2000 スコアと比較することはできない。)

同じく μthe inquirer のこの記事によると、ドイツのサイト pro-Linux とフランスのサイト x86-secret.com がAMD Athlon64 を入手しベンチマークを公開したようだ。x86-secret.com は、1.4GHz の Athlon64 (200MHz x 7) マシン上でWindows の主なベンチマークのスコアを計測している( ここ)。1.4GHz Athlon64 (200MHz x7 DDR333 メモリ) は 同クロックの Athlon XP (133MHz x10.5 DDR266メモリ)と比較して 全体的に 1~2割速度が向上しているようだ。
メモリに注目すると、スループット性能はシステムバスのクロック比程度向上(SiSoft Sandra 2003 Memory Benchmark の結果が約25%向上)。レイテンシは大幅に改善して mBench の結果が 136,3 → 64,9 と半分に短縮。 これは2.26GHz の Pentium4 (133MHz x17 DDR333 メモリ)の結果よりよく、Hyper-Transport の効果だと思われる。
余談だが AMD は AMD Breakout Performance Survey Contestというのをやっている。誰かエントリした人はいますか?"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by alp (1425) on 2003年01月28日 20時04分 (#245461) ホームページ 日記
    手でコードを直すことが出来ないだけで、コンパイラによる最適化は好き勝手にやって良い、ものです。まぁ、コンパイラの実力込みだけど、普通はプロファイル取って思いっ切り最適化します。ちなみに、問題ごとの最適化をやってはいけないのが 'base'、やっていいのが peak (こちらが普通にいう cpu2000 の値) です。
    • by bushidoh (12670) on 2003年01月28日 20時48分 (#245486)
      Intel やAMD などは base で公開しますが、IBM は全て peak ですね。

      某氏が以前、ごちゃまぜにして比較していました。
      http://pc.watch.impress.co.jp/docs/2002/1021/kaigai01.htm
      親コメント
    • >コンパイラによる最適化は好き勝手にやって良い
      昔UNIX Warkstation各メーカーがSPEC競争をしていた頃は、テスト毎にコンパイラそのものを変えていたんだよなぁ。
      だから、ユーザーがそれを再現しようとしても、絶対にできなかったけど。
      その好き勝手というのは、単にコンパイラの最適化オプションを変えているだけでしょうか?
      親コメント
    • ただ、今回の場合、Intelのコンパイラを使っているので、
      せっかく拡張されたレジスタは全然使われていないことになりますね。
      もったいない。

      # というか、AMDって自前のコンパイラ持ってないようだけど。
      --
      あぁ、「ン」が消えてるんですよ。「ビーフン・カレー」ね。
      親コメント
  • by Ying (4319) on 2003年01月28日 20時32分 (#245481)
    Athlon64(Hammer)の最大のウリはメモリコントローラをオンダイで搭載したことにあると思うのですが、なんメモリ性能の向上にHyper-Transportが効果あるんでしょう?

    解説求む。

    • by kumakuma (13762) on 2003年01月28日 20時43分 (#245485)
      シングルプロセッサだと関係ないっす。 マルチプロセッサだと、HT Link経由でのメモリアクセス(XFire)が 行われるので、HT Linkが高速だからリモートメモリも高速にアクセス 出来るとAMDは言ってます。
      親コメント
    • おっしゃる通りメモリコントローラ(MCT)のおかげでした。

      脳内の Hammer のイメージが風化して、このOHP [amd.com]の 11 ページ目の図が、"DDR Memory Controller" から "HyperTransport" に置き変わっておりました。
      自分で書いておいて [srad.jp]忘れているのだから世話はない。

      具体的には、2GHz Hammer でコアから MCT までのアクセスレイテンシが 12ns になるそうです。手元に資料がないのですが、これまでのものだと速いものでも 40ns ~ぐらいでしょうか。
      無論この後、MCT~DRAM 間の転送のためにDRAM のレイテンシ(50ns ~)がかかります。
      --
      コンタミは発見の母
      親コメント
  • レイテンシは大幅に改善して mBench の結果が 136,3 → 64,9 と半分に短縮。これは2.26GHz の Pentium4 (133MHz x17 DDR333 メモリ)の結果よりよく、Hyper-Transport の効果だと思われる。
    CPU が直接にメモリへアクセスするようになったと聞いたのでチップセットのレイテンシ(DRAM のレイテンシより長いか同程度) が無くなったからではありませんか。
  • by bushidoh (12670) on 2003年01月28日 20時56分 (#245489)
    C't はSSE2 向けのコード最適化とIntel コンパイラを用いたバイナリで、 SPECint2000 で 719、SPECfp2000 で 755 というスコアを得ている (ドイツ語の記事、 結果のグラフ)。
    (おそらく) 同一バイナリを Pentium4 2.2GHz 上で実行した結果は、 int2000 で 774、fp2000 で 677 。

    A64
    int_base 755
    fp_base 719

    でしょう。
    • base or peak? (スコア:2, 参考になる)

      元のタレコミの SPECint2000/SPECfp2000 という記述もまずいのですけど、base 値でもないみたいなんです。

      μthe inquirer の方の記事 ("along with code optimised for SSE2 and using an Intel compiler.")と、 C't のドイツ語記事を読む限り どうも手作業でソースを弄っている感じがします。
      つまりレギュレーション違反のスコアです。
      # もっとも私のドイツ語力は限りなくゼロに近いので、誤読の可能性は高い。

      実際 C't は昨年の時点でレギュレーションに沿った base 値を 公開しています( 英語記事 [heise.de])。 SPECint_base2000 が 739、SPECint_fp2000 が 674 です。
      マシンの構成に変化がないので、同じマシンで取ったものだと思われます。

      p.s.
      あと MPF2002 で AMD が公開した Opteron のスコア(int2000 が 1,202、fp2000 が 1170)も、 peak だか base だか断言されず揉めていました。
      --
      コンタミは発見の母
      親コメント
      • by bushidoh (12670) on 2003年01月29日 8時52分 (#245810)
        > "along with code optimised for SSE2 and using an Intel compiler."

        それは最適化ではなく、SSE 命令を使うかどうかでは。

        > あと MPF2002 で AMD が公開した Opteron のスコア(int2000 が 1,202、
        > fp2000 が 1170)も、 peak だか base だか断言されず揉めていました。

        base ですよ。
        親コメント
        • by bushidoh (12670) on 2003年01月29日 9時39分 (#245844)
          > base ですよ。

          これだけでは不親切なので、

          http://pcweb.mycom.co.jp/news/2002/10/18/31.html
          ところで前回のレポートの際に示したSPECint/SPECfpの値だが、これはSPECint_base/SPECfp_baseであることが確認された。なんでもテスト環境の構築のために利用したコンパイラはIntel製のものだそうである。したがって、最適化した場合には更に性能が上がりそうだ。また、Intel製コンパイラということはつまりIA-32用のものだから、32bitコードでの実行結果ということになる。改めてOpteronの性能の高さが確認された事になる。
          親コメント
          • サンクス。
            結局、base 値だったのね。

            p.s.
            PCWeb の大原雄介氏の歓心するポイントはずれているにゃあ。
            bushidoh さんにも分かっていると思うので突っ込みませんが。
            --
            コンタミは発見の母
            親コメント
          • by take0m (4948) on 2003年01月29日 12時48分 (#245989) 日記
            Itanium2 1GHzは、HPのベンチマークで

            CINT2000 base 807
            CFP2000 base 1431

            って出ています。
            ほとんど科学技術計算専門って感じですかね。
            WebサーバとかDBサーバには基本的に向いていないのかなぁ。
            でもそれはまた別のベンチマークがあるか・・・
            親コメント
            • > ほとんど科学技術計算専門って感じですかね。
              > WebサーバとかDBサーバには基本的に向いていないのかなぁ。
              > でもそれはまた別のベンチマークがあるか・・・

              DB世界の標準ベンチマークTPC [tpc.org]のTPC-C には NEC のマシン Itanium2 マシン(Express 5800/1320Xc)がエントリしていますよ。
              Itanium2 1GHz の 32CPUマシン、MS .NET Server 2003 Datacenter + SQL Server2000 の構成で、TPC-C 値が 342,746(単位時間あたりの処理トランザクション数なので大きいほど性能が高い)。気になるお値段は 4,409,084 US$。

              Pentium4 も Unisys が Intel Xeon MP 2.0GHz の 32CPUマシンでエントリしています。OS と DB は上と一緒で、TPC-C 値が 234,235 が最高です。お値段は 2,715,310 US$。

              実際はマシン性能以上にストレージの性能とかが効いてくるので一概にいえませんが、悪くないスコアだと思いますよ。

              ちなみにトップは hp ProLiant DL760-900-256P のシステムです。
              Pentium III Xeon 900MHz を 272 個で構成したクラスタマシンですな。こいつも Windows 2000 Advanced Server + SQL Server2000
              TPC-C 値は 709,200。お値段は10,603,803 US$ なり。
              --
              コンタミは発見の母
              親コメント
  • 素人目にはベンチやスペックなどでは余りぴんと来ないのですが
    識者の方は単刀直入にどう感じているのでしょうか?
    前評判だとかなり速いらしいといううわさがあったのは知っているのですが・・・
    期待通りだったのか、まぁまぁ現実的だったのか
    期待はずれだったのか、泣けてくるのか、
    をズバリ聞かせて頂けるとうれしいです。

    そのような表現が見あたらないのは実際手元に来ないと分からない
    と言うことなのでしょうか?やはりまだまだ情報が足りない?
  • by trueOne (134) on 2003年01月28日 22時35分 (#245551)
    どうなのかしら?PC用途での最速(これもまぁイイカゲンな表現ではあるけれど)CPUってのは、一体全体どれなのでしょう?
    --
    trueOne
    • by pantora (11989) on 2003年01月28日 22時52分 (#245565)
      >PC用途での最速
      スピードの最速は日々変わりますし用途によっても異なります。
      コストパフォーマンスという観点から見ると、
      PentiumよりもAthlonかと思われます。

      ちなみ、うちのLinuxマシンはAthlonです。
      カーネル再構築が10分以内に終ります。
      --
      PCにECC Registeredメモリの利用を推奨します。
      親コメント
      • by doripush (653) on 2003年01月28日 23時31分 (#245600)
        > カーネル再構築が10分以内に終ります

        最近の話にしては、やけに遅くないかい?
        親コメント
        • by pantora (11989) on 2003年01月29日 1時30分 (#245695)
          > > カーネル再構築が10分以内に終ります
          > 最近の話にしては、やけに遅くないかい?

          debパッケージで管理していますから、
          余計な時間かかるんですわ。

          最近、そのままビルドする事が少なくなりました。
          あと、メインマシンで6台分のカーネルパッケージ作ったり。
          --
          PCにECC Registeredメモリの利用を推奨します。
          親コメント
  • この先リリースされる、CPUを更に効率良く稼動させる為にRAMの最適化、高速化に適してるチップセットが
    AMD以外から、きちんと出る事だけだな…

    つうか、CPUパワーだけ設計どうり良くても、チップセットのバグとかは許しがたいものが…
    結局は、CPUだけに至らず、RAMやチップセットのバランスがユーザーが求める形になるんだから…

    #RB26DETTを(もし)積んだクルーのアクセルは怖くて踏めん。(苦笑)
    #20B積んだコスモクーペも同じく(爆笑)
    --

    /* Kachou Utumi
    I'm Not Rich... */
  • by GSone (8994) on 2003年01月29日 2時17分 (#245720) 日記
    今度Macに載るとうわさの64bitCPU,
    970とも比べて欲しいな。
    IBMとAMDって協力関係むすんだんでしたっけ?
    • IBM の予測値ですけど 1.8GHz の PPC 970 が
      SPECint2000 が 937、SPECfp2000 が 1,051
      になると言っています。

      元の記事は ここ [theregus.com]。
      --
      コンタミは発見の母
      親コメント
      • IBM の出す値は peak だから比較するべきではない。
        親コメント
        • > IBM の出す値は peak だから比較するべきではない。

          単純に比較できないという本当ですが、
          PPC 970 の結果は peak だから較べられないのではないです。
          予測値(つまり実機での計測でない)なのですから比較できないのです。
          # そういう意味で IBM が出す値も peak とは限りません。

          bushidoh さんは peak / base の違いにこだわっておいでですが、
          SPEC CPU はコンパイラの選択、オプション、マシンのチューニングによって
          大きくスコアが変わるベンチマークです。
          base or peak 以上に、どこまでチューニングされているかが影響します。
          同じハードであってもいい加減なチューニングの peak は、最適化された base を下まわります。
          そのため、本当に SPEC値を比較するためには 双方の configuration を知る必要があります。
          ですから Configuration や各テストのスコアを公開しないデータは、base / peak が分かっていても意味のある比較はできません。

          逆に、性能の輪郭が見えればいい程度の比較であれば peak と base の比較であっても無意味とはいえません。実測値は、測って取れた性能ですから。
          一般に RISC 系の石は peak/base の差が大きく、IA-32 系の石は差が小さくなります(1割未満です)。
          # IA-64 のように base 値がそのまま peak 値になっているアーキもあります。

          そのため IA-32 系の石の base と RISC 系の peak と比較して、性能をつかむことはできますよ。
          --
          コンタミは発見の母
          親コメント
          • > 逆に、性能の輪郭が見えればいい程度の比較であれば peak と base の
            > 比較であっても無意味とはいえません。実測値は、測って取れた性能です
            > から。

            いえ、無意味だとは考えていません。しかし、提示した値が peak である事を説明するべきでしょうし、加えて安易な比較は出来ないと付け加えてあればいいかもしれません。コンパイラ云々と "後" から説明する事こそ無意味ではありませんか。
            親コメント
typodupeerror

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

読み込み中...