Athlon64のベンチマーク結果が続々と 96
64bitだとどうだろう 部門より
nminoru 曰く、 "Hammer あらため Athlon64 の性能は、
AMD 自身が発表したベンチマーク結果しかなかったが、今年に入って Athlon64 を実際に入手したユーザーからの情報がネットに公開され始めた。
μthe inquirerのこの記事によるとドイツのサイト C'tが
1.2GHz Athlon 64 のプロトタイプシステムで
SPEC CPU2000 ベンチマークの計測を行ったようだ。
C't はSSE2 向けのコード最適化とIntel コンパイラを用いたバイナリで、
SPECint2000 で 719、SPECfp2000 で 755 というスコアを得ている
(ドイツ語の記事、
結果のグラフ)。
(おそらく) 同一バイナリを Pentium4 2.2GHz 上で実行した結果は、
int2000 で 774、fp2000 で 677 。AMD 自身が発表した Hammer Opteron 2GHz のスコアはint2000 が 1,202、fp2000 が 1170。(注意:SPECcpu2000 はソースコードで配布されるベンチマークでありコンパイラのオプション等によって性能が左右される。またコードに対する最適化は認められていない。そのため C't の結果を他の SPECcpu2000 スコアと比較することはできない。)
同じく μthe inquirer のこの記事によると、ドイツのサイト pro-Linux とフランスのサイト x86-secret.com がAMD Athlon64 を入手しベンチマークを公開したようだ。x86-secret.com は、1.4GHz の Athlon64 (200MHz x 7) マシン上でWindows の主なベンチマークのスコアを計測している(
ここ)。1.4GHz Athlon64 (200MHz x7 DDR333 メモリ) は
同クロックの Athlon XP (133MHz x10.5 DDR266メモリ)と比較して
全体的に 1~2割速度が向上しているようだ。
メモリに注目すると、スループット性能はシステムバスのクロック比程度向上(SiSoft Sandra 2003 Memory Benchmark の結果が約25%向上)。レイテンシは大幅に改善して mBench の結果が 136,3 → 64,9 と半分に短縮。
これは2.26GHz の Pentium4 (133MHz x17 DDR333 メモリ)の結果よりよく、Hyper-Transport の効果だと思われる。
余談だが AMD は
AMD Breakout Performance Survey Contestというのをやっている。誰かエントリした人はいますか?"
何か誤解を招く書き方だけど (スコア:2, 参考になる)
x86 Athlon PowerPC (スコア:1)
某氏が以前、ごちゃまぜにして比較していました。
http://pc.watch.impress.co.jp/docs/2002/1021/kaigai01.htm
Re:x86 Athlon PowerPC (スコア:1)
IBM の PPC 970 の予測値がそうだとはいいませんが、 この手の予測値は妄想爆発なので眉に唾つけてみるべきです。
例えば、Motrola の PowerPC G5 の予測値 [212.100.234.54]とかです。
予測値が base か peak かは、ほとんど意味はないと考えられます。
あと peak と base の差は結構大きいと思っていらっしゃいませんか?
www.spec.org のデータを見ると分かるのですが、peak と base が接近したデータが多いです(spec のページを見るのが面倒な場合は ここ [u-tokyo.ac.jp]でもいいですけど)。
こういう結果になるのは、コンパイラ技術が成熟したためと、各社 SPEC CPU 向けにコンパイラを作りこむからでしょうが、、、
コンタミは発見の母
Re:何か誤解を招く書き方だけど (スコア:1)
昔UNIX Warkstation各メーカーがSPEC競争をしていた頃は、テスト毎にコンパイラそのものを変えていたんだよなぁ。
だから、ユーザーがそれを再現しようとしても、絶対にできなかったけど。
その好き勝手というのは、単にコンパイラの最適化オプションを変えているだけでしょうか?
Re:何か誤解を招く書き方だけど (スコア:1)
エゲツない最適化 (スコア:1)
テスト毎にコンパイラそのものを変えていたんだよなぁ。
SPEC cpu95 のころにはソース中の関数を拾って、
コンパイラが特殊処理をするとかやっていたメーカーもちらほら。
今の SPECcpu2000 のレギュレーションはここ [spec.org]です。
複数コンパイラに関してはやっている [spec.org]とこがあるので、いいのではないかと思われます。
コンタミは発見の母
Re:何か誤解を招く書き方だけど (スコア:1)
せっかく拡張されたレジスタは全然使われていないことになりますね。
もったいない。
# というか、AMDって自前のコンパイラ持ってないようだけど。
あぁ、「ン」が消えてるんですよ。「ビーフン・カレー」ね。
Hyper-Transport の効果 (スコア:1)
解説求む。
Re:Hyper-Transport の効果 (スコア:2, 参考になる)
間違えました (スコア:1)
脳内の Hammer のイメージが風化して、このOHP [amd.com]の 11 ページ目の図が、"DDR Memory Controller" から "HyperTransport" に置き変わっておりました。
# 自分で書いておいて [srad.jp]忘れているのだから世話はない。
具体的には、2GHz Hammer でコアから MCT までのアクセスレイテンシが 12ns になるそうです。手元に資料がないのですが、これまでのものだと速いものでも 40ns ~ぐらいでしょうか。
無論この後、MCT~DRAM 間の転送のためにDRAM のレイテンシ(50ns ~)がかかります。
コンタミは発見の母
チップセットのレイテンシ (スコア:1)
fp719, int755 (スコア:1)
A64
int_base 755
fp_base 719
でしょう。
base or peak? (スコア:2, 参考になる)
μthe inquirer の方の記事 ("along with code optimised for SSE2 and using an Intel compiler.")と、 C't のドイツ語記事を読む限り どうも手作業でソースを弄っている感じがします。
つまりレギュレーション違反のスコアです。
# もっとも私のドイツ語力は限りなくゼロに近いので、誤読の可能性は高い。
実際 C't は昨年の時点でレギュレーションに沿った base 値を 公開しています( 英語記事 [heise.de])。 SPECint_base2000 が 739、SPECint_fp2000 が 674 です。
マシンの構成に変化がないので、同じマシンで取ったものだと思われます。
p.s.
あと MPF2002 で AMD が公開した Opteron のスコア(int2000 が 1,202、fp2000 が 1170)も、 peak だか base だか断言されず揉めていました。
コンタミは発見の母
Re:base or peak? (スコア:1)
それは最適化ではなく、SSE 命令を使うかどうかでは。
> あと MPF2002 で AMD が公開した Opteron のスコア(int2000 が 1,202、
> fp2000 が 1170)も、 peak だか base だか断言されず揉めていました。
base ですよ。
Re:base or peak? (スコア:1)
これだけでは不親切なので、
http://pcweb.mycom.co.jp/news/2002/10/18/31.html
ところで前回のレポートの際に示したSPECint/SPECfpの値だが、これはSPECint_base/SPECfp_baseであることが確認された。なんでもテスト環境の構築のために利用したコンパイラはIntel製のものだそうである。したがって、最適化した場合には更に性能が上がりそうだ。また、Intel製コンパイラということはつまりIA-32用のものだから、32bitコードでの実行結果ということになる。改めてOpteronの性能の高さが確認された事になる。
Re:base or peak? (スコア:1)
結局、base 値だったのね。
p.s.
PCWeb の大原雄介氏の歓心するポイントはずれているにゃあ。
bushidoh さんにも分かっていると思うので突っ込みませんが。
コンタミは発見の母
ちなみに (スコア:1)
CINT2000 base 807
CFP2000 base 1431
って出ています。
ほとんど科学技術計算専門って感じですかね。
WebサーバとかDBサーバには基本的に向いていないのかなぁ。
でもそれはまた別のベンチマークがあるか・・・
TPC-C スコアは悪くない (スコア:2, 参考になる)
> WebサーバとかDBサーバには基本的に向いていないのかなぁ。
> でもそれはまた別のベンチマークがあるか・・・
DB世界の標準ベンチマークTPC [tpc.org]のTPC-C には NEC のマシン Itanium2 マシン(Express 5800/1320Xc)がエントリしていますよ。
Itanium2 1GHz の 32CPUマシン、MS .NET Server 2003 Datacenter + SQL Server2000 の構成で、TPC-C 値が 342,746(単位時間あたりの処理トランザクション数なので大きいほど性能が高い)。気になるお値段は 4,409,084 US$。
Pentium4 も Unisys が Intel Xeon MP 2.0GHz の 32CPUマシンでエントリしています。OS と DB は上と一緒で、TPC-C 値が 234,235 が最高です。お値段は 2,715,310 US$。
実際はマシン性能以上にストレージの性能とかが効いてくるので一概にいえませんが、悪くないスコアだと思いますよ。
ちなみにトップは hp ProLiant DL760-900-256P のシステムです。
Pentium III Xeon 900MHz を 272 個で構成したクラスタマシンですな。こいつも Windows 2000 Advanced Server + SQL Server2000
TPC-C 値は 709,200。お値段は10,603,803 US$ なり。
コンタミは発見の母
識者の方は実際どう感じているのでしょう? (スコア:1)
識者の方は単刀直入にどう感じているのでしょうか?
前評判だとかなり速いらしいといううわさがあったのは知っているのですが・・・
期待通りだったのか、まぁまぁ現実的だったのか
期待はずれだったのか、泣けてくるのか、
をズバリ聞かせて頂けるとうれしいです。
そのような表現が見あたらないのは実際手元に来ないと分からない
と言うことなのでしょうか?やはりまだまだ情報が足りない?
Re:識者の方は実際どう感じているのでしょう? (スコア:1)
例えば、Dell Precision 350 P4 3.06GHzだと
int2000 base 1085
fp2000 base 1092
ですから。
金額は別にして、既に出荷されているマシンでこの値出ている訳ですから・・・
Re:識者の方は実際どう感じているのでしょう? (スコア:1)
製品のライフサイクルの間にどこまで性能を上げていけるかの方が問題でしょう。
Intel とAMD のメインストリーム製品の開発、リリースサイクルは丁度半周期だけずれていて、 ライフサイクルのある時期では他方を押さえつけるだけのパフォーマンスの物を出してくるので、次はAMDの番かという気がしなくもない。 しかしながら、Athlon対PentiumIIIではIntel はPentiumIIIの末期まで よく持ちこたえたこともあり、Pentium4も以外に長持ちしてしまいAMDの 出る幕無しかもしれませんね。
Re:識者の方は実際どう感じているのでしょう? (スコア:1)
どちらかと言えば、Athlon64の末期でIntelの次世代とどう戦うかに興味があります。
マーケティング的に、64bitということをどう打ち出してくるかも興味深いです。
#Athlon対PenIIIの時も、それまでのシェアを考えると、AMDが十分押していたような気もしますが。
Re:識者の方は実際どう感じているのでしょう? (スコア:1)
発熱はどうですか!ヒートシンクのみでいけそうですか!?
さらなるスピードより、静音ならAstro待つ方がいいですか!?
AMIGA4000T(60/50)使い
Re:識者の方は実際どう感じているのでしょう? (スコア:1)
ベースクロックを落とせば、ファンレスも可能かもしれませんが、そういうマザーを出す会社があるかな?
第一、AMDとIntelは速度重視・消費電力軽視の傾向が強いので、厳しいと思います。
(とはいえ、PII/K6の時代と比べると消費電力の軽減に相当腐心している形跡が見えるのも事実ですが、x86系でもTransmetaやVIAにはかなわない)
Re:識者の方は実際どう感じているのでしょう? (スコア:1)
あ、浮動小数点だとLINPAK MFLOPSのほうがメジャーかなぁ。
PowerPCと比べて (スコア:1)
trueOne
Re:PowerPCと比べて (スコア:1)
スピードの最速は日々変わりますし用途によっても異なります。
コストパフォーマンスという観点から見ると、
PentiumよりもAthlonかと思われます。
ちなみ、うちのLinuxマシンはAthlonです。
カーネル再構築が10分以内に終ります。
PCにECC Registeredメモリの利用を推奨します。
Re:PowerPCと比べて (スコア:1)
最近の話にしては、やけに遅くないかい?
Re:PowerPCと比べて (スコア:1)
> 最近の話にしては、やけに遅くないかい?
debパッケージで管理していますから、
余計な時間かかるんですわ。
最近、そのままビルドする事が少なくなりました。
あと、メインマシンで6台分のカーネルパッケージ作ったり。
PCにECC Registeredメモリの利用を推奨します。
問題は… (スコア:1)
AMD以外から、きちんと出る事だけだな…
つうか、CPUパワーだけ設計どうり良くても、チップセットのバグとかは許しがたいものが…
結局は、CPUだけに至らず、RAMやチップセットのバランスがユーザーが求める形になるんだから…
#RB26DETTを(もし)積んだクルーのアクセルは怖くて踏めん。(苦笑)
#20B積んだコスモクーペも同じく(爆笑)
/* Kachou Utumi
I'm Not Rich... */
Re:問題は… (スコア:1, おもしろおかしい)
もしかすると、中の人がすごかったのかもしれませんが。
Re:問題は… (スコア:1)
OpteronってノースブリッジについてはCPUに内蔵 [impress.co.jp]されるんじゃありませんでしたっけ? なもんで, 従来のAMDのCPUの様にチップセットに悩まされることが少なくなるっていうメリットもあるはずです.
Re:問題は… (スコア:1)
新型メモリが出るたびに ピン配置が変更される予感
VCRAM 1T-SRAM (スコア:1)
IBM PPC970 (スコア:1)
970とも比べて欲しいな。
IBMとAMDって協力関係むすんだんでしたっけ?
SPECint2000 が 937、SPECfp2000 が 1,051 (スコア:1)
SPECint2000 が 937、SPECfp2000 が 1,051
になると言っています。
元の記事は ここ [theregus.com]。
コンタミは発見の母
IBM の出す値は peak、 Athlon は base (スコア:1)
Re:IBM の出す値は peak、 Athlon は base (スコア:1)
単純に比較できないという本当ですが、
PPC 970 の結果は peak だから較べられないのではないです。
予測値(つまり実機での計測でない)なのですから比較できないのです。
# そういう意味で IBM が出す値も peak とは限りません。
bushidoh さんは peak / base の違いにこだわっておいでですが、
SPEC CPU はコンパイラの選択、オプション、マシンのチューニングによって
大きくスコアが変わるベンチマークです。
base or peak 以上に、どこまでチューニングされているかが影響します。
同じハードであってもいい加減なチューニングの peak は、最適化された base を下まわります。
そのため、本当に SPEC値を比較するためには 双方の configuration を知る必要があります。
ですから Configuration や各テストのスコアを公開しないデータは、base / peak が分かっていても意味のある比較はできません。
逆に、性能の輪郭が見えればいい程度の比較であれば peak と base の比較であっても無意味とはいえません。実測値は、測って取れた性能ですから。
一般に RISC 系の石は peak/base の差が大きく、IA-32 系の石は差が小さくなります(1割未満です)。
# IA-64 のように base 値がそのまま peak 値になっているアーキもあります。
そのため IA-32 系の石の base と RISC 系の peak と比較して、性能をつかむことはできますよ。
コンタミは発見の母
Re:IBM の出す値は peak、 Athlon は base (スコア:1)
> 比較であっても無意味とはいえません。実測値は、測って取れた性能です
> から。
いえ、無意味だとは考えていません。しかし、提示した値が peak である事を説明するべきでしょうし、加えて安易な比較は出来ないと付け加えてあればいいかもしれません。コンパイラ云々と "後" から説明する事こそ無意味ではありませんか。
Re:結局 (スコア:2, 参考になる)
>上げられる余地があるので将来的にはK8のほうが
>優勢になる…
パイプラインはPen4の方が深いです(たしか)
クロックをあげられる余地があるとすればSOI採用で消費電力を下げられるってとこくらいじゃないかなぁ
あとはメモリ周り
大きなデータを扱うと違いが出てくるはず
Re:結局 (スコア:1, 参考になる)
今回比較されたのはいわゆるDuron相当のブツです。
Athlon64 1.4Gは2200+以上の性能を持つと期待されます
じゃあ (スコア:1)
まだ登場してない製品と、既に過去の製品を比べてもってことで、
K8 2GとP4 3Gは?
そして、これから(2003 Q2)登場する製品同士を比べたらってことで、
K8 2GとP4 3.2Gは?
ってところがポイントですかね。
Re:結局 (スコア:1)
Re:そんなに急いでどこいくの♪ (スコア:1)
4MHz ⇔ 8MHz とか。
まあ、ほかにもこういう機種はあるんでしょうけども、
ほかは知らないので。
[udon]
Re:そんなに急いでどこいくの♪ (スコア:1)
ひそかに搭載されていまして、ソフト切り替えが可能でした。
out &h81,1 だったっけ?
Re:そんなに急いでどこいくの♪ (スコア:1)
仕組みは分からんですが、ゲーム対策にかスライダーがついていて、動かすことで連続的に速度を調整できるってのも見た記憶があります。
Re:そんなに急いでどこいくの♪ (スコア:1)
交換したときにはまりました(笑
自動で切り替わるかと思ってたら、ただ挿しただけだと表示が1250MHz(確か)、
なぜ小さくなるんだ???(笑
FSBはBIOSで設定が必要と気づき、変更、けど、表示は1666MHz(あれ?2000じゃないのか?)
しばらく実クロックが表示されていることに気づかず、FSBを上げたのにクロックが(思ったよりも)低い!偽物?とか(笑
本当かい♪本当かい♪
Re:そんなに急いでどこいくの♪ (スコア:1)
FSB下げて電圧下げられればなかなかいいかもしれんぞ
# 我がPalominoコアのAthlonXP1700+(普通の奴)
# 定格クロックのまま常時1.75V→1.55Vにて駆動中
# まぁ こういう使い方もありってことで
Re:わかってくださ~い~♪ (スコア:1)
そんな私は2世代前のアーキテクチャ。
の
Re:Itanium2 (スコア:1)
それと比較するなら せめて Opteronの64bit用に最適化したバイナリを実行した結果じゃないと
逆でもいいけどさ…Itanium2でx86エミュレーションして…とか