ATIのGPUがFolding@homeに参戦 84
ストーリー by next
ゲームやっていない時でもフル計算 部門より
ゲームやっていない時でもフル計算 部門より
Li on曰く、"先日、「プレイステーション3がFolding@homeに参戦」と発表になったばかりだが今度はATIのGPU上で動作させるクライアントを開発中との事。
現在は内部ベータテスト中とのことだが、9月の終わりごろにはオープンベータが公開される模様。
同FAQによればこれにより一つのPCから得られる性能が100Gflpsに到達するとの事。
並列演算リソースを持つチップに続々と対応しているFolding@Homeですが、となれば次はAGEIA社のPhysXチップ対応か?と思わず期待するところです。"
NかAかはともかくとして (スコア:5, 興味深い)
本人なのでID
Re:NかAかはともかくとして (スコア:1)
かつて、NeXT ってのがあった。 (スコア:1)
音の再生用とかに DSP を積んでいました。
大学でそれを使って計算していた人がいましたね。
マクロの基本は検索置換(by y.mikome)
Re: そんなこというなら (スコア:1)
ソフトウェア的なアップグレードが可能で革新的だったと思うけれど、1997年以降は気がついたら存在が消えてましたね。
OSのアップグレードの度にドライバで苦しんでいたのもいい思い出ですね。
#どこかに誤りがあるかも
#恥ずかしがらずにIDで。
Re:かつて、NeXT ってのがあった。 (スコア:1)
やはりAmigaかと。
Re:かつて、NeXT ってのがあった。 (スコア:2, 参考になる)
もっとも、3DではなくDisplay Postsript処理に使用されていたと思いますが。
DSPも乗ってますがあまり有効活用されてなかったかな?
別途DSPボード積んで音声処理させてたのは、国内だとどっかの音大にしかないはず...
Re:かつて、NeXT ってのがあった。 (スコア:1)
>
> 68Kだった筈。
あああ・・・しまった。間違えました><
マクロの基本は検索置換(by y.mikome)
Re:NかAかはともかくとして (スコア:1, 興味深い)
GPGPU+並列計算な研究をしてる人達が近くにいるのだけど,疎結合な並列計算機から見たGPGPUって,ノードのプロセッサが少し速くなったという意味しか無いように思えるんですよね. 組み合わせによって新たに発生する問題も,彼らのプレゼンを見ている限りでは見えてこないですし.
もしよろしければ,「早く計算できるのが正義」以外の研究の意義を教えていただけると嬉しいのですが.
# 所属を特定されそうなので AC
Re:NかAかはともかくとして (スコア:1)
効率よくパイプラインを使い切れるコードを書いたとしても。
AGPは論外としてPCIeを使ったとしても、
CPU-GPU間のボトルネックがあって、
大した効果が出ませんでした。
1PASSでデータ転送して、FINALまでGPUで完結させて、
結果だけCPUに転送するだけのような@HOMEコードって、
現状のスペックで出来るんかなー。
まぁ、CPUを重くさせないでGPUリソースだけ提供するっていう
考え方じゃ、悪くはないのかなー。
GPGPUの起こりって (スコア:1)
# まるでNetBSD移植のように「そこに計算機があるからだ」とでも言わんばかり。 研究レベルにおいては意義はあります。 今回のGPGPU研究がベースとなって別の研究へ ステップアップする可能性は何人も否定できません。
# 万里の道も一歩から。
MIYAZAKI Yasushi
たとえばデータパラレルプロセッサ (スコア:1)
並列計算を疎結合環境で構築するとなると、結構な金額が動いていました(IBM RS/6000 SPとか)。それと比較して、汎用的にGPUを使うことが可能ならば圧倒的な価格競争力を得ることになります。わざわざ高価なハードウェアを買わなくてもよいことになります。商業ベースに乗せることができる(または道筋がつけられる)ようにために、その方策を確立するというのは十分研究に値すると私は考えています。
SC06 Workshop [gpgpu.org]では、GPUを異種・同種のマルチコアプロセッサ、データパラレルプロセッサとして扱っていこう、という話が聞けるそうです。私見ですが、パラレルプロセッサとしても動作することを考えてGPUの最適化を設計段階で行うといった逆の展開もありうるのではないでしょうか(もちろん設計コストとのバランスにも依るのでしょうが)。
MIYAZAKI Yasushi
FM-8/7/11のサブシステムとか (スコア:1)
富士通の8ビットパソコン FM-8/7/11 では
メインの 6809 以外に主として描画を処理するために
メモリ、割り込み、もう一つの6809 など一式をもった
サブシステムが搭載されていました。
メインとサブとのやりとりには共有メモリを使っていました。
当時は「サブシステムでもうひとつ OS-9 が動くんじゃね?」
とか思ったものです。そういや PC-8801シリーズも
フロッピーディスクの制御用に Z80
もう一個積んでませんでしたっけ?
屍体メモ [windy.cx]
Re:80S31 (スコア:1)
実際に使うとなると母艦との連絡手段が
I/Oポート二個(三個?)によるハンドシェイクだけなので
あまり豪華なことはできない感じではありました
Re:80S31 (スコア:1)
その他のソフトでもデータ先読みとかに使っていたものがあります。
ポートも8255が直結されてるだけ(PC-8001のころの名残)なので、その気になれば転送速度は上げられるんじゃないかと。
Re:80S31 (スコア:1)
GPUがプログラマブルになったからだとは思いますけれど
CPUとの間に係る応答の速度幅に対価を払うハードに対して
アイドルタスク…
とここまで書いてはみました、どうなんですかね、
なまじ技術的な知識はない方が
いろいろと楽しめたり役に立てたりしたのではないかなあ
Re:80S31 (スコア:1)
→ 実際に(グリッド目的で)使うとなると母艦との(略)
としたのですが、その旨単語をきちんと配置すべきでした。
失礼しました。
PhysX対応は無いと思う (スコア:3, すばらしい洞察)
しかし,そう考えるとPS3ってのは,仮にゲーム機としてコケたとしても,たしかに単一プラットフォームな計算機としての普及数では相当なレベルになるなぁ,とか素で思った.
Re:PhysX対応は無いと思う (スコア:5, 参考になる)
Physics Processor Unit (PPU) and Molecular Dynamics [folding-community.org]
We've checked it out and it doesn't look like it will be useful for us (at least in the current incarnation). Also, even if they did support our types of calculations, what they mean by "physics" is fairly different than what we'd call. It's probably closer to "physics inspired." For games, it's perfect, for simulations, it might need to be more realistic (at least for our needs).
Re:PhysX対応は無いと思う (スコア:3, 興味深い)
とおっしゃっている記事 [impress.co.jp]です。。。
PhysXはアイデアはよかったのですが、実装面ではズタボロなのかもわかりませんね。
あぁPowerVRを思い出す。
Re:PhysX対応は無いと思う (スコア:2, 興味深い)
X1900のCrossFireって、PhyXのメモリ帯域に対してビット幅で2倍、クロックで2倍、2枚分で計8倍。
物理演算だと、メモリ帯域が性能に直接影響するので、そのまんまの結果ですね。
それだけのメモリを乗せて良いのなら、同じ性能を出すのは難しくないでしょう。
まぁ、10万以上になって売れなくなると思いますが。
実装/設計の差という意味では、GPUとCPUの差のほうがよほど大きいです。
Re:PhysX対応は無いと思う (スコア:1)
NVIDIA版も希望 (スコア:2, 興味深い)
そうすればPS3が凄い事になりそうだ。
Re:NVIDIA版も希望 (スコア:1, 興味深い)
参考にGPGPUの姫野ベンチ
http://gpgpu.jp/article/17502609.html
(ATI,nVIDIA)両方作ってたが、ATIの方が速かったので、こっちを集中して作ったって書いてたし。
http://folding.stanford.edu/FAQ-highperformance.html
Re:NVIDIA版も希望 (スコア:1, 興味深い)
Re:NVIDIA版も希望 (スコア:1, 興味深い)
大学や研究室がPS3を大量購入してクラスターを組むという選択肢もありだよね。
ところで、初期のPS3が1台売れるとSONYはいくらの赤字になるのだろう?
Re:NVIDIA版も希望 (スコア:1)
GPUとかCellでは64bit倍精度浮動小数点性能が高くないから研究用途には使えないってよく言うけど、
Folding@homeで利用できる事を考えると使える種類の研究もあるって事ですよね。
Re:NVIDIA版も希望 (スコア:1)
#ゲーム用に買った家庭用も参加できるようになってるといいねぇ。
なんだかなあ。 (スコア:2, おもしろおかしい)
他の用途でバリバリ使用中でもフルに計算できるよ
もううんざり
Re:なんだかなあ。 (スコア:2, おもしろおかしい)
>他の用途でバリバリ使用中でもフルに計算できるよ
>もううんざり
何か、チルドレンズ・マシン [engadget.com]って名前で
世界中に配るらしいですよ。
# コレはまさにホントの手回し計算機
Re:なんだかなあ。 (スコア:1, すばらしい洞察)
PCI-e、AGP限定かしら (スコア:1)
まあ、そんなことしてなんの役に立つのかはわかりませんが。
Re:PCI-e、AGP限定かしら (スコア:2, 参考になる)
ここで素人のおれが言いますよ。 (スコア:1, おもしろおかしい)
GPUはGPUでしょ!!なんであれが単体で使えるんだ!!と・・・
呼び起こせ!おれの魂!!呼び起こせ!セガサターン!!
もっと広まっている (スコア:1)
Medu Lah! en' gula vrechen d' MOL! ~箇更なる高みで廼の困惑を姜す
Re:もっと広まっている (スコア:2, 参考になる)
iアプリはダウンロードしたのと同じプロトコル(HTTP or HTTPS)/ホスト名/ポート番号と HTTP 通信ができるだけですので、ダウンロードサーバをプロキシサーバにしなければなりません。
SETI@home に参加する i モード端末をサポートするだけのプロキシサーバは立てたくありません...
EZアプリ(BREW) はソケット API があり通信は自由ですが、企画を KDDI が承認しないと一般ユーザにアプリを配布できないので難しいです。遊び心をどれだけ分かってもらえるか。ボーダフォン -> ソフトバンクも企画の承認が必要なので同じく難しいです。
ちなみに jig ブラウザのすごいところの一つは本当にプロキシサーバを立てていることです(端末のセキュリティチェックは Java アプリで回避できないのですから)。その条件でペイできるビジネスモデルを作ったこともすごいのです。
Re:もっと広まっている (スコア:1)
よく考えたら、プロキシサーバにするマシンで SETI@home を動かしてもいい線行くのかも。あんまり嬉しくないなあ。
Re:もっと広まっている (スコア:1)
まず先に (スコア:0)
歓迎だけど、先にAMD64対応やFreeBSD対応など
身近なところからやって欲しい物だ。
ここを見ると (スコア:3, 参考になる)
Linux_base じゃ、だめって事?
Re:ここを見ると (スコア:3, すばらしい洞察)
GPUは処理の内容によってはCPUの10倍近い速度で計算できるため、もはやCPUが参加してるかどうかなど些細な事になってしまう可能性もあります。
また、これの狙いは多くのパソコンではCPUが稼動している時間に対してGPUのプログラマブルシェーダが有効な処理をしている時間が非常に短いというのを利用することなのではないでしょうか。
Re:まず先に (スコア:1, 興味深い)
Re:光線追跡ソフトも GPU を使ってほしい (スコア:1)
Pentium4 2Gで4Mflops程度
PenD 3Gで11Mflops
PenXE965(3.73G)が20Mflops
Athlon FX-62(2.8G)が17Mflops
Core2XE(2.67)が18Mflops
クロックあたり2flopsのPentium4系の非効率が目立ちますね。
Re:光線追跡ソフトも GPU を使ってほしい (スコア:2)
SSE2 or SSE3使用時(Mycomより)
Pentium4 2Gで4Gflops程度
PenD 3Gで11Gflops
PenXE965(3.73G)が20Gflops
Athlon FX-62(2.8G)が17Gflops
Core2XE(2.67)が18Gflops
クロックあたり2flopsのPentium4系の非効率が目立ちますね。
Mflops→Gflops
全て桁が違っていました。
Re:光線追跡ソフトも GPU を使ってほしい (スコア:1, 参考になる)
10000 個並べ、コンパイル、実行すると焼く 7 秒で終了。142Mflops 位?
足し算を 20000 個並べようとしたらコンパイルエラーになりました。
Opteron 2.2GHz + digitalmars c 8.49 です。レジスタ間演算を徹底
すればもっと早くなるのでしょうけど。
Re:光線追跡ソフトも GPU を使ってほしい (スコア:1)
相当に落ちることをAtiも認めています。
ここに出ている100Gflopsというのは端正どのものですね。
ちなみにCellの場合は3.2GHzで倍精度なら約20Gflops
単精度なら約220Gflops
Folding@Home で要求されるのは倍精度だろうなぁ (スコア:1)
いや、中身を見ずにそう想像しているだけなんですが、
普通科学技術系の計算って倍精度か拡張倍精度で、
場合によっては多倍長演算ライブラリとか使いますよね。
なので実際には 100Gflops も出ないんじゃないかなぁ。
GPUでプログラミングしたことがないんでハズしてるかもしれませんが、
GPUって、XMMレジスタみたいなのがたくさん載ってて、
メモリ帯域が広くってブロック演算も得意、みたいな感じですか?
いや、ベクトル・行列演算のためのユニットが並んでるのかな?
屍体メモ [windy.cx]
Re:Folding@Home で要求されるのは倍精度だろうなぁ (スコア:1)
GPUを使うのだから,それはないと思う.
SETI@Homeは単精度らしい (スコア:2, 参考になる)
少なくとも SETI@Home は単精度みたいですね。 これまた科学的な計算は倍精度以上が普通!っていう俺の勝手な先入観でした。んでも自分の仕事でやってるシミュレーションだと単精度じゃダイナミックレンジが足りない・・・
屍体メモ [windy.cx]
Re:SETI@Homeは単精度らしい (スコア:1, おもしろおかしい)
イトカワ星人「ふぅ、危ない、倍精度で計算されてたら
あの子へのラブレター読まれちゃうとこだったよ」
Re:参戦? (スコア:1)