retardeeの日記: GPUってわからない 4
日記 by
retardee
いつかと同じように、また突如として計算結果がおかしくなった。
言いたくないけど、それこそ「何もしてないのに壊れた」って感じ。
動いていたリビジョンに戻しても、リビルドしても、それこそPCを再起動しても治らない。
そこで前回と同様にPCの電源を落として一晩置いたら治った・・・
いったいこの現象は何なんだろうか。
こんな信頼性では他人に使わせることなどできない。
中性子線でも当たったのだろうか?
それともプログラムに状態依存(?)バグがあるんだろうか・・
何使ってます? (スコア:2)
長崎大の方の話では,GeForceでGPGPUやると結構不良率が高かった,なんてのもありますが.
http://www.ssken.gr.jp/MAINSITE/activity/sectionmeeting/sci/2009-2/lec... [ssken.gr.jp]
(13ページ目.421個使って72個に問題有り)
うちの計算系の人がnVidiaの人?だか代理店の人?だかに聞いたときは,GPGPU用として売られているTeslaの場合は動作を保証しますが,GeForce系をGPGPUに使った場合の計算結果は保証しません,とかいうような話だったそうですし.負荷かけて温度が上がったりした際に計算ミスが出たりする,という話だったような.nVidia自体も,「お試しでGeForce使うのは良いけど,クリティカルな用途や長時間の計算には使わないで」とか行ってた覚えが.
#そのせいなのか,Teslaは同アーキテクチャのGeForceに比べだいぶクロックが落とされてますね.ECCの有無の違いもありますが.
貴重な情報ありがとうございます。 (スコア:1)
ぐぐっても計算結果がおかしくなるなんてのは見つからなかったもので・・
GeForce GTX 460 です。
そうなんですか・・・
nVidiaのサイトではしっかりCUDA-Enabled Productsの中に含まれていて [nvidia.com]そんなこと全然触れられていませんね。
Teslaって高いのかな・・
Re:貴重な情報ありがとうございます。 (スコア:1)
一応位置づけとしては,GeForceはCUDA使えるけど,
・CUDAの入門用(とか簡単な動作テスト用)
・演算結果がクリティカルじゃないもの(例えば映像処理とか)
・計算時間が短いもの(熱がこもらないように)
に使ってね,という感じみたいです.
どうしても長時間使う場合は、コアとかメモリクロックを落として使うとましになる……かも?
>Teslaって高いのかな・・
2-30万ぐらいした気がしますので,個人だと手が出しにくい価格ですよね.
エミュレーションモード (スコア:1)
エミュレーションモードでプログラムが間違っていないことを確認したいところなんですが、CUDA 4.0ではエミュレーションモードがなくなっちゃったんですよね。
代わりにgpuocelot [google.com]というのが使えるらしいんだけど、インストールしようとしたらpythonのビルドスクリプトがいきなりsyntax errorで、まあぼちぼちやっていきます。