パソコンをスパコンに変えるプロセッサー 71
ストーリー by yourCat
評価は出荷待ち 部門より
評価は出荷待ち 部門より
ClearSpeed Technology社は省電力型並列アレイ・プロセッサー『CS301』を発表した (プレス・リリース、HotWiredの記事、本家/.の記事)。CS301は0.13μm CMOS、PBGAパッケージ、FPU×2を積んだ演算ユニットを64基持ち、200MHzで動作する。わずか3Wの最大消費電力で25.6Gflops (64×2×0.2G) の演算能力を持つ。2003年第4四半期のサンプル出荷を目指す。
Anonymous Coward曰く、"1枚のPCIカードに4個ずつ、6枚のPCIカードを装着すれば、単純計算で600Gflopsの速度を2万5,000ドル程度で普通のデスクトップマシンにもたらすことができる。しかも省電力なのでPCカードに組み込むことが可能になるかもしれないとのこと。真偽のほどは定かではないようだが、真実なら興味深い。
このチップやSONYのCELLチップなど次世代を狙ったものが最近話題になる。次世代OSを処理速度で導くようなチップの登場に期待したいものである。"
なお、このネタはたくさんのタレコミをいただいた。
げてもの (スコア:5, 興味深い)
FFT演算というのは、メモリアクセスのストライドがそこそこ大きいので、リニアにアクセスできるアドレス空間が広くなければいけません。各PEには4KBのデータキャッシュがありますが、このアドレス空間でFFTを実行するには1024点が限界です。それも1つのデータを2バイトとしてです。そうすると(complex FFTなので、虚数と実数のデータが必要ということに注意)、1024*2*2=4096byte。データキャッシュいっぱいです。それ以上の点数を処理しようとすると、演算に必要なデータがキャッシュに存在せず、外部メモリからロードしなければいけませんので、処理スピードがガクンと落ちます。
これはFFTに限った話ではなく、一般化することができます。4KBで完結するような処理ならば相当高速に処理できる可能性は高いですが、それを超えるとダメ、といえます。
また、隣のPEのレジスタに直接書き込むことができる構成なので、パイプライン処理には向くでしょう。しかし、データ依存の少ないマルチスレッド処理には向かないでしょう。高速にアクセスできるメモリ容量が少ない(SRAMの128KB)からです。仮に16並列のスレッドが動いているとしましょう。そうすると、1つのスレッドはたった8KBしかメモリを使用できません。まるで8ビットCPU時代の会話に出てきそうな容量です。逆にデータ依存の高いマルチスレッドでも、128KBのSRAMにアクセスしなければいけないならば本来の速度は出ないですね。結局データキャッシュの4KBに制限されます。
その他、チップ外とのデータ転送容量も問題になるのですが、もう書かなくてもいいですね。余談ですが、Cellもそのような観点で見てます。Cellはまだましかな、という感じです。
別にこんなチップが出てきてもいいんですがね、「スパコン並みの性能を持つ」という嘘っぱちはいけません。私見ですが、きっとこの会社は、nVIDIAやATIその他の大きな会社に買収されることを目標としているのでしょう。
Re:げてもの (スコア:1, 興味深い)
そうなのですが
逆に考えれば、1024点FFTを目的した設計であるため
キャッシュを4KBにしたとも言えます。
ということで、1024点FFT用途であれば
スパコン並の性能を叩き出すという売り文句になりますが、
それはそれで、それを望む人にとってはありがたいことでしょう。
もう少しほしいところですけどね。
Re:げてもの (スコア:1, 興味深い)
#「1番!G7!スパコンやりまーす!」…なんか飲み会みたいなのでG7
映像関係なら・・・CPU技術には詳しくありませんが (スコア:2, 参考になる)
3Dのレンダリングはとてつもなく時間がかかるみたいで、
こういう映像関連のアプリケーションでこれが使えるようになれば
多分1枚50万円だとしてもその友人は買うと思う。
ただPCIのカードとしてこれがでるとなると、もちろん特定のアプリケーションでしか意味が無いんでしょうなぁ、きっと。
OSで対応したら面白いですね。
でもバイナリがX86と違うから結局普通のアプリを動かすためには使えないのかな。
一切これすなわち空(くう)かもしんなくてイエスキリストもきっと正しい。
Re:映像関係なら・・・CPU技術には詳しくありませんが (スコア:2, 参考になる)
で、個人的に気になるのは
ほえほえ
Re:映像関係なら・・・CPU技術には詳しくありませんが (スコア:1)
なるほど、結局のところはCPUというより単なるDSPなんですね。
DSPといえば昔シンクパッドつかってたときMwaveっていうDSPが搭載されていましたな。関係ないですが。
ともかく映像関係のアプリで使えるようになるといいですね。
純粋な科学技術の計算、シミュレーションなどの用途を想定していそうですけれど。
一切これすなわち空(くう)かもしんなくてイエスキリストもきっと正しい。
Re:映像関係なら・・・CPU技術には詳しくありませんが (スコア:1)
どうなんでしょうね?
演算しても最終的には画面表示しないと意味無いのでPCIカードだと転送速度がボトルネックに
なってしまうような気がします。 PCI-Xなら大丈夫かも知れないけど。
一方、GPUとして使うなら、うまくすると十分実用に耐えるリアルタイムRenderManとか、
HAVOKのような物理シミュレーションエンジンのアクセラレーションとがが手軽に出来るかも。
そうなったらとっても欲しいゾ!!
Re:映像関係なら・・・CPU技術には詳しくありませんが (スコア:1)
仕事になるようなCGは、画面表示してもあまり意味がありません。
#画面サイズのCGでは、L版に印刷しても悲しいこと請け合いです。
1枚(動画なら1コマ)数時間~とかいう計算を任せられるなら十分価値はあるでしょう。
物理シミュレーションをリアルタイムで行う時のネックは、
画面表示ではなくてシミュレーション部分ですし、
GPUにのせても結局は「グラボとDSPボードを一枚にまとめてみました」
な使い方になるんじゃないかと。
#いやGPUにプログラムとデータ送っておいて、
#シミュレーションから画面表示まで全部やってくれてもいいけど、
#それってグラボの形したPCだし。
低速回線でも可能なデジタルテレビとか? (スコア:0)
受像機側にあらかじめ送っておいて、
あとは基本的な骨組みの動きのデータを送れば映像は受像機側で合成
てな具合のこと出来ないかな?
Re:低速回線でも可能なデジタルテレビとか? (スコア:1, 参考になる)
メモリーが必要になると本体との通信する仕様やらを
しっかり決める必要もあるだろうし
大量のデータを処理するような場合オーバーヘッドに
ならないようにしなければならない。
#むじゅかチーのでチュ
Re:低速回線でも可能なデジタルテレビとか? (スコア:1)
ひょっとしてTVML [nhk.or.jp]のこと?
まぁ もうちょっと進んだものをイメージされてるとは思いますが
Re:低速回線でも可能なデジタルテレビとか? (スコア:0)
Re:低速回線でも可能なデジタルテレビとか? (スコア:1)
映画「ファイナルファンタジー」のことだったりするのかな?と思わないでもなかったりして。
Re:低速回線でも可能なデジタルテレビとか? (スコア:1)
Re:映像関係なら・・・CPU技術には詳しくありませんが (スコア:0)
昔の専用カードの場合全機能、または一部機能を
専用カードで計算させる仕組みでしたが
現在の3Dソフトはソフトの他にプラグインを使用するものが
多く対応させ
Re:映像関係なら・・・CPU技術には詳しくありませんが (スコア:1)
そうかな? OpenGLのライブラリで吸収させればいいだけなんじゃない? 今だって MesaとかOpenGLが各種カードに対応って形になってるよね?
だから同じプログラムで RealityEngine積んでいようが なんだろうが動作するわけで, 動作速度が変わるけど…って例えが古いなぁ
プラグインはほとんど関係ないと思いますが Blenderとかだって Pythonで書いたScriptをプラグイン的に使うことは出来ますよ
とはいっても (スコア:2, すばらしい洞察)
SIMD (スコア:1)
これを活かすアプリケーションとなるとどういうものが考えられますかね?連続メディア関連とかの処理は今のPCで行われていますけど、今スパコンでやっているようなことをPCでできるようになる? すっごいシミュレーションとかをPCでやれるようになるのかな? ガンガンこれを使うアプリケーションを考えたいですね・・。
Re:SIMD (スコア:0)
使うアプリケーションってあまり想像できないのですが、
物が出て来れば、使う人も出るんでしょうね。。
Re:SIMD (スコア:1)
計算精度は? (スコア:1)
PS2 (スコア:1)
Re:PS2 (スコア:0)
PS2の場合、メディアの読み込み速度の方を速くして欲しい
PS2の場合はむしろ (スコア:2, おもしろおかしい)
#オフトピなのでAC
Efficeonより… (スコア:1)
Re:Efficeonより… (スコア:1)
#このコメントは余計なもの
一切これすなわち空(くう)かもしんなくてイエスキリストもきっと正しい。
Re:Efficeonより… (スコア:0)
他にも、W3CがWebフォームの新仕様『XForms 1.0』を勧告とかね。
MS、「Media Center Edition2004」を発表とか、
CommanderGauntlet [mycom.co.jp]とか、
Nokia 7600 [mycom.co.jp]とか、
「VIA Eden-N」 [mycom.co.jp]とかタレコミはあるだろうねと思う。
(採用されるかはわからん)
FM音源のシミュレートとか (スコア:1)
Re:FM音源のシミュレートとか (スコア:1)
サイン波「の表(テーブル)」を順繰りにアクセス、ただしタイミングを微妙に(サイン波で再帰的に)揺さぶる、
という(結構素朴な)処理を行なえば、それでFM音源になるわけですから、処理的には微々たるもの。
OS本体とは別にリアルタイム処理に専念できるという意味では、コ(子)プロセッサが欲しいと思うことは有りますが、
膨大なパワーが欲しいってわけじゃないですよね。
初期(1980年代中程くらいでしたっけ)のFM音源システムに、そんな大きな演算能力の石が使われたはずがない事を考えると、ねえ…
まあ、数千オペレータを同時に動かすとかしようと思えば、パワーも要るかも知れませんね。
ただ、それでも「テーブルへのポインタ」が数千個あれば済むだけですんで…
#しかもテーブル自体を変更する必要は無いから、テーブルはimmutableなROMと見なして1セットあれば十分。
それに、わずか数個のオペレータでもプログラミングが困難なFM音源ですから、
パワー不足に悩むほどのオペレータ数を使うこと自体が困難かも…
Re:FM音源のシミュレートとか (スコア:1)
最速 (スコア:1, おもしろおかしい)
次世代と省エネ (スコア:1)
次世代OSは、もーちょっとリソースを「食わない」ものであることを期待させて頂けないもんでしょうか?(^^;
代を重ねるごとに順調にリソース消費量を伸ばすOSなんて、某社のだけで十分っす。
#ウチでドコモバが眠ってるのでG7。CEをハイジャックして「次世代OS」を動かしてみたいものだ。
#もちろん十分に省リソースなOSであることを期待した上での話。
----
うーん。OSと処理速度という2題噺(?)から、どんなOS像が浮かび上がってくるんでしょうか?
俺としてはあんまりピンとこないんですが、スラドのアレゲな皆様の脳裏にはそれが既に浮かんでいるのでしょうか?
うーん。少なくとも今の2次元画面とキーボードとマウスでやれる(?)範囲の事は、
今よりも左程パワーが要るとは思えないなあ。
やっぱり3次元画面や3次元マウス(?)な世界の話なんでしょうか。
サーバとして使う場合も、ネットワーク帯域が今程度なら、
これ以上処理だけ速くなってもしょーがないという面が時折有りそう。
CPUだけじゃなく周辺の色々なものも、桁違いにリソース食いであり、
かつその健啖ぶりの見返りとして、かなり望ましい何らかの利益をもたらしてくれる、
というモノが揃って初めて、「処理速度を要するOS」像が浮かび上がってくるような気がしてならない。
いや~驚き (スコア:0)
HotWiredの記事によれば、
"パワーアップされたパソコンが2万5000ドル程度で手に入る"
らしいが、コンシューマ向けじゃないとしても、驚きだね。
しかもさらに驚きなのが、"PCIカード"として販売されるらしいというあたり。
(単純に6枚のこのカードをつけたパソコンがパワーアップされたパソコンとすると、
このカード1枚約4.000ドル以下?か。そういう計算でいいのか?)
# いや~、てかまじ本当なのかと。。。
i860 (スコア:0)
トランスピュータといふ (スコア:0)
この手の計算させるボードがありましたね。
これ1個あたり25Gflopsでか、速くなるものですね。
しかし演算結果を取り込むって何に使えば検討もつきません
差し詰めCGの計算やDVDのオーサリングですかね。
実際プログラムを書いてこれ専用にも
プログラム書かないとだめなのですが
どうするのでしょう。
#Quadra840AVのDSP用のプログラムを思い出したのでAC
Re:トランスピュータといふ (スコア:0)
Re:トランスピュータといふ (スコア:1)
単純なパフォーマンスを求めるだけなら汎用の CPU を使った方が良いでしょうが,消費電力あたりのパフォーマンスを考えると専用チップにも出番があるようです.
対応ソフトを作るには? (スコア:0)
Re:対応ソフトを作るには? (スコア:1, 参考になる)
ClearSpeed Technologyの出している
データシートを参考にプログラミングするのでしょう。
発熱は大丈夫? (スコア:0)
うちのマックにも搭載したいんだけど、熱暴走されたら困るんだよね
Re:発熱は大丈夫? (スコア:1, 参考になる)
入れてもMacが速くなったりしませんので安心して下さい。
これは、 PC Compatibility Card [apple.co.jp]って覚えているかな?
PCIバス上に別なプロセッサを入れてドライブとキーボードだけを共有したボード
あれと非常に似ている、つまりPCIバスを利用して別なコンピュータに計算をさせているだけに
過ぎずコンピュータの一部にはなっていない。
少し身近な例で QuickDraw3D Accelerator card [mbn.or.jp]と同じ
別なプロセッサに計算させるデータを受け渡して計算結果を得る仕組み
これを固定化させるかプログラムで変更させるかは設計次第。
効率良く動かすならボード上に独立したRAMを置くべきだし、
演算結果を利用したいならビデオチップ側に搭載した設計にすべきものだと思います。
Re:発熱は大丈夫? (スコア:0)
これの意味がわからないのですが。
言い替えるなら
「演算結果を利用したいならビデオチップ側に搭載できるよ
Re:発熱は大丈夫? (スコア:1, 参考になる)
昔ラディウスが出していたボードで
DSPを4つ(だったかな?)搭載したビデオカードがありました
フィルター処理などをボード側で行うことができます。
2つ目は3Dカードの座標を計算させるのに一役かってもらおうってことでしょう
>「600Gflopsの速度のコンピューターの演算結果を利用する」
違います。25G程度でしょう。1枚に4個X6枚での値ですから
この数は単にこれくらいあればスパコンに近くなりますよっていうたとえで
あって6枚さすことではないと思います。
結局専用に設計すればいいのでしょうが
プログラムの更新やらの手間を考えるならPCのボードにしてしまえって
発想なのではないかと、思うのですがPCIの拡張ボックスってありました
あれと同じくPCIを1つだけ使ってケーブル引き出して演算させるユニット
という形で製品化して大学や時間がかかるようなことをする所にコンパイラ
つきで売れば需要があると思いますけど。
倍の数のDSPで作れば本当にスパコンに張り合えますしPCの限られた
スペースに入れる必要もなくなりますのでこちらの方が実用的でしょう。
CPU、PCIカード、どっちが先に熱暴走? (スコア:1)
Photoshopアクセラレータだけだったような。
PCIバスの規格だと (スコア:0)
でも発売されればきっと買ってしまう^^;
Re:PCIバスの規格だと (スコア:0)
いや、先にPCI-Xを… (スコア:1)
PCI-Xなら、手元のサーバーマシンのが使えるので…(^^;
Re:PCIバスの規格だと (スコア:1)
Re:PCIバスの規格だと (スコア:0)
Re:パチンコをスロットに (スコア:1)
一つ前のストーリーで体感機がどうのこうのというコメントがついていたので, その影響ではないかと.
# 全く同じ間違いをしでかしたのでID