パスワードを忘れた? アカウント作成
6703 story

パソコンをスパコンに変えるプロセッサー 71

ストーリー by yourCat
評価は出荷待ち 部門より

ClearSpeed Technology社は省電力型並列アレイ・プロセッサー『CS301』を発表した (プレス・リリースHotWiredの記事本家/.の記事)。CS301は0.13μm CMOS、PBGAパッケージ、FPU×2を積んだ演算ユニットを64基持ち、200MHzで動作する。わずか3Wの最大消費電力で25.6Gflops (64×2×0.2G) の演算能力を持つ。2003年第4四半期のサンプル出荷を目指す。

Anonymous Coward曰く、"1枚のPCIカードに4個ずつ、6枚のPCIカードを装着すれば、単純計算で600Gflopsの速度を2万5,000ドル程度で普通のデスクトップマシンにもたらすことができる。しかも省電力なのでPCカードに組み込むことが可能になるかもしれないとのこと。真偽のほどは定かではないようだが、真実なら興味深い。
このチップやSONYのCELLチップなど次世代を狙ったものが最近話題になる。次世代OSを処理速度で導くようなチップの登場に期待したいものである。"

なお、このネタはたくさんのタレコミをいただいた。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • げてもの (スコア:5, 興味深い)

    by Qs (1185) on 2003年10月16日 10時13分 (#415726) 日記
    micro processor forumにはこのてのげてものチップが必ず出ますね。このチップ、カタログに1024点FFTが10,000回/秒できるとあります。すごいですね。でも、そこまでです。それ以上のポイントになるとガクンとスループットは落ちるはずです。

    FFT演算というのは、メモリアクセスのストライドがそこそこ大きいので、リニアにアクセスできるアドレス空間が広くなければいけません。各PEには4KBのデータキャッシュがありますが、このアドレス空間でFFTを実行するには1024点が限界です。それも1つのデータを2バイトとしてです。そうすると(complex FFTなので、虚数と実数のデータが必要ということに注意)、1024*2*2=4096byte。データキャッシュいっぱいです。それ以上の点数を処理しようとすると、演算に必要なデータがキャッシュに存在せず、外部メモリからロードしなければいけませんので、処理スピードがガクンと落ちます。

    これはFFTに限った話ではなく、一般化することができます。4KBで完結するような処理ならば相当高速に処理できる可能性は高いですが、それを超えるとダメ、といえます。

    また、隣のPEのレジスタに直接書き込むことができる構成なので、パイプライン処理には向くでしょう。しかし、データ依存の少ないマルチスレッド処理には向かないでしょう。高速にアクセスできるメモリ容量が少ない(SRAMの128KB)からです。仮に16並列のスレッドが動いているとしましょう。そうすると、1つのスレッドはたった8KBしかメモリを使用できません。まるで8ビットCPU時代の会話に出てきそうな容量です。逆にデータ依存の高いマルチスレッドでも、128KBのSRAMにアクセスしなければいけないならば本来の速度は出ないですね。結局データキャッシュの4KBに制限されます。

    その他、チップ外とのデータ転送容量も問題になるのですが、もう書かなくてもいいですね。余談ですが、Cellもそのような観点で見てます。Cellはまだましかな、という感じです。

    別にこんなチップが出てきてもいいんですがね、「スパコン並みの性能を持つ」という嘘っぱちはいけません。私見ですが、きっとこの会社は、nVIDIAやATIその他の大きな会社に買収されることを目標としているのでしょう。

    • Re:げてもの (スコア:1, 興味深い)

      by Anonymous Coward on 2003年10月16日 21時22分 (#416161)
      キャッシュが4KBであるため1024点FFTしか扱えないといってしまえば
      そうなのですが
      逆に考えれば、1024点FFTを目的した設計であるため
      キャッシュを4KBにしたとも言えます。
      ということで、1024点FFT用途であれば
      スパコン並の性能を叩き出すという売り文句になりますが、
      それはそれで、それを望む人にとってはありがたいことでしょう。
      もう少しほしいところですけどね。
      親コメント
  • 友人で映像関係の仕事をしている人がいるんですが、
    3Dのレンダリングはとてつもなく時間がかかるみたいで、
    こういう映像関連のアプリケーションでこれが使えるようになれば
    多分1枚50万円だとしてもその友人は買うと思う。

    ただPCIのカードとしてこれがでるとなると、もちろん特定のアプリケーションでしか意味が無いんでしょうなぁ、きっと。
    OSで対応したら面白いですね。
    でもバイナリがX86と違うから結局普通のアプリを動かすためには使えないのかな。
    --
    一切これすなわち空(くう)かもしんなくてイエスキリストもきっと正しい。
    • 特定のアプリケーションでしか意味が無いんでしょうなぁ
      そりゃそうでしょうね。OverViewを見る限りにおいてはただのDSPみたいですし。

      OSで対応したら面白いですね
      このプロセッサはCPUとして捉えるのではなく、デバイスとして捉えるのが自然と思われるので、OSでの対応といったらドライバを作るくらいでしょう。この辺はこのチップを使うボードを出すメーカーの対応次第と思われます。

      結局普通のアプリを動かすためには使えないのかな
      おおよそCPUとしての機能は備わっていない(MMUがないetc.)、というか使い道としては想定されていなさげなので、あくまでも計算をするためだけのDSPである、と。

      で、個人的に気になるのは

      1. なぜ今さら外部I/Oがオリジナルバスなのか
      2. JTAG端子が見えるけど、これってやっぱりコードやデータを送り込む時に使うんだろか
      の2点かな。実際にPCに載せようと思ったらバスブリッジ&JTAG制御回路が必要だろうし。今出すなら、HyperTransportとかPCIExpressとかのバス上にそのまま載せられる方が使い道がよかったのではないかと…。

      --
      ほえほえ
      親コメント
      • これが出るころにはPCI-Express対応になってたりしませんかね?

        なるほど、結局のところはCPUというより単なるDSPなんですね。
        DSPといえば昔シンクパッドつかってたときMwaveっていうDSPが搭載されていましたな。関係ないですが。

        ともかく映像関係のアプリで使えるようになるといいですね。
        純粋な科学技術の計算、シミュレーションなどの用途を想定していそうですけれど。
        --
        一切これすなわち空(くう)かもしんなくてイエスキリストもきっと正しい。
        親コメント
    • 映像関係だと演算速度も重要だけど、スループットもかなり効いてくると思うので実際のところ
      どうなんでしょうね?

      演算しても最終的には画面表示しないと意味無いのでPCIカードだと転送速度がボトルネックに
      なってしまうような気がします。 PCI-Xなら大丈夫かも知れないけど。

      一方、GPUとして使うなら、うまくすると十分実用に耐えるリアルタイムRenderManとか、
      HAVOKのような物理シミュレーションエンジンのアクセラレーションとがが手軽に出来るかも。
      そうなったらとっても欲しいゾ!!
      親コメント
      • >演算しても最終的には画面表示しないと意味無い

        仕事になるようなCGは、画面表示してもあまり意味がありません。
        #画面サイズのCGでは、L版に印刷しても悲しいこと請け合いです。
        1枚(動画なら1コマ)数時間~とかいう計算を任せられるなら十分価値はあるでしょう。

        物理シミュレーションをリアルタイムで行う時のネックは、
        画面表示ではなくてシミュレーション部分ですし、
        GPUにのせても結局は「グラボとDSPボードを一枚にまとめてみました」
        な使い方になるんじゃないかと。

        #いやGPUにプログラムとデータ送っておいて、
        #シミュレーションから画面表示まで全部やってくれてもいいけど、
        #それってグラボの形したPCだし。
        親コメント
    • 人物・背景等の詳細データとレンダリングプログラムとか何トカを
      受像機側にあらかじめ送っておいて、

      あとは基本的な骨組みの動きのデータを送れば映像は受像機側で合成
      てな具合のこと出来ないかな?
    • 現状を考えますと無理臭い気がします。
      昔の専用カードの場合全機能、または一部機能を
      専用カードで計算させる仕組みでしたが
      現在の3Dソフトはソフトの他にプラグインを使用するものが
      多く対応させ
      • 現状を考えますと無理臭い気がします。

        そうかな? OpenGLのライブラリで吸収させればいいだけなんじゃない? 今だって MesaとかOpenGLが各種カードに対応って形になってるよね?
        だから同じプログラムで RealityEngine積んでいようが なんだろうが動作するわけで, 動作速度が変わるけど…って例えが古いなぁ

        プラグインはほとんど関係ないと思いますが Blenderとかだって Pythonで書いたScriptをプラグイン的に使うことは出来ますよ

        親コメント
  • とはいっても (スコア:2, すばらしい洞察)

    by take0m (4948) on 2003年10月16日 10時35分 (#415737) 日記
    数年後には、この性能がCPUモジュールの中に内包されることになると思います。かなり昔になりますがFPGAで専用計算機作ったことあるのですけど、数年後にアルファに処理速度抜かれて悲しかったです。
  • by slash5234 (16218) on 2003年10月16日 4時58分 (#415627)
    詳しくないけど、AltiVecの元のものということは、つまりSIMDなわけですよね? Altivec が 例えば32bit x 4並列だったものが、64並列とか128並列とか。

    これを活かすアプリケーションとなるとどういうものが考えられますかね?連続メディア関連とかの処理は今のPCで行われていますけど、今スパコンでやっているようなことをPCでできるようになる? すっごいシミュレーションとかをPCでやれるようになるのかな? ガンガンこれを使うアプリケーションを考えたいですね・・。
    • by Anonymous Coward
      たった384Kバイトのメモリでガンガン演算性能を
      使うアプリケーションってあまり想像できないのですが、
      物が出て来れば、使う人も出るんでしょうね。。
  • by chiba-f (6867) on 2003年10月16日 5時24分 (#415632)
    クリアスピード・テクノロジー社のサイトを見たのですが,計算精度について書かれてないです.(見落とした?)PDFに書かれていた用途は,"Signal & Image Processing","Computational Chemistry","Network Processing"とあるので,倍精度無し?
  • by slash5234 (16218) on 2003年10月16日 5時43分 (#415639)
    PS2に差すと速くなるとか。
    • by Anonymous Coward
      速さ=演算速度とも限らないと思うがの
      PS2の場合、メディアの読み込み速度の方を速くして欲しい
      • PS2の場合はむしろ (スコア:2, おもしろおかしい)

        by Anonymous Coward on 2003年10月16日 9時36分 (#415701)
        BB Unit搭載機の、BB Navigator起動の不条理なまでの遅さをなんとかしてください(泣)

        #オフトピなのでAC

        親コメント
  • by patagon (1453) on 2003年10月16日 6時49分 (#415652) 日記
    slashdot.jp的にはTransmetaのEfficeonよりこっちかよ…(笑)
    • Effeceonのネタは私もたれ込んでおきましたのでもしかしたら採用されるかもしれません。

      #このコメントは余計なもの
      --
      一切これすなわち空(くう)かもしんなくてイエスキリストもきっと正しい。
      親コメント
    • by Anonymous Coward
      完全オフトピックだけど、Efficeonはすぐでてくるんじゃないかな?

      他にも、W3CがWebフォームの新仕様『XForms 1.0』を勧告とかね。
      MS、「Media Center Edition2004」を発表とか、
      CommanderGauntlet [mycom.co.jp]とか、
      Nokia 7600 [mycom.co.jp]とか、
      「VIA Eden-N」 [mycom.co.jp]とかタレコミはあるだろうねと思う。
      (採用されるかはわからん)
  • 音声合成に利用するVSTプラグインがあったら面白そうですね。
    • FM音源とかに、そんな凄いCPUパワーが、要るもんなんでしょうか?

      サイン波「の表(テーブル)」を順繰りにアクセス、ただしタイミングを微妙に(サイン波で再帰的に)揺さぶる、
      という(結構素朴な)処理を行なえば、それでFM音源になるわけですから、処理的には微々たるもの。

      OS本体とは別にリアルタイム処理に専念できるという意味では、コ(子)プロセッサが欲しいと思うことは有りますが、
      膨大なパワーが欲しいってわけじゃないですよね。
      初期(1980年代中程くらいでしたっけ)のFM音源システムに、そんな大きな演算能力の石が使われたはずがない事を考えると、ねえ…

      まあ、数千オペレータを同時に動かすとかしようと思えば、パワーも要るかも知れませんね。
      ただ、それでも「テーブルへのポインタ」が数千個あれば済むだけですんで…
      #しかもテーブル自体を変更する必要は無いから、テーブルはimmutableなROMと見なして1セットあれば十分。

      それに、わずか数個のオペレータでもプログラミングが困難なFM音源ですから、
      パワー不足に悩むほどのオペレータ数を使うこと自体が困難かも…
      親コメント
  • 最速 (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2003年10月16日 9時57分 (#415717)
    起動してからたった3秒でブルースクリーンに到達できます。:P
  • by G7 (3009) on 2003年10月17日 5時04分 (#416334)
    >次世代OSを処理速度で導くようなチップの登場に期待したいものである

    次世代OSは、もーちょっとリソースを「食わない」ものであることを期待させて頂けないもんでしょうか?(^^;
    代を重ねるごとに順調にリソース消費量を伸ばすOSなんて、某社のだけで十分っす。

    #ウチでドコモバが眠ってるのでG7。CEをハイジャックして「次世代OS」を動かしてみたいものだ。
    #もちろん十分に省リソースなOSであることを期待した上での話。

    ----

    うーん。OSと処理速度という2題噺(?)から、どんなOS像が浮かび上がってくるんでしょうか?
    俺としてはあんまりピンとこないんですが、スラドのアレゲな皆様の脳裏にはそれが既に浮かんでいるのでしょうか?

    うーん。少なくとも今の2次元画面とキーボードとマウスでやれる(?)範囲の事は、
    今よりも左程パワーが要るとは思えないなあ。
    やっぱり3次元画面や3次元マウス(?)な世界の話なんでしょうか。

    サーバとして使う場合も、ネットワーク帯域が今程度なら、
    これ以上処理だけ速くなってもしょーがないという面が時折有りそう。

    CPUだけじゃなく周辺の色々なものも、桁違いにリソース食いであり、
    かつその健啖ぶりの見返りとして、かなり望ましい何らかの利益をもたらしてくれる、
    というモノが揃って初めて、「処理速度を要するOS」像が浮かび上がってくるような気がしてならない。
  • by Anonymous Coward on 2003年10月16日 4時42分 (#415624)
    本当だとしたら、まじすげーよ。

    HotWiredの記事によれば、

    "パワーアップされたパソコンが2万5000ドル程度で手に入る"

    らしいが、コンシューマ向けじゃないとしても、驚きだね。

    しかもさらに驚きなのが、"PCIカード"として販売されるらしいというあたり。

    (単純に6枚のこのカードをつけたパソコンがパワーアップされたパソコンとすると、
    このカード1枚約4.000ドル以下?か。そういう計算でいいのか?)

    # いや~、てかまじ本当なのかと。。。
  • by Anonymous Coward on 2003年10月16日 5時26分 (#415633)
    が出たときもそう云っていたような気がする…。
  • by Anonymous Coward on 2003年10月16日 5時27分 (#415634)
    昔CGの計算を高速化するために拡張ボードで
    この手の計算させるボードがありましたね。

    これ1個あたり25Gflopsでか、速くなるものですね。
    しかし演算結果を取り込むって何に使えば検討もつきません
    差し詰めCGの計算やDVDのオーサリングですかね。

    実際プログラムを書いてこれ専用にも
    プログラム書かないとだめなのですが
    どうするのでしょう。

    #Quadra840AVのDSP用のプログラムを思い出したのでAC
    • 一般論としては、この手の専用チップって汎用のCPUのコスト/パフォーマンスに負けて消え去る運命かと。専用ソフト書く手間と、開発環境そろえる面倒くささ、大量生産される汎用CPUの価格低下に対抗するとなると、結構大変です。そいや、初代NeXTってモトローラのDSP乗っけてましたっけ。
      • 記事やタレコミ文にもありますが,「こんなに少ない消費電力でこんなに性能が出る」というのも売りの一つでしょう.

        単純なパフォーマンスを求めるだけなら汎用の CPU を使った方が良いでしょうが,消費電力あたりのパフォーマンスを考えると専用チップにも出番があるようです.
        親コメント
  • by Anonymous Coward on 2003年10月16日 5時56分 (#415641)
    クラスタリングに適したソフトとやらは、どんな感じでつくられてるのでしょう。
  • by Anonymous Coward on 2003年10月16日 6時00分 (#415643)
    集積化は容易とはいえ、発熱量はどうなのだろう?
    うちのマックにも搭載したいんだけど、熱暴走されたら困るんだよね
    • by Anonymous Coward on 2003年10月16日 7時13分 (#415655)
      > うちのマックにも搭載したいんだけど、熱暴走されたら困るんだよね

      入れてもMacが速くなったりしませんので安心して下さい。
      これは、 PC Compatibility Card [apple.co.jp]って覚えているかな?
      PCIバス上に別なプロセッサを入れてドライブとキーボードだけを共有したボード
      あれと非常に似ている、つまりPCIバスを利用して別なコンピュータに計算をさせているだけに
      過ぎずコンピュータの一部にはなっていない。
      少し身近な例で QuickDraw3D Accelerator card [mbn.or.jp]と同じ
      別なプロセッサに計算させるデータを受け渡して計算結果を得る仕組み
      これを固定化させるかプログラムで変更させるかは設計次第。

      効率良く動かすならボード上に独立したRAMを置くべきだし、
      演算結果を利用したいならビデオチップ側に搭載した設計にすべきものだと思います。
      親コメント
      • by Anonymous Coward
        > 演算結果を利用したいならビデオチップ側に搭載した設計にすべきものだと思います。

        これの意味がわからないのですが。
        言い替えるなら
        「演算結果を利用したいならビデオチップ側に搭載できるよ
        • by Anonymous Coward on 2003年10月16日 11時08分 (#415762)
          2つあると思います。
          昔ラディウスが出していたボードで
          DSPを4つ(だったかな?)搭載したビデオカードがありました
          フィルター処理などをボード側で行うことができます。

          2つ目は3Dカードの座標を計算させるのに一役かってもらおうってことでしょう
          >「600Gflopsの速度のコンピューターの演算結果を利用する」
          違います。25G程度でしょう。1枚に4個X6枚での値ですから
          この数は単にこれくらいあればスパコンに近くなりますよっていうたとえで
          あって6枚さすことではないと思います。

          結局専用に設計すればいいのでしょうが
          プログラムの更新やらの手間を考えるならPCのボードにしてしまえって
          発想なのではないかと、思うのですがPCIの拡張ボックスってありました
          あれと同じくPCIを1つだけ使ってケーブル引き出して演算させるユニット
          という形で製品化して大学や時間がかかるようなことをする所にコンパイラ
          つきで売れば需要があると思いますけど。
          倍の数のDSPで作れば本当にスパコンに張り合えますしPCの限られた
          スペースに入れる必要もなくなりますのでこちらの方が実用的でしょう。
          親コメント
  • by Anonymous Coward on 2003年10月16日 8時26分 (#415676)
    あまりハードウェアには詳しくないが,PCIバス [e-words.jp]のバンド幅はせいぜい533MB/sらしいので,ピーク性能は25GFlopsでもパソコンではバンド幅以上の性能を引き出すのは非常に困難かと…
    でも発売されればきっと買ってしまう^^;
typodupeerror

計算機科学者とは、壊れていないものを修理する人々のことである

読み込み中...