パスワードを忘れた? アカウント作成
14634 story

Intelが80コアプロセッサを開発、1TFLOPSを越える時代へ 97

ストーリー by kazekiri
へぇ 部門より

JonMoo 曰く、

EETimes Japanの記事によると、 Intelが80コア・プロセッサの開発に既に成功しているようだ。この80コア・プロセッサは、クロック周波数が3.16GHzで、 電源電圧が0.95Vのときに1.01TFLOPSを記録するが、消費電力はわずかに62Wということである。これなら、もう数年内には 手元のデスクトップにテラスケールの計算機ということになるかもしれないが、こんなリソースをどう使えばいいのだろう。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by Tsukuba2000 (32811) on 2007年02月14日 16時28分 (#1110013)
    心配いりません、これまでコンピュータの歴史でさんざん言われた事です。

    # 128kBものメモリー・・どう使えばいいんだ、とか。
  • by Anonymous Coward on 2007年02月14日 17時28分 (#1110048)
    CPUを100%占有するゲームはなくならない…

    #特にエロゲに多いような。
  • 2割のアリは働かない (スコア:2, すばらしい洞察)

    by Anonymous Coward on 2007年02月14日 16時45分 (#1110029)
    コアが80個もあればそのなかの2割ぐらいはredundancyのために予約しておくものではないだろうか

    --
    ソースはソニー?
  • by Choro-Chan (31768) on 2007年02月14日 17時30分 (#1110049)
    実際に1TFLOPSを達成した伝えられても [impress.co.jp]どのような構成、アプリケーションでベンチマークを取ったのかが重要ですよね。
    CPUのキャッシュ内に収まるような物で達成したところで、実際の利用を考えた上での実効速度はぐんと落ちるでしょうし、「ラボ内でこんな事も出来たんだよ」くらいにとらえておいた方が良いのかも。
    • Re:推測しよう (スコア:5, すばらしい洞察)

      by Qs (1185) on 2007年02月14日 18時55分 (#1110100) 日記
      1GHzで320GFLOPSとあるから、80コアと周波数で割ってみる。

      320[GFLOPS]/80[core]/1[GHz]=4。

      つまり、1つのコアで1クロックあたり4命令のfloat演算を行っている。2つの単精度FPUしかないのに4命令ということは、SIMDか? それも16bitフローティング??

      4命令がわかったので、記事中にある動作周波数と演算量を検証してみる。
      「約3.1GHz時に1TFLOPS、5.67GHz時に1.8TFLOPS」という記述のこと。

      4 * 80[core] * 3.1[GHz] = 992[GFLOPS]
      4 * 80[core] * 5.67[GHz] = 1814[GFLOPS]

      ここまできれいにスケールしていると、単純に演算器を動かすだけのテストの結果だろうと思われる。
      LINPACKどころか、合成ベンチマークでもない可能性大。
      親コメント
      • Re:推測しよう (スコア:2, すばらしい洞察)

        by Anonymous Coward on 2007年02月14日 19時01分 (#1110103)

        4命令のfloat演算

        というのは間違いで、

        4float演算

        でしょう。一度に2回演算できる命令を呼べば良いんです。

        親コメント
      • by bero (5057) on 2007年02月15日 4時34分 (#1110269) 日記
        1命令で2FLOPである積和演算を延々やってんじゃね?
        2FPUなので4FLOP/クロック
        「最大8個の命令を同時実行」なのでループジャンプは同時実行でカウントされない。
        でもコレだと残り6個の命令スロットはずっと空いてるからもったいないな。
        本来ココで整数演算を同時実行できるので、多分ピーク性能と現実的なベンチの差が小さいと思う。
        親コメント
    • まず初めに、このプロセッサは汎用のCPUではなくて、当面、科学技術計算にしか使わない
      コプロセッサのような物だと考えられます。GRAPE-DR [u-tokyo.ac.jp]と競合する分野でしょうか。

      なにせ、並列動作できない部分が1%でもあれば、その部分は1/80の能力しか出せないわけで、
      実行時間が80倍かかります。
      つまり、99%を速度80で実行して、1%を速度1で実行すると、平均速度は45ぐらいです。
      半分の性能しか出せていません。

      99%を大きく超える効率で、80スレッドを動作させるとすると、このプロセッサ専用に
      カリカリにチューニングされたコードを書くしかありません。
      科学技術計算向けに、システム毎にコードを書き直すような使い方になると思います。
      そうすると、CPUのキャッシュ内に収まるもので評価しても意味がないのではなくて、
      キャッシュ内に収まるようにコードを書かなければ意味がないと言う方が適切でしょう。

      ではメモリ帯域は関係ないのかというと、そんなことはないです。
      メモリ帯域によって、使用できる用途が変わります。
      用途によって、必要な演算量とメモリ帯域のバランスが変わるため、
      現状だとメモリ帯域が少なく演算量の大きい用途にしか使えません。
      具体的には、LINPACKなんかが最適でしょう。実用性はともかく、知名度は高いですし。

      個人的には、メモリを3次元に配置しようとしているところが一番興味深いです。
      今回の発表ではまだ実現できていないようですが、実現すればメモリ帯域が数十倍に増えて、
      用途が一気に広がるのではないかと思います。
      当面は技術デモのみかLINPACK用で、3次元メモリの技術が完成したらスパコン用とか
      GPU用に使えるのではないでしょうか。
      親コメント
      • ZDNet の記事 [zdnet.com]の方が分かりやすいような気がします。

        演算要素は非常に基本的なもので、IntelやAdvanced Micro Devicesのチップが用いるx86命令セットを使用しない。つまり、「Windows Vista」をこのプロトタイプチップ上で実行することはできない。同チップは、x86命令セットよりも単純な命令方式であるVery Long Instruction Word(VLIW)アーキテクチャを使用している。

        EETimes の記事だとここまで書かれていないのでちょっと分かりづらいのかもしれませんが、「とりあえずコアを増やせるだけ増やして同時に動かすことが出来るデモ」でしかないと見たほうがいいかと。

        こちらの記事中に見られる以下の部分は x86 アーキテクチャ系の汎用プロセッサを指していると思いますが。

        その際、同社最高経営責任者(CEO)であるPaul Otellini氏は同チップを5年以内にリリースすると公言した。

        親コメント
    • ベンチマークとなった演算内容は「微分方程式を解くアプリケーション」。
      メモリとの接続は無し。プログラムもデータも全部オンチップメモリのみ。

      という事らしいです。どうやらピーク性能そのままって感じですね。
      ラボではこのチップの上に貼り付ける、積層メモリのような物を考えているようです。

      でも私個人的には、この方向が将来のコンピュータの一つとは考えてます。
      メモリが記憶だけしているなんてもったいなくて。
      記憶装置と演算装置とついでに配線を兼ねた素子を見てみたいです(…脳細胞?)
      親コメント
    • by Anonymous Coward on 2007年02月14日 17時37分 (#1110053)
      FLOPS [wikipedia.org]がどういうものか判ってないということが丸分かりなんだが、それをIDで発言する度胸に乾杯。
      親コメント
      • FLOPSの定義はそうなんですが、実際にこういう分野では、恐ろしく速い演算に対してどうやってエサとなるデータを与えるか?演算結果を引き出すか?が問題になるのです。

        物を良く知らないから、そういう書き方になったのではなく、知っているが故に書いているのですよ。
        親コメント
      • こりゃ失礼、乾杯(完敗)対象で構わないのですが、実際に動かしたのであればどのような環境かは
        気になるところです。

        #恥の上塗りかも知れないけれど臆病者は嫌いなのでID
        親コメント
      • by Anonymous Coward on 2007年02月14日 18時00分 (#1110069)
        FLOPSとひとことでいっても

        理論ピーク性能(これ以上はどうやっても性能があがりませんすいませんごめんなさい)
        実効性能(LINPACKみたいな特定のベンチマークで実際にこの性能を叩き出しましたすごいだろ)

        があって
        『実際に1TFLOPS』という記述から後者の話に違いないと想定するのは間違っていなくて

        その場合にはキャッシュ間のコヒーレンシ(このプロセッサではデータメモリを持っているようだ)や同期が効いてくるから
        実効性能として1TFLOPSを達成したのが命令やデータをキャッシュに収まるようにした特殊なものかもしれないし
        さらにみなさんのお手元に届いて使うときの実効性能は数値演算アプリケーションの種類にも依存するから

        …ラボの中でこんなことができたんだよと考えておく ことにあながちまちがいはないとおもうのですが

        --
        っていっしょうけんめい書いていたら余計なものになりそうだけどAC
        親コメント
  • 先に言っておこう・・・ (スコア:2, おもしろおかしい)

    by gonta (11642) on 2007年02月14日 19時02分 (#1110105) 日記
    「コア数の神話」
    cf. 「メガヘルツの神話」

    今や、端末がIntel Mac・・・信じられん。
    --
    -- gonta --
    "May Macintosh be with you"
  • by shinshimashima (9763) on 2007年02月14日 16時29分 (#1110014) 日記
    すでに半年近く前の記事だけど
    http://www.intel.com/pressroom/archive/releases/20060926corp_b.htm
    • Re:これ? (スコア:2, 参考になる)

      by Anonymous Coward on 2007年02月14日 16時45分 (#1110028)
      今回発表したのは「ちゃんと実機で動作するものができたよ」というのがポイント。
      中身は計算に特化したCPUコア(3KByteの命令メモリ,2KByteのデータメモリ,32個のレジスタ,2つの32bit演算器)の集合体なんだけど
      消費電力が少ないのが売りかな。ATIやnVidiaなどのGPUとどっちが使いやすいだろうね。
      親コメント
  • Z80コア? (スコア:1, すばらしい洞察)

    by Anonymous Coward on 2007年02月14日 16時36分 (#1110019)
    と空目。
    中には「8080コア」と読んだやつも絶対いるに違いない!
  • by Anonymous Coward on 2007年02月14日 17時52分 (#1110061)
    今のPCは遅すぎると思うのは、私だけですかねぇ。

    デスクトップも全て3Dで、学習コストと効率を上げたものが出て欲しいし。

    Webサーバなんかだと、ちょっと効率悪いプログラムにちょっと人が集まるだけですぐ限界が来るような。

    考え方の違いだろうか。

    • by kikki (30639) on 2007年02月14日 21時58分 (#1110182)
      私も演算能力も容量も全く足りていないと思っています。
      だって3次元のデータをそのままではまともに扱えません。
      医療機器などで使われている装置でも表示だけでいっぱいですし。

      表面だけじゃなくて、中身が詰まった物体を、フツーに扱えるようになるには、
      あとどのくらいの性能が必要なんでしょうね。
      親コメント
  • 水ではなく火事になる (スコア:1, おもしろおかしい)

    by Anonymous Coward on 2007年02月14日 20時09分 (#1110139)
    この記事を見て頭の中に所ジョージの「組曲 冬の情景」が流れてきました

    1枚が2枚
    2枚が4枚
    4枚が8枚
    8枚が16・32・64・128・256・512・10……
  • by rero (29767) on 2007年02月14日 21時41分 (#1110179)
    について誰もコメントしないのが不思議.
  • by CowardDuck (25674) on 2007年02月14日 23時19分 (#1110199)
    ムーアの法則的には 10 年以内に 1000 コア超えそうだね。

    「1プロセス1コア」が現実になると今の OS の
    スケジューラって全部、時代遅れになるんだろうな。
    • Re:1プロセス1コア (スコア:2, おもしろおかしい)

      by ftw (7254) on 2007年02月15日 0時23分 (#1110217)
      こんどはプロセスに対して、コア/プロセッサーではなくて、 メモリをスケジュールすることになるんです。 そんでメモリが速くなったらI/Oをスケジューリングすることになるんです。 さらにI/Oまで速くなったら人間をスケジューリングするんです。 はい、つぎ r、m、スペース、スラッシュ、エンター!ってコンピュータに指示されます。
      親コメント
typodupeerror

「科学者は100%安全だと保証できないものは動かしてはならない」、科学者「えっ」、プログラマ「えっ」

読み込み中...