ページ内ジャンプ:

アレゲなニュースと雑談サイト

kazekiriによる 2007年02月14日 16時21分の掲載
へぇ部門より。

JonMoo 曰く、

EETimes Japanの記事によると、 Intelが80コア・プロセッサの開発に既に成功しているようだ。この80コア・プロセッサは、クロック周波数が3.16GHzで、 電源電圧が0.95Vのときに1.01TFLOPSを記録するが、消費電力はわずかに62Wということである。これなら、もう数年内には 手元のデスクトップにテラスケールの計算機ということになるかもしれないが、こんなリソースをどう使えばいいのだろう。

この議論は賞味期限が過ぎたので、保存されている。 新たにコメントを書くことはできない。
表示オプション しきい値:
  • 心配いりません、これまでコンピュータの歴史でさんざん言われた事です。

    # 128kBものメモリー・・どう使えばいいんだ、とか。
  • Anonymous Coward : 2007年02月14日 17時28分 (#1110048)
    CPUを100%占有するゲームはなくならない…

    #特にエロゲに多いような。
  • 2割のアリは働かない (スコア:2, すばらしい洞察)

    Anonymous Coward : 2007年02月14日 16時45分 (#1110029)
    コアが80個もあればそのなかの2割ぐらいはredundancyのために予約しておくものではないだろうか

    --
    ソースはソニー?
  • 実際に1TFLOPSを達成した伝えられても [impress.co.jp]どのような構成、アプリケーションでベンチマークを取ったのかが重要ですよね。
    CPUのキャッシュ内に収まるような物で達成したところで、実際の利用を考えた上での実効速度はぐんと落ちるでしょうし、「ラボ内でこんな事も出来たんだよ」くらいにとらえておいた方が良いのかも。
    • Re:推測しよう (スコア:5, すばらしい洞察)

      Qs (1185) : 2007年02月14日 18時55分 (#1110100) 日記
      1GHzで320GFLOPSとあるから、80コアと周波数で割ってみる。

      320[GFLOPS]/80[core]/1[GHz]=4。

      つまり、1つのコアで1クロックあたり4命令のfloat演算を行っている。2つの単精度FPUしかないのに4命令ということは、SIMDか? それも16bitフローティング??

      4命令がわかったので、記事中にある動作周波数と演算量を検証してみる。
      「約3.1GHz時に1TFLOPS、5.67GHz時に1.8TFLOPS」という記述のこと。

      4 * 80[core] * 3.1[GHz] = 992[GFLOPS]
      4 * 80[core] * 5.67[GHz] = 1814[GFLOPS]

      ここまできれいにスケールしていると、単純に演算器を動かすだけのテストの結果だろうと思われる。
      LINPACKどころか、合成ベンチマークでもない可能性大。
    • まず初めに、このプロセッサは汎用のCPUではなくて、当面、科学技術計算にしか使わない
      コプロセッサのような物だと考えられます。GRAPE-DR [u-tokyo.ac.jp]と競合する分野でしょうか。

      なにせ、並列動作できない部分が1%でもあれば、その部分は1/80の能力しか出せないわけで、
      実行時間が80倍かかります。
      つまり、99%を速度80で実行して、1%を速度1で実行すると、平均速度は45ぐらいです。
      半分の性能しか出せていません。

      99%を大きく超える効率で、80スレッドを動作させるとすると、このプロセッサ専用に
      カリカリにチューニングされたコードを書くしかありません。
      科学技術計算向けに、システム毎にコードを書き直すような使い方になると思います。
      そうすると、CPUのキャッシュ内に収まるもので評価しても意味がないのではなくて、
      キャッシュ内に収まるようにコードを書かなければ意味がないと言う方が適切でしょう。

      ではメモリ帯域は関係ないのかというと、そんなことはないです。
      メモリ帯域によって、使用できる用途が変わります。
      用途によって、必要な演算量とメモリ帯域のバランスが変わるため、
      現状だとメモリ帯域が少なく演算量の大きい用途にしか使えません。
      具体的には、LINPACKなんかが最適でしょう。実用性はともかく、知名度は高いですし。

      個人的には、メモリを3次元に配置しようとしているところが一番興味深いです。
      今回の発表ではまだ実現できていないようですが、実現すればメモリ帯域が数十倍に増えて、
      用途が一気に広がるのではないかと思います。
      当面は技術デモのみかLINPACK用で、3次元メモリの技術が完成したらスパコン用とか
      GPU用に使えるのではないでしょうか。
      • ZDNet の記事 [zdnet.com]の方が分かりやすいような気がします。

        演算要素は非常に基本的なもので、IntelやAdvanced Micro Devicesのチップが用いるx86命令セットを使用しない。つまり、「Windows Vista」をこのプロトタイプチップ上で実行することはできない。同チップは、x86命令セットよりも単純な命令方式であるVery Long Instruction Word(VLIW)アーキテクチャを使用している。

        EETimes の記事だとここまで書かれていないのでちょっと分かりづらいのかもしれませんが、「とりあえずコアを増やせるだけ増やして同時に動かすことが出来るデモ」でしかないと見たほうがいいかと。

        こちらの記事中に見られる以下の部分は x86 アーキテクチャ系の汎用プロセッサを指していると思いますが。

        その際、同社最高経営責任者(CEO)であるPaul Otellini氏は同チップを5年以内にリリースすると公言した。

      • 1個のコメント が現在のしきい値以下です。
    • ベンチマークとなった演算内容は「微分方程式を解くアプリケーション」。
      メモリとの接続は無し。プログラムもデータも全部オンチップメモリのみ。

      という事らしいです。どうやらピーク性能そのままって感じですね。
      ラボではこのチップの上に貼り付ける、積層メモリのような物を考えているようです。

      でも私個人的には、この方向が将来のコンピュータの一つとは考えてます。
      メモリが記憶だけしているなんてもったいなくて。
      記憶装置と演算装置とついでに配線を兼ねた素子を見てみたいです(…脳細胞?)
  • 先に言っておこう・・・ (スコア:2, おもしろおかしい)

    gonta (11642) : 2007年02月14日 19時02分 (#1110105) 日記
    「コア数の神話」
    cf. 「メガヘルツの神話」

    今や、端末がIntel Mac・・・信じられん。
    --
    -- gonta --
    "May Macintosh be with you"
  • shinshimashima (9763) : 2007年02月14日 16時29分 (#1110014) 日記
    すでに半年近く前の記事だけど
    http://www.intel.com/pressroom/archive/releases/20060926corp_b.htm
    • Re:これ? (スコア:2, 参考になる)

      Anonymous Coward : 2007年02月14日 16時45分 (#1110028)
      今回発表したのは「ちゃんと実機で動作するものができたよ」というのがポイント。
      中身は計算に特化したCPUコア(3KByteの命令メモリ,2KByteのデータメモリ,32個のレジスタ,2つの32bit演算器)の集合体なんだけど
      消費電力が少ないのが売りかな。ATIやnVidiaなどのGPUとどっちが使いやすいだろうね。
  • Z80コア? (スコア:1, すばらしい洞察)

    Anonymous Coward : 2007年02月14日 16時36分 (#1110019)
    と空目。
    中には「8080コア」と読んだやつも絶対いるに違いない!
  • Anonymous Coward : 2007年02月14日 17時52分 (#1110061)
    今のPCは遅すぎると思うのは、私だけですかねぇ。

    デスクトップも全て3Dで、学習コストと効率を上げたものが出て欲しいし。

    Webサーバなんかだと、ちょっと効率悪いプログラムにちょっと人が集まるだけですぐ限界が来るような。

    考え方の違いだろうか。

    • kikki (30639) : 2007年02月14日 21時58分 (#1110182)
      私も演算能力も容量も全く足りていないと思っています。
      だって3次元のデータをそのままではまともに扱えません。
      医療機器などで使われている装置でも表示だけでいっぱいですし。

      表面だけじゃなくて、中身が詰まった物体を、フツーに扱えるようになるには、
      あとどのくらいの性能が必要なんでしょうね。
    • 3個のコメント が現在のしきい値以下です。
  • 水ではなく火事になる (スコア:1, おもしろおかしい)

    Anonymous Coward : 2007年02月14日 20時09分 (#1110139)
    この記事を見て頭の中に所ジョージの「組曲 冬の情景」が流れてきました

    1枚が2枚
    2枚が4枚
    4枚が8枚
    8枚が16・32・64・128・256・512・10……
  • rero (29767) : 2007年02月14日 21時41分 (#1110179)
    について誰もコメントしないのが不思議.
  • ムーアの法則的には 10 年以内に 1000 コア超えそうだね。

    「1プロセス1コア」が現実になると今の OS の
    スケジューラって全部、時代遅れになるんだろうな。
    • Re:1プロセス1コア (スコア:2, おもしろおかしい)

      ftw (7254) : 2007年02月15日 0時23分 (#1110217)
      こんどはプロセスに対して、コア/プロセッサーではなくて、 メモリをスケジュールすることになるんです。 そんでメモリが速くなったらI/Oをスケジューリングすることになるんです。 さらにI/Oまで速くなったら人間をスケジューリングするんです。 はい、つぎ r、m、スペース、スラッシュ、エンター!ってコンピュータに指示されます。
    • 1個のコメント が現在のしきい値以下です。
  • Matthew (12158) : 2007年02月16日 2時45分 (#1110703) 日記
    OpenCVで利用してみたい。
  • Sakura Avalon (12557) : 2007年02月14日 18時04分 (#1110073)
    >飛ぶようなスピードで起動し、レンダリングも書き出しも瞬時に終わる
    >HDビデオ編集環境が実現できたら素敵ですね。

    大丈夫です。今度はメモリーとHDDが足を引っ張ってくれます☆
    実際とあるプロジェクトで大きなデータの演算やらせてるのだけど、CPU性能向上のおかげで演算自体は当初から数百倍近く速くなりました。でもデータ量も増えてきており、OSのスワップやらデータの読み込み/書き出しで時間をとられてそれほど全体にかかる時間は減っていません。もちろんやれる事が増えているのは確かなんですけどね~。

    #昔:LZHやZipは時間がかかるけどフロッピーに書き出す時には欠かせないんだよな~。(データ量を減らすため。)
    #今:LZHやZipは時間がかかるけどUSBメモリーに書き出す時には欠かせないんだよな~。(ファイル数を減らすため。ファイル数が多いほど遅いので。)
  • >> 数年内には手元のデスクトップにテラスケールの計算機
    >その頃にテラワロスという言葉は死語になっているのだろうか。

    クスクス笑い程度の意味になってます。
    ○:あの件があったためか、彼女は僕の顔を見るなりクスッと笑った。
    ×:あの件があったためか、彼女は僕の顔を見るなりテラワロス。

    #あぁ、だから今年になって「地球へ… [terra-e.com]」がTVアニメになるんだ☆(違う。)
  • 5個のコメント が現在のしきい値以下です。