FreeBSD SMPngが完了、性能が劇的に改善

FreeBSD SMPngが完了、性能が劇的に改善 72

ストーリー by mhatta 2007年02月25日 17時00分
ビフォーアフター部門より

uyota 曰く、

2000年から続けられていたFreeBSDの次世代SMP対応プロジェクト、通称SMPngが完了し、劇的な性能改善を実現したようだ。

Kris Kennaway氏の実験結果によると、同じ8コアの amd64 システム上において、最新のLinuxカーネルと、ULEスケジューラに更にパッチをいくつか当てた 7.0-CURRENTの両方でMySQLのトランザクション/秒を計測したところ、クライアント数が 8 までならばLinuxの方が僅かに上回るが、それ以上になると今回改良されたFreeBSDのパフォーマンスが勝ることが分かった。特に14クライアントを越えた後のLiunxは無惨な結果となり、1スレッド並にまで性能が劣化するが、FreeBSDはそれ以降も安定した性能を発揮できたという(グラフ)。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索72コメント Log In/Create an Account

本当に劇的に改善したの？ (スコア:3, 興味深い)

by annoymouse coward (11178) on 2007年02月25日 18時01分 (#1116710) 日記

一体 SMPng は何を劇的に改善したのでしょうか？

タレコミにリンクが貼ってあるグラフ [freebsd.org]ですが，
このグラフを見た限りでは，すくなくとも性能が劇的に改善したように見えません．場合によっては，Linuxの方が性能が良いようにさえ見えます．

まず，縦軸のピークは linux です．
(意地悪な言い方をすれば) アプリケーション側でチューニングを行えば Linux のほうが性能がでることになります

次に，グラフの左側，並列度が実CPU数よりも低い場合は Linuxのほうが1割以上速いという結果が出ています．
タレコミ中では”僅かに上回る”と言っていますが，CPUのマルチコア化が進んでいる状況を考えると，並列度が低い場合に1割以上性能が劣る事実は，FreeBSDがLinuxに劣る欠点として認識すべきです．

グラフの右側も含めて，グラフ全体を見ても，
- 高負荷時のスループット BSD が有利
- 低負荷時のスループット Linux が有利
という以前から言われている関係が再度示されただけで，結局 SMPng を持ってしても問題は改善できなかったように思えます．一体 SMPng は何を劇的に改善したのでしょうか？
- Re:本当に劇的に改善したの？ (スコア:4, 興味深い)
  
  by bee (10028) on 2007年02月25日 18時18分 (#1116715) ホームページ日記
  
  このグラフを見た限りでは，すくなくとも性能が劇的に改善したように見えません．
  
  そうですね、グラフには改善前のものが記載されていませんから改善したのか悪化したのかすら判りません。
  
  次に，グラフの左側，並列度が実CPU数よりも低い場合は Linuxのほうが1割以上速いという結果が出ています．
  
  むしろ、実CPU数よりも多い並列度になるとLinuxのスケジューラはうまく処理を捌けない点に注目すべきだと思います。うまく処理を割り当てていれば、スレッド個別のスループットは落ちたとしても合計のスループットはそれほど低下しないはずです。
  
  FreeBSDにおいて並列4～7度の部分が遅くなっているのは、AMDのCPUを使用していることからリモートメモリへのアクセスが発生していることによるボトルネックに思えます(4で若干低下しているのはOSのオーバヘッドだと考えられます。)。先も書きましたがFreeBSDのスケジューラ/メモリアロケータはNUMAを意識していないように思えます。
  
  シェア
  
  親コメント
  - - Re:本当に劇的に改善したの？ (スコア:1)
      
      by bee (10028) on 2007年02月27日 12時54分 (#1117713) ホームページ日記
      
      SMPng の成果を計測するのに、厳密にはSMPといえないAMDのCPUを使用したのは何故なんでしょうか。
      
      厳密にはSMPではないとはどの部分を指しているのでしょうか。単にSMPngが対象としている問題領域の範囲内ではSMPとみなせるだけの条件を満たしていたのかもしれません。
      
      それはともかく、実際にはAMDがマシンを提供してくれたから [freebsd.org]でしょう。
      
      シェア
      
      親コメント
      - NUMA.≠SMP? (スコア:1)
        
        by bee (10028) on 2007年02月28日 2時16分 (#1118142) ホームページ日記
        
        NUMAとSMPは対立する概念とは思えません。
        
        NUMAだからSMPではないとかそういった表現はできなくて、マルチプロセサシステムにおけるメモリの接続方法としてUMAとNUMAといった区分があり、SMPの対義語はASMPだと思うのです。
        
        シェア
        
        親コメント
- Re:本当に劇的に改善したの？ (スコア:3, 参考になる)
  
  by Anonymous Coward on 2007年02月25日 19時29分 (#1116740)
  
  してます。
  MySQLのベンチにおいて、これまでは全てLinuxを下回る結果でした。
  (ソース失念)
  
  改良したULEスケジューラ、libthrスレッドライブラリ、
  CURRENTにパッチをあてたもの、という非標準な環境ではあるにしろ
  このような結果がでたことは素直に喜ばしいです。
  
  # 6.2-RELEASE の結果も載せるべきだと思う。
  
  シェア
  
  親コメント
  - Re:本当に劇的に改善したの？ (スコア:1, 興味深い)
    
    by Anonymous Coward on 2007年02月25日 21時22分 (#1116791)
    
    >>MySQLのベンチにおいて、これまでは全てLinuxを下回る結果でした。
    8CPU上のLinuxでスレッドを増やして落ち込んでいる所よりも下だったんですか？
    
    このグラフを見るとLinuxのこのバージョン(だけと信じたい)のスケジューラには痛いバグがあるというのが無難な結論と思います。
    
    シェア
    
    親コメント
    - Re:本当に劇的に改善したの？ (スコア:1, 参考になる)
      
      by Anonymous Coward on 2007年02月26日 4時39分 (#1116908)
      
      > このグラフを見るとLinuxのこのバージョン(だけと信じたい)のスケジューラには痛いバグがあるというのが無難な結論と思います。
      
      2.6.18, 2.6.19, 2.6.20で観測されているよ。
      
      信じたい→無難な結論、って恥ずかしくね？
      
      シェア
      
      親コメント
- Re:本当に劇的に改善したの？ (スコア:3, 興味深い)
  
  by Anonymous Coward on 2007年02月26日 1時25分 (#1116871)
  
  > タレコミ中では”僅かに上回る”と言っていますが，CPUのマルチコア化が進んでいる状況を考えると，並列度が低い場合に1割以上性能が劣る事実は，FreeBSDがLinuxに劣る欠点として認識すべきです．
  
  DBサーバに適応すると考えた場合、
  このグラフを見る限り普通はFreeBSD改の方がいいという結論になりませんかね？
  
  FreeBSD改のように低負荷の場合に多少性能が悪くても個々のレスポンスが落ちるだけですけど、
  Linuxのように高負荷になった場合に途端に性能ががくんと落ちられてしまうと
  何かの拍子にネガティブなスパイラルに突入して待ち行列がすごい勢いで伸びていって
  「サーバ落ちた」状態になるのが怖そうなんですが。
  
  確かに全範囲でLinuxを上回ればベストでしょうけど、
  サーバ関係なら同時リクエストがコア数を上回るなんてザラでしょうから、
  そこを優先して改善するというのはアリじゃないでしょうかね。
  
  どうせならスレッド数を対数にしちゃえば良かったのに（笑）と思うAC
  （そういえば、昨日のまいにちいっしょ [dokodemoissyo.com]は「グラフで比較すると」ネタだったな～）
  
  シェア
  
  親コメント
  - Re:本当に劇的に改善したの？ (スコア:1)
    
    by nox_dot (11614) on 2007年02月26日 19時18分 (#1117264) 日記
    
    > このグラフを見る限り普通はFreeBSD改の方がいいという結論になりませんかね？
    同感です。
    パクリでもいいのでLinuxにもこの研究(実装)成果を取り込みたい物ですね。
    (あ、私がBSD使いになればいいのか。)
    
    シェア
    
    親コメント
- Re:本当に劇的に改善したの？ (スコア:1, すばらしい洞察)
  
  by Anonymous Coward on 2007年02月25日 20時32分 (#1116769)
  
  >CPUのマルチコア化が進んでいる状況を考えると，並列度が低い場合に1割以上性能が劣る事実は
  
  CPU のマルチコア化が進むと、今後は並列処理を積極的におこなうアプリケーションが増えるであろうことが
  予想されるので、並列度が低い場合にしか性能を発揮できない事実はうんぬんかんぬん、
  ともいえますね。
  
  シェア
  
  親コメント
従来版との比較 (スコア:3, 興味深い)

by superfox (31908) on 2007年02月28日 18時01分 (#1118565)

http://obsecurity.dyndns.org/holycrap.png [dyndns.org] これを見ると、効いているのは ULE というより filedesc、つまり GIANT-lock 対策の方のような気がします（filedesc-4bsd もそこそこ良い値を出しているので）。
- Re:従来版との比較 (スコア:1)
  
  by bee (10028) on 2007年03月07日 18時08分 (#1122212) ホームページ日記
  このグラフを探していました。これを見ると
  
  4BSDとULEでは大きな差は無い。若干向上するがスレッドを増やすとどちらもLinuxと同じ程度に性能が低下する。
  
  4bsd+filedescで性能低下が抑えられる。Linuxのピーク性能には及ばないが性能も向上する。
  
  ule+filedescは4bsd+filedescと比較して有意な差は無い。
  
  ということでULEによる効果というわけではなさそうですね。
  
  nopickpriというのが性能向上に大きな効果があるのですが、これは4BSDでは使えないのでしょうね。
  
  filedescがスレッドの競合を防ぐ効果があるように見えることから、Linuxでもまだロックが荒いところがあるように思えます。
  シェア
  
  親コメント
末恐ろしいぜマルチコア (スコア:2, 興味深い)

by t_mrc-ct (5292) on 2007年02月25日 18時57分 (#1116732) 日記

このグラフ [freebsd.org]通りに性能が向上するとしたら、100コアCPUとか出てきたらエラい事になりそう。
でもその前にメモリ帯域かネットワーク帯域が詰まるんだろうなぁ。

話変わるけど、コア数以上にスレッド走らせても性能的には無意味っていう事に結構おどろいた。
スレッド数がコア数を越えても暫くはスコアが上昇してその後で降下するんだろうなぁ、と何となく考えていたので、コア数越えと共にスコアの上昇がピタッと止まったのは意外。
- Re:末恐ろしいぜマルチコア (スコア:2, 参考になる)
  
  by little( (31297) on 2007年02月25日 20時24分 (#1116764) ホームページ日記
  
  >このグラフ通りに性能が向上するとしたら、100コアCPUとか出てきたらエラい事になりそう。
  
  LinuxもFreeBSDもスレッドが１つの時は、秒間当りのトランザクションは５００だね。
  でも、スレッドがコアの数と同じ８になると、両者ともおよそ３０００くらい。
  ４つだと１７００くらいだから、たぶん、コア数を0.86乗したあたりが、性能の上限かなぁ？
  １００コアだとおよそ１コアの５２倍の性能あたりだろうか。
  
  ただの推測だし、１００コアいくころは、マルチコアの制御の仕方ももっと洗練されるだろうけど。
  
  シェア
  
  親コメント
- Re:末恐ろしいぜマルチコア (スコア:2, 参考になる)
  
  by goji (949) on 2007年02月26日 1時49分 (#1116881) ホームページ日記
  
  このテストの最善のケースは、スレッド数がプロセッサ数に至るまでの間リニアにスループットが増加し、その後平らになるようなケースです。
  FreeBSDのケースは極めて理想に近い性能を示していると言えます。
  
  シェア
  
  親コメント
- Re:末恐ろしいぜマルチコア (スコア:0)
  
  by Anonymous Coward
  
  >話変わるけど、コア数以上にスレッド走らせても性能的には無意味っていう事に結構おどろいた。
  >スレッド数がコア数を越えても暫くはスコアが上昇してその後で降下するんだろうなぁ、と何となく考えていたので、コア数越えと共にスコアの上昇がピタッと止まったのは意外。
  
  スループット・レスポンスタイムあたりを混同している予感。
  - Re:末恐ろしいぜマルチコア (スコア:1, 参考になる)
    
    by Anonymous Coward on 2007年02月25日 22時07分 (#1116804)
    
    いや、処理内容次第でしょ。
    
    CPUを使い切ってる状況なら、スレッドを増やしてもスループットの向上なんかは見込めませんが、
    
    例えばディスクの読み込み待ち時間があるとか、CPUが100%使い切れてない状況なら
    コア数以上にスレッドを増やすことで、
    (同じコア内で、例えば2つのスレッドがディスク待ちと計算処理を交互に行うことになり)
    全体のスループットが上昇する可能性がある。
    
    ハイパースレッディングなんかは、そういう状況で(コンテクストスイッチの負荷を減らして)スループットを向上させるような技術だしね。
    
    シェア
    
    親コメント
    - Re:末恐ろしいぜマルチコア (スコア:1)
      
      by tarosuke (2403) <webmaster@tarosuke.net> on 2007年02月25日 23時46分 (#1116836) 日記
      
      >ハイパースレッディングなんかは、そういう状況で(コンテクストスイッチの負荷を減らして)スループットを向上させるような技術だしね。
      
      それたぶん違う。intelがハイパースレッディングと呼んでるSMTは、パイプラインが長くなってOutOfOrder程度じゃパイプラインが埋まらなくなったので複数のスレッドのコード(=互いに因果関係が全くない)をパイプラインに投入する事でパイプラインを埋める方法じゃなかったか？因果関係のない命令を順番に書いてストールを避けるってのの延長で。
      # MMUも複数持たせりゃSMPになるわけだが...。
      
      シェア
      
      親コメント
      - Re:末恐ろしいぜマルチコア (スコア:1)
        
        by chess (7856) on 2007年02月26日 0時30分 (#1116852)
        
        見ている部分がマクロかミクロかの差であって、どちらかが違うというほどのものでもないでしょう。多分モチベーションはパイプ埋めにあったんでしょうけど。
        
        シェア
        
        親コメント
        
        Re:末恐ろしいぜマルチコア (スコア:1)
        
        by tarosuke (2403) <webmaster@tarosuke.net> on 2007年02月26日 0時40分 (#1116856) 日記
        
        コンテキストスイッチへの効果自体は否定しないけどね。たぶん余録。
        # でもプロセススイッチが絡むとSMTは結構邪魔だったり。特にマイクロカーネルなOSだと困るんじゃないかなー。
        
        シェア
        
        親コメント
他でも再現したみたい (スコア:2, 参考になる)

by ddc (14170) on 2007年02月26日 20時25分 (#1117296) 日記

LKLMにも確認報告 [lkml.org]が出たようですね。
こっちは4コアに4,8スレッドで比較してますけど、8スレッド時に35%もidleに食われているようです。
やっぱりバグなんですかねぇ。
- Re:他でも再現したみたい (スコア:1)
  
  by Henrich (121) on 2007年02月27日 3時06分 (#1117477)
  
  http://www.ussg.iu.edu/hypermail/linux/kernel/0702.3/0515.html [iu.edu]
  で Suse の人がパッチ出して 30% ぐらいは改善したけどまだまだ、だそうで。
  
  まぁ、あとしばらく見守りましょう。
  
  シェア
  
  親コメント
原因判明 (スコア:2)

by yosshy (3545) on 2007年03月22日 22時13分 (#1130349) 日記

スレッド数＞CPU 数で Linux の性能が落ちるのは、glibc の malloc/free コードのスケーラビリティに問題があるから [ozlabs.org]と判明しました。
素晴らしいことは素晴らしいのですが (スコア:1, 興味深い)

by Anonymous Coward on 2007年02月25日 17時29分 (#1116694)

パッチを適用しない状態での素のFreeBSDではどうなんでしょうか？
- Re:素晴らしいことは素晴らしいのですが (スコア:1)
  
  by SteppingWind (2654) on 2007年02月25日 21時15分 (#1116789)
  
  それ以前にSMP環境でULEスケジューラが安定して動くかどうかって問題もあったり. シングルなら安定して動いてはいるんですけど.
  
  他にもドライバレベルでGIANTロックがまだまだ残っていたり, デスクトップ用途だと割り込みのリアルタイム性がちょっと怪しげだったり(TigerMPXなんか使っているからかも?)とかいろいろあるんで, 実際のシステムで性能をうんぬんする段階ではないという気がしますけどね.
  
  シェア
  
  親コメント
- Re:素晴らしいことは素晴らしいのですが (スコア:0)
  
  by Anonymous Coward
  
  そりゃ、悪いんじゃない？
  SMPngもそのうち取り込まれるだろ。
  
  # Vistaの性能がどうこう言ってるときに「アップデートしないXPではどうなんでしょう？」って聞くようなもんだぞ
  - Re:素晴らしいことは素晴らしいのですが (スコア:3, 参考になる)
    
    by ddc (14170) on 2007年02月25日 17時57分 (#1116708) 日記
    
    素のFreeBSDは無さそうですが、もう少し比較対象を追加した結果が
    ここ [livejournal.com]に出ていますね。
    
    シェア
    
    親コメント
    - Re:素晴らしいことは素晴らしいのですが (スコア:2, 興味深い)
      
      by Jadawin (2174) on 2007年02月26日 13時01分 (#1117023) 日記
      
      SMPの実装方式の対立から分裂した、DragonFlyも見てみたい。
      
      シェア
      
      親コメント
      - Re:素晴らしいことは素晴らしいのですが (スコア:3, 参考になる)
        
        by Jadawin (2174) on 2007年02月27日 9時28分 (#1117534) 日記
        
        少しググッてみた。DragonFlyのMLを見つけた。
        
        http://leaf.dragonflybsd.org/mailarchive/kernel/2007-01/msg00124.html [dragonflybsd.org]
        
        ざくっと、読んでみると、、、
        
        (1) DragonFlyには、まだGiant Lockが残っている。
        (2) FreeBSDは、頑張ってるけどやりかたがまずい。あれでは1024CPUは扱えない。
        (3) LinuxとDragonFlyは、重点の置き方が違うけど考え方は似ている。
        
        てな話をしている。
        
        シェア
        
        親コメント
  - Re:素晴らしいことは素晴らしいのですが (スコア:1, 興味深い)
    
    by Anonymous Coward on 2007年02月25日 18時41分 (#1116730)
    
    どのくらい改善しているのかは当然知りたいわけで、Linuxなんかと比べる前に素のFreeBSDと比べてほしいのだけど...
    
    ># Vistaの性能がどうこう言ってるときに「アップデートしないXPではどうなんでしょう？」って聞くようなもんだぞ
    Vistaはアップデートすると遅くなるんでしょ？？
    
    シェア
    
    親コメント
落ち込みは何が原因なんでしょ？ (スコア:1, 興味深い)

by Anonymous Coward on 2007年02月25日 20時13分 (#1116760)

マルチコアで、スレッド数がコア数を上まわるとパフォーマンスが落ちるというのは、例えば動画エンコーダなんかだとキャッシュ容量を圧迫するからというのが大きな理由でしょう。動画エンコーダだと広範囲のメモリを参照、大量のI/Oをしないといけないけど、マルチスレッド化するために、並列で複数の異なるフレームを処理したりとかしているので、どうしてもワーキングセットが肥大化しがちで、スラッシング状態になったりします。

でも今回の実験だとFreeBSDでは殆ど性能が落ちないんですよね。もっと別のケースのデータなんかも見てみたい気はしますね。
- Re:落ち込みは何が原因なんでしょ？ (スコア:1)
  
  by bero (5057) on 2007年02月26日 13時18分 (#1117037) 日記
  
  それはタコなだけかとおもいます。別に並列で同一フレームの異なる場所を処理してもいいわけだし、あと異なる圧縮方式を試して一番いいのを採用するので並列で異なる方式を処理してもいいし。
  よしんば別フレームを処理するにしても、DCT系(mpeg2/4/h264等)圧縮だと必要なのは過去(I)、未来(P)、現在(B)の３フレーム分だけで、別フレーム処理するにしても過去、未来は同じなので「広範囲のメモリを参照、大量のI/O」つーほどにはならないはず。
  
  シェア
  
  親コメント
- - Re:落ち込みは何が原因なんでしょ？ (スコア:2, 参考になる)
    
    by little( (31297) on 2007年02月26日 0時14分 (#1116842) ホームページ日記
    
    >ならばユーザースレッドの数が多ければ多いほど、処理できる能力って相対的に減るよね
    
    コアの数を上回ったスレッドを動かすと、個々のスレッドの処理能力は落ちるんですけど、FreeBSDはそれぞれのスレッド処理能力を合計すると、８スレッド動かした時の合計に近い値が出る。
    ところが、Linuxは８スレッド超えると、それぞれのスレッドの処理能力を合計しても、８スレッド時の合計に遠く及ばなくなる。
    
    グラフによると、８スレッド動かした時の能力は双方とも、およそ３０００。
    スレッド毎に３７５くらいになる。
    スレッドの数を１６にしても、FreeBSDは能力の合計が３０００弱。
    合計が８スレッドの時とほぼいっしょなので、スレッド毎の能力は単純に半分になる。
    ところが、Linuxの場合、１６スレッドになると、能力の合計が８００くらいまで落ちる。
    スレッド毎には、５０程度と激減する。
    
    シェア
    
    親コメント
    - Re:落ち込みは何が原因なんでしょ？ (スコア:1)
      
      by bee (10028) on 2007年02月27日 13時00分 (#1117719) ホームページ日記
      
      シングルプロセサで複数のスレッドを動かした場合、Linuxはやはり性能が低下するのでしょうか。
      
      シェア
      
      親コメント
      - Re:落ち込みは何が原因なんでしょ？ (スコア:1)
        
        by little( (31297) on 2007年02月27日 14時16分 (#1117790) ホームページ日記
        
        グラフを見る限り、Linuxでの性能の低下は、スレッド１４個あたりで下げ止まります。
        性能としてはコア１個に＋αといった所で安定します。
        性能低下の原因が、単純に、複数スレッドを実行した事にあるのなら、こんな形にはならないと思うんですよ。
        これは、複数のコアに対する処理が原因で、最終的には、有効に使えてるコアが１つだけだからなのではないかと思います。
        なので、シングルプロセッサの場合、この現象は起きない可能性が高いです。
        
        シェア
        
        親コメント
  - Re:落ち込みは何が原因なんでしょ？ (スコア:1, 参考になる)
    
    by Anonymous Coward on 2007年02月26日 1時58分 (#1116886)
    
    > スレッド数がコア数を上回っている時点で
    > 素のスレッドと言うよりはユーザースレッドだよね。
    
    カーネルスレッドで，I/O待ちに突入した時点で，プリエンプションが起こっているだけでしょう．
    
    DBの処理は，I/O処理と計算処理の粒度が大きいので，カーネルスレッドのベンチマークに最適な例です．
    つまりI/O処理待ちの間に，他のスレッドが計算処理を並行して実行できるので
    グラフのように実CPU以上のスレッドが起動しても，さほど性能低下が起きていないのだと思います．
    
    シェア
    
    親コメント
MySQLの実装の差とか (スコア:1)

by hyoshiok (10034) on 2007年02月27日 9時13分 (#1117527)

MySQLが８コアでスケールしないということは知られているのですが、このFreeBSDとLinuxの比較でのMySQLのバージョン、設定方法等はどうなっているんでしょう？ MySQLのポートごとの実装の差が性能動作の差になっている可能性はありますよね。（OSとしての差というより）
どなたか追試をしていただけるとうれしいっす。
http://ossipedia.ipa.go.jp/capacity/EV0612260303/ [ipa.go.jp]
- Re:MySQLの実装の差とか (スコア:2, 興味深い)
  
  by hyoshiok (10034) on 2007年02月28日 12時23分 (#1118339)
  
  ブログのネタにしました。
  http://blog.miraclelinux.com/yume/2007/02/mysqllinux_472a.html [miraclelinux.com]
  SMTないしMC用スケジューラの問題だということに落ち着きそうな勢いです。
  
  シェア
  
  親コメント
- Re:MySQLの実装の差とか (スコア:1)
  
  by superfox (31908) on 2007年02月28日 18時05分 (#1118566)
  
  実装の差が影響を与えないような試験方法になっていたはずですよ(I/Oも発生しないようなリクエストだったはず)。対Solaris編 [tweakers.net]も参照してみてはどうでしょうか。
  
  シェア
  
  親コメント
解説記事でたよ〜 (スコア:1, 参考になる)

by Anonymous Coward on 2007年02月28日 14時19分 (#1118448)

佐藤さんの解説記事でたよ〜 http://journal.mycom.co.jp/articles/2007/02/27/smpng/ [mycom.co.jp]
6.Xとの比較も欲しい (スコア:0)

by Anonymous Coward on 2007年02月25日 17時31分 (#1116695)

(6.Xに比べて)性能が劇的に改善、という意味ですよね？
NUMA (スコア:0)

by Anonymous Coward on 2007年02月25日 17時33分 (#1116698)

最新のLinux Kernel というか、FC6 って書いてますね。
これはNUMA イネーブルなのでしょうか？

Linux は良く解ってないのですが、SMP-ng の対抗馬はNUMA だと思っていたのでAC
- Re:NUMA (スコア:1)
  
  by bee (10028) on 2007年02月25日 18時07分 (#1116712) ホームページ日記
  
  逆にFreeBSDはNUMAに対応したスケジューラ/メモリアロケータを持っているのでしょうか。
  
  シェア
  
  親コメント
  - Re:NUMA (スコア:4, 参考になる)
    
    by Anonymous Coward on 2007年02月25日 23時28分 (#1116826)
    
    元AC ですが、NUMA 対応は全く話題になっていないですし、対応していないはずです。
    
    AMD64 やPPC がNUMA だと言えばそうなのかもしれませんが、NUMA アーキテクチャはサポートしてないと思います。
    
    いちおう、ですが、今日現在のFreeBSD 6.2-RELEASE-p1 は、そもそもULE が有効になっていません。
    6.2R 上の同一HW でULE を有効にしたSMP Kernel と
    無効にしたもののベンチを採ったところ、全く気にならない程の僅差でULE スケジューラが勝ちました(並列処理数、2,4,8,16,24,32 と試し、その全てでULE の勝ち)。
    
    また、ULE 自体はLinux のスケジューラのパクリといわれていて、実装もソックリです。
    
    http://journal.mycom.co.jp/articles/2005/01/01/ule/ [mycom.co.jp]
    
    シェア
    
    親コメント
    - MYCOMの記事に酷い曲解をするもんですね (スコア:3, 参考になる)
      
      by shojin (28072) on 2007年02月26日 19時27分 (#1117270) 日記
      
      > また、ULE 自体はLinux のスケジューラのパクリといわれていて、実装もソックリです。
      
      件のMYCOMの記事には次のように書いてある。
      | このCPUごとに複数のキューを持つというこの実装のアイディアは、
      | Linux O(1)スケジューラで実現されているものとよく似ている。
      
      つまり、『アイディア』が『似ている』と書いてある。
      実際、Linux Kernelを解説する書籍や黒いFreeBSD本を読んでみると実装が大きく異なるのはわかるだろう。
      O(1)スケジューラーはrunキュー2つで、ULEはrunキュー2つにidleキュー1つとキューが3つある構成。
      このような構造の違いに加え、Linuxの対話的なジョブ判定アルゴリズムを導入したSCHED_COREが最近出来て来たくらいだから、少なくとも対話的なジョブと判定するアルゴリズムはULEとO(1)では異なっている。恐らくはもっと異なっているだろう。
      
      余談だが、FreeBSDのSMP対応の歴史を知りたかったら下記URLのAOSS-2の論文orスライドを読んだら良い。
      どちらもULEの話は載っていないが、FreeBSDのSMP対応がBSD/OSを参考にしたと知るには十分だろう。
      http://www.lemis.com/grog/SMPng/ [lemis.com]
      
      シェア
      
      親コメント
    - - Re:NUMA (スコア:1, おもしろおかしい)
        
        by Anonymous Coward on 2007年02月26日 2時55分 (#1116898)
        
        「俺の主張の根拠はお前が探せ」は通用しませんよ。
        
        シェア
        
        親コメント
お金持ちの人は大変だねえ (スコア:0)

by Anonymous Coward on 2007年02月25日 19時30分 (#1116741)

俺なんてしばらくはせいぜい２コアまでしか縁がなさげ。

で、そのあたりだと以前とどういう差があるんだろ?
- Re:お金持ちの人は大変だねえ (スコア:1, 興味深い)
  
  by Anonymous Coward on 2007年02月25日 20時04分 (#1116756)
  
  高負荷に苦しんでいたサーバーが、転送量増大に苦しむようになる、と思う。自分の周りでは直接関係なさげだから、目に見える違いって、ソレくらいかなぁ。あるいは、サーバープログラミングが富豪的になる、とか？
  
  シェア
  
  親コメント
  - - Re:お金持ちの人は大変だねえ (スコア:1, 興味深い)
      
      by Anonymous Coward on 2007年02月26日 0時50分 (#1116861)
      
      昔はemacsで編集しただけで隣のセクションからキーボードと罵声が飛んできました。
      cgiでP言語起動するなんて言ったら殴られたかもしれない（そもそもp言語いねぇよ）そんな馬鹿なって位のメモリしかなかったんだよな～
      
      今じゃ机の上に2Gバイトの主記憶があるんだものな～、十年一昔なんてレベルじゃねぇやね。
      みんなが富豪になったんじゃなくて単なる帝国マルクじゃねぇのかと、当時の自分に小一時間言われそうな使い方だよね。
      
      シェア
      
      親コメント
- - Re:お金持ちの人は大変だねえ (スコア:3, おもしろおかしい)
    
    by Anonymous Coward on 2007年02月26日 1時45分 (#1116877)
    
    プログラマーの人件費まで一緒に下げるのはやめてください。
    
    シェア
    
    親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

FreeBSD SMPngが完了、性能が劇的に改善 More ログイン

本当に劇的に改善したの？ (スコア:3, 興味深い)

Re:本当に劇的に改善したの？ (スコア:4, 興味深い)

Re:本当に劇的に改善したの？ (スコア:1)

NUMA.≠SMP? (スコア:1)

Re:本当に劇的に改善したの？ (スコア:3, 参考になる)

Re:本当に劇的に改善したの？ (スコア:1, 興味深い)

Re:本当に劇的に改善したの？ (スコア:1, 参考になる)

Re:本当に劇的に改善したの？ (スコア:3, 興味深い)

Re:本当に劇的に改善したの？ (スコア:1)

Re:本当に劇的に改善したの？ (スコア:1, すばらしい洞察)

従来版との比較 (スコア:3, 興味深い)

Re:従来版との比較 (スコア:1)

末恐ろしいぜマルチコア (スコア:2, 興味深い)

Re:末恐ろしいぜマルチコア (スコア:2, 参考になる)

Re:末恐ろしいぜマルチコア (スコア:2, 参考になる)

Re:末恐ろしいぜマルチコア (スコア:0)

Re:末恐ろしいぜマルチコア (スコア:1, 参考になる)

Re:末恐ろしいぜマルチコア (スコア:1)

Re:末恐ろしいぜマルチコア (スコア:1)

Re:末恐ろしいぜマルチコア (スコア:1)

他でも再現したみたい (スコア:2, 参考になる)

Re:他でも再現したみたい (スコア:1)

原因判明 (スコア:2)

素晴らしいことは素晴らしいのですが (スコア:1, 興味深い)

Re:素晴らしいことは素晴らしいのですが (スコア:1)

Re:素晴らしいことは素晴らしいのですが (スコア:0)

Re:素晴らしいことは素晴らしいのですが (スコア:3, 参考になる)

Re:素晴らしいことは素晴らしいのですが (スコア:2, 興味深い)

Re:素晴らしいことは素晴らしいのですが (スコア:3, 参考になる)

Re:素晴らしいことは素晴らしいのですが (スコア:1, 興味深い)

落ち込みは何が原因なんでしょ？ (スコア:1, 興味深い)

Re:落ち込みは何が原因なんでしょ？ (スコア:1)

Re:落ち込みは何が原因なんでしょ？ (スコア:2, 参考になる)

Re:落ち込みは何が原因なんでしょ？ (スコア:1)

Re:落ち込みは何が原因なんでしょ？ (スコア:1)

Re:落ち込みは何が原因なんでしょ？ (スコア:1, 参考になる)

MySQLの実装の差とか (スコア:1)

Re:MySQLの実装の差とか (スコア:2, 興味深い)

Re:MySQLの実装の差とか (スコア:1)

解説記事でたよ〜 (スコア:1, 参考になる)

6.Xとの比較も欲しい (スコア:0)

NUMA (スコア:0)

Re:NUMA (スコア:1)

Re:NUMA (スコア:4, 参考になる)

MYCOMの記事に酷い曲解をするもんですね (スコア:3, 参考になる)

Re:NUMA (スコア:1, おもしろおかしい)

お金持ちの人は大変だねえ (スコア:0)

Re:お金持ちの人は大変だねえ (スコア:1, 興味深い)

Re:お金持ちの人は大変だねえ (スコア:1, 興味深い)

Re:お金持ちの人は大変だねえ (スコア:3, おもしろおかしい)