パスワードを忘れた? アカウント作成
4187 story

BitKeeperのサーバ停止 33

ストーリー by Oliver
やっぱSingle-Point-of-Failure 部門より

yosshy曰く、"Linux カーネルの開発に使用されている[編注:BitKeeperのサーバである]bkbitsが数時間前に停電で停止したらしく、現在復旧作業中との事。UPS を繋いでおく、ジャーナリングファイルシステムを用いるなど、色々とサービス停止時間を短くする施策はあったと思うのだが、今となっては後のまつりである。
賢明な /.er の諸兄はどのような障害対策を行っておられるだろうか。何度も議論されてきた事ではあろうが、技術の進歩もあるので、これを機に改めて聞いてみたい。"

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 復旧の予行演習 (スコア:3, 参考になる)

    by saitoh (10803) on 2002年10月25日 11時03分 (#189464)
    新しいOSを入れたときは、マシン内に有用なデータが貯まらない うちに、バックアップとリストアの練習をしておく。
    バックアップを取っている人は多いけど、特にシステム領域の リストア手順知らない人がおおい。そういうバックアップは 無意味。 マシンがクラッシュしてオンラインドキュメントが読めない状態で、復旧手順が 頭に入ってないと悲惨。
    • by annoymouse coward (11178) on 2002年10月25日 13時06分 (#189534) 日記
      HDDをRAIDにするだけで安心している人多いですよね。

      いかに復旧を早くやるかが大事であって、
      今回のタレコミも復旧に手間取っているのが問題なのだと思います。
      親コメント
      • by doripush (653) on 2002年10月25日 22時54分 (#189757)
        というよりRAIDのフォルトトレーランスと、バックアップは
        代替関係にあるのではなく補完関係にあることを理解すること
        から始めないと駄目なのでしょうね。

        ファイアウォールがあれば、セキュリティホールのあるソフトウェア
        を使っていても大丈夫と考えているようなもんだ。
        親コメント
        • by ftw (7254) on 2002年10月25日 23時09分 (#189766)
          細かいですがRAIDは名の通り冗長なだけで
          フォルトトレランスとはちょっと違う気がします。
          少なくとも RAIDカードの予備をもっておかないと
          Availabilityは低下するはずですし。

          >バックアップは
          >代替関係にあるのではなく補完関係にあることを理解すること
          >から始めないと駄目なのでしょうね。

          おっしゃるとおりそのものの本質を理解しないと
          結局データもお金ももどってこないってことになりそうですね。
          親コメント
    • by G7 (3009) on 2002年10月26日 16時03分 (#190017)
      下でMacOSの良い話も出ていますが、
      こういう復旧などの作業しやすさを出来るだけ高める、ってことを
      OSを設計する段階から考慮して設計して欲しいな、とは思いますね。
      実用(?)OSなら尚更のこと。

      Plan9(とかいうんだっけ?)みたいに、ディレクトリツリー構造自体が「仮想化」されているOSなら、
      書き換えてしまったらバックアップしない限り復旧が難しい、などという下等な悩みは
      かなり軽減されるのかな?と、素人的理解で思ったりします。

      #あとはVMWareみたいなやりかたっすかね。というか広い意味でのディスク書き込みのジャーナリングつーかバージョニング。
      親コメント
    • by Anonymous Coward
      MacOS 9.xまでは、システムフォルダを丸ごとMOや外付けHDにでもコピーしておいて、非常時にはそのMOやHDから起動すればよかったので楽チンでした。もちろん、WindowsをFDで起動したときのような制限なんてものはありません。元のシステムが壊れていても、ディスクが生きているならディスク上のアプリケーションも使えます。

      これはApple ROM + システムフォ
      • by hitopin (2384) on 2002年10月25日 14時06分 (#189556)
        単純に考えると、別パーティションのMac OS 9以前からは、OS Xのパーティションはほぼ丸見えなのだから、そっちからはできそうなんですが、OS X上では、アクセス権の問題やらなにやらで、めんどくさいんじゃないでしょうか。(ユーザーのアカウントもアカウント名ではなくIDつけて管理してるって言うし)
        私はどちらの方法も、リスキーな感じがして試したことがないです。(だからJaguerへのアップデートもクリーンインストールしなかった。)
        親コメント
      • by Anonymous Coward
        > Apple ROM + システムフォルダ = Macのシステム
        これって9.xまではそんな気がするけど、darwin
        になってもそんな独自の仕組みを維持しているのだろうか?
  • 我が家のWindows管理術 (スコア:2, おもしろおかしい)

    by Anonymous Coward on 2002年10月25日 7時21分 (#189375)
    パッケージ版以外でインストールしたソフトを暗記しておく。

    #OS再インストールかよっ
    • by nekurai (6253) on 2002年10月25日 7時34分 (#189380) 日記

      インストールする順序(アンインストールする順序)も覚えておかないとDLLがぶつかり合ってすぐにHDDの再formatをする羽目に・・・ 特にプリインストールのWindowsに対してアンインストールする順序は大事だったりする。

      # 特に 95 / 98 系。Me は知らん :-)

      親コメント
      • Re:Windowsの場合 (スコア:2, おもしろおかしい)

        by ted21century (11877) on 2002年10月25日 11時19分 (#189474)
        >Me は知らん

        いやぁ,MeはWin98 Third Editionと見なしているので同じでしょう。
        親コメント
        • Re:Windowsの場合 (スコア:2, おもしろおかしい)

          by seldon (5637) on 2002年10月25日 16時01分 (#189592)
          Meは、Win98 Minor change EditionとかWin98 More heavy Editionとか・・・
          親コメント
        • by pantora (11989) on 2002年10月25日 14時10分 (#189560)
          >いやぁ,MeはWin98 Third Editionと
          >見なしているので同じでしょう。

          Win98 Millennium Editionなんでは?

          システム管理方法ですがWin98 SEよりもクソかったるくなっています。
          メーカ品だとリカバリディスクがあるから簡単なのかな。
          --
          PCにECC Registeredメモリの利用を推奨します。
          親コメント
      • ファイルサーバで使っているデータ保存用ディスクは二重化したいです。結構切実に。

        でも、OSの入ってるドライブはあんまり気にしてません。
        むしろたまには壊れてくれた方がディスクとOSのリプレースができて
        有益かも、なんて罰当たりなことを言ってみるテスト。
        親コメント
      • by Anonymous Coward
        思い出します。NT4の時、
        素のインストールCDから何かインストールする場合にはSP当て直しとか、
        Option PackとかIEのインストールする順序とかいろいろ問題があったこと。
        出したソフトがそういう順序の狂ったシステム上で動かなくて、
        「頼むから別のPCに今から言う通りの順番でインストールして動かしてみてくれ。」
        っていうのを何度となくやった。
  • by seldon (5637) on 2002年10月25日 16時12分 (#189595)
    メーカ製のRAID製品の場合、工場出荷時に搭載されているHDDはほとんどの場合同一ロットです。
    なので、ロットによる障害があった場合はみんな一斉に壊れます(^^;
    実際、そういう目にあったという話は数人のCEさんに聞きました。
    HDDが一台飛んだので、新しいディスクでsync中に別のHDDが死んだとかいう悲惨な場合もあったらしい。
    sync中はアクセスがかなり多くなるので、死にかけたHDDにとどめを刺しちゃったようです(^^;
    同一容量のHDDを使った製品を時期をずらして購入して、HDDを入れ替えるとかすればちょっとは安心かもしれません。

    # まぁ、死ぬ時は死ぬんだが :-)

    • 私、そのディスク交換中の笑えないトラブルの話、聞いたことあるんですけど?(苦笑)
      (しかも、以前の職場の同僚から聞いた(爆死))

      というか、それってAS/400じゃないんですか?(^^;

      さらに言えば、ロードソースがミラーリングの相手を含めて、同時に亡くなったのも経験あります(苦笑)
      (何のためのバックアップなんだか....)
      --


      (_ _)ZZZZzzzzz...... I'm sleepy
      親コメント
  • by brake-handle (5065) on 2002年10月25日 17時10分 (#189614)

    障害復旧といってもいろいろなレベルでの障害を考えなければキチンとした対策にはなりません。BitKeeperのようなバージョン管理システムの場合、たとえ計算機のhardwareやOSに問題がなくても、誤操作によりdatabaseがめちゃくちゃ(databaseそのものの破壊、あるいは誤ったfileの変更)になってしまう恐れがあります。

    そういう意味ではRAIDだけじゃなくて、きちんと磁気tapeなども併用しておくべきでしょうね。

    # FreeBSDでは少なくとも1回cvs repoが誤ったimportで使いものにならなくなったことがある

  • 障害が発生する前に 色々とチェックリストを
    作ったりして、それに応じた対応をするでしょうが
    もし、ダウンしている時間を短くする手法を
    投稿主が尋ねているのであれば
    「予めダウンの復旧対策を手順書にして事前確認する事が
    商用ではやる事もあります。」というのが回答かな

    でも、趣味のサーバは、例えば復旧対策として予備を
    用意してあってもついつい他に流用するのでは
    (本音)
  • by pantora (11989) on 2002年10月25日 7時30分 (#189379)
    Debian GNU/Linuxで運用しているマシンですけど。
    まず、全パーティションext3fsで
    40GBのRAID1 ミラーリング構成
    定期的バックアップもかかさずに。

    自分でコンパイルかける時は、
    debにしてからインストールするので
    もしもの場合、復旧時間は少ない。

    電気代かかるのでUPSはないけども。

    # 部屋のマシンですよ。
    --
    PCにECC Registeredメモリの利用を推奨します。
  • この問題 [srad.jp]で BitKeeper を使うのやめた、って話題なのかと思ってしまいました。

    #あるいはこのまま復旧しなかったりなんかしちゃったりして?
  • by Anonymous Coward on 2002年10月25日 9時04分 (#189400)
    だいぶ前からUPSとディスクの二重化してます。
    作業中にディスクが飛んで泣きながら復旧した経緯があるので(T-T)
    でも、買った当時はUPS高かったので...お財布が~

    そういえば、会社の作業用マシンとかをUPSorディスク二重化出来てる
    裕福な会社ってどれぐらいあるんでしょう?(^^;;
    まぁ~今の会社はCVS使ってるから最悪ソースは飛ばないんですけどねぇ(笑)
    • > CVS使ってるから最悪ソースは飛ばない
      リポジトリがぶっ飛ぶ罠

      いや。先日、バックアップジョブが走ってない事に気が付いて青くなったので。。。
      # /etc も突っ込んであるけど、これって復帰できるものなのだろうか。。。 ←やった事ない人

      しかし、個人でUPSはうらやましい。。。
      --
      wild wild computing
      親コメント
      • > CVS使ってるから最悪ソースは飛ばない
        >>リポジトリがぶっ飛ぶ罠

        ははは(^^;;アセ
        それがあるので職場のCVSサーバは(RAIDでは無い)ソフトバックアップで三重化&何世代か残してます。
        一応最悪数分前までは戻れる状態。

        >しかし、個人でUPSはうらやましい。。。

        私が4年
    • バイト先でバックアップのためのディスク領域が無くて困ったことはあります。
      # というかみんなバックアップしてない…。

      学校の卒論で使ってる作業用マシンはなぜかRAID1(SCSI)です。
      かつて何かのサーバに使っていたマシンだった模様。

      家のファイルサーバはSoftWare RAID5(IDE)です。快適。

      # RAID0 が AID なら SCSI RAID は RAD なのでAC
    • > そういえば、会社の作業用マシンとかをUPSorディスク二重化出来てる
      > 裕福な会社ってどれぐらいあるんでしょう?(^^;;
      会社の作業マシンは8割方UPS実装されてます。
      #ノートってオチなんですけどね。
      一番重要なサーバー類がUPSもないし二重化もされてなかったりする。
  • by Anonymous Coward on 2002年10月25日 21時27分 (#189718)
    http://www.bitkeeper.com/Sales.BitKeeper.html
    を見ると。BitKeeperにしておけばこのような時でも安心で、
    BitKeeperを使うことこそが対策と言っとるように見えます。

    #リポジトリ一個なんてoldtypeだね!
typodupeerror

あつくて寝られない時はhackしろ! 386BSD(98)はそうやってつくられましたよ? -- あるハッカー

読み込み中...