hylomによる
2009年06月04日 16時45分の掲載
RAIDを信じるな部門より。
RAIDを信じるな部門より。
flutist 曰く、
GPLソフトウェア開発のレポジトリを提供している savannah.gnu.org が先週 (5/28木)、RAID不調によりダウンした。翌金曜日には何事もなかったかのように復帰できたが、その日のうちにまたRAIDが原因でダウン。復旧を試みたところ、結局システムを再インストールせざるを得なくなり、また不調のRAIDからバックアップしていたデータも不完全で、CVS/SVN/Git/Hgの各種レポジトリは4月末のバックアップ・テープか、各プロジェクト管理者の手元のデータから復旧することになったそうだ。savannah側では5月分は失われてしまった、とのこと。そういうわけでCVSもSubversionもgitもサービスが止まっていたが、ついさっき全面復旧した (いきさつは管理者のメール参照)。
ここでお世話になっているプロジェクトは3069件。その中にはもちろんgccやglibcも含まれている。また、たとえば Lilypond は自前サーバーもあるおかげでクラッシュ後も開発版を公開できているが、GSL なんかは直撃を食らった格好だ。
関連ストーリー
ミラーリングはバックアップにはならない 229 コメント
emacsのCVS HEAD (スコア:2, 興味深い)
emacsを毎日のように更新していたのですが、ある日唐突にCVSレポジトリに繋がらなくなり、困ってました。
で、いろんな方法を模索して、gitを使ってみると、ソースは持ってこれるのに、なぜかそれがかなり古い
日付のものだったり(これが4月分からの復旧?)して、何が起こっているのかわからない状況でした。
サーバのほうが壊れてたのか。
Your 金銭的 potential. Our passion - Micro$oft
Tsukitomo(月友)
コメントを書く
レポジトリのコピー (スコア:2, 興味深い)
FreeBSDだとCVSup [cvsup.org]を使ってマスターのレポジトリに同期させたローカルレポジトリを持つことができるので, たとえマスターレポジトリが飛んでも混乱はあるにせよ, それほど深刻なことにはならないのかと思います. こうしたレポジトリ同期サービスをやっているプロジェクトって少ないのでしょうかね?
コメントを書く
Re:レポジトリのコピー (スコア:2, 参考になる)
逆説的には, ツールがどんなに優れていても運用を含めて十分な考慮がなされていなければシステムとしては意味が無い, というのが今回の教訓でしょうか.
コメントを書く
親コメント
分散型と中央集中型 (スコア:2)
サーバが壊れたら、それでおしまい
と言う致命的な欠点がある。もはや、中央集中型を使う利点は、
まったくない
あるとすれば、レガシーに固執している人達の自己満足と怠慢だね。
コメントを書く
親コメント
結局失われたのは一日分だけ (スコア:2, 参考になる)
5月27日のバックアップが正常だったことが判明したので。
http://lists.gnu.org/archive/html/savannah-users/2009-06/msg00027.html [gnu.org]
コメントを書く
1ヶ月無かったことに (スコア:1, おもしろおかしい)
バックアップは複数取るようにしてますが、1ヶ月無かった事になる事態に遭遇したらきっと真っ白になるでしょう。
#もしそうなったら自分探しの旅にでも出ますかね
#旅に出ます。探さないでください。
#
#でも最近はGPSとかで特定される人もいるんでしょうね…
コメントを書く
GNUでもその位の運用なのか… (スコア:1, 興味深い)
うちの会社のシステム運営がいい加減でも、気が向いた時にしかバックアップ
とらなくても、仕方ないよねぇ…(笑)。すみません。定期バックアップの
スケジュールを立てます。
(ストールマンが怒って、GNU RAIDとか作ったりしないかな?(笑))
コメントを書く
Re:GNUでもその位の運用なのか… (スコア:2)
GPLっぽく、ディスクの中身を入手した人に対して要求があれば公開する、ということですね?
コメントを書く
親コメント
RAIDの信頼性 (スコア:1)
つい先日もNTTデータのブログサービスでHDD障害が発生 [slashdot.jp]したりと,RAIDを組んでいるにもかかわらず復旧できないといったことが多くみられますが,
RAIDの信頼性(ストライピングを除いて)はいったいどれくらいなものなのでしょうか?
RAID構成なら復旧できて当たり前なので,こういう「事件」だけが表に出てくるのかもしれませんが….
コメントを書く
Re:RAIDの信頼性 (スコア:3, 参考になる)
個人的な経験の範囲では、RAID 5 は大きくなるとヤバい感じがします。
たとえば 24 個の HDD で組んだ RAID 5 で、HDD が全部同じロットだったばあい、24 個中の 1 個がコケて交換、リビルドしてる間に、残りの 23 個のうちのどれかが死亡、そして RAID 全体が死亡という泣けてくる事態は容易に想像がつきます。ていうか実体験です。へたってきたディスクが 23 個もあって、リビルドみたいな高負荷がかかれば、まぁ 1 個くらい死んでも不思議はない、と思います。
いろんなカラミで RAID 5 にせざるを得なかったのですが、素直にミラーリングとかにしとけばよかったです。
コメントを書く
親コメント
Re:RAIDの信頼性 (スコア:2, 参考になる)
個人でWin2k、シリコンイメージ(ソフトRAID5のやつ)使ってます。
250GB×4の構成で750GB、こんな程度で良かったら参考までに。
1年ぐらい利用していて、ある日、起動時にユーティリティでエラーが上がるようになりました。
なにぶん、個人利用なので常に代わりを用意しているわけではなかったのですが、
・何回かの起動に1度、特定のHDDのエラーが起きる。
・HDDアクセス頻度が普段と違う。
・RAID5は2台壊れたらもうダメぽ。
なので、速攻で買って交換しました。
おかげでエラーも出なくなり、そのHDDが壊れてることが立証できました。
ただ、ユーティリティの助けがあったものの、決定打はHDDアクセス頻度であって、
ある程度の経験が無ければやはりデータを飛ばしていたと思います。
もしサーバ室内のサーバだったら多分気づかなかったでしょう。
RAID5を運用するのだったら、ユーティリティの重要性が高いと思います。
それと、出来る限りミラーリングで・・・かな。
コメントを書く
親コメント
これを機会にサボっていたsubversionのレポジトリをバックアップ (スコア:1)
これを機会に、数ヶ月サボっていたsourceforge.netのsubversionのレポジトリの
バックアップをここ [sourceforge.net]に書いてある方法を参考にして
と取りました。ディレクトリを新しく作っているのはインクリメンタルにバックアップ
してだいじょうぶなのか不安だからです。いまのところコミッタがぼく一人なので、
バックアップ中にコミットが入るおそれはありません。
また、Subversionリポジトリのバックアップ方法いろいろ [hatena.ne.jp]にあるとおり
この方法は「バックアップデータの可搬性に乏しい(アーキテクチャ依存)」そうです。
実際、ぼくの手元のマシンは、Intelではなく、PowerPC(上のDebian GNU/Linux)です。
バックアップデータをローカルでレポジトリとして使えるかどうか試したことがないの
で不安です。
あと、たまに SourceForge, Inc. (LNUX) の株価もチェックして、会社が大丈夫なこと
を確認しています。
みなさんはどんなふうにレポジトリのバックアップを取っていますか?
love && peace && free_software
t-nissie
コメントを書く
Re:ねえ、プロジェクトホスティングサイトはどこがいい? (スコア:3, 参考になる)
使い方にもよるでしょうが、無難に一通りの機能がそろっているSouceForge.JP、多機能な(かつ難解な)SouceForge.net、gitで個人リポジトリを使いたいならgitHub、bazaar使うならLaunchPad、シンプルなのがいいならGoogle Codeというところでしょうか。
コメントを書く
親コメント
まだある(Re:ねえ、プロジェクトホスティングサイトはどこがいい?) (スコア:3, 参考になる)
ほかにも
Microsoftが後援 CodePlex [codeplex.com]
福岡の人が多い codecheck.in [codecheck.in]
設定ファイルなど code repos [coderepos.org]
PHPなら openpear [openpear.org]
があります
コメントを書く
親コメント