パスワードを忘れた? アカウント作成
127212 journal

bugbirdの日記: 所期の通り動かないという怖さ

日記 by bugbird

京葉線の停電事故の顛末は、この問題の重要性への認識の欠如によってもたらされたと言って良いと思う。

今回の事故は、車両側で発生した故障によって饋電の負荷が短絡状態となってしまった変電所で、ブレーカが所期の通り動作せず、ブレーカを含めた変電設備が炎上するという事態に到ったのが、その発端となる。

で、実際のところ、ブレーカは変電所だけでなく車両側にもそれに類するものが設けられているはずで(そのような装置が無いと、最悪の場合車両側が炎上に至る可能性もある)、今回の事故ではそのどちらもが、所期の通り動作していなかったということになる。

そもそもブレーカとは、電力回路の中に『意図的な脆弱性』を作るのが目的の装置であり、これによって設計値を超えた負荷がその回路に発生した場合、いち早く動作することによって回路全体に破壊が及ぶことを防止しようとするものである。それがちゃんと動作しなかったわけだから、もう何が起きても不思議じゃなかったわけであり、変電所が炎上した停電事故だけで済んだのは本当に幸運だったと考えるべきなのだ。

…で、実は「所期の通り動かないという怖さ」は上記の問題に留まるものではない。今回の事故を外見的な事実で追いかけてみれば、

『変電所で(なにか故障があったために)火災事故が発生して停電した』

…と捉える事ができるわけで、実際この錯誤のせいで復旧までに7時間を要してしまうことになるのだ。

まぁ、この錯誤にはやむを得ないところもある。変電所のブレーカと車両側の安全装置が同時に働かなかった… なんてことは通常なら到底考えられないことからだ。しかしながら、その不運をもってしても、この予断によって障害の切り分けに失敗し、適切な障害復帰のチャンスをみすみすと見逃してしまったという事実は重く捉え、再発の防止策を検討するべきなのだ。

障害対応の際に第一に優先しなければならないのは障害の拡大の防止であることは当然だが、それに続く重要な作業が障害原因の特定である。この吟味が不充分なままに復旧作業を急いでしまうと最悪の場合は障害を拡大する事になる。今回はまさにその陥穽に落ちてしまったわけだ。

「(予想|想像)を超えた」ことによって事故は顕在化する。だからこそ、目の前にある現象を冷静に捉え分析して、事故原因の正確な掌握につとめるように努力する事のみが、本質的な障害復旧へつながる唯一の道なのだ。

原因の特定に臨んで「あってはならないこと」すらも「あり得ること」として吟味できること。それこそが適切な障害対応のために必須な要件なのである。

この議論は、bugbird (4706)によって ログインユーザだけとして作成されたが、今となっては 新たにコメントを付けることはできません。
typodupeerror

Stableって古いって意味だっけ? -- Debian初級

読み込み中...