火星探査車Spiritの障害の詳細が明らかに 51
片道10分のリモートデバッグ 部門より
higon 曰く、 "
eeTimes「先月に起こった火星探査機のトラブルが明らかに」 より。一月下旬、スピリットはシステムの更新時のプログラム転送中にエラーを起こし、その後通信を絶った。スピリットとの通信を失ったというニュースは深刻に受け止められた。反応がないということは、火星探査機を失った可能性もある。JPLの研究員は地球から何度もリブートコマンド等を送信するが状況は一向に改善しない。再起動後にシステム状態を報告しない探査機に何が起こったのかを知るのは難しいことだった。
解決の糸口となったとは「システムがおかしくなる前に、ファイル転送に失敗していること」であった。メモリアロケーションエラーを起こしているに違いないとある研究者は考えた。対処するための情報はドキュメントに記されていた。結局、火星表面一台取り残されたスピリットを救ったのは、「ファイルシステムをマウントしないで再起動」するコマンドだった。"
詳細はこうだ。RAMディスク上に残ったゴミディレクトリが原因で、OSがメモリアロケーションエラーを起こした。自動でリブートしたはいいが、再起動時ファイルシステムをマウントする段階でメモリを割り当てに失敗し、またリブート、リブートリブート。結果スピリッツは反応を返さなくなった。ただし、探査機はいわゆるセーフモードの状態であり、情報送信しないものの、地球から送られたコマンドは受信していた。つまり、彼らが「マウントなし再起動」を命じるまで、スピリットは一人きりでけなげに命令を実行し、再起動を続けていたのだ。彼らはその後、通信を回復したスピリッツのローレベルコマンドでファイルとディレクトリを削除することで、システムを復旧した。
現在、JPLは念のためにアロケーションエラーハンドラの処理を改善する作業に取り掛かっている。"
日本語の記事のひとつ (スコア:5, 参考になる)
日本語でCMを交えつつ、わかりやすく概略が書かれてると思います:)
# なんで、こっちにもリンクしなかったですか?>>たれ込み人
Re:日本語の記事のひとつ (スコア:2, 参考になる)
たれ込みの人です。
単純に、日本語の記事をチェックしていませんでした。検索しときゃよかったなと焦っているところです。
「RAMディスク」について、
たれ込みの人が、「メモリ上にディスク→RAMディスク」と勝手な発想をしてしまった
ため、そう書きました。フラッシュはROMの一種ですね。
元記事に、前までわからなかったことが突っ込んで書いてあったので、興味深いなと
思い、急いでたれ込みの文を作りました。VxWorks等、衛星のスペックについては既知
のものなのでカットして何が起こったのかだけを書きました。元記事の翻訳ではありませ
ん。ですからこのたれ込みを読んで突っ込んだ内容を知りたくなった人は元記事や関連記事を読んでください。(ですから日本語の記事等をポイントしてくださるのは助かるし、たれ込みを読んだ後、記事を読んだ人がいるのは嬉しいことです。)
#あと「スピリッツ」は誤字で、「スピリット」が正しい。
Re:日本語の記事のひとつ (オフトピック:-1) (スコア:1)
> 単純に、日本語の記事をチェックしていませんでした。
> 検索しときゃよかったなと焦っているところです。
たれ込みするときはいろいろ悩みますからね:)
私もあとで反省すること多々です。
> ですからこのたれ込みを読んで突っ込んだ内容を知りたくなった人は元記事や関連記事を読んでください。(ですから日本語の記事等をポイントしてくださるのは助かるし、たれ込みを読んだ後、記事を読んだ人がいるのは嬉しいことです。)
さらーっと流し読み後に、ツッコミ入れてみたので喜んで頂けてうれしいです。
# スコア5貰えるなら面倒でもIDにしておけばよかった_| ̄|○
Re:日本語の記事のひとつ (オフトピック:-1) (スコア:2)
ACで5をもらって、IDでオフトピをもらうと尚更浮かばれないような 。;0
このコメントも最後の三行の編集中にプレビューするつもりが投稿ボタンを押してげげげとなりました。
改行なしですからですから。焦るとろくなことない。
まてよ…プレビューボタンの隣に投稿ボタンを置くインターフェース設計が悪い。<コラ
#ときどき小市民のち自己虫。
大発見! (スコア:4, おもしろおかしい)
火星人の存在を示す証拠が見つかりました。
Re:大発見! (スコア:1)
+-/�+-/�+-/�
月に続いて火星にも行っていないのか�
火星上でのVxWorksの挙動の詳細が (スコア:4, 興味深い)
確か何処かにいらっしゃったはず…。(失念すまそ)
http://catless.ncl.ac.uk/Risks/19.54.html#subj6
Re:火星上でのVxWorksの挙動の詳細が (スコア:3, 参考になる)
火星でいったい何が起きたのか? [unixuser.org]
(これはスピリットじゃなくて1997のマーズパスファインダーの件ですけどね、念のため。)
えーと (スコア:4, 参考になる)
ファイルシステムにあるファイルの数が増えていくと、その管理用にメモリの使用量が増える。
ファイル数が増えすぎて、メモリが足りなくなって動作不良を起こし、リブート。
リブートしてもファイルシステムを再マウント時に当然またメモリが足りなくなってリブート。
を延々繰り返したという理解でOK?
Oliver氏はRAMディスクと書いているので「何でRAMディスクを作るときに失敗するのよ」と混乱したが、
原文を見るとFlashファイルシステムと書かれていた。
元記事のほうが「詳細」で正確なので混乱された方はそちらを。
しかし、管理できなくなるまでファイルを作れちゃうシステムは
「頑強なシステム」と言い張ることが出来るんだろうか?
Re:えーと (スコア:1, 興味深い)
>ファイルシステムにあるファイルの数が増えていくと、その管理用にメモリの使用量が増える。
>ファイル数が増えすぎて、メモリが足りなくなって動作不良を起こし、リブート。
>リブートしてもファイルシステムを再マウント時に当然またメモリが足りなくなってリブート。
あっていると思います。
>Oliver氏はRAMディスクと書いているので「何でRAMディスクを作るときに失敗するのよ」と混乱したが、
どこに「RAMディスクを作るとき」と書いてありますか?「ファイルシステムをマウント」す>原文を見るとFlashファイルシステムと書かれていた。
る時。マウント時に呼び出されるユーティリティ(コマンドのことか)が、ワーク用にRAM
上でディレクトリ構造を構築する際メモリを使い切ってしまった。のだと解釈しました。
ファイルシステム上に不要なディレクトリが残ったのが予想外だったようで、
Flash/RAMディスク上に配置できるファイルとディレクトリの数に限界がある問題は
打ち上げ前から把握されていたようです。
Re:えーと (スコア:0)
「何でごみが残るの」とか「Flashが問題だったというけど
この話のどこにFlashが出てくるんだ」と謎だらけだったという話。
Re:えーと (スコア:1)
Re:えーと (スコア:0)
# ↓次どうぞ
Re:えーと (スコア:1, おもしろおかしい)
Re:えーと (スコア:0)
# ↓次どうぞ
Re:えーと (スコア:0)
# 時間なのでAC
Re:えーと (スコア:1)
愛です。
----------------------------------------
You can't always get what you want...
Re:えーと (スコア:0)
そんなものは最初からない!!
Re:えーと (スコア:0)
んだ、んだ。
きっと、再起動したら愛がたっぷりに違いねぇだ。
Re:えーと (スコア:0)
>きっと、再起動したら愛がたっぷりに違いねぇだ。
人生はリブートできないアルよ。
そこんとこきびしいアルよ。
# それでもリブートしたい、という人のためにこの本 [amazon.co.jp]をお勧めしよう。
Re:えーと (スコア:1)
きっと、現在の人格をマウントしないで
人生を再起動ってコマンドが必要だと思うけど
ちゃんとあらかじめ準備してある??
#もちろん用意してある。この問題は
#はじめから予想されていたから
#ってことだったらヤだな...
Kiyotan
Re:えーと (スコア:1)
1を聞いて0を知れ!
Re:えーと (スコア:0)
「UNIX で言うところの UFS が足りなくなった」に似た
違和感を感じるのですが、DOS で「FAT が足りない」という
表現はよくあるのでしょうか。
Re:えーと (スコア:1)
Re:えーと (スコア:1)
ただ、ルートディレクトリは極端に少ない(200個ほど)ので、よく問題になってたんではなかったかと。
FAT32 からは、このへんが解決されたと聞いてるんですが、どうなんでしょう?
Re:えーと (スコア:0)
FAT12でもルート以外は拡張できますので、ご安心を。
Re:えーと (スコア:0)
(「FAT」だけでFAT filesystemを指すこともまああるけどさ)。
Re:えーと (スコア:0)
>表現はよくあるのでしょうか。
ないでちゅ、
容量とFATが対応関係になるのが無くなるのであれば
容量がない事を意味します。
#FATって予備にもう1本ありましたよね。使ってなかったと思ったけど
# http://kone.vis.ne.jp/diary/diaryb5.html
#適当にリンクを貼ってみたのでAC
Re:えーと (スコア:0)
Re:えーと (スコア:0)
ディスク管理のためにディスク上に格納されたデータ構造です。
つまらんマジレスなんでAC
ふむふむ (スコア:2, 参考になる)
あとね、これ、Flashメモリの上に有るって言うことは、つまり、FlashメモリのR/W保証回数を考えると、耐用年数はどのくらいなのか。。。。
気になるところでもありますね。
フラッシュの種類次第?(Re:ふむふむ) (スコア:3, 参考になる)
書き込みセクタをその都度ランダムに選んで書き込むそうです。こ
れによって、頻繁に書込や消去とかがあっても全セクタを均等に使
えてメディアの寿命が伸びるそうです。
コンパクトフラッシュなんかは、端から書き込んでいるみたいで、
エラーセクタがあるメディアをチェック付で再フォーマットすると
必ず同じセクタで動きが停滞してしまいます。
(あ、もちろん暫くたってそのセクタを不良ブロックにして先進みますけど)
Re:フラッシュの種類次第?(Re:ふむふむ) (スコア:0)
だからSDに比べてCFは特定部位が死にやすいのではと思う。
特にFATとかだと、同じ部位を管理領域にしてるんじゃないかな?
Re:フラッシュの種類次第?(Re:ふむふむ) (スコア:0)
角度とか。
Re:ふむふむ (スコア:1)
Re:ふむふむ (スコア:1)
それ以前に、砂塵やら放射線やら、劣悪な環境でしょうから、
本体の耐用年数の方が気になります。
# 結構、大丈夫なのかな?
Re:ふむふむ (スコア:2, 参考になる)
後2ヶ月ほど動けるそうな。
〜明日は明日の風が吹く〜
Re:ふむふむ (スコア:0)
Re:ふむふむ (スコア:0)
Re:ふむふむ (スコア:0)
#末期のひまわり5号とか。
#復活したAO-7 [amsat.org]とか(今年11月で30歳かぁ)。
Re:ふむふむ (スコア:1)
しかも、round-trip time が、20分近い(今はどれくらいの距離なのかな?)わけですから、大変ですよね。
TCPによる通信はもちろんですが、sshやtelnetみたいにインタラクティブなセッションでの操作は不可能な距離ですね。
# リモートの Solaris マシンをリブートするつもりが init 5 して電源OFFって泣いたことがあるのでID
トピックとは直接関係ありませんが (スコア:2, 興味深い)
よくわからんのですが (スコア:0)
余計なもの:-1 (スコア:0)
記事の日付(ぉぃ
読めばわかる (スコア:0)
メールが出せん!! (スコア:0)
リスタートしても戻らん。
本当にあった。オフトピなのでAC
Spiritだし (スコア:0)
それはめでたい。
飲もう。
# There are no spirits here from 1969 ....
古すぎて (スコア:1)