快晴
基幹ファイルサーバが死んだ...
最悪の障害
一時間後
原因は何だったのか...
障害発生時、ちょうどシステム工学実験が終わった後の時間で、本館でICE端末をいじっていました。<br>周りにも同級生が結構残って作業していたのですが、みんなばらばらのことをやっていた画面が一斉に凍り付いたのに、端末室は騒然としておりました。<br>再起動しても「ホームディレクトリはhogehogeに設定されていますが、ホームディレクトリが見つかりません、/をホームとして起動しますか?」など……初めて見ました。<br><br>数分してから、一応、と1F事務室に報告に言ったら「あ、本当だ落ちてますね……」と言われて、(あれ?すぐには気づかないモノなのか……)などと思ったりもしたのですが。<br>明日がちょうど実験レポートの締め切りなので、「復旧しなかったらどうしよう!」とか焦ってる人もいましたが、復旧したようで何よりです。<br>原因がわからないなんてなんかちょっと怖いのですが……本当にお疲れ様です。
いやはや、ご迷惑をお掛けしました。<br>西では障害直後に気付いたんですが、サーバ群は本館側なので手も足も出せず...<br>結局よく分からず(?) file server と mail server を再起動して復旧したようです。一時間以上障害が続いたというのも情けない orz...
私も(大学外の)ML宛に送ったはずのメールが自分に返ってこないので「あれぇ?」と頭を抱えてたら、<br>IMCのページに障害情報が上がってきたので、とりあえず納得はしましたが、<br>homeが死んでしまうと何もできないというのは、シンクライアントの弱点ですね…。<br><br>結局メールはその時間に送信できていて、サーバ復帰後に自分にも遅延配信されました^^;;
確かに Thin client の弱点と言えるかもしれませんが、その間は他のサービス(mail server とか web server とか)も全滅しちゃいました。ファイルサーバが落ちると影響範囲が広いですから、一番落ちてはならないんですけどね。<br>障害のあった間に smtp server が受け取ったメールのうち、.forward 等が読めなくて正しく転送されなかったメールがあるんじゃないか心配です...
障害発生時、ちょうどシステム工学実験が終わった後の時間で、本館でICE端末をいじっていました。<br>周りにも同級生が結構残って作業していたのですが、みんなばらばらのことをやっていた画面が一斉に凍り付いたのに、端末室は騒然としておりました。<br>再起動しても「ホームディレクトリはhogehogeに設定されていますが、ホームディレクトリが見つかりません、/をホームとして起動しますか?」など……初めて見ました。<br><br>数分してから、一応、と1F事務室に報告に言ったら「あ、本当だ落ちてますね……」と言われて、(あれ?すぐには気づかないモノなのか……)などと思ったりもしたのですが。<br>明日がちょうど実験レポートの締め切りなので、「復旧しなかったらどうしよう!」とか焦ってる人もいましたが、復旧したようで何よりです。<br>原因がわからないなんてなんかちょっと怖いのですが……本当にお疲れ様です。
いやはや、ご迷惑をお掛けしました。<br>西では障害直後に気付いたんですが、サーバ群は本館側なので手も足も出せず...<br>結局よく分からず(?) file server と mail server を再起動して復旧したようです。一時間以上障害が続いたというのも情けない orz...
私も(大学外の)ML宛に送ったはずのメールが自分に返ってこないので「あれぇ?」と頭を抱えてたら、<br>IMCのページに障害情報が上がってきたので、とりあえず納得はしましたが、<br>homeが死んでしまうと何もできないというのは、シンクライアントの弱点ですね…。<br><br>結局メールはその時間に送信できていて、サーバ復帰後に自分にも遅延配信されました^^;;
確かに Thin client の弱点と言えるかもしれませんが、その間は他のサービス(mail server とか web server とか)も全滅しちゃいました。ファイルサーバが落ちると影響範囲が広いですから、一番落ちてはならないんですけどね。<br>障害のあった間に smtp server が受け取ったメールのうち、.forward 等が読めなくて正しく転送されなかったメールがあるんじゃないか心配です...