サーバのHDDいかれた

真夏のプログラムホラー キャピ(ゝω・)v―☆


他所のサーバの話ですが、
はじまりはWebプログラムの不具合からでした。


最初は普通のよくあるプログラムのミスかなと思ってたんです。

ですが、ソースを見てもおかしい箇所は見当たらない。
不思議に思った私は処理のメインの流れを大雑把に区切って、部分部分で動作テストを行ったのです。

するとなんてことでしょう。
文法的にも、メモリ的に見ても問題無いコードを削除することでプログラムの不具合が解消されたのです。

勿論、その時原因は分かりませんでした。
ですが、とりあえず動作したのでひとまず様子を見ることに。

そして、その翌日―――

また不具合が起こったのです。

そして、またしても全く文法的にもメモリ的にも問題の無いコードを削除することによって不具合が解消されました。

それからというもの、1日ごとにコードを削っていき、
ついにだましだましで運用するには辛いレベルにまで達しました。

さすがにプログラムだけの問題では無いことに気付いた私はサーバのログ情報を片っ端からチェック。

すると、smartdがエラーメッセージを吐いているではありませんか。
smartdとはハードディスクの不具合を点検してくれるツールです。

「これは・・・?」

ハードディスクに異常があるせいで、プログラムの挙動がおかしいとすぐに脳裏によぎりました。

そしてすぐさま、ハードディスクのチェック・修正を行ってくれるコマンド「fsck」を打ったのです。

そして、ハードディスクは修復不能なレベルにまで逝ってしまいましたとさ。

というわけでハードディスクの障害でしたというオチです。
おそらくサーバ内部に熱がこもってしまっていたのかと。

データ自体は別のPCにバックアップ取ってたのでHDDを差し替えて直しましたけど・・・なんでしょうな、このやりきれない感じ。

ソースを順々にチェックしていた時間が無駄になりました。

問題無いコードを削除すれば一時的に直る不具合とかこんなのどうやって未然に防げというのであろうか。
因果関係が意味不明すぎて、ちょっとしたホラー気分。

ともあれ、念のために新品のHDDを持って行った自分グッジョブ。
キャピ(ゝω・)v―☆

大阪の江坂でウェブ制作をしている、インフラもシステムもデザインもディレクションもできるエンジニア。 広く浅く薄っぺらくですが(笑)

Leave a reply:

Your email address will not be published.