エラー頻発の件、おそらく解決できました

2023/09/07 11:39投稿 (2023/09/07 14:38更新)

昨日のお知らせでサーバー攻撃が原因だとお伝えしましたが、間違いだったようです。

まだ、確定ではないのですが、別の対策を施したところ、エラー頻発がなくなったので、おそらく合っていると思われます。

謎は全て解けた

原因は「サーバーのスワップ領域が溢れていたから」でした。

スワップ領域というのは、メモリーに乗り切らないデータを一旦ディスクに退避させる際に使うディスク領域のことです。

これが日に日に足りなくなっていって昨日は1時間おきくらいに足りなくなってしまっていたからエラーが頻発していたと考えられます。

そこで、スワップ領域を拡張しました。現在はその半分を使用する程度に収まっています。

真実はいつもひとつ

ソフトウェア開発の世界には「推測するな、計測せよ」という言葉があります。

  • エラーの原因を予想して当たることもあるけれど外れることも多いし、予測することで思い込みが強くなって正解からますます遠ざかってしまう
  • だから、推測するのではなく、サーバーの状態を計測して異常値を見つけることが大切だ

という意味です。これを知っていたのですが、いくら計測しても原因がわからず、憶測でサーバー攻撃が原因だと判断してしまいました。

名探偵コナンでいうと、

  • 毛利小五郎は憶測で犯人を決めつける
  • 江戸川コナンは調査・観察をして犯行の証拠を見つける

といった違いがありますよね。

コナン君のようにありたいですが、なかなかに難しいことだなと痛感しました。

ということで、まだ確定ではないのでサーバーの様子をしばらく見守ります。おそらくこれで解決したと思います。

ご心配おかけしてすみませんでした。