2012年4月1日日曜日

サーバ故障と「Connection Error: Too Many Connections」エラーおよびMySQLテーブル破損について: 小粋空間


「小粋空間」で利用しているサーバが3月3日の2時頃から突然CGIにアクセスできなくなるという事象が発生し、本日ようやく回復しました。

ページの表示は通常とおり行えていたので、検索経由できた人には特に支障はなかったと思いますが、すべてのCGIが利用できなくなっていたため、コメント投稿やサイト内検索などは利用できなくなっていました。ご迷惑おかけしました。なおコメントスパムが相変わらず激しいため、コメント投稿のみ3月7日現在も停止しています。

以下、故障から回復までの顛末を備忘録で記しておきます。

1.発生した事象1

2月27日~29日にかけてサーバ障害でアクセスできない事象が何回か発生しました。

このときは障害発生中はCGIに一時的にアクセスできなくなっていましたが、回復後はアクセス可能でした。

2.発生した事象2

何回か発生した障害および障害回復のあと、いつものようにMTの管理画面にアクセスしようとすると、別の画面に移動するたびに毎回サインイン画面が表示されてしまうという事象が発生しました。


デジタル証明書を取得する方法について説明します。

一番困ったのは一覧画面の表示です。Ajaxで一覧を表示する直前で毎回この事象が発生するようになったため、一覧画面を参照することができなくなりました。

とりあえず新規投稿は行えたので、そのような状態で2日ほどエントリーを投稿した記憶があります。

ちなみにブラウザのキャッシュやブラウザ自体を変更しても事象は変わりませんでした。

3.発生した事象3

3月3日、CGI(MTの管理画面)にアクセスすると、2項の事象が何回か続いたあと「Connection error: Too many connections」というエラーに変わりました。

ネットで調べたところ、これはMySQLのエラーで、DBコネクションの利用数が多すぎるときに発生するようです。

対処方法は掲載されていたのですが、MySQLを操作する権限がないため、とりあえずサポートにメールして連絡を待つことにしました。

故障発生が金曜日の夜でサポート対応外だったのが痛かったです。

4.ロードアベレージとメモリ

サーバで提供されているモニタリングツールによる、故障発生時点のデータです。上段がロードアベレージ、中段がトラヒック、下段が物理メモリです。


なぜあなたはmotavational speekersを求めている

5.回復

サポート担当にてプログラムの起動数制限の解除および、データベースサーバの再起動を行ってもらうことで18:00頃に回復しました。

あとで気がついたのですが、データベースサーバの再起動だけはコントロールパネルから行えるようです。

ところがこのあと、まだ完全に回復していないことに気がつきます。

6.発生した事象4

MTの管理画面にアクセスしようとすると、別の画面に移動するたびに毎回サインイン画面が表示されてしまうという事象がふたたび発生しました。

MTのセッションテーブルが怪しいと思い、phpMyAdminで参照しようとすると、次のような「Table '/xxxxxxx/mt_session' is marked as crashed and should be repaired」というエラーが発生していることが判明しました。このエラーは要するに、mt_sessionのテーブルが壊れたみたいです。「表示」タブもクリックできない状態です。

壊れたテーブルを修復するには、


湿度チャンバーのテーブルトップ
REPAIR TABLE tableName;

を実行すればいいみたいですが、利用しているサーバではターミナルから実行できないので、調べたところ、phpMyAdminで修復できることを知りました。

修復したいテーブルをチェックして、プルダウンメニューで「テーブルを修復する」を選択すれば修復が実行されます。

下は修復を実行したところです。

最後に「OK」が表示されました。

これでセッションテーブルが正常に表示されました。

このあと管理画面にアクセスしたところ、サインイン画面が毎回表示されなくなり、完全に回復したのでこのエントリーを投稿しました。←いまここ

DBエラーはセッションテーブルの故障が原因のようにも思われますが、そもそものセッションテーブルが壊れた原因は分かりません。同じような事象に遭遇した場合の参考になれば幸いです。


7.参考サイト

参考サイトは下記です。ありがとうございました。

8.その他

故障中もエントリーを書き溜めたいたので、回復後に遡ってまとめて投稿しようと思っていましたが、故障した日が分かりにくくなってしまうので、投稿できなかった日の分は先送りにして投稿したいと思います。



These are our most popular posts:

ORACLE障害回復手順

回復処理の際に、障害個所を探し当てるために以下の手順を実行する。 以下の手順を 踏まなければ、正確な障害個所を把握することはできない! ① アラート・ファイルを確認 する。 ORACLEデータベースに何か障害が発生した場合は、まずアラート・ファイルの ... read more

【何か変?】(とりあえず100人+いわし) 障害の回復(ユー.. - 人力検索 ...

2006年1月17日 ... 【何か変?】(とりあえず100人+いわし) 障害の回復(ユーザー)とTIIDA(スポンサー) さぁ、大事なのはどっち? <参考> : hatena.ne.jp/maintenance : i. hatena.ne.jp/idea/8063 .. read more

情報システムの障害回復計画って何?

2005年9月17日 ... 情報システムの障害回復計画って何ですか 重要な観点は以下のどれを保証するかの 問題がありました? (1)組織や業務の変更が回復計画に反映される (2)システムへの 変更が生産に移る前に入念に試験される. read more

摂食障害の基本知識 経験者の視点で語り合いました - 摂食障害回復 ...

摂食障害からの回復とは? いづ : では最後に、自分にとっての回復とは何か、教えて いただけますか。 いずみ : 今までは、何かあると食べるとか体型とつながってた。回復し ても嬉しいことも悲しいこともあって…摂食じゃない人もそうじゃない?思考パターンは ... read more

Related Posts



0 コメント:

コメントを投稿