at+link プレミアムサポート 標準手順書 (1/3)

at+link プレミアムサポート 標準手順書 (1/3)
お客さま情報 (おわかりになる部分をご記入ください)
ユーザコード
XXXXX
記入日
20 X X 年 XX 月 XX 日
お客さま名
○○ 株式会社
連絡先 E-Mail
[email protected]
ご担当者名
○○ ○○
通知先 E-Mail
[email protected]
サーバ IP
192.168.10.XXX
ホスト名
db.example.jp
電話番号
03-5785-XXXX
電話対応時間
平日 9:30 ~ 18:00
様
サービス内容(どのようなサービスを行っていますか)
例:データベースを利用した検索サイト
障害対応手順書
対象サービス
PING, ALIVE 障害検出時
HTTP, HTTPS 障害検出時
POP 障害検出時
SMTP 障害検出時
対応手順・確認手順
(1) PING によるサーバへの接続を確認
(2) サーバが停止している場合はデータセンター内で確認・電源再投入
などの復帰作業
(1) ps コマンドで httpd プロセスが動作しているか確認
(2) 動作していない・応答していない場合 httpd プロセスの再起動を実施
/etc/rc.d/init.d/httpd stop
/etc/rc.d/init.d/httpd start
(3) ps コマンドで httpd プロセスの起動を確認
(4) その他のトラブルが発生している場合、お客さまに状況を通知
(1) サーバ内から telnet localhost 110 コマンドを実行
応答しない場合は (2) へ進む
応答する場合は確認状況をお客様へ通知
(2) xinetd の再起動を行い再度確認
/etc/rc.d/init.d/xinetd stop
/etc/rc.d/init.d/xinetd start
(3) 接続できない場合やその他のトラブルが発生している場合は、
お客様へ状況を通知
(1) サーバ内から telnet localhost 25 コマンドを実行
応答しない場合は (2) へ進む
応答する場合は確認状況をお客様へ通知
(2) SMTP プロセスが稼働しているかどうか確認
(3) 停止している (応答しない) 場合は再起動コマンドを実施
/etc/rc.d/init.d/sendmail stop
/etc/rc.d/init.d/sendmail start
(4) ps コマンドで sendmail プロセスの起動を確認
telnet localhost 25 でポート応答の確認
(5) 接続できない場合やその他のトラブルが発生している場合は、
お客様へ状況を通知
at+link プレミアムサポート 標準手順書 (2/3)
対象サービス
DNS 障害検出時
(1)
(2)
FTP 障害検出時
(3)
(1)
(2)
(4)
SSH 障害検出時
(1)
(2)
(3)
TELNET 障害検出時
(1)
(2)
(3)
PostgreSQL 障害検出時
(1)
(2)
(3)
対応手順・確認手順
サーバ内にて「dig @127.0.0.1 -x 127.0.0.1 +norec」コマンドを実行し、
名前解決ができるか確認
名前解決ができない場合は (2) へ進む
名前解決ができる場合は確認状況をお客様へ通知
DNS サーバが at+link 内にある場合は、サーバ内で named が稼働し
ているかや、ZONE ファイルの記述に問題がないかどうか確認し
お客様へ通知
at+link 外の DNS サーバである場合、お客様に状況確認を依頼
ftp localhost コマンドを実行
応答しない場合は (2) へ進む
応答する場合は確認状況をお客様へ通知
xinetd の再起動を行い再度確認
/etc/rc.d/init.d/xinetd stop
/etc/rc.d/init.d/xinetd start
応答しない (接続できない) 場合はログ情報 ( /var/log/messages )
を確認し、お客様へ状況を通知
ssh localhost コマンドを実行
応答しない場合は (2) へ進む
応答する場合は確認状況をお客様へ通知
xinetd または sshd の再起動を行い再度確認
[xinetd]
/etc/rc.d/init.d/xinetd stop
/etc/rc.d/init.d/xinetd start
[sshd]
/etc/rc.d/init.d/sshd stop
/etc/rc.d/init.d/sshd start
接続できない場合はログ情報 ( /var/log/messages ) を確認し、
お客様へ状況を通知
telnet localhost コマンドを実行
応答しない場合は (2) へ進む
応答する場合は確認状況をお客様へ通知
xinetd の再起動を行い再度確認
/etc/rc.d/init.d/xinetd stop
/etc/rc.d/init.d/xinetd start
応答しない (接続できない) 場合はログ情報 ( /var/log/messages ) を確
認し、お客様へ状況を通知
ps コマンドで postmaster プロセスが動作しているか確認
停止している場合は (2) へ進む
動作している場合は確認状況をお客様へ通知
起動コマンドを実行
※ 起動指定されているコマンドを実行
ps コマンドで postmaster プロセスの動作を確認
at+link プレミアムサポート 標準手順書 (3/3)
対象サービス
MySQL 障害検出時
(2)
(2)
CPU 障害検出時
(3)
(1)
(2)
対応手順・確認手順
ps コマンドで mysqld プロセスが動作しているか確認
停止している場合は (2) へ進む
動作している場合は確認状況をお客様へ通知
起動コマンドを実行
※ 起動指定されているコマンドを実行
ps コマンドで mysqld プロセスの動作を確認
top コマンドにて状況を確認
top コマンドの実行結果を添付しお客様へ通知
プロセス再起動等が必要であれば指示をいただく
df コマンドにてディスク使用率の確認
df コマンドの実行結果を添付しお客様へ通知
使用率の高いデータなど削除が必要であれば指示をいただく
DISK 障害検出時
(1)
(2)
(3)
SWAP 障害検出時
(1) free コマンドの実行や top コマンドの実行によるリソース確認
(2) 各コマンドの実行結果を添付しお客様へ通知
プロセス再起動等が必要であれば指示をいただく
OpenRelay 障害検出時
(1) 外部からメールの不正中継がされていないかメールログ
( /var/log/maillog ) から確認
(2) メールソフトよりメールの送信テストを実施
(3) お客様へ対応内容・状況を通知
別途確認・対応が必要 (標準仕様ではない場合など) であれば予め
指示をいただく
(1) ps コマンドで crond プロセスが動作しているか確認
停止している場合は (2) へ進む
動作している場合は確認状況をお客様へ通知
(2) 起動コマンドを実行
/etc/rc.d/init.d/crond start
(3) ps コマンドで crond プロセスの動作を確認
CRON 障害検出時
追加監視項目 ( オプション ) 対応手順書
対象サービス
Traffic (帯域) 障害検出時
HTTP_String 障害検出時
LOG 障害検出時
※
(1)
(2)
(3)
(1)
(2)
(3)
(1)
(2)
(3)
(4)
対応手順・確認手順
契約帯域の限界に達していないか確認
帯域の要因となるプロセスを可能な限り確認
お客さまに帯域状況・プロセス状況を通知
ブラウザにて指定 URL の文字列を再確認
文字列の出力元(例:データベース)のチェック
ウェブサーバの状況・出力元の状況を通知
指定のログを確認
指定された手順(例:データベースの再起動)にて復旧作業
指定された手順(例:データベースへの接続)にて確認作業
お客さまに対応内容を通知
その他オプション項目の【 URL 監視 】【 ファイル存在監視 】【 ロードモジュール監視 】
【 オリジナルスクリプトによる監視 】【イベント処理 】につきましては、対応内容を予めご指示ください。