Adaptec RAID ソリューションのメインテナンスベストプラクティス

Adaptec RAID ソリューションのメインテナンスベストプラクティス
メモ: 本書は、Adaptec RAID システムの日常のメインテナンスにおけるベストプラクティスについて考察を提供するも
のです。これらのメインテナンスのベストプラクティスは、全ての Adaptec RAID のカスタマーが、データロスなく、デー
タの整合性を維持し、ダウン時間を最小にするのに役立ちます。これらのプラクティスを使用することで、カスタマー
がデータの整合性を維持し、ダウン時間のコストを最小にするよることが可能になります。
RAID の利点と制約の両方を理解することが重要です。多くの RAID のユーザは、RAID にすればデータは絶対に壊
れないという誤った共通認識のために、メンテナンスやバックアップに無頓着な傾向があります。
RAID は、最も広く使用されているデータ保護の方法で、多くの会社がハードディスク故障からデータを保護するため
に、様々な RAID レベルが提供する冗長性に依存しています。ハードディスク容量の累乗的な増加や、信頼性の低
いドライブの使用が増えてきているために、RAID によるデータ保護能力へは、ますます困難さが増してきています。
RAID は、ウィルスの攻撃、人的エラー、データ削除、自然または自然以外の災害に対してデータを保護することが
できません。RAID は、定義しているハードディスク冗長性(例えば RAID-1、RAID-10、RAID-5 ではハードディスク 1 台
の故障、RAID-6 ではハードディスク 2 台の故障など)を超えてデータ保護することはできません。アダプテックのテク
ニカルサポートでは、アレイが長い間デグレードの状態にあり、最終的に別のハードディスクが故障したときにデータ
ロスが発生したようなケースをしばしば見ています。最もよい RAID コントローラでさえ、このような状況では役に立ち
ません。最適な時期のメインテナンスに加え、定期的なバックアップがデータ操作時の最も重要なプラクティスの一
つとして残されています。
RAID における最新の大容量ハードディスクとディスクの品質問題の影響
最新のディスクアーキテクチャは、その他のコンピュータ関連のテクノロジと同様に発展し続けています。ハードディ
スクは、RAID が最初に導入された時と比べて容量が数桁大きくなっています。ハードディスク容量が大きくなるにつ
れ、その信頼性は改善されず、さらに重大なことには、大容量のメディアでドライブ毎の推定ビットエラーが比例的に
増えています。大容量ディスク、向上しない信頼性、大規模メディアで増えるビットエラーといった、これらの 3 要素
全てが、データを保護する RAID の能力にとって重大な問題になっています。低コストの SATA ハードディスク(デスク
トップ版のハードディスク)が負荷の大きなアプリケーションに採用された場合に、データ損失のリスクはさらに倍増し
ます。
ディスク容量が実際に増大しているなかで、ハードディスクメディア不良とその他のドライブの品質問題は、時間と共
に着実に改善しています。しかし、ハードディスクが完全に故障と無縁になることは考えられません。さらに、ハード
ディスク上の通常の消耗は、メディアの不良、共に「ミディアムエラーカウント(grown defects)」の増加の原因となりま
す。不良を含むデータブロックは、使用できなくなり、ハードディスクの別の場所に「再配置」する必要があります。も
し通常のライトオペレーション中に不良ブロックにあたると、コントローラは、ブロックが不良だとマークし、そのブロッ
クをハードディスクの NVRAM にある「ミディアムエラーリスト」に追加します。そのライトオペレーションは、再配置さ
れた場所にデータが適切に書き込まれるまで完了しません。通常のリードオペレーション中にバッドブロックにあたる
と、コントローラがパリティオペレーションからなくなったデータを再構築し、新しい場所にデータを再配置します。
RAID コントローラが RAID ボリューム上のドライブで不良ブロックにあたり、同じデータストライプの別のハードディス
クドライブ上でさらに不良ブロックにあたると、二重障害(「バッドストライプ」)とよばれる状況が発生します。この二重
故障のシナリオは、不十分なパリティ情報をもつコントローラにデータストライプを再構築させる、デグレード下アレイ
の再構築中にも起きる可能性があります。ストライプがユーザデータエリアにあると仮定すると、ストライプ中のデー
タ損失する再構築失敗という結果になります。
ページ | 1
ドライブ容量が小さかった以前には、小さなアレイは一般的に大容量のアレイよりメディアエラーが少ない為に、この
様な問題は発生する可能性はあまりありませんでした。ミディアムエラーは、ビット数 y 毎に x 倍の不良があると定
義されます。そのため、容量の大きなドライブは、大容量のビット数を含み、ディスクが高密度で書き込まれるため、
不良が多い傾向にあります。今日、ハードディスク容量は増大し、ハードディスクの寿命を超えて 1 個以上のメディ
ア不良が発生する危険性が増えています。さらに、大容量のアレイは、小規模のアレイより再構築に長い時間がか
かり、そのためアレイに冗長性がない時間が増えてしまいます。
RAID 6 に必要なものは?
RAID 5 構築では、ハードディスク 1 台故障を保護するシングルパリティを使用します。ハードディスク 1 台の故障を
問題としています。伝統的なシングルパリティの RAID では、故障イベント 1 つに対してのみ適切な保護を提供しま
す。他のディスク故障や、不正なメディアエラーが再構築の進行中に発生しないことが前提になります。通常の運用
では、回復不能なエラーがあり、エラーイベントがリードエラーなら、パリティからのデータ再作成は殆ど即時であり、
アレイはオンラインのままです。しかしながら、RAID 5 グループ内のハードディスクが故障して、その全てのデータの
再構築が必要な場合、スペアディスク上にデータが再構築されるまで、アレイは脆弱なデグレードモード(パリティ保
護がない)に留まります。高密度または遅いディスクでは、それに長い時間がかかる可能性があります。
デュアルパリティ構成の RAID 6 は、同じ RAID グループ上で発生した 2 つのハードディスク故障に対しても、拡張し
たデータ保護を可能にします。
RAID のベストプラクティスを保つためにとるべきステップの概要
 全ての推奨ドライバ、コントローラファームウェア、ストレージ管理ソフト(Adaptec Storage Manager)のアップデ
ートを実行します。
 Adaptec Storage Manager のインストール:
Adaptec Storage Manager は、ストレージスペース内の Adaptec RAID コントローラ、エンクロージャ、ハードデ
ィスクを、一カ所から監視、保守するのに役立ちます。Adaptec Storage Manager がコンピュータにインストー
ルされると、Adaptec Storage Manager エージェント も自動的にサービスとしてインストールされます。ユーザ
の介入無しにバックグラウンドで稼働するようデザインされ、システムの健全性、イベント通知、タスクスケジ
ュール、システムでのその他の進行中のプロセスを監視、管理することを目的にしています。タスクが完了し
たときに通知を送り、エラーや故障がシステムに発生した際にはアラームを鳴らします。詳細については
Adaptec Storage Manager ユーザズガイドを参照して下さい。
 定期的なシステムの整合性チェックを実行します:
ベリファイは、アレイがオンラインで冗長性があるときにハードディスクのメディア不良を前もって検出するた
ように設計されています。データパリティが一致しない場合に、RAID 5 または RADI 6 アレイが不整合になり
ます。同様に、RAID 1 アレイは、データとミラーが一致しないときに不整合になります。
ベリファイプロセスは、全てのセクターをテストするために、アレイ上のそれぞれのドライブにコマンドを発行
します。不良セクターが見つかると、RAID コントローラは、ハードディスクに不良セクターを再割り当てするよ
う指示し、別のディスクを使用してデータを再構築します。該当するハードディスクは、データを新しく割り当
てられた正常なセクターに書き込みます。これらの作業は、ホットスペアを含む、全ての設定されたディスク
の全てのセクターがチェックされるまで続きます。結果として、不良セクターはデータロスが発生する前に再
配置されます。
さらに柔軟性とデータ保護を高めるのに役立つ 2 つの稼働モードが利用可能です。
ページ | 2
1. Background Consistency Check(バックグラウンド一貫性チェック) (自動モード):
このモードでは、ツールはいつもオンになっています。論理ドライブが一度使用されると、Adaptec Storage
Manager が継続的、自動的にその論理ドライブをチェックします。Background Consistency Check が全ての
アレイの全てのセクターでのチェックを終了すると、その後、このチェックを永遠に繰り返します。
その名称が示すように、Background Consistency Check(バックグラウンド一貫性チェック)は、常にバックグラ
ウンドまたはセカンダリのプロセスです。RAID サブシステムでは、データの I/O が最も優先度が高い状態の
ままです。
メモ: この機能を有効にすると、パフォーマンスに影響があります。
Adaptec Storage Manager で、バックグラウンド一貫性チェックを有効にするには:
a. Enterprise ビューで、コントローラを右クリックします。
b. Background Consistency Check を選択し、Enable をクリックします。
有効になると、バックグラウンド一貫性チェックの期間を変更できます。
a. Enterprise ビューで、コントローラを右クリックします。
b. Background Consistency Check をクリックし、Change period を選択します。Change Background
Consistency check period ウィンドウが開きます。
c. Very Slow (365 日)から Fast (10 日)の間でスライダコントロールを調整します。または、New Period
フィールドで矢印キーを使用し、設定を増やすか減らすかします。
d. OK をクリックします。
2. ベリファイと修復 (マニュアルモード):
ページ | 3
このモードは、アレイを 1 つ、早くチェックするのに使用されます。ベリファイプロセスが全てのアレイのセクタ
ーをチェックした後終了し、管理者がマニュアルで開始しない限り再開しません。マニュアルモードでは、ベリ
ファイプロセスのコマンドは、自動モードよりも高い優先度が与えられ、チェックは非常に早く完了します。
ベリファイと修復はデータレベルのチェックで、データを読んで比べるのにより多くのコントローラリソースを
必要とします。また、追加のリソースが必要とされるため、ベリファイと修復は継続的に実行するようには設
計されていません。それよりも、定期的に、望ましくは、ディスクアクセスの低い期間やシステムメインテナン
ス中に実行するようスケジューリングするべきです。
Adaptec Storage Manager を使用して論理ドライブのベリファイと修復をするには:
a. Logical Devices ビューで、論理ドライブを右クリックします。
b. Verify with fix を選択し、ベリファイすることを確認します。
c. ベリファイをすぐに始める場合は、Yes をクリックします。ベリファイをスケジュールするには、
Schedule をクリックし、日時を設定します。ベリファイを繰り返しのタスクとして選択することも可能で
す。
ベリファイが進行中の間は、論理ドライブはアニメーションアイコンとして表示され、タスクが進行中であるこ
とを示します。
ベリファイが完了すると、ローカルシステムのイベントログにイベント通知が作成されます。
 Storage Manager のイベント ログを監視するには:
Adaptec Storage Manager でコンポネントのプロパティをクリックしたり、イベントビューアを表示したり、ステ
ータスアイコンで、ストレージ スペースでおきたステータス情報や、アクティビティ(またはイベント) に関する
メッセージを表示することができます。イベント ログをフルスクリーンで開くには、ツールバーの Events ボタ
ンをクリックします。
ページ | 4
イベントログは、最も最近のイベントを上にしてストレージスペースで発生したアクティビティを一覧表示しま
す。イベントをダブルクリックして、Configuration Event Detail ウィンドウを開き、よみやすい形式で詳細の情
報を見ることができます。
Adaptec Storage Manager は、ストレージスペース内のシステム上のイベントについて、電子メールメッセー
ジ(または通知)を送るように設定することができます。ストレージスペースが指定した人に管理されていない
場合や、特定のシステムが離れた場所にあるまたは、モニタに接続していない場合に、このような方法をと
ることをお勧めします。電子メール通知は、一つのローカルステーションからストレージスペース全体のアク
ティビティを監視するのに役立ち、特に Adaptec Storage Manager エージェントのみが稼働している複数のシ
ステムを含むストレージスペースのアクティビティを監視するのに有用です。
電子メール通知を設定するには、以下の手順に従います。
a. Configure メニュー(ツールバー上の)で、該当するシステムを選択し、Email Notification を選択しま
す。
b. Email Notifications ウィンドウが開きます。以前に電子メール通知をセットアップしていない場合は、
SMTP Server Settings ウィンドウが開きます。
c. SMTP サーバのアドレスを入力し、「差出人」アドレスを電子メール通知に表示します。電子メールの
受信者が、電子メール通知に返事する場合には、「差出人」は頻繁に監視できるシステムに属する
アドレスである必要があります。
d. OK をクリックして、設定を保存します。
ページ | 5
e. Email Notifications ウィンドウのツール バーで、Add email recipient をクリックします。Add Email
Recipient ウィンドウが開きます。
f. 受信者の電子メールアドレスを入力し、受信者が電子メールを受け取るイベントのレベルを選択し、
Add をクリックします。このステップを繰り返し、電子メールを受け取る人を追加します。Cancel をクリ
ックしてウィンドウを閉じます。
Adaptec Storage Manager エージェントを設定して、特定のシステムに関するイベント警告をストレージスペ
ースにログインする全てのユーザに送信することができます。Adaptec Storage Manager にイベント警告の
配信を設定する場合、全ての ログインユーザが 全ての タイプのイベントに関するメッセージを受け取ります。
Windows では、これらの警告はポップアップメッセージで表示され、その他のオペレーティングシステムでは、
コンソールメッセージとして表示されます。
Adaptec Storage Manager には、お使いのストレージスペースのステータスを監視する方法がいくつかありま
す。詳細については、最新の Adaptec Storage Manager ユーザズガイドを参照して下さい。
 完全に故障したか、故障の兆候を見せ始めている (ミディアムエラー、S.M.A.R.T. エラーなど)ディスクを直ち
に交換します。
詳細な情報の探し方
製品に関する、記事、トラブルシューティングのヒントやよくある質問(FAQ) は、Adaptec Support
Knowledgebase (ASK) で探してください。
PMC-Sierra, Inc.
1380 Bordeaux Dr.
Sunnyvale, CA 94089
USA
Sales: 800.442.7274
http://www.adaptec.co.jp
Copyright PMC-Sierra, Inc. 2012. All rights reserved. PMC、PMC-SIERRA、Adaptec は、PMC-Sierra, Inc. の登録商標です。「Adaptec by
PMC」は PMC-Sierra, Inc の商標です。
その他、使われているすべての製品や会社名は、各権利所有者による商標の可能性があります。情報は印刷された時点において、正
確であると確信していますが、本書中の誤記や情報の抜けに起因
する結果に関して何ら責任を負うものではありません。また、記載された製品の仕様や情報等は予告無しに変更される可能性がありま
す。
ページ | 6