データセンタ設計における ストレージに関する留意点 November 2011

データセンタ設計におけるストレージに関する留意点
データセンタ設計における ストレージに関する留意点 1RYHPEHU
RI
6725$*(1(7:25.,1*,1'8675<$662&,$7,21
データセンタ設計におけるストレージに関する留意点
はじめに
ストレージは最近のデータセンタにおいてその重要性と複雑さが増しているコンポーネントで
ある。データに高速にアクセスしたいという要件は、データの保存・法的証拠開示・寿命・整
合性・アクセスのし易さ・セキュリティ・災害復旧などの要件と共に求められるが、これらは
しばしば相反する。よって、これら全ての要件のバランスを注意深く取らなければならない。
最近のクラウドインフラストラクチャへの流れは、従来の資本経費(CAPEX)を運用経費
(OPEX)に変換するという新たな要件を示唆している。そのため、既存のストレージ運用コ
ストに注目が集まり、これまでよりも装置の電力消費に焦点が当てられるようになった。最新
の機器の電力密度とラック密度の増加がこの傾向に拍車をかけている。
しかし、データセンタを計画する場合に最も重要なストレージに関する留意点は、データセン
タの使用目的である。MicrosoftやGoogleなどの巨大なインターネット企業が構築した大規模
なモノリシックデータセンタは、既存の「記録システム」、つまり、データベース駆動型ビジ
ネスアプリケーションをサポートするように設計されたデータセンタとはモデルや運用が根本
的に異なる。さらに、このようなデータセンタはエンジニアリング運用をサポートするための
データセンタとも異なる傾向がある。クラウド指向の運用をサポートするためのデータセンタ
はモノリシックモデルに向かう傾向があるが、スイッチングや仮想ストレージインフラストラ
クチャに関する要件が追加されるため、その点が異なる。最後に、SMBやSMEをサポートする
データセンタの多くは、財政的制約からデータ要件が緩めに設定されている。
このペーパーでは、データセンタのストレージコンポーネントを設計する場合に考慮すべきさ
まざまな留意点について簡単に説明する。また、このペーパーの目的は、ストレージ専門家や
IT設計者が自分たちの顧客に対して提供してきた、顧客が直面している問題を解決するために
蓄積した知識や経験を置き換えるというものではない。むしろ、データセンタ設計者に知識を
提供することによって適切な質問ができるようにすることが目的である。
ストレージに関する留意点
データセンタのストレージレイヤを設計する場合に考慮すべき留意点にはさまざまなものがあ
る。ここではこれらの留意点について簡単に説明する。これらの留意点に基づいて決定を下す
のは経験豊富なストレージコンサルタントやIT設計者であるが、データセンタ設計者はデータ
センタのストレージインフラストラクチャの複雑さを理解することによって、将来的に柔軟性
を制約しかねない短絡的な想定を避ける必要がある。例えば、一般的にストレージの消費電力
はストレージ構成を決定する重要な要素のひとつであるが、それは多くの要素のひとつに過ぎ
ず、これらすべての要素がそれぞれの意味において重要である。
2 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
信頼性
信頼性は有名なRAS(信頼性、可用性、および保守性)3本柱の1本目の柱である。本来、信頼
性とは、一旦保存されたデータが消えたり、変化したりしないことを意味する。
一般的に、これは、ディスクやその他の媒体の故障から保護するためのRAID保護やその他の
冗長なデータコピー(大抵は遠隔地に配置される)に関する要件に反映される。
可用性
データの安全性が保証されていても、プロトコル、装置、または通信の障害によってそれにア
クセスできなければ、リアルタイムアプリケーションにとってはほとんど意味がない。一般的
に、可用性はアプリケーションからデータにアクセスできる時間の割合として測定される。
ファイブナインストレージ装置は、時間にして平均で99.999%のデータ可用性を実現する。
これは、年間のダウンタイムが5分未満であることを意味する。これまで、計画的ダウンタイ
ムと計画外ダウンタイムは区別されてきた。しかし、今日では年中無休の世界が広がるにつれ、
計画的ダウンタイムの機会が減っている。そのために重要度が増しているのが、次の保守性で
ある。
保守性
保守性の高いシステムは点検中でも機能とデータ供給を続けることができる。一般的にこれは、
単一障害点(SPOF)がないことに加えて、すべてのコンポーネントがホットプラグ可能か、
そうでなくても処理を中断せずに点検または交換が可能であることを意味する。無停止アップ
グレード(NDU)でサービスまたはパフォーマンスのレベルが一時的に低下する場合があるこ
とはよく知られている。従来のデータセンタでは、計画外の機能停止よりも点検イベントの方
が頻繁に発生することが多いため、設計者はこうしたイベントの間隔と、その際に許容できる
サービス低下のレベルを慎重に決定する必要がある。
データ保存とコンプライアンス
今日、多くの業界がSarbanes/OxlayやHIPAAなどのさまざまなコンプライアンスに関する法的
指令に基づいたデータ保存に関する要件を抱えている。加えて、企業の法務部門は、電子メー
ルやその他のデータコンポーネントを備えたコアな電子サービスに対して設定すべきポリシー
の決定を支援する必要がある。
どのようなデータ保存要件でも専用のレコード管理システムとそれに適したストレージが必要
である。そのため、データセンタのコンポーネントによってストレージシステムの選択肢が制
限される場合がある。
3 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
法的証拠開示
データセンタ設計サイクル中に会社の法務部門と連携して法的証拠開示に関する要件を決定す
ることを推奨する。開示可能なデータの容量や開示手続きに課された期限によっては、テープ
などの特定の媒体が前記データの長期保存に適さないことが判明する場合がある。
スイッチ構成
従来のデータセンタの多くには、ストレージ用とホスト/ユーザ間の接続用の、2種類の異な
る方式のスイッチおよびネットワーク構成が存在する。
仮想マシンの利用が増えることにより、仮想マシンの割り当てや起動が毎日何百回も繰り返さ
れるようになるだろう。このことにより、どちらの方式であっても、それぞれの役割に使われ
るネットワークに対する負荷が増大し、VMのイメージを提供するストレージとVMを動作させ
るホスト間のネットワーク帯域はより広くあることが要求される。
広い帯域幅のネットワークを用意する代わりに、VMイメージをローカルストレージに保存し、
ローカルストレージからVMを立ち上げることが出来るが、この場合は別の管理や分散に関す
る問題が発生する。
災害復旧
一定期間(大体2週間)以上コアシステムを失った企業が実際に倒産するケースがよくある。
データセンタの機能停止が長引いた場合に発生するコストの認識は不足しているが、実際にデ
ータセンタを必要としているすべての企業でこのようなコストが膨大になることが予想されて
いる。このリスクに対処する最も一般的な方法は、メインのデータセンタに一定の時間差(大
体数秒差)で同期されている別のデータセンタで計算資源とストレージ容量を維持する方法で
ある。企業のニーズに合わせて設定された時間以内に、別データセンタに自動切り替えして運
用を継続できる計算資源とストレージ基盤が、ビジネスの信頼性を実現する鍵となる。ビジネ
スに不可欠なデータと運用の特性やデータセンタのタイプに応じて、データセンタ設計者ごと
にさまざまなデータセンタが設計される可能性がある。
ストレージ技術
システム構成要素の要件に影響を与えるものや、電力レベルや全体的なエネルギー要件に影響
を与えるものなど、データセンタの設計に影響を与えるストレージ技術が数多く存在する。
SAN
ストレージエリアネットワーク(SAN)は、直接接続されたディスクからほぼ順調に進化を遂
げた。エンタープライズレベルのオープンシステムコンピュータはSCSIと呼ばれるプロトコル
(発音は「スカジー」)を使用してハードドライブと通信する。初期のSANシステムはいくつ
かのドライブを集約して、管理者が論理ユニット(通常は省略して「LUN」と表記される)と
呼ばれるパーティションを切り出せるようにした。
4 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
この論理ユニットは1台のドライブの一部ではなく、使用可能な空間全体の一部である。この
LUNは、一般的なSCSIハードドライブと全く同じように、SCSIパーティションとしてホストコ
ンピューティングシステムに搭載された。その後、システムは1つの仕事を行う2台のドライブ
を使用して各ドライブのミラーリングを開始する。これにより、性能が向上するとともに、サ
ービスを中断させずにドライブ障害を克服する能力がもたらされた。今日のシステムは、数種
類の仮想化を使用して、LUNの拡大縮小やデータのリモートサイトへのミラーリングなどの洗
練されたデータ管理テクニックを享受している。現時点でターゲットハードドライブ上の論理
ブロック番号(LBN)と物理ブロック番号に相関は見られないが、ホストは未だに物理SCSIド
ライブに見えるものを認識してそれをこれまでと全く同じように使用している。
SANインフラストラクチャの進化の第2段階は、ファイバチャネルの開発に伴うものである。
SCSIをカプセル化することにより、それ自体よりもはるかに長い距離でスイッチングや展開を
可能にするファブリック(光ファイバケーブルなどの物理媒体)とプロトコルの両方が最初か
ら開発された。これにより、何百または何千ものホストにデータを供給する大規模ディスクア
レイが可能になった。ホストからストレージを分離して、このように集約することにより、以
前のバックアップ活動やアーカイブ活動の問題点のいくつかが解消された。大規模なテープジ
ュークボックスが進化して、何百ものサーバからのデータを1カ所でバックアップできるよう
になった。
現在のSAN技術には、イーサネットファブリック上のTCP/IPネットワーク経由でSCSIをカプセ
ル化するiSCSIや、イーサネットファブリック上でTCP/IPではなくファイバーチャネル・プロト
コルを使用してSCSIをカプセル化するFCoEが含まれる。SAN技術を批判する人もいるが、今日
のストレージ市場、特に、記録システムにおいて支配的なストレージネットワーキングパラダ
イムが続いている。2010年に大きなSAN市場シェアを占めたベンダーにはEMC、IBM、HP、
NetApp、Dell、HDSがある。
NAS
ネットワーク接続ストレージ(NAS)は、ストレージの中央集中管理やホストOSからのストレ
ージ負担の除去といった目的の多くがSANと共通している。アーキテクチャ上の原則のせいと
いうよりはむしろ誕生した境遇のせいで、NASシステムは非構造化データに支配された環境で
進化した。SNIA(ストレージネットワーキング・インダストリ・アソシエーション)では、非
構造化データを構造化データと正反対のものとして定義している。これは恐らく構造化データ
の方が定義しやすいためである。一般的に、データベースアプリケーション(記録システム)
によって生成されたデータは、データ定義言語または何らかのスキーマで指定された既知のフ
ォーマットを持っている。対照的に、非構造化データは、ほとんどがファイルベースであり、
オフィス生産性アプリケーションなどのユーザレベルアプリケーションによって生成されたデ
ータと見なすことができる。NovellとNetAppがNAS市場の初期のパイオニアと見なされてい
る。2010年のエンタープライズNAS市場で大きなシェアを占めたベンダーにはEMC、NetApp、
IBM、Dellがある。
5 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
NASとSANの特徴の違いはファイルシステムの位置である。SANベースのシステムの場合、ホ
ストはSANから提供される物理ブロックストレージ上に必要なすべてのファイルシステムの実
装と維持に責任がある。一方、NASシステムは、NFSやCIFSなどのファイル共有プロトコルを
使用して、POSIXに似た方法でファイルの作成、読み取り、書き込み、および削除を実行する。
ファイルシステムはホスト上ではなく、ストレージサーバ上に配置される。
近年、一部のNASシステムが、LUNとファイルは本来どちらも連続するバイト配列であるとい
う基本的な見解を持ち出して、ファイルシステム上に構築されたブロックストレージの提供を
開始した。つまり、これらのシステムは、LUNイメージをローカルストレージ上のファイルと
して維持し、ファイバチャネル、iSCSI、またはFCoE経由でLUNとしてホストに提供する。これ
により、ファイルシステムの間接費の一部で「ブロックストレージ」上の洗練されたファイル
ベースのデータ管理戦略を導入できる。このトレードオフの評価はストレージコンサルタント
の仕事の範疇である。
SAN構成とNAS構成のどちらも、大規模なスイッチ設備が必要であり、計算資源、ネットワー
ク資源、およびストレージ資源の3方向からそのデータセンタ設備を特徴付けることができる。
これらのコンポーネントの相対的な電力消費量の見積もりは技術の進歩に伴って変化および遷
移するが、大まかには、計算資源が60%、ネットワーク資源が10%、ストレージ資源が30%を
占める。
ストレージハードウェアコンポーネント
概して、従来のデータセンタ向けのストレージは、2つの基本部分(コントローラと複数のデ
ィスクシェルフ(またはドロワー))で構成されたストレージアレイと見なすことができる。
これにより、ラックスペースと電力サイジングの計算に便利なコンポーネント化されたアプロ
ーチが適用できる。
通常、コントローラで消費される電力は、DRAM(ダイナミックランダムアクセスメモリ)で
構成された大規模メモリキャッシュに支配される。2010年において、4 GBのメモリモジュール
の消費電力は2 W弱であり、キャッシュが256 GBを超えることも珍しくない。したがって、コ
ントローラの電力負荷を決定する場合にキャッシュサイジングを含めることが重要になってく
る。コントローラは、RASのためにHA(高可用性)ペアに統合されることが多い。これらはア
クティブ/アクティブペアにすることも、アクティブ/パッシブペアにすることもできる。N
ウェイ構成を使用することもできる。電力の観点では、これらの構成の詳細は重要ではない。
データセンタ設計者が知るべきことは、使用されるコントローラの数と、通常の使用条件と例
外的な使用条件で各コントローラが消費する電力である。
電力の観点では、ディスクシェルフはディスクとファンで構成される。電力を節約するために
は、ファンの仕様を可変速にする必要がある。これは一見、あまり影響がなさそうに思えるか
もしれないが、ファンの電力は回転速度の2乗で増加するうえ、1000ディスクを超える大規模
アレイを冷やすには200台のファンを稼動させる必要があるので、非常に重要である。
6 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
技術が急速に進展しているため、アレイ内のディスクが最大の課題である。まず、ディスク容
量は2年ごとに倍増している。この傾向は基本的な物理的限界の壁に阻まれると予想されてき
たが、研究所で物理学の新しい発見がなされるたびに壁は後退し続けている。そのため、5年
前の装置を新しい装置に「フォークリフトアップグレード」することにより、以前の密度の10
倍近い密度を実現できる可能性がある。これは、144 TBを収容するための10ラック分の高性能
ディスクが1ラックで賄える計算になる。ラックごとの電力要件が若干高くなる可能性はある
が、密度負荷を勘定に入れても、ディスクシェルフ上で80%以上の電力節約が期待できる。そ
の他の要素については後述する。
顧客がベンダーに密度を上げるように圧力をかけているため、ドライブのラックがどんどん重
くなるのは避けられない。設計者は最新設備の重量に耐えられるフロアーシステムを慎重に設
計する必要がある。
ディスクドライブ
ディスクドライブは電力、容量、および性能の特性が異なるいくつかのタイプに分けられる。
SSD(ソリッドステートドライブ)は市場に投入されてから急速に進歩した。一般的に、SSD
はシリコンベースの極めて短い遅延のせいでI/O当たりのコストが最も低い。また、テラバイ
ト単位の保存コストはディスクドライブの約10倍で、最も高い。
高性能FC(ファイバチャネル)ドライブは20年間エンタープライズストレージ業界の中心的
存在だった。概して、このドライブは、より低速のSATAドライブの2∼3倍速く回転し、容量
はSATAドライブの1/2∼1/3である。2008年以降は、新しい装置でSAS(シリアル接続SCSI)
ドライブに置き換えられるようになった。SASはファイバチャネルプロトコルレイヤが排除さ
れているため、FCよりも若干性能が高い。ただし、それが原因で、遠距離には適さないため、
主に、アレイコントローラとそのディスクドライブ間でデータを移動するバックエンドスト
レージネットワークで使用されている。ただし、いずれの場合も、有効な経験則は、高性能
ドライブが物理容量のテラバイト単位の電力をSATAの約6倍消費するように考慮することで
ある。その代わり、高性能ドライブは、回転速度が速いため、信頼性と性能が高くなる。相
変わらず、大容量データベース環境には不可欠な存在である。
SATA(シリアルATA)ドライブは、元々、コンシューマ市場をターゲットにしていた。しか
し、メーカーがその信頼性を高め、寿命を延ばすことに成功したため、エンタープライズ市
場に進出することができた。前述のように、SATAはランダムアクセス媒体のテラバイト単位
の動作電力効率がずば抜けて高い。
7 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
データセンタ内のアプリケーションミックスのデータアクセスニーズを評価し、性能、容量、
および電力消費のバランスを取るのは、ストレージコンサルタントとITアーキテクトの仕事で
ある。
設備の構造的な実装方式
データセンタ設計者の主な関心事は、ストレージに必要な物理装置の量である。従来の多目的
データセンタでは、これがイーサネットネットワークとFCネットワークの2つのネットワー
ク構成の規模を意味する。一般的には、ラック毎に小型スイッチを配備し、より上位のスイッ
チとの間で「星形」もしくはツリー型のネットワークを構成することが、最も良い方法である。
この方法が、配線し保守されるべきケーブルの量を最小化し、スイッチ段数の最小化により、
レスポンス時間の増加を抑える方法である。非常に高い性能が要求される場合は、ネットワー
ク内のスイッチ回数を最小化するためにサーバとストレージの配置場所を考えることが重要課
題であるが、そのような高性能を要求される場合はほとんどない。
ストレージ自体で消費される電力に関して2つの留意点がある。1つはアレイで消費されるピー
ク電力で、もう1つは動作電力である。
ピーク電力
通常、ピーク電力は、所定のシステムに必要なコントローラとシェルフの数を特定してから、
メーカーの仕様書からピーク電力を積み上げてシステム全体の数値を算出することにより決定
される。この数値が装置に供給される電力のサイジングに使用される。安全な基準ではあるが、
高すぎる傾向がある。まず、メーカーは仕様書を公開するときに最悪のケースを想定せざるを
得ない。フル実装の装置とリストに掲載された範囲内で最低の電圧が想定されるため、電流量
が増えることになる。
そのため、できるだけ、現地で装置の(恐らく最も消費電力が多い状況である)起動時の電力
を測定して正確な数値を得る必要がある。
段階的起動を使用すれば、大規模アレイに必要な突入電流を大幅に抑えることができる。アレ
イ自体にこの機能がない場合、ディスク起動に要する時間が増えることが許容され、ディスク
アレイのメーカーがこの方式を採用できるのであれば、SNIAとTGGはPDUを利用した段階的電
源投入を推奨している。
また、3段階起動の3つの工程でピーク電力が均等に分散するように配慮しなければならない。
8 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
動作電力
SNIAは、動作電力測定仕様を公開し、さまざまな製品の稼働・非稼動時の電力使用量に関する
情報を収集するEmerald™プログラムを創設した。ただし、ある構成に関して公開された数値
から別の構成の信頼できる数値を推定するのは必ずしも容易ではない。設計者は、信頼できる
ベンダーが顧客に提供している電力計算機を使用して、公開されているすべての動作数値と計
算をチェックする必要がある。
動作電力を削減するストレージ技術
SNIAでは、特定の量のデータをデータセンタに保存するために必要な動作電力全体を大幅に削
減可能な、(主にソフトウェアベースの)技術をいくつか挙げている。
パリティRAID
RAID 1(ドライブごとのシンプルミラーリング)は、20年間、データ保護を代表する存在とし
て位置付けられてきた。その明らかな欠点は、単にディスク容量を見れば、所定量のデータを
保存するために必要な物理容量と電力量が必要な量の2倍になることである。
パリティRAIDは、データドライブをストライプに分割し、別のドライブに保存されているパリ
ティストライプを計算することによってこれを改善している。この文脈では、パリティ構成の
詳細は重要ではない。重要なことは、1台以上のドライブが故障した場合にデータを消失する
ことなく、特定の「RAIDグループ」内で対処できることである。故障したドライブ上のデータ
はパリティ情報と他のドライブ上の情報を組み合わせて再計算される。RAID 4とRAID 5は、
RAIDグループ(通常は5∼8ドライブ)当たり1ドライブの消失に対処できる。RAID 6は、グル
ープ(通常は16ドライブ程度)当たり2ドライブの故障に対処できる。
ストレージコンサルタントとIT設計者は、パリティRAIDを使用する場合にさまざまなトレード
オフを考慮する必要がある。データセンタ設計者の場合は、必要なドライブ数を削減すること
によって、必要なストレージの設置面積とTB単位の総動作電力の両面でメリットが得られる。
RAID 1(シンプルミラーリング)またはRAID 1/10とそれに類するRAID(シンプルでないミラ
ーリング)の使用に関しては、ITスタッフが吟味して、増えた動作電力の妥当性を確認する必
要がある。特に、災害復旧用として遠隔地でミラーリングされているアレイに関して、既に一
方のエンドポイントにミラーが存在しているのに、もう一方のエンドポイントにRAID 1保護が
必要かどうかを考えなくてはならない。
9 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
シンプロビジョニング
ディスクアレイはLUNの形で容量の一部分を提供していた。これは「事前に」ストレージを割
り当てる必要があることを意味する。さらに、アプリケーションは事前に作成されたLUNの領
域をそのまま使用するため、書き込みエラーや容量不足に対処するように作成されていない場
合が多い。このことにより、被害妄想的に必要以上に大きなLUNを必要とする傾向がある。こ
れが原因で、使用可能なスペースの大部分(業界筋によると半分)が使用不能になる。
しかし、ストレージが仮想化されたことによって、システムはLUN内の各ストレージ・ブロッ
クの割り当てをそれらが実際に書き込まれるまで延期できるようになった。このようなシンプ
ロビジョニングシステムは、購入時のサイズを小さくして、データニーズに合わせてスケール
アップできるため、必要なストレージのTB単位のエネルギーを半分節約できる可能性がある。
データ重複排除
特にバックアップシナリオでは、1つのデバイスに同じデータが何回も書き込まれるのが普通
である。データ重複排除は、このような1つのソースコピーの複数コピーをソースコピーを指
す複数ポインタに置き換えることによって、スペースを99%まで節約する。現時点で、このデ
ータ重複排除はランダムアクセス媒体(その多くは回転ディスクドライブ)を搭載したシステ
ム上でしか実行できない。プライマリストレージ内のオンラインデータの重複排除も使用でき
るが、割合はそれほど高くない。2010年のベンダー発表によれば、エクサバイトを超える顧
客データに対する重複排除の割合は27%である。
準オンラインディスクベースのシステム(SANやNASなど)に対する重複排除は非常に魅力的
である。特に、法的証拠開示要件を抱えている企業では、バックアップデータをオンラインで
検索できる能力が極めて有益である。複雑なテープベースのバックアップシステムをうまく管
理するための組織や規則のない中小企業では、ディスクベースのバックアップのシンプルさが
非常に魅力的なことに気付く場合も多い。
ただし、本稿の執筆時点では、洗練されたIT部門を有する大規模データセンタが、未だにテー
プバックアップシステムを購入している。テープはどのディスクベースの媒体よりも動作電力
が少ないため、組織のビジネスニーズを満たしている限り、電力の観点からは文句の付けよう
がない。ただし、データセンタ設計者はバックアップ決定に影響を与える可能性のあるその他
の要素を把握しておく必要がある。
10 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
圧縮
テープシステムは何十年も前から圧縮を実施しており、約50%の圧縮率を達成している。
ディスクベースのストレージシステムの場合は、データがテープシステム上のストリーミング
フォーマットではなく、ブロックフォーマット(通常は1回4 KiB)で保存されるため、圧縮が
困難になっている。しかし、それを特徴とするシステムが出荷され始めている。この方法でど
のくらいの電力が節約されるかに関する入手可能なデータはほとんどないが、一般的には、あ
るデータを保存するために必要な物理ストレージ容量が少ない技術のほうがエネルギーを節約
できる。
デルタスナップショット
近代的なデータセンタにおけるポイントインタイム(PIT)コピーの用途はさまざまであり、
バックアップの基礎として使用可能な静的コピーから、テストやwhat-ifシナリオに使用される
コピー、高度に仮想化された環境でVMを実行するために使用される高品質イメージのコピー
までが含まれる。
スナップショットやクローンと呼ばれる従来のコピーはターゲットデータセットの完全な写し
である。ただし、書き込み可能か、読み取り専用かに関係なく、本番使用シナリオで変更され
るデータが10%または20%を超えることはほとんどない。
デルタスナップショットは、さまざまな形態のコピーオンライト技術(ブロックは新しいデー
タが追加されるまで書き込まれない)を使用して作成される。それまでは、ポインタやポイン
タを追跡するメタデータと同程度のスペースしか必要のないPITコピーのターゲットと共有さ
れる。
そのため、デルタスナップショットは、スナップショットごとに、ターゲットデータセットを
保存するために必要な物理容量の80%∼98%を超えるサイズを節約できる。その使用頻度によ
っては、エネルギー節約の可能性がさらに大きくなる。
ストレージ「階層」
ストレージ階層化は、データをその使用パターンによって正当化される最も経済的な媒体に配
置しようとする技術である。ベンダーは、この技術を使用すれば、特定のアレイと同等または
それ未満の資本コストでその約2倍のデータを保存できると主張している。一般的に、SSDドラ
イブとSATAドライブのどちらもSASドライブまたはFCドライブより電力消費が低いため、純粋
な高性能アレイ上の電力消費の方が低くなる。
11 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
階層化と似ている他の方法としては、非常に大きな(テラバイト級の)容量を持つフラッシュ
キャッシュをSATAストレージの前に置くという方法がある。
この構成は、ストリーミング書き込みが多いワークロードには適さないが、より一般的なラン
ダムアクセスワークロードの場合は、性能が高性能SASドライブを搭載した従来のアレイ以上
になる可能性がある。動作電力は次の2つの要因に左右される。まず、大容量のフラッシュキャ
ッシュがフルI/Oロード時に大量の余分な電力を消費する。次に、SASドライブまたはFCドライ
ブではなく、SATAドライブを使用すると、エネルギー単位当たりのストレージ容量が大幅に
増加する。設計者は、ベンダーとその電力計算機だけでなく、ストレージコンサルタントとIT
設計者にも相談して、実際の電力負荷を決定する必要がある。
ストレージ電力効率
ストレージユーザが注目する電力効率には次の3種類がある。1つ目は装置の電気電力効率であ
る。2つ目は、I/O電力効率、つまり、装置で使用される電力のワット単位で供給されるI/Oの数
である。3つ目は、装置で使用される電力のワット単位で保存可能なデータ量である容量電力
効率である。
電気電力効率
これは、米国の環境保護庁と電力会社が最も関心を寄せている効率である。設計者は、電源供
給に対する効率がシルバー、ゴールドまたはプラチナレベルなのかを示すことを、ベンダーに
対して要求するべきである。選択すべきものは、価格の高さと電力節約の可能性によって決ま
る。満たすべき不等式を以下に示す。
新価格−基本価格< 1ー
基本効率
新効率
× 所要時間 × ドル /KW × 出力電力(KW)
この式の右辺を使用すれば、60%の効率で225 Wを消費するサーバは、168 Wを消費する80%
の効率の電源を備えた同じサーバよりも0.10ドル/KWh多く、年間約50ドルのコストがかかる
ことがわかる。電源効率を上げるための投資に対して期待されるROIによっては、標準的な3年
間で減価償却して150ドルが節約されるとしても、より効率的なユニットの25∼50ドルを上回
る価格の上昇を正当化するのは難しい。
一般的に、電気電力効率の向上は、3つの効率タイプの中で最も見返りが少なく、効率が100%
に近づくほど、その向上から得られる見返りがほとんど無視できるくらい小さくなる。
12 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
I/O電力効率
I/O効率は特徴付けるのは簡単だが、規定するのは難しい。これは、標準的なデータセンタ内
でストレージシステムのフルI/O効率が使用されることがまずないためである。大規模ストリ
ーミングアプリケーションや高負荷データベースアプリケーションは例外であるが、一般的に、
定格I/O能力の約60∼80%で動作しているストレージサーバは、その管理者がうまく運用して
いると見なされる。「スケールアウト」システムは、I/Oまたは容量の限界に到達したときに
簡単に新しいサーバを追加できるようにして、「壁の傍」での運用を可能にすることによって
これを支援しようとするが、システム粒度などの影響によって、シンプロビジョニングされた
システムが「壁の傍」かどうかを単純に判断するのは難しい。
一般的に、I/O電力効率は、1ドル当たりの最大IOP数、つまり、IOP数/ドルで特徴付けられる。
本稿の執筆時点(2011年)では、この部門でソリッドステートディスク(SSD)の方が回転デ
ィスクより有利であるが、この優位性は書き込みワークロードを持続させるためにほとんど効
果がないか、逆効果にさえなる可能性がある。大量のキャッシュを搭載したシステムは、キャ
ッシュ内で電子ストレージが使用されるため、同様のメリットを享受できる。
容量電力効率
容量電力効率は、ストレージシステムで使用された電力のワット単位で保存されたTB(テラバ
イト)の数値として定義される。パリティRAID、シンプロビジョニング、デルタスナップショ
ット、重複排除、SSD、およびさまざまな形態の階層化を使用することにより、実に簡単に容
量電力効率を約2倍にできる。
容量電力効率は、ストレージシステムで使用されている物理容量のユニット単位で保存された
TBの数値として定義される正味容量効率に関係する。ミラーリングされたアレイの場合は、物
理容量の半分がミラーリングにのみ使用され、他のシステムオーバーヘッドも存在するため、
容量効率は0.5未満になる。前述した容量最適化技術のすべてまたはほとんどを採用している
最新のシステムは、実際に物理容量よりも多くのデータを保存できるため、単純にデータを保
存するだけで1.0を上回る効率値を達成できる。
容量電力効率は、現時点で、ストレージ業界の3つの電力効率タイプの中で最も重要である。
これは、最近のデータセンタ内のオンラインストレージの主流が回転ディスクドライブであり、
SNIAでの広範な試験によれば、これらはドライブを「アイドル」状態で回転させるためだけに
ピーク使用量の85%以上を使用している。事実、アレイによっては、アイドル時にデータ配信
時よりも多くの電力を消費している場合がある。これは、アイドル状態がアレイにとってシー
クを多用するバックグラウンド処理やハウスキーピングタスクを起動するのに最適な時間であ
ることを示している。大規模アレイがコントローラ当たり何百ものドライブを備えている場合
は、計算上、ディスクとファンの電力負荷がコントローラの電力負荷を圧倒する。そのため、
容量電力の最適化は、数学的に最大の利得を提供するだけでなく、ストレージ電力式の最大の
要素に作用するため、最大のメリットを享受できる。また、この最適化は、購入して電力を供
給しなければならないドライブの台数を削減することによって機能するため、装置の資本コス
トにも良い影響を与える。
13 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
フラッシュベースのストレージ電子装置はその状態を維持するためにほとんど電力を消費しな
いため、SSDはアイドル状態でデータにとってほぼ理想的な電力プロファイルを供給する。し
たがって、ワット単位の容量の観点で、SSDは優れていると言える。正味容量効率の観点では、
ストレージシステムがそれらをシステム上の他のディスクドライブと同じように扱うと仮定す
ると、回転ストレージと同じプロファイルになる。2010年における容量単価は、まだSATA媒
体のコストの約10倍である。データセンタのアーキテクトや設計者が何を最も重視するかによ
っては、大きなトレードオフとなる。
データセンタのタイプ
データセンタはいくつかの基本的なタイプに分けられる。従来の「記録システム」データセン
タの多くが何百もの従来のデータベース駆動型ビジネスアプリケーションをサポートしている。
大規模なモノリシックデータセンタが、メジャーな検索エンジンやソーシャルメディアによっ
て具体化されるような巨大な国際化された高度並列インターネットアプリケーションを支えて
いる。クラウド指向のデータセンタは、スイッチ要件と仮想ストレージ要件が追加された、こ
れらの変形と見なすことができる。エンジニアリングデータセンタは、クラウドと従来のモデ
ルの混在を受け入れる傾向にある。最後に、中小企業(SMB)向けのデータセンタは、経済的
な理由から堅牢度の低いストレージを使用していることが多いため、特別な配慮が必要である。
記録システム用のデータセンタ
昔から記録システムではダイレクトアタッチトストレージ(DAS)が使用されている。このス
トレージの場合は、計算資源とストレージ間のプロトコルレイヤとスイッチングレイヤの数が
最小限に維持されるため、初期セットアップの容易さだけでなく、非常に高い性能からもメリ
ットが得られる。
ただし、ビジネスとシステムが成長するにつれ、DASは正常に機能しなくなる傾向がある。均
一性に欠ける(システムがロールインとロールアウトを繰り返していると保守が非常に困難に
なる)場合は、ストレージの管理に論理的混乱をきたす。さらに、多種多様なデバイスタイプ
とパッチレベルの効率的なバックアップとリカバリは、装置と管理コストの両面でますます困
難で高価なものになる。NASストレージシステムとSANストレージシステムは、どちらも環境
の健全性を向上させるように進化してきた。どちらも統合されたバックアップ戦略とリカバリ
戦略を可能にする。設計者の視点で見た場合の主な違いは、さまざまなネットワークの配備で
ある。純粋なFC SAN構成では、LAN(必ずイーサネットであると言っても良い)があまりスト
レージ領域を侵害しないが、純粋なNAS構成では、イーサネットが、配備される唯一のネット
ワークである。DAS構成では、統合テープバックアップに使用される可能性がある場合を除い
て、ストレージ構成の妨げになるものはほとんどない。
14 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
データのリモート重複
メジャーなストレージベンダーが供給しているシステムは、自動的にデータをリモートサイト
にミラーリングして、まるで魔法のようなリカバリ処理を実行できる。完璧な災害復旧処理は
未だに標準ではなく例外のままだが、その需要はデータセンタの成長に伴って増加しており、
装置の故障自体は例外ではなく標準になっている。
エンタープライズデータセンタ:データセンタは大きすぎて常にその内部の何かが壊れている。
-- Alan Yoder, NetApp
現在のデータセンタ設計者は、この事実とそれに対する緩和戦略を無視するわけにはいかない。
データベースストレージ
記録システムはほとんどデータベース駆動である。数年前まで、データベースのほとんどに物
理ストレージが使用されていた。これは、DASアレイまたはFCアレイ以外はストレージタイプ
の候補としてふさわしくないことを意味する。しかし、最近になって、ベンダーはNFS実装を
改良して、ファイルベースのストレージだけでなく、よく知られているエンタープライズレベ
ルデータベース用の物理ストレージも動作するようにした。これにより、理論上は、データベ
ースシステムでストレージを管理する必要がなくなった。ただし、データベースベンダーは、
DASまたはJBOD上でのストレージ管理にも着手して、そのデータレイアウトの知識を利用し
た性能および信頼性の向上を目論んでいる。これら3つのシステム(DASアレイ、FCアレイ、
およびNFSサーバ)のすべてが、今日、市場で十分な存在感を示しており、現時点でこれらの
いずれかが他を圧倒する兆候は見られない。したがって、設計者は、データベース/ストレー
ジ間の通信フォーマット戦争に参戦するのではなく、管理容易性、データベース機能、および
ビジネスにより直接的な影響を与えるその他の重要課題に集中すべきである。ただし、フォー
マットの最終決定が装置構成に影響を与える可能性があるため、それなりに考慮する必要があ
る。
15 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
電子メール
電子メールは、今日、かなり普及している厄介なデータベース駆動型アプリケーションの1つ
である。いくつかの留意点が適用される。
まず、堅牢なスパムフィルタがあれば、電子メールシステムのデータストレージ要件の90%を
簡単に克服できる可能性がある。これは、複数の研究によって、今日の電子メールの90%以上
がスパムであることがわかっており、スパムにとっての最良の場所は、ストレージも電源も要
らない、空に浮かぶ巨大なビットバケットであるという理由による。ほとんどのユーザは、す
べてのスパムフィルタがときどき引き起こす「誤検出」(重要かどうかに関係なく電子メール
のドロップにつながる)を克服できるだろう。誤検出を克服できない企業は、保存要件と確認
要件が生じるため節約分を切り崩すことになるが、それでもスパムフィルタリングが積極的な
環境保全技術であることに変わりはない。
電子メールシステムに関する2つ目の重要な留意点は、コンプライアンスおよび保存ポリシー、
つまり、電子メールが自動削除されるまでの保存期間をどうするかと、開示要求にいかに速く
応答するかである。これらの質問に関する標準的なポリシーは存在しない。新しい判例法では、
ポリシーを設定してそれを厳格に実施することが重要とされている。会社の法務部門が現実的
なポリシーの提案者として最適である。一部の企業では、すべてのメールを検索可能な媒体上
で永久に保存するように要求する法律(テープの使用に影響を与える可能性がある)が浸透し
ている。その他の企業では、1年、3年、および5年の自動削除間隔が報告されたすべてである。
サイジングのためには、既存の電子メールボリューム上のレコードを調査して外挿することに
より、データセンタの存続期間中に必要なおおよそのストレージ量を決定する必要がある。明
らかに、ストレージニーズに合わせて容量を増やすことができるシンプロビジョニングストレ
ージシステムが有効である。添付ファイルとメールメッセージを重複排除するストレージまた
は電子メール管理システムも大量のスペースと動作電力を節約できる。
非構造化データ
従来のデータセンタでは、オフィス生産性アプリケーションによって生成された非構造化デー
タの占める容量が増え続けている傾向がある。前述した容量最適化技術(パリティRAID、デル
タスナップショット、シンプロビジョニングなど)のすべてが非構造化データのストレージに
適用できる。設計者は、これらの技術を最大限活用することにより、初期に配備するストレー
ジの容量を減らし、容量拡大の要求が上がった時に拡大できるよう、ストレージコンサルタン
トとIT設計者に働きかける必要がある。必要な計算をする場合は、展開されている物理容量
のレコードよりも、保存されている実際のデータ容量の数年前のレコードの方が有効である。
16 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
バックアップとアーカイブ
すべてのデータセンタは、あるレベルでバックアップとアーカイブを行わなければならない。
データが大量である場合には、テープアーカイブに保存される。設計者の視点では、あるデー
タセンタから、安全で遠隔地にあるデータセンタに移動可能な媒体が必要である。アーカイブ
は頻繁に読み取られるわけではないため、古くなった電子メールの破棄などのタスクを迅速に
実行できるように管理する必要がある。災害発生時に、ビジネス活動を回復するためにアーカ
イブからのリストアをしなければならないデータセンタを持つ企業は、その回復までに数日ま
たは数週間を要することが常に悩みの種である。
長期保存に関する課題は山積みであり、この分野はまだ成長期にある。最近になって、問題を
解決するためには堅牢な仮想化機能(ホスト層とストレージ層の両方)が必要なことがわかっ
てきたため、長期分野の要件が提起された設計者はこのことを胸に刻んでおく必要がある。特
に、10年以上前のストレージ装置に「見える」ように構成可能なストレージ仮想化アプライア
ンス(SVA)が必要になる可能性がある。ただし、これらの機能はアウトソーシングで賄うこ
とができる。
回復イベントに役立つように意図されたバックアップがもう1つの課題である。一部の企業で
は、未だに、テープがこの目的に使用されているが、最近は多くのデータセンタで、プライマ
リまたはセカンダリストレージ上の重複排除バックアップアプライアンスまたはデルタスナッ
プショットの形態でのオンライン媒体が最適な構成と見なされている。高度に最適化された物
理容量を採用しているお陰で、どちらの技術も運用コストが安いうえ、故障したシステムを正
常な状態に回復させるために必要な高速データアクセスを提供できる。また、どちらの技術も
(未だに必要とされている)アーカイブのためのテープアレイの規模とコストの削減に役立ち、
事業運営に大きな影響を与えることなくテープアレイにデータを書き出す時間枠を延長できる。
上記の目的は、ストレージ戦略としてテープを排除することではなく、これまでのすべてのス
トレージ技術に対して最適な動作電源プロファイルと小型化を提供することである。ただし、
媒体の機能性とデータに関する要件のバランスを注意深く取る必要がある。
データセンタが機能停止状態になった後に性能状態に回復するための最善の方法の一つが、DR
用データセンタを用意することである。ただし、企業が強固なDR戦略を行っており、重複排除
されスナップショットされたバックアップを取っていた場合、これらのデータが段階的なアー
カイブや消失ファイルの回復、ひいては主要な企業活動の継続と言う第一の目的に役立つだろ
う。
バックアップとアーカイブ用の装置構成要件と電力要件はあまりにも変化に富んでいるため、
本書のようなガイドでは表現しきれない。設計者は、ビジネス要件がストレージコンサルタン
トとIT設計者によって十分考慮されていることを確認し、彼らの推奨事項と選択された装置メ
ーカーの最適な方針に基づいて進める必要がある。
17 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
モノリシックデータセンタ
一部の現代的インターネット企業(特にGoogleとMicrosoft)は、新しいタイプのデータセン
タの構築に積極的に取り組んでいる。このようなデータセンタの設計は、従来のものとは全く
異なる以下の留意点を通して具体化される。
・アプリケーションは簡単かつ高度に並列処理できる。
・すべてのアプリケーションは同じアーキテクチャ上で動作する。
・アプリケーションの規模は膨大(地球規模)である。
・アプリケーションは特定の目的専用に作られる。
・ストレージと計算資源は有利に配置されている。
・少量のデータ消失は許容される。
現在では、「レンガ」アーキテクチャがこのようなデータセンタに最も有益と見なされている。
レンガの概念は、いくつかのディスクドライブを内蔵した1-Uサーバから、CPU、ストレージ、
およびスイッチングが満載された大型出荷用コンテナにまで及ぶが、前者に向かう傾向がある。
一般的に、レンガアーキテクチャはネットワーク全体で少なくとも2回データを複製する。レ
ンガの一部が内部冗長性限界(もしあれば)を超えて故障した場合は、レンガ全体が交換の対
象となり、その上でホストされていたすべてのデータとコンピュテーションが新しいレンガに
移動される。
グリーンストレージの立場からは、このような設計は推奨できない。この理由の1つとして、
このような設計を構築している企業が今日のインターネット市場における熾烈な競争圧力のせ
いでアーキテクチャの詳細の公開を拒否していることが挙げられる。ただし、わかっているこ
とがいくつかある。第1に、このようなデータセンタでのストレージの使用はうまく最適化で
きない可能性がある。本章の冒頭で説明した容量最適化技術の一部が使用されている可能性が
あるが、それらがホストOS(LinuxまたはWindows)から提供されていない場合は、自分でど
うにかする必要がある。レンガを簡単かつ安全に交換できるようにするために複製への依存度
が高い場合は、必然的に、従来のデータセンタよりも物理ストレージ容量の使用量が増える可
能性がある。
第2に、このようなアーキテクチャでは、従来の集中型ストレージアーキテクチャよりもCPU
の数がはるかに多くなる。ただし、設計者が、CPU密度と、アプリケーションのストレージ要
件と計算要件の組み合わせのバランスを取ることができる場合は、これが実際にアーキテクチ
ャの強みになる可能性がある。これは、ストレージと計算資源をできるだけ近くに配置するこ
とによって明らかなメリットが得られるためである。
18 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
第3に、このような広範囲に分散したデータプールを使用して災害復旧(DR)を実施する方法
は、ストレージ効率を低下させるだけのデータセンタ全体の複製を除いて、確認するのは困難
である。業界のフォーラムで公開され、確認された例があまりにも少ないため、このガイドで
はこの分野の十分なガイダンスを提供できない。モノリシックデータセンタを導入する前に、
設計者はITアーキテクトに次のような質問をすべきである。
・バックアップはどのように実施するか。
・保存要件はあるか。ある場合は、それらをどのように処理するか。
・リモート複製はどのように処理するか。DRに加えて、follow-the-sun サービス(24
時間365日のサービス提供を実現するため、異なるタイムゾーンにある世界各地の
データセンタでサービス資源を受け渡していくこと)を使用できるか。
ただし、モノリシックデータセンタに関して確信を持って予想できることは、変化である。計
算ユニットの変化、ストレージユニットの変化、およびアプリケーションミックスと組織戦略
の変化。したがって、運用面から見た場合のデータセンタ設計者に関する最適な方針は、でき
るだけ、電力ネットワークとネットワーク分散ネットワークをモジュール化することである。
市販のハードウェアを利用するアーキテクチャの場合は、全体の再構成に3∼5年かかる可能性
がある。可動式で交換可能な大型電源バスは電力を節約し、簡単に再配置が可能な端子スイッ
チを備えた大型でアップグレード可能なブレードスタイルのディレクタスイッチのネットワー
クは、これらの将来的な再構成に対して最大限の柔軟性を提供する。これらによって将来的な
ネットワーク装置のコストと電気変換コストが削減される。
クラウドデータセンタ
クラウドインフラをホストするためのデータセンタとモノリシックデータセンタはある程度似
ているが、設計者が認識すべきモノリシックな構成との重要な違いがいくつかある。これらの
違いには、中央のVMリポジトリとインフラストラクチャ、それらのバックアップ/リカバリ
戦略、およびストレージインフラストラクチャが含まれる。
クラウドは、モノリシックデータセンタと全く同じように、レンガ内に組み込まれたDASを使
用して構築できる。ただし、これによって、各ノードに使用可能なストレージが制限されたり、
一部の計算ノードから純粋なストレージノードへの再構成が強制されたりする(ノードのリソ
ースの最適な使用とは限らない)。計算ノードがキャッシュ以外にストレージを使用しない場
合、ネットワーク経由で提供される完全に仮想化されたストレージを使用することで、更なる
柔軟性が得られる。これらのノードはネットワーク経由でストレージアレイからも起動させる
こともできる。この配置を使用すれば、計算ファームを純粋に計算のみに使用することが出来
る。この場合に、ブレードサーバを使用することで、小型化と保守性を実現することが出来る。
ブレードサーバを使用すれば、10 Gイーサネットなどのより帯域幅の広いネットワークのより
経済的な使用が可能になる。これは、すべてのノードが広帯域幅のネットワークを必要とする
わけではないからである。この場合、ラック間スイッチを10Gにする必要があり、それに伴っ
てコストは上がるが、このコストはブレード筐体に内蔵されたスイッチングによって相殺され
る。
19 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
このようなデータセンタ内のストレージは、特定の大規模アプリケーションがロードされ、実
行準備が整うまでの短い間に、特定のタスクに適したOSイメージとアプリケーションを使用
して事前に構成された仮想化ストレージコンテナを何百も配信できる必要がある。単一のゴー
ルデンイメージから複数の仮想マシンイメージを複製できる能力は差別化要因になる。各スト
レージアレイは、後ろに控えているブレードサーバの集合全体からの帯域幅要件を処理できる
必要がある。アプリケーションのストレージ帯域幅要件によっては、数百台のブレードサーバ
すべてのアレイが必要になる場合がある。セキュアなマルチテナンシーは、エンドユーザが第
三者からデータにアクセスされたり、データを操作されたりしないことを保証するための別の
要件である。
スタンドアロンストレージを特徴とするすべてのデータセンタモデルと同様に、ホットアイル
/コールドアイルラッキングに適したストレージが必須である。
エンジニアリングデータセンタ
多くのエンジニアリングデータセンタが、大規模アプリケーションのコンパイル、チップ設計
のVLSIルーティング、大規模な薬学計算と生化学計算、構造解析、風洞シミュレーション、そ
の他の工業関連タスクなどの作業を実行するグリッドベースの処理ファームを何年も使用し続
けている。高いレベルでは、これらのグリッドとコンピュートクラウドはよく似ている。グリ
ッドとクラウドの主な違いは、グリッドは概して目的別に構築され、大量の仮想化の恩恵を受
けずに機能するのに対して、クラウドは、仮想化を多用することによって、汎用リソースとし
て構築できる点である。
データセンタ設計者は、エンジニアリングチームが新しいエンジニアリングデータセンタでグ
リッドアプローチからクラウドアプローチへの移行を計画しているかどうかを確認する必要が
ある。前述したように、クラウドアプローチでは仮想化要件が増えるため、スイッチとネット
ワーク構成の選択肢も増える。
また、エンジニアリングデータセンタは、製品の設計書・議事録・ドキュメント・プレゼンテ
ーションといった、大量の非構造化データを保存する必要がある。SharepointやExchangeな
どのコラボレーションツールをさまざまな理由で会社のITとは別にホストすることもある。設
計者は、新しいデータセンタにどのくらいの非構造化データストレージが必要かを確認する必
要がある。現時点(2010年)で、クラウドインフラでは非構造化データを保存する最適な方式
が確立していない。したがって、このストレージの最適な方針は従来のデータセンタのベスト
プラクティスと同様である。ストレージベンダーは、可能であれば、新しいデータセンタに必
要な専用のストレージ担当者の数を最小限に抑えられるように、クラウドとファイルストレー
ジの両方のニーズを満たす製品に関する問い合わせに応じる必要がある。
20 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
上記は、過去10年間に、多くの最先端のエンジニアリング企業で採用された「follow-the-sun」
サービスによって複雑化した。このような設計には、少なくともコアデータに関して相互に同
期が保たれた3つ以上の世界中に分散されたデータセンタが含まれている。日中作業している
エンジニアリングチームの近くの装置を使用することによって、WAN遅延が最小化され、計算
効率が向上する。これらのセンタ内のストレージシステムは、効率的かつ確実にデータ同期化
を実行してデータ書き込みの衝突や性能劣化を回避できる必要がある。ストレージの同期化プ
ロトコルにWAN最適化がネイティブに組み込まれていない場合、このようなアーキテクチャ
にはWAN最適化製品が必須である。
SMBデータセンタ
中小企業が抱えるニーズや要件は、主に、財務プロファイルが小さいことに起因して軽減され
ている。中小企業向けのデータセンタは、数台のサーバが置かれた小部屋や収納場所で構成で
きる。規模が小さいため、グリーンデータセンタに対する施設側のアプローチの多くが設計者
やコンサルタントを必要としない。
ストレージ側の最適な方針には、会社の成長に合わせて簡単に拡張可能な小型で高度に統合さ
れたストレージアレイが含まれる。容易な管理または安価な外部保守契約が必須であるが、こ
れはストレージ上のWindowsベースまたは非常にうまく設計されたWebベースの管理インタフ
ェースを指している。バックアップは、信頼できるクラウドバックアッププロバイダに委託す
るか、別のサイトにミラーリングされる重複排除機能付きの内部ディスクベースバックアップ
を実施するのがベストである。テープが最適であるが、オフサイトストレージを含むテープバ
ックアップローテーションを安全かつ効率的に管理するための自社規律があるSMBはほとんど
ない。高性能な小型ストレージアレイがあれば、企業のRPOプロファイルとRTOプロファイル
を改善しながら、PITスナップショットを小刻みな間隔で提供することもできる。これらの多
くは、本章の冒頭で説明した容量最適化技術の一部も提供している。
安易に実現できる環境対策は、落とし穴が隠されているので、注意深く避ける必要がある。1
つの例として、外気を直接、冷却に使用する方法が挙げられる。データクローゼットが外側の
壁に接触していれば簡単に実現できる。この場合の落とし穴は、特にスモッグの多い地域で、
湿度が80%を超えるとディスクドライブの電子回路が結露して、ドライブ(Seagate社製)の
初期故障や非保証故障を引き起こす可能性があることである。
通常、除湿はエアコンによって自動的に処理されるため、要件に含まれない場合が多い。経験
豊富なHVAC請負業者に相談して、外気の経済的な利用が可能かどうかを判断する必要がある。
21 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
動作電力の監視と管理
現時点で、少なくとも装置のベンダーの数だけ、動作電力の監視方法が存在する。ここでは、
ある程度の標準化が可能な方法を提案する。
SNMP
SNMPレポーティングはほとんど汎用的に使用できる。小型の家庭向けJBODボックスでさえそ
れをサポートしているほどである。ただし、本稿の執筆時点で標準的なMIBは存在していない。
これは、監視ソフトウェアの制作者が、装置の部品の型式、モデル、およびバージョンを特定
してから、ベンダーから提供されたMIBを使用して管理情報を問い合わせる必要があることを
意味する。この作業はそれほど困難ではなく、SNMPが、ネットワークに接続されたオブジェ
クトに関するステータスレポーティングに最適なことに変わりはない。
SNMPはSET操作経由で基本的なアクティブ管理をサポートしているが、以前のバージョンのプ
ロトコルは読み取り専用管理にしか使えないことが判明し、セキュリティは脆弱だった。加え
て、トランザクションメカニズムが欠如しているため、複雑な管理操作にはとても使えない。
そのため、SNMPのバージョン3は、以前のバージョンのプロトコルで発見されたセキュリティ
上の問題がほぼ解決されているが、あまり普及しなかった。現時点で、SNMP経由のアクティ
ブ管理はほとんどのデバイスで使用できない。
SNMPの偏在性にもかかわらず、電力使用のSNMPレポーティングは初期段階にある。部品メ
ーカーは、SNMP経由で結果を集約して報告できるように、周辺のストレージシステムにもレ
ポーティング機能を付加する必要がある。電力を報告するためのこのテクニックが普及する
のは数年先(2015年頃)のことであり、これに関する業界のロードマップは存在しない。
PDUレベル監視
電力監視をサポートするラックレベルPDUが搭載されたストレージ装置の構成は、簡略化され
ているのが普通である。ベンダーはこの方式のサポートに関する問い合わせに応じる必要があ
る。これは、適切なベンダーならば、製造時にキャビネット内へPDUを組み込むことをサポー
トしているからである。装置の購入後に新しいPDUを設置する方法もある。
ラックレベル監視の根拠は、あまり手間や費用がかからない、かなり詳細な電力レポーティン
グを採用して、それを実用化していることである。現在、ラックレベルPDUに基づくソリュー
ションを提供しているベンダーは数社だが、その数は増えつつある。
22 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
CIM
SNIAのSMI-S仕様書(第1.5版)に動作電力プロファイルが記載されている。この仕様書では、
コンピュータシステムから統計データを収集する方法が規定されている。この統計データには、
システムのファン、ディスクドライブ、ディスクシェルフ、HBA、電源、およびシステム全体
で使用される電力を含めることができる(メーカーの実装とデバイスの構成要素によって異な
る)。必要なCIMクラスはDMTF CIM Schema v2.28以降に記載されている。値はミリワット単
位で報告されている。
現時点で、このプロファイルの実装はほとんど存在せず、それを促進する取り組みに管理コン
ソールメーカーが参加していない。普及の見通しは立っていないが、本稿の執筆時点(2011年)
から数年先になるだろう。業界のロードマップは存在しない。
動作温度監視
温度監視は、可用性と堅牢性に関して電力監視とほぼ同レベルである。ほとんどすべてのスト
レージシステムコンポーネントに温度センサが組み込まれているため、媒体を破損させないよ
うにシャットダウンすることができる。一般的に、これらの測定値は近代的なデータセンタの
設計者が望むほど正確ではなく、周辺のシステムに報告されることもない。
そのため、事前に、SNMPまたはCIM経由の詳細な温度監視を使用可能にするための作業を行う
必要がある。所要時間は動作電力監視とほぼ同じである。
前述した電力監視PDUは、複数の温度センサの測定値を提供する。ラックレベルPDUとベンダ
ーを選択するときに、この機能があるかどうかを考慮する必要がある。このガイドでは、スト
レージ装置のラック内で3∼5個のセンサが使用されており、その大部分が装置の背面(温度が
上がる側)に配置されていることを推奨している。
23 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
まとめと最適な方針
ストレージは、データセンタインフラストラクチャの複雑で扱いにくい構成要素である。CPU
とストレージが混合した構成(すなわち、ストレージが埋め込まれた「レンガ」)を明確な理
由によって採用している、特定の目的の為に作られたモノリシックデータセンタを除き、最適
な方針とは、出来る限りストレージを集中管理することである。これにより、環境保全技術、
管理的取り組み、および集中型バックアップおよびアーカイブリソースを最大限活用できる。
さらに、仮想化レベルを上げるための計画は会社に利益をもたらす可能性がある。これは、特
にファブリックやスイッチングのレイアウトに関する柔軟性を重視し、容量やI/O機能を簡単
に拡張可能で、ストレージ仮想化を簡単かつ適切にサポートするストレージシステムに投資す
ることを意味する。
重要事項
一部のグリーンストレージ技術は特に有益である。パリティRAID、シンプロビジョニング、お
よびSATAドライブを使用した階層化またはキャッシングは、ストレージシステムの容量電力
効率を簡単に2倍にすることができる。プライマリストレージでは、デルタスナップショット
と重複排除も有効である。オンラインバックアップシナリオでは、ストリーミング重複排除が
最適であるが、上述したその他の技術もバックアップシステムに展開された場合に重要な役割
を果たす。
設計者とアーキテクトは、候補ベンダーに、すべてのタイプのストレージ最適化に対する自社
の取り組みを提示するように要求すべきである。
その他の資料
SNIAグリーンチュートリアルの参照先
http://www.snia.org/education/tutorials/2010/spring#green
http://www.snia.org/education/tutorials/2009/spring#green
グリーンストレージに関するSNIAグリーンストレージ分科会(GSI)ホワイトペーパーの参照先
http://www.snia.org/forums/green/knowledge/GSI_Best_Practices_V1.0_FINAL.pdf
謝辞
執筆者 Alan G. Yoder博士(NetApp)
SNIA内の校閲者 Mike Dutch(EMC)、Larry Freeman(NetApp)、Wayne Adams(EMC)
付録A. 候補ベンダーに対する質問リスト
以下は、重要なストレージの購入時にストレージベンダーが回答すべき質問の代表的なもので
ある。これらの相対的な重要性は、ストレージのインストールと使用目的によって異なる。
24 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
信頼性
1. 単一障害点の排除(no-SPOF)が要件に含まれているか。
2. RAIDグループ内の同時故障は何台まで耐えるべきか。
3. DR―サイト規模の災害を軽減するためにデータのリモートライブコピーが必要か。
可用性
4. 「9」は何個あるか。ファイブナイン(99.999%稼働)はシステム当たり年間5分の平均総計画外
ダウンタイムを意味する。フォーナインは年間50分の平均総ダウンタイムを許可する。スリーナ
インは8時間20分の平均総ダウンタイムを許可する。「ナイン」指定はハード保証ではなくSLO
(サービス品質)である。
5. RTO(目標復旧時間)―どの時点においても許容される機能停止時間はどのくらいか。RTOはSLO
である(この質問は質問3に関連したものである)。
6. RPO(目標復旧ポイント)―機能停止時に失われる可能性のある、生成されたが書き込まれてい
ないデータの容量はどのくらいか。これは、通常、分単位またはトランザクション件数で指定さ
れる。これもSLOである。
保守性
7. NDU(無停止アップグレード)は必要か。一部のFRU(交換可能部品)が対象か、それともす
べてのFRUが対象か。
8. 保守期間中の性能はどの程度なのか。
接続性
9. ストレージに接続されるシステムの種類は何か。使用されるプロトコルは何か(CIFS、NFS、
CKD、FC、SAS、SCSI、iSCSI、FCoE)。ベンダーはさまざまな要件に含まれるすべてのプロ
トコルをサポートしているか。
目的に対する適合性
10. ストレージ上でデータをホストするアプリケーションは何か。アプリケーションベンダーは
ストレージをサポートしているか。
11. ベンダーは、現地の環境内で製品をテスト可能な貸出プログラムを持っているか。データ量、
アーキテクチャの詳細、および参照数が提示されているかどうか、システムの最終テストがど
の程度正常に動作するか、および解決しようとしているビジネス上の問題点が解決されるかど
うか。
保存とコンプライアンス
12. 保存要件(会社の法務部門からの)はあるか。
13. ある場合は、それらをストレージで直接サポートできるか。ストレージ自体がプロトコル強化
機能を持つことがセキュリティに関して利点となる。
14. ロックダウンされた可能性のあるデータへの「バックドア」アクセスまたは「帯域外」アクセ
スからストレージを保護できるか。
25 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
15. データが誤って無保護のコンテナに書き込まれた場合に、ストレージからデータを「scrub
(洗浄)」できるか(「データ・シュレッダー」も同じ意味で使われる)
16. ストレージは、ロックダウンされたデータを変更または削除するすべての試みの監査をサポート
しているか。
17. 悪意のある管理アクセスから保存するために別のセキュリティドメイン内のリモートマシン上に
保存されているデータを監査できるか。
18. レコード管理システムはあるか。これに関するストレージ要件は何か。
19. 法的証拠開示要求が満たされる期間はどのくらいか。
a. 要件を満たしているサードパーティソリューションはあるか。
バックアップとアーカイブ
20. 誤った削除やデータ破損から回復するためのバックアップはどのくらいの頻度で実施すべきか。
21. 装置の破損または故障から回復するためのバックアップはどのくらいの頻度で実施すべきか。
22. バックアップコピーはどのくらいの頻度でオフサイトの場所にアーカイブすべきか。
23. 要求されたときにバックアップデータをどのくらい早くオンラインでアクセスできるようにす
べきか(数秒から数日までの範囲が考えられる)。
24. 要求されたときにアーカイブデータをどのくらい早くオンラインでアクセスできるようにすべ
きか(数秒から数日までの範囲が考えられる)。
25. それぞれのアーカイブ操作間で想定されるバックアップ回数はどのくらいか。
26. ローカルに維持すべきバックアップ数はどのくらいか。
サポート
27. 自動化された「自宅に電話」サポートは利用できるか。これにより、ベンダーはリモート診断
を実施して、問題が深刻になる前に修理を提案できる。
28. 適切なサポートパッケージが提供されるか。オプションには、フルオンサイト保守から48時間
応答時間までが含まれる。
29. サポートの価格表に装置の予想寿命に関する記述があるか(通常は5年)。
26 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION
データセンタ設計におけるストレージに関する留意点
ROIとストレージ効率
30. ROI計算で適切な情報が提供されるか。
a. ドル/IOPが計算上の装置の寿命を上回っているか。その場合は、装置の予想I/O負荷、つま
り、最大値の50%を使用して数値を正規化すること。
b. 物理容量に対する有効な容量の平均割合が提示されているか。その場合は、どのように計
算されたか。計算は信頼できるか。
c. 容量のドル/TBが計算上の装置の寿命を上回っているか。その場合は、上記(b)内の割合を使
用してそれを正規化すること。
31. ROI計算に、サポート、インストール、およびアーキテクチャの料金が含まれているか。
アップグレード方法
32. 現行システムを、提案された新しいシステムにアップグレードするために必要な手順は何か。
33. ベンダーは、提案された新しいシステムから、データが大幅に増大した場合に必要になる次の
レベルへのスムーズなアップグレード方法を提供しているか。
電力および温度監視
34. 装置上で使用可能な電力および温度監視用のオプションが事前に構成されているか。
35. 使用可能なオプションは既にインストール済みの監視パッケージと連動するか。
36. 会社でSNIA EmeraldTMデータシートを公開しているか。
会社と製品の生存性
37. ベンダーは創業何年か。
38. ベンダーは「順調に業績を伸ばしている企業」か。明らかな買収対象のベンダーや財政基盤の
弱いベンダーは、製品の耐用年数の途中でサポートが中断される懸念がある。
39. 製品はよく知られているか。主流でない製品や実験的製品は同様に存続期間に対する懸念があ
る。
27 of 27
2011 STORAGE NETWORKING INDUSTRY ASSOCIATION