フラッシュストレージ技術と標準化動向

プレゼンテーションタイトルがここに入る
フラッシュストレージ技術と標準化動向
ストレージネットワーキング・インダストリ・アソシエーション日本支部
教育委員会
資料利用に関する注意事項
本プレゼンテーションに含まれる資料は、SNIAも
しくはSNIA日本支部に著作権があります。
会員企業は、以下の条件でこの資料をプレゼンテー
ション及び文書の中で利用できます。
スライドを利用する場合は、変更せずに複製しなければなりま
せん。
本資料を含む文書では、使用した資料の提供元がSNIA日本支部
であることを明示しなければなりません。
このプレゼンテーションは、 SNIA日本支部 教育委
員会のプロジェクトによるものです。
© 2014 Storage Networking Industry Association. All Rights Reserved.
2
目次
SSSの定義
フラッシュストレージ活用の種類
ストレージ階層化
オールフラッシュアレイ
NVDIMM
© 2014 Storage Networking Industry Association. All Rights Reserved.
3
SSSの定義
SSS = ソリッド・ステート・ストレージ
© 2014 Storage Networking Industry Association. All Rights Reserved.
4
ソリッド・ステート・ストレージ(SSS)とは?
半導体メモリ・チップで構成された回転プラッターやストリー
ミング・テープの代替ストレージ・デバイス
様々なフォーム・ファクター
(http://www.snia.org/forums/sssi/knowledge/formfactors)
SSD(ソリッド・ステート・ドライブ)
従来のHDDフォーム・ファクターを用いる
通常、ソリッド・ステート・ドライブは SATA、SAS、FCなどのストレージ・イン
ターフェースを用いる
SSC(ソリッド・ステート・カード)
プリント基板上にあるか、またはPCIカードなどの標準カード・フォーム・ファ
クターを用いる
通常、ソリッド・ステート・カードはPCIeなどのインターフェースを用いる
SSM(ソリッド・ステート・モジュール)
デュアル・インライン・メモリー(DIMM)、あるいは、SATAなどの標準HDD
インターフェースを用いる
通常、ソリッド・ステート・モジュールは、ソリッド・ステート・カードよりも
物理的に小さく、容量が少なく、パフォーマンスが低い
© 2014 Storage Networking Industry Association. All Rights Reserved.
5
特徴
不揮発性チップ、高密度
チップ はWriteに特別な処理を必要とする:
ウェア・レベリング
不良ブロック処理
HDDより速いが、RAMよりは少なくとも10倍遅い
一般的に、高いパフォーマンスのためには多くのチップ
が必要
ビット密度がディスク並み(Capable of disk density)
低消費電力
HDDよりも高信頼性
© 2014 Storage Networking Industry Association. All Rights Reserved.
SLC/MLC/TLC
情報量
SLC
<
MLC
<
TLC
性能
SLC
>
MLC
>
TLC
寿命(平均書き換え回数)
SLC > MLC > TLC
コスト
SLC
>
MLC
>
TLC
© 2014 Storage Networking Industry Association. All Rights Reserved.
7
xLC
eMLC=エンタープライズMLC
性能はMLCと同じ
平均書き込み寿命が長い(保持期間を犠牲)
cMLC = コンシューマMLC
擬似SLC
MLCをあたかもSLCのようにしてリード・ライト行う
SSD
コント
ローラ
擬似SLC
MLC
データ
データ
高速・少量
低速・大量
© 2014 Storage Networking Industry Association. All Rights Reserved.
8
フラッシュストレージの活用の種類
サーバ搭載
PCI フラッシュ
フラッシュ・キャッシュ
付きアレイ
フラッシュ階層
を持つアレイ
© 2014 Storage Networking Industry Association. All Rights Reserved.
全フラッシュ構成の
LUN/アレイ
9
フラッシュ・キャッシュ付きアレイ
概要:
アレイのDRAMキャッシュをフラッシュで拡張。
コントローラ搭載のPCI フラッシュ・カード、または、ドライブ・ベイ内のSSD
として実装。
一般的にはreadキャッシュのみ。ただし、writeキャッシュとしての実装もある。
キャッシュ・ページ・サイズ/キャッシング・スキームはアレイによって異なる
(一般的には4-16KB)。
フラッシュ・キャッ
シュ付きアレイ
利点:
アレイ ・キャッシュ・バッファが1%以下、または1-5%に拡張。
フラッシュ・キャッシュにヒットするとI/Oレーテンシーが10倍に向上(10+ms
 <1ms)。
それらのディスクI/Oをオフロードすることで、HDDの負荷が減り、性能も良く
なる。
結果: I/Oストリームのキャッシュ性に全て依存する。しかし、一般的に30-80%
性能 が向上する。
課題:
I/Oストリームのキャッシュ性に全て依存するので、結果が大きく変わる。
キャッシュとしてのフラッシュは非常に使用される(高頻度): SLCフラッシュ
が必要。
非常に高価: 主要ベンダーのリスト・プライスは$50-150/GB。
キャッシュは“徐々に(warm)”性能の利点が出てくる。リブートやHAイベン
トの際は効果が失われる。
利点が最小化するのは、 真のランダムI/Oストリームの場合: ランダムI/Oはラン
ダムなのでキャッシュされない。
© 2014 Storage Networking Industry Association. All Rights Reserved.
10
フラッシュ階層を持つアレイ
概要:
ストレージの複数階層(フラッシュ、高性能FC/SAS HDD、SATA HDD)を作成。 LUN
/ FSにまたがることも可能。
一般的に3.5”または2.5” SSDをドライブ・ベイ/シェルフに導入。
ほとんど5-10%がフラッシュ、90-95%がそれ以外。
バックエンド・ストレージは仮想化され、ブロック/ファイルはアクセス・パターンに
応じて階層間で移動する。
ベンダーによってチャンク・サイズは異なる。一般的にMB~GB単位。
移動頻度はベンダーによって異なる: 代表的な例は、日次で、I/O負荷が低い期間
(window)に移動。
フラッシュ階層を
持つアレイ
利点:
IOPSのためにフラッシュを使用し、容量のためにHDDを使用することができる。
全フラッシュ構成より廉価。フラッシュとHDDの混合による経済性を利用。
MLCおよびSLCフラッシュに最適。
性能を出すためにHDDを大量に構成している(over-built)場合、大幅にHDD数/設置
面積/消費電力を削減する可能性がある。
課題:
成功はI/Oストリームの予測とランダム性に依存する。
“ホット・ブロック(hot block)”が 一致(consistent)した場合にのみ、うまく機能
する
現在実装されているブロック・サイズは大きい;
1つのホット・ブロックが、チャンク全体(MB~GB )をフラッシュに移行させる。
“リアルタイム”なソリューションではない。チャンクは日次でプロモート/デモート
される。
設定と管理が難しい – 階層を増やして管理を複雑化することに価値があるのか?
© 2014 Storage Networking Industry Association. All Rights Reserved.
11
全フラッシュ構成のLUN/アレイ
概要:
100% フラッシュ構成のLUNを作成。
一般的に3.5”または2.5” SSDをドライブ・ベイ/シェルフに導入。
MLCおよびSLCフラッシュに最適。
利点:
全フラッシュ構成
のLUN/アレイ
10倍以上の性能向上の可能性 (vs. 1-2倍:キャッシュ付き/階層ソリューショ
ン)
これまで以上の定常的なレーテンシー: “キャッシュ・ヒットしない”ペナルティ無
し。
全I/Oがフラッシュの速度(一般的に、1ms未満)
劇的に小さなサイズ。ストレージ設置面積が1/4~1/5倍になる。
フラッシュの高速性がアレイ内のDRAMキャッシングの必要性を取り除く。
フラッシュの高速性により、RAIDのリビルド時間が大幅に向上する(数時間 
数10分)
課題:
コスト: $20/GB - $150/GB。 ベンダーとフラッシュ・タイプ(MLC vs. SLC)に
依存する。
接続性: これまでの(成熟した(matured))ディスク・アレイと比べて、ほとん
どのフラッシュ・アレイは、接続性のオプションが限られている。
HA & DR: ベンダーによって異なるが、これらのフラッシュ・アレイのHA/DRモ
デルは、既存のディスク・アレイよりも成熟していない。
© 2014 Storage Networking Industry Association. All Rights Reserved.
12
ホスト・ベースPCI フラッシュ
概要:
ホスト・ベースPCI フラッシュ・カード, 一般的には数100GBの容量
RAIDなし、または、サーバ内で2カードをミラー化
HAなし、または、複数サーバ間のアプリケーション・クラスタ
フラッシュ管理にホストのCPUを使用
サーバ搭載
PCI フラッシュ
利点:
非常に高い性能のフラッシュ・アーキテクチャーが可能
共有ストレージのコスト/負荷を減らす
非常に小さい設置面積
ホストのDRAMを削減できる可能性がある
課題:
非常に高額。各サーバに高価なフラッシュの島(island)を作る。
ほとんどのエンタープライズ用途で再設計が必要
保護が高価で難しい(HA、バックアップ)
複数サーバにまたがるHAにはミラーリングが必要
DRは、アプリ・レベル、または、外部のレプリケーションが必要
© 2014 Storage Networking Industry Association. All Rights Reserved.
13
PCIe SSD 搭載アレイ
SASインタフェースでなく、PCIe インタフェースを利用
 SFF-8639(コネクタの仕様)
 2.5インチドライブにPCIeイン
タフェースを追加するためのコ
ネクタ仕様
 多機能コネクタ
 SATA/SASのレーンもあり互換
性維持
 NVM Express(NVMe)
 コントローラの仕様
 AHCIに代わる
 SSD向けの最適化されたレジス
タ・コマンドセット定義
© 2014 Storage Networking Industry Association. All Rights Reserved.
14
ストレージ階層とは
階層とは、特定の性能特性を持つストレージ・メディアの一種
階層ストレージは、価格、性能、その他の属性に基づいて、
複数の異なるクラスに物理的に分割
自動ストレージ階層化は、アクセス・アクティビティやその他
の検討事項に基づいて、階層ストレージ構成内のクラスや階
層間でデータを動的に移動
© 2014 Storage Networking Industry Association. All Rights Reserved.
15
自動ストレージ階層化
非常に高速な
フラッシュ/SSD
高速ディスク
SAS 10Kおよび15K
キャパシティ・ディスク
ニア・ライン
SAS
SATA
階層1
階層2
階層3
SAS
SATA
© 2014 Storage Networking Industry Association. All Rights Reserved.
16
参照の確率でデータを分類
再参照の確率
時間が経過するに
つれ、低いカテゴリ
のデータのパーセン
テージが増える。
0
70~100%
1~5%の超高性能ア
プリケーション
1
10~25%のミッションクリ
ティカルな高性能アプリ
ケーション
2
20~35%の参照データ
3
40~65%の固定のコンテンツ、アーカイブ
© 2014 Storage Networking Industry Association. All Rights Reserved.
40~60%
20~30%
0~5%
17
ストレージのサイジングはバランス・ゲーム
大量のデータをあまりにも少ないスピンドルに格納  性能
上の問題
容量にかかわらず、ディスクが処理できる1秒当たりのI/O要求は同じ
である。
スピンドル・ディスクのI/O能力は、そのタイプ(15K rpm、10K rpm、
7.2K rpm)、シーク時間および遅延によって決まる。
ごく少量のデータを多数のディスクに格納  コストに影響
I/O要件を満たすために容量を未使用のままにしておく必要がある。
© 2014 Storage Networking Industry Association. All Rights Reserved.
18
階層化の使用理由
コスト要件を満たす
性能要件を満たす
クラウドサービスに適用する
© 2014 Storage Networking Industry Association. All Rights Reserved.
19
クラウドサービスでの利用例
Volume Types
Normal
HDD
Bronz
e
Hybrid
HDD + SSD
Silver
SSD
Gold
Platinum
PCIe SSD
© 2014 Storage Networking Industry Association. All Rights Reserved.
?
20
検討事項
階層を置くため、ストレージメディアの選択
階層化処理にかかるオーバヘッド
IO分布の把握
© 2014 Storage Networking Industry Association. All Rights Reserved.
21
オールフラッシュアレイ
性能重視
ハードウェアから、高速性を重視するためフラッシュに最適化
100万超えのIOPS
機能重視
既存HWやソフトウェアを活かしてフラッシュに対応
新興ベンダーよりも最大IOPSは低いがスケールアウトで全体の
ワークロードに対応
マネジメント機能をふんだんに備え既存ストレージとの連携も
保つ(スナップショット、クローン、ミラーリング、etc)
© 2014 Storage Networking Industry Association. All Rights Reserved.
22
選び方
負荷
負荷
負荷
負荷
負荷
負荷
負荷
100万
IOPS<
~40万 IOPS
オールフラッシュアレイ
ハイブリッド・アレイ
または、オールフラッシュアレイ
アプリケーション、データセンターの要件次第
© 2014 Storage Networking Industry Association. All Rights Reserved.
23
トレンド
SSD単体の容量が増大(TB台に入ってる)
価格もHDD並に?(表現は様々)
オールフラッシュアレイの機能差が小さくなっ
てくる
管理面
フラッシュ最適機構
© 2014 Storage Networking Industry Association. All Rights Reserved.
24
NVDIMMとは?
サーバーサイド
メモリとストレージの性能ギャップ
DRAMとSSD/HDとのレイテンシ差は依然として大きい
NVDIMMが低レイテンシアーキテクチャとして登場
© 2014 Storage Networking Industry Association. All Rights Reserved.
25
NVDIMM - 概要
メモリ・チャンネル(DDR3/DDR4)に常駐
予期しない停電時にデータを保持
成熟したメモリ技術を結合(DRAMおよびフラッシュ)
永続性を確保するための独立電源が必要
NVMプログラミング・モデルに適合(SCMの前身として)
新たなレベルのストレージ性能を提供
データベースのより迅速な実行と回復が可能
SSDの耐久性と信頼性の両方を向上可能
© 2014 Storage Networking Industry Association. All Rights Reserved.
26
メモリ/ストレージの問題(遅延)
不揮発性メモリ階層
揮発性メモリ階層
10K ns
100ns
PCIe SSD
100K ns
DRAM
10ns
SAS SSD
10M ns
CPU Cache
1ns
HDD
 CPU技術はムーアの法則によって発展するため、メモリI/Oが性能上の著しいボトルネックとなる。
 メモリ/ストレージ階層での遅延ギャップをブリッジする必要がある。
 現状の解決策はNVDIMMである(DRAMのストレージ遅延)。
© 2014 Storage Networking Industry Association. All Rights Reserved.
27
メモリ/ストレージ階層




データ集約型のアプリケーションは、ストレージに迅速にアクセスできる必要が
ある。
メイン・メモリとHDDの間には大きなパフォーマンス・ギャップがある。
SSDはこのギャップを縮小したが、まだ大きなギャップがある。
解決は「SCM」が実用化される時(2020年?)
パフォーマンス・ギャップ
CPU
キャッシュ
SRAM
100
新しいメモリ
MAIN
MEMORY技術
SSD
HDD
MRAM/ReRAM
DRAM
101
NAND
102
103
104
105
ACCESS TIME (ns)
© 2014 Storage Networking Industry Association. All Rights Reserved.
磁気
106
28
メイン・メモリのロードマップ
揮発性DRAM
不揮発性メモリ
相対的能力
SCM



MRAM
PCM
ReRAM
NVDIMM
DDR4


DDR3
2012
2014
スケーリングの問題
製造上の問題点 < 2x nm
2016
© 2014 Storage Networking Industry Association. All Rights Reserved.
2020
29
業界がメモリに期待すること(最終目標)
 無限の耐久性
 最小の遅延
 大容量
 不揮発性
 低電力
 拡張性
現在、NVDIMMはその大半を実現している
…
 低コスト
© 2014 Storage Networking Industry Association. All Rights Reserved.
30
どのように機能するか
通常動作
1. 通常動作時には、NVDIMMは標準のDDR3 DRAMモジュールのように見える。
DRAM遅延(ナノ秒)
DRAMの耐久性(実質的に無限)
DRAMの帯域幅(1つのNVDIMMにつき12GB/秒)
© 2014 Storage Networking Industry Association. All Rights Reserved.
31
どのように機能するか
停電 - DRAMをフラッシュに保存
1.
2.
停電時:NVDIMMはバスから隔離される。DRAM内のすべてのデータ(ECCを含む)は、
NVDIMMロジック経由でオンボード・フラッシュに保存される。この動作時には、超コンデンサ
がモジュールにホールド・アップ電力を供給する。
保存が終了すると、NVDIMMモジュールがシャット・ダウンする。
© 2014 Storage Networking Industry Association. All Rights Reserved.
32
どのように機能するか
電力復旧
1.
システムに電力の供給が戻ると、超コンデンサが再充電され、データがフラッシュから
DRAMに復旧される。
© 2014 Storage Networking Industry Association. All Rights Reserved.
33
どのように機能するか
再び通常状態へ
すべてのデータがDRAMに復旧されると、NVDIMMはホスト・システムとのI/Oト
ランザクションができるようになる。
2. ホスト・システムが起動を完了し、通常のNVDIMM動作が継続される。
1.
© 2014 Storage Networking Industry Association. All Rights Reserved.
34
Ecosystem performance gap between compute & storage
CPU
NVDIMM
• Nanoseconds latency (1000x faster than Flash)
• 1.4 million IOPS (3x better)
DRAM
PERFORMANCE GAP
PCIe SSD
milliseconds
Performance (Latency)
Nanoseconds
Storage: latency & capacity
SSD
HDD
1GB – 32GB
STORAGE
60GB – 4TB
Volatile
© 2014 Storage Networking Industry Association. All Rights Reserved.
NonVolatile
35
Example of NVDIMM Performance
(Bandwidth – GB/sec)
Benchmark:
VDBENCH, Platform: Intel Sandybridge, Linux, Two DDR3-1333
NVDIMMs as interleaved pair (channel interleaving),
PRAMFS vs. SATA SSD as Linux block device
© 2014 Storage Networking Industry Association. All Rights Reserved.
36
$ per i/o : A new Storage metric ?
COST ($)
パフォーマンス vs. コスト($ per I/O) トレードオフ
HDD
SSD
PCIe SSD
PERFORMANC
E / COST GAP
NVDIM
M
DRAM
*Cost per PB written:
Best in Class SSD: $100.00 / PB versus. NVDIMM: $0.40 (250x cost savings)
Reference: http://www.vikingtechnology.com/uploads/NVDIMM_Technical_Comparison.pdf
PERFORMANCE
Volatile
© 2014 Storage Networking Industry Association. All Rights Reserved.
NonVolatile
37
オプション - 柔軟性 - メリットとデメリット



フラッシュはDRAMよりも安い(ギガバイト単価)。
NVDIMMの遅延はフラッシュに比べて1,000倍小さい。
DRAMの耐久性は実質的に無限である。



ハイパースケールには「密度と安さ」が必要である。
金融用途では、予測可能な低遅延が必要である。
ストレージには、高いI/O性能とデータ・セキュリティが必要である。
© 2014 Storage Networking Industry Association. All Rights Reserved.
38
重要なのは・・・
標準サーバは非常にフレキシブルになった。
どのようなアプリケーションの要求にも対応できるソリュー
ションがある。
•
•
•
最高性能のストレージ: NVDIMM
大容量フラッシュ: PCIe SSD
遅延が少ないSSD: ULLtraDIMM
© 2014 Storage Networking Industry Association. All Rights Reserved.
39
活用の可能性
 インメモリコンピューティング



インメモリデータベース
分散処理、機械学習(繰り返し)処理
系
BI、可視化系ソリューションソフト
更にビジネススピードを加速させる
© 2014 Storage Networking Industry Association. All Rights Reserved.
40
まとめ
SSSはコンシューマ、エンタプライズどちらでも成長
(よりフラッシュに最適なH/W、S/Wの展開)
オールフラッシュアレイも多く投入されている
DRAMとフラッシュのギャップを埋める低遅延領域も新
たな技術が出現
多様なワークロードに対して、様々な対応の形がコスト
感も含め、ユーザーは柔軟に選択しインテグレーション
できる環境がある
© 2014 Storage Networking Industry Association. All Rights Reserved.
41
参考資料
SNIAチュートリアル(英語のみ)
www.snia.org/education/tutorials
PCIe SSD関連
www.nvmexpress.org
www.scsita.org
www.t10.org
SNIA SSS PTS関連
標準仕様書
http://www.snia.org/tech_activities/standards/curr_standards/pts
SSDクライアント&エンタープライズPTSの比較データ、技術
白書(ホワイドペーパー)、Webcast等の情報
www.snia.org/forums/sssi/pts
© 2014 Storage Networking Industry Association. All Rights Reserved.
42
参考図書
SNIA-J推薦図書
「よくわかるストレージネットワーキング」
喜連川優編 : オーム社
SNIAストレージネットワーキング用語集
このチュートリアルに関するご意見は以下にご連絡ください。
SNIA日本支部 教育委員会 [email protected]
© 2014 Storage Networking Industry Association. All Rights Reserved.