スライド 1 - RED HAT OPENEYE

2
Red Hat Storage Server 2.0
~大量データ保存に最適な
ソフトウェアストレージ・ソリューション〜
レッドハット株式会社
Senior Solution Architect
and Cloud Evangelist
Etsuji Nakai / 中井悦司
v1.0 2012/10/23
Red Hat Storage Server 2.0
Contents




Red Hat Storage Server 2.0の概要
アーキテクチャ
Public Cloud (AWS)での構成パターン
参考資料
3
Red Hat Storage Server 2.0
Red Hat Storage Server 2.0の概要
4
Red Hat Storage Server 2.0
Red Hat Storage Server 2.0の特徴
 コモディティ・ハードウェア(x86サーバ)を利用して、 スケールアウト型の大容量ストレージ環境を構築するソフトウェア
– Nativeクライアント(FUSEマウント)/ NFSv3 により標準的なファイル システムとしてアクセスが可能
– REST APIでオブジェクトストレージとしても利用可能
– サポート上限として、最大64ノード、8PBのボリュームを構成可能
– クラスタ間での非同期データコピー(GeoReplication)が可能
 オンプレミス、およびパブリッククラウドで利用可能
– 「Red Hat Storage Server 2.0 For On-premise」
• OS (RHEL6)、分散ファイルシステム機能(GlusterFS)、管理ツールなどを パッケージングしたソフトウェア・アプライアンスとして提供
– 「Red Hat Storage Server 2.0 For Public Cloud」
• Amazon EC2で利用可能なAMI(マシンイメージ)として提供
5
Red Hat Storage Server 2.0
GlusterFSとRed Hat Storage Serverの関係
 GlusterFSは、コミュニティメンバによるオープンソースプロジェクトとして新機能の 開発を継続
GlusterFS Advisory Board Member (as of 2012/04)
Richard Wareing, Storage Engineer, Facebook
Jeff Darcy, Filesystem Engineer, Red Hat; Founder, HekaFS Project
AB Periasamy, Co-Founder, GlusterFS project
Ewan Mellor, Xen Engineer, Citrix; Core contributor, OpenStack project
David Nalley, CloudStack Community Manager, Citrix; Member, Fedora Advisory Board
Louis Zuckerman, Sr. System Administrator, Picture Marketing
Joe Julian, Sr. System Administrator, Ed Wyse Beauty Products
Greg DeKoenigsberg, Community VP, Eucalyptus; co-founder, Fedora project
John Mark Walker, Gluster.org Community Guy (Chair)
 Red Hat Storage Serverは、Red Hat独自の品質テストを行った安定バージョンのGlusterFS
を同梱したソフトウェア・アプライアンスとして商用サポートを提供
新機能の開発
商用サポート
とメンテナンス
GlusterFS
Red Hat
Storage Server
6
Red Hat Storage Server 2.0
Red Hat Storage Server 2.0のアーキテクチャ
7
Red Hat Storage Server 2.0
システム構成イメージ
 ストレージノードは、最小構成4ノードから必要に応じて追加可能
・・・
クライアントノード 群
10GbE / 1GbE接続
10GbEスイッチ x 2
10GbE接続
ストレージノード x 4
8
Red Hat Storage Server 2.0
スループットのリニアなスケールアウト特性
 シーケンシャルリードに対するパフォーマンス測定結果の例
総転送速度 MB/s
1ノード当たり転送速度 MB/s
– ストレージノード1台あたりの転送速度がほぼ一定で、ストレージノードを 追加した分だけ、総転送速度がリニアに向上していることが読み取れます。
ストレージノード数
Native Client (replica 1)
Native Client (replica 2)
NFS Client (replica 1)
NFS Client (replica 2)
ストレージノード数
(出典)http://rhsummit.files.wordpress.com/2012/03/england-rhs-performance.pdf
9
Red Hat Storage Server 2.0
アーキテクチャ
10
Red Hat Storage Server 2.0
メタデータノードを持たない分散アーキテクチャ
 分散ストレージを構成する各ノードの通常のファイルシステムを バックエンドデバイスとして使用します。
 ファイル名のハッシュ値から、DHT(Distributed Hash Table)を参照して、 保存するノードを決定します。
– DHTはクライアント上に動的に構成されるため、専用のメタデータサーバは不要
クライアントマシン
実際には各ノードのファイルシステムに
分散して保存されている
クライアントからは
1つのファイルシステムに見える
file01, file02, file03
ボリューム
ストレージノード
・・・
file01
file02
file03
11
Red Hat Storage Server 2.0
ノード / ブリック / ボリュームの階層構造
オンラインでボリューム
の拡張、縮小が可能
ノード1
ノード2
ノード3
/data/brick01
/data/brick01
/data/brick01
/data/brick02
/data/brick02
/data/brick02
ファイルシステム /data
ブリック
(単なるディレクトリ)
・・・
・・・
・・・
1つのボリュームは、各ノードが提供する
「ブリック」の集合として作られる
ボリューム vol01
 1つのノードが複数のブリックを提供することも可能です。
 ノードごとに提供するブリック数、ディレクトリ名などを揃える必要はありません。
 ボリュームサイズを拡大/縮小する際は、ボリュームに対するブリックの追加/削除を行います。
12
Red Hat Storage Server 2.0
ボリューム単位でアクセスパターンに
応じた最適な構成を選択可能
ボリュームの構成例
node01
node02
node03
node04
ストレージノード
/brick01
/brick01
/brick01
/brick01
ファイル単位で各ブリックに分散保存
(1つのファイルは1つのブリックに存在)
/brick02
1つのファイルを各ブリックに分散保存
ストライピング
/brick02
/brick02
/brick02
レプリケーション
/brick03
/brick03
レプリケーション
/brick03
/brick03
node01-node02、node03-node04で
それぞれレプリケーション
ストライピング
レプリケーション
/brick04
/brick04
レプリケーション
/brick04
/brick04
レプリケーションとストライピングの
組み合わせ
13
Red Hat Storage Server 2.0
トランスレータ・モジュールについて
 複数の「トランスレータ・モジュール」が連携してアクセス処理を行います。
– クライアント側で動くモジュールとサーバ側で動くモジュールがあります。
 それぞれのモジュールは異なる役割を持っています。
– 各モジュールは共有ライブラリとして提供されます。
– 独自のモジュールを作成して、プラグインすることも可能です。
[root@rhs20-01 ~]# ls -l /usr/lib64/glusterfs/3.3.0.2rhs/xlator/
total 48
DHT、レプリカなどの機能
drwxr-xr-x 2 root root 4096 Jun 16 15:25 cluster
drwxr-xr-x 2 root root 4096 Jun 16 15:25 debug
drwxr-xr-x 2 root root 4096 Jun 16 15:25 encryption
Quota、ファイルロックなどの機能
drwxr-xr-x 2 root root 4096 Jun 16 15:25 features
drwxr-xr-x 2 root root 4096 Jun 16 15:25 mgmt
drwxr-xr-x 2 root root 4096 Jun 16 15:25 mount
drwxr-xr-x 2 root root 4096 Jun 16 15:25 nfs
drwxr-xr-x 2 root root 4096 Jun 16 15:25 performance
キャッシュ、先読みなどの機能
drwxr-xr-x 2 root root 4096 Jun 16 15:25 protocol
drwxr-xr-x 2 root root 4096 Jun 16 15:25 storage
物理ディスクアクセスなどの機能
drwxr-xr-x 2 root root 4096 Jun 16 15:25 system
drwxr-xr-x 3 root root 4096 Jun 16 15:25 testing
14
Red Hat Storage Server 2.0
トランスレータ・モジュールの組み合わせ例
io-stats
統計情報の記録
md-cache
メタデータのキャッシング
quick-read
io-cache
データのキャッシング
read-ahead
write-behind
dht
クライアント
モジュール(*1)
replicate-1
サーバ
モジュール(*2)
DHTの処理
replicate-2
レプリケーション
client-1
client-2
client-3
client-4
server
server
server
server
brick
brick
brick
brick
marker
marker
marker
marker
index
index
index
index
io-threads
io-threads
io-threads
io-threads
I/Oスレッドの起動
locks
locks
locks
locks
ファイルロック処理
access-control
access-control
access-control
access-control
posix
posix
posix
posix
ブリック
ブリック
ブリック
ブリック
サーバとの通信
クライアントとの通信
ACL管理
ブリックへの物理アクセス
(*1) /var/lib/glusterd/vols/<Vol>/<Vol>-fuse.volで定義 (*2) /var/lib/glusterd/vols/<Vol>/<Vol>.<Node>.<Brick>.volで定義
15
Red Hat Storage Server 2.0
今後の機能拡張予定
 仮想マシンのディスクイメージ保存領域としての利用
– Red Hat Enterprise Virtualization 3.1以降で対応予定
– VMware vSphere、OpenStackなどへの対応は計画中
 マルチマスタレプリケーション
– クラスタ間で双方向の非同期レプリケーションに対応予定
 マルチテナント対応
– ユーザ認証、暗号化などにより、複数ユーザで安全にボリュームを共有
 TechPreview機能の正式サポート
– Hadoop API (HDFSの代替としての利用)
– InfiniBand(TCP over IB、およびRDMA)対応
– GUI管理コンソールの使用
 その他
– NFSv4対応
– スナップショット、データ圧縮、重複排除機能などの追加
※ これらはあくまで現時点での計画であり、必ず対応することをお約束するものではありません。
16
Red Hat Storage Server 2.0
Public Cloud (AWS)での
構成パターン
17
Red Hat Storage Server 2.0
AWSにおけるRHS2.0の利用方法
インターネット上
のクライアント
EC2インスタンス
Native Clinet
REST
EC2インスタンス
NFS
RHS2.0クラスタ
AMI (Amazon Machine Image)
インスタンス起動
・・・
サブスクリプション購入ユーザに
RHS2.0導入済みのAMIを提供
EBS (Elastic Block Store)
18
Red Hat Storage Server 2.0
Availability Zone間でのレプリケーション構成
RHS2.0クラスタ
Tokyo Region / Availability Zone A
Tokyo Region / Availability Zone B
・・・
・・・
レプリケーション
特定のAvailability Zoneが
停止してもRHS2.0は可動を継続
19
Red Hat Storage Server 2.0
GeoReplicationによる遠隔地データ保存
 WAN回線を用いて、遠隔地のRed Hat Storage Serverに向けた
非同期レプリケーション(GeoReplication)が可能
– シングルマスタ/マルチスレーブのレプリケーションが可能ですので、AWSを含めた複数のロ
ケーションへのGeoReplicationを構成できます。
AWS
GeoReplication
gsyncd
Red Hat Storage Server (スレーブ)
gsyncd
Red Hat Storage Server (マスタ)
iDC
gsyncd
Red Hat Storage Server (スレーブ)
20
Red Hat Storage Server 2.0
参考資料
21
Red Hat Storage Server 2.0
参考資料
 製品マニュアル
– http://docs.redhat.com/docs/ja-JP/Red_Hat_Storage/index.html
 Knowledge Base
– https://access.redhat.com/knowledge/products/red-hat-storage-server
 サポートHW構成
– https://access.redhat.com/knowledge/articles/66206
 推奨用途と非推奨用途
– https://access.redhat.com/knowledge/articles/88723
 GlusterFS技術情報(コミュニティ版GlusterFSに関する技術情報)
– https://sites.google.com/site/glusterfstech/
22