FUJITSU Integrated System HA Database Ready SX2 PCIe SSDの

FUJITSU Integrated System HA Database Ready
CA92344-0450-01
2014年2月28日
PCIe SSDの書き込み保証値とその監視方法
FUJITSU Integrated System HA Database Ready SX2における、PCIe SSDの書き込み保証値とその監視方法につい
て説明します。
●PCIe SSDの書き込み保証値について
PCIe SSD は、書き込み寿命を有する NAND フラッシュを含んだ「有寿命部品」となります。PCIe SSD の書き
込み保証値は 34PB ですので、
製品標準保守期間内に寿命が来る可能性は極めて低いです(注)。ただし、
PCIe SSD
の寿命に到達する時期は、お客様のご使用方法(書き込みデータ量や書き込み回数)に大きく依存します。
SupportDesk 契約における定期保守時にはお客様同意の元、当社保守員によりデバイスの状態を確認・ご報告
いたしますが、お客様ご自身でも必ず以下の方法で PCIe SSD の書き込み状態を確認してください。なお、PCIe
SSD は両方のサーバユニット(ServerUnit#1 および ServerUnit#2)に搭載しているものがほぼ同時に寿命に到達
するため、早めの交換準備(予算の確保、発注手続きなど)をお勧めします。
製品故障による修理の際に、PCIe SSD が書き込み保証値に達して寿命に至っていた場合、SupportDesk 契約の
有無に関わらず、修理をお受けすることはできません。その際は、お客様に PCIe SSD をご購入頂く必要があり
ます。
注) 書き込み保証値の詳細については、「SSD 製品の書き込み保証値とその監視方法」の"PCIe SSD-Duo 2.4TB"を参照。
●PCIe SSDの書き込み状態を確認する方法
各サーバユニットにログインして、以下の作業を実施してください。
1. ServerUnit#1に、スーパーユーザーでログインします。ログイン方法については“利用ガイド”の“サーバ
へのログイン方法”を参照してください。
2. ServerUnit#1で "fio-status"コマンドを実行すると、PCIe SSDの状態情報が表示されます。
それぞれのReserve space statusおよびRated PBW(Peta-Bytes Written)の値を確認し、現在までの使用期
間から寿命に到達する時期を推測してください。確認方法の詳細は、"図1. コマンド実行例"を参照してくだ
さい。
3. 同時に、ServerUnit#2にログインしてPCIe SSDの状態を確認してください。
1
Copyright 2014 FUJITSU LIMITED
FUJITSU Integrated System HA Database Ready
図1. コマンド実行例
# fio-status -a
Found 2 ioMemory devices in this system with 2 ioDrive Duos
Driver version: 3.2.3 build 950
…
Adapter: Dual Controller Adapter
確認ポイント1 (注1)
Fusion-io ioDrive2 Duo 2.41TB, Product
…
fct0
Attached
…
Reserve space status: Healthy; Reserves: 100.00%, warn at 10.00%
Rated PBW: 17.00 PB, 99.99% remaining
Lifetime data volumes:
確認ポイント2(注2)
Physical bytes written: 1,353,589,307,216
Physical bytes read : 373,609,458,144
…
fct1
Attached
…
Reserve space status: Healthy; Reserves: 100.00%, warn at 10.00%
Rated PBW: 17.00 PB, 99.99% remaining
PCIe SSD1枚単位に
Lifetime data volumes:…
表示される情報で
す。(注3)
Physical bytes written: 1,338,056,636,512
Physical bytes read : 372,373,048,008
…
…
注1) 不良ブロックの交替用領域の残量の割合を示します。書き込み回数超過となった不良ブロックが増えるにつれ、
数値が減少していきます。"100%"は、まだ不良ブロックが発生していない状態です。
不良ブロックの交替用領域の残量が0%に達すると、書き込み低減モードに移行します。これは、データをPCIe SSD
の外に安全に移行できるように、寿命をある程度延ばすためのモードです。この状態では、書き込み性能が低下
しますが、PCIe SSDは通常どおりに動作します。
不良ブロックの交替用領域の残量が0%に達した後、しばらくするとPCIe SSDは読み取り専用モードに入ります。
このモードでは、PCIe SSDへの書き込みを行おうとしてもエラーになります。
注2) PCIe SSDの書き込み保証値(17.00PB)と、それに対する現在以降に書き込み可能なデータ量の割合を示します。
書き込まれるデータ量に比例して、書き込み可能なデータ量の割合が減少していきます。
書き込み可能なデータ量の割合が0%に近づくと、一般的に書き込み回数超過の不良ブロックが増える傾向にあり
ます。それに伴い Reserve space statusの減少に繋がります。
Rated PBWが表示されない場合は、Physical bytes writtenの値を使って以下の計算式で算出してください。
Rated PBW(%) = 100 - (Physical bytes Written ÷ 17,000,000,000,000,000) x 100
なお、1つのPCIe SSDの書き込み保証値は、fct0の17.00PBとfct1の17.00PBを合算して34.00PBとなります。
2
Copyright 2014 FUJITSU LIMITED
FUJITSU Integrated System HA Database Ready
注3) PCIe SSDの搭載数により、fctxの表示数が異なります。
製品
各サーバユニットでのPCIe SSDの搭載数
fctxの表示
2CPUモデル
1
fct0~fct1
2CPUモデル+容量増設オプション
2
fct0~fct3
4CPUモデル
2
fct0~fct3
4CPUモデル+容量増設オプション
3
fct0~fct5
●PCIe SSDの寿命を通知するメッセージ
上記のデバイスが書き込み低減モードに入った場合と、デバイスが読み取り専用モードに入った場合で、
Appliance Managerのメッセージウィンドウに以下のメッセージが表示されます。
契機
デバイスが書き込み
メッセージID
10959
エラー種別
Error
メッセージ
ServerView received the following alarm
低減モードに入った
from server ServerUnit%d:#012Write
場合
performance reduced
デバイスが読み取り
10960
Error
ServerView received the following alarm
専用モードに入った
from server ServerUnit%d:#012Write
場合
operations disabled
%d :1または2が表示され、サーバユニットの番号を示します。
本メッセージが表示された場合は、速やかにPCIe SSDを交換してください。交換方法については“利用ガイド”
の“ハードウェア部品交換”を参照してください。
なお、交換後にデータのリカバリー作業も必要になり、時間を要する場合があります。業務への影響を考慮し
て計画的に実施してください。リカバリー所要時間の目安については“利用ガイド”の“警告・異常時の対処
とリカバリー”を参照してください。
3
Copyright 2014 FUJITSU LIMITED