Continuous Processing Paper

ストラタス® Continuous Processing® テクノロジー —
The Smarter Approach to Uptime™
ホワイトペーパー
Larry Sherman 著、2003
Stratus Continuous Processing Technology
Page 1
目次
概要
3
Continuous Processing 設計の概要
4
ロックステップ・テクノロジ―
6
フェイルセーフ・ソフトウェア
10
Active Service™アーキテクチャ
16
まとめ
21
Stratus Continuous Processing Technology
Page 2
概要
ストラタステクノロジーの無停止型(フォールト・トレラント)ftServer®システムのフ
ァミリは、Microsoft®Windows® 環境に対して、業界最高の 99.999%以上の稼働率を提供
できることが証明されています。この即時に、そして透過的な、可用性を維持する基本
的なしくみは、すべての ftServer システムに組み込まれている Stratus®Continuous
Processing®技術であり、これによって The Smarter Approach to Uptime™が可能となりま
す。
設計時からサーバのハードウェア、ソフトウェア、そしてサービス技術に、可用性を向
上させるしくみを組み込む事により、ストラタスは、業界標準 Intel®プロセッサをベー
スにしたサーバで卓越した可用性を顧客に提供すると同時に、シンプルな操作性とより
大きな経済的利点を提供しています。
このドキュメントでは、第二世代の ftServer シリーズに実装されているストラタス
Continuous Processing 技術の概要を説明します。続いて Continuous Processing 設計のベー
スとなる技術、すなわち、ロックステップ・テクノロジー、フェイルセーフ・ソフトウ
ェア、ActiveService™アーキテクチャについて詳しく説明します。
Stratus Continuous Processing Technology
Page 3
Continuous Processing 設計の概要
最高の稼働率を実現する為には、ハードウェア、ソフトウェアそしてサービスのすべて
に対して総合的に対応する必要があります。Windows 市場では、ストラタステクノロジ
ー社とその販売チャネルパートナーのみが ftServer システムにて、このトータルソリュ
ーションを提供できます。
すべてのストラタス ftServer システムには、Continuous Processing 機能が組み込まれてい
ます。これは、世界中のミッション・クリティカルおよびビジネス・クリティカルなア
プリケーションの要求に対して、20 年以上にわたって稼働率を保証してきた経験と技術
の結果です。
Continuous Processing 設計のすべての技術と要素が、不測のダウンタイムを、単純に最
小限にするのではなく、回避するために協調動作します。ダウンタイムを回避すること
が、ftServer システムを堅牢な従来のサーバや高可用性クラスタ(複数のサーバを使用
して、クラスタ中の 1 つのサーバが故障した場合、すみやかにダウンした状態から復帰
する)と区別する重要な設計ポイントです。ストラタスでは、この無類の可用性と信頼
性の実現を The Smarter Approach to Uptime という言葉で示しています。
特筆すべき点は、市販の Windows ベースのアプリケーションは、何ら修正の必要なく、
このように優れた可用性の恩恵を受けられる事です。クラスタ・システムではフェイル
オーバー・スクリプト、繰り返し必要なテスト、アプリケーションをクラスタに対応さ
せるためのソフトウェアの変更などが必要であることを考慮すると、この利点は大きな
優位性となります。
図1
ストラタス Continuous Processing 設計の主要な要素
ストラタスは、3 つの基本的要素を通じて、frServer システムの Continuous Processing 機
能を実現します。
• ロックステップ・テクノロジー :ロックステップ・テクノロジーは、冗長化された
フォールト・トレラントのハードウェア・コンポーネントで、同じ命令を同じタイ
Stratus Continuous Processing Technology
Page 4
ミングで処理します。コンポーネントのハードウェア障害が発生した場合でも、対
となるコンポーネントがアクティブなスペアとして継続して動作し通常の稼働を続
け、システムのダウンタイムを回避します。システムは、点検しないで放置した場
合ソフトウェアの障害に発展する、一時的なハードウェア・エラーを検出して対処
します。
第二世代の ftServer システムには、このハードウェアによるロックステップ・テク
ノロジーを取り入れ更に大きく改善・進歩させた ftServer3300、5600、および 6600
モデルがあります。これらのシステムでは、ハードウエア・デザインの変更と、業
界標準のモジュラ・コンポーネントの採用により、優れたコストパフォーマンス、
大幅に改善されたスペース効率、より優れた投資保護、よりシンプルな保守性を提
供します。(これらの利点に関しては、「ロックステップ・テクノロジー」および
「ActiveService アーキテクチャ」の節で詳しく説明します。)
フェイルセーフ・ソフトウェア :フェイルセーフ・ソフトウェアはロックステップ・テ
クノロジーとともに機能し、多くのソフトウェア・エラーが機能停止に発展するのを防
止します。従来のサーバやクラスタ・システムとは異なり、ftServer ハードウェアとソ
フトウェアは、ほとんどのエラーを透過的に処理し、オペレーティング システム、ミド
ルウェア、アプリケーション・ソフトウェアを保護します。ストラタスのテクノロジー
のもう一つの大きな利点は、メモリ内のデータを絶えず保護し、維持していることです。
さらに、強化されたデバイス・ドライバは ftServer システム上の Windows 環境に大きな
信頼性を追加します。
•
ActiveService アーキテクチャ :ActiveService 機能により、他のベンダでは提供でき
ない標準実装された保守性を実現しています。ストラタスの ftServer システムは、
絶えず自身の動作を監視し続けます。故障が発生するとそれを検出し、その故障ユ
ニットを切り離し、Stratus サポート・センターに自動的に電話をかけ、障害コール
として登録され、どのような処置をすべきかを伝えます。
遠隔サポート機能は、ftServer Access Adapter とグローバルな ActiveService ネットワ
ークによって実現し、Stratus サポートエンジニアが、トラブルへの対応や解決にか
かる時間の 95%以上を、オンラインで実施しています。ftServer システムが中断しな
いで運転を続けている間に、認定技術者やユーザは交換部品を簡単に交換すること
ができます。さらに、セキュアな Web ベースの ActiveService マネージャにより、ス
トラタスと連携しているサービス認定パートナーは、協力して問題をより早く解決
することができます。
以降では、Continuous Processing 技術の 3 つの側面それぞれについて、詳しく説明しま
す。
ロックステップ・テクノロジー
ftServer ファミリは二重化されたコンポーネントを使うことにより、シングル・ポイン
ト障害の可能性を排除し、コンポーネントに障害が発生した場合でも、中断せずに処理
を続けます。ハードウェア障害は、フェイルオーバーによるサービス中断やデータ損失
が発生することなく自動的に処理されます。
Stratus Continuous Processing Technology
Page 5
ftServer システムは、ストラタスのロックステップ・テクノロジーを使って、複数の
CPU-メモリ装置を正確に同期化し、まったく同じクロックサイクルで同じ命令を実行
します。ロックステップ処理では、どんなエラーであっても、たとえ一時的なエラーの
場合でも確実に検出され、システムは処理を中断せずに、データや状態を失うことなく、
CPU-メモリ装置障害時にも稼動を続けることができます。
多くの高可用用途向けとされるサーバでは、予備の電源やファン、ディスクドライブが
実装されていますが、マザーボード、プロセッサ、メモリ、I/O バス、I/O アダプタ
を含む主要なシステム・コンポーネントに対して障害に対する保護を提供できるのは、
ストラタスだけです。この手法のもう一つの大きな利点は、ftServer システムが、1 つの
システムとして構成され、ソフトウェアが 1 本ずつ搭載されることです。これにより、
マルチノード・クラスタと比べると、ソフトウェアのライセンス・コストが減少し、管
理がシンプルになります。
図2
ロックステップ・テクノロジーの概念図
フォールト・トレラントの入出力(I/O)サブシステムは、物理的に CPU-メモリ・サブ
システムから分離されています。ハードウェア・ロジックはカスタム ASIC の形式で、
CPU と I/O 間の PCI ブリッジとして動作し、エラーの検出、障害部位の特定、ロックス
テップ・アーキテクチャによる同期化機能を提供します。これらの ASIC は、図 2 の
Stratus North PCI(SNP)ASIC と Stratus South PCI(SSP)ASIC です。SNP にはプライマ
リ PCI インタフェース、割り込み制御機能、トランザクション命令ロジックが含まれま
す。SSP には、多数決ロジック、セカンダリ PCI インタフェース、エラー・レジスタが
含まれます。これらの ASIC は、第二世代の ftServer 設計においてバックプレーンに一
Stratus Continuous Processing Technology
Page 6
体化されたバス接続コネクタを使用して、多重化された CPU と多重化された I/O モジュ
ールをサーバ内で接続します。
フォールト・トレラントの入出力(I/O)サブシステムは、二重化された PCI バス、二
重化された I/O アダプタ、および二重化されたデバイスの使用により実現されます。基
本的な ftServer 構成には、2 つの独立した PCI バスが含まれます(さらに 2 つの PCI バ
スを追加する事もできます)。すべての重要な PCI アダプタ、すなわち、SCSI、イーサ
ネット、遠隔保守アダプタ、およびファイバーチャネル・アダプタも二重化されます。
内部と外部の SCSI ディスク・ストレージはミラーリングされ(RAID 1)、2 つの独立
した SCSI バス経由で接続されます。
内部と外部のストレージ処理に対して、どの論理 I/O 動作に対しても、複数のパスが利
用できます。I/O 動作に障害が発生した場合、代替パスを使用して処理されるため、I/O
動作が正常に完了します。
Dual Modular Redundancy(DMR:完全二重化)と Triple Modular Redundancy
(TMR:三重化)
ストラタスでは、標準の Dual Modular Redundancy(DMR:完全二重化)モードの
ftServer システムを提供しています。これには 2 つの CPU-メモリ装置を使用します。こ
れらのシステムは、競合するクラスタシステムとは比較にならない可用性を提供します。
DMR システムは、「ファイブ・ナイン(99.999%)」の可用性を達成するように設計さ
れており、今日までの実績では、この設計目標を上回る性能が示されています。
ftServer のモデルの中には、Triple Modular Redundancy(TMR:三重化)がオプションと
して提供されているものがあります。TMR は 3 番目の CPU-メモリ装置をシステムに追
加して、さらに高水準の信頼性を提供します。TMR 構成では、プロセッサやメモリの
障害が発生した場合でも、システムはデフォルトの DMR 動作、すなわち、ファイブ・
ナインの可用性を持つ完全冗長サーバになります。TMR システムは、最も重要なアプ
リケーション用として、最高水準の信頼性を顧客に提供します。
前述のように、すべてのマザーボードは、単一のシステムクロックからのロックステッ
プ手法で稼動します。障害検出と特定のロジックにより、全マザーボードからの I/O 出
力が比較され、不一致がある場合はエラーが示されます。DMR システムは、各マザー
ボードの障害検出ロジックに依存して、どのボードでエラーが発生しているのかを判断
します。マザーボードのエラーが示されない場合は、ソフトウェア・アルゴリズムによ
ってどのボードに問題が発生しているのかを判断します。TMR システムでは、3 重化多
数決による比較をし、故障したボードを正確に検出して切り離します。
業界標準とモジュラ・コンポーネントの活用
ftServer アーキテクチャは、DMR と TMR を含めて、ストラタスの従来の「ペアアンド
スペア・アーキテクチャ」の利点を活かしながら、よりシンプルで、より実装に必要な
部品数の少ない設計となっています。各モジュールの物理的設計において既存の標準的
な技術を活用することは、コスト的に有利になるだけでなく、新しい ftServer モデルに
対する開発時間や市場に出すまでの時間の短縮を可能にします。
Stratus Continuous Processing Technology
Page 7
実際に、ftServer 製品ラインは、標準のインテル・サーバのコンポーネントと設計を十
分に活用しています。標準のインテル・サーバとの最大の違いは、ftServer 製品が、PCI
I/O をマザーボードの他の部分と分離し、障害検出ハードウェア・ロジック、すなわち
ストラタスのカスタム ASIC を追加していることです。これは、ロックステップ動作や、
効果的な障害検出と特定に欠かせないものです。
第二世代の ftServer システムでは、業界標準のコンポーネントとモジュール方式を全面
的に適用しています。ファミリの全モデルは、共通のシャーシおよびバックプレーンの
使用により、多くの共有のコンポーネントを使用したモジュール方式をベースに設計さ
れています。この手法は、ftServer 製品全体にわたって重要な利点を新たにもたらして
います。
•
省スペース化ラックマウント・パッケージ
•
コストパフォーマンスの向上
•
よりよい投資保護
省スペース化ラックマウント
I/O コンポーネントへの Disk の内蔵、標準搭載 I/O インタフェースの追加、省スペース
化への注力により、新しい世代の ftServer システムでは、平均すると以前の ftServer モ
デルの半分の大きさになっています。4U モデル ftServer 3300 から、10U の 4-way
Symmetric Multi-Processing(SMP)モデル ftServer 6600 まで、新しいファミリの ftServer
システムは、データセンターの省スペース化を図り、標準のラック装置に簡単に統合で
きます。例として、単一の 42U ラックには、電源供給装置や他の周辺装置と一緒に、8
つまでの ftServer3300 システムを搭載できます。
コストパフォーマンスの向上
新しい製品ファミリのあらゆる点で、顧客はサーバ性能の向上を低価格で受けられます。
たとえば、ftServer 3300 は前モデルの 3 倍以上の CPU 性能を提供し、ftServer 5600 は以
前の ftServer 5240 モデルの半分の価格でより大きい I/O 帯域を提供します。ftServer 6600
では、新しい水準の 4-way SMP オプションが、以前の 4-way モデルより 35%以上も低い
価格設定になっています。
よりよい投資保護
第二世代の全ての ftServer システムは、3 つの主要コンポーネント、CPU、コア I/O、拡
張 I/O で構成されています。
コア I/O エンクロージャは、全モデルに共通の 1U コンポーネントです。各コア I/O エン
クロージャには内蔵のシリアル、USB、SCSI、イーサネット(10/100 およびギガビッ
ト)インタフェース、ユーザ使用可能な 2 つの PCI スロット、CD-ROM、ホットプラ
グ・ディスク・ドライブを収容可能な 3 つのスロットがあります。
拡張 I/O エンクロージャは、ftServer 5600 および ftServer 6600 モデル両方で使用されて
いる 1U コンポーネントです。各拡張 I/O エンクロージャは、独立した PCI バスを持ち、
それぞれユーザ使用可能な 3 つの PCI スロットを実装しています。
Stratus Continuous Processing Technology
Page 8
CPU エンクロージャは 1U または 2U の高さで、プロセッサとメモリの両方が含まれて
います。CPU エンクロージャは各 ftServer モデルで異なりますが、多くの設計要素やサ
ブアセンブリが共通しています。
全モデルで、共通の PCI アダプタ、ストレージ・オプション、その他周辺機器を共有す
ることができます。
このモジュール設計により、通常のサーバでは不可能なアップグレードに対する柔軟性
が実現します。ftServer 3300、5600 および 6600 では、アセンブリ化されているので新し
いプロセッサについても、システムの他のコンポーネントに影響することなく、アップ
グレードのように実装することができます。さらに、3 つの ftSerer モデルに共通したコ
ンポーネントが使用されているため、ストラタスでは、より強力なモデルにアップグレ
ードしたい顧客にそれまでの投資を無駄にしないでアップグレードが可能となります。
Stratus Continuous Processing Technology
Page 9
フェイルセーフ・ソフトウェア
ストラタス ftServer システムは、Microsoft Windows 2000 Advanced Server および
Windows Server™ 2003 Enterprise Edition オペレーティング システムに対応し、且つ、ソ
フトウェアの可用性機能を提供しています。
Windows 2000 が稼動している ftServer ファミリは、実稼動システムにおいてハードウェ
アとオペレーティング システムの可用性のレベルが 99.999%を超えることが実証されて
います。Windows Server 2003 は、実績のある Windows 2000 ベースにホットプラグ PCI、
メモリ・ミラーリング、ミニポート・ドライバ用のロード・バランシングとフェイルオ
ーバー、およびマルチパス I/O などの機能を提供しています。これらの新しい機能によ
り、ftServer シリーズの優れた連続稼動性の向上が期待できます。
ストラタスでは、フェイルセーフ・ソフトウェア機能を追加することにより、システム
とアプリケーション障害の既知の原因に対応し、修理やメンテナンス中のダウンタイム
を最小限にします。
•
ソフトウェアを一時的なハードウェア・エラーから遮断
•
強化されたドライバによりソフトウェア障害を防止
•
ソフトウェアの問題を正確に分析、レポート
•
メモリ内のデータをハードウエア障害時にも維持
•
広範囲のインテグレーション/擬似障害擬似障害テストにより複雑なエラーを発見し
て解決
これらのソフトウェアの拡張すべてが、Windows のコアのオペレーティング システ
ム・コードに影響なく組み込まれています。その結果、ftServer システムは Windows
Server オペレーティング システムとの完全なアプリケーション・バイナリ・インタフェ
ース(ABI)の互換性を維持します。すべての ftServer システムは、他のサーバと同様
に厳しい Windows Hardware Compatibility Test(HCT)に合格しており、Windows アプリ
ケーションを変更せずにストラタス ftServer システムで動作することが保証されていま
す。現行の ftServer モデルはすべて Microsoft Hardware Compatibility List(HCL)にリス
トされています。
一時的なハードウェア・エラー
ftServer ハードウェアとシステム・ソフトウェアは、ハードウェア・エラーとともに発
生する一時的なエラーを切り離し、又は自動的に復帰するように設計されています。一
般的にソフトウェアの設計ではハードウェア・エラーが発生した場合の処理の脆弱性が
ある事が知られているので、一時的なエラーおよびハードウェア・エラーの両方をハー
ドウエアの中で処理しソフトウエアに伝えないようにすることにより、多くの潜在的な
ソフトウェア問題が回避されます。ftServer ハードウェアとシステム・ソフトウェアは、
クラスタ・ノードや典型的なサーバで、オペレーティング システム、ミドルウェア、ま
たはアプリケーション・ソフトウェアに影響する可能性のある、一時的なハードウェア
とソフトウェア・エラーを捕捉して処理する事により影響を防ぎます。
Stratus Continuous Processing Technology
Page 10
強化されたデバイス・ドライバ
多くの Windows オペレーティング システムのクラッシュの根本的な原因としては、デ
バイス・ドライバの不具合が知られています。たとえば、Microsoft の調査ではデバイ
ス・ドライバの不具合が全 Windows NT® 4.0 の再起動の原因の 30%以上を占めるとして
います。Windows 2000 および Windows Server 2003 オペレーティング システムでは、
Microsoft が、新しいテストや認証プログラムを通じて、ドライバの信頼性に重要な改良
を導入しました。しかし、Windows 2000 および Windows Server 2003 カーネルの信頼性
が増すにつれて、オペレーティング システム全体の信頼性に比べて、ドライバの問題が
より大きくなっています。
ストラタス ftServer ソフトウェアは、ストラタスが開発した強化されたドライバの利用
により、この主要な信頼性の問題を解決します。問題が発生した場合、PCI アダプタが
システムの残りの部分から切り離されます。PCI アダプタには、オンライン診断機能や、
Microsoft の Windows Management Instrumentation(WMI)ドライバ・モデルに準拠する
サービス・インタフェースも供与されています。
ストラタスは、ドライバのソースコードをライセンス供与するか、または、ドライバ・
ベンダと共同で機能を追加して、ftServer システムと一緒に販売およびサポートしてい
る PCI アダプタとドライバに対して、インテグレーション/擬似障害テストを実行して
います。最高水準の可用性を維持するために、ストラタスでは、ftServer システムには
強化されたデバイス・ドライバが搭載された PCI アダプタのみの使用を推奨しています。
(デバイス・ドライバのソース・コードが利用可能な場合、ストラタスのプロフェッシ
ョナル・サービスに、ftServer システムでの他の PCI アダプタの動作検証や、ドライバ
の強化の支援を依頼することができます。)
次の機能拡張により、デバイス・ドライバが強化されています。
•
アダプタの活線挿抜(ホットプラグ)に対する完全なサポート
•
アプリケーションからの透過的なフェイルオーバー(テープと非同期通信アダプタ
を除く)
•
オンライン診断機能
•
オンラインでのファームウェア更新に対するサポート
•
WMI を通じたモニタリングとレポーティング
ソフトウェア問題にかかわる分析と対処
ソフトウェア関連の問題は、最善の予防措置をとっていても発生する可能性があります。
ftServer のシステム設計は、ソフトウェアの問題をハードウェアの問題と確実に区別す
ることによって、これらのソフトウェア問題の早期対応を可能にします。従来のサーバ
や高可用性クラスタでは、多くのソフトウェアに起因する問題が、実際に一時的なハー
ドウェア・エラーによって発生しています。ftServer システムでは、ハードウェア・エ
ラーは自動的に検出、特定、解決されるので、困難な切り分け処理に必要となる作業を
事前に防止する事が可能となります。
さらに重要なのは、ftServer が設計段階からソフトウエアに対する信頼性向上の機能を
組み込んで、誘発されるソフトウェア障害を初めから発生させないようにしている点で
Stratus Continuous Processing Technology
Page 11
す。従来のサーバや高可用性クラスタでは、こういったソフトウェア障害を事前に防止
する機能がないのは注目に値します。従来のサーバは、冗長性があり信頼性が高いとし
て販売されているものでも、誘発されるソフトウェア障害の防止には対応していません。
クラスタはこの脆弱性に再起動と復旧メカニズムで対応するしかなく、できるだけ早く
ソフトウェアを立ち上げて再稼働させるのみです。
ftServer ハードウェアとシステム・ソフトウェアは、クラスタ・ノードや従来のサーバ
の場合にはオペレーティング システム、ミドルウェア、アプリケーション・ソフトウェ
アにまで及んでいた一時的なハードウェア/ソフトウェア・エラーを捕捉して処理しま
す。正しくエラー処理を行わないと、多くのソフトウェア問題を引き起こすことが知ら
れていますが、ftServer システムではこれらのエラーをシステムに影響無く処理してい
ますのでソフトウェア問題が発生する可能性を減少させます。
ftServer アーキテクチャのもう一つの利点は、ハードウェア、強化されたソフトウェア
とサービス機能により、Windows オペレーティング システムとデバイス・ドライバの
障害の特定と正しい対処を支援する機能を備えている点です。
Stratus Continuous Processing Technology
Page 12
2 つの主要な機能が、ソフトウェア関連の問題を削減します。
•
自動再起動
•
フェイルセーフ・システム・ソフトウェア
自動再起動
オペレーティング システムのクラッシュという稀な事態が発生した場合、ストラタスの
ftServer システムは、クラッシュ情報を二重化された CPU-メモリ装置の 1 つに保持した
状態で自動的に再起動します。システムとアプリケーションがオンラインに戻った後、
クラッシュ情報を保持した CPU-メモリ装置から自動的にカーネル・メモリのダンプが
とられます。ftServer システムは、ストラタスの ASN(Active Service Network)経由で、
遠隔からのダンプ解析が可能なので、ダンプ情報を送付しなくても解析が可能です。
ftServer システムの監視ソフトウェアは、リソースの枯渇や性能問題のような多くのソ
フトウェア問題を識別して報告する事が可能です。これにより、アプリケーションに悪
影響が発生する前に対応を行うことが可能です。また、ftServer システムソフトウェア
は、システム構成とリビジョン・レベルを追跡し、潜在的な非互換性の問題を特定し、
発生する可能性のある問題の分析を支援します。
フェイルセーフ・システムソフトウェア
ストラタスは、フェイルセーフ・システムソフトウェアを開発して、ftServer ファミリ
用の可用性支援システムとして組み込んでいます。このシステムソフトウェアは、入出
力装置に対して信頼性とフォールト・トレラントな機能を提供し、サーバの監視と管理
を実行し、遠隔サービスとサポートを可能にし、さらに他の高度な可用性機能を提供し
ます。
次のようなフェイルセーフ・システムソフトウェア機能があります。
•
ftServer Management Console(ftSMC) — このユーザ・インタフェースは、システ
ム管理者が ftServer システムの詳しいステータス情報の構成確認と制御をできるよ
うにします。ftSMC はストラタスが提供する標準の Microsoft 管理コンソール
(MMC)のスナップインの 1 つです。ftSMC は、ローカルの ftServer システムでも、
または遠隔の Windows 2000/2003/XP システムでも稼動させる事ができます。ftSMC
のどのインスタンスからでも、ローカルと遠隔の両方の ftServer システムを管理で
きます。
•
Software Availability Manager(SAM) — SAM はシステム起動時に動作する
Windows サービスと、MMC 内で動作するスナップインで構成されています。SAM
サービスは、重要な ftServer システム・リソースやユーザ・アプリケーションのス
テータスを監視します。SAM スナップインは、e メールの送信、アプリケーション
のステータスに基づくプログラムの実行、性能のしきい値の設定やイベントログへ
のメッセージ送信などを行います。
SAM は次の機能を実行します。
ユーザ・アプリケーションを監視し、障害時に検出する。
Stratus Continuous Processing Technology
Page 13
ディスク、CPU、メモリのような重要なシステム・リソースの状態を監視し、ク
ラッシュやデータ損失が発生する前に問題を検出する。
Windows イベントログにメッセージを送り、システム性能の状況を e メールでユ
ーザに通知する。
設定されているアラート条件に応じて、ユーザ指定プログラムを実行する。
•
Simple Network Management Protocol(SNMP)Agent — ftServer SNMP エージェン
トは、Microsoft SNMP エージェントを拡張して、サードパーティの一般的なシステ
ム管理ツールの管理コンソールなどで ftServer システムを遠隔で監視できるように
します。Tivoli® Enterprise Console、HP® OpenView®、および CA Unicenter®製品を含
むほとんどの管理コンソール・ソフトウェアで SNMP がサポートされています。
ftServer SNMP エージェントは、SNMP トラップの形式で、システムコンポーネント
が障害、異常、取り外し、挿入のいずれかの状態になった場合、通知を送ります。
ftServer MIB ファイルは、管理ソフトウェア・パッケージが、ストラタスのアラーム
メッセージを解釈するために提供されます。
メモリ上のデータの保持
メモリ上のデータは、多くのビジネス・クリティカルなアプリケーションで広く利用さ
れていますが、その損失は取引の逸失やダウンタイムの増加となります。ストラタス
ftServer システムは、少なくとも 2 つの冗長化されたハードウェア・コンポーネントに
メモリ内容を保存するロックステップ・アーキテクチャを使用して、ハードウェア障害
からメモリ上のデータを保護します。
ストラタス ftServer システムでは、メモリ上のデータを保護するために、次のような重
要な機能を提供しています。
クイック・ダンプ
従来の Windows サーバでは、ユーザはクラッシュ後に厄介な選択に迫られます。後で
分析するためにシステム・メモリのダンプをとる間アプリケーションを停止させておく
か、または、すぐにアプリケーションを再開し、ただし同じようなクラッシュの発生を
防止するための情報を失うかのいずれかを選択しなければなりません。ftServer システ
ムでは、ユーザがこのようなジレンマに悩まされずに、アプリケーションがオフライン
になっている時間を最小限にし、かつダンプ情報を入手することができます。
クイック・ダンプ機能は、フォールト・トレラント ftServer システムの二重化されたハ
ードウェアを活用します。オペレーティング システムに障害が発生した場合、ftServer
システムは二重化された CPU-メモリ装置の 1 つをオフラインにし、システムの残りの
部分を通常の動作に復帰させます。その結果、ビジネス・クリティカルなこのサーバは、
問題の根本的な原因を解析するのに必要な情報を失うことなく、すぐにサービスを復帰
させることができます。
Stratus Continuous Processing Technology
Page 14
システムとアプリケーションが正常な動作に戻った後で、オフライン状態の CPU-メモ
リ装置の内容を使用して、標準のカーネルメモリダンプをとります。ダンプ動作が完了
すると、オフラインの CPU-メモリ装置が二重化動作に戻ります。その後システムは自
動的に Stratus CAC にクラッシュの発生を通知します。その後、保守契約に基づき、ス
トラタスの ActiveService アーキテクチャと ftServer 遠隔保守 PCI アダプタを通じて、ス
トラタスまたはストラタスのサービスパートナーの技術者がリモートからダンプの解析
を開始します。
クイック・ダンプは、現在稼働中のサーバや他のアプリケーションを停止させずに、稼
働中のシステムのメモリ・ダンプを確保するためにも利用できます。CPU-メモリ装置
の 1 つをオフラインにし、メモリ内容をディスクに保存して、オンラインに戻すことが
できます。プロセスが中断されないため、クイック・ダンプにより、オンライン状態で
分析やデバッグを簡単に実行することができます。
広範囲にわたるテスト
ストラタスは、すべてのハードウェアやソフトウェアのオプションを含めて、最大構成
を含むさまざまな構成で、完全に統合されたシステムを対象にした綿密なテスト項目で
テストを実施しています。システムは極度に高いプロセス負荷や I/O 負荷のもとでテス
トされ、エラーの擬似障害テストが実施されます。
CPU や PCI バス障害のような擬似障害テストの多くは、通常のシステムをクラッシュさ
せることがあるため、これらの擬似障害テストは、ストラタスだけが行っています。ス
トラタスのテストは、ストラタス・ソフトウェア、Windows オペレーティング システ
ム、サードパーティ統合製品など、システムのさまざまな部分のエラーを発見します。
このようなインテグレーション/擬似障害テストの問題を検出して解決することにより、
ftServer システムではよりハイレベルなソフトウェアの信頼性を実現させています。
Stratus Continuous Processing Technology
Page 15
ActiveService アーキテクチャ
ftServer システムの全般に当てはまりますが、ActiveService アーキテクチャの設計ポイ
ントは、システムが稼働を停止する前に問題を検出して解決する能力です。このアーキ
テクチャでは、自動障害検出、自動障害切り離し、統合された「call-home(障害通
知)」遠隔サポート、保守パーツのオンライン状態での交換などにより、他社のサーバ
にない、内部実装型の保守技術を実現しています。
ActiveService アーキテクチャには、ハードウェアの設計とその技術により可能になった
Access 機能の設計から、ストラタスのグローバルな ActiveService ネットワークと Web
ベースの ActiveService マネージャまでが含まれます。
図3
アクティブ・サービス・アーキテクチャ
内部実装型の保守技術
問題解決シナリオの例(図 4)は内部実装型の保守技術がどのように ftServer システム
に実装され、システム稼働を継続させるのかを示しています。
簡単にいうと、ftServer システム自体に、すでに初期レベルのカスタマ・サポート機能
を提供する機能が含まれています。サーバ内のメンテナンス・ソフトウェアは、使用者
が意識することなく、定期的にシステム状況の監視、診断、報告を行い、コンポーネン
ト・レベルまで障害を正確に特定します。ハードウェアのエラーや障害の場合は、
ftServer システムがその状態を特定し、残りの片系コンポーネントで稼動を続けます。
クラスタシステムとは対象的に、フェイルオーバーの時間はまったく発生せず、ユーザ
が性能の劣化を感じることはありません。
Stratus Continuous Processing Technology
Page 16
図4
問題解決シナリオ
1. 障害の発生。システムは障害を検知・切り離し、片系コンポーネントで稼働し続け
ます。
2. 「call home」(障害通知)技術により、障害をストラタス・カスタマ・アシスタンス・
センターに通知します。
3. 交換可能の新しいコンポーネントが翌日配送で出荷されます。
4. ftServer システムは交換部品と再同期化し、稼働を続けます。
*日本国内ではストラタス又はストラタスのサービスパートナーの技術者がオンサイトし、コン
ポーネントを交換するサービスが一般的です
サーバは、セキュリティの保たれたダイヤル接続経由で、ストラタス・カスタマ・アシ
スタンス・センター(CAC)に障害が発生するとその内容を自動的に報告します。グロ
ーバルな ActiveService ネットワークは、すべての顧客システムへの遠隔アクセスを可能
にする、ワールドワイドなインフラストラクチャを提供します。ストラタスまたはサー
ビスパートナーの技術者は、ユーザを訪問することなく、遠隔からクリティカルな問題
を 24 時間 365 日にわたって調査できます。実際に、ストラタスのサポートエンジニア
は、95%以上の事例で、オンラインで障害を調査して問題を解決しています。
交換部品が必要な状態では、ftServer システムから自動的に報告された内容を元にホッ
トスワップ可能な部品が注文されます。ftServer のほとんどの部品がユーザ自身で交換
可能なユニット(customer replaceable unit:CRU)なので、ユーザは交換部品を簡単に
交換することができ、特別なツールや現場でのサポートエンジニアの支援なく交換する
ことも可能です。
ftServer システムは新たな交換部品を自動的に組み込み、片系コンポーネントの完全二
重化運転(ロックステップ動作)に戻ります。システムとアプリケーションは上記の全
ての過程を通じて正常に稼働し続けます。
Stratus Continuous Processing Technology
Page 17
シンプルな保守性
前節では、ftServer システムが誕生以来、全モデルが稼動状態で部品交換できるように
設計されているという点を説明しました。第二世代の ftServer アーキテクチャは、シス
テム・コンポーネントの数を減らし、コンポーネントを以下で説明するブラインドメイ
トのバックプレーンを含む共通の筐体設計にすることによって、この概念をさらに次の
レベルに進めています。
ブラインドメイトのバックプレーンは CPU と I/O エンクロージャに対して電力と信号接
続を提供し、各エンクロージャは筐体の中や外へ簡単にスライドし交換することができ
ます。その結果、内部のケーブルの抜き差しや工具の使用は、最新の ftServer ファミリ
の保守には必要とされません。
ステータス・インジケータ LED とロック機能の付いたコンポーネントを多く利用する
ことで、保守作業中のオペレータのミスを排除できます。コンポーネントの交換やシス
テム再構成にオペレータ・コマンドが必要ないので、エラーの可能性がさらに削減され
ます。
ftServer Access アダプタ
ftServer システムは二重化された遠隔保守アダプタの ftServer Access アダプタ(ftSAA)
を通じて柔軟なリモートからの管理機能を提供します。この機能は、サーバの状態にか
かわらず、ストラタス ActiveService ネットワークと顧客のシステム間の遠隔通信を可能
にします。ftServer Access アダプタにより、オペレーション・スタッフやサポートエン
ジニアが、遠隔で電源をオン/オフにしたり、システムをリセット/再起動したり、
ActiveService ネットワークを通じてネットワークのセキュリティを管理したりできます。
信頼性を保証するために、この PCI アダプタは独立した電源とネットワーク接続で稼動
するボードレベル・コンピュータで構成されています。
ActiveService ネットワーク
サポートされるシステムと同様に、ストラタスの 24 時間 365 日のサービス・インフラ
ストラクチャは重要なアプリケーションの稼働率を最大にする目的で設置されました。
すべての ftServer システムは ActiveService ネットワークを活用するように構築されてお
り、サーバと世界中のストラタスの技術専門家および CAC の間に、セキュァで寸断さ
れないリンクを提供します。ActiveService ネットワークは、システムの場所に関係なく、
オンラインで 24 時間体制の監視と遠隔診断を行い、オンサイト・サービスに関連する
遅延やコストの大部分を削減します。
認定されたサポートエンジニアは、ActiveService ネットワークを使用して顧客の
ftServer システムにアクセスし、診断と解析を行います。ネットワークの強力な遠隔サ
ービス管理ツールには、遠隔リセット、遠隔コンソール機能、情報の取得と保管、セキ
ュリティ機能が含まれます。
診断と分析技術は ActiveService ネットワークを、発生したイベントの根本的な原因の調
査や、エラー・ログとシステム・ダンプのアップロードに利用できるようにします。ス
トラタスのサポートエンジニアは、ネットワークを利用して、必要に応じて、ソフトウ
ェアのパッチ、診断ルーチンをインストールできます。
Stratus Continuous Processing Technology
Page 18
ftGateway ソフトウェア
ftGateway ソフトウェア機能は、いくつかの ftServer システムが、ストラタス
ActiveService ネットワークへの共通ダイアルアップ接続を共有できるようにします。こ
の機能により、必要な電話回線の回線数を削減し、同じ場所に設置された複数の
ftServer システムに対するサービス接続をより簡単に管理できるようになります。
1 つの ftServer システムは、最大 20 システムに対する接続ゲートウェイ機能を提供しま
す。ftServer Access アダプタは、ゲートウェイ・システムでは必須となります。グルー
プ内の他のシステムは、ftServer Access アダプタの、もしくは標準の、イーサネットポ
ートを使用して、イーサネット経由でゲートウェイ・システムに接続します。
ActiveService マネージャ
ActiveService ネットワークを補足するのが、ActiveService マネージャです。この Web ベ
ースのサービス・ツールは、ftServer システム用のオンラインコール管理機能をサポー
トします。24 時間 365 日リアルタイムでストラタス CAC とのやりとりを提供するよう
に設計された ActiveService マネージャによって、ユーザは ftServer システムによって自
動的に生成されるコールを確認することができます。また、顧客自身がサポート・コー
ルの作成および更新を行うことにより、ストラタスの適切なサポート担当者につながり
ます。さらに、ActiveService マネージャは、顧客で使用する総てのストラタス・システ
ムの完全なコール履歴を記録します。
ストラタス ftServiceTM オプション
顧客は、ActiveService 技術を活用するいくつかのレベルの ftService サポート・
オプションからサポート契約を選択することができます。最高のオプションは、
Assured AvailabilityTM Plus ftServiceTM(日本名:24×7保証サービス)で、ftServer シ
ステムと Windows オペレーティング システムに対して 24 時間 365 日のサポートを提供
します。
ストラタスの手法は、すべての ftServer システムに組み込まれている強力な
AcriveService 機能を活用し、通常はオンサイト・サポートを必要とせずに、グローバル
なサービス・ネットワークから接続して、検出した問題をすばやく診断、解決を可能に
します。これは、事後の改善策を提供するのではなく、ダウンタイムを防止することに
焦点をあてています。
サードパーティ・コラボレーションによるサポートも、ストラタス ActiveService ネット
ワークと Web サポートセンターを使用します。ストラタス ftService の顧客は、ストラ
タス以外のベンダからも、ActiveService マネージャと ActiveService ネットワークを通じ
てコールの状態を共有し、世界中のどこからでも共同の問題解決に対して仮想のコール
共有システムをベースにサービスを受ける事ができます。
さらに、ストラタスは米国での Microsoft ゴールド認証パートナーでもあります。スト
ラタスの統合された電子サポート・インフラストラクチャにより、優れた Microsoft の
サポート・サービスが世界中の顧客に届けられるようになります。
Stratus Continuous Processing Technology
Page 19
ミッション・クリティカルなサービスへの注力
大規模なシステムの配備は IT 部門への大きな要求を生み出すため、ストラタスの 24 時
間 365 日ワールドワイド・サービスでは幅広い専門的なサービスを提供し、ftServer コ
ンピューティング・ソリューションのために最大限の稼働率と性能を提供しています。
サービスには可用性ソリューションの設計、実施、管理の他に、トレーニングと教育も
含まれます。
フォールト・トレラント・コンピューティング用のストラタスの最先端のセンターは、
マサチューセッツ州、メーナードの本社内にあり、ベンチマーキングやポーティング・
サービスに加えて、サードパーティ製品や顧客のアプリケーションの検証と可用性のテ
ストを実施することができます。
これらのサービスは、顧客が社内の熟練技術者の投入や、他のプロジェクトからの内部
スタッフの転用や又は複数の企業との契約によるアプリケーションやインフラの設計な
しで、信頼できるコスト効率のよいソリューションを提供できるようにします。
Stratus Continuous Processing Technology
Page 20
まとめ
ストラタスは、ftServer ファミリによって、Windows 環境で最高水準の可用性を達成す
る実際的で実現容易な方法を提供しています。ftServer 製品ラインは、ロックステッ
プ・テクノロジー、フェイルセーフ・ソフトウェア、ActiveService アーキテクチャを通
じて、Continuous Processing 技術を提供し、全てが調和して働くことで、ダウンタイム
が発生する前に技術的な問題を解決します。
ftServer システムの設計すべての側面が、高可用性クラスタや「頑強な」従来のサーバ
に組み込まれているような迅速な回復ではなく、不測のダウンタイムを防止するように
設計されています。Continuous Processing 技術がアプリケーションから透過的に、かつ
自動的に行われるという事実は、Windows アプリケーションへの人手の介入や追加のプ
ログラミング、およびテストを必要とせず、完全にフォールト・トレラントなサーバ環
境を実現できることを意味しています。
第二世代の ftServer システムは、最高のコストパフォーマンス、より大きい収納効率性、
よりよい投資保護、よりシンプルな保守性によって、これらの固有の利点を拡大します。
優れた操作上の簡潔さは、ストラタスの遠隔からの管理や保守機能と一緒になって、
ftServer システムの導入と管理を簡単でコスト効率のよいものとします。ストラタスの
24 時間 365 日サービス・インフラストラクチャは、包括的なオンライン・サポート、
Web ベースのイベント追跡、マルチベンダ共同サービスを提供して、最高の稼働率と効
率的な問題解決を実現しています。
その他にも、ストラタスの Continuous Processing 技術は、複雑なシステム構成、不測の
ダウンタイム、継続するサポート費用に関連するコストを削減することによって、競合
する他の手法に対して、明らかに経済的な優位性をもたらします。これは、企業経営者
にとって最も説得力がある事でしょう。
追加のリソース
ストラタスは、ftServer システムによってもたらされる他の技術、機能、利点を説明す
る一連のホワイトペーパーを発行しています。これらの文書は次のアドレスから入手で
きます。http://www.stratus.com/whitep/
Stratus、ftServer、ftServer ロゴ、および Continuous Processing は登録商標です。The Smarter
Approach to Uptime、ActiveService、Stratus Technologies のロゴ、Stratus 24x7 のロゴは商標です。
ftService および Assured Availability は、Stratus Technologies Bermuda Ltd.のサービスマークです。
Microsoft、Windows、Windows Server、および Windows NT は Microsoft Corporation の米国および
その他の国における商標または登録商標です。
Tivoli は IBM Corporation の登録商標です。
Intel は Intel Corporation の米国およびその他の国における登録商標です。
HP および OpenView は Hewlett-Packard Company の登録商標です。
Unicenter は、Computer Associates International, Inc.が所有する登録商標です。
その他すべての商標および登録商標は、それぞれの保有者に属します。
Stratus Continuous Processing Technology
Page 21
仕様と説明は概要であり、予告なしに変更されることがあります。
© 2003 Stratus Technologies Bermuda Ltd. All rights reserved.
Stratus Continuous Processing Technology
Page 22