PDFをダウンロード - PBS Works

Enabling On-Demand Computing
TM
®
PBS Professional が
選ばれる理由
• 20 年以上の実績
• 世界中の何千もの顧客
• HPCWire の読者投票で HPC ソフト
ウェア部門第1位を獲得
• HPC の専門家が HPC ユーザーのた
めに構築 - Altair は HPC を知り尽く
しています
PBS Professional
業界をリードする HPC ワークロード管理およびジョブスケジューリングソフトウェア
HPC(ハイパフォーマンスコンピューティング)のワークロード管理における信頼の先進的なソ
フトウェアである PBS Professional は、あらゆる形態のコンピューティングインフラストラク
チャーにおける HPC ワークロードを効率的にスケジューリングできます。 クラスタから最大規模
のスーパーコンピューターまで、あらゆる規 模 のシステムを容易にサポートする PBS
Professional は、ハードウェアおよびソフトウェア投資の価値を最大限に引き出すことができ
ます。
• 百万コアに拡張可能なスケーラビリ
ティと安定性
• 複雑な要件にも容易に対応できる
柔軟なプラグインフレームワーク
PBS Professional は以下の目的のために選ばれています
• EAL3+ 認証と SELinux のサポートに
より、比類ないセキュリティを実現
• 高速かつ強力で信頼性の高いワークロード管理
ソフトウェアを使ってパフォーマンスを向上させる
• 高速かつ強力なスケジューリング機
能。 消費電力とトポロジーを考慮で
きるほか、 GPU / Xeon Phi のサポー
トを実装
• 22 か国の 48 のオフィスに専門家が
常駐するグローバルなサポート体制
• HPC およびクラスタの管理を簡略化する
• ハードウェア、ソフトウェア、電力の使用を最適
化してコストを削減する
• 最高レベルのセキュリティを確保する
(EAL3+ 認証と SELinux/MLS のサポートを
提供できるのは PBS Professional だけ)
• 専任の担当者が個別にお客様に対応する
高度な技術サポートを受けることができる
• 複雑なカスタム要件を満たすための
柔軟性を獲得する
• 生産性を最大化し、 SLA を確実に満たす
• 最重要のジョブを最初に実行して
時間通りに完了させることで、ビジネス上の優
先順位を満たす
• パブリック / プライベートクラウドで実績のある
製品を使って、クラウドレディな環境を構築する
• 商用ソフトウェアの確固たるリーダーの高度な
サービスとカスタマーケアで安心を獲得する
• ハードウェア障害を最小限に留め、障害発生時
も自動的に回復することで、リスクを低減する
13.0 の新機能
• 百万コアのスケーラビリティ
– 50,000 以上のノードで試験済み
「PBS はパフォーマンスと柔軟性の両面で競
合製品を上回っています。 HPC を知り尽くし
た Altair だからこそできます」
— NCI 社
「この製品の柔軟性と Altair の専門知識
およびサポートは他に類を見ません」
— 富士通
「年間でおよそ 200,000 ドルの電気代を節
約できています」
— 米国陸軍(RDECOM)
「成功に導くための Altair の専門知識と献
身的なサポートは、 他社を圧倒しています」
• 巨大な MPI ジョブを高速かつ確実に起
動 – 何万もの MPI ランクを持つジョブで試験
済み。 障害が発生したノードによる遅延を最
小限に抑える
• 短時間ジョブの高速スループット
- 1日に 1,000,000 以上のジョブを処理可能
• cgroups でリソースの競合を防止 – ジョ
ブが高速で処理され、ほかのジョブや OS に干
渉しない
(*)
• 包括的なヘルスチェックフレームワーク
が ヘ ルスチ ェ ッ クスク リ プト の 挙 動 を 監 視 チェックが実行されるか、ノードがダウンと判定さ
れる
• スケジューリングの優先順位を制御す
る formula を 拡 張 - 完 全 な 数 学 関 数
(sqrt()、 ceil() など)や条件式の使用に加え、
ジョブの実行可能時間のしきい値の設定が
可能
• Preemption を き め 細 や か に 指 定
キュー単位で設定が可能
(管理者のみ)
• 一般的な fairshare formula - 各キュー
単位でジョブの待機時間、ライセンス共有、時
刻、消費電力を設定でき、これらを組み合わ
せて使用することも可能
• システムサポート要件の拡張:Windows
の Intel MPI と MPICH2、 Windows の stdin
/ stdout / ファイルステージングのための UNC
パス、 SLES 12、 RHEL 7
— ワイツマン科学研究所
• 拡張された hook events で、プラグインの
拡張性とカスタマイズ性がさらに向上
• カスタムリソース - サーバーを再起動するこ
となく、 qmgr を使って直接カスタムリソースを
作成可能
• 長いジョブ名および予約名に対応
PBS Works is a division of
• より柔軟なポリシーによるコントロール
によって、ビジネスのニーズにより的確に対応
主な特長とメリット
• ジョブの”shrink-to-fit ”により、特に、計画され
ているシステムの停止前の使用率が向上しま
す。あるスーパーコンピューティングセンターでは、
わずか数ヶ月で800,000時間ものCPUアイドル
時間の無駄をなくすことができました
• ジョブアレイによりスループットを最大化し、無限
数のジョブのスケジューリング、実行、管理を実現
• 履歴を含んだジョブステータス(”qstat -x”によ
る)が、ジョブの追跡記録の紛失を防止
• きめ細かいポリシー設定のためのユーザー、グ
ループ、およびプロジェクト制限
• Python により、1つのスクリプトをすべてのアー
キテクチャーで利用可能
• GPU / コプロセッサーのスケジューリングにより、
使 用 の 優 先 順 位 を 決 定 し、 Intel® Xeon
Phi ™ コプロセッサーだけでなくあらゆるタイプの
アクセラレーター(nVidia、 AMD など)へのアク
セスを管理することが可能
• "execution events" のプラグインにより、ヘルス
チェック、サードパーティ製品との統合、サイト特
有のカスタマイズを容易に実行
(*)
• 優先実行およびチェックポイント機能により、優
先順位の高いジョブを即座に実行
• formula の使用により、オンザフライの”例外”
を含め、柔軟なスケジューリングポリシーを定義
• ジョブ開始時刻の推定により、ワーフフローの
計画と期日の遵守が可能に
• Green Provisioning™によりリソースを自動的
にシャットダウン / 再起動することで、消費電力
を節約(エネルギー消費量を最大 30% 削減
できたという顧客事例もあります)
• Backfill TopN スケジューリングにより、最優先
の作業を遅延させることなく不要なサイクルを
削除
• ユーザーによるカスタマイズが可能な”runjob
hooks”により、割り当ての制限を厳格に適用
• 動的なプロビジョニングにより OS を自動的に
変更することで、変化するワークロードの需要に
対応
• リソースの先行予約により、繰り返し発生する
ジョブのためにリソースを確保
• ジョブのフィルタリング”hooks”機能により、その
場で機能の変更 / 拡張が可能
• トポロジーを考慮したスケジューリングによりすべ
ての HPC ネットワークトポロジー(InfiniBand、
SGI、 Cray、 IBM、 GigE など)でタスク配置が
最適化され、アプリケーションのパフォーマンスの
向上とネットワーク競合の緩和を実現
• ヘテロジニアスな MPI 割り当て(ランク 0 には
64GB のメモリを割り当て、その他のランクには
1GB だけを割り当てるなど)により、メモリの無駄
を削減
The PBS Works Suite
HPCwire の 2014 年 の “Best HPC Software”
に選ばれた製品群には、 PBS Professional に
加えて以下のソフトウェアが含まれています:
• PBS Analytics
ジョブのレポート作成とアカウンティング
• Compute Manager
リモートでのジョブの投入、監視、管理
• Display Manager
リモートビジュアライゼーション
• ソフトウェア資産最適化
ライセンス利用状況の分析
詳細は、 www.pbsgridworks.jp を
ご覧ください
* 利用に制限あり - お客様のサイトにおけるこの機能の実装については、アルテアの担当者にお問い合わせください。
技術的な機能
GPU およびコプロセッサー(Xeon Phi)
のスケジューリング
複数の機種が混在したクラスタ
継続予約
チェックポイントリスタート
スケジューリング formula
Kerberos
実行可能時間
ジョブアレイ
フェアシェア
経過時間に基づいたスケジューリング
ピアスケジューリングを通じたメタスケジューリング
トポロジーを考慮したスケジューリング
OS プロビジョニング
ライセンススケジューリング
優先実行
ジョブ履歴
(qstat –x)
Web サービス
拡張可能なプラグインフレームワーク
("hooks") 動的リソース
マルチコア
ジョブの依存関係
ジョブ開始時刻の予測
インタラクティブジョブ
Backfill TopN
24 時間無休のオンラインコミュニティ
ペタフロップレベルを超える拡張性
ユーザー / グループ / プロジェクト単位での制限
ジョブの "shrink-to-fit"
オンデマンドライセンス
グリーン プロビジョニング
$restrict_user
クロスドメインソリューション
フェイルオーバー
ハイブリッドジョブ
(MPI+OpenMP)
MPI との統合
消費電力を考慮したスケジューリング
ポリシーベースのスケジューリング
オーバーサブスクリプション
EAL3+ セキュリティ
ノードのヘルスモニタリング
サポートされるプラットフォーム
PBS Professional は、主要なプラットフォームおよびオペレーティングシステムをすべてサポートしています。
アルテアエンジニアリング株式会社
170-6043
東京都豊島区東池袋 3-1-1 サンシャイン 60 43 階
Phone: 03.5396.1341 • Fax: 03.5396.1851
www.altairjp.co.jp • [email protected]
PBS Professional に
関する詳細は、
www.pbsgridworks.jp
をご参照ください。