最新PCクラスタにおけるAcuSolve 性能評価と富士通HPC

2015 Japan Altair テクノロジーカンファレンス
最新PCクラスタにおけるAcuSolve
性能評価と富士通HPCのご紹介
2015年7月7日
株式会社富士通システムズ・イースト
解析ソリューション部
山浦 和也
Copyright 2015 FUJITSU LIMITED
Agenda
1. 会社紹介 および 富士通のHPCへの取り組み
・富士通のHPCサーバの歴史
・HPCサーバ製品ラインナップ
2. 富士通PCクラスタによるAcuSolve性能評価
・性能評価の概要(測定環境、テストモデル)
・測定結果
・性能評価のまとめ
3. 富士通のHPC向けソリューションのご紹介
・PCクラスタソリューション
・TCクラウド
2
Copyright 2015 FUJITSU LIMITED
SCRYU/Tetra V11, STREAM V11
の並列性能
会社紹介 および 富士通のHPCへの取り組み
3
Copyright 2015 FUJITSU LIMITED
会社紹介
会社名
株式会社富士通システムズ・イースト
本社
東京都港区港南1-2-70 品川シーズンテラス
代表者
代表取締役社長 石川 享
設立
2012年4月1日
資本金
5億円(富士通100%出資)
売上高
1,339億円(2015年3月期)
従業員
4,950人(2015年4月現在)
事業内容
システム企画・コンサルティング
システム構築サービス
業種・業務別パッケージ開発
アウトソーシングサービス
2011年6月、アルテアエンジニアリング株式会社と代理店契約
(HyperWorks、PBS Professional)
4
Copyright 2015 FUJITSU LIMITED
富士通のHPCサーバの歴史
 30年以上にわたりHPCのトップベンダーとしてビジネスを展開
エクサスケール
スーパーコンピュータ
スーパーコンピュータ 「京」(注)
FX1
VPP5000
NWT
世界最速のベクトルプロセッサ
提供(1999年)
SPARC Enterprise
PRIMEHPC FX100
ⒸJAXA
VPP300/700
ベクトル
PRIMEPOWER HPC2500 PRIMEQUEST
世界最高の実行効率を達成
(2008年11月,TOP500) X86クラスタ
VPP500
AP3000
VPシリーズ
F230-75APU
AP1000
世界最高のスケーラビリティ
を実現(2003年)
HX600 クラスタノード
PRIMERGY RX200
クラスタノード
スカラ
日本発のベクトル型スーパーコンピュータ提供
(1977年)
~1980 1985 1990
PRIMERGY BX900
クラスタノード
クラスタ
PCクラスタ型で日本一の性能を実現
(2004年6月,TOP500)
1995
2000
2005
2010
将来
(注)「京」について :理化学研究所と富士通が共同で開発. 「京」は理化学研究所の登録商標です。
5
Copyright 2015 FUJITSU LIMITED
富士通のHPCサーバ製品ラインナップ
Scale Up
スーパーコンピュータ
大規模SMP(注)型演算サーバ
UNIXサーバ
SPARC M10
基幹IAサーバ
PRIMEQUEST
 マルチコアプロセッサ「SPARC64™ X」4CPUを1
筐体~16筐体までを増設可能(最大:1,024
コア,64TBメモリ)
 最大64TBの大容量メモリを搭載可能
ハイエンド
PCワークステーション
CELSIUS R シリーズ
デスクトップPC
ESPRIMO
PRIMEHPC FX100
 最大8個のXeonを搭載
 最大1TBの大容量メモリ
PCクラスタ
PCサーバ PRIMERGY
ブレードサーバ
ラックサーバ
 最大2個のXeonを搭載
する業界標準サーバ
(1U/2U)
 サーバ機に搭載するXeonを
最大2個搭載可能
 GPUコンピューティングカードを
搭載可能
 18ブレード/10Uと8ブレード/6Uの
Xeonブレードを搭載可能な高密
度大規模ブレードサーバ
 34(32+2)コア
SPARC64™ Xifx
プロセッサ採用
 最大100PFLOPS以上の
大規模計算環境を実現
マルチノードサーバ
 データセンターに最適な高集積・省
電力設計とHPCを実現する高性
能アーキテクチャーを兼ね備えた高
密度マルチノードサーバ
4GPU/コプロセッサー搭載サーバ
 低価格・低消費電力で
CPU以上の性能を実現
するGPU/コプロセッサーを
高密度搭載可能なHPC
専用モデル
Scale Out
注 SMP:
Symmetric Multi-Processingの略。複数のCPUを同時に利用して処理を行なう方法。→共有メモリ型演算サーバ。
6
Copyright 2015 FUJITSU LIMITED
SCRYU/Tetra V11, STREAM V11
の並列性能
富士通PCクラスタによるAcuSolve性能評価
7
Copyright 2015 FUJITSU LIMITED
富士通から見たAcuSolveの強み
特長1
特長2
特長3
ロバスト性
有限要素法、収束の安定性、ゆがんだ要素にも対応
スピード
高い並列化性能、独自の直接解法による収束の速さ
コストパフォーマンス
HyperWorksユニットで動作、柔軟な並列実行
8
Copyright 2015 FUJITSU LIMITED
AcuSolve性能評価の概要
 目的





:富士通の最新PCクラスタ環境において、流体解析ソルバ
AcuSolveの性能を測定し、並列化性能を評価する
場所 :富士通トラステッド・クラウド・スクエア 検証ルーム
(浜松町 世界貿易センタービル)
期間 :2015年5月
ソフト :AcuSolve V13.0
PBS Pro V13.0
SimBINDER V1
ハード :次ページにて紹介
評価値 :CPU/Elapse時間
(3回平均)
Fujitsu Trusted Cloud Square
9
Copyright 2015 FUJITSU LIMITED
検証マシン スペック情報
PRIMERGY CX2550M1
計算ノード(8台)
PRIMERGY RX350 S7
機種名
PRIMERGY CX2550M1 / RX2540M1
CPU
Xeon E5-2667 v3(3.20GHz/8コア/20MB) ×2
メモリ
128GB(16GB 2,133 Registered DIMM×8)
ドライブ
HDD:1TB×2(2.5インチ,BC-SATA, RAID1)
OS
Red Hat Enterprise Linux 6.5
コンパイラー
InfiniBand FDR
BIOS設定
Turbo Boost
Hyper Threading
:ON
:OFF
ファイルサーバ
機種名
PRIMERGY RX350 S7
CPU
Xeon E5-2690 (2.90GHz/8コア/20MB) ×2
メモリ
64GB(8GB 1,600 Registered DIMM×8)
ドライブ
HDD:1TB×2(3.5インチ,SATA, RAID1)
OS
Red Hat Enterprise Linux 6.5
BIOS設定
Turbo Boost
Hyper Threading
10
:ON
:OFF
Copyright 2015 FUJITSU LIMITED
検証マシン ネットワーク構成
富士通トラステッド・クラウド・スクエア
検証マシン環境
スイッチ
スイッチ
計算ノード
PRIMERGY CX2550 M1 ×8
作業用PC
基幹ネットワーク
・
・
・
管理ノード兼ファイルサーバ
PRIMERGY RX350 S7
管理用ネットワーク
(1 Gigabit Ethernet)
11
計算用ネットワーク
(InfiniBand)
Copyright 2015 FUJITSU LIMITED
性能測定に使用したテストモデル
業
種
Case1
Case2
Case3
電子機器
自動車
攪拌槽
モ
デ
ル
・自動車の空力解析
・大規模な解析空間に多数の
メッシュを生成
・風速80Km/h
概
要
・電子機器の熱流体解析
・基板3枚、電子部品100点以上
・発熱、自然対流、輻射を考慮
要
素
数
902万
7,140万
1,082万
観
点
現実的なモデル
大規模データ
複雑な解析条件
12
・多成分の移流拡散
・別流体が8.5kg/sで流入
・インペラーが100prmで回転
Copyright 2015 FUJITSU LIMITED
SCRYU/Tetra V11, STREAM V11
の並列性能
測定結果
13
Copyright 2015 FUJITSU LIMITED
測定結果 Case1(約902万要素)
Core
14
実行時間【sec】
CPU
Elapse
スケール
CPU
Elapse
16
4496.7
4575.4
1.00
1.00
32
2119.5
2162.3
1.85
1.78
64
1020.6
1048.3
3.85
3.57
128
550.5
606.1
8.17
7.55
Copyright 2015 FUJITSU LIMITED
測定結果 Case2(約7,140万要素)
Core
15
実行時間【sec】
CPU
Elapse
スケール
CPU
Elapse
16
32200.1
32660.3
1.00
1.00
32
16843.8
17078.4
1.92
1.91
64
7929.0
8062.0
4.08
4.05
128
4126.4
4216.8
7.80
7.75
Copyright 2015 FUJITSU LIMITED
測定結果 Case3(約1,082万要素)
Core
16
実行時間【sec】
CPU
Elapse
スケール
CPU
Elapse
16
11072.4
11152.9
1.00
1.00
32
5833.7
5878.4
2.25
2.19
64
2901.7
2924.2
4.52
4.40
128
1292.0
1336.0
8.57
8.35
Copyright 2015 FUJITSU LIMITED
性能評価のまとめ
 富士通の最新PCクラスタ環境において、3件のテストデータを用い、
16から128並列での速度性能を評価した。
 全てのテストデータに対して、良好な並列スケーラビリティを示し、
「コア数8倍」 に対して 「速度7.88倍」 の性能が確認できた。
(Elapse時間、平均値)
17
Copyright 2015 FUJITSU LIMITED
富士通のPCクラスタ
製品・サービスのご紹介
富士通PCクラスタソリューションのご紹介
18
Copyright 2015 FUJITSU LIMITED
PCサーバ PRIMERGY(プライマジー) シリーズ
 PCクラスタに最適なインテル Xeon E5-2600 v3 製品ファミリー搭載
2WAYサーバラインナップ
ラックマウントサーバ
マルチノードサーバ
ブレードサーバ
1U筐体ながら最大容量16TB
搭載可能なラックマウントサーバ
2Uの省スペースに最大で
4ノード高密度搭載可能
18ノード/10U高密度実装
からラック不要のフロアスタンド
構成まで対応可能
PRIMERGY RX2530M1
PRIMERGY CX400M1
拡張性に優れた2U
ラックマウントサーバ
PRIMERGY RX2540M1
GPGPU/Xeon Phi 4ノード/2U筐体
×2枚内蔵可能
高密度実装
(CX2570 M1) (CX2550 M1)
19
PRIMERGY BX400S1
PRIMERGY BX900S2
Copyright 2015 FUJITSU LIMITED
ご参考)最新CPUの性能(開発名称
CPUコア数が前世代モデルの1.5倍
Haswell-EP)
メモリアクセス性能の向上
「インテル® Xeon® E5-2600 v2 製品ファミリー」 メモリ動作クロック周波数が前世代の1866MHzか
搭載の前世代モデルと比較して、1CPUあたりの ら2133MHzに上がり、スループット性能が向上。
最大コア数が 12 から 18 に増加。
実効性能が高いDual Rankメモリをラインナップ。
「インテル® AVX 2」 命令セットに対応
「インテル® AVX 2」の「FMA (Fused Multiply-Add) 」
機能により、演算性能がさらに向上。(アプリケーションにより、効果は異なります。)
従来モデルとの性能比較 (浮動小数点演算スループット性能)
演算性能(DGEMM)
SPECfp_rate_base2006、最新モデルのレートは2014年8月時点の暫定値
単位
: レート
RX2540 M1はAVX 2向けコンパイル済み
本情報は予告なく変更することがあります。
800
600
495
193
50
200
RX300 S5 RX300 S6 RX300 S7 RX300 S8
0
RX2540 M1
X5570
X5690
E5-2690
E5-2697 v2
E5-2697 v3
E5-2699 v3
× 2CPU
× 2CPU
× 2CPU
× 2CPU
× 2CPU
× 2CPU
(4コア/2.93GHz)(6コア/3.46GHz) (8コア/2.9GHz) (12コア/2.7GHz)(14コア/2.6GHz)(18コア/2.3GHz)
CPU開発コード
Nehalem-EP
(2009年4月~)
100
521
400
266
119.3
99.1
800
677
400
0
単位
: GB/s
1000
600
200
1079
単位
: GFLOPS
メモリスループット性能
(STREAM TRIAD)
CPU開発コード
CPU開発コード
CPU開発コード
Westmere-EP Sandy Bridge-EP Ivy Bridge-EP
(2010年4月~) (2012年3月~) (2013年9月~)
CX250 S2 RX2540 M1
E5-2697 v2 E5-2697 v3
CX250 S2 RX2540 M1
E5-2697 v2 E5-2697 v3
(12コア/2.7GHz)(14コア/2.6GHz)
(12コア/2.7GHz) (14コア/2.6GHz)
AVX 2対応
AVX 2対応
× 2CPU
AVX対応
CPU開発コード
Haswell-EP
(2014年9月~)
0
× 2CPU
× 2CPU
AVX対応
× 2CPU
富士通ブース内のパンフレット:最新CPU 「Xeon® E5-2600 v3」 搭載PCクラスタシステムより
20
Copyright 2015 FUJITSU LIMITED
PCクラスタ Quick Start Suite
導入検討から運用まで、PCクラスタ Quick Start Suiteで
お客様のシステム構成から運用まで、トータルに支援し、フェーズごと
に最適な製品・サービスを提供するソリューションです。
システム
構成検討
ハードウェア
OS
ミドルウェア
おすすめ構成
システム
運用検討
システム
構築
ジョブ運用
ファイル共有
システム監視
インストール
設定
お引き渡し
システム
運用
解析業務
モニタリング
トラブル対応
PCクラスタシステムテンプレート
スタートアップ
サービス
運用支援サービス
SupportDesk
PCクラスタ Quick Start Suite
21
Copyright 2015 FUJITSU LIMITED
業界最高水準の国内2時間オンサイト修理
お客様満足度の向上を目指し、高品質なサービスの提供に取り組んでいます。
サポートセンターと全国のサービス拠点のとのスムーズな連携により、業界最高水準
の2時間以内(*1)オンサイト修理を実現しています。また、お客様がサービスエンジ
ニアの対応状況や保守部品の到着時間などをお客様専用ホームページで確認す
ることも可能(*2)です。
(*1)SupportDesk Standardでサーバの保守契約をした場合の目標値。対応時間はご契約の内容により異なります。
(*2)SupportDesk Standard契約の場合のみ、お客様専用ホームページにて確認可能です。
22
Copyright 2015 FUJITSU LIMITED
富士通のPCクラスタ
製品・サービスのご紹介
富士通のHPCクラウドサービス
23
Copyright 2015 FUJITSU LIMITED
HPCクラウドサービス TCクラウド
 HPC用途に特化したクラウドサービス
 富士通が長年培ってきたスパコンの技術をクラウドで利用できます
安心サポート
ヘルプデスクサービス
日額従量ライセンス
STREAM
SCRYU/Tetra
LS-DYNA
SCIGRESS
Poynting
25社61アプリ
多彩なアプリケーション
流体解析 構造解析 電磁界解析
音響解析 計算化学 最適化設計
HPC Portal
WEB GUIを提供
高性能プラットフォーム
高速リモートデスクトップ
お客様環境
プレポストもクラウドで可能
24
Copyright 2015 FUJITSU LIMITED
HPCクラウドサービス TCクラウド
HyperWorks製品が高性能な計算環境上で利用可能
富士通が培ったHPC技術をネットワーク経由で利用可能
特長1
特長2
特長3
特長4
高性能
HPC分野に特化した高性能な計算環境を提供
高いオンデマンド性
従量課金制で大規模な計算環境を必要なときに必要な分だけ利用可能
高い利便性
クラウド利用のメリットを最大限に引き出す各種ツール・サービスを提供
高信頼のデータセンター
富士通の堅牢な国内データセンターによるクラウドのサービスをご提供
25
Copyright 2015 FUJITSU LIMITED
【特長1】高性能
CAE業務に適した高性能なPCクラスタ環境の利用が可能
 物理ノードを専有利用可能
 高性能なIntel Xeonプロセッサ(20CPUコア/1ノード)
 高並列計算に適した高速インターコネクト(InfiniBand FDR)
 高速で大量にデータ処理が可能なファイルシステム
 スーパーコンピュータ「京」のファイルシステム開発ノウハウを基に、オープンソースソフトウェア
「Lustre(ラスター)」をベースにPCクラスタシステム向けに機能強化
 ファイルシステム側でのボトルネックが発生しないよう、高速で大量にデータ処理が可能
導入効果
導入前
約 12 時間
一般的な解析・シミュレーションへの 「FEFS」 適用例
I/O時間
導入後
約 6 時間(▲50%)
CPU時間
1/3
変化なし
I/O
CPU時間
I/O時間
システム全体処理時間の
3/4をI/Oが占める場合
1/3
I/O時間
I/O処理性能が3倍になれば、
システムトータルの処理時間が1/2に!
高速並列分散ファイルシステムFEFS(Fujitsu Exabyte File System)
記載されている会社名、製品名は各社の登録商標です
26
Copyright 2015 FUJITSU LIMITED
【特長2】高いオンデマンド性
計算リソースを
「必要なときに」「必要な分だけ」「迅速に」調達可能
 計算サーバを月/日/時間単位の従量課金制で1ノードから利用可能
 手頃な金額で利用可能
300円(1ノード/1時間)~
 短いリードタイムで大規模な解析環境を確保可能
TCクラウドの利用による計算環境の増強
30ノード
計算需要(ノード数)
ピーク時は
TCクラウドを利用
20ノード
10ノード
5ノード
年間の需要変動
不足分は
TCクラウドを利用
需要に応じた増設により高い稼働率を維持
無駄な投資を抑えたスモールスタートが可能
緊急の需要に対しても即時利用可能
一時的なマシンパワーの増強により
研究開発スピードを加速化
27
Copyright 2015 FUJITSU LIMITED
【特長3】高い利便性
WebベースのGUIで簡単操作
プレポスト環境も利用可能
 HPC Portal
 リモートデスクトップサービス
 富士通独自の仮想デスクトップ高速化技術を搭載し
た、リモートデスクトップサービス
 大容量の解析結果データを手元にダウンロードせず、
即時解析結果の表示が可能
 高画質・高性能なプレポスト環境をクラウド上で利用
可能
 複数個所での画面共有による解析評価検討が可能
 Webブラウザから容易かつ共通の操作性でHPCシス
テムを利用可能なポータルシステム
 HPCシステム固有のスキル(Linuxコマンド、ジョブスケ
ジューラ等のスキル)がなくとも、ファイル操作やジョブ操
作を簡単に実行可能。
 誰でも簡単に同じ操作で解析が実行でき、解析作業
の平準化が可能
お客様環境(複数個所での画面共有)
設計部門
Internt
解析部門
TCクラウド
28
Copyright 2015 FUJITSU LIMITED
【特長4】高信頼のデータセンター
 富士通の堅牢な国内データセンターによるクラウドサービス
 セキュリティー、災害等に対する設備・運用面の対策を実施
 各種認証を取得
設備
電源
対策
停電
空調
空調
災害対策
防犯対策
漏水
実施内容
無停電電源装置(UPS)、自家用発電装置
冗長並行商用同期運転方式
空冷式空調機
空冷式空調機
空調機械室/配管を計算機室と分離
フロア内防水堤・排水設備、床防水対策加工、床・配管に漏水センサー設置
温度・湿度
温度・湿度センサーの設置
地震
ラック免震・落下防止枠付き専用ラックへの機器収納
火災
自動火災報知器設備、防排煙制御設備、窒素ガス消火設備、
超高感度煙センサー設置、耐火壁パーティション採用
雷
避雷機器設備の設置
侵入防止
手のひら静脈認証、専用カード入退室管理、セキュリティゲート
防犯監視
ITVによる24時間監視およびHDDへの記録、保存
防犯管理
セキュリティドアの監視と遠隔操作、退室実績の記録保存
ISO27001規格取得 認定:ISO
ISO14001規格取得
LGWAN-ASP認定 認定:LASDEC
プライバシーマーク認証取得 認定:JIPDEC
自家用発電装置
手のひら静脈認証装置
ISO9001規格取得
ISO20000規格取得
サーバールーム
29
監視オペレーションルーム
監視カメラ セキュリティゲート
Copyright 2015 FUJITSU LIMITED
TCクラウド -解析アプリケーションサービス解析プラットフォームと組み合わせてご利用いただけるアプリケーション
 アルテアエンジニアリング様のアプリケーションソフトウェア
熱流体解析(CFD)ソルバー
構造解析ソルバー・最適化
非線形・衝撃解析ソルバー
複合領域設計スタディ・最適化
モデリング&ビジュアライゼーション
高精度・高速なオートメッシャー
OptiStruct
AcuSolve
HyperStudy
RADIOSS
SimLab
HyperMesh
アルテアエンジニアリング様と協力してTCクラウド上で動作検証済み
全25社、61種のアプリケーションを使用可能
30
Copyright 2015 FUJITSU LIMITED
TCクラウド -解析ヘルプデスク 解析における問題解決支援サービス例
アプリベンダーのソフトや内製ソフトを利用したい
導入支援
問題切分けで困っている、運用構成への助言が欲しい
運用支援
アプリケーションの利用技術を習得したい
解析業務をアウトソーシングしたい
教育支援
受託解析
 豊富なソリューション提供実績をもつ専門家の力を結集
 プラットフォームから解析アプリケーションの業務適用までのトータルサポート
 精密機械、建設、鉄鋼、電気・電子、自動車など多彩な業種で蓄積したノウハウ
 アプリケーションベンダー、コンサルティング会社など、パートナー様とのアライアンスで、
多くの解析の専門家の力を活用
31
Copyright 2015 FUJITSU LIMITED
おわりに
 富士通の最新PCクラスタ環境での測定を通して、
流体解析ソルバAcuSolveの優れた並列化性能
が得られた。
 富士通がご提供するHPC向けソリューションとして、
PCクラスタとTCクラウドについて紹介した。
今後もアルテアエンジニアリング様と連携し、
お客様に安心して解析アプリケーションを
活用していただける環境をご提供します。
32
Copyright 2015 FUJITSU LIMITED
留意事項および商標について
 留意事項
 本資料に記載されている情報は、お客様システムにおける性能向上を保証するも
のではございません。
 本資料および記載内容については、無断で他に転載しないようにお願いします。
 商標について
 AcuSolve、PBS Professionalは、アルテアエンジニアリング株式会社の登録商
標または商標です。
 Intel、インテル、Xeonは、米国インテル社の登録商標または商標です。
 Ethernetは、米国ゼロックス社の登録商標です。
 Red Hat、RPMおよびRed Hatをベースとしたすべての商標とロゴは、Red Hat
Inc.の米国およびその他の国における登録商標または商標です。
 その他の記載されている会社名、製品名は各社の登録商標または商標です。
 本資料に記載されている製品名、システム名等には、必ずしも商標表示(®、
TM)を付記していません。
33
Copyright 2015 FUJITSU LIMITED
Copyright 2015 FUJITSU LIMITED