構造力学シミュレーション性能を 倍以上に向上1,2

ソリューション概要
インテル® Xeon Phi™ コプロセッサー
構造力学シミュレーション性能を
倍以上に向上 1,2
ANSYS* Mechanical* とインテル ® Xeon Phi ™ コプロセッサーを組み合わせ、
Windows*、Linux* 両方の環境で劇的に性能を向上。
工学シミュレーションにおける性能向上は、生産性を向上させるだけでなく、製品開発期間と製
品化までに要する時間を短縮します。性能が倍増することで、
ワークフロー全体の変革が促進され、
設計チームは、イノベーション、品質、安全性、信頼性、製造可能性の向上につながるより多くの
大規模なシミュレーションをより短時間で実行することが可能となります。
「高並列化されたワークロードで優れた
性能を発揮するインテルの新製品は、
ANSYS* 直接法スパースソルバーを
使用して 1TFLOPS 以上の
ピーク時性能を実現します」
̶ ANSYS, Inc. 戦略的提携 /
HPC 戦略担当ディレクター
Barbara Hutchings 氏
ANSYS とインテルは密接に協力しながら、マルチコアのインテル® Xeon® プロセッサー E52600 v2/v3 ファミリーとメニーコアのインテル® Xeon Phi ™ コプロセッサーを組み合わせたア
プリケーション・コードを最適化することで、ANSYS* Mechanical* の性能向上を最大 2.2 倍ま
で実現しました。プロセッサーとコプロセッサーを組み合わせることで、エンドユーザー体験や IT
環境を複雑化させることなく、比較的低コストで構造力学シミュレーションの性能を向上させる
可能性を広げます。
高品質設計へのスマートな近道
ANSYS* Mechanical* ソフトウェアは、線形解析および非線形解析と動力学解析など、構造物
解析のための包括的な有限要素解析(FEA)ツールです。設計 / 解析チームが機械設計のさま
ざまな問題を検証するために使いやすいツールで、広範囲に及ぶライブラリーと構造シミュレー
ションのオプションを豊富に備えています。
ANSYS* Mechanical* は、伝熱解析機能のほか、音響、圧電、伝熱−構造、伝熱−電気などの
連成物理解析機能も搭載しています。品質と柔軟性に優れたシミュレーション環境により、複雑
でより現実的なシナリオを多種盛り込むことで、製品の動作と信頼性を予測することが可能にな
ります。
インテル ® Xeon Phi ™ コプロセッサーで劇的に性能向上
インテル® Xeon® プロセッサー E5-2600 v3 ファミリーは、高並列アプリケーション向けに1ソケッ
ト当たり最大 18 コアで 2.30GHz までコア性能を最適化したプロセッサーと、コア数を抑えて最
大 3.50GHz まで周波数を最適化したプロセッサーを提供します。インテル® Xeon Phi™ コプロ
セッサーは、最大 61 個のコアと 244 スレッドから構成され、超高水準の並列処理を実現します。
ソリューション概要 インテル® Xeon Phi™ コプロセッサー
ANSYS とインテルのエンジニアは、現世代と前世代のソフトウェアおよ
びハードウェア(2-way サーバー)の組み合わせでベンチマークを実行
し、性能面のメリットを測定しました。以下のアップグレード・シナリオに
おいて、
それぞれの性能がどの程度向上するかを示します。
• 前世代のハードウェアをアップグレードしてコプロセッサーを追加
した場合、性能が最大 3.1 倍向上 1,2:インテル ® Xeon® プロセッ
サー E5-2600 v2 ファミリーからインテル® Xeon® プロセッサー E52600 v3 ファミリーにアップグレードしてインテル® Xeon Phi™ コプ
ロセッサーを 1 枚以上追加した場合、ANSYS* Mechanical* 16.0
DMP の性能が最大 3.1 倍に向上しました。
インテル® Xeon Phi™ コプロセッサーを追加すると、より一層の性能
向上を実現します。
継続的に協業することでさらなる価値を創造
インテル® Xeon® プロセッサーとインテル® Xeon Phi™ コプロセッサー
は、
これからも性能、並列処理、電力効率の基準をさらに引き上げてい
きます。ANSYS とインテルは、より大きな価値を実現する、最適化およ
びテスト済みのソリューションを提供するために、引き続き協力してい
きます。ANSYS のライセンスモデルでは、ソフトウェアの最新リリース
に無料でアップグレードできるため、最新のインテル・サーバー・プラッ
トフォームに更新すれば、
ミッション・クリティカルなシミュレーション・ツー
ルの全体的な機能と価値を低リスクで確実に高めていくことが可能に
なります。
ANSYS* Mechanical* 16.0 V16ln-2 DMP
正規化されたソルバー速度
ANSYS はインテルと連携し、インテル® マス・カーネル・ライブラリー
(インテル® MKL)、インテル® コンパイラー、インテル® VTune™ パフォー
マンス・アナライザーといったインテルのソフトウェア開発製品を使うこ
とで ANSYS* Mechanical* をインテル® プロセッサーおよびインテル®
コプロセッサー向けに最 適 化しました。こうした取り組みの結 果、
Windows* 版および Linux* 版 ANSYS* Mechanical* 16.0(それぞれ
の SMP 版と DMP 版を含む)では、サーバーまたはワークステーション・
プラットフォーム上で複数のインテル® Xeon Phi™ コプロセッサーを利
用できます。また、高並列化された行列計算処理コードセグメントをコプ
ロセッサーにオフロードすることで、
スループットを向上します。アプリケー
ション処理に必要なワークロードを、プロセッサーとコプロセッサーの間
で自動的に分散することで、全体的なスループットを最適化します。
• 現世代のハードウェア / ソフトウェア・プラットフォームにコプロセッ
サーを 1 枚以上追加した場合、性能が最大 1.7 倍向上 1,2:インテル®
Xeon® プロセッサー E5-2600 v3 ファミリーを搭載したサーバーに
インテル® Xeon Phi™ コプロセッサーを追加することで、ANSYS*
Mechanical* 16.0 の性能が最大 1.7 倍に向上しました。さらに
10.0
8.0
6.0
4.0
2.0
0.0
2
4
ホストの MPI プロセス数
ホストの構成
2 基のインテル® Xeon® プロセッサー E5-2697 v2
2 基のインテル® Xeon® プロセッサー E5-2697 v2 と 1 枚のインテル® Xeon Phi™ コプロセッサー 7120A
2 基のインテル® Xeon® プロセッサー E5-2697 v3
2 基のインテル® Xeon® プロセッサー E5-2697 v3 と 1 枚のインテル® Xeon Phi™ コプロセッサー 7120A
関連情報
ANSYS* シミュレーション・ソフトウェア
インテルと ANSYS のパートナー Web サイト
インテル ® Xeon Phi ™ 製品ファミリー
科学技術計算分野におけるインテル
¹ 出典:インテルと ANSYS による性能テスト(2014 年 10 月)。前世代のサーバー構成:2 基のインテル ® Xeon® プロセッサー E5-2697 v2(12 コア、2.70GHz、8GT/s、130W)、64GB
DDR3-1600MHz メモリー(8 x 8GB)、1 台の 600 GB SAS HDD ストレージ、Red Hat* Enterprise Linux* Server リリース 6.5、ANSYS* Mechanical* 16.0 DMP。新しいサーバー構
成:2 基のインテル ® Xeon® プロセッサー E5-2697 v3(14 コア、2.60GHz、9.6GT/s、145W)、64GB DDR4-2133MHz メモリー(8 x 8GB)、インテル ® Solid-State Drive DC S3500
シリーズ 800GB、Red Hat* Enterprise Linux* Server リリース 6.5、ANSYS* Mechanical* 16.0 DMP。インテル ® Xeon Phi ™ コプロセッサー 7120 を搭載したシステムと搭載していな
いシステムでそれぞれパフォーマンスを測定。
² 性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル ® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、
特定のコンピューター・システム、
コンポーネント、
ソフトウェア、操作、機能に基づいて行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と
組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。
最適化に関する注意事項
インテル ® コンパイラーは、互換マイクロプロセッサー向けには、
インテル製マイクロプロセッサー向けと同等レベルの最適化が行われない可能性があります。これには、
インテル ® ストリーミン
グ SIMD 拡張命令 2(インテル ® SSE2)、
インテル ® ストリーミング SIMD 拡張命令 3(インテル ® SSE3)、ストリーミング SIMD 拡張命令 3 補足命令(SSSE3)命令セットに関連する最適化お
よびその他の最適化が含まれます。インテルでは、
インテル製ではないマイクロプロセッサーに対して、最適化の提供、機能、効果を保証していません。
本製品のマイクロプロセッサー固有の最適化は、インテル製マイクロプロセッサーでの使用を目的としています。インテル ® マイクロアーキテクチャーに非固有の特定の最適化は、インテル
製マイクロプロセッサー向けに予約されています。この通知に記載の命令セットの詳細については、該当する製品のユーザー・リファレンス・ガイドを参照してください。通知事項の改訂
#20110804
本資料に掲載されている情報は、
インテル製品の概要説明を目的としたものです。本資料は、明示されているか否かにかかわらず、
また禁反言によるとよらずにかかわらず、いかなる知的財
産権のライセンスも許諾するものではありません。製品に付属の売買契約書『Intel's Terms and Conditions of Sale』に規定されている場合を除き、
インテルはいかなる責任を負うもので
はなく、
またインテル製品の販売や使用に関する明示または黙示の保証(特定目的への適合性、商品適格性、あらゆる特許権、著作権、
その他知的財産権の非侵害性への保証を含む)に関
してもいかなる責任も負いません。インテルによる書面での合意がない限り、インテル製品は、その欠陥や故障によって人身事故が発生するようなアプリケーションでの使用を想定した設計
は行われていません。
インテル製品は、予告なく仕様や説明が変更されることがあります。機能または命令の一覧で「留保」または「未定義」と記されているものがありますが、
その「機能が存在しない」あるいは「性
質が留保付である」という状態を設計の前提にしないでください。これらの項目は、
インテルが将来のために留保しているものです。インテルが将来これらの項目を定義したことにより、衝突
が生じたり互換性が失われたりしても、
インテルは一切責任を負いません。この情報は予告なく変更されることがあります。この情報だけに基づいて設計を最終的なものとしないでください。
本資料で説明されている製品には、エラッタと呼ばれる設計上の不具合が含まれている可能性があり、公表されている仕様とは異なる動作をする場合があります。現在確認済みのエラッタに
ついては、
インテルまでお問い合わせください。最新の仕様をご希望の場合や製品をご注文の場合は、お近くのインテルの営業所または販売代理店にお問い合わせください。本資料で紹介
されている注文番号付きのドキュメントや、
インテルのその他の資料を入手するには、1-800-548-4725(アメリカ合衆国)までご連絡いただくか、http://www.intel.co.jp/ を参照してください。
Intel、
インテル、Intel ロゴ、Intel Inside ロゴ、Xeon、VTune、Intel Xeon Phi は、
アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。
Microsoft、および Windows は、米国 Microsoft Corporation の、米国およびその他の国における登録商標または商標です。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
インテル株式会社
〒 100-0005 東京都千代田区丸の内 3-1-1
http://www.intel.co.jp/
©2015 Intel Corporation.
2015 年 4 月
無断での引用、転載を禁じます。
331849-001JA
JPN/1504/500/SE/MKTG/KO