インテル® System Studio 2017

コネクテッド・デバイスは複雑さを増し、あらゆるところに存在
システム/組込み開発者の課題と可能性が増加
IoT デバイス
ゲートウェイ
クラウド/
データセンター/
ストレージ
クライアント
& モバイル
輸送
小売
産業
画像処理
デジタル・
セキュリティー/
監視
軍事、
航空宇宙、
政府
医療
ネットワーク &
通信
F
143
$$
bpm
これらの課題に取り組むには、ソフトウェア開発者は次のようなツールが必要
 簡単に使える統合スイート
 複雑なシステムの不具合を解決できるように迅速に支援
 電力を浪費しているソースの詳細を提供
 パフォーマンスが求められる、ユニークで競争力に優れたユースケースへの対応と
高速化
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
2
インテル® SYSTEM STUDIO
システム/組込み開発者にシステムワイドの深い洞察を提供
開発期間を
短縮
電力効率と
パフォーマンスを向上
システムの信頼性を
強化
最新のインテル® プラットフォームを
サポート
強力で分かりやすいパフォーマンス
解析ツール
相関システムイベントのトレース/
デバッグ
包括的なすぐに使えるドメイン固有
のルーチン
高度に最適化され、プラットフォーム
向けにチューニングされたライブラ
リーとコンパイラー
クローズド筐体のソフトウェア・デ
バッグとプロダクション・ハードウェア
上でのトレース
実用的なデータ - ウェイクアップ、
スリープステート、周波数、温度
拡張されたデバッガー・ワークフロー
により素早くデバッグを開始
システムワイドの視覚的なパフォー
マンス解析により迅速に最適化
組込みソリューションを迅速に開発
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
3
インテル® System Studio は包括的なツールスイートを提供
システム/組込み開発者にシステムワイドの深い洞察を提供
コンパイラーとライブラリー
C/C++
コンパイラー
画像、信号、数学、
データ処理
アナライザー
電力 &
パフォーマンス
メモリー &
スレッド化
デバッガー
アプリケーション &
システム
Linux*1、Android™、Windows®、VxWorks* で動作する
システムおよびアプリケーション・コード
Simics*
プラットフォーム・
シミュレーション
デバッグ/
トレース
JTAG、
JTAG
over
USB
UEFI2
エージェント
インテル® アーキテクチャー・ベースのプラットフォーム
ターゲットシステム




パフォーマンスが求められるユースケースへの対応と高速化
電力を浪費しているソースの詳細を提供
複雑なシステムの不具合を解決できるように迅速に支援
簡単に使える統合スイート
組込みソリューションを迅速に開発 - 詳細: intel.ly/system-studio (英語)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
1
2
Linux*、組込み Linux*、Wind River* Linux*、Yocto Project*
UEFI: Unified Extensible Firmware Interface
4
インテル® System Studio 2017 によりシステム、
組込みアプリケーション、デバイスを迅速に開発 – 新機能
最新のインテル® プラットフォーム
をサポート
インテルの組込み/モバイル・プラットフォームを利用して優れたソリューション/デバイス
を開発。アーキテクチャー固有のチューニングの向上、グラフィックス・エンジンへのオフ
ロードを含む新機能。
改良された解析によりコード・
パフォーマンスを最適化
拡張されたデータレポートと新しいサブシステム解析により、開発者はパフォーマンス・
ボトルネックを特定して、コードへの影響を素早く理解し、より効率的なコードを作成可能。
コンパイラー & ライブラリー
画像、マシンラーニング、ストレージ、通信、輸送を含む、負荷の高い処理のパフォーマンス
と機能を向上 - これらのターゲット向けに革新的なソリューション/アプリケーションの作
成を支援。
簡単に使用可能
拡張されたユーザビリティー、ワークフロー、タスクベースのチュートリアルにより、開発者
の生産性を向上。
素早いプロトライプ生成、
競争優位性の確立
短期間でプロトタイプから生産に取り掛かれるように支援。ほかのインテル® ソフトウェア・
ツールおよび SDK と連携して、ユニークで競争力に優れた機能の革新を支援。
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
5
各エディションと構成
ビルド
インテル® System Studio 2017
インテル® C++ コンパイラー
インテル® TBB
インテル® IPP
インテル® MKL
Composer Edition
Professional Edition
Ultimate Edition
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
√
デバッグ
解析
インテル® VTune™ Amplifier for Systems – パフォーマンス・
プロファイラー
インテル® Energy Profiler
インテル® Graphics Performance Analyzers
インテル® Inspector for Systems – メモリー/スレッドのデバッガー
GDB アプリケーション・デバッガー3
インテル® System Debugger
GDB OpenOCD3
√
ホスト・オペレーティング・システム
Linux*、Windows®
ターゲット・オペレーティング・システム1
ハードウェア・プロセッサー/プラットフォーム4
Linux*2、Android™、Windows®
プロセッサー: インテル® Quark™ プロセッサー X1000、インテル® Atom™ x3/x5/x7 プロセッサー、
インテル® Core™ M プロセッサー、インテル® Core™ i3/i5/i7 プロセッサー、インテル® Xeon® プロセッサー
開発プラットフォーム: インテル® Edison 開発プラットフォーム、インテル® Joule™ モジュール、
インテル® Puma™ 6 メディア・ゲートウェイ、第 2 世代 インテル® Galileo ボード
フローティング・ライセンス、アカデミック・ライセンス、および VxWorks* サポートを含むその他の構成については、software.intel.com/en-us/intel-system-studio/try-buy (英語) を参照してください。
すべてのエディションに 1 年間のインテル® プレミアサポート (更新可能) が含まれます。
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
利用可能なターゲット OS ライセンス: Linux*+Android™ (コンボ)、Windows®
Linux*、組込み Linux*、Wind River* Linux*、Yocto Project*
Linux* ターゲット OS でサポート
4 サポートされるプロセッサーとプラットフォームの詳細は、リリースノートを参照してください。
1
2
3
6
インテル® System Studio はシステム/組込み開発者を支援
開発期間を短縮
8 時間以上から 5 分に
生産性を向上
www.imcorp.com
「IMCORP は、電力ケーブル診断を行う複雑な信号処理アルゴ
リズムのパイオニアです。インテル® System Studio に含まれ
るインテル® VTune™ Amplifier を利用することで、それまで 8
時間以上かかっていたクリティカルなパフォーマンス hotspot
の特定作業を 5 分以内に行うことができました。」
IMCORP R&D ソフトウェア・エンジニア
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
7
インテル® System Studio はシステム/組込み開発者を支援
システムの信頼性を強化
コードを改善
「インテル® System Studio に含まれるインテル®
System Debugger を利用することで、工業オートメー
ション・システム・ソフトウェアのハードウェア依存コー
ドを改善できました。インテル® System Studio により、
プロセッサーの内部状態やソフトウェアのタイム・クリ
ティカルな実行パスの分析にかかる労力が劇的に軽
減しました。」
Beckhoff Automation
Henning Zabel 博士
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
効率を向上 無駄な作業を排除
「クラッシュの調査で、1 週間かかってなんとか問題が
発生した場所は見つけましたが、原因の究明が非常に
困難で苦労していました。インテル® Inspector を実
行してみたところ、すぐに境界外の配列を見つけること
ができました。それは、実際にクラッシュが発生した場
所よりもずっと前にありました。もっと早くインテル®
Inspector を使用していれば 1 週間も無駄にせずに
済みました!」
Envivio
シニア・コーデック・アーキテクチャー・エンジニア
Mikael Le Guerroué 氏
8
インテル® System Studio はシステム/組込み開発者を支援
電力効率とパフォーマンスを向上
3 倍向上
50% 向上
電力効率
パフォーマンス
「インテル® System Studio により、最近リリースした
弊社の Android™ ベースのタブレット Tolino Tab* 8”
(電子書籍リーダー) では、ユーザー・エクスペリエンス
が 3 倍 (500 ~ 700 ミリ秒から 200 ミリ秒) に劇的に
向上しました。これにより、CPU 負荷が軽減され、電力
効率が少なくとも 3 倍向上しました。」
「インテル® System Studio を使用することにより、
弊社のインテル® アーキテクチャー・ベースのネット
ワーク・ビデオ・レコーダー・システムのパフォーマン
スが 50% 向上しました。」
Deutsche Telekom
チーフ・プロダクト・オーナー
Dirk Hofmann 氏
Zhejiang Dahua Technology Co.
製品ライン・マネージャー
Cai Jian Feng 氏
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
9
システム/組込み開発を容易にするツール
インテル® System Studio
インテル® IoT Developer Kit
組込みソリューションを迅速に開発
CPU ベースのシステム/
組込み開発者向け
3 つのエディション: Composer、
Professional、Ultimate
IoT ソリューションを簡単に作成
インテル® System Studio
for Microcontrollers
マイクロコントローラー・ベースのソリューションの
作成に役立つツール
関連ツールキット (無料)
インテル® Computer Vision
SDK
コンピューター・ビジョン・
ソリューションを高速化
インテル® Media SDK または
インテル® Media Server Studio
高速で高密度のメディア処理
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
インテル® SDK for OpenCL*
Applications
インテル® グラフィックス
により計算を最適化
IoT Edition
素早く簡単に市場投入する
ための IoT ゲートウェイ
インテル® XDK IoT
Edition
Node.js ベースの
アプリケーションを直接
IoT デバイス上で開発
インテル®
IoT
ゲートウェイ
10
インテル® SYSTEM STUDIO
ベンチマーク
インテル® C++ コンパイラー - SPEC* ベンチマークで優れたパフォーマンスを達成
インテル® C++ コンパイラーによる優れた C++ アプリケーション・パフォーマンス ― Windows®/Linux*
(数値が大きいほど高性能)
浮動小数点演算
整数演算
相対 (相乗平均) パフォーマンス SPEC* ベンチマーク
システム構成: Windows® ハードウェア: インテル® Xeon® プロセッサー E3-1245 v5 @ 3.50GHz、ハイパースレッディング有効、
ターボブースト有効、32GB RAM。Linux* ハードウェア: インテル® Xeon® プロセッサー E5-2680 v3 @ 2.50GHz、256GB RAM、
ハイパースレッディング有効。
ソフトウェア: インテル® C++ コンパイラー 17.0、Microsoft® C/C++ 最適化コンパイラー 19.00.23918 (x86/x64)、GCC 6.1.0、
PGI* 15.10、Clang/LLVM 3.8。
Linux* OS: Red Hat* Enterprise Linux* Server 7.1 (Maipo)、カーネル 3.10.0-229.el7.x86_64。Windows® OS: Windows® 10
Pro (10.0.10240 N/A Build 10240)。
SPEC* ベンチマーク (www.spec.org)。SPECint* ベンチマークでは、Visual C++® コンパイラーとインテル® コンパイラーで
SmartHeap 11.3 を使用。
Windows®
Linux*
SPECfp*_speed_base2006 の推定値
Windows®
1
GCC 6.1.0
インテル® C++
コンパイラー 17.0
Visual C++®
2015
PGI* 15.10
1 1.09
インテル® C++
コンパイラー 17.0
1.28 1.7
1.67
1 1.02
GCC 6.1.0
1.51
インテル® C++
コンパイラー 17.0
Visual
C++® 2015
PGI* 15.10
GCC 6.1.0
Linux*
SPECint*_rate_base2006 の推定値
1 1.03
Clang 3.8
Windows®
1 1.02
Clang 3.8
1.13
Visual C++®
2015
インテル® C++
コンパイラー 17.0
PGI* 15.10
インテル® C++
コンパイラー 17.0
Linux*
SPECfp*_rate_base2006 の推定値
1
2.03
1.55
Clang 3.8
Windows®
GCC 6.1.0
1 1.03 1.28
Clang 3.8
インテル® C++
コンパイラー 17.0
Visual C++®
2015
PGI* 15.10
1.39
1 1.05
整数演算
インテル® C++
コンパイラー 17.0
1.71
インテル® C++
コンパイラー 17.0
浮動小数点演算
Linux*
SPECint*_speed_base2006 の推定値
相対 (相乗平均) パフォーマンス SPEC* ベンチマーク
システム構成: Windows® ハードウェア: インテル® Xeon® プロセッサー E3-1245 v5 @ 3.50GHz、ハイパースレッディング有効、
ターボブースト有効、32GB RAM。Linux* ハードウェア: インテル® Xeon® プロセッサー E5-2680 v3 @ 2.50GHz、256GB RAM、
ハイパースレッディング有効。
ソフトウェア: インテル® C++ コンパイラー 17.0、Microsoft® C/C++ 最適化コンパイラー 19.00.23918 (x86/x64)、GCC 6.1.0、
PGI* 15.10、Clang/LLVM 3.8。
Linux* OS: Red Hat* Enterprise Linux* Server 7.1 (Maipo)、カーネル 3.10.0-229.el7.x86_64。Windows® OS: Windows® 10
Pro (10.0.10240 N/A Build 10240)。
SPEC* ベンチマーク (www.spec.org)。
性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて
行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。
ベンチマークの出典: インテル コーポレーション
最適化に関する注意事項: インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング
SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル®
マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・
ガイドを参照してください。注意事項の改訂 #20110804
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
13
インテル® MKL と FFTW* の FFT パフォーマンスの比較
単精度複素数 1D および 2D FFT、インテル® Core™ i7-6700 プロセッサー
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
14
インテル® MKL と FFTW* の FFT パフォーマンスの比較
単精度複素数 1D および 2D FFT、インテル® Xeon® プロセッサー E5-2699 v4
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
15
インテル® IPP により
画像のサイズ変更関数のパフォーマンスを大幅に向上
インテル® AVX-512 向けに最適化されたコードとコンパイルした C コード
1
2
インテル® AVX 向けに最適化されたコードとコンパイルした C コード
1
2
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
16
インテル® IPP により
信号処理関数のパフォーマンスを大幅に向上
インテル® AVX-512 向けに最適化されたコードとコンパイルした C コード
2
1
インテル® AVX 向けに最適化されたコードとコンパイルした C コード
1
2
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
17
インテル® IPP により Tencent* の
不正画像フィルターシステムが 2 倍 以上スピードアップ
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
18
インテル® IPP により Tencent* の
不正画像フィルターシステムが 2 倍以上スピードアップ
WeChat*、QQ*、QQ Album* などの人気が
あるアプリケーションでは、新しく生成される
画像が約 100 ペタバイトにも上ります。不正
画像 (アダルトコンテンツなど) をアップロー
ドしようとするユーザーもいます。
それらをブロックするため、システムは各画像をチェックしま
す。100 ペタバイトのデータを検索することを想像してみて
ください。
OpenCV* では 143ms かかるこの処理を、インテル® IPP の
フィルター関数 (ipp_filter2D) は 9ms で実行します。つまり、
インテル® IPP の filter2D は、OpenCV* コードよりも 15 倍高
速です。
※ コンパイル時に OpenCV* はインテル® IPP を統合するため、いくつかの関数は自動的にインテル® IPP 関数を呼び出すことができます。
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
19
インテル® IPP により
JD.com が画像処理を 17 倍スピードアップ
JD.com は、中国のほかのどの企業よりも多くのオンラ
イン・トランザクションを処理しており、2014 年第二四
半期の市場シェアは 54.3% でした。
ビジネスの急成長に伴い、提供する製品の数は 2011
年の約 150 万から 2013 年には約 2570 万へと大幅に
増加しました。現在では、JD.com が扱うデータはペタバ
イトの領域に達しており、効率的で強固な分散型ファイ
ルシステムが求められています。
JD.com は、画像処理を 17 倍スピードアップし、
300,000 画像の処理を 2,800 秒から 162 秒に短縮し
ました。
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
20
インテル® IPP により
Tencent* が MD5 画像識別を 2 倍スピードアップ
毎日、Tencent* では WeChat*、QQ*、QQ Album* でユー
ザーが生成した数十億もの画像を処理しています。
• 1 日で数億もの画像がアップロード、格納、処理、そして
ダウンロードされます―そのため、大量の計算リソースを
必要とします。
• 画像は、圧縮しても数百ペタバイトに上り、爆発的な成長
が続いていて、対応するクラスターは 20,000 を超える
サーバーにより構成されています。
Tencent* のエンジニアは、オンラインシステムにも
インテル® IPP の MD5 を実装しました。その結果、オリジナ
ルの MD5 と比較して、パフォーマンスが約 60% 向上しま
した。
ケーススタディーの詳細
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
21
インテル® SYSTEM STUDIO
機能詳細
画像、信号、データ処理アプリケーション向けのビルディング・ブロック
インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP)
インテル® IPP について
画像処理
最適化
•
•
•
•
•
•
•
画像、信号、データ、暗号化処理作業を
高速化する、すぐに使える、プロセッサー
向けに最適化された関数
インテル® IPP を使用する理由
•
•
•
•
信号処理
サポート
• ゲーム (高度なオーディオコンテン
ツやエフェクト)
• エコー・キャンセレーション
• 通信
• エネルギー
ハイパフォーマンス
簡単に使える API
開発期間の短縮
プロダクション環境にも対応
インテル® IPP の入手方法
インテル® System Studio
インテル® Parallel Studio XE
無料ツールプログラム
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
さまざまな取り組み
医療用画像
コンピューター・ビジョン
デジタル監視
生体認証
自動ソート
ADAS
視覚探索
データ圧縮と暗号化
•
•
•
•
•
•
データセンター
エンタープライズ・データ管理
ID 検査
スマートカード/スマートウォレット
電子署名
情報セキュリティー/サイバーセキュ
リティー
詳細: software.intel.com/intel-ipp (英語)
サポート: software.intel.com/en-us/forums/intel-integrated-performance-primitives (英語)
23
インテル® マス・カーネル・
ライブラリー (インテル® MKL)
エネルギー
科学/研究
工学設計
金融解析
信号処理
デジタル
コンテンツ
制作
 マシンラーニング、科学、工学、金融、
デザイン系アプリケーションにおける
数学処理を高速化
 密/スパース線形代数 (BLAS、LAPACK、
PARDISO)、FFT、ベクトル演算、サマリー
統計などの関数を含む
 ほかの数学ライブラリーから簡単に
切り替えられる業界標準の API
 プロセッサーのパフォーマンスを最大限
に引き出すように高度に最適化、スレッド
化、およびベクトル化済み
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
24
マルチスレッド化とヘテロジニアス・コンピューティングを容易に
インテル® スレッディング・ビルディング・ブロック (インテル® TBB)
インテル® TBB の入手方法
最適化
インテル® System Studio
インテル® Parallel Studio XE
無料ツールプログラム
オープンソース・サイト
インテル® TBB について
1 つまたは複数のデバイス上のすべて
の CPU を利用して、アプリケーションの
並列化を容易にする高度にテンプレー
ト化された C++ ライブラリー
サポート
インテル® TBB を使用する理由
•
•
•
•
ハイパフォーマンス
簡単に使える API
開発期間の短縮
プロダクション環境にも対応
アプリケーション
•
•
•
•
•
•
さまざまな取り組み
•
•
•
•
•
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
アニメーション・レンダリング
数値天気予報
海洋学 & 天体物理学
AI & オートメーション
遺伝子工学
医療アプリケーション (画像処理、MRI
画像再構成)
リモート・センシング・アプリケーション
社会経済学
金融セクター (株式デリバティブの価
格付け、統計)
データファイルの大量更新
ビッグデータ問題
詳細: software.intel.com/intel-tbb (英語)
サポート: software.intel.com/en-us/forums/intel-threading-building-blocks (英語)
25
高速でスケーラブルなコードを迅速に開発
インテル® VTune™ Amplifier パフォーマンス・プロファイラー
正確なデータと意味のある解析で
高速なコードを素早く開発





正確な CPU、GPU、スレッドデータ
メモリーアクセスとストレージ解析
強力なデータ解析とフィルター
データをソースコードに表示
セットアップが簡単で、特別な
コンパイラーは不要
「先週は、インテル® VTune™ Amplifier
により、3 倍のパフォーマンス向上を
見つけることができました。今週は、さらに
3 倍パフォーマンスを向上できました。」
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
SAS Institute Inc.
主任開発者
Claire Cates 氏
intel.ly/vtune-amplifier-xe (英語)
26
Application Performance Snapshot
ベクトル化とスレッド化によるパフォーマンス向上の可能性を見つける
インテル® VTune™ Amplifier パフォーマンス・プロファイラー
目的
 休憩時間に簡単に実行可能
 コードの現代化により利点が得られる
個所を表示
ユーザー
 パフォーマンス・チーム – 最も大きな
利点が得られるアプリケーションを
迅速に特定
 開発者 – コードの現代化による
パフォーマンス・ゲインを予測
その他の用途
 実用的なチューニング・データ – Snapshot を利用
して素早く “ヘルス” チェックを行うことも可能
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
27
電力を無駄にしているソフトウェアを素早く特定
ウェイクアップ、スリープステート、周波数、温度に関する実用的なデータ
インテル® Energy Profiler
 低電力状態を長時間維持する
ことで、ウェイクアップを結合し、
電力消費を抑えて、バッテリー
持続時間を向上
 ファンレスシステムの温度管理を
最適化
コア周波数を下げて
電力効率を向上
C6 ディープ・
スリープ・モードにより
消費電力を削減
software.intel.com/en-us/intel-energy-profiler (英語)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
28
グラフィックス・アプリケーションのデバッグ、解析、最適化
ゲームの最適化とパフォーマンスの向上
インテル® Graphics Performance Analyzers (無料)
 詳細なフレーム解析により FPS を向上
 複数のプラットフォームと GPU をサポート
 困難な CPU/GPU の問題を特定
 リアルタイム・ハードウェア・メトリックの詳細な解析
 ソースコードや外部の変更は不要
PC ゲーム (Windows®、Ubuntu*)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
モバイルゲーム (Windows®、Android™)
intel.software.com/gpa (英語)
29
メモリー/スレッドエラーの特定とデバッグ
メモリー/スレッドのデバッガー – インテル® Inspector
正当性検証ツールにより ROI が 12%-21%1 向上
デバッガー・ブレークポイント
 早期に発見した問題のほうが修正コストが少なくて済む
 いくつかの調査によると ROI% はケースバイケースだが、
早期に発見/対応したほうがコストを抑えられる
エラーによっては診断に数カ月を要する
 競合やデッドロックは簡単に再現できない
 メモリーエラーをツールなしで発見するのは困難
デバッガー統合により迅速な診断が可能
 問題の直前にブレークポイントを設定
「インテル® Inspector により、パッケージ
をリリースする前に、切り分けが困難な
スレッドエラーを迅速に追跡できるように
なりました。」
 デバッガーで変数とスレッドを確認
数カ月かかっていた診断を数時間に短縮
1
コスト要因 - Square Project による分析
CERT: U.S. Computer Emergency Readiness Team および Carnegie Mellon CyLab
NIST: National Institute of Standards & Technology : Square Project の結果
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
Harmonic Inc.
ソフトウェア開発ディレクター
Peter von Kaenel 氏
intel.ly/inspector-xe (英語)
30
複雑なシステムの問題を迅速に切り分け
総合的なシステムワイドのハードウェア/ソフトウェア・イベントトレース
インテル® System Debugger
 タイムスタンプ付きの関連付け
されたトレース情報を使用して
問題を効率良く特定
タイムスタンプ
情報による
イベントトレース
 ソフトウェアとハードウェア間の
複雑な相互作用を解析
第 6 世代 インテル® Core™ プロセッサー・ファミリー以降で利用可能
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
フィルターダイアログ
を使用して特定の
イベントに注目
31
システムワイドのクローズド筐体のデバッグ
低コストの USB 接続による JTAG ベースのデバッグとトレース
 開発者がエンジニアリング・サンプルではなく、実際のプロダクション・ハードウェア上で作業する時間を排除
 JTAG 機器/プローブにかかるコストを節約 - 高価な JTAG プローブの代わりに標準 USB 接続でデバッグ
 JTAG デバッグ・ステーションを交代で使用する必要なし
 柔軟な設計 – アクセス可能なハードウェア JTAG ポートの要件を緩和
インテル® SVT CLOSED CHASSIS ADAPTER
USB ケーブル
ターゲット
システム
インテル® System
Debugger
OS ブートのデバッグ & トレース
ターゲット
システム
物理的な USB
ポートを介した
JTAG データ
(1)
インテル® System
Debugger
CPU リセットからのデバッグ & トレース
第 6 世代 インテル® Core™ プロセッサー・ファミリー以降で利用可能
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
(1) SVT = Silicon View Technology – 詳細: https://designintools.intel.com/product_p/itpxdpsvt.htm (英語)
32
インテル® SYSTEM STUDIO
関連情報: 新機能
インテル® System Studio 2017** - 新機能
最新のインテル® プラットフォームをサポート
 インテル® Quark™ プロセッサー X1000、インテル® Atom™ x3/x5/x7 プロセッサー、インテル® Core™ M プロセッサー、インテル® Core™ i3/i5/i7
プロセッサー、インテル® Xeon® プロセッサー、インテル® Edison 開発プラットフォーム、インテル® Puma™ 6 メディア・ゲートウェイほか
 インテル® IPP は最新のベクトル命令を活用: インテル® SSE4.2 (インテル® Atom™ プロセッサー)、インテル® AVX 2 (インテル® Core™ プロセッ
サー)、インテル® AVX-512 (インテル® Xeon® プロセッサー)





高速なルーチン: FIR、MulPack、Min/Max、DotProd、BinToGray/GrayToBin、Morphology、CrossCorr、Sort、さまざまなフィルターなど
–
–
第 5 世代インテル® Core™ プロセッサー向けのチューニング: /tune:broadwell (Windows®) または –mtune=broadwell (Linux*)
第 6 世代インテル® Core™ プロセッサー向けのチューニング: /tune:skylake (Windows®) または –mtune=skylake (Linux*)
SIMD Data Layout Template (SDLT) により C++ コードのベクトル化を向上
コンパイラーによるループと関数のアライメントの向上
特定のターゲット・プロセッサー向けに強力なチューニングを行うコンパイラー・オプションを追加
インテル® グラフィックス・テクノロジーへのオフロード (インテル® C++ コンパイラー) と OpenCL* 2.0 共有仮想メモリー (インテル® IPP/インテル®
VTune™ Amplifier for Systems) のサポートを拡張
より多くの情報を利用して優れたコードを作成
 より詳細なコンパイラーの最適化レポートとインテル® Inspector のスレッド・エラー・レポート
 インテル® VTune™ Amplifier for Systems のディスク I/O 解析により、バランスの取れていないディスク I/O と計算を検出
アプリケーション用のドメイン固有のツール
 マシンラーニング/ニューラル・ネットワーク: インテル® MKL を使用したディープ・ニューラル・ネットワーク (DNN) プリミティブ
 画像処理: インテル® IPP を利用して 64 ビット・データ型で超解像をサポート
エクスペリエンスの向上
 単純な IDE ワークフローにより簡単に製品開発に着手可能
 特定のプロジェクトでの各種ツールの使用法を示すタスクベースのチュートリアルをさらに充実
 デバッガー・ワークフローの拡張 (セッション管理、デバッグスクリプトのサポート、トレース出力のフィルター/検索) により製品のデバッグに集中可能
**ここでは主な機能のみ紹介 - すべての機能についてはリリースノートをご覧ください
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
34
インテル® System Studio 2017
インテル® C++ コンパイラー
インテル® C++ コンパイラー
より効果的な使用によりパフォーマンスを向上
インテル® グラフィックス・テクノロジーへのオフロードを向上
ベクトル化の改良点:
 新しい SIMD Data Layout Template (SDLT) により C++ コードのベクトル化を向上
 ループと関数のアライメントを向上
 インテル® AVX-512 命令をサポート
新しいターゲット・プロセッサー・アーキテクチャー用のチューニング・オプション
正しい情報でより効果的なコードを作成
最適化レポートの拡張: レジスター割り当てレポート、アノテーション付きのソース一覧、セキュリティー機能の強化により
生産性と効率を向上
最新の言語標準とプラットフォームをサポート
C++14、C11、最新の Windows® と Visual Studio® プラットフォームほか
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
35
インテル® System Studio 2017
インテル® IPP
概要
高速なルーチン
さらなるベクトル化によりパフォーマンスを向上
 ベクトル & SIMD 命令を利用してパフォーマンスを向上
• インテル® SSE4.2 (インテル® Atom™ プロセッサー)、
インテル® AVX 2 (インテル® Core™ プロセッサー)、
インテル® AVX-512 (インテル® Xeon® プロセッサー)
インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX512)
 135 関数を Knights Landing✝ と Skylake✝ 向けに最適化:
32f Min/Max、Norms、Mean、Sum、Compare、SwapChannels、Copy、
いくつかの Filters、Morphology、CrossCorr、いくつかの算術関数
 17 関数を Skylake✝ 向けに最適化: DotProd、Convert、
BinToGray/GrayToBin、いくつかの Filters、FIR、MulPack
改良された画像処理と超解像サポート
 画像データ処理の精度を向上するため、新しい 64 ビット・
データ型を追加
インテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2)
Haswell✝ と Skylake✝ 向けに最適化された関数: Convert、CrossCorr、
Max/Min、PolarToCart、Sort、いくつかの算術関数
コンピューター・ビジョン・アプリケーション向けにパフォーマン
スを最適化
 OpenCV* パフォーマンスを向上
インテル® ストリーミング SIMD 拡張命令 4.2 (インテル® SSE4.2)
インテル® Atom™ プロセッサー向けに最適化された関数:
CopyMirrorBorder、Morphology (Dilate/ErodeBorder)、
AlphaComposition
出典: インテル コーポレーション - Sharmila Chockalingam (20160603)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
✝
開発コード名
36
インテル® System Studio 2017
インテル® TBB & インテル® MKL
インテル® TBB
インテル® MKL
ヘテロジニアス・コンピューティングのサポートを拡大
 OpenCL* 2.0 共有仮想メモリー (SVM) 使用タイプを
サポート
マシンラーニング & ニューラル・ネットワーク・アプリ
ケーションのパフォーマンスを向上
 新しいディープ・ニューラル・ネットワーク (DNN)
プリミティブによりインテル® アーキテクチャー上で
畳み込みニューラル・ネットワークとディープ・
ニューラル・ネットワークを高速化
• 畳み込み、正規化、アクティベーション、プーリング
関数
インテル® TBB との互換性を向上
 スレッドレイヤーのサポートをすべてのレベル 1
BLAS 関数に拡張
インテル® MKL との互換性を向上
• スレッドレイヤーのサポートをすべてのレベル 1
BLAS 関数に拡張
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
37
インテル® System Studio 2017
インテル® VTune™ Amplifier for Systems & インテル® Inspector
インテル® VTune™ Amplifier for Systems インテル® Inspector
最適化の可能性がないかサブシステムを解析
競合状態を簡単に診断
 ディスク I/O 解析は、ディスク・サブシステム、CPU、プロセッサー・
バスの使用状況をモニターして、バランスの取れていないディスク
I/O の検出および計算を支援
 OpenCL* 2.0 共有仮想メモリー (SVM) 使用タイプをサポート
 競合状態が発生したソースコードの行番号と変数 (グローバル、
スタティック、スタック) の名前を特定することで、競合状態と
スレッドエラーのデバッグを改良
ドライバーをインストールすることなく、より多くのパフォーマンス・
データを解析
• プリインストールされる Linux* の perf ドライバーを使用したイベント
ベースのサンプリングに、メモリーと帯域幅の問題の可視性を向上する
イベントを追加
未活用のパフォーマンスを迅速に発見
 新しい Application Performance Snapshot 機能により、単なる推測
ではなくデータに基づいて最適化の可能性の優先度を迅速かつ容易
に付け、コードの現代化の潜在的な利点を表示
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
38
インテル® System Studio 2017
インテル® Graphics Performance Analyzers (インテル® GPA) & インテル® System Debugger
インテル® GPA
インテル® System Debugger
最適化の可能性がないかサブシステムを解析
改良されたデバッグ・ワークフロー
ディスク I/O 解析により、バランスの取れていないディスク I/O を検出
正しい情報でより効果的なコードを作成
Graphics Frame Analyzer
 ergs の選択履歴とジオメトリ―・エクスポートを新たにサポート
 すべての試みを元に戻す機能を実装
 ergs を使用状況、色分けされたリソースタイプに視覚的に関連付け
るリソース履歴を追加
 Ubuntu* ターゲットのリモート・プロファイルを新たにサポート
System Analyzer
 フレームレート制限の影響を最小限に抑えるための、Android™ と
Ubuntu* ターゲット向けの Vsync オーバーライドを実装
 システムメトリックを 1 つのビューにまとめた Ubuntu* ターゲット用
の新しいシステムビュー
 Ubuntu* ターゲット向けに第 6 世代インテル® Core™ プロセッサー
上で GPU ハードウェア・メトリックをサポート
 より簡単なターゲット接続: デバッガー設定の保存と復元機能
を備えた新しいプロジェクト/セッションをサポート
 トレース出力フィルター/検索機能を向上
 新しい Python* デバッグ・スクリプト・サポート
互換性の向上
• DWARF4 デバッグ形式をサポート
最新のグラフィックス API をサポート
Microsoft® DirectX® 12 API
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
39
その他のインテル® ソフトウェア開発ツール
インテル® SYSTEM STUDIO と連携して動作
IoT ソリューションを作成、実行、デバッグ、最適化する
ための IDE とツール

インテル® System Studio IoT Edition

インテル® XDK IoT Edition

Wind River* Helix* Cloud

MCU 開発ツール

C、C++、JavaScript*、Python*、Java* プログラミング
言語をサポート
データの収集、視覚化、解析のための IoT クラウド/エッジ
解析
software.intel.com/iot (英語)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
クラウド/
エッジ解析
IDE/ツール
ミドルウェア
I/O およびセンサー/アクチュエーター向けミドルウェア・
ライブラリー
Trusted
Analytics
Platform
(TAP)
IoT エッジ
解析
IBM* BlueMix*、Microsoft® Azure®、
Amazon* AWS*、AT&T* ほか
プロトタイプ
評価/開発/デプロイ
IDP/ Workbench
I/O ライブラリー
(SPI、GPIO、I2C、
AIO、UART)
管理機能、
セキュリティー、
クラウド接続など
センサー/アク
チュエーター・
ライブラリー
Intel®
通信スタック
(Wi-Fi*、Bluetooth*
Technology、ZigBee* など)
OS イメージ
インテル® Edison ボード、インテル® Galileo ボード、
インテル® IoT ゲートウェイ、MCU
ハードウェア
インテル® IoT Developer Kit
インテル® IoT
ゲートウェイ
インテル®
インテル®
Edison ボード Galileo ボード
MCU
(インテル® Quark™ SE マイクロ
コントローラー、インテル® Quark™
マイクロコントローラー D2000)
センサー
アクチュエーター
API バインド (C、C++、Node.JS、Python*、Java*)
41
インテル® System Studio for Microcontrollers
インテル® Quark™ マイクロコントローラー向けに高速でインテリジェントなモノの開発を支援
1インテル®
Quark™ マイクロコントローラー D2000 とインテル® Quark™ SE マイクロコントローラーの電力解析は近日サポート予定
 インテル® Quark™ マイクロコントローラーを利用して魅力的な IoT ソリューション
を開発
 Eclipse* 統合開発環境で開発効率を向上
 最適化コンパイラーとライブラリーを使用して高速でコンパクトなコードを開発
 デバッガーとアナライザーにより品質と電力効率を保証
インテル® SYSTEM STUDIO を利用して、組込みソリューションを迅速に開発
software.intel.com/en-us/intel-system-studio-microcontrollers (英語)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
42
革新的な開発を加速
インテル® Computer Vision SDK & インテル® SDK for OpenCL* Applications
インテル® Computer Vision SDK
コンピューター・ビジョン・ソリューションを高速化
インテル® SDK for OpenCL* Applications
互換性
インテル® プラットフォーム向けの開発環境
1 つのグラフにさまざまな種類のビルディング・ブロックを混在させること
が可能
 ビルトインカーネル (CPU、GPU、IPU など)
 OpenCV* 関数、デバッグ/ユーティリティー・カーネル
 カスタムカーネル: ネイティブ C/C++、OpenCV*、OpenVX*、
OpenCL* ほか
ヘテロジニアス




各カーネルが異なる IP ブロックで実行するように割り当て
コンピューター・ビジョン・アクセラレーターを簡単にプログラム可能
プラットフォームと IP ブロック間で簡単に移植可能
効率良いメモリー転送とタスク・スケジュール
無料: software.intel.com/intel-opencl (英語)
プラットフォーム – OpenCL* の利点
 ヘテロジニアス・コンピューティング向けのオープンスタン
ダードの移植性に優れた API
 Windows®、Linux*、Android™ 向けのハイパフォーマンスな
ヘテロジニアス・アプリケーションを開発
 インテル® グラフィックス・テクノロジー向けプログラムを作成
する標準的な方法
パフォーマンス
OpenVX* ランタイムで使用される複数のパフォーマンス向上機能
(例: タイリング、キャッシュ/CPU の局所性、グラフ融合)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
43
エンドツーエンドの高速で効率良いメディア処理
エッジからクライアントまでシームレスなソフトウェア開発エクスペリエンス
エッジ
ビデオ・ゲートウェイ
スマートカメラ/スマートカー
ネットワーク・ビデオ・レコーダー
インテル® MEDIA SDK
組込み Linux* 向け
データセンター/クラウド
ビデオ・トランスコード/解析、
リモート・デスクトップ、ゲーム
インテル® MEDIA SERVER STUDIO
クライアント
プレイヤー/エディター
車載インフォテインメント/エンターテインメント
インテル® MEDIA SDK
Windows®/組込み Linux* 向け
FPGA
インテルが提供
 ハードウェア・アクセラレーション・コーデックによるスケーラブルなパフォーマンス
 SDK および API の包括的なセット
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
 開発期間の短縮
 ソフトウェアの移植性
44
Wind River* Simics* シミュレーション・テクノロジー
Simics* は、開発者が利用する複雑な電子システムのハードウェアをシミュレートするシステム・シミュレーター





プロセッサー、周辺機器、ネット
ワークをシミュレート
任意のサイズのターゲット・シス
テムをシミュレート
未変更のターゲット・バイナリーを
実行
ユニークで強力なデバッグ手法
を使用
シミュレーションの動作を記録、
保存、復元

アクセス - ソフトウェア開発
プロセスからハードウェアによる
ボトルネックを排除

コラボレーション – 保存した
シミュレーション環境を共有、
通信、交換

オートメーション – デバッグ、
テスト、プロファイル、トレース機能
を自動化
ターゲット・ハードウェア
SIMICS
インテル® System Studio に含まれている評価版シミュレーター
Simics* は Wind River* (インテルの子会社) がライセンス所有および販売
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
45
インテル® SYSTEM STUDIO
技術的な詳細
インテル® System Studio に含まれる機能
ビルド & 最適化
システム/組込み
アプリケーション
解析
デバッグ & トレース
パフォーマンス
CPU 上のコード・
パフォーマンス
時間ベース、
システム・
ソフトウェア
インテル® VTune™ イベントベース
Amplifier
Eclipse* ベース、
Visual Studio®
インテル®
C++
コンパイラー
インテル®
グラフィックス・
テクノロジーへの
オフロードを含む
IDE
サポート
インテル® GPA
System Analyzer
インテル® GPA
Platform Analyzer
CPU/GPU
ワークロード
CPU/GPU
ワークロード
リアルタイム
インテル® IPP
オフライン/詳細
インテル® GPA
Frame Analyzer
電力
インテル®
Energy Profiler
正当性
Professional Edition
Ultimate Edition
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
インテル® Inspector
インテル® System
Debugger
UEFI、OS、ドライバー
JTAG ベース
ウェイクアップ、
スリープステート、
周波数、温度
アプリケーション
の安定性
Composer Edition
インテル拡張 GDB
OpenGL* ES、
DirectX®
システムワイド
の電力効率
インテル® MKL
インテル® TBB
グラフィックス・
パフォーマンス
スレッド/
メモリーリーク
インテル® Debug
Extensions for
WinDbg
Windows® スタック
WinDbg over JTAG
47
ビルド & 最適化
システム/組込みアプリケーション
Eclipse* IDE、
WR Workbench、
Visual Studio®
インテル® C++
コンパイラー
インテル拡張
GDB デバッガー
インテル® IPP
インテル® MKL
インテル® TBB
IDE サポート
•
•
Eclipse*、Workbench* (Linux* ターゲット OS)
Visual Studio® (Windows® ターゲット OS)
IA 向けに最適化されたコンパイラー
インテル® グラフィックス・テクノロジーへの
オフロードを含む
アプリケーション・デバッガー
Linux*、Android™
IA 向けに最適化されたライブラリー
•
画像、信号、データ処理
•
1D、2D、3D FFT ほか
スレッド・ライブラリー
Composer Edition
 優れたコード・パフォーマンス
 強固なコードのためのアプリケーション・
リモート・デバッグ
 パフォーマンスが求められるコードルーチン
用ライブラリー
 複数のターゲット OS プラットフォームで
統一されたスレッド化手法
 一般的な IDE に統合
パフォーマンスが最適化されたコードをビルド
Windows®、Linux* ターゲット用統合テンプレート
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
48
解析
パフォーマンス
インテル® GPA
System Analyzer
インテル® GPA
Platform Analyzer
インテル® VTune™
Amplifier
インテル® GPA
Frame Analyzer
CPU/GPU ワークロード
•
リアルタイム
•
オフライン/詳細
CPU 上のコード・パフォーマンス
時間ベース、イベントベース
グラフィックス・パフォーマンス
OpenGL* ES、DirectX®
電力
インテル®
Energy Profiler
Composer Edition を含む





ワークロード解析によりシステムの動作を理解
より応答性に優れたシステムのコード解析
高速グラフィックスのフレーム解析
システムワイドの解析により電力効率を最適化
スレッドおよびメモリーリーク解析によりシステ
ムの安定性を向上
システムワイドの電力効率
ウェイクアップ、スリープステート、周波数、温度
正当性
インテル®
Inspector
Professional Edition
電力効率、パフォーマンス、コードの正当性を解析
アプリケーションの安定性
スレッド/メモリーリーク
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
49
デバッグ & トレース
システム・ソフトウェア
インテル® System
Debugger
インテル® Debug
Extensions for
WinDbg
UEFI、OS、ドライバーのデバッグ
& トレース
JTAG ベース
Linux*、Android™ ターゲット OS
Windows® スタック
WinDbg over JTAG
Windows® ターゲット OS
Ultimate Edition
Professional Edition を含む
 システムワイドのデバッグとトレース
 UEFI、OS、ドライバー、ミドルウェア用
 イベントトレースにより困難な問題を迅速に
特定
 さまざまな JTAG ハードウェア・インターフェイ
スをサポート
 より効率的なデバッグサイクルのために OS
(Linux*、Android™、VxWorks*) を認識
 Windows® インテグレーター向けのフルスタッ
ク・デバッグ
安定性を高めるシステムワイドの
デバッグとトレース
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
50
デバッグとトレース
デバッグ = システムのスナップショット
トレース = システムの履歴
ハードウェア・イベント
ハードウェア・イベント
STOP
Bluetooth*、GPS
STOP
Bluetooth*、GPS
プラットフォーム・ソフトウェア
プラットフォーム・ソフトウェア
ソフトウェア・イベント
ソフトウェア・イベント
OS、ファームウェア
OS、ファームウェア
時間
時間
表示できる項目:
• 実際のソースコード行
• 変数のステータス
• HW レジスターの内容
デバッグ
トレース
記録
時間
表示できる項目:
• タイムスタンプ付きのハードウェア・イベントと
ソフトウェア・イベント
• サービスルーチンのマップ
トレースはハードウェア・イベントとソフトウェア・イベントの履歴を正確に表示し、
複雑な問題を迅速に識別して切り分けることができる
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
51
コスト効率に優れたアクセスでシステムワイドの問題を切り分け
USB を介した低コストの JTAG ベースのデバッグとトレース・ソリューション
インテル® SVT CLOSED CHASSIS ADAPTER (1)
ターゲット
システム
インテル® System
Debugger
物理的な USB
ポートを介した
JTAG データ
CPU リセットからのデバッグ & トレース
USB ケーブル
ターゲット
システム
インテル® System
Debugger
OS ブートのデバッグ & トレース
第 6 世代インテル® Core™ プロセッサー・ファミリー (開発コード名 Skylake) で利用可能
(1) SVT = Silicon View Technology – 詳細: https://designintools.intel.com/product_p/itpxdpsvt.htm (英語)
USB クローズド筐体の JTAG
インテル® SVT
Closed Chassis Adapter
USB クローズド筐体のデバッグ
CPU リセット
USB.
BIOS/UEFI DbC
スタ
USB 接続確立
ック に依存しない)
(UEFI の一部、OS
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
OS/RTOS/カーネル/ドライバー
ブートフェーズ
52
プリエンプティブなリアルタイム Linux* でアプリケーションの
パフォーマンスを解析
パフォーマンス・アナライザーはリアルタイム Linux* システムのプロファイルをサポート
 プリエンプティブな Linux* システムのパフォーマンス
hotspot を素早く正確に特定
o データコレクターが優先度の高いタスクで中断
されるため、プリエンプティブなシステムにおける
正確なパフォーマンス・プロファイルは困難
 インテル® VTune™ Amplifier は低オーバーヘッドの
サンプリングによりデータ収集を継続
組込みリアルタイム・
アプリケーション
インテル®
VTune™
Amplifier の
データコレクター
プリエンプティブな
リアルタイム
Linux*
 コンカレンシー解析、ロックと待機解析、コンテキスト・
スイッチ情報を提供
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
53
仮想環境でアプリケーションのパフォーマンスを解析
パフォーマンス・アナライザーは仮想環境でのパフォーマンス・プロファイルをサポート
 ゲスト OS で実行中の組込みアプリケーションの
パフォーマンスと動作を検証して解析
 1 つのプラットフォームで仮想環境を利用して
複数の OS とアプリケーションのパフォーマンスを
最適化し、ハードウェア・コストを抑制
1 KVM、Wind
組込み
アプリケーション
組込み
アプリケーション
組込み
アプリケーション
ゲスト OS 1
ゲスト OS 2
ゲスト OS 3
VM1
1
VM2
1
VM3
1
ハイパーバイザー
River* Open Virtualization windriver.com/announces/open_virtualization/ (英語)
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
54
Windows® システムの詳細情報により信頼性を強化
Microsoft® WinDbg カーネルデバッガー向けのシステムデバッグおよびトレース拡張
 JTAG を利用して新しい Microsoft®
WinDbg で簡単にプラットフォーム
を起動し Windows® ドライバーを
検証
インテル®
Processor Trace
の情報
 ドライバーや割り込みを含む、完全
停止状態の Windows® システムを
デバッグ
 インテル® Processor Trace により
複雑なランタイム時の問題を迅速
に切り分け
第 6 世代 インテル® Core™ プロセッサー・ファミリー以降で利用可能
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
JTAG およびインテル® Processor Trace 対応の
Microsoft® WinDbg カーネルデバッガー
55
グラフィックス・コアにオフロードされた計算負荷の高いコードを
効率良くデバッグ
グラフィックス・
オフロードコード用デバッガー
コアで実行する
アプリケーションの
ソースコード
 計算負荷の高いコードをプロセッサーと
グラフィックス・コア間で連携して実行
 簡単なコンパイラー宣言子 (#pragma)
を使用してオフロード用にコードをマーク
 グラフィックス・コアで実行するコードの
デバッグが可能
インテル® HD
グラフィックスまたは
インテル® Iris™ Pro
オフロード
グラフィックス・
グラフィックスを搭載した
されるコードを
コンパイラー
コア
インテル® Core™
が生成
プロセッサーおよび
インテル® Xeon®
プロセッサー
デバッグ・
クライアント
CPU
コア
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
56
必要な情報を素早く表示
インテル® VTune™ Amplifier
データのグループを調整
… (リストの一部のみ表示)
関数をダブルクリックしてソース
を表示
[+] をクリックするとコールスタッ
クが表示される
タイムライン (またはグリッド) の
選択範囲でフィルター
プロセスとその他の
コントロールでフィルター
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
チューニングの可能性はピンクで表示
ホバーするとヒントが表示される
57
タイムラインでスレッドの動作を視覚的に確認
インテル® VTune™ Amplifier
遷移
ロックと待機
CPU 時間
基本 hotspot
高度な hotspot
ホバー:
オプション: API を使用してフレームとユーザータスクをマーク
オプション: 収集中にマークを追加
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
58
並列パフォーマンスの問題を視覚化
共通パターンを見つける
粗粒度のロック
高いロック競合
低コンカレンシー
ロード・インバランス
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
59
インテル® GPU の計算パフォーマンス
インテル® VTune™ Amplifier
OpenCL* カーネルと GPU オフロードの
チューニング
新しいプロセッサーでは、GPU データの収集も
可能 (オプション)。GPU & CPU アクティビティー
の関連付け(Windows® のみ)。
可能性をハイライト表示
潜在的なチューニングの可能性があるセルは
ピンクでハイライト。ホバーすると推奨事項が
表示される。
プロセッサー全体 (CPU + GPU) 向けにチューニング
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
60
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
61
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
62
呼び出し元/呼び出し先 – 親/子の解析
インテル® VTune™ Amplifier
左ペインで関数
をクリックして
呼び出し元/
呼び出し先の
情報を表示
タイム・クリティカルな実行パスのボトルネックを素早く発見
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
63
法務上の注意書きと最適化に関する注意事項
本資料の情報は、現状のまま提供され、本資料は、明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず、いかなる知
的財産権のライセンスも許諾するものではありません。製品に付属の売買契約書『Intel's Terms and Conditions of Sale』に規定されている
場合を除き、インテルはいかなる責任を負うものではなく、またインテル製品の販売や使用に関する明示または黙示の保証 (特定目的への適
合性、商品性に関する保証、第三者の特許権、著作権、その他、知的財産権の侵害への保証を含む) をするものではありません。
性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。
SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行った
ものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほ
かの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。
© 2016 Intel Corporation. 無断での引用、転載を禁じます。Intel、インテル、Intel ロゴ、Intel Inside、Intel Inside ロゴ、Intel. Experience
What‘s Inside、Intel. Experience What’s Inside ロゴ、Intel Atom、Intel Core、Intel Jourle、Iris、Puma、Quark、Xeon、Intel Xeon Phi、
VTune は、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。
Microsoft、Azure、DirectX、Visual C++、Visual Studio、 Windows および Windows Server は、米国 Microsoft Corporation の、米国およ
びその他の国における登録商標または商標です。
Android は Google Inc. の登録商標または商標です。
最適化に関する注意事項
インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えな
いことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡
張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いた
しません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテク
チャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、
該当する製品のユーザー・リファレンス・ガイドを参照してください。
注意事項の改訂 #20110804
最適化に関する注意事項
© 2016 Intel Corporation. 無断での引用、転載を禁じます。
* その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。
64