コネクテッド・デバイスは複雑さを増し、あらゆるところに存在 システム/組込み開発者の課題と可能性が増加 IoT デバイス ゲートウェイ クラウド/ データセンター/ ストレージ クライアント & モバイル 輸送 小売 産業 画像処理 デジタル・ セキュリティー/ 監視 軍事、 航空宇宙、 政府 医療 ネットワーク & 通信 F 143 $$ bpm これらの課題に取り組むには、ソフトウェア開発者は次のようなツールが必要 簡単に使える統合スイート 複雑なシステムの不具合を解決できるように迅速に支援 電力を浪費しているソースの詳細を提供 パフォーマンスが求められる、ユニークで競争力に優れたユースケースへの対応と 高速化 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 2 インテル® SYSTEM STUDIO システム/組込み開発者にシステムワイドの深い洞察を提供 開発期間を 短縮 電力効率と パフォーマンスを向上 システムの信頼性を 強化 最新のインテル® プラットフォームを サポート 強力で分かりやすいパフォーマンス 解析ツール 相関システムイベントのトレース/ デバッグ 包括的なすぐに使えるドメイン固有 のルーチン 高度に最適化され、プラットフォーム 向けにチューニングされたライブラ リーとコンパイラー クローズド筐体のソフトウェア・デ バッグとプロダクション・ハードウェア 上でのトレース 実用的なデータ - ウェイクアップ、 スリープステート、周波数、温度 拡張されたデバッガー・ワークフロー により素早くデバッグを開始 システムワイドの視覚的なパフォー マンス解析により迅速に最適化 組込みソリューションを迅速に開発 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 3 インテル® System Studio は包括的なツールスイートを提供 システム/組込み開発者にシステムワイドの深い洞察を提供 コンパイラーとライブラリー C/C++ コンパイラー 画像、信号、数学、 データ処理 アナライザー 電力 & パフォーマンス メモリー & スレッド化 デバッガー アプリケーション & システム Linux*1、Android™、Windows®、VxWorks* で動作する システムおよびアプリケーション・コード Simics* プラットフォーム・ シミュレーション デバッグ/ トレース JTAG、 JTAG over USB UEFI2 エージェント インテル® アーキテクチャー・ベースのプラットフォーム ターゲットシステム パフォーマンスが求められるユースケースへの対応と高速化 電力を浪費しているソースの詳細を提供 複雑なシステムの不具合を解決できるように迅速に支援 簡単に使える統合スイート 組込みソリューションを迅速に開発 - 詳細: intel.ly/system-studio (英語) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 1 2 Linux*、組込み Linux*、Wind River* Linux*、Yocto Project* UEFI: Unified Extensible Firmware Interface 4 インテル® System Studio 2017 によりシステム、 組込みアプリケーション、デバイスを迅速に開発 – 新機能 最新のインテル® プラットフォーム をサポート インテルの組込み/モバイル・プラットフォームを利用して優れたソリューション/デバイス を開発。アーキテクチャー固有のチューニングの向上、グラフィックス・エンジンへのオフ ロードを含む新機能。 改良された解析によりコード・ パフォーマンスを最適化 拡張されたデータレポートと新しいサブシステム解析により、開発者はパフォーマンス・ ボトルネックを特定して、コードへの影響を素早く理解し、より効率的なコードを作成可能。 コンパイラー & ライブラリー 画像、マシンラーニング、ストレージ、通信、輸送を含む、負荷の高い処理のパフォーマンス と機能を向上 - これらのターゲット向けに革新的なソリューション/アプリケーションの作 成を支援。 簡単に使用可能 拡張されたユーザビリティー、ワークフロー、タスクベースのチュートリアルにより、開発者 の生産性を向上。 素早いプロトライプ生成、 競争優位性の確立 短期間でプロトタイプから生産に取り掛かれるように支援。ほかのインテル® ソフトウェア・ ツールおよび SDK と連携して、ユニークで競争力に優れた機能の革新を支援。 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 5 各エディションと構成 ビルド インテル® System Studio 2017 インテル® C++ コンパイラー インテル® TBB インテル® IPP インテル® MKL Composer Edition Professional Edition Ultimate Edition √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ √ デバッグ 解析 インテル® VTune™ Amplifier for Systems – パフォーマンス・ プロファイラー インテル® Energy Profiler インテル® Graphics Performance Analyzers インテル® Inspector for Systems – メモリー/スレッドのデバッガー GDB アプリケーション・デバッガー3 インテル® System Debugger GDB OpenOCD3 √ ホスト・オペレーティング・システム Linux*、Windows® ターゲット・オペレーティング・システム1 ハードウェア・プロセッサー/プラットフォーム4 Linux*2、Android™、Windows® プロセッサー: インテル® Quark™ プロセッサー X1000、インテル® Atom™ x3/x5/x7 プロセッサー、 インテル® Core™ M プロセッサー、インテル® Core™ i3/i5/i7 プロセッサー、インテル® Xeon® プロセッサー 開発プラットフォーム: インテル® Edison 開発プラットフォーム、インテル® Joule™ モジュール、 インテル® Puma™ 6 メディア・ゲートウェイ、第 2 世代 インテル® Galileo ボード フローティング・ライセンス、アカデミック・ライセンス、および VxWorks* サポートを含むその他の構成については、software.intel.com/en-us/intel-system-studio/try-buy (英語) を参照してください。 すべてのエディションに 1 年間のインテル® プレミアサポート (更新可能) が含まれます。 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 利用可能なターゲット OS ライセンス: Linux*+Android™ (コンボ)、Windows® Linux*、組込み Linux*、Wind River* Linux*、Yocto Project* Linux* ターゲット OS でサポート 4 サポートされるプロセッサーとプラットフォームの詳細は、リリースノートを参照してください。 1 2 3 6 インテル® System Studio はシステム/組込み開発者を支援 開発期間を短縮 8 時間以上から 5 分に 生産性を向上 www.imcorp.com 「IMCORP は、電力ケーブル診断を行う複雑な信号処理アルゴ リズムのパイオニアです。インテル® System Studio に含まれ るインテル® VTune™ Amplifier を利用することで、それまで 8 時間以上かかっていたクリティカルなパフォーマンス hotspot の特定作業を 5 分以内に行うことができました。」 IMCORP R&D ソフトウェア・エンジニア 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 7 インテル® System Studio はシステム/組込み開発者を支援 システムの信頼性を強化 コードを改善 「インテル® System Studio に含まれるインテル® System Debugger を利用することで、工業オートメー ション・システム・ソフトウェアのハードウェア依存コー ドを改善できました。インテル® System Studio により、 プロセッサーの内部状態やソフトウェアのタイム・クリ ティカルな実行パスの分析にかかる労力が劇的に軽 減しました。」 Beckhoff Automation Henning Zabel 博士 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 効率を向上 無駄な作業を排除 「クラッシュの調査で、1 週間かかってなんとか問題が 発生した場所は見つけましたが、原因の究明が非常に 困難で苦労していました。インテル® Inspector を実 行してみたところ、すぐに境界外の配列を見つけること ができました。それは、実際にクラッシュが発生した場 所よりもずっと前にありました。もっと早くインテル® Inspector を使用していれば 1 週間も無駄にせずに 済みました!」 Envivio シニア・コーデック・アーキテクチャー・エンジニア Mikael Le Guerroué 氏 8 インテル® System Studio はシステム/組込み開発者を支援 電力効率とパフォーマンスを向上 3 倍向上 50% 向上 電力効率 パフォーマンス 「インテル® System Studio により、最近リリースした 弊社の Android™ ベースのタブレット Tolino Tab* 8” (電子書籍リーダー) では、ユーザー・エクスペリエンス が 3 倍 (500 ~ 700 ミリ秒から 200 ミリ秒) に劇的に 向上しました。これにより、CPU 負荷が軽減され、電力 効率が少なくとも 3 倍向上しました。」 「インテル® System Studio を使用することにより、 弊社のインテル® アーキテクチャー・ベースのネット ワーク・ビデオ・レコーダー・システムのパフォーマン スが 50% 向上しました。」 Deutsche Telekom チーフ・プロダクト・オーナー Dirk Hofmann 氏 Zhejiang Dahua Technology Co. 製品ライン・マネージャー Cai Jian Feng 氏 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 9 システム/組込み開発を容易にするツール インテル® System Studio インテル® IoT Developer Kit 組込みソリューションを迅速に開発 CPU ベースのシステム/ 組込み開発者向け 3 つのエディション: Composer、 Professional、Ultimate IoT ソリューションを簡単に作成 インテル® System Studio for Microcontrollers マイクロコントローラー・ベースのソリューションの 作成に役立つツール 関連ツールキット (無料) インテル® Computer Vision SDK コンピューター・ビジョン・ ソリューションを高速化 インテル® Media SDK または インテル® Media Server Studio 高速で高密度のメディア処理 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 インテル® SDK for OpenCL* Applications インテル® グラフィックス により計算を最適化 IoT Edition 素早く簡単に市場投入する ための IoT ゲートウェイ インテル® XDK IoT Edition Node.js ベースの アプリケーションを直接 IoT デバイス上で開発 インテル® IoT ゲートウェイ 10 インテル® SYSTEM STUDIO ベンチマーク インテル® C++ コンパイラー - SPEC* ベンチマークで優れたパフォーマンスを達成 インテル® C++ コンパイラーによる優れた C++ アプリケーション・パフォーマンス ― Windows®/Linux* (数値が大きいほど高性能) 浮動小数点演算 整数演算 相対 (相乗平均) パフォーマンス SPEC* ベンチマーク システム構成: Windows® ハードウェア: インテル® Xeon® プロセッサー E3-1245 v5 @ 3.50GHz、ハイパースレッディング有効、 ターボブースト有効、32GB RAM。Linux* ハードウェア: インテル® Xeon® プロセッサー E5-2680 v3 @ 2.50GHz、256GB RAM、 ハイパースレッディング有効。 ソフトウェア: インテル® C++ コンパイラー 17.0、Microsoft® C/C++ 最適化コンパイラー 19.00.23918 (x86/x64)、GCC 6.1.0、 PGI* 15.10、Clang/LLVM 3.8。 Linux* OS: Red Hat* Enterprise Linux* Server 7.1 (Maipo)、カーネル 3.10.0-229.el7.x86_64。Windows® OS: Windows® 10 Pro (10.0.10240 N/A Build 10240)。 SPEC* ベンチマーク (www.spec.org)。SPECint* ベンチマークでは、Visual C++® コンパイラーとインテル® コンパイラーで SmartHeap 11.3 を使用。 Windows® Linux* SPECfp*_speed_base2006 の推定値 Windows® 1 GCC 6.1.0 インテル® C++ コンパイラー 17.0 Visual C++® 2015 PGI* 15.10 1 1.09 インテル® C++ コンパイラー 17.0 1.28 1.7 1.67 1 1.02 GCC 6.1.0 1.51 インテル® C++ コンパイラー 17.0 Visual C++® 2015 PGI* 15.10 GCC 6.1.0 Linux* SPECint*_rate_base2006 の推定値 1 1.03 Clang 3.8 Windows® 1 1.02 Clang 3.8 1.13 Visual C++® 2015 インテル® C++ コンパイラー 17.0 PGI* 15.10 インテル® C++ コンパイラー 17.0 Linux* SPECfp*_rate_base2006 の推定値 1 2.03 1.55 Clang 3.8 Windows® GCC 6.1.0 1 1.03 1.28 Clang 3.8 インテル® C++ コンパイラー 17.0 Visual C++® 2015 PGI* 15.10 1.39 1 1.05 整数演算 インテル® C++ コンパイラー 17.0 1.71 インテル® C++ コンパイラー 17.0 浮動小数点演算 Linux* SPECint*_speed_base2006 の推定値 相対 (相乗平均) パフォーマンス SPEC* ベンチマーク システム構成: Windows® ハードウェア: インテル® Xeon® プロセッサー E3-1245 v5 @ 3.50GHz、ハイパースレッディング有効、 ターボブースト有効、32GB RAM。Linux* ハードウェア: インテル® Xeon® プロセッサー E5-2680 v3 @ 2.50GHz、256GB RAM、 ハイパースレッディング有効。 ソフトウェア: インテル® C++ コンパイラー 17.0、Microsoft® C/C++ 最適化コンパイラー 19.00.23918 (x86/x64)、GCC 6.1.0、 PGI* 15.10、Clang/LLVM 3.8。 Linux* OS: Red Hat* Enterprise Linux* Server 7.1 (Maipo)、カーネル 3.10.0-229.el7.x86_64。Windows® OS: Windows® 10 Pro (10.0.10240 N/A Build 10240)。 SPEC* ベンチマーク (www.spec.org)。 性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて 行ったものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほかの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。 ベンチマークの出典: インテル コーポレーション 最適化に関する注意事項: インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えないことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いたしません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテクチャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、該当する製品のユーザー・リファレンス・ ガイドを参照してください。注意事項の改訂 #20110804 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 13 インテル® MKL と FFTW* の FFT パフォーマンスの比較 単精度複素数 1D および 2D FFT、インテル® Core™ i7-6700 プロセッサー 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 14 インテル® MKL と FFTW* の FFT パフォーマンスの比較 単精度複素数 1D および 2D FFT、インテル® Xeon® プロセッサー E5-2699 v4 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 15 インテル® IPP により 画像のサイズ変更関数のパフォーマンスを大幅に向上 インテル® AVX-512 向けに最適化されたコードとコンパイルした C コード 1 2 インテル® AVX 向けに最適化されたコードとコンパイルした C コード 1 2 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 16 インテル® IPP により 信号処理関数のパフォーマンスを大幅に向上 インテル® AVX-512 向けに最適化されたコードとコンパイルした C コード 2 1 インテル® AVX 向けに最適化されたコードとコンパイルした C コード 1 2 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 17 インテル® IPP により Tencent* の 不正画像フィルターシステムが 2 倍 以上スピードアップ 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 18 インテル® IPP により Tencent* の 不正画像フィルターシステムが 2 倍以上スピードアップ WeChat*、QQ*、QQ Album* などの人気が あるアプリケーションでは、新しく生成される 画像が約 100 ペタバイトにも上ります。不正 画像 (アダルトコンテンツなど) をアップロー ドしようとするユーザーもいます。 それらをブロックするため、システムは各画像をチェックしま す。100 ペタバイトのデータを検索することを想像してみて ください。 OpenCV* では 143ms かかるこの処理を、インテル® IPP の フィルター関数 (ipp_filter2D) は 9ms で実行します。つまり、 インテル® IPP の filter2D は、OpenCV* コードよりも 15 倍高 速です。 ※ コンパイル時に OpenCV* はインテル® IPP を統合するため、いくつかの関数は自動的にインテル® IPP 関数を呼び出すことができます。 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 19 インテル® IPP により JD.com が画像処理を 17 倍スピードアップ JD.com は、中国のほかのどの企業よりも多くのオンラ イン・トランザクションを処理しており、2014 年第二四 半期の市場シェアは 54.3% でした。 ビジネスの急成長に伴い、提供する製品の数は 2011 年の約 150 万から 2013 年には約 2570 万へと大幅に 増加しました。現在では、JD.com が扱うデータはペタバ イトの領域に達しており、効率的で強固な分散型ファイ ルシステムが求められています。 JD.com は、画像処理を 17 倍スピードアップし、 300,000 画像の処理を 2,800 秒から 162 秒に短縮し ました。 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 20 インテル® IPP により Tencent* が MD5 画像識別を 2 倍スピードアップ 毎日、Tencent* では WeChat*、QQ*、QQ Album* でユー ザーが生成した数十億もの画像を処理しています。 • 1 日で数億もの画像がアップロード、格納、処理、そして ダウンロードされます―そのため、大量の計算リソースを 必要とします。 • 画像は、圧縮しても数百ペタバイトに上り、爆発的な成長 が続いていて、対応するクラスターは 20,000 を超える サーバーにより構成されています。 Tencent* のエンジニアは、オンラインシステムにも インテル® IPP の MD5 を実装しました。その結果、オリジナ ルの MD5 と比較して、パフォーマンスが約 60% 向上しま した。 ケーススタディーの詳細 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 21 インテル® SYSTEM STUDIO 機能詳細 画像、信号、データ処理アプリケーション向けのビルディング・ブロック インテル® インテグレーテッド・パフォーマンス・プリミティブ (インテル® IPP) インテル® IPP について 画像処理 最適化 • • • • • • • 画像、信号、データ、暗号化処理作業を 高速化する、すぐに使える、プロセッサー 向けに最適化された関数 インテル® IPP を使用する理由 • • • • 信号処理 サポート • ゲーム (高度なオーディオコンテン ツやエフェクト) • エコー・キャンセレーション • 通信 • エネルギー ハイパフォーマンス 簡単に使える API 開発期間の短縮 プロダクション環境にも対応 インテル® IPP の入手方法 インテル® System Studio インテル® Parallel Studio XE 無料ツールプログラム 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 さまざまな取り組み 医療用画像 コンピューター・ビジョン デジタル監視 生体認証 自動ソート ADAS 視覚探索 データ圧縮と暗号化 • • • • • • データセンター エンタープライズ・データ管理 ID 検査 スマートカード/スマートウォレット 電子署名 情報セキュリティー/サイバーセキュ リティー 詳細: software.intel.com/intel-ipp (英語) サポート: software.intel.com/en-us/forums/intel-integrated-performance-primitives (英語) 23 インテル® マス・カーネル・ ライブラリー (インテル® MKL) エネルギー 科学/研究 工学設計 金融解析 信号処理 デジタル コンテンツ 制作 マシンラーニング、科学、工学、金融、 デザイン系アプリケーションにおける 数学処理を高速化 密/スパース線形代数 (BLAS、LAPACK、 PARDISO)、FFT、ベクトル演算、サマリー 統計などの関数を含む ほかの数学ライブラリーから簡単に 切り替えられる業界標準の API プロセッサーのパフォーマンスを最大限 に引き出すように高度に最適化、スレッド 化、およびベクトル化済み 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 24 マルチスレッド化とヘテロジニアス・コンピューティングを容易に インテル® スレッディング・ビルディング・ブロック (インテル® TBB) インテル® TBB の入手方法 最適化 インテル® System Studio インテル® Parallel Studio XE 無料ツールプログラム オープンソース・サイト インテル® TBB について 1 つまたは複数のデバイス上のすべて の CPU を利用して、アプリケーションの 並列化を容易にする高度にテンプレー ト化された C++ ライブラリー サポート インテル® TBB を使用する理由 • • • • ハイパフォーマンス 簡単に使える API 開発期間の短縮 プロダクション環境にも対応 アプリケーション • • • • • • さまざまな取り組み • • • • • 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 アニメーション・レンダリング 数値天気予報 海洋学 & 天体物理学 AI & オートメーション 遺伝子工学 医療アプリケーション (画像処理、MRI 画像再構成) リモート・センシング・アプリケーション 社会経済学 金融セクター (株式デリバティブの価 格付け、統計) データファイルの大量更新 ビッグデータ問題 詳細: software.intel.com/intel-tbb (英語) サポート: software.intel.com/en-us/forums/intel-threading-building-blocks (英語) 25 高速でスケーラブルなコードを迅速に開発 インテル® VTune™ Amplifier パフォーマンス・プロファイラー 正確なデータと意味のある解析で 高速なコードを素早く開発 正確な CPU、GPU、スレッドデータ メモリーアクセスとストレージ解析 強力なデータ解析とフィルター データをソースコードに表示 セットアップが簡単で、特別な コンパイラーは不要 「先週は、インテル® VTune™ Amplifier により、3 倍のパフォーマンス向上を 見つけることができました。今週は、さらに 3 倍パフォーマンスを向上できました。」 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 SAS Institute Inc. 主任開発者 Claire Cates 氏 intel.ly/vtune-amplifier-xe (英語) 26 Application Performance Snapshot ベクトル化とスレッド化によるパフォーマンス向上の可能性を見つける インテル® VTune™ Amplifier パフォーマンス・プロファイラー 目的 休憩時間に簡単に実行可能 コードの現代化により利点が得られる 個所を表示 ユーザー パフォーマンス・チーム – 最も大きな 利点が得られるアプリケーションを 迅速に特定 開発者 – コードの現代化による パフォーマンス・ゲインを予測 その他の用途 実用的なチューニング・データ – Snapshot を利用 して素早く “ヘルス” チェックを行うことも可能 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 27 電力を無駄にしているソフトウェアを素早く特定 ウェイクアップ、スリープステート、周波数、温度に関する実用的なデータ インテル® Energy Profiler 低電力状態を長時間維持する ことで、ウェイクアップを結合し、 電力消費を抑えて、バッテリー 持続時間を向上 ファンレスシステムの温度管理を 最適化 コア周波数を下げて 電力効率を向上 C6 ディープ・ スリープ・モードにより 消費電力を削減 software.intel.com/en-us/intel-energy-profiler (英語) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 28 グラフィックス・アプリケーションのデバッグ、解析、最適化 ゲームの最適化とパフォーマンスの向上 インテル® Graphics Performance Analyzers (無料) 詳細なフレーム解析により FPS を向上 複数のプラットフォームと GPU をサポート 困難な CPU/GPU の問題を特定 リアルタイム・ハードウェア・メトリックの詳細な解析 ソースコードや外部の変更は不要 PC ゲーム (Windows®、Ubuntu*) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 モバイルゲーム (Windows®、Android™) intel.software.com/gpa (英語) 29 メモリー/スレッドエラーの特定とデバッグ メモリー/スレッドのデバッガー – インテル® Inspector 正当性検証ツールにより ROI が 12%-21%1 向上 デバッガー・ブレークポイント 早期に発見した問題のほうが修正コストが少なくて済む いくつかの調査によると ROI% はケースバイケースだが、 早期に発見/対応したほうがコストを抑えられる エラーによっては診断に数カ月を要する 競合やデッドロックは簡単に再現できない メモリーエラーをツールなしで発見するのは困難 デバッガー統合により迅速な診断が可能 問題の直前にブレークポイントを設定 「インテル® Inspector により、パッケージ をリリースする前に、切り分けが困難な スレッドエラーを迅速に追跡できるように なりました。」 デバッガーで変数とスレッドを確認 数カ月かかっていた診断を数時間に短縮 1 コスト要因 - Square Project による分析 CERT: U.S. Computer Emergency Readiness Team および Carnegie Mellon CyLab NIST: National Institute of Standards & Technology : Square Project の結果 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 Harmonic Inc. ソフトウェア開発ディレクター Peter von Kaenel 氏 intel.ly/inspector-xe (英語) 30 複雑なシステムの問題を迅速に切り分け 総合的なシステムワイドのハードウェア/ソフトウェア・イベントトレース インテル® System Debugger タイムスタンプ付きの関連付け されたトレース情報を使用して 問題を効率良く特定 タイムスタンプ 情報による イベントトレース ソフトウェアとハードウェア間の 複雑な相互作用を解析 第 6 世代 インテル® Core™ プロセッサー・ファミリー以降で利用可能 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 フィルターダイアログ を使用して特定の イベントに注目 31 システムワイドのクローズド筐体のデバッグ 低コストの USB 接続による JTAG ベースのデバッグとトレース 開発者がエンジニアリング・サンプルではなく、実際のプロダクション・ハードウェア上で作業する時間を排除 JTAG 機器/プローブにかかるコストを節約 - 高価な JTAG プローブの代わりに標準 USB 接続でデバッグ JTAG デバッグ・ステーションを交代で使用する必要なし 柔軟な設計 – アクセス可能なハードウェア JTAG ポートの要件を緩和 インテル® SVT CLOSED CHASSIS ADAPTER USB ケーブル ターゲット システム インテル® System Debugger OS ブートのデバッグ & トレース ターゲット システム 物理的な USB ポートを介した JTAG データ (1) インテル® System Debugger CPU リセットからのデバッグ & トレース 第 6 世代 インテル® Core™ プロセッサー・ファミリー以降で利用可能 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 (1) SVT = Silicon View Technology – 詳細: https://designintools.intel.com/product_p/itpxdpsvt.htm (英語) 32 インテル® SYSTEM STUDIO 関連情報: 新機能 インテル® System Studio 2017** - 新機能 最新のインテル® プラットフォームをサポート インテル® Quark™ プロセッサー X1000、インテル® Atom™ x3/x5/x7 プロセッサー、インテル® Core™ M プロセッサー、インテル® Core™ i3/i5/i7 プロセッサー、インテル® Xeon® プロセッサー、インテル® Edison 開発プラットフォーム、インテル® Puma™ 6 メディア・ゲートウェイほか インテル® IPP は最新のベクトル命令を活用: インテル® SSE4.2 (インテル® Atom™ プロセッサー)、インテル® AVX 2 (インテル® Core™ プロセッ サー)、インテル® AVX-512 (インテル® Xeon® プロセッサー) 高速なルーチン: FIR、MulPack、Min/Max、DotProd、BinToGray/GrayToBin、Morphology、CrossCorr、Sort、さまざまなフィルターなど – – 第 5 世代インテル® Core™ プロセッサー向けのチューニング: /tune:broadwell (Windows®) または –mtune=broadwell (Linux*) 第 6 世代インテル® Core™ プロセッサー向けのチューニング: /tune:skylake (Windows®) または –mtune=skylake (Linux*) SIMD Data Layout Template (SDLT) により C++ コードのベクトル化を向上 コンパイラーによるループと関数のアライメントの向上 特定のターゲット・プロセッサー向けに強力なチューニングを行うコンパイラー・オプションを追加 インテル® グラフィックス・テクノロジーへのオフロード (インテル® C++ コンパイラー) と OpenCL* 2.0 共有仮想メモリー (インテル® IPP/インテル® VTune™ Amplifier for Systems) のサポートを拡張 より多くの情報を利用して優れたコードを作成 より詳細なコンパイラーの最適化レポートとインテル® Inspector のスレッド・エラー・レポート インテル® VTune™ Amplifier for Systems のディスク I/O 解析により、バランスの取れていないディスク I/O と計算を検出 アプリケーション用のドメイン固有のツール マシンラーニング/ニューラル・ネットワーク: インテル® MKL を使用したディープ・ニューラル・ネットワーク (DNN) プリミティブ 画像処理: インテル® IPP を利用して 64 ビット・データ型で超解像をサポート エクスペリエンスの向上 単純な IDE ワークフローにより簡単に製品開発に着手可能 特定のプロジェクトでの各種ツールの使用法を示すタスクベースのチュートリアルをさらに充実 デバッガー・ワークフローの拡張 (セッション管理、デバッグスクリプトのサポート、トレース出力のフィルター/検索) により製品のデバッグに集中可能 **ここでは主な機能のみ紹介 - すべての機能についてはリリースノートをご覧ください 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 34 インテル® System Studio 2017 インテル® C++ コンパイラー インテル® C++ コンパイラー より効果的な使用によりパフォーマンスを向上 インテル® グラフィックス・テクノロジーへのオフロードを向上 ベクトル化の改良点: 新しい SIMD Data Layout Template (SDLT) により C++ コードのベクトル化を向上 ループと関数のアライメントを向上 インテル® AVX-512 命令をサポート 新しいターゲット・プロセッサー・アーキテクチャー用のチューニング・オプション 正しい情報でより効果的なコードを作成 最適化レポートの拡張: レジスター割り当てレポート、アノテーション付きのソース一覧、セキュリティー機能の強化により 生産性と効率を向上 最新の言語標準とプラットフォームをサポート C++14、C11、最新の Windows® と Visual Studio® プラットフォームほか 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 35 インテル® System Studio 2017 インテル® IPP 概要 高速なルーチン さらなるベクトル化によりパフォーマンスを向上 ベクトル & SIMD 命令を利用してパフォーマンスを向上 • インテル® SSE4.2 (インテル® Atom™ プロセッサー)、 インテル® AVX 2 (インテル® Core™ プロセッサー)、 インテル® AVX-512 (インテル® Xeon® プロセッサー) インテル® アドバンスト・ベクトル・エクステンション 512 (インテル® AVX512) 135 関数を Knights Landing✝ と Skylake✝ 向けに最適化: 32f Min/Max、Norms、Mean、Sum、Compare、SwapChannels、Copy、 いくつかの Filters、Morphology、CrossCorr、いくつかの算術関数 17 関数を Skylake✝ 向けに最適化: DotProd、Convert、 BinToGray/GrayToBin、いくつかの Filters、FIR、MulPack 改良された画像処理と超解像サポート 画像データ処理の精度を向上するため、新しい 64 ビット・ データ型を追加 インテル® アドバンスト・ベクトル・エクステンション 2 (インテル® AVX2) Haswell✝ と Skylake✝ 向けに最適化された関数: Convert、CrossCorr、 Max/Min、PolarToCart、Sort、いくつかの算術関数 コンピューター・ビジョン・アプリケーション向けにパフォーマン スを最適化 OpenCV* パフォーマンスを向上 インテル® ストリーミング SIMD 拡張命令 4.2 (インテル® SSE4.2) インテル® Atom™ プロセッサー向けに最適化された関数: CopyMirrorBorder、Morphology (Dilate/ErodeBorder)、 AlphaComposition 出典: インテル コーポレーション - Sharmila Chockalingam (20160603) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 ✝ 開発コード名 36 インテル® System Studio 2017 インテル® TBB & インテル® MKL インテル® TBB インテル® MKL ヘテロジニアス・コンピューティングのサポートを拡大 OpenCL* 2.0 共有仮想メモリー (SVM) 使用タイプを サポート マシンラーニング & ニューラル・ネットワーク・アプリ ケーションのパフォーマンスを向上 新しいディープ・ニューラル・ネットワーク (DNN) プリミティブによりインテル® アーキテクチャー上で 畳み込みニューラル・ネットワークとディープ・ ニューラル・ネットワークを高速化 • 畳み込み、正規化、アクティベーション、プーリング 関数 インテル® TBB との互換性を向上 スレッドレイヤーのサポートをすべてのレベル 1 BLAS 関数に拡張 インテル® MKL との互換性を向上 • スレッドレイヤーのサポートをすべてのレベル 1 BLAS 関数に拡張 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 37 インテル® System Studio 2017 インテル® VTune™ Amplifier for Systems & インテル® Inspector インテル® VTune™ Amplifier for Systems インテル® Inspector 最適化の可能性がないかサブシステムを解析 競合状態を簡単に診断 ディスク I/O 解析は、ディスク・サブシステム、CPU、プロセッサー・ バスの使用状況をモニターして、バランスの取れていないディスク I/O の検出および計算を支援 OpenCL* 2.0 共有仮想メモリー (SVM) 使用タイプをサポート 競合状態が発生したソースコードの行番号と変数 (グローバル、 スタティック、スタック) の名前を特定することで、競合状態と スレッドエラーのデバッグを改良 ドライバーをインストールすることなく、より多くのパフォーマンス・ データを解析 • プリインストールされる Linux* の perf ドライバーを使用したイベント ベースのサンプリングに、メモリーと帯域幅の問題の可視性を向上する イベントを追加 未活用のパフォーマンスを迅速に発見 新しい Application Performance Snapshot 機能により、単なる推測 ではなくデータに基づいて最適化の可能性の優先度を迅速かつ容易 に付け、コードの現代化の潜在的な利点を表示 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 38 インテル® System Studio 2017 インテル® Graphics Performance Analyzers (インテル® GPA) & インテル® System Debugger インテル® GPA インテル® System Debugger 最適化の可能性がないかサブシステムを解析 改良されたデバッグ・ワークフロー ディスク I/O 解析により、バランスの取れていないディスク I/O を検出 正しい情報でより効果的なコードを作成 Graphics Frame Analyzer ergs の選択履歴とジオメトリ―・エクスポートを新たにサポート すべての試みを元に戻す機能を実装 ergs を使用状況、色分けされたリソースタイプに視覚的に関連付け るリソース履歴を追加 Ubuntu* ターゲットのリモート・プロファイルを新たにサポート System Analyzer フレームレート制限の影響を最小限に抑えるための、Android™ と Ubuntu* ターゲット向けの Vsync オーバーライドを実装 システムメトリックを 1 つのビューにまとめた Ubuntu* ターゲット用 の新しいシステムビュー Ubuntu* ターゲット向けに第 6 世代インテル® Core™ プロセッサー 上で GPU ハードウェア・メトリックをサポート より簡単なターゲット接続: デバッガー設定の保存と復元機能 を備えた新しいプロジェクト/セッションをサポート トレース出力フィルター/検索機能を向上 新しい Python* デバッグ・スクリプト・サポート 互換性の向上 • DWARF4 デバッグ形式をサポート 最新のグラフィックス API をサポート Microsoft® DirectX® 12 API 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 39 その他のインテル® ソフトウェア開発ツール インテル® SYSTEM STUDIO と連携して動作 IoT ソリューションを作成、実行、デバッグ、最適化する ための IDE とツール インテル® System Studio IoT Edition インテル® XDK IoT Edition Wind River* Helix* Cloud MCU 開発ツール C、C++、JavaScript*、Python*、Java* プログラミング 言語をサポート データの収集、視覚化、解析のための IoT クラウド/エッジ 解析 software.intel.com/iot (英語) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 クラウド/ エッジ解析 IDE/ツール ミドルウェア I/O およびセンサー/アクチュエーター向けミドルウェア・ ライブラリー Trusted Analytics Platform (TAP) IoT エッジ 解析 IBM* BlueMix*、Microsoft® Azure®、 Amazon* AWS*、AT&T* ほか プロトタイプ 評価/開発/デプロイ IDP/ Workbench I/O ライブラリー (SPI、GPIO、I2C、 AIO、UART) 管理機能、 セキュリティー、 クラウド接続など センサー/アク チュエーター・ ライブラリー Intel® 通信スタック (Wi-Fi*、Bluetooth* Technology、ZigBee* など) OS イメージ インテル® Edison ボード、インテル® Galileo ボード、 インテル® IoT ゲートウェイ、MCU ハードウェア インテル® IoT Developer Kit インテル® IoT ゲートウェイ インテル® インテル® Edison ボード Galileo ボード MCU (インテル® Quark™ SE マイクロ コントローラー、インテル® Quark™ マイクロコントローラー D2000) センサー アクチュエーター API バインド (C、C++、Node.JS、Python*、Java*) 41 インテル® System Studio for Microcontrollers インテル® Quark™ マイクロコントローラー向けに高速でインテリジェントなモノの開発を支援 1インテル® Quark™ マイクロコントローラー D2000 とインテル® Quark™ SE マイクロコントローラーの電力解析は近日サポート予定 インテル® Quark™ マイクロコントローラーを利用して魅力的な IoT ソリューション を開発 Eclipse* 統合開発環境で開発効率を向上 最適化コンパイラーとライブラリーを使用して高速でコンパクトなコードを開発 デバッガーとアナライザーにより品質と電力効率を保証 インテル® SYSTEM STUDIO を利用して、組込みソリューションを迅速に開発 software.intel.com/en-us/intel-system-studio-microcontrollers (英語) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 42 革新的な開発を加速 インテル® Computer Vision SDK & インテル® SDK for OpenCL* Applications インテル® Computer Vision SDK コンピューター・ビジョン・ソリューションを高速化 インテル® SDK for OpenCL* Applications 互換性 インテル® プラットフォーム向けの開発環境 1 つのグラフにさまざまな種類のビルディング・ブロックを混在させること が可能 ビルトインカーネル (CPU、GPU、IPU など) OpenCV* 関数、デバッグ/ユーティリティー・カーネル カスタムカーネル: ネイティブ C/C++、OpenCV*、OpenVX*、 OpenCL* ほか ヘテロジニアス 各カーネルが異なる IP ブロックで実行するように割り当て コンピューター・ビジョン・アクセラレーターを簡単にプログラム可能 プラットフォームと IP ブロック間で簡単に移植可能 効率良いメモリー転送とタスク・スケジュール 無料: software.intel.com/intel-opencl (英語) プラットフォーム – OpenCL* の利点 ヘテロジニアス・コンピューティング向けのオープンスタン ダードの移植性に優れた API Windows®、Linux*、Android™ 向けのハイパフォーマンスな ヘテロジニアス・アプリケーションを開発 インテル® グラフィックス・テクノロジー向けプログラムを作成 する標準的な方法 パフォーマンス OpenVX* ランタイムで使用される複数のパフォーマンス向上機能 (例: タイリング、キャッシュ/CPU の局所性、グラフ融合) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 43 エンドツーエンドの高速で効率良いメディア処理 エッジからクライアントまでシームレスなソフトウェア開発エクスペリエンス エッジ ビデオ・ゲートウェイ スマートカメラ/スマートカー ネットワーク・ビデオ・レコーダー インテル® MEDIA SDK 組込み Linux* 向け データセンター/クラウド ビデオ・トランスコード/解析、 リモート・デスクトップ、ゲーム インテル® MEDIA SERVER STUDIO クライアント プレイヤー/エディター 車載インフォテインメント/エンターテインメント インテル® MEDIA SDK Windows®/組込み Linux* 向け FPGA インテルが提供 ハードウェア・アクセラレーション・コーデックによるスケーラブルなパフォーマンス SDK および API の包括的なセット 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 開発期間の短縮 ソフトウェアの移植性 44 Wind River* Simics* シミュレーション・テクノロジー Simics* は、開発者が利用する複雑な電子システムのハードウェアをシミュレートするシステム・シミュレーター プロセッサー、周辺機器、ネット ワークをシミュレート 任意のサイズのターゲット・シス テムをシミュレート 未変更のターゲット・バイナリーを 実行 ユニークで強力なデバッグ手法 を使用 シミュレーションの動作を記録、 保存、復元 アクセス - ソフトウェア開発 プロセスからハードウェアによる ボトルネックを排除 コラボレーション – 保存した シミュレーション環境を共有、 通信、交換 オートメーション – デバッグ、 テスト、プロファイル、トレース機能 を自動化 ターゲット・ハードウェア SIMICS インテル® System Studio に含まれている評価版シミュレーター Simics* は Wind River* (インテルの子会社) がライセンス所有および販売 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 45 インテル® SYSTEM STUDIO 技術的な詳細 インテル® System Studio に含まれる機能 ビルド & 最適化 システム/組込み アプリケーション 解析 デバッグ & トレース パフォーマンス CPU 上のコード・ パフォーマンス 時間ベース、 システム・ ソフトウェア インテル® VTune™ イベントベース Amplifier Eclipse* ベース、 Visual Studio® インテル® C++ コンパイラー インテル® グラフィックス・ テクノロジーへの オフロードを含む IDE サポート インテル® GPA System Analyzer インテル® GPA Platform Analyzer CPU/GPU ワークロード CPU/GPU ワークロード リアルタイム インテル® IPP オフライン/詳細 インテル® GPA Frame Analyzer 電力 インテル® Energy Profiler 正当性 Professional Edition Ultimate Edition 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 インテル® Inspector インテル® System Debugger UEFI、OS、ドライバー JTAG ベース ウェイクアップ、 スリープステート、 周波数、温度 アプリケーション の安定性 Composer Edition インテル拡張 GDB OpenGL* ES、 DirectX® システムワイド の電力効率 インテル® MKL インテル® TBB グラフィックス・ パフォーマンス スレッド/ メモリーリーク インテル® Debug Extensions for WinDbg Windows® スタック WinDbg over JTAG 47 ビルド & 最適化 システム/組込みアプリケーション Eclipse* IDE、 WR Workbench、 Visual Studio® インテル® C++ コンパイラー インテル拡張 GDB デバッガー インテル® IPP インテル® MKL インテル® TBB IDE サポート • • Eclipse*、Workbench* (Linux* ターゲット OS) Visual Studio® (Windows® ターゲット OS) IA 向けに最適化されたコンパイラー インテル® グラフィックス・テクノロジーへの オフロードを含む アプリケーション・デバッガー Linux*、Android™ IA 向けに最適化されたライブラリー • 画像、信号、データ処理 • 1D、2D、3D FFT ほか スレッド・ライブラリー Composer Edition 優れたコード・パフォーマンス 強固なコードのためのアプリケーション・ リモート・デバッグ パフォーマンスが求められるコードルーチン 用ライブラリー 複数のターゲット OS プラットフォームで 統一されたスレッド化手法 一般的な IDE に統合 パフォーマンスが最適化されたコードをビルド Windows®、Linux* ターゲット用統合テンプレート 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 48 解析 パフォーマンス インテル® GPA System Analyzer インテル® GPA Platform Analyzer インテル® VTune™ Amplifier インテル® GPA Frame Analyzer CPU/GPU ワークロード • リアルタイム • オフライン/詳細 CPU 上のコード・パフォーマンス 時間ベース、イベントベース グラフィックス・パフォーマンス OpenGL* ES、DirectX® 電力 インテル® Energy Profiler Composer Edition を含む ワークロード解析によりシステムの動作を理解 より応答性に優れたシステムのコード解析 高速グラフィックスのフレーム解析 システムワイドの解析により電力効率を最適化 スレッドおよびメモリーリーク解析によりシステ ムの安定性を向上 システムワイドの電力効率 ウェイクアップ、スリープステート、周波数、温度 正当性 インテル® Inspector Professional Edition 電力効率、パフォーマンス、コードの正当性を解析 アプリケーションの安定性 スレッド/メモリーリーク 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 49 デバッグ & トレース システム・ソフトウェア インテル® System Debugger インテル® Debug Extensions for WinDbg UEFI、OS、ドライバーのデバッグ & トレース JTAG ベース Linux*、Android™ ターゲット OS Windows® スタック WinDbg over JTAG Windows® ターゲット OS Ultimate Edition Professional Edition を含む システムワイドのデバッグとトレース UEFI、OS、ドライバー、ミドルウェア用 イベントトレースにより困難な問題を迅速に 特定 さまざまな JTAG ハードウェア・インターフェイ スをサポート より効率的なデバッグサイクルのために OS (Linux*、Android™、VxWorks*) を認識 Windows® インテグレーター向けのフルスタッ ク・デバッグ 安定性を高めるシステムワイドの デバッグとトレース 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 50 デバッグとトレース デバッグ = システムのスナップショット トレース = システムの履歴 ハードウェア・イベント ハードウェア・イベント STOP Bluetooth*、GPS STOP Bluetooth*、GPS プラットフォーム・ソフトウェア プラットフォーム・ソフトウェア ソフトウェア・イベント ソフトウェア・イベント OS、ファームウェア OS、ファームウェア 時間 時間 表示できる項目: • 実際のソースコード行 • 変数のステータス • HW レジスターの内容 デバッグ トレース 記録 時間 表示できる項目: • タイムスタンプ付きのハードウェア・イベントと ソフトウェア・イベント • サービスルーチンのマップ トレースはハードウェア・イベントとソフトウェア・イベントの履歴を正確に表示し、 複雑な問題を迅速に識別して切り分けることができる 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 51 コスト効率に優れたアクセスでシステムワイドの問題を切り分け USB を介した低コストの JTAG ベースのデバッグとトレース・ソリューション インテル® SVT CLOSED CHASSIS ADAPTER (1) ターゲット システム インテル® System Debugger 物理的な USB ポートを介した JTAG データ CPU リセットからのデバッグ & トレース USB ケーブル ターゲット システム インテル® System Debugger OS ブートのデバッグ & トレース 第 6 世代インテル® Core™ プロセッサー・ファミリー (開発コード名 Skylake) で利用可能 (1) SVT = Silicon View Technology – 詳細: https://designintools.intel.com/product_p/itpxdpsvt.htm (英語) USB クローズド筐体の JTAG インテル® SVT Closed Chassis Adapter USB クローズド筐体のデバッグ CPU リセット USB. BIOS/UEFI DbC スタ USB 接続確立 ック に依存しない) (UEFI の一部、OS 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 OS/RTOS/カーネル/ドライバー ブートフェーズ 52 プリエンプティブなリアルタイム Linux* でアプリケーションの パフォーマンスを解析 パフォーマンス・アナライザーはリアルタイム Linux* システムのプロファイルをサポート プリエンプティブな Linux* システムのパフォーマンス hotspot を素早く正確に特定 o データコレクターが優先度の高いタスクで中断 されるため、プリエンプティブなシステムにおける 正確なパフォーマンス・プロファイルは困難 インテル® VTune™ Amplifier は低オーバーヘッドの サンプリングによりデータ収集を継続 組込みリアルタイム・ アプリケーション インテル® VTune™ Amplifier の データコレクター プリエンプティブな リアルタイム Linux* コンカレンシー解析、ロックと待機解析、コンテキスト・ スイッチ情報を提供 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 53 仮想環境でアプリケーションのパフォーマンスを解析 パフォーマンス・アナライザーは仮想環境でのパフォーマンス・プロファイルをサポート ゲスト OS で実行中の組込みアプリケーションの パフォーマンスと動作を検証して解析 1 つのプラットフォームで仮想環境を利用して 複数の OS とアプリケーションのパフォーマンスを 最適化し、ハードウェア・コストを抑制 1 KVM、Wind 組込み アプリケーション 組込み アプリケーション 組込み アプリケーション ゲスト OS 1 ゲスト OS 2 ゲスト OS 3 VM1 1 VM2 1 VM3 1 ハイパーバイザー River* Open Virtualization windriver.com/announces/open_virtualization/ (英語) 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 54 Windows® システムの詳細情報により信頼性を強化 Microsoft® WinDbg カーネルデバッガー向けのシステムデバッグおよびトレース拡張 JTAG を利用して新しい Microsoft® WinDbg で簡単にプラットフォーム を起動し Windows® ドライバーを 検証 インテル® Processor Trace の情報 ドライバーや割り込みを含む、完全 停止状態の Windows® システムを デバッグ インテル® Processor Trace により 複雑なランタイム時の問題を迅速 に切り分け 第 6 世代 インテル® Core™ プロセッサー・ファミリー以降で利用可能 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 JTAG およびインテル® Processor Trace 対応の Microsoft® WinDbg カーネルデバッガー 55 グラフィックス・コアにオフロードされた計算負荷の高いコードを 効率良くデバッグ グラフィックス・ オフロードコード用デバッガー コアで実行する アプリケーションの ソースコード 計算負荷の高いコードをプロセッサーと グラフィックス・コア間で連携して実行 簡単なコンパイラー宣言子 (#pragma) を使用してオフロード用にコードをマーク グラフィックス・コアで実行するコードの デバッグが可能 インテル® HD グラフィックスまたは インテル® Iris™ Pro オフロード グラフィックス・ グラフィックスを搭載した されるコードを コンパイラー コア インテル® Core™ が生成 プロセッサーおよび インテル® Xeon® プロセッサー デバッグ・ クライアント CPU コア 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 56 必要な情報を素早く表示 インテル® VTune™ Amplifier データのグループを調整 … (リストの一部のみ表示) 関数をダブルクリックしてソース を表示 [+] をクリックするとコールスタッ クが表示される タイムライン (またはグリッド) の 選択範囲でフィルター プロセスとその他の コントロールでフィルター 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 チューニングの可能性はピンクで表示 ホバーするとヒントが表示される 57 タイムラインでスレッドの動作を視覚的に確認 インテル® VTune™ Amplifier 遷移 ロックと待機 CPU 時間 基本 hotspot 高度な hotspot ホバー: オプション: API を使用してフレームとユーザータスクをマーク オプション: 収集中にマークを追加 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 58 並列パフォーマンスの問題を視覚化 共通パターンを見つける 粗粒度のロック 高いロック競合 低コンカレンシー ロード・インバランス 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 59 インテル® GPU の計算パフォーマンス インテル® VTune™ Amplifier OpenCL* カーネルと GPU オフロードの チューニング 新しいプロセッサーでは、GPU データの収集も 可能 (オプション)。GPU & CPU アクティビティー の関連付け(Windows® のみ)。 可能性をハイライト表示 潜在的なチューニングの可能性があるセルは ピンクでハイライト。ホバーすると推奨事項が 表示される。 プロセッサー全体 (CPU + GPU) 向けにチューニング 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 60 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 61 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 62 呼び出し元/呼び出し先 – 親/子の解析 インテル® VTune™ Amplifier 左ペインで関数 をクリックして 呼び出し元/ 呼び出し先の 情報を表示 タイム・クリティカルな実行パスのボトルネックを素早く発見 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 63 法務上の注意書きと最適化に関する注意事項 本資料の情報は、現状のまま提供され、本資料は、明示されているか否かにかかわらず、また禁反言によるとよらずにかかわらず、いかなる知 的財産権のライセンスも許諾するものではありません。製品に付属の売買契約書『Intel's Terms and Conditions of Sale』に規定されている 場合を除き、インテルはいかなる責任を負うものではなく、またインテル製品の販売や使用に関する明示または黙示の保証 (特定目的への適 合性、商品性に関する保証、第三者の特許権、著作権、その他、知的財産権の侵害への保証を含む) をするものではありません。 性能に関するテストに使用されるソフトウェアとワークロードは、性能がインテル® マイクロプロセッサー用に最適化されていることがあります。 SYSmark* や MobileMark* などの性能テストは、特定のコンピューター・システム、コンポーネント、ソフトウェア、操作、機能に基づいて行った ものです。結果はこれらの要因によって異なります。製品の購入を検討される場合は、他の製品と組み合わせた場合の本製品の性能など、ほ かの情報や性能テストも参考にして、パフォーマンスを総合的に評価することをお勧めします。 © 2016 Intel Corporation. 無断での引用、転載を禁じます。Intel、インテル、Intel ロゴ、Intel Inside、Intel Inside ロゴ、Intel. Experience What‘s Inside、Intel. Experience What’s Inside ロゴ、Intel Atom、Intel Core、Intel Jourle、Iris、Puma、Quark、Xeon、Intel Xeon Phi、 VTune は、アメリカ合衆国および / またはその他の国における Intel Corporation の商標です。 Microsoft、Azure、DirectX、Visual C++、Visual Studio、 Windows および Windows Server は、米国 Microsoft Corporation の、米国およ びその他の国における登録商標または商標です。 Android は Google Inc. の登録商標または商標です。 最適化に関する注意事項 インテル® コンパイラーでは、インテル® マイクロプロセッサーに限定されない最適化に関して、他社製マイクロプロセッサー用に同等の最適化を行えな いことがあります。これには、インテル® ストリーミング SIMD 拡張命令 2、インテル® ストリーミング SIMD 拡張命令 3、インテル® ストリーミング SIMD 拡 張命令 3 補足命令などの最適化が該当します。インテルは、他社製マイクロプロセッサーに関して、いかなる最適化の利用、機能、または効果も保証いた しません。本製品のマイクロプロセッサー依存の最適化は、インテル® マイクロプロセッサーでの使用を前提としています。インテル® マイクロアーキテク チャーに限定されない最適化のなかにも、インテル® マイクロプロセッサー用のものがあります。この注意事項で言及した命令セットの詳細については、 該当する製品のユーザー・リファレンス・ガイドを参照してください。 注意事項の改訂 #20110804 最適化に関する注意事項 © 2016 Intel Corporation. 無断での引用、転載を禁じます。 * その他の社名、製品名などは、一般に各社の表示、商標または登録商標です。 64
© Copyright 2025 Paperzz