エヌビディアのディープラーニング戦略
エヌビディア合同会社 プラットフォームビジネス本部 部長
林 憲一
ディープラーニングによって加速する AI 競争
IMAGENET
正答率
100%
従来 CV 手法
ディープラーニング
90%
80%
70%
IBM Watson が自然言語処理の
ブレークスルーを実現
Facebook が Big Sur を発表
Baidu の Deep Speech 2
人間を超える
Google が TensorFlow を発表
トヨタ自動車が人工知能研究所に
1200億円投資
マイクロソフトと中国の科学技術大学が
IQ テストで人間を超える
60%
50%
40%
30%
20%
10%
0%
2009 2010 2011 2012 2013 2014 2015 2016
7
ディープラーニングを加速する3要素
DNN
ビッグデータ
GPU
エクサバイトのコンテンツが毎日生み出される
ユーザーの作るコンテンツがウェブサービスのサーバーを圧迫
1000万ユーザー
毎日40 年分のビデオ配信
170万のゲーマーが配信
毎日1時間半視聴
毎日60億の検索クエリー
10% は音声入力
毎日2億7000万アイテム売買
43% はモバイルデバイス
毎日80億ビデオビュー
半年で400% 成長
毎分300時間分のビデオ
50% はモバイルデバイスを使用
9
ハイパースケールデータセンター
Tesla プラットフォーム
トレーニングのためのサーバー
データ量でスケール
毎日エクサバイトのコンテンツ
学習済みモデル
推論、ウェブサービスのためのサーバー
ユーザー数でスケール
学習済みのモデルを配置
数十億のデバイス
11
8倍高速
Caffe パフォーマンス
CPU
TESLA M40
世界最速のディープラーニング
アクセラレーター
トレーニングにかかる時間を8日から1日へ短縮
Tesla M40
0
1
2
3
4
5
6
7
8
9
# of Days
CUDA コア
理論ピーク性能
3072
7 TFLOPS
GDDR5 メモリ
12 GB
メモリバンド幅
288 GB/s
消費電力
250W
Caffe Benchmark: AlexNet training throughput based on 20 iterations,
CPU: E5-2697v2 @ 2.70GHz. 64GB System Memory, CentOS 6.2
13
手振れ補正、画質向上
TESLA M4
ハイパースケールワークロードを
加速して最高スループットを実現
ビデオ処理
イメージ処理
4倍
5倍
ビデオ
トランスコード
H.264 & H.265, SD & HD
2倍
リサイズ、フィルター、検索、
自動画質向上
機械学習
推論
2倍
CUDA コア
1024
理論ピーク性能
2.2 TFLOPS
GDDR5 メモリ
4 GB
メモリバンド幅
88 GB/s
フォームファクター
消費電力
PCIe Low Profile
50 – 75 W
Preliminary specifications. Subject to change.
14
エヌビディア合同会社 プラットフォームビジネス本部
ディープラーニングソリューションアーキテクト 兼 CUDA エンジニア 村上 真奈
16
ディープラーニング SDK
ディープラーニング開発を強力にサポート
ディープラーニング SDK
DIGITS
cuDNN
cuSPARSE
cuBLAS
NCCL
17
cuDNN4 ディープラーニング用ライブラリ
ディープラーニング SDK
最新はバージョン4 (2015/12~)
ディープニューラルネットワークの為のGPUプリミティブ群
Caffe, Torch, Theano, Chainer, TensorFlow 等の主要ディープラーニングフ
レームワークが採用
以下のOSをサポート (※2016.1.15現在)
Windows
Linux(x64/ARMv7/ARM64/Power8)
Mac OSX
Android(ARMv7/ARM64)
18
cuDNN4 ディープラーニング用ライブラリ
学習をより速く 推論を高速に
学習の高速化
畳み込み演算のアルゴリズムに2D FFTタイリングを追加
Batch Normalization処理の追加
normalizationFoward関数、normalizationBackward関数の追加
畳み込み演算のFP16サポート(Tegra X1 only)
cudnnConvolutionForward関数のFP16対応
推論処理の高速化
convolutionFowardのbatchsize=1の場合の最適化
Small Batch Sizes Up to 2x faster on Alexnet Layers
3.0x
2.0x
1.0x
0.0x
Tiled FFT up to 2x faster on VGG Layers
3.0x
2.0x
1.0x
0.0x
20
cuDNN4 ディープラーニング用ライブラリ
学習をより速く 推論を高速に
Caffe Performance
6
M40+cuDNN4
5
Performance
M40+cuDNN3
4
3
2
K40+cuDNN1
1
K40
0
11/2013
9/2014
7/2015
AlexNet training throughput based on 20 iterations,
CPU: 1x E5-2680v3 12 Core 2.5GHz. 128GB System Memory, Ubuntu 14.04
12/2015
21
CUDA7.5: cuBLAS & cuSPARSE
ディープラーニング SDK
cuBLAS
cuSPARSE
密行列計算用ライブラリ
疎行列計算用ライブラリ
cuSPARSE
22
CUDA7.5: cuBLAS & cuSPARSE
ディープラーニング SDK
cuSPARSE
密行列×疎ベクタールーチン
自然言語処理を高速化
Bag of Words(BoW)をより高速に処理
cusparse{S,D,C,Z}gemvi()
y = α ∗ op(A)∗x + β∗y
cuBLAS
FP16(半精度浮動小数点)ストレージ
cublasSgemmEx()
FP16データ入出力対応の行列積 (演算はFP32)
23
NVIDIA Collective Collection Library(NCCL)
ディープラーニング SDK
マルチGPU集合通信ライブラリ
•
https://github.com/NVIDIA/nccl
all-gather, reduce, broadcast など標準的な集合通信の処理をバンド幅が出るように最適化
シングルプロセスおよびマルチプロセスで使用する事が可能
24
DIGITS3
ディープラーニング SDK
WebベースのディープラーニングGPUトレーニングシステム
ユーザー
データセット
の作成
インターフェース
学習モデルの
作成
学習過程の
可視化
レイヤーの
可視化
Chainer
Theano
DIGITS(UI/Server)
ディープラーニングの学習・テストを
簡単に行う為のUI
別マシンからDIGITSを操作する為の
サーバ機能
Torch
NVCaffe
Caffe
cuDNN, cuBLAS
CUDA
学習
GPU HW
GPU
マルチGPU
GPUクラスタ
NVCaffe
BVLC/caffe(本家)からフォーク
最新のCUDAライブラリを使用
エヌビディアGPUに最適化
クラウド
25
DIGITS3
強化されたワークフローで効率よく学習
Torch7に対応(Preview)
cuDNN4を使った学習/推論
HDF5形式のデータセットのサポート
学習データセットのブラウジング機能
LMDB形式の学習データの中身を確認出来る機能が追加
ジョブマネージメント機能の強化
現在実行中のジョブ一覧を分かりやすく表示する機能が追加
学習結果比較用ブラウザ
学習済みモデルをAccuracyやLoss率など幾つかの項目でソートしたり、分析できる画面が追加
27
DIGITS DEMO
28
ディープラーニング SDK
ディープラーニング開発を強力にサポート
ディープラーニング SDK
DIGITS
cuDNN
cuSPARSE
cuBLAS
NCCL
29
Jetson TX1
モジュール型スーパーコンピューター
10W以下で比類ないパフォーマンス
クレジットカードサイズ
ディープラーニングの各種フレームワークに対応
30
包括的な開発者用プラットフォーム
Jetson ソフトウェア開発キット
ライブラリ群
開発ツール
設計ファイル
開発者フォーラム
学習・チュートリアル
エコシステム
http://developer.nvidia.com/embedded-computing
32
Jetson Linux SDK
グラフィックス
ディープラーニングと
コンピュータビジョン
GPU による計算
開発ツール
NVTX
NVIDIA Tools eXtension
Debugger | Profiler | System Trace
33
アプリケーション
cuDNN
各種フレームワーク
CUDAで加速された
ディープラーニング用ライブラリ
各種ニューラルネットワークを
使い始めてすぐに高速化
cuDNN
標準的なフレームワークに全て対応
CUDA
学習にも推論にも対応
各ハードウェア
Jetson TX1
Tesla
TITAN X
34
アプリケーション
VisionWorks™
CUDAで加速された
コンピュータービジョン用ツールキット
Pipelines
Feature
Tracking
Structure
from Motion
OpenVX1.1 の完全実装
Object
Tracking
Dense
Optical Flow
…
VisionWorks
NVIDIAのカスタム拡張
CUDA
既存のCVパイプラインに容易に統合可能
Linux
Windows
各ハードウェア
Jetson TK1 Jetson TX1
Tesla
TITAN X
35
JETSON TX1 DEMO
36
あらゆるフレームワークを GPU で最適化
大学
BIG SUR
TORCH
CAFFE
THEANO
MATCONVNET
MOCHA.JL
PURINE
WATSON
CNTK
スタートアップ
CHAINER
MINERVA
TENSORFLOW
DL4J
KERAS
OPENDEEP
SCHULTS
LABORATORIES
VITRUVIAN
MXNET*
NVIDIA GPU プラットフォーム
*U. Washington, CMU, Stanford, TuSimple, NYU, Microsoft, U. Alberta, MIT, NYU Shanghai
37
株式会社 Preferred Networks
取締役副社長 岡野原 大輔様
38
Google’s Open Source Machine Learning System: TensorFlow
Dr. Mike Schuster, Google
40
docomo Developer support における画像認識 API 提供
株式会社 NTT ドコモ
サービスイノベーション部 酒井 俊樹様
42
docomo Developer support をご存じの方?
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
協創による新規事業創出をめざし、APIを提供
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
docomo Developer support
•17カテゴリ
(25種類)のAPI
•無償
(制限の範囲内で)
APIカテゴリ
APIカテゴリ
シナリオ対話
文字認識
発話理解
トレンド記事抽出
雑談対話
動作推定
知識Q&A
ジオフェンシング
言語解析
地図
音声認識
フォトコレクション
音声合成
ドコモ電話帳
画像認識
データ保管BOX
IoT機器制御
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
docomo Developer support
• シナリオ対話
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
docomo Developer support
• 雑談対話
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
docomo Developer support
• 画像認識
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
© 2016 NTT DOCOMO, INC. All Rights Reserved.
2. カテゴリ認識
• 抽象的なコンセプトを認識
• Deep Learningを利用
© 2008 NTT DOCOMO, INC. All rights reserved.
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
自然言語
処理入門
画像認識
エンジン
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
・商品名:画像認識API入門
・著者:ドコモ太郎
・発売年:2014/9/17
自然言語
処理入門
画像認識
エンジン
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
・商品名:自然言語処理入門
・著者:ドコモ花子
・発売年:1989/9/01
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
自然言語
処理入門
画像認識
エンジン
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
・商品名:画像認識API入門
・著者:ドコモ太郎
・発売年:2014/9/17
自然言語
処理入門
画像認識
エンジン
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
・商品名:自然言語処理入門
・著者:ドコモ花子
・発売年:1989/9/01
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
・商品名:画像認識API入門
・著者:酒井 俊樹
・発売年:2014/9/17
画像認識
エンジン
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
・商品名:画像認識API入門
・著者:酒井 俊樹
・発売年:2014/9/17
自然言語
処理入門
画像認識
エンジン
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
×
1.オブジェクト認識、商品認識の特徴
特徴量
比較
自然言語
処理入門
…
・商品名:自然言語処理入門
・著者:ドコモ花子
・発売年:1999/12/21
・商品名:画像認識API入門
・著者:ドコモ太郎
・発売年:2014/9/17
© 2016 NTT DOCOMO, INC. All Rights Reserved.
・・
・
画像認識
エンジン
大規模・高速(700万件・1秒)
遮蔽・回転OK
画像1枚から
バリエーションのある
物体は苦手
特徴量は手作り
© 2008 NTT DOCOMO, INC. All rights reserved.
2つの画像認識API
1.オブジェクト認識、商品認識
• 個別具体的な名称で認識
• 局所特徴量ベース
© 2016 NTT DOCOMO, INC. All Rights Reserved.
2. カテゴリ認識
• 抽象的なコンセプトを認識
• Deep Learningを利用
© 2008 NTT DOCOMO, INC. All rights reserved.
2. カテゴリ認識(Deep Learning)
スキー/スノボ
海
シーン認識
エンジン
運動会
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
2. カテゴリ認識(Deep Learning)
豚骨ラーメン
醤油ラーメン
料理認識
エンジン
焼きそば
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
2. カテゴリ認識(Deep Learning)
キノコ
認識
ドクツルタケ
花認識
チューリップ
ファッション認
識
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
カットソー
グレー系
ボーダー
2. カテゴリ認識(Deep Learning)
バリエーションOK
とりあえず学習・認識
出力
入力
…
…
…
…
…
大量のデータが必要
並列分散処理
低次の層で特徴を抽出
取り出すべき特徴も
学習で決める
取り出した特徴を
元に認識
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
Deep Learningの学習時間(イメージ)
CPU
GPU
約7日(20000iter)
半日弱
約20倍
大規模データの”学習”ではGPUが必須
© 2016 NTT DOCOMO, INC. All Rights Reserved.
※あくまでイメージです。画像枚数やネットワークによって変わりま
す。
・CPU:Intel Xeon(R) CPU E5-2643
・GPU:NVIDIA Tesla K80
© 2008 NTT DOCOMO, INC. All rights reserved.
Deep Learningの認識時間(イメージ)
CPU
GPU
数百ms/枚
数十ms/枚
約10倍
以下に依存して選択
・使うネットワーク構造
・求める処理速度
© 2016 NTT DOCOMO, INC. All Rights Reserved.
※あくまでイメージです。画像枚数やネットワークによって変わりま
す。
・CPU:Intel Xeon(R) CPU E5-2643
・GPU:NVIDIA Tesla K80
© 2008 NTT DOCOMO, INC. All rights reserved.
Deep Learningを用いたAPIのシステム構成
登録
アプリ開発者
開発
アクセス用
キー
ドコモ側で学習済みの
Deep Learningの認識器(モデル)
画像+
モデル名
シーン認識
認識結果
タグ+スコア
画像認識API
(CPU)
※返却は1秒以内
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
料理認識
学習用サーバ
(GPU)
Deep LearningのAPIのサービス利用
• シーン認識
×
アルバムアプリ
運動会
×
クラウド管理支援
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
Deep LearningのAPIのサービス利用
• 料理認識
×
ヘルスケアアプリ
握りずし
×
トレンド解析
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
Deep LearningのAPIのサービス利用
• ファッション認識
カットソー
グレー系
ボーダー
×
ECサイトでの購入支援
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
Deep LearningのAPIのサービス利用
• 花認識/キノコ認識
×
チューリップ
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
図鑑アプリ
画像認識APIを使ってみるには
https://dev.smt.docomo.ne.jp/
制限緩和/カスタムモデルのご相談も
ご清聴ありがとうございました
© 2016 NTT DOCOMO, INC. All Rights Reserved.
© 2008 NTT DOCOMO, INC. All rights reserved.
MATLABによる深層学習
Mathworks Japan
アプリケーション エンジニアリング部 テクニカルコンピューティング 太田 英司様
72
MATLABとは?
科学技術計算のための統合開発環境
優れた開発効率
– シンプルなプログラムの文法
– インタープリタによる対話的操作
– デバッガ・プロファイラー等の充実
Figure
エディター
現在のフォルダ
柔軟な拡張性
– C/C++, Java, Python 等との連携
– 各種計算ライブラリの取り込み
ワークスペース
MATLAB メモリ領域
豊富な拡張ライブラリー
– アプリ:画像・信号・制御・金融等
– 入出力:カメラ・マイク・データベース
コマンドウィンドウ
コマンド履歴
GPGPU によるアルゴリズムの高速化
実行時間(秒)
波動方程式をスペクトラル法で解いたときの速度の比較
80
70
60
50
40
30
20
10
0
20x
faster
18 x
faster
0
512
23x
faster
1024
1536
2048
NVIDIA Tesla K20c
波動方程式のグリッドサイズ
GPU実行が可能なMATLAB関数群
– 300以上のMATLAB関数
– 90 in Statistics and Machine Learning Toolbox
– 48 in Image Processing Toolbox
– スパース配列のGPU演算サポート
GPGPUによるアルゴリズムの高速化
Parallel Computing Toolbox™
gpuArray
gather
メインメモリ
GPGPU
>> I = gpuArray(I);
GPU のメモリへ転送
>> I = imrotate(I, 75, ‘bicubic’);
画像の回転を GPU上で実行
>> I = gather(I);
結果をメインメモリへ転送
MATLABによる深層学習
積層自己符号化器
Stacked Autoencoder
リカレントニューラルネット
Recurrent Neural Network
畳み込みニューラルネット
Neural Network Toolbox
MATLAB のオプションとして提供
インストールしてすぐ使える
サポートも利用可能
MatConvNet
Convolutional Neural Network
画像認識等に優れた性能
既存方式を大きく引き離す
Oxfordの研究者によるライブラリ
Caffe に近い実行性能(cuDNN v4)
使い易いインターフェース
Stacked Autoencoder (積層自己符号化器)
Neural Network Toolbox
自己符号化器(Autoencoder)とは?
2層のニューラルネットワーク
恒等写像となるようなウェイトを学習
主に DNN の事前学習に利用
自己符号化器(Autoencoder)
【コード例】 自己符号化器の学習
autoenc = trainAutoencoder(X, hiddenSize,...
'L2WeightRegularization’, 0.001, ...
'SparsityRegularization', 4, ...
'SparsityProportion', 0.05, ...
'DecoderTransferFunction', 'purelin‘
'useGPU', true);
GPUによる高速化
積層自己符号化器(Stacked Autoencoder)
Convolutional Neural Network (畳み込みニューラルネット)
MatConvNet
http://www.vlfeat.org/matconvnet/
CNNと転移学習
転移学習:学習済みのネットワークを他のタスクに転用する手法
学習済みのCNNを特徴抽出器として転用
分類器の部分をタスクに合せて再学習
http://devblogs.nvidia.com/parallelforall/deep-learning-for-computer-vision-with-matlab-and-cudnn/
Convolutional Neural Network (畳み込みニューラルネット)
MatConvNet
Demonstration
機械学習・並列化・高速化
Statistics and Machine Learning Toolbox™
機械学習
多変量統計
確率分布
回帰と分散分析
実験計画
統計的工程管理
Neural Network Toolbox
ニューラルネットワークの構築、学習
Parallel Computing Toolbox
MATLAB & Simulink と連携した並列処理
対話的な並列計算実行
GPGPU による高速演算
ジョブおよびタスクの制御
MATLAB Distributed Computing Server
クラスタによる計算環境を提供
コンピュータ
ローカル
Mean Squared Error (mse)
データフィッティング
クラスタリング
10
0
Best Validation Performance is 0.01227 at epoch 26
Train
Validation
Test
Best
10
-1
10
-2
10
-3
0
パターン認識
深層学習
5
10
15
20
25
32 Epochs
GPUによる計算の高速化
MATLAB Distributed Computing Server
MATLAB
デスクトップ
Scheduler
Parallel Computing
Toolbox
30
画像処理・コンピュータービジョン・ロボットビジョン
Image Processing Toolbox™
コーナー、円検出
Computer Vision System Toolbox™
カメラキャリブレーション
幾何学的変換
各種画像フィルタ処理
特徴点・特徴量抽出
機械学習による物体認識
レジストレーション(位置合せ)
セグメンテーション(領域分割)
動画ストリーミング処理
トラッキング
画像の領域の定量評価
ステレオビジョン・3D表示
Image Acquisition Toolbox™
デバイスから画像、動画直接取り込み
Robotics System Toolbox™
ロボティクスアルゴリズム開発の支援
フレームグラバボード
DCAM, Camera Link®
GigE Vision®, Webカメラ
Microsoft® Kinect® for Windows®
MATLAB・SimulinkとROS間の
インターフェイス
ROSノード生成
信号処理・信号解析
Signal Processing Toolbox™
信号生成、時間領域解析
DSP System Toolbox™
高度なフィルタ設計
フィルタ設計解析
スペクトル解析
スペクトル解析
スペアナ、ロジアナ表示
線形予測
行列演算、統計処理
30
Input signal PSD
Equiripple output PSD
IFIR output PSD
Multirate/multistage output PSD
20
Power density (dB/rad/sample)
10
0
-10
-20
-30
-40
-50
Wavelet Toolbox™
信号・画像の解析・ノイズ除去・圧縮等
連続 / 離散ウェーブレット
パケット解析 / 主成分分析
対話的なGUIによる操作
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Normalized Frequency (x rad/sample)
0.8
0.9
1
セルフドライビングカー競争の先頭へ
85
セルフドライビングは
コンピューターサイエンスの大きな挑戦
ソフトウェア
スーパーコンピューター
ディープラーニング
86
エヌビディア合同会社
シニアソリューションアーキテクト 室河 徹
87
自動運転の基本ループ
HDマップ
センシング
制御
ローカライズ
認識
プランニング
88
自動運転の困難さ
世界は複雑
世界は予測不能
世界は危険
89
NVIDIA DRIVE PX 2
12 CPUコア | Pascal GPU | 8 TFLOPS | 24 DL TOPS | 16nm FF | 250W | リキッドクーリング方式
世界初
自動運転向けAIスーパーコンピュータ
91
TITAN X
DRIVE PX 2
28nm
16nm FinFET
NVIDIA DRIVE PX 2
Process
12 CPU コア
CPU
—
GPU
Maxwell
Pascal
TFLOPS
7
8
DL TOPS
7
24
AlexNet
450 イメージ/秒
2,800 イメージ/秒
8x A57 +
4x Denver
92
次世代 TEGRA プロセッサ 2基
93
次世代 PASCAL GPU 2基
94
リキッドクーリング方式
消費電力 250W | 動作温度 80℃ | 容量 4200 c㎥
95
NVIDIA DRIVE PX 2
96
ぶつからない車の未来へ向け
エヌビディアの
ディープラーニング・カーコンピュータ
が選定されました。
97
NVIDIA DRIVENET デモ
KITTI dataset
99
Courtesy of Cityscapes dataset
100 project
Courtesy of Cityscapes dataset
101 project
Courtesy
102 of Audi
自動運転向け
ディープラーニングプラットフォーム
DRIVEWORKS
認識
ローカライズ
プランニング
可視化
NVIDIA DRIVE PX 2
NVIDIA DIGITS
NVIDIA DRIVENET
103
ONE ARCHITECTURE — END-TO-END AI
PC GAMING
Tesla
(クラウド)
TITAN X
(PC)
DRIVE PX
(車載)
Jetson
(組み込み)
104
大学
BIG SUR
TORCH
CAFFE
THEANO
MATCONVNET
MOCHA.JL
PURINE
TENSORFLOW
CNTK
スタートアップ
CHAINER
MINERVA
WATSON
DL4J
KERAS
OPENDEEP
SCHULTS
LABORATORIES
VITRUVIAN
MXNET*
ディープラーニング SDK
Tesla
(クラウド)
TITAN X
(PC)
DRIVE PX
(車載)
Jetson
(組み込み)
105
Thank you!
© Copyright 2026 Paperzz