Local Data Memory

SMYLEvideo
ビデオマイニング向けメニーコアの開発
 なぜ、ビデオマイニングか?
 アプリに潜在する並列性:処理全体の99%以上が並列化可能
 要求処理能力が1TOPS以上と高く、既存のプロセッサでは実現困難
 技術展望
 人間の目の能力により近く、インテリジェントに
 ビジュアル・コンピューティング(実世界のモデリング&シミュレーション)に向けて
 複数のタイプの異なるアルゴリズム:ハード化では効率低下
 Video Decoder ; MPEG2, MPEG4, H.264, ・・・
 SIFT, Optical Flow, Ransac, ハール特徴、モデル・ベース顔認識、・・・
コア技術の応用展開の狙い
 次世代組込みシステムのカメラ/ビデオ入力のインテリジェント化による付加価値向上
 機能要件・性能要件に合わせてスケーラブルにSMYLE videoメニーコアIPを構成
 情報家電:
スマートフォン、タブレット、次世代テレビ、STB、デジカメ、ビデオカメラ
 自動車:
車載カメラ(車両周辺認識)、インテリジェント・カー(自動運転)
 その他:
ロボット、監視装置(ビル/ホーム・セキュリティ、鉄道・道路など)
SMYLEvideoの構成
L1 Instruction Memory(SPM)
Fetch /
Loop
Buffer(*)
Instruction Bus
FIFO Bus
Register Bus
Inst.
Decoder
(*)
GP
Reg
File
Data
Reg
File(*)
Interrupt
& FIFO
Controller
Core
Core
Core
Core
Core
Core
TaskA
ローカルメモリ
FIFO
(*)
(*) Configurable
ローカルメモリ
Cluster
FIFO
(*)
Local I Mem(*)
FIFO
(*)
Scalar Processor Core
SMYLEvideoの処理方式
TaskB
Kahn Process Network
Core
Core
タスク並列
データ並列
Task-A
MUX
MUX
FIFO
(**)
Data Bus
L1 Data Memory(SPM)
データ並列
(SIMD)
Task-B
Task-C
ALU (*)
Task-D
ALO
タスク並列とデータ並列の組合せ
SMYLE for Video Mining Chip
LD/ST(*)
CPU
Mem
Ctrl
L2 Data Memory (SPM)
I/O
Local Data Mem(*)
 Local Inst. Memory拡張
 Loop Buffer拡張
 命令拡張(Decoder, ALU, LD/ST)
 Data Register拡張
 FIFO Register拡張
 Local Data Memory拡張
Cluster Cluster
適用アプリ向けにコンフィグレーション
Cluster
Cluster
Cluster
Cluster
Cluster
時間
狙い:コアはKernel
処理の演算を
休みなく実行する
Cluster
**Data Register Bankの一部
NEDO「極低電力回路・システム技術開発(グリーンITプロジェクト)」
研究開発項目⑦「低消費電力メニーコア用アーキテクチャとコンパイラ技術」