画像認識特論 資料5

画像認識特論 資料5
システム情報系
情報工学域
福井和広
固有空間への射影の有効性
1.
1
2.
3.
4
4.
情報圧縮
特徴抽出
画像復元
高次元デ タの可視化
高次元データの可視化
1
有効性1:情報圧縮
顔パターンを顔固有空間へ射影
この場合の情報の圧縮率は?
900次元
射影
射影
顔固有空間(90次元)
顔固有空間:
様々な撮影条件、人物の顔パターンが局在している部分空間
900(=30x30)次元空間を張る直交基底ベクトルの一例
4
2
基底ベクトルの1次結合による表現
c1
任意の正面顔
(30x30ピクセル
=900次元ベクトル)
c2
e1
c3
c4
e2
c897
900本の正規直交基底
ベクトルの線形和で
表される
表される.
重み
係数
e3
c898
e4
e5
c899
e898
e897
c5
c900
e900
e899
ci = x ⋅ ei = x t ei , i = 1,L ,900
99.9%
0
c1 c2 c3 ・・・・, c90,
・・・・
c899 c900
固有空間の基底ベクトルによる近似
b1
人物A 近似
b2
e1
b3
e2
b90
e90
e3
人物B
a1
近似
a2
e1
a3
e2
a90
e3
e90
90
3
情報圧縮とは?
射影前:人物のベクトルは900本の基
底により表現される.
底により表現される
射影後:人物のベクトルは90本の基底
ベクトルにより表現される.
画像情報は90/900*100=10%に圧縮された.”
“画像情報は90/900*100=10%に圧縮された
と見なさせる.
射影により類似度の計算量が大幅に削減
A B
射影前:人物AとBの類似度を計算する
ためには何回の乗算が必要か?
射影後:人物AとBの類似度を計算する
ためには何回の乗算が必要か?
4
固有空間の基底ベクトルによる近似
内積計算の量が大幅に減る理由
b1
人物A 近似
b2
e1
b3
e2
b90
e90
e3
ベクトルAとBの内積<A・B>=
ベクトルAとBの内積<A
B>
???
人物B
a1
近似
a2
e1
a3
e2
a90
e3
e90
情報圧縮は画像認識の常套手段!
5
最もシンプルな識別法はこうなる.
1. 各人物毎に様々な条件で顔画像を収集する.
2. 各顔画像(ベクトル)を予め求めておいた固有空間に射
影する(この図では3次元固有空間).
3 各クラスの射影ベクトル分布の平均を求める.
3.
各クラスの射影ベクトル分布の平均を求める
4. 入力(未知)顔ベクトルと各クラス平均ベクトルとの正規
化相関を計算する.
5. もっとも高い正規化相関に対応するクラスに分類する.
人物3ベクトル p3
S = cos θ =
2
人物1ベクトル
人物
ク ル p1
( v ⋅ pi ) 2
2
v pi
人物2ベクトル p2
2
入力ベクトル v
固有(部分)空間
有効性2:特徴抽出
個人成分空間への射影
顔の固有空間(90次元)
射影
射影
共通成分
部分空間
(30次元)
個人成分
部分空間
(60次元)
6
さらに識別性能を高めた識別法はこうなる.
1. 各人物毎に様々な条件で顔画像を収集する.
2. 各顔画像(ベクトル)を予め求めておいた固有空間中の
個人差成分空間へ射影する.
3 各クラスの射影ベクトル分布の平均を求める.
3.
各クラスの射影ベクトル分布の平均を求める
4. 入力(未知)顔ベクトルと各クラス平均ベクトルとの正規
化相関を計算する.
5. もっとも高い正規化相関に対応するクラスに分類する.
共通成分空間
S = cos θ =
2
人物1ベクトル
人物
ク ル p1
( v ⋅ pi ) 2
2
v pi
人物2ベクトル p2
2
入力ベクトル v
人物3ベクトル p3
個人差成分空間
有効性3:画像復元
射影
?
欠損のない多数の人物の正面顔から
生成された部分空間とする.
部分空間
(正面顔固有空間)
この部分空間内のパターンは必ず
欠損の無い正面顔の線形和で表される.
7
射影とは何かを再考してみよう.
x ' = Px
ベクトル X
射影ベクトルX’
部分空間P
x − x 'とxは直交している.
x 'は,xに対してどのような特性を
持つ部分空間P上のベクトルか?
有効性3:画像復元
射影
?
欠損のない多数の人物の正面顔から
生成された部分空間とする.
部分空間
(正面顔固有空間)
この部分空間内のパターンは必ず
欠損の無い正面顔の線形和で表される.
8
画像パターンの可視化
どうすれば高次元ベクトルを
“(近似的に)見る”ことができるか?
画像パターンの可視化
e2
射影
射影
e1
顔の固有空間(3次元以下)
9
正面顔(4人分)の分布
動画像パターン列の可視化
• 回転する物体を撮影した動画像列を,固
転する物体を撮影 た動 像列を 固
有空間へ射影した場合,どのような分布
になるか?
• 動画像パタ
動画像パターンセットは高次元ベクトル
ンセットは高次元ベクトル
空間において多様体を形成する.
10
ロボットの全身運動の可視化するためには?
自由度=10(首に3,肩3×2左右,肘1×1左右)
t=1
t=k
t
X t = (θ1t , θ2t , θ3t ,LL, θ9t , θ10
)
11
ロボットの全身運動の可視化
自由度=10(首に3,肩3×2左右,肘1×1左右)
10次元状態ベクトルを
3次元部分空間に射影
Motion 1
「力学系を用いたロボットの情報処理」,中村仁彦,岡田昌史より
12