画像認識特論 資料5 システム情報系 情報工学域 福井和広 固有空間への射影の有効性 1. 1 2. 3. 4 4. 情報圧縮 特徴抽出 画像復元 高次元デ タの可視化 高次元データの可視化 1 有効性1:情報圧縮 顔パターンを顔固有空間へ射影 この場合の情報の圧縮率は? 900次元 射影 射影 顔固有空間(90次元) 顔固有空間: 様々な撮影条件、人物の顔パターンが局在している部分空間 900(=30x30)次元空間を張る直交基底ベクトルの一例 4 2 基底ベクトルの1次結合による表現 c1 任意の正面顔 (30x30ピクセル =900次元ベクトル) c2 e1 c3 c4 e2 c897 900本の正規直交基底 ベクトルの線形和で 表される 表される. 重み 係数 e3 c898 e4 e5 c899 e898 e897 c5 c900 e900 e899 ci = x ⋅ ei = x t ei , i = 1,L ,900 99.9% 0 c1 c2 c3 ・・・・, c90, ・・・・ c899 c900 固有空間の基底ベクトルによる近似 b1 人物A 近似 b2 e1 b3 e2 b90 e90 e3 人物B a1 近似 a2 e1 a3 e2 a90 e3 e90 90 3 情報圧縮とは? 射影前:人物のベクトルは900本の基 底により表現される. 底により表現される 射影後:人物のベクトルは90本の基底 ベクトルにより表現される. 画像情報は90/900*100=10%に圧縮された.” “画像情報は90/900*100=10%に圧縮された と見なさせる. 射影により類似度の計算量が大幅に削減 A B 射影前:人物AとBの類似度を計算する ためには何回の乗算が必要か? 射影後:人物AとBの類似度を計算する ためには何回の乗算が必要か? 4 固有空間の基底ベクトルによる近似 内積計算の量が大幅に減る理由 b1 人物A 近似 b2 e1 b3 e2 b90 e90 e3 ベクトルAとBの内積<A・B>= ベクトルAとBの内積<A B> ??? 人物B a1 近似 a2 e1 a3 e2 a90 e3 e90 情報圧縮は画像認識の常套手段! 5 最もシンプルな識別法はこうなる. 1. 各人物毎に様々な条件で顔画像を収集する. 2. 各顔画像(ベクトル)を予め求めておいた固有空間に射 影する(この図では3次元固有空間). 3 各クラスの射影ベクトル分布の平均を求める. 3. 各クラスの射影ベクトル分布の平均を求める 4. 入力(未知)顔ベクトルと各クラス平均ベクトルとの正規 化相関を計算する. 5. もっとも高い正規化相関に対応するクラスに分類する. 人物3ベクトル p3 S = cos θ = 2 人物1ベクトル 人物 ク ル p1 ( v ⋅ pi ) 2 2 v pi 人物2ベクトル p2 2 入力ベクトル v 固有(部分)空間 有効性2:特徴抽出 個人成分空間への射影 顔の固有空間(90次元) 射影 射影 共通成分 部分空間 (30次元) 個人成分 部分空間 (60次元) 6 さらに識別性能を高めた識別法はこうなる. 1. 各人物毎に様々な条件で顔画像を収集する. 2. 各顔画像(ベクトル)を予め求めておいた固有空間中の 個人差成分空間へ射影する. 3 各クラスの射影ベクトル分布の平均を求める. 3. 各クラスの射影ベクトル分布の平均を求める 4. 入力(未知)顔ベクトルと各クラス平均ベクトルとの正規 化相関を計算する. 5. もっとも高い正規化相関に対応するクラスに分類する. 共通成分空間 S = cos θ = 2 人物1ベクトル 人物 ク ル p1 ( v ⋅ pi ) 2 2 v pi 人物2ベクトル p2 2 入力ベクトル v 人物3ベクトル p3 個人差成分空間 有効性3:画像復元 射影 ? 欠損のない多数の人物の正面顔から 生成された部分空間とする. 部分空間 (正面顔固有空間) この部分空間内のパターンは必ず 欠損の無い正面顔の線形和で表される. 7 射影とは何かを再考してみよう. x ' = Px ベクトル X 射影ベクトルX’ 部分空間P x − x 'とxは直交している. x 'は,xに対してどのような特性を 持つ部分空間P上のベクトルか? 有効性3:画像復元 射影 ? 欠損のない多数の人物の正面顔から 生成された部分空間とする. 部分空間 (正面顔固有空間) この部分空間内のパターンは必ず 欠損の無い正面顔の線形和で表される. 8 画像パターンの可視化 どうすれば高次元ベクトルを “(近似的に)見る”ことができるか? 画像パターンの可視化 e2 射影 射影 e1 顔の固有空間(3次元以下) 9 正面顔(4人分)の分布 動画像パターン列の可視化 • 回転する物体を撮影した動画像列を,固 転する物体を撮影 た動 像列を 固 有空間へ射影した場合,どのような分布 になるか? • 動画像パタ 動画像パターンセットは高次元ベクトル ンセットは高次元ベクトル 空間において多様体を形成する. 10 ロボットの全身運動の可視化するためには? 自由度=10(首に3,肩3×2左右,肘1×1左右) t=1 t=k t X t = (θ1t , θ2t , θ3t ,LL, θ9t , θ10 ) 11 ロボットの全身運動の可視化 自由度=10(首に3,肩3×2左右,肘1×1左右) 10次元状態ベクトルを 3次元部分空間に射影 Motion 1 「力学系を用いたロボットの情報処理」,中村仁彦,岡田昌史より 12
© Copyright 2025 Paperzz