第 16 回画像の認識・理解シンポジウム Cascaded FAST と CARD による 高速な 2 画像間の対応付け 長谷川 昂宏1,a) 安倍 満2,b) 山内 悠嗣1,c) 吉田 悠一2,d) 藤吉 弘亘1,e) 1. はじめに 2 画像間のキーポイントの対応付けは特定物体認識やパ ノラマ画像生成,画像検索などのアプリケーションに用い られる.これらのアプリケーションでは,画像の回転,ス 図 1 提案手法による 2 画像間の対応付けの流れ. ケール変化,照明変化,視点変化などに関わらず,高精度 Brighter,Similar,Darker に分類し,Brighter または Darker なキーポイントの対応付けが必要とされる.また,アプリ が {11, 9, 6} 画素以上連続する場合に注目画素をキーポイ ケーションの性質からリアルタイムに動作することも重要 ント候補点とする.そして,キーポイント候補点に対して である.2 画像間の対応付けは,(1) 画像からキーポイント 周囲 {20, 16, 12} 画素のオリエンテーションを算出する. 検出,(2) キーポイントに対して特徴量記述,(3) キーポイ 周囲 {20, 16, 12} 画素の連続する Brighter または Darker ント間の距離計算の 3 段階の処理で実現できる. の始点から終点までの角度を求め,その角度を 2 等分する 本稿では Cascaded FAST と CARD による高速な 2 画像 方向をオリエンテーションとする.周囲 {16, 12} 画素のオ 間の対応付けを提案する.Cascaded FAST[1] は機械学習に リエンテーション間の角度と周囲 {20, 16} 画素のオリエン より学習した 3 つの決定木を用いることで,高速にキーポイ テーション間の角度がそれぞれ閾値以下の場合,注目画素 ントを検出することができる.そして,Compact And Real- をキーポイントとする. time Descriptors (CARD)[2] により高速に特徴量を記述す Cascaded FAST では周囲 {20, 16, 12} 画素を参照する る.CARD はルックアップテーブルを用いることで高速 ため 3 本の決定木を FAST と同様に学習し,カスケード に勾配方向ヒストグラムに基づく局所特徴量を算出するこ 状に並べる.この決定木をトラバーサルすることにより, とができる.さらに,Supervised Sparse Hashing により FAST よりも多くの画素を参照するため,図 2 のように不 局所特徴量をバイナリコードに変換することでハミング距 要な点の検出を抑制することができる. 離により高速にキーポイントの対応付けが可能となる. 2. 高速な 2 画像間の対応付け また,Cascaded FAST はキーポイントの座標に加え,オ リエンテーションとスケールも同時に出力することができ 提案手法による 2 画像間の対応付けはの流れは (1)Cas- る.オリエンテーションは周囲 {20, 16, 12} 画素の 3 つの caded FAST によるキーポイント検出,(2)CARD による オリエンテーションのうち,分解能が最も高い周囲 20 画 特徴量の記述,(3) ハミング距離による距離計算である.提 素のオリエンテーションを出力する.また,スケールは画 案手法の流れを図 1 に示す.以下に各処理の詳細について 像ピラミッドからキーポイントを検出することで獲得でき 述べる. る.図 3 にキーポイント (座標,オリエンテーション,ス 2.1 Cascaded FAST による高速なキーポイント検出 ケール) の検出結果を示す. Cascaded FAST は周囲 {20, 16, 12} 画素を参照する 3 本の決定木を用いたキーポイント検出法である. ま ず ,周 囲 {20, 16, 12} 画 素 を FAST[3] と 同 様 に 1 2 a) b) c) d) e) 中部大学 〒 487-8501 愛知県春日井市松本町 1200 番地 株式会社デンソーアイティーラボラトリ 〒 150-0002 東京都渋 谷区渋谷二丁目 15 番地 1 号 渋谷クロスタワー 28 階 [email protected] [email protected] [email protected] [email protected] [email protected] 図 2 FAST と Cascaded FAST の比較. 1 第 16 回画像の認識・理解シンポジウム 図 4 図 3 キーポイントの検出結果. Cascaded FAST と CARD による 2 画像間の対応付けの例. 図 4 から画像の回転,スケール変化などに関わらず高精度 2.2 CARD による高速な局所特徴量の記述 に 2 画像間を対応付けていることが確認できる.また,図 CARD は,高速に計算可能であり,128 ビット程度のバ 5 に各手法における 2 画像間の対応付けの処理時間を示す. イナリコードで表現される局所特徴量である.CARD は ルックアップテーブルを用いた高速な局所特徴量抽出と Supervised Sparse Hashing による高速なバイナリコード 変換の 2 段階から成る. まず,パッチのオリエンテーションを補正後,キーポイ 図 5 ント周辺領域をセルに分割し,各セルから勾配方向ヒスト 2 画像間の対応付けの処理時間の内訳. グラムを抽出する.その際,パッチの各画素がどのセルに FAST と ORB の組み合わせでは,コーナーを高速に検 属するかをルックアップテーブルを用いて高速に求めるこ 出できる一方,FAST はテクスチャが複雑な領域から多く とができる.そして,抽出された局所特徴量 d ∈ R136 を のコーナーを検出するため距離計算に多くの時間を要する. 式 (1) によりバイナリコード b ∈ {0, 1}128 に変換する. b = (sgn(WT d) + 1)/2 (1) ここで,W ∈ R136×128 は変換行列であ.W は変換前 の局所特徴量間の距離と,変換後のバイナリコード間の距 提案手法である Cascaded FAST と CARD の組み合わ せでは,2 画像間の対応付けの計算コストを大幅に削減す ることができ,約 33[fps] でリアルタイム処理が可能であ る.以下にその理由を述べる. ・Cascaded FAST による不要なキーポイントの削減 離が一致するように最適化することにより元々の特徴量 2 画像間のキーポイントの全ての組み合わせに対してハ の記述能力を維持することができる.また,W の各要素 ミング距離を計算する必要があるため,不要なキーポイン が {-1,0,1} のうちいずれかの値を取るという制約を入れる トの検出を抑制することで計算コストを大幅に削減できる. ことで高速に変換できる.さらに,W の要素のうち 0 が ・CARD により生成されるバイナリコードのビット長 90%を占めるように最適化することで局所特徴量を高速に ORB では 256 ビットのバイナリコードで特徴量を表現 バイナリコードへ変換する. するのに対し,CARD では 128 ビットのバイナリコードで 2.3 ハミング距離による 2 画像間の高速な距離計算 特徴量が表現される.そのため,ORB に対して半分の処 CARD により記述したバイナリコードを用いてキーポイ 理時間で距離計算ができる.さらに,短いバイナリコード ントの対応付けをする.そのため,2 枚の画像から得られ による表現はメモリ消費量の削減に対しても寄与する. るキーポイント間のハミング距離を計算する.ハミング距 4. おわりに 離はビット演算を用いることで高速に計算可能である.画 本稿では不要なキーポイントの検出を抑制する Cas- 像間のキーポイントの対応付けをするため,ハミング距離 caded FSAT と高速に特徴量を記述する CARD を組み合 が 1 番小さいペア d1 と 2 番目に小さいペア d2 を比較し, わせることで,高速な 2 画像間の対応付けが可能となった. 式 (2) が成り立つ場合に対応点とする. 今後の課題として,提案手法の更なる効率化や性能の向上 d1 < d2 × k (k < 1.0) (2) 3. 評価実験 などが挙げられる. 参考文献 [1] 長谷川昂宏,山内悠嗣,藤吉弘亘,安倍満,吉田悠一,“Cascaded [2] M. Ambai and Y. Yoshida,“CARD: Compact And Real-time [3] E. Rosten and R. Porter, T. Drummond,“Faster and Better: Cascaded FAST と CARD による 2 画像間の対応付けの 有効性を確認するために評価実験をする.比較手法を表 FAST によるキーポイント検出”,SSII,2013. Descriptors”, ICCV, 2011. 1 に示す.CPU は Intel(R) Xeon(R) X5470 3.33GHz を使 用する. A Machine Learning Approach To Corner Detection”, PAMI, 表 1 比較手法. キーポイント検出 オリエンテーション算出 特徴量記述 FAST[3] モーメント [4] ORB[4] Cascaded FAST[1] Cascaded FAST[1] CARD[2] Vol. 32, No. 1, pp. 105 - 119, 2010. [4] E. Rublee, V. Rabaud, K. Konolige, and G. Bradski, “ORB : An Efficient Alternative to SIFT or SURF”, ICCV, 2011. 図 4 に提案手法による 2 画像間の対応付けの例を示す. 2
© Copyright 2025 Paperzz