ベクトル量子化のコードブックによる画像分類 カテゴリ分類実験例

©Nagao Laboratory
ベクトル量子化のコードブックによる画像分類
z 現在,一般に利用されている検索エンジンにおける画像検索では,画像に付け
られたインデックスやファイル名などを手がかりにしたキーワード検索が主流で
あり,“画像の内容そのもの”をもとにした検索は行なわれていない.色配置や
構図などをクエリにするものも一部あるが,まだ完全とは言えない.
z ここでは,画像の圧縮符号化によく用いられるベクトル量子化法のコードブック
情報を,画像の「カテゴリ」の情報として用いる手法を提案する.
z ベクトル量子化法:
画像をブロックに分割し,含まれるブロックを典型的なパ
ターン(代表ベクトル)で
表現することで,データ
圧縮を行なう方法.
z 画像のカテゴリ毎に,代表ベ
クトルとして選ばれるブロック
群(コードブック)が異なり,そ
れはカテゴリの特徴を現して
いるのではないか?と考える.
1
©Nagao Laboratory
カテゴリ分類実験例
z 果物のカテゴリ毎のコード
ブックを作った.「りんご」の
コードブックの例を次に示す.
緑のブロックは,りんごの木
の影響によって入ったと考え
られる.
z 複数のカテゴリを同様に記
述した後,未知の画像100
枚を分類した結果を下に示
す.比較的良好な結果が
得られていることがわかる.
画像の例
ベクトル量子化
z 同様に肌色画像と
顔画像を分離した
結果を右に示す.
距離が小さいほど
顔画像であること
を示す.
コンピュータによる分類結果
キーワード
リンゴ
ミカン
メロン
バナナ
ブドウ
リンゴ
20
1
0
0
0
ミカン
0
14
1
0
0
メロン
0
3
14
1
1
バナナ
0
2
0
19
1
ブドウ
0
0
5
0
18
コードブックに含ま
れるブロックの例
距離
2000未満
2000 ~ 2200
2200 ~ 2400
2400 ~ 2600
2600 ~ 2800
2800 ~ 3000
3000 ~ 3200
3200 ~ 3400
3400 ~ 3600
3600 ~ 3800
3800 ~ 4000
4000 ~ 4200
4200 ~ 4400
4400 ~ 4600
4600 ~ 4800
4800 ~ 5000
5000以上
合計
未知画像合計
顔画像数
1
0
2
5
6
10
2
0
0
0
0
0
0
0
0
1
0
27
肌色画像数
0
0
0
0
2
2
5
3
3
4
1
1
2
3
0
2
3
31
58
2