JPEG optimization decoding based on Web image database

Web 画像データベースを用いた JPEG 最適化復号
JPEG optimization decoding based on Web image database
渡邉 玲児 †
†
Reiji Watanabe
宮田 高道 †
†
Takamichi Miyata
稲積 泰宏 ‡
Yasuhiro Inazumi
†
†
東京工業大学
Tokyo Institute of Technology
‡
‡
酒井 善則 †
Yoshinori Sakai†
富山大学 ‡
University of Toyama
Abstract: To eliminate blockiness and ringing distortion caused by JPEG compression, JPEG decoding method based
on total variation regularization has been proposed. On the other hand, to restore texture component that lost through
compression, the image quality improvement method based on Web image database have been proposed. In this study, we
proposed a hybrid method of eliminating blockiness with total variation regularization and regenerating texture from Web
image database. Experimental result shows the proposed method can improve the decode image quality.
1
はじめに
より算出する.dct(・) は DCT 係数を,N はブロック
内の画素数を表す.入力画像の各ブロックについて,
近年,JPEG 符号化で生じるブロックノイズやリンギン
グ歪みの除去を目的とした Total Variation(TV) 正則化法に
この S が最小となる参照画像のブロックを探索して
よる JPEG 圧縮画像復号法が提案されている [1][2].しか
得られる画像を参照ブロック画像と呼ぶ.
3. 低品質な参照のブロック画像と,各参照ブロックに対
しながら,このような手法では,符号化によって失われた
画像のテクスチャを再現することは一般的に難しい.一
応するトランスコード前の参照画像のブロックから,
方,Web 画像データベースを用いることで,圧縮によって
高品質な参照ブロック画像を得る.
失われた高周波成分を復元する画質改善法も提案されてい
4. 入力画像と高品質参照ブロック画像の DCT 係数を平
る [3] が,ブロックノイズやエッジの損失の発生という問
均し,その直流成分を入力画像の直流成分で置き換
題点がある.そこで本研究では,Web 画像データベースか
えたものを逆 DCT し,出力画像を得る.
ら抽出された類似 Web 画像群から得られる情報と TV 正
則化法を用いた復元法を組み合わせることにより,JPEG
圧縮画像復号時の画質改善を行う手法を提案する.
2 TV 正則化法を用いた JPEG 圧縮画像
の復元
以上の処理により,符号化によって失われた高周波成分,
特にテクスチャの復元を行う.
提案手法
4
4.1
概要
Alter らは JPEG 符号化の際に生じるブロックノイズや
前述で述べた TV 正則化法を用いた復元法や Web 画像
リンギング歪みを除去するため,TV 正則化法を JPEG 圧
データベースによる画質改善法は,共に JPEG 圧縮された
縮画像の復元に応用する手法を提案した [1].
画像を復元する際の画質改善を目的としている.TV 正則
この手法は,JPEG 復号画像から当該画像の TV ノルム
化法を用いた復元法は,画像のエッジ部分を保持しつつブ
の劣勾配を引いた画像の DCT 係数を,符号化ビットスト
ロックノイズやリンギング歪みの除去を行うが,画像中の
リームから得られた各係数の量子化ステップ範囲内の値に
テクスチャ成分 (例えば画像中の芝生部分等) を復元する
修正する操作を繰り返すものである.
ことは原理的に難しい.一方 Web 画像データベースによ
3 Web 画像データベースによる画質改
善
る画質改善法は,JPEG 圧縮により本来復元できない失わ
文献 [3] は,JPEG 画像 (入力画像) に対して,タグによっ
うため,ブロックノイズが出たりエッジ部分が失われてし
れたテクスチャ成分を類似画像を用いることで疑似的に再
生させることができる.しかし,ブロック単位で処理を行
て Web データベースから取得した高品質な類似画像群 (参
まう問題がある.また,入力された符号化ビットストリー
照画像) を用いて画質改善を行う手法である.この手法の
ムに含まれている量子化テーブルの情報を一切参照しな
アルゴリズムを以下に示す.
1. 参照画像を入力画像と同様の Q ファクタによって JPEG
いため,マッチングで不適切な参照ブロックが選択された
トランスコードすることにより,低品質な参照画像を
生成する.
2. 入力画像と参照画像のブロック (8×8 画素) の類似度 S
を
1 S = dct入力画像 − dct低品質参照画像 N
際には,原画像と大きく異なる画像が生成される可能性も
ある.
提案手法では,Web 画像データベースによる画質改善
法と TV 正則化法を用いた復元法を用いることにより,画
像のテクスチャ成分を復元しつつ,かつブロックノイズや
リンギングの発生を抑えることを目的とする.
4.2
アルゴリズム
提案手法のアルゴリズムを以下に示す.
1. 通常の JPEG 復号法により得られた復元画像を入力符
号化画像 I とする.最大反復回数を R とする.
2. 前節の Web 画像データベースによる画質改善法によ
り,テクスチャ成分が復元された入力画像 Iu(0) を得る.
3. TV 正則化法の最大反復回数を K とする.初期値を
k = 0 と設定する.
Figure 1: Original image.
Figure 2: JPEG image.
4. TV 正則化項の重みを λk = 1/(k + 1) と設定する.
5. Iuk の TV ノルムの劣勾配 g(Iuk ) を求め,
Ivk = Iuk − λk・g(Iuk ) によって勾配降下を行う.
6. Ivk の DCT 係数を求め,当該 DCT 係数を入力符号化
画像と同じ量子化テーブルによって量子化する.
7. Ivk の DCT 係数の量子化インデックスが入力符号化画
像の量子化インデックスと完全に一致するように補
正する.
Figure 3: Web database result. Figure 4: Processing result.
8. 補正された DCT 係数を逆 DCT して復元画像 Iuk+1 を
求める.
9. k を 1 増加し,k < K であれば 4. へ戻る.
10. 最大反復回数 R を満たすまで 8. で得られた画像を入
力画像とし,2. へ戻る.
11. 終了
6
おわりに
本稿では,Web 画像データベースによる画質改善法と
TV 正則化法を用いた復元法を組み合わせることにより,
JPEG 圧縮画像復号時の画質改善を行う手法を提案した.
今後の課題として,反復処理における適切な収束判定に
ついての検討などが挙げられる.
5
実験結果
提案手法の有効性を評価するための復号実験を行った.
Fig.1 は今回の実験に使用した原画像である.Fig.2 は Fig.1
を JPEG 圧縮した入力画像である.この Fig.2 に対して,
文献 [3] の手法を適用した結果を Fig.3 に示す.ここで,参
参考文献
[1] Francois Alter, et al.: “Adapted Total Variation for Artifact Free Decompression of JPEG Images,” Jounal
of Mathematical Imaging and Vision, Vol.23,No.2,
pp.199-211, 2005.
照画像としては,Fig.1 の内容を表すキーワード,“lawn”
と “road” によって Web 画像データベース Flickr [4] から
[2] 小松隆, 齊藤隆弘, “TV 正則化法を用いた JPEG 圧
得た 3 枚の画像を用いた.提案手法において同様の参照画
縮画像の超解像デコーディング,” 電子情報通信学会,
像を用い,K = 40,R = 3 と設定したときの結果を Fig.4
Vol.J90-D, No.7, pp.1671-1674, 2007.
に示す.なお,今回用いた K 及び R の値は発見的に得た
ものである.
Fig.2 の JPEG 圧縮画像では,高い圧縮率を用いたため
[3] 谷亮広, 稲積泰宏, 宮田高道, 堀田裕弘, “内容に
合った Web 画像特徴量を用いた画質改善法,” 電子情
報通信学会論文誌, Vol.J92-D, 採録済み, 2009.
に DCT 係数の高周波成分が失われ,顕著なブロックノイ
ズの発生と,芝生等のテクスチャ成分の欠損が確認でき
[4] Flickr, http://www.flickr.com/
る.文献 [3] の手法を適用した Fig.3 では失われたテクス
チャ成分が復元されている一方で,ブロックノイズの発生
やエッジ部分の損失が見られる.これに対し,提案手法に
よって得られた Fig.4 は,Fig.2 及び Fig.3 と比較してテク
スチャ成分やエッジ部分を保持しつつ全体的にブロックノ
イズが軽減されており,主観評価が向上しているといえる.
The authors are permitted to publish and modify of the photographs(Figure1∼Figure4) released under the Creative Commons.
Figure1 is created by Joel Abroad.
東京工業大学 大学院理工学研究科 集積システム専攻
〒152–8522 東京都目黒区大岡山 2-12-1
Phone: 03-5734-3761, Fax: 03-5734-3763
E-mail: [email protected]