CSS2003論文(pdf形式) - 慶應義塾大学 湘南藤沢キャンパス

周波数領域での非線形適応システムを用いた電子透かしの耐性評価
直江健介 安藤類央
武藤佳恭
慶應義塾大学大学院政策メディア研究科
〒2520816 神奈川県藤沢市遠藤5322
[email protected] [email protected] [email protected]
あらまし
著作権保護の際に必要となるロバスト電子透かしの効率的な手法を提案する。
本論文では、頑健な電子透かしを作成する際に、少ない埋め込み情報から多くの秘匿情報
を検出する事を目標にして、非線形適応システムの入力信号として、直交変換後の係数を
選択し、この位置情報を埋め込む手法について検討する。検出鍵の作成にあたっては、比
較的優れた汎化能力と情報の分散表現に特長があるという理由から、階層型のニューラル
ネットワークを用いた。提案手法は静止画像に適用され、変更する必要のある画素数の削
減と、耐性の改善についての従来手法との比較評価を行った。
Block location embedding using backpropagation after DCT
for robust watermark
Kensuke Naoe, Ruo Ando, Yoshiyasu Takefuji
Keio University, Graduate School of Media and Governance
5322 Endo, Fujisawa, 2520816 JAPAN
[email protected]
[email protected]
[email protected]
Abstract. In this paper we propose a new watermarking method employing
nonlinear adaptive system. Our system can detect the embedded code by
feed-forward computing as input signal of coefficients of a DCT block. In generating
key, we applied supervised learning process of neural networks that takes
advantages in interpolation and fault-tolerance for damaged input signal. For
achieving robustness of watermarking, experimental results is presented to
validate that our model is more functional compared with the previous Huffman
coding method after frequency transformation because location information
embedding requires the modification of only 2 pixels for the following detection of
possibly more than 1 byte code. Proposal method is tested and evaluated in a still
image watermark system.
1. 電子透かしの用途と分類
近年マルチメディアデジタルコンテンツ
の作成が極めて容易になり、またインターネ
ットの普及によりこれらのデジタルコンテ
ンツを公開することが可能になってきた。し
かしこれらのコンテンツが著作者の意図し
ない所で一人歩きするケースが起こってい
る。デジタルコンテンツは品質が優れている
にもかかわらず、いくらコピーをしても品質
が劣化せず、取り扱いが簡単という特徴があ
るため現実では他人の著作物を平然と複製
し利用されるという危険を常に抱えている。
デジタルコンテンツの配布に関しては、性
悪説で物事を考える必要があり、悪意の第三
者が著作者の断りなく悪用した場合に法的
手続きをとるためにも証拠として電子透か
しをコンテンツに忍ばせる必要がある。コン
テンツビジネスの発展要件しては、著作権の
保護、主張、正当な課金、不正コピーの防止
などがあり、電子透かしの技術を用いること
で、各自のコンテンツに署名を埋め込んでか
ら作品を安全に公開するようになることが
想定される。
電子透かしのデジタルコンテンツへの埋
め込みは、そのコンテンツの不正コピーの抑
止力として働くとしても、不正コピー自身を
防止する事はできないという点から、電子透
かしの用途は著作権の主張、保護、本物であ
ることの証明、秘密通信、改ざん検知などに
なる。著作権の保護については、以下のよう
な用途が検討されている。
[1] コンテンツの著作権を主張するために
電子透かしを入れておく利用方法。不正コピ
ーに対しては抑止力として作用。
[2] 不正利用された場合現場を発見する必
要がある。それを補助する機能として不正利
用コンテンツを探索するシステムを利用。
例)特定の URL を指定して探索するシステム
や、自動的にすべての URL に対してロボット
型探索を行い、検査するシステム。
[3] 利用者を特定するためのデジタル指紋
ユーザから購入希望があった場合、例えばユ
ーザ情報などを電子すかし入りコンテンツ
に追記することでユーザ情報が記述された
デジタルコンテンツがユーザに届くシステ
ム。
[4] 配信システムへの応用:例として音楽に
透かしを埋め込みそれを暗号化したものを
配信コンテンツサーバに格納する方法があ
る。利用側は暗号を複合化しコンテンツを利
用。このコンテンツにはすかしが入っている
ため不正配布にも対応できる。
1.1 目的別分類
インフォメーションハイディングは、その
用途によって、ウォーターマーキング、フィ
ンガープリンティング、ステガノグラフィに
分けることができる。本論文ではウォーター
マーキングを扱うが、ウォーターマーキング
にはフラジャイルウォーターマーキングと
ロバストウォーターマーキングがある。
フラジャイルウォーターマーキングとは
主に改ざん検知のための電子透かしに用い
られるアルゴリズムで、電子透かしの入った
メディアに簡単な処理を施しただけで透か
しの一部または全部が消えるような仕組み
のことである。またある一定の閾値を超える
改ざんが行なわれて初めて透かしが消える
という仕組みのものもあり、それはセミフラ
ジャイルウォーターマーキングと呼ばれる。
ロバストウォーターマーキングは透かしに
対して非常に複雑な処理を施しても耐えう
る仕組みを持ったアルゴリズムを持つ電子
透かしのことである。透かしの除去を防ぐこ
とに最大の目的がある。このため主に著作権
管理情報用の電子透かしなどで用いられる
ことが多い。
1.2 手法別分類
電子透かしとは通常では人間が知覚でき
ないが、コンテンツに対して特定の操作を行
うと秘匿された情報を検出できる手法を指
す。そのため、近年 HVS(Human Visual
System)の仕組みを援用した電子透かしが
採用されている。人間の視覚システムの複雑
かつ精巧な仕組みを模倣して、特徴抽出やパ
ターン認識、そして電子透かしに援用する試
みが行われている。最近の心理実験によれば、
人間の視覚皮質は各周波数領域に対応して
分割されており、これにより脳はスペクトラ
ムを知覚可能なチャンネルに分解するとし
ている[3]。それ以前の感知の段階として、
輝度が極端に変化する箇所や、高周波の領域
に電子透かしを埋め込む手法も、HVS ウォ
ーターマーキングに分類される。電子透かし
を埋め込む領域としては、画像とビットプレ
ーンに分解してから埋め込む方法と、周波数
領域に変換してから埋め込む方法がある。
また、個々のコンテンツに特有な冗長度、
局所性などを解析し、適応的な電子透かしを
行う研究も行われている。ウェーブレット変
換を利用した電子透かしはここに分類され
ることがある。このコンテンツ適応型の電子
透かしは対象の特徴を抽出することを意味
し、クラスタリングなどの手法を適用した研
究も行われている。
2
2.1 埋め込みプロセス I
コンテナとなる画像と周波数変換し、比較
的フィルタの影響のかかりにくい中間領域
に位置情報を埋め込む。次に、検出のために、
位置情報で指定されたブロックの係数を入
力信号、秘匿するビット列を教師信号として、
ニューラルネットワークに学習を行う。
2.2 埋め込みプロセス II
非対称電子透かしとは、埋め込みの際に用
いた鍵から、なんらかの変換処理を行って、
検出用の鍵(公開鍵)を作成することである
が、ここでは、入力信号を選択したブロック
の係数の値、教師信号を秘匿する情報のビッ
ト列として、学習が終了した時点の結合係数
を検出用の公開鍵とする。なお、復元時に埋
め込み時の情報がすべて利用されるため、同
手法は厳密な意味での非対称電子透かしで
はない。
提案手法
前節で述べたとおり、本論文では、周波数
領域にロバストな電子透かしを埋め込むこ
とを目標とする。著作権保護の際に必要とな
るロバスト電子透かしについての需要が高
まっている。本論文では、頑健な電子透かし
を作成する際に、少ない埋め込み情報から多
くの秘匿情報を検出する事を目標にして、非
線形適応システムの入力信号として、直交周
波数変換後の係数を選択し、この位置情報を
埋め込む手法を提案する。提案手法は静止画
像に適用され、変更する必要のある画素数の
削減と、耐性の改善についての従来手法との
比較評価を行った。
埋め込みプロセスは、位置情報の埋め込み
と鍵の生成、検出プロセスは位置情報の検出
とメッセージの復元といったそれぞれ2つ
の手順を踏む。検出プロセスは、埋め込み位
置情報の検出、秘匿情報の復元の2つに分か
れる。
2.3 検出プロセス I
提案手法では、秘匿された情報は非線形適
応システムの出力信号として復元される。そ
のため、検出プロセスではまずシステムが処
理する入力信号をコンテナから得ることが
必要になる。
2・4 検出プロセス II
検出プロセスの第2番目は、ニューラルネ
ットワークの認識手順における前進処理に
あたる。対象となるコンテンツに多少のフィ
ルタがかかっていた場合でも、非線形適応シ
ステムの汎化能力と学習データの分散表現
により、適切な復元を行うことができる。
3
適応信号処理
3.1 適応信号処理とは
現在、電子透かしに関わらず、適応性をも
つシステムがさまざまな分野で適用されて
いる。とりわけ、現在の情報通信システムに
は適応信号処理が不可欠な手法となってい
る。適応信号処理とは、可変システムでの信
号処理の過程において、システムの特性が変
換させる処理のことである。ここで最適化の
ために適用されることの多い最小自乗法は、
誤差信号の二乗を最小化するようにシステ
ムの構造を順次的に修正していくアルゴリ
ズムである。適応信号処理の特徴として、根
幹となる構造に加え、アルゴリズム、パラメ
ータが可変であり、これらの設定が性能に大
きく寄与する。また、膨大な回数の繰り返し
をおこなうため、基本的にソフトウェア処理
が適する。本論文では、適応信号処理の手法
としての最急降下法をニューラルネットワ
ークモデルに適用した逆誤差伝播法(バック
プロパゲーション)を用いた。
3.2 バックプロパゲーション
ニューラルネットワークは、一般に非線形
適応システムと言われる。階層型ニューラル
ネットワークモデルは、その数理的定式化が
簡素であると同時に、層の数やニューロンの
連結関数を比較的容易に調整することがで
きる。これにより、表現能力の高い非線形関
数を実現できることが特徴である。バックプ
ロパゲーションに関わらず、階層型ニューラ
ルネットワークは学習、汎化、並列処理の3
つの機能を持っている。特に、階層型ニュー
ラルネットワークの汎化機能が応用分野に
おいては重要となる。
2ノイズへの耐性:ニューラルネットワーク
の順伝播学習は、基本的に計算コストがかか
り、ローカルミニマムに陥る問題があるが、
その強力な汎化能力により、雑音がある程度
加わったパターンに対しても、正しい応答を
出力する。
3誤り訂正と補完性:学習の過程で情報が多
数のニューロンに分散され、各々が最終出力
応答に影響を与える構造になっているため、
入力情報や各ユニットがダメージをうけて
いても補完的に適切な信号を出力すること
ができる。
任意の入力信号に対して、学習ずみの入力
パターンの中から類似するものを探しだす
ことは、想起可能なすべての入力パターンを
ネットワークに与えなくとも、代表的なパタ
ーンのみを学習させれば適切な応答を行う
ようになることを意味する。電子透かしでい
えば、任意に選択したコンテンツデータの数
値が学習させることで、適切な秘匿情報を検
出できることが想定される。上述したシンプ
ルなモデルを使うと、学習が2回以内になり
従来の方法に比べ高速に完了する。
4
実験結果
以上述べてきた、提案手法の評価分析のため
に簡単な透かし埋め込みと検出のための実験
を行った。画像データは256*256画素数
の任意に選択したものを用い、離散コサイン変
換を行い、複数のブロックから構成される係数
行列を構成した後、任意のブロックを選択し、
中間領域に入力信号となる係数のあるブロッ
1追加学習性:逆誤差伝播法は入力信号とし
て連続値をとり、パターン認識として離散的
な応答をするため、閾値を設ける必要がある。
また、学習が収束することを要求しないアル
ゴリズムであるため、以前の訓練によって獲
得した知識の損失を避けながら、新しい学習
パターンを処理することができる。
クの位置情報を埋め込んだ。
図1は、埋め込まれた位置情報が変更され
なかった場合の、DCT係数を入力信号とし
たニューラルネットワークの認識率である。
ニューラルネットワークは基本的に連続値
の演算なので閾値を設けてビット列を復元
する必要があるが、本実験では概ね高い認識
率を示した。
が学習の過程で分散して表現されるように
なるため、入力信号にノイズが加わっても適
切な応答することになる。
実験では、フィルタによって、離散コサイ
ン後の係数は変化したが、位置情報そのもの
は変化しないケースでは、認識率に多少の差
はあるものの同じビット列を検出できるこ
とがあきらかになった。
1バイトコードの検出
0.25
0.2
0.15
0.1
0.05
0
1
2
3
4
5
6
7
8
出力信号
1バイトコードの検出
図 1.
検出結果1
1
0.8
0.6
0.4
1バイトコードの検出
0.2
1.2
0
1
1
2
3
0.8
4
5
出力信号
6
7
8
0.6
図 3. 検出結果3
0.4
0.2
5
0
1
2
3
4
5
出力信号
6
7
8
まとめと今後の課題
本論文ではロバスト電子透かしを扱った。
階層型ニューラルネットワークの持つノイ
ズへの耐性と学習仮定での情報の分散的な
図 2. 検出結果2
波及などの特徴に着目し、周波数変換を行っ
図2は、意図的に埋め込み情報に変更を加え、 た後に学習によって検出用の鍵を作成し、位
置情報を埋め込む手法による電子透かしの
任意のDCTブロックの係数値を入力信号と
耐性評価を行った。バックプロパゲーション
してニューラルネットワークに認識させた場
合の出力である。電子透かしへの改ざんとして、 は入力信号を処理処理することにより内部
ニューロン群にエンコードされるパターン
復号時のルールに基づいて画素値を変更する
を検出することにより、汎化能力に優れる。
という手法があるが、提案手法では、埋め込み
今回は、DCTで作成されたブロックの内特
に用いた情報が復元時にもすべて参照されが、
徴が顕著に出ているものを1つ選び埋め込
検出用に用いる鍵を共有するため、検出鍵に対
みと検出を行ったが、今後さまざまなコンテ
する改ざんがない限り、画素値の変更によって
ンツを対象とし、提案手法を従来手法と比較
任意に秘匿情報を他の有意のものに書き換え
検討し、本論文で指摘した特徴の実証を更に
ることができないことが実験結果から実証さ
行う必要がある。また、汎化という観点でい
れた。
えば、クラスタごとの汎化を均一に強化する
SVM(サポートベクトルマシン)や、RB
図3は、フィルタ後の出力である。階層型
Fネットワークの適用を検討する必要があ
ニューラルネットワークの汎化能力と情報
Trans. on Image
る。また、現在指摘されているコンテンツレ
pp.1673-1687,.
コーダによるストリーミングコンテンツの
複製に関して、動画像処理への電子透かしを、
非線形適応システムを用いて行う予定であ
る。
文献
[1]松井甲子雄, 電子透かしの基礎, 森北出
版, 1998
[2] E. M. Johansson, F. U. Dowla and D. M.
Goodman, “Backpropagation Learning for
Multilayer Feed-forward Neural Networks
using the Conjugate Gradient Method'', Int.
J. Neur. Syst. 2, 291 (1992).
[3] Daugman, J.G. High confidence visual
recognition of persons by a test of statistical
independence. IEEE Trans. Pattern Anal. and
Machine Intell. 15, 11 (1993)1148-1161.
[4] Barni, F. Bartolini, V. Cappellini, A.
Piva, "A DCT-domain System for robust
image watermarking”, Signal Processing,
Vol. 66, No. 3, 1998,pp. 357-372.
[5]C.Podilchuk
and
W.
Zeng,
“Image-adaptive watermarking using
visual models,” IEEE Journal on Selected
Areas in Communications. vol. 10, no. 4,
1998,pp. 525-540.
[6]Ki-Ryong Kwon, Seong Geun Kwon,
Jeho Nam, Ahmed H. Tewfik, “Content
adaptive watermark embedding in the
multiwavelet transform using a stochastic
image
model”,
IWDW2002,
2002,
pp.249-263
[7]D. Kundur and D. Hatzinakos, “A
robust digital image watermarking
scheme using wavelet-based fusion”, Proc.
ICIP-97, Vol. 1, 1997,pp. 544-547.
[8]I.J. Cox, J. Kilian, T. Leighton and T.
Shamoon,”Secure
spread
spectrum
watermarking for multimedia, IEEE
Processing,
1997,