周波数領域での非線形適応システムを用いた電子透かしの耐性評価直江健介安藤類央武藤佳恭慶應義塾大学大学院政策メディア研究科〒２５２０８１６神奈川県藤沢市遠藤５３２２ [email protected] [email protected] [email protected] あらまし著作権保護の際に必要となるロバスト電子透かしの効率的な手法を提案する。本論文では、頑健な電子透かしを作成する際に、少ない埋め込み情報から多くの秘匿情報を検出する事を目標にして、非線形適応システムの入力信号として、直交変換後の係数を選択し、この位置情報を埋め込む手法について検討する。検出鍵の作成にあたっては、比較的優れた汎化能力と情報の分散表現に特長があるという理由から、階層型のニューラルネットワークを用いた。提案手法は静止画像に適用され、変更する必要のある画素数の削減と、耐性の改善についての従来手法との比較評価を行った。 Block location embedding using backpropagation after DCT for robust watermark Kensuke Naoe, Ruo Ando, Yoshiyasu Takefuji Keio University, Graduate School of Media and Governance 5322 Endo, Fujisawa, 2520816 JAPAN [email protected] [email protected] [email protected] Abstract. In this paper we propose a new watermarking method employing nonlinear adaptive system. Our system can detect the embedded code by feed-forward computing as input signal of coefficients of a DCT block. In generating key, we applied supervised learning process of neural networks that takes advantages in interpolation and fault-tolerance for damaged input signal. For achieving robustness of watermarking, experimental results is presented to validate that our model is more functional compared with the previous Huffman coding method after frequency transformation because location information embedding requires the modification of only 2 pixels for the following detection of possibly more than 1 byte code. Proposal method is tested and evaluated in a still image watermark system. 1. 電子透かしの用途と分類近年マルチメディアデジタルコンテンツの作成が極めて容易になり、またインターネットの普及によりこれらのデジタルコンテンツを公開することが可能になってきた。しかしこれらのコンテンツが著作者の意図しない所で一人歩きするケースが起こっている。デジタルコンテンツは品質が優れているにもかかわらず、いくらコピーをしても品質が劣化せず、取り扱いが簡単という特徴があるため現実では他人の著作物を平然と複製し利用されるという危険を常に抱えている。デジタルコンテンツの配布に関しては、性悪説で物事を考える必要があり、悪意の第三者が著作者の断りなく悪用した場合に法的手続きをとるためにも証拠として電子透かしをコンテンツに忍ばせる必要がある。コンテンツビジネスの発展要件しては、著作権の保護、主張、正当な課金、不正コピーの防止などがあり、電子透かしの技術を用いることで、各自のコンテンツに署名を埋め込んでから作品を安全に公開するようになることが想定される。電子透かしのデジタルコンテンツへの埋め込みは、そのコンテンツの不正コピーの抑止力として働くとしても、不正コピー自身を防止する事はできないという点から、電子透かしの用途は著作権の主張、保護、本物であることの証明、秘密通信、改ざん検知などになる。著作権の保護については、以下のような用途が検討されている。 [1] コンテンツの著作権を主張するために電子透かしを入れておく利用方法。不正コピーに対しては抑止力として作用。 [2] 不正利用された場合現場を発見する必要がある。それを補助する機能として不正利用コンテンツを探索するシステムを利用。例）特定の URL を指定して探索するシステムや、自動的にすべての URL に対してロボット型探索を行い、検査するシステム。 [3] 利用者を特定するためのデジタル指紋ユーザから購入希望があった場合、例えばユーザ情報などを電子すかし入りコンテンツに追記することでユーザ情報が記述されたデジタルコンテンツがユーザに届くシステム。 [4] 配信システムへの応用:例として音楽に透かしを埋め込みそれを暗号化したものを配信コンテンツサーバに格納する方法がある。利用側は暗号を複合化しコンテンツを利用。このコンテンツにはすかしが入っているため不正配布にも対応できる。１．１目的別分類インフォメーションハイディングは、その用途によって、ウォーターマーキング、フィンガープリンティング、ステガノグラフィに分けることができる。本論文ではウォーターマーキングを扱うが、ウォーターマーキングにはフラジャイルウォーターマーキングとロバストウォーターマーキングがある。フラジャイルウォーターマーキングとは主に改ざん検知のための電子透かしに用いられるアルゴリズムで、電子透かしの入ったメディアに簡単な処理を施しただけで透かしの一部または全部が消えるような仕組みのことである。またある一定の閾値を超える改ざんが行なわれて初めて透かしが消えるという仕組みのものもあり、それはセミフラジャイルウォーターマーキングと呼ばれる。ロバストウォーターマーキングは透かしに対して非常に複雑な処理を施しても耐えうる仕組みを持ったアルゴリズムを持つ電子透かしのことである。透かしの除去を防ぐことに最大の目的がある。このため主に著作権管理情報用の電子透かしなどで用いられることが多い。１．２手法別分類電子透かしとは通常では人間が知覚できないが、コンテンツに対して特定の操作を行うと秘匿された情報を検出できる手法を指す。そのため、近年 HVS（Human Visual System）の仕組みを援用した電子透かしが採用されている。人間の視覚システムの複雑かつ精巧な仕組みを模倣して、特徴抽出やパターン認識、そして電子透かしに援用する試みが行われている。最近の心理実験によれば、人間の視覚皮質は各周波数領域に対応して分割されており、これにより脳はスペクトラムを知覚可能なチャンネルに分解するとしている[3]。それ以前の感知の段階として、輝度が極端に変化する箇所や、高周波の領域に電子透かしを埋め込む手法も、HVS ウォーターマーキングに分類される。電子透かしを埋め込む領域としては、画像とビットプレーンに分解してから埋め込む方法と、周波数領域に変換してから埋め込む方法がある。また、個々のコンテンツに特有な冗長度、局所性などを解析し、適応的な電子透かしを行う研究も行われている。ウェーブレット変換を利用した電子透かしはここに分類されることがある。このコンテンツ適応型の電子透かしは対象の特徴を抽出することを意味し、クラスタリングなどの手法を適用した研究も行われている。２２．１埋め込みプロセスＩコンテナとなる画像と周波数変換し、比較的フィルタの影響のかかりにくい中間領域に位置情報を埋め込む。次に、検出のために、位置情報で指定されたブロックの係数を入力信号、秘匿するビット列を教師信号として、ニューラルネットワークに学習を行う。２．２埋め込みプロセスＩＩ非対称電子透かしとは、埋め込みの際に用いた鍵から、なんらかの変換処理を行って、検出用の鍵（公開鍵）を作成することであるが、ここでは、入力信号を選択したブロックの係数の値、教師信号を秘匿する情報のビット列として、学習が終了した時点の結合係数を検出用の公開鍵とする。なお、復元時に埋め込み時の情報がすべて利用されるため、同手法は厳密な意味での非対称電子透かしではない。提案手法前節で述べたとおり、本論文では、周波数領域にロバストな電子透かしを埋め込むことを目標とする。著作権保護の際に必要となるロバスト電子透かしについての需要が高まっている。本論文では、頑健な電子透かしを作成する際に、少ない埋め込み情報から多くの秘匿情報を検出する事を目標にして、非線形適応システムの入力信号として、直交周波数変換後の係数を選択し、この位置情報を埋め込む手法を提案する。提案手法は静止画像に適用され、変更する必要のある画素数の削減と、耐性の改善についての従来手法との比較評価を行った。埋め込みプロセスは、位置情報の埋め込みと鍵の生成、検出プロセスは位置情報の検出とメッセージの復元といったそれぞれ２つの手順を踏む。検出プロセスは、埋め込み位置情報の検出、秘匿情報の復元の２つに分かれる。２．３検出プロセスＩ提案手法では、秘匿された情報は非線形適応システムの出力信号として復元される。そのため、検出プロセスではまずシステムが処理する入力信号をコンテナから得ることが必要になる。２・４検出プロセスＩＩ検出プロセスの第２番目は、ニューラルネットワークの認識手順における前進処理にあたる。対象となるコンテンツに多少のフィルタがかかっていた場合でも、非線形適応システムの汎化能力と学習データの分散表現により、適切な復元を行うことができる。３適応信号処理３．１適応信号処理とは現在、電子透かしに関わらず、適応性をもつシステムがさまざまな分野で適用されている。とりわけ、現在の情報通信システムには適応信号処理が不可欠な手法となっている。適応信号処理とは、可変システムでの信号処理の過程において、システムの特性が変換させる処理のことである。ここで最適化のために適用されることの多い最小自乗法は、誤差信号の二乗を最小化するようにシステムの構造を順次的に修正していくアルゴリズムである。適応信号処理の特徴として、根幹となる構造に加え、アルゴリズム、パラメータが可変であり、これらの設定が性能に大きく寄与する。また、膨大な回数の繰り返しをおこなうため、基本的にソフトウェア処理が適する。本論文では、適応信号処理の手法としての最急降下法をニューラルネットワークモデルに適用した逆誤差伝播法（バックプロパゲーション）を用いた。３．２バックプロパゲーションニューラルネットワークは、一般に非線形適応システムと言われる。階層型ニューラルネットワークモデルは、その数理的定式化が簡素であると同時に、層の数やニューロンの連結関数を比較的容易に調整することができる。これにより、表現能力の高い非線形関数を実現できることが特徴である。バックプロパゲーションに関わらず、階層型ニューラルネットワークは学習、汎化、並列処理の３つの機能を持っている。特に、階層型ニューラルネットワークの汎化機能が応用分野においては重要となる。２ノイズへの耐性：ニューラルネットワークの順伝播学習は、基本的に計算コストがかかり、ローカルミニマムに陥る問題があるが、その強力な汎化能力により、雑音がある程度加わったパターンに対しても、正しい応答を出力する。３誤り訂正と補完性：学習の過程で情報が多数のニューロンに分散され、各々が最終出力応答に影響を与える構造になっているため、入力情報や各ユニットがダメージをうけていても補完的に適切な信号を出力することができる。任意の入力信号に対して、学習ずみの入力パターンの中から類似するものを探しだすことは、想起可能なすべての入力パターンをネットワークに与えなくとも、代表的なパターンのみを学習させれば適切な応答を行うようになることを意味する。電子透かしでいえば、任意に選択したコンテンツデータの数値が学習させることで、適切な秘匿情報を検出できることが想定される。上述したシンプルなモデルを使うと、学習が２回以内になり従来の方法に比べ高速に完了する。４実験結果以上述べてきた、提案手法の評価分析のために簡単な透かし埋め込みと検出のための実験を行った。画像データは２５６＊２５６画素数の任意に選択したものを用い、離散コサイン変換を行い、複数のブロックから構成される係数行列を構成した後、任意のブロックを選択し、中間領域に入力信号となる係数のあるブロッ１追加学習性：逆誤差伝播法は入力信号として連続値をとり、パターン認識として離散的な応答をするため、閾値を設ける必要がある。また、学習が収束することを要求しないアルゴリズムであるため、以前の訓練によって獲得した知識の損失を避けながら、新しい学習パターンを処理することができる。クの位置情報を埋め込んだ。図１は、埋め込まれた位置情報が変更されなかった場合の、ＤＣＴ係数を入力信号としたニューラルネットワークの認識率である。ニューラルネットワークは基本的に連続値の演算なので閾値を設けてビット列を復元する必要があるが、本実験では概ね高い認識率を示した。が学習の過程で分散して表現されるようになるため、入力信号にノイズが加わっても適切な応答することになる。実験では、フィルタによって、離散コサイン後の係数は変化したが、位置情報そのものは変化しないケースでは、認識率に多少の差はあるものの同じビット列を検出できることがあきらかになった。１バイトコードの検出 0.25 0.2 0.15 0.1 0.05 0 1 2 3 4 5 6 7 8 出力信号１バイトコードの検出図 1. 検出結果１ 1 0.8 0.6 0.4 １バイトコードの検出 0.2 1.2 0 1 1 2 3 0.8 4 5 出力信号 6 7 8 0.6 図 3. 検出結果３ 0.4 0.2 ５ 0 1 2 3 4 5 出力信号 6 7 8 まとめと今後の課題本論文ではロバスト電子透かしを扱った。階層型ニューラルネットワークの持つノイズへの耐性と学習仮定での情報の分散的な図 2. 検出結果２波及などの特徴に着目し、周波数変換を行っ図２は、意図的に埋め込み情報に変更を加え、た後に学習によって検出用の鍵を作成し、位置情報を埋め込む手法による電子透かしの任意のＤＣＴブロックの係数値を入力信号と耐性評価を行った。バックプロパゲーションしてニューラルネットワークに認識させた場合の出力である。電子透かしへの改ざんとして、は入力信号を処理処理することにより内部ニューロン群にエンコードされるパターン復号時のルールに基づいて画素値を変更するを検出することにより、汎化能力に優れる。という手法があるが、提案手法では、埋め込み今回は、ＤＣＴで作成されたブロックの内特に用いた情報が復元時にもすべて参照されが、徴が顕著に出ているものを１つ選び埋め込検出用に用いる鍵を共有するため、検出鍵に対みと検出を行ったが、今後さまざまなコンテする改ざんがない限り、画素値の変更によってンツを対象とし、提案手法を従来手法と比較任意に秘匿情報を他の有意のものに書き換え検討し、本論文で指摘した特徴の実証を更にることができないことが実験結果から実証さ行う必要がある。また、汎化という観点でいれた。えば、クラスタごとの汎化を均一に強化するＳＶＭ（サポートベクトルマシン）や、ＲＢ図３は、フィルタ後の出力である。階層型Ｆネットワークの適用を検討する必要があニューラルネットワークの汎化能力と情報 Trans. on Image る。また、現在指摘されているコンテンツレ pp.1673-1687,. コーダによるストリーミングコンテンツの複製に関して、動画像処理への電子透かしを、非線形適応システムを用いて行う予定である。文献 [1]松井甲子雄, 電子透かしの基礎, 森北出版, 1998 [2] E. M. Johansson, F. U. Dowla and D. M. Goodman, “Backpropagation Learning for Multilayer Feed-forward Neural Networks using the Conjugate Gradient Method'', Int. J. Neur. Syst. 2, 291 (1992). [3] Daugman, J.G. High confidence visual recognition of persons by a test of statistical independence. IEEE Trans. Pattern Anal. and Machine Intell. 15, 11 (1993)1148-1161. [4] Barni, F. Bartolini, V. Cappellini, A. Piva, "A DCT-domain System for robust image watermarking”, Signal Processing, Vol. 66, No. 3, 1998,pp. 357-372. [5]C.Podilchuk and W. Zeng, “Image-adaptive watermarking using visual models,” IEEE Journal on Selected Areas in Communications. vol. 10, no. 4, 1998,pp. 525-540. [6]Ki-Ryong Kwon, Seong Geun Kwon, Jeho Nam, Ahmed H. Tewfik, “Content adaptive watermark embedding in the multiwavelet transform using a stochastic image model”, IWDW2002, 2002, pp.249-263 [7]D. Kundur and D. Hatzinakos, “A robust digital image watermarking scheme using wavelet-based fusion”, Proc. ICIP-97, Vol. 1, 1997,pp. 544-547. [8]I.J. Cox, J. Kilian, T. Leighton and T. Shamoon,”Secure spread spectrum watermarking for multimedia, IEEE Processing, 1997,