ランレングス・ハフマン符号化

JPEGのDCT係数のAC部分
†
値の特徴
„
„
量子化により、数値の範囲は狭くなっている。
0の連続が多い。
†
ランレングス・ハフマン符号化で圧縮
†
22 7 -1 -6 8 2-2 1 3 -1 -1 -2 -2 1 0 0 0 1 0 0 0 0
0 0 ・・・
ランレングス・ハフマン符号化
例
†
ハフマン符号化
0, 1, 2, 3 のいずれかの値が並んだ列
0 3 1 0 0 0 0 0 1 2 1 0 0 0 1 1 0 0 0 2
†
出現確率の例
„
„
†
„
2ビットの2進符号化
00 11 01 00 00 00 00 00 01 10 01 01 00 00 00 10
平均符号長=2
„
†
„
„
„
„
†
†
„
0の連続をランという。
„
ランの長さをラン長あるいは零ラン長という。
1
1
1
ハフマン木
0 111 10 0 0 0 0 0 10 110 10 0 0 0 10 10 0 0 0 110
平均符号長=1x0.6 + 2x0.25 + 3x0.1 + 3x0.05 = 1.55
ラン長=5
13個の組み合わせで符号を表現
03100000121000110002
03100000121000110002
†
0
10
110
111
0
0
0
ランレングス符号化(2)
ラン
ラン長=1
0
1
2
3
0
1
2
3
ハフマン符号化
„
ランレングス符号化
0.6
0.25
0.1
0.05
ハフマン符号
„
†
0
1
2
3
03 1 0000 01 2 1 0001 1 0002
†
これらの13種の組み合わせに符号を対応付ける。
零ラン長が4までのものを考えると次の13個の組み合わせ
„
„
„
„
„
零ラン長=0
零ラン長=1
零ラン長=2
零ラン長=3
零ラン長=4
1,2,3
01、02、03
001、002、003
0001、0002、0003
0000
1
ランレングス・ハフマン符号化
†
出現確率
„
13種類の組み合わせの出現確率を求め、ハフマン符号化
する。
†
†
出現確率は0,1,2,3の出現確率から計算
零ラン長=0
1、2、3
„
„
†
†
†
†
†
†
†
p(1)= 0.25
p(2)=0.1
p(3)=0.05
零ラン長=1
„
零ラン長=2
„
零ラン長=3
†
†
01、02、03
†
p(01)=p(0)p(1)=0.6x0.25=0.15
p(02)=p(0)p(2)=0.6x0.1=0.06
p(03)=p(0)p(3)=0.6x0.05=0.03
„
0001、0002、0003
p(001)=p(0)p(0)p(0)p(1)=0.6x0.6x0.6x0.25=0.054
p(002)=p(0)p(0)p(0)p(2)=0.6x0.6x0.6x0.1=0.0216
p(003)=p(0)p(0)p(0)p(3)=0.6x0.6x0.6x0.05=0.0108
零ラン長=4
†
ハフマン木
001、002、003
p(001)=p(0)p(0)p(1)=0.6x0.6x0.25=0.09
p(002)=p(0)p(0)p(2)=0.6x0.6x0.1=0.036
p(003)=p(0)p(0)p(3)=0.6x0.6x0.05=0.018
0000
p(003)=p(0)p(0)p(0)p(0)=0.6x0.6x0.6x0.6=0.01296
ランレングス・ハフマン符号
1
0
0
0000
001
2
02
002
零ラン長
1
01
03
2の符号
文字
0001
3
2
3
0
−
00
110
1110
1
−
010
1010
01111
2
−
0110
01110
111101
3
100
1011
11111
111100
0002
符号=1010
符号=01110
1
0003
002の符号
003
02の符号
ランレングス・ハフマン符号
†
13種の組み合わせをハフマン符号化
03100000121000110002
03 1 0000 01 2 1 0001 1 0002
電子透かし
01111 00 100 010 110 00 1011 00 1111
†
平均符号長≒1.501
„
ハフマン符号化よりも短い。
2
デジタル化の著作物の著作権
†
†
†
†
電子透かし
1996年にWIPO(World Intellectual Property Organization)に
よってベルヌ条約が改正され、ネットワーク上の画像・映像
情報についても著作権が公式に認められた。
著作物の利用・複製は、著作権者の承諾が必要
デジタルデータは全く同質なコピーを生成したり、修正・加
工も容易に行えるので、その保護技術が重要
著作権保護技術
„
„
コピー防止技術
†
DVD(CSS - Content Scrambling System)
†
コピーコントロールCD
†
ソフトウェアのコピープロテクト
著作権者の証明技術
†
電子すかし
JPEGのDCT係数(復習)
†
画像や音声情報に、著作権者の情報などを埋め込
む技術
JPEGのための電子透かし
†
AC係数の一つに透かし情報を
埋め込む。
„
„
„
†
†
8x8ピクセルのブロックごとに8x8のDCT係数が計算され
る。
ジグザグスキャンされた63個のAC係数
„
AC(k) k=1,63
各ブロックのp番目のAC係数
AC(p)に着目し、その値を、埋め
込むバイナリデータのビットにあ
わせて、0または1に置き換える。
pは定数で、全てのブロックに対し
同じ位置のAC係数を置き換える。
埋め込む位置pの決定には、デー
タ埋め込み後の、画像劣化を回
避し、画像データの増加を抑える
位置がよいが、図では(p=63)の
場合を示している。
量子化テーブルの書き換え
†
一般に符号化の際に使用した量子化テーブルをそのまま
復号側で使用するが、透かしを埋め込んだ場合、復号側で
は、情報を埋め込んだ場所pに相当する量子化テーブルの
値を1に置き換える。
„
„
†
動画の圧縮
復号側では、これによって情報が埋め込まれた位置pを特
定することができる。
„
†
透かし処理をせずにそのまま復号する際には、逆量子化の過程で、
AC(p)の値に、場所pに相当する量子化テーブルの値が乗じられる
ので、最小値の1とする。(量子化テーブルの値は、量子化間隔な
ので0にはできない。)
情報を強制的に置き換えたために発生するノイズの影響を押さえる
ためである。
つまり、量子化テーブルの値が1の場所をpとし、AC(p)を参照する
ことで、埋め込んだ情報を取り出すことができる。
復号側では、AC(p)の情報を取り出した後、AC(p)の値を0
として、復号化する。
3
動画
†
画像の列
一枚のコマをフレームという。
カラーテレビ
„
„
†
圧縮
†
NTSC
†
240x720x60
空間的な圧縮
†
時間軸に対する圧縮
„
„
„
データ量大
フレーム単独で画像を圧縮
フレーム間の相関関係を用いて圧縮
前後するフレームの画像は相関関係が強い。
2時間で約100ギガバイト
„
差分と情報量
†
†
画像の差分
前後する信号に相関関係がある場合、その差分をとると、
情報量を減らすことができる。
300
250
200
150
元信号
差分
100
50
0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97
-50
元の信号の信号地の分布よりも、差分の信号値の分布のほうが偏りが大きい。
予測
動き補償予測
†
画像を16x16ピクセルのブロックに分割
†
各ブロックにおいて、前フレームとブロックマッチングにより
動きベクトルを求める。
差分
前フレーム
„
場所によって動きが異なる。
現フレーム
予測フレーム
4
ブロックマッチングと動きベクトル
動き補償予測符号化
†
各ブロック毎に動きベクトルを求める。
„
†
†
†
動きベクトル自身も空間的に相関関係があるのでDCPMなどによっ
て圧縮できる。
ブロック毎に予測された画像を集めて、予測画像を作る。
予測画像と現フレームとの差分画像を作る。
差分画像を圧縮する。(JPEGと同様にDCT等を用いる。)
前フレーム fn-1
現フレーム fn
動きベクトル=arg min D(dx, dy ) = ∑∑ f n (i, j ) − f n−1 (i + dx, j + dy )
i
†
j
ブロックを±16ピクセルの範囲で水平方向と垂直方向に動かして差分
が最小になるベクトルを求める。
動画像の転送
双方向予測
†
送信側
入力画像
データ
ー
出力符号
データ
符号化
動き補償予測に使うフレームを、前フレームだけでなく、後
ろのフレーム(時間的に先のフレーム)も使う。
局部復号化
受信側
入力符号
データ
差分画像の
復号
出力画像
データ
+
フレーム N-1
前フレーム
画像の復号
I ピクチャー
„
†
†
I または複合済みのPピクチャから前方向の動き補償によって予測
し、差分を作り符号化
B ピクチャー
„
†
†
MPEG2
†
MPEG4
„
„
I または複合済みのPピクチャから動き補償によって双方向の予測
を行い、差分を作り符号化
„
†
B
B
P
B
B
データ転送レート1.5Mbpsまでの動画と音響を対象
データ転送レート数M〜数十Mで、放送メディアが対象
画像を物体毎に符号化できるオブジェクトベース符号化や誤り耐性
符号化を含む
MPEG7
„
I
フレーム N+1
ITU-TS(国際電気通信連合:旧CCITT)とISO(国際標準化
機構)で制定
MPEG1
†
それだけで符号化(静止画と同じ)
P ピクチャー(前方向予測符号化)
„
フレーム N
デジタル動画と音声の圧縮.伸長に関する規格
MPEG-1 (Motion Picture Expert Group)
†
後方予測
前方予測
受信側では現画像を前フレームとはできな
いので、受信側と同じように復号化した画
像を用いる。
映像コンテンツの標準記述手法
P
5