H.264 の動画圧縮規格について - 澤見ゼミ

H.264 の動画圧縮規格について
岡山理科大学
総合情報学部
澤見研究室
I02I101 野村 雄一
I02I102 羽田 慎也
目次
1. はじめに
2
2. 動画
3
3. ビットレート
4
4. 動画のデータ量
4
5. コーデック
5
5.1. H.264(MPEG-4 AVC,MPEG-4 Part 10)
6. H.264 の圧縮技術
5
6
6.1 動画圧縮の原理
6
6.1.1. 離散コサイン変換(DCT)
7
6.1.2. フレーム間予測
8
6.1.3. 動き補償
10
6.1.4. エントロピー符号化
11
6.2. H.264 の特徴
12
6.2.1. フレーム内予測
12
6.2.2. フレーム間予測
16
6.2.3. デブロッキングフィルタ
19
7. 実験
20
7.1. 画質の比較
20
7.1.1. H.264 の画質比較(720×480pixel,29.97fps,2000kbps)
20
7.1.2. H.264 の 2000kbps,1000kbps,100kbps による画質比較
23
(720×480pixel,29.97fps)
7.2. ファイルサイズ比較
26
7.2.1. H.264 のファイルサイズの比較(720×480pixel,29.97fps,2000kbps) 26
7.2.2. H.264 の 2000kbps,1000kbp,100kbps によるファイルサイズ比較
27
(720×480pixel,29.97fps)
7.2.3. H.264 の 2000kbps~5kbps によるファイルサイズ比較
28
7.2.4. 解像度による実験値と理論値(720×480pixel,29.97fps)
29
7.2.5. 解像度による実験値と理論値(620×480pixel,29.97fps)
30
7.2.6. 解像度による実験値と理論値(320×240pixel,29.97fps)
31
7.2.7. フレームレートによる実験値と理論値
32
8. 考察
33
9. まとめ
34
35
参考文献
1
1. はじめに
動画像のデータ圧縮とは,元の情報に存在する“冗長な情報”を削除して必要最小限の
情報を取り出す処理のことである.
“冗長”とは,無駄が多くて長いという意味であり,そ
れを除くことで画質を落とすことなく情報量を大幅に削除することが可能である.しかし,
動画像のデジタル処理技術が大きく発展したとしても,画像の高画質化,大画面化が進む
につれ冗長な情報を削除したとしてもデータ量が増加してくる.本研究では,最近注目さ
れている動画圧縮規格 H.264 について調べた.なお,ここでは音声については取り扱わず,
動画像のみに関して研究した.ソフトとして QuickTime7.0 のみを用いる.
2
2. 動画
動画とは,同じスクリーンに連続的に再生された静止画群のことである(図 1).簡単に
言えばパラパラ漫画である.動画になっているように見えるのは,人間の目の錯覚を利用
しているからであり,1 秒間でどれだけの静止画群で構成されているかをフレームレート
(frame per second:fps)で表す.フレームレートは,24~30fps が実用的であり,fps が
多ければ滑らかな動画になる(図 2).
図 1 静止画群と動画
図 2 フレームレート
3
3. ビットレート
ビットレートとは,単位時間あたりに何ビットのデータあるいは送受信されるかを表す.
単位として“ビット毎秒(Bits Per Second:bps)”を使うのが一般的である.ビットレー
トには,固定ビットレート(Constant Bit Rate:CBR)と可変ビットレート(Variable Bit
Rate:VBR)の 2 種類が存在する.固定ビットレートとは,エンコードするときに常に一
定のビットレートを保って圧縮する方式である.可変ビットレートとは,動きが少ないシ
ーンでビットレートを下げ,動きの多いシーンでは多くのビットレートを割り当てること
で,効率のよいエンコードを行う.ここでは,後者を用いる.
4. 動画のデータ量
データを圧縮していない場合のデータ量を計算する.データを圧縮していない場合の計
算式は,
(幅×高さ×3B)×fps×秒である.これは 1 画素 3B(byte)の場合の計算式である.
例を示すと,MPEG-2 の解像度(720×480pixel)と 30fps の場合 1 秒間の総データは,
(720×480×3B)×30×1 = 31,104,000B
となり,約 31MB になる.これが 1 時間の場合 3600 秒なので 30fps とすると総データは,
(720×480×3B)×30×3600 = 111,974,400,000B
となり,約 112GB と膨大な値になる.
4
5. コーデック
符号化と復号の機能を併せ持つ装置やソフトウェアである.本研究の対象となる H.264,
H.261,H.263,MPEG-4 について紹介する.
5.1. H.264(MPEG-4 AVC,MPEG-4 Part10)
本研究の主体である H.264 は,2003 年に ITU(国際電気通信連合)よって勧告された動
画データの圧縮符号化方式のひとつである.最近では,ソニーの携帯ゲーム機“PSP”,次
世代 DVD の“HD DVD”や“Blu-ray Disc”などに用いられている.また,携帯電話のテ
レビ電話の低速,低画質の用途からハイビジョンテレビ放送などの大容量・高画質の動画
まで幅広く用いられている.
符号化の方式は,動き補償,整数制度 DCT 変換,エントロピー符号化などに様々な工夫
を加えているため,処理時間が長い.
5
6. H.264 の圧縮技術
H.264 に使用されている圧縮技術について紹介する.
6.1. 動画圧縮の原理
一般に,動画像信号には,空間方向と時間方向とも近傍画素間に高い相関がある.この
画素間での予測を行うことにより,符号化すべき情報量を削減することができる.空間方
向の相関を利用し,冗長度を削減するのが直交変換である.直交変換の代表的なものとし
て離散コサイン変換があげられる.また,時間方向の相関を利用し,冗長度を削減するの
がフレーム間予測と呼ばれる.
以上の予測や変換によって信号を偏らせた後,量子化によっていくつかの代表値で近似
することによって情報圧縮がなされる.また,そのデータの発生頻度に応じた符号長を割
り当てる可変長符号化を使うことによって,さらに情報圧縮が可能となる.
近年での動画像圧縮符号化は動き補償フレーム間予測(Motion Compensation:MC)と
離散コサイン変換(Discrete Cosine Transform:DCT)にエントロピー符号化を組み合わ
せたハイブリッド符号化によって圧縮されている(図 3).
符号量制御
画像入力
DCT
エントロピー
量子化
符号化
逆量子化
逆 DCT
動き補償
メモリ
動き検出
図 3 MC +DCT ハイブリッド符号化
6
ビット
ストリーム
6.1.1. 離散コサイン変換(Discrete Cosine Transform:DCT)
離散コサイン変換とは,入力されるアナログの元画像を,低周波や高周波などの周波数
成分に分解する仕組みをもっている変換技術である.画面中の画素領域を周波数領域に変
換し,これによって元画像を圧縮しやすくしている.一般に,人間の眼の視覚特性は,低
周波成分に敏感であり,高周波成分には鈍感であるため,このような特性を利用するうえ
で,離散コサイン変換が最も利用される(図 4).
図 4 DCT 変換の仕組み
変換処理として,自然画像から 8 画素×8 ラインのブロックを取り出す.そして下記の式
を使うことによって DCT 変換処理を行う.変換前の画素ブロックの画素値を f ( x, y ) とす
ると次式で与えられる.
7
7
1
⎡ (2 x + 1)uπ ⎤
⎡ (2 y + 1)vπ ⎤
F (u, v) = C (u )C (v)∑∑ f ( x, y ) cos ⎢
cos
⎥
⎢
⎥
16
16
4
⎣
⎦
⎣
⎦
x =0 y =0
ただし
⎧ 1
(u, v = 0)
⎪
C (u )C (v) = ⎨ 2
⎪1(u, v ≠ 0)
⎩
7
変換により得られる F (u , v) を DCT 係数とよぶ.図に示すように,DCT 係数は直流(DC:
Direct Current)成分と交流(AC:Alternate Current)成分から構成されており,左上の
一つだけが DC 成分で,他の 63 個が AC 成分となっている.左上から右および下にいくほ
ど高い周波数成分となっている.
自然画像は,なだらかであり,変化が少ないので高周波成分はあまり含まれていない.
そこで,AC 係数のなかでも高周波成分に相当する AC 係数を削除し,情報を圧縮すること
ができる.
6.1.2. フレーム間予測
フレーム間予測とは,異なる時刻のフレームに基づいて予測画像を生成し,入力画像と
予測画像の差分画像を符号化する方式である.
動画像において連続するフレームは人間の目にはわからないほど似ている.動画像を圧
縮する場合は,このような隣り合ったフレームが似ている仕組みを利用する.
なお,フレーム間予測では,時間的に前のフレームから予測する方法(前方向予測)だ
けではなく,後のフレームから予測する方法(後方向予測)や前後のフレームから予測す
る方法(双方向予測)がある.一般に予測する方法によって三つのピクチャタイプがある
(図 5).
符号化フレーム
参照フレーム
非参照フレーム
後方
予測なし
前方
前方
予測
予測
時間
(1)
I ピクチャ
時間
(2)
P ピクチャ
図 5 予測モードとフレームタイプ
8
予測
時間
(3)
B ピクチャ
(1)Iピクチャ(Intra Picture)
Iピクチャとは,前後のフレームとは関係なくそのフレーム内だけで独立して符号化す
ることによって得られるピクチャのことである.時間方向の動き予測を行うことはなく,
フレーム内の情報のみを用いて符号化処理を行う.
(2)Pピクチャ(Predictive Picture)
Pピクチャとは,フレーム間の前方向予測符号化によって得られるピクチャのことであ
る.IピクチャもしくはPピクチャを予測画像として,フレーム間予測を用いて符号化処
理が行われる.Pピクチャは,ほかのフレームに依存し,独立には複合化できないが,I ピ
クチャにくらべ圧縮率の向上が期待できる.
(3)Bピクチャ(Bi directional Predictive Picture)
Bピクチャとは,過去と未来の双方向からの予測符号化によって得られるピクチャのこ
とである.IピクチャもしくはPピクチャを予測画像として,時間軸上で,予測するピク
チャより過去もしくは未来,またはその両方からの双方向予測が可能である.Bピクチャ
は,独立には複合化できず,フレームの遅延も生ずるが,I,Pピクチャとくらべ圧縮率
の向上が期待できる.
また,フレーム間予測では,より高い圧縮率を実現するために動き補償と呼ばれる技術
が同時に用いられる.
9
6.1.3. 動き補償(Motion Compensation:MC)
二つの連続したフレームで形の変わらない物体が動く場合,動いた方向と動き量を知る
ことができれば,物体の形に関する情報は既知であるため正確な予測画像を作ることがで
き,効率のよいフレーム間予測が可能になる.この動いた方向と動き量をベクトルデータ
で示し,圧縮する際にこのベクトルデータを検出し,転送するデータと残り差分を含める.
また,伸張する際には,ベクトルデータと差分データを合成し,元の画像を再現すること
になる.物体の動きをベクトルデータという形で効率よく差し引くことによって,差分デ
ータはベクトルデータを無視した場合の差分データより極端に少なくてすみ,高い圧縮率
を得ることが可能である.これが動き補償の技術である(図 6).
過去
現在
未来
動きベクトル
動きベクトル
予測フレーム
MC
MC
前方向MC予測
双方向MC予測
図 6 動き補償(MC)の例
10
6.1.4. エントロピー符号化(可変長符号化)
エントロピー符号化とは,出現頻度の高い値には短い符号を割り振り,出現頻度の低い
値には長い符号を割り振る符号化である.予測や変換処理した結果は,何らかの値を示す
数字で表されている.それらの中には頻繁に現れる値もあれば,たまにしか現れない値も
ある.これらの偏りを利用し,平均的な符号長を短くして,圧縮率を上げることができる.
例えば,A,B,C,D という文字の出現確率が等しいときには,一定の符号長で符号化
を行う固定長符合化で行い,00,01,10,11 の 2 桁の符号にしておけば,平均符号長は 2
ビットになる.ところが,表で示すように出現確率に違いがあった場合,可変長符号化で
行うと、最も出現確率が高い A に 1 ビット符号‘0’,2 番目に高い B には 2 ビット符号‘01’,
最も低い C と D は 3 ビット符号‘011,111’を割り当てることになる.このとき,平均符
号長は以下のようになる(表 1).
表 1 可変長符号化の例
登場する文字
出現確率
符号
符号長
A
0.5
0
1
B
0.3
01
2
C
0.1
011
3
D
0.1
111
3
(1)固定長符号化(常に一定の符号長)
平均符号長=0.5×2+0.3×2+0.1×2+0.1×2=2 ビット
(2)可変長符号化(状況に応じて符号長を変化)
平均符号長=0.5×1+0.3×2+0.1×3+0.1×3=1.7 ビット
出現する文字に対し,固定長符号化の場合では合計 2 ビットであるのに比べ,可変長符
号化の場合では 1.7 ビットと 15%もビット数が少なくてすみ,圧縮効果を高めることがで
きることがわかる.
11
6.2. H.264 の特徴
H.264 自体は従来の MPEG と同様,動き補償フレーム間予測と離散コサイン変換にエン
トロピー符号化を組み合わせたハイブリッド符号化で構成されている.低レートや低解像
度での符号化時において符号化効率向上の効果は特に大きく,既存の MPEG-2/4 などでは
ブロックノイズが多く発生するようなビットレートであっても,ブロックノイズの見えに
くい画像に符号化処理することが可能である.これは,可変ブロックサイズ動き補償予測,
ループ内デブロッキングフィルタなど,従来処理量が大きかったり処理が複雑であったり
することから標準には採用されなかった符号化ツールを採用した部分が大きく影響を与え
ている.
6.2.1. フレーム内予測
フレーム内の予測処理として,MPEG-2/4 では周波数領域(DCT 係数)上の予測を行い
符号量の削減を図っているが,H.264 では空間領域(画素領域)上での予測を行い符号量
の削減を図っている.MPEG-2/4 で採用されている周波数領域上での予測は少ない演算量
で処理ができるように構成されているが,H.264 で採用されている空間領域上での予測は,
多くの演算量を必要とするが,さまざまな手法を採用しているため高い予測効率を得るこ
とが可能である.
H.264 では,輝度信号に対しては 2 種類の予測方式が定められており,そのうちの一方
をマクロブロック単位に選択できる.色差信号に対しては 1 種類の予測方式が定められて
いる.それぞれの予測方式ごとに複数のモードが設けられている.
12
(1)16×16 予測
輝度信号 16×16 画素ブロックを一度に予測する方式であり,図に示す 4 通りのモードの
いずれかをマクロブロック単位に選択する.画面の上端や左端のマクロブロックにおいて
は画面内に位置する画素のみを使用し,画面外からの予測処理は行わない.
垂直に予測をするモード 0,水平に予測をするモード 1,上ブロックと左ブロックの合計
32 画素の平均値を予測値として予測をするモード 2,上ブロックの画素と左ブロックの画
素を斜め方向に画素値を内挿し予測値とするモード 3 の 4 通りの予測方法から 1 通りを選
択して予測する.
4×4 予測と比べ,予測方向の符号化に必要なビット数が少ないため,青空などのような
平坦な画像部分で大幅な圧縮が期待できる(図 7).
図 7 16×16 予測
13
(2)4×4 予測
マクロブロック内の輝度信号 16×16 画素ブロックを 4×4 画素ブロックで構成される 16
個のブロックに分割し,図に示す 9 通りのモードのいずれかをブロック単位に選択する.
画面の上端や左端であったり,復号処理をまだ終えていない画素については予測に使用で
きない.
4×4 予測のモード情報は,一つのマクロブロック当り 16 個必要となる.モード情報その
ものの符号量を削減するために,モード情報そのものは隣接するブロック間との相関が高
いことを利用して,隣接するブロックのモード情報から予測処理を行っている.4×4 予測
は予測処理の単位が小さいため,複雑な画像に対しても比較的効率の高い予測効果が得ら
れる(図 8).
図 8 4×4 予測
14
(3)色差信号の予測
色差信号の予測は,マクロブロック内の 8 画素×8 ラインに対して,図に示す 4 つのモー
ドのいずれかを選択して行う.予測方向は,輝度信号の 16×16 画素単位の予測と同様に,
平均値予測,水平予測,垂直予測,平面予測の 4 通りである.モード 3 の平面予測や,モ
ード 0 の平均値予測の計算方法も,ブロックの大きさが 16 画素か 8 画素の違いを除けば,
16×16 画素単位の予測と同じである(図 9).
図 9 色差信号の予測
15
6.2.2. フレーム間予測
動き補償フレーム間予測符号化という意味では,従来の MPEG-2/4 などと同じ技術であ
るが,H.264 ではより多くのモードと複雑な演算処理を採用することにより,予測効率を
高めている.
(1)可変ブロックサイズ動き補償予測
H.264 では,16×16 画素から 4×4 画素の 7 通りの動き補償ブロックサイズが用意され
ている.このブロックサイズは,図で示すようにマクロブロック単位とサブマクロブロッ
ク単位の 2 つに分けて階層的に示される.まず,マクロブロックごとに 16×16 画素,16
×8 画素,8×16 画素,8×8 画素のいずれかを選択し,8×8 が選択されている場合にはサ
ブマクロブロックごとに 8×8 画素,8×4 画素,4×8 画素,4×4 画素のいずれかを選択す
る.
図 10 動き補償予測のブロックサイズ
16
(2)複数参照フレーム予測
これまでのフレーム間予測では,動き補償予測の参照に使用できるフレームは,P ピクチ
ャの場合は過去の 1 フレームのみ,Bピクチャの場合は過去と未来の 1 フレームのみであ
り,かつBピクチャを参照できないなどの制限があった.
しかし,H.264 では過去,未来の複数のフレームをメモリ内に蓄えておき,蓄えられて
いる複数あるフレームの中から選択できる仕組みがとられている.複数の参照フレームを
持つことによって,シーンチェンジや移動物体を考慮してより前のフレームを参照フレー
ムとして指定することが可能となっている.また,B フレームについては未来方向のフレー
ムを使わずに過去の 2 フレームを参照フレームとして指定したり,別の B フレームを参照
フレームとして指定したりすることが可能となっている.
17
(3)重み付け予測
重み付け予測とは,画像の明るさを予測する処理である.従来の動画像符号化方式は,
動き補償によって画像の動きを予測する仕組みはあったものの,画像の明るさを予測する
仕組みはなかった.このため,明るさが時間的に変化する画像で,符号化画像の品質が大
幅に劣化する原因となっていた.そこで H.264 では,複数の参照フレームに対して明るさ
に関する重み係数を掛けた信号を予測に用いることで,この問題を解決している.H.264
の重み付け予測の様子を下の図に示す(図 11,図 12).
ピクチャ X
ピクチャ Y
ピクチャ Z
図 11 フェード画像(明るさが時間的に変化)
明るさ
ノイズ
従来の
Y
方式
予測(Y)
Z
符号化済み
符号化対象
ピクチャ
ピクチャ
時間
予測(WX×X+WY×Y+D)
明るさ
X,Y:予測信号
H.264
X
WX,WY,D:重み係数
Y
Z
符号化済み
符号化対象
ピクチャ
ピクチャ
図 12 重み付け予測の特徴
18
時間
6.2.3. デブロッキングフィルタ
デブロッキングフィルタとは,画像の符号化字に生じるブロックの境界の歪みを減少さ
せるためのフィルタである.H.264 では,このデブロッキングフィルタがループ内フィル
タとして符号化ループに組み込まれている.メリットとしては,ブロックノイズの除去さ
れた画像を参照画像として用いることができる点である.参照画像からブロックノイズが
除去されることにより,動き補償予測による予測誤差からブロックノイズの影響が除かれ,
符号化効率が向上する.
19
7. 実験
ビデオカメラで撮影した動画を標準動画(720×480pixel,29.97fps)として,H.264 の
画質の比較とファイルサイズの比較について実験を行う.
7.1. 画質の比較
H.264 の画質について調べてみる.
7.1.1. H.264 の画質比較
標準動画(図 13)をもとに,H.264(図 14),H.263(図 15),H.261(図 16),MPEG-4(図
17)で圧縮した動画(720×480pixel,29.97fps,2000kbps,10 秒)の画質を比較する.
図 13 標準動画
(720×480pixel,29.97fps,2000kbps)
20
図 14 H.264
(720×480pixel,29.97fps,2000kbps)
図 15 H.263
(720×480pixel,29.97fps,2000kbps)
21
図 16 H.261
図 17 MEPG-4
(720×480pixel,29.97fps,2000kbps)
(720×480pixel,29.97fps,2000kbps)
22
7.1.2 H.264 の 2000kbps,1000kbps,100kbps による画質比較
次に H.264 のビットレートを 2000kbps(図 14),1000kbps(図 18),100kbps(図 19)
による圧縮動画(720×480pixel,29.97fps)の画質を比較する.
図 18 H.264
(720×480pixel,29.97fps,1000kbps)
23
図 19 H.264
(720×480pixel,29.97fps,100kbps)
24
圧縮した画質を比較した結果,H.264 は他の動画に比べて全体的に色が薄くなっている.
そこで色が薄くなる原因について調べてみた.標準動画と H.264 のテレビ信号の明度で現
すと H.264 の黒レベルの基準が高いことが判明した(図 20,図 21).標準動画の黒レベル
の基準が約 5IRE に対して H.264 の基準は約 11IRE である.黒レベルが高いと色が鮮やかに
なり,黒レベルが低いと黒くなります.つまり H.264 の黒レベルを下げれば標準動画のよ
うな明度になると考えられます.
図 20 標準動画の明度
図 21 H.264 の明度
25
7.2. ファイルサイズの比較
画質の比較に続いて,H.264 のファイルサイズについて比較する.
7.2.1. H.264 のファイルサイズ比較
標準動画をもとに,MPEG-4,H.261,H.263,H.264 で圧縮した動画(720×480pixel,29.97fps,
2000kbps)のパラメータによるファイルサイズを比較する(図 22).H.264 の圧縮率が高い
のがわかる.
(KB)
350,000
720×480pixel,29.97fps,2000kbps
303,763
300,000
250,000
200,000
150,000
100,000
50,000
0
16,642
標準動画 MPEG-4
10,726
H.261
6,685
H.263
ファイルサイズ
図 22 ファイルサイズ
26
3,202
H.264
規格
7.2.2. H.264 の 2000kbps,1000kbps,100kbps によるファイルサイズ比較
更にビットレートを 2000kbps,1000kbps,100kbps による動画(720×480pixel,
29.97fps)のファイルサイズを比較する(図 23).ビットレートが下がるとそれに比例して
ファイルサイズも減る.
720×480pixel,29.97fps
(KB)
350,000
303,763
300,000
250,000
200,000
150,000
16,642
100,000
3,202
6,685
1,649
6,685
10,667
1,296
6,250
8,161
10,726
15,783
50,000
0
7,947
標準動画
MPEG-4
2000kbps
H.261
1000kbps
H.263
100kbps
図 23 ビットレートによるファイルサイズ
27
H.264
規格
7.2.3. H.264 の 2000kbps~5kbps によるファイルサイズ比較
次にビットレートを細かく指定し,ファイルサイズを比較する(図 24).やはりビットレ
ートが下がるとファイルサイズが減る.しかし 900kbps 以降ファイルサイズにあまり変化
が見られない.
H.264 (720×480pixel,29.97fps)
(KB)
3,500 3,202
3,000
2,415
2,500
1,422
1,394
1,649
1,296
1,386
1,386
1,498
1,405
1,389
1,386
1,296
1,296
2,000
1,500
1,000
500
28
5
図 24 ビットレートによるファイルサイズ
10
ファイルサイズ
100
200
300
400
500
600
700
800
900
1000
1500
2000
0
(kbps)
7.2.4. 解像度による実験値と理論値(720×480pixel,29.97fps)
実際に H.264 で圧縮した実験値と 2000kbps を基準に理論値を求め比較する(表 2,図
25).理論値を求める際,小数点は四捨五入する.結果 900kbps 以降実験値と理論値の差が
現れていて,その差はビットレートが下がるにつれて大きくなる.
表 2 実験値と理論値(720×480pixel,29.97fps)
ビットレート
実験値
理論値
ビットレート
実験値
理論値
2000kbps
3,202
3,202
500kbps
1,389
800
1500kbps
2,415
2,400
400kbps
1,386
640
1000kbps
1,649
1,600
300kbps
1,386
480
900kbps
1,498
1,440
200kbps
1,386
320
800kbps
1,422
1,280
100kbps
1,296
160
700kbps
1,405
1,120
10kbps
1,296
16
600kbps
1,394
960
5kbps
1,296
8
H.264 (720×480pixel,29.97fps)
(KB)
3,500
3,000
2,500
2,000
1,500
1,000
500
理論値
図 25 実験値と理論値(720×480pixel,29.97fps)
29
5
10
100
200
300
400
実験値
500
600
700
800
900
1000
1500
2000
0
(kbps)
7.2.5. 解像度による実験値と理論値(640×480pixel,29.97fps)
更に解像度を 720×480pixel から 640×480pixel に下げ実験値と理論値を比較する(表 3,
図 26).結果,700kbps 以降実験値と理論値の差が大きくなる.
表 3 実験値と理論値(640×480pixel,29.97fps)
ビットレート
実験値
理論値
ビットレート
実験値
理論値
2000kbps
3,163
3,163
500kbps
1,186
790
1500kbps
2,388
2,370
400kbps
1,180
632
1000kbps
1,642
1,580
300kbps
1,097
474
900kbps
1,478
1,422
200kbps
1,097
316
800kbps
1,330
1,264
100kbps
1,097
158
700kbps
1,216
1,106
10kbps
1,097
16
600kbps
1,195
948
5kbps
1,097
8
H.264 640×480pixel 29.97fps
(KB)
3,500
3,000
2,500
2,000
1,500
1,000
500
理論値
図 26 実験値と理論値(640×480pixel,29.97fps)
30
5
10
100
200
300
400
実験値
500
600
700
800
900
1000
1500
2000
0
(kbps)
7.2.6. 解像度による実験値と理論値(320×240pixel,29.97fps)
更に解像度を 620×480pixel から 320×240pixel に下げ実験値と理論値を比較する(表 4,
図 27).結果,200kbps 以降実験値と理論値の差が大きくなる.つまり解像度が低いほど,
実験値と理論値の差は少なくなる.
表 4 実験値と理論値(320×240pixel,29.97fps)
ビットレート
実験値
理論値
ビットレート
実験値
理論値
2000kbps
3,129
3,129
500kbps
812
785
1500kbps
2,358
2,355
400kbps
656
628
1000kbps
1,587
1,570
300kbps
514
471
900kbps
1,433
1,413
200kbps
501
313
800kbps
1,286
1,256
100kbps
499
157
700kbps
1,136
1,099
10kbps
458
16
600kbps
981
942
5kbps
458
8
H.264 (320×240pixel,29.97fps)
(KB)
3,500
3,000
2,500
2,000
1,500
1,000
500
理論値
図 27 実験値と理論値(320×240pixel,29.97fps)
31
5
10
100
200
300
400
実験値
500
600
700
800
900
1000
1500
2000
0
(kbps)
7.2.7. フレームレートによる実験値と理論値
今度はフレームレート fps を 29.97fps~1fps に分け,実験値と理論値を比較する(表 5,
図 28).結果,フレームレートによる実験値と理論値の差はあまり見られない.つまりビッ
トレートと解像度がファイルサイズに大きく関わっていることがわかる.
表 5 フレームレートによる実験値と理論値
fps
720×480
720×480 640×480 320×240
実験値
理論値
理論値
理論値
29.97fps
3,202
3,202
3,163
3,129
25fps
2,671
2,675
2,605
2,600
24fps
2,567
2,568
2,544
2,496
15fps
1,609
1,605
1,590
1,560
12fps
1,289
1,284
1,272
1,248
10fps
1,077
1,070
1,060
1,040
8fps
863
856
848
832
6fps
652
642
636
624
5fps
545
535
530
520
1fps
116
107
106
104
H.264 (2000kbps)
(KB)
3,500
3,000
2,500
2,000
1,500
1,000
500
0
29.97
25
720×480の実験値
24
15
12
720×480の理論値
10
8
6
640×480の理論値
図 28 フレームレートによる実験値と理論値
32
5
1
(fps)
320×240の理論値
8.考察
画質を比較した場合,H.264 は他の動画と比べて全体的に色が薄くなっている.そこで色
が薄くなる原因について調べてみたところ,H.264 の黒レベルの基準が高いことが判明した
(図 20、図 21).黒レベルが高いと色が鮮やかになり,黒レベルが低いと黒くなります.つ
まり H.264 の黒レベルを下げれば標準動画のような明度になると考えられます.また,多
少画質の劣化が見られるが,アルファべットや数字ははっきりと見える.H.261 などと比べ
ると画質が向上し圧縮率も上がっていることがわかる.また,ビットレートを下げた場合,
やはり画質の劣化が見られブロックノイズが生じている.しかし解像度を低くした場合同
じビットレートでも画質の劣化が見られない.
ファイルサイズを比較した場合,比較した規格の中では H.264 が一番データ圧縮率が高
い.標準動画に比べて約 99%圧縮している(図 22)
.H.264 は動き補償,整数制度 DCT 変換,
エントロピー符号化に様々な工夫を加えているため,従来の圧縮技術よりも処理時間が長
くなる.そのためある程度以上のマシンスペックが必要ではないかと考えられる.また,
同じ解像度でもビットレートの設定次第では,ファイルサイズに変化がなく画質の劣化だ
けが見られる.実際に解像度を下げ実験値と理論値を求めると徐々に差がなくなっていく
のが理解できる.fps を変えた場合では,実験値と理論値の差はあまり見られない.つまり
ビットレートと解像度が大きくファイルサイズに関係していることがわかる.
33
9. まとめ
H.264 は,以前の企画に比べて圧縮率が高いことが判明した.更に圧縮率を上げるために
以下の項目を調整することが考えられる.
(1)ビットレート
ビットレートを下げるとファイルサイズが減るが,画質劣化がひどくなる.圧縮処理速
度は変わらないが一定の解像度である場合,ビットレートを下げてもファイルサイズはあ
まり変わらない.
(2)解像度
解像度を下げると圧縮処理速度が速くなり,ファイルサイズも減るが画面が小さくなり
見づらくなる.
(3)フレームレート
fps を減らした場合,少ないほど圧縮処理速度は,飛躍的に速くなりファイルサイズも減
るが,fps を低くし過ぎると動画がぎくしゃくして見づらくなる.
H.264 で圧縮する場合,鑑賞するならば 640×480pixel,29.97fps,3000kbps 程度がベ
ストではないかと考える(図 29).
図 29 H.264
(640×480pixel,29.97fps,3000kbps)
また,今後の課題として,H.264 と同等画質と言われている Windows Media Video 9 と比
較してみたいと考えています.
34
参考文献
[1] Nagasima’s Page
http://www.rikkyo.ne.jp/~nagasima/mat/movie/index.html
[2] 株式会社アイ・ビー・イー
http://www.mpeg.co.jp/libraries/mpeg_labo/winPC_20.html
[3] IT 用語辞典 e-Word
http://e-words.jp/
[4] 大久保 榮,H.264/AVC 教科書,株式会社インプレス(2004)
[5] Adobe Premiere Pro 1.5 日本語版
[6] QuickTime 7.0
[7] SONY DCR-TRV30 DVC
[8] QTConverter 1.3.0
35