3次元ウェーブレットを用いた動画像のスケーラブル符号化

テーマ名
3 次元ウェーブレットを用いた動画像のスケーラブル符号化
組織名
国立大学法人 電気通信大学 情報・通信工学科 張 煕 教授
技術分野
IT
概要
動画像のエンコード技術として MPEG2/4 などが一般に利用されていますが、解像度
を変える場合には再度圧縮処理を行う必要があり、大きな計算コストと時間が掛かっ
ていました。そこで、3 次元ウェーブレット変換を用いて、既存技術に引けを取らない
圧縮性能を持ちながら、一度圧縮処理だけで様々な解像度に再生できる(=スケーラ
ブル)エンコード技術を確立しました。動画像の配信サービス・データ伝送等へ適用
可能です。本技術の実用化に意欲的な企業を歓迎します。
簡略図
背景
近年、デジタルテレビ放送や Youtube を代表として、デジタル動画は多くのユーザ
間で流通が盛んになっています。デジタル動画はそのままではデータ量が膨大である
ため、MPEG2/4 や H.264 などの形式により、解像度を保ちながら、データ量を減ら
すエンコード技術を取り入れています。
例えばデジタルテレビ放送では MPEG2 が利用されており、Youtube にアップロー
ドされている動画では、多岐にわたるエンコード技術によって圧縮されています。
これらのエンコード技術のひとつの課題として「スケーラビリティ」があります。
スケーラブルとは「拡大縮小可能な」を意味し、既存の MPEG 技術などでは、一度圧
縮をした動画でも異なる解像度へ変更する場合には再度圧縮処理を行う必要がありま
す。すなわちスケーラビリティが無いと言え、圧縮処理には大きな計算コストと時間
が掛かるため、利便性に乏しいのが現状でした。
本技術では、3 次元ウェーブレット変換を用いることにより、MPEG2/4 に引けを取
らない圧縮性能を保ちながら、一度圧縮処理して様々な解像度で再生できるスケーラ
ブルなエンコード技術をご提案します。
技術内容
本技術の原理は以下の通りです。
1)撮影した動画像を入力します。
2)「空間ウェーブレット変換」と「時間ウェーブレット変換+動き補償」を用いて
動画像を階層化処理します。
3)圧縮率に応じて処理後の動画像を量子化して情報量を減らします。(量子化)
4)量子化後の情報を圧縮します。
(エントロピー符号化)
※2)が本技術の特徴です。
空間ウェーブレット変換における「フレームの水平成分」
「フレームの垂直成分」、
時間ウェーブレット変換における「時間成分」の 3 次元に対してウェーブレット
変換を行うほか、動き補償を行い、冗長成分を取り除いています。
【空間ウェーブレット変換】
静止画の符号化方式として「JPEG2000」などに利用されている技術です。
「JPEG2000」
では「Daubechies-9/7」と呼ばれる空間ウェーブレット変換が使用されていますが、
動画像に応用しようとすると、エイリアシングと呼ばれる雑音が残り、画面のちらつ
きにつながります。
本技術では「オールパスフィルタ」により構成された直交対称ウェーブレット変換
を考案し、空間変換に適用しています。エイリアシング成分が小さくなるため、動画
像での動き補償の効率が向上できます。
【時間ウェーブレット変換】
フレーム間の予測と動き補償を組み合わせることによって冗長性を削減(圧縮効率
を高める)する技術です。
(動き補償)
時間情報の冗長を効率的に削除する手法です。
符号化対象の動画中の 1 フレームは、先に符号化された時間的に近い位置にあるフ
レームを参照して冗長情報を削除しますが、フレーム間にはカメラや被写体の動きに
よって“ずれ”が生じます。この「ずれを補償して」予測フレームを作成し、これを
参照することによって、冗長情報をより効率的に削除できます。
※雲は動かないため、この部分は時間的に冗長であり、削除できます。
※車(被写体)は一定方向に動きますが、この時間的な変化を予想してフレームを
参照すると、冗長成分を効率的に削減することができます。
技術・ノウハウの強み(新規性、優位性、有用性)
1.MPEG2/4 や H.264 などの既存のエンコード技術では、スケーラビリティに乏し
く、解像度を変える場合に再度圧縮処理が必要でした。
→本技術では、再度の圧縮処理は必要ありません。
2.ウェーブレット変換は階層化構成をもち、スケーラビリティに優れるため、
多くの研究事例がありますが、2 次元ウェーブレット変換がほとんどでした。
また、3 次元ウェーブレット変換についての研究事例では、エイリアシングが
多く残るなどの問題がありました。
→本技術では、高度な信号処理技術により、3 次元でのウェーブレット変換を実現
するほか、オールパスフィルタにより、圧縮性能が他の 3 次元ウェーブレット
変換技術より優れています。
連携企業のイメージ
本技術の実用化を希望する企業を歓迎します。
例えば、以下に該当する企業へご提案可能です。
1)動画像の配信サービスを提供している企業。
2)動画像のデータ伝送を頻繁に行っている企業。
3)動画像の圧縮について研究開発を行っている企業。
4)他、本技術の活用、実用化に意欲がある企業。
技術・ノウハウの活用シーン(イメージ)
高解像度の動画圧縮を一度行えば、低解像度に変更する場合にも圧縮処理が必要あ
りません。この利点を生かした動画像伝送へ適用可能です。
例えば、以下の用途で適用可能です。
1)動画像の配信サービス
-ユーザの会員ランク(有料会員/無料会員など)に合わせて、
高解像度/低解像度の動画を配信するなどのサービスを、
処理時間や手間を掛けずに簡単に行うことができます。
-ユーザの視聴環境・通信環境を認識することができれば、伝送する動画の解像
度を適正に変えることが容易に実現可能です。
例えば、光通信であれば高解像度のデータ伝送、低速の ADSL であれば中解像
度のデータ伝送、小型端末(スマートフォン等)であれば低解像度のデータ伝
送など、通信負荷(ダウンロード時間)や端末サイズに応じた伝送サービスを
提供できます。
2)動画像のデータ伝送
-動画像のデータ伝送には大きな通信負荷が掛かります。
工場において動画像による不良検査を行う際に、生データは高解像度であるが、
データを集約して保存するためのサーバへ伝送する場合には低解像度で良い、
などのニーズへ対応可能です。
監視カメラにおけるサーバへのデータ伝送にも適用が可能です。
技術・ノウハウの活用の流れ
基本的なソフトウェアは既に確立しています。お問い合わせ後、デモンストレーシ
ョンや技術の詳細説明などさせていただきます。
また、張 教授は、画像処理・信号処理・動画像処理等の専門家であり、ディジタル
フィルタ・ウェーブレット変換・画像圧縮などに関して豊富なノウハウがあります。
これらの技術分野に関わる技術相談・共同研究へ対応可能です。
専門用語の解説
【動画圧縮】
動画は連続した静止画の集合とも言え、本来そのデータ量は膨大となります。しか
しながら、冗長なデータが多数含まれているため、冗長なデータを上手く省くことに
より、解像度を保ちながら、圧縮する(データ量を減らす)ことが可能となります。
代表的な動画圧縮技術として MPEG2/4 や H.264 などが挙げられます。
【ウェーブレット変換】
時間周波数解析の一つであり、基底関数として、ウェーブレット関数を用います。
フーリエ変換によって周波数特性を求める際に失われる時間領域の情報を、この変換
においては残すことが可能です。この特徴を活かすことにより、スケーラビリティに
優れた動画像圧縮技術を実現しています。
お問合せ先
下記から御問合せください。
http://www.open-innovation-portal.com/university/it/scalable.html