NEXT STEP マルチメディア コーデック ミドルウエアの動向 池 上 青 史 ★ はじめに 進んでいます。 話としての通常の通話機能に加え画像 近年, 携帯電話をはじめとするモバイル このようなモバイル機器の発展にとも コーデック, オーディオデコーダ等の機能が 機器は短期間に広範に普及し, 性能, 機能 なって, その処理の対象となるデータはテ 加わるようになるでしょう。 的にもめざましい発展を遂げています。携 キスト・データから音声データ, オーディオ・ 当社では,従来より音声認識,文字認 帯電話は, 2001年には第三世代携帯電話 データさらに映像データのような大容量 識,エコーキャンセラといったアプリケー サービスであるIMT-2000が始まり, 通話機 データとなってきています。 また, そのデー ションをミドルウエアとして製品化してきま 能だけでなく画像, 音楽の配信, 通信機能 タを処理するプロセッサも高性能化し,大 した。今後, モバイル機器に搭載されるマ を備えるようになります。 また, 携帯オーディ 量のデータを処理することが可能となって ルチメディア・コーデックとして音声, オー オ機器はICメモリを媒体にしたいわゆるソ きています。 また, モバイル機器においても ディオ, 画像データを対象とするミドルウエ リッド・オーディオが普及してきました。 さら 単一の機能のみでなく複数の機能を持つ ア が 必 要となって います。本 稿 では , に,PDAにおいても従来の機能に加え,音 ようになります。例として図1ではIMT-2000 AMR,MPEG-4 CELPといった音声コー 楽や画像を扱う機能を備え,高機能化が で必要となる機能を示しています。携帯電 デック,MP3,AACといったオーディオ・デ 画像入出力 画像コーデック H.263/MPEG-4 JPEG 音声入出力 音声コーデック AMR/G.723.1 オーディオ出力 オーディオデコーダ MP3/AAC アプリケーション T.120 etc. データプロトコル V.14 システム 制御部 遅延 回路 多重 分離部 H.223 Network プロトコル制御部 H.245 Call Set-up 図1 IMT-2000システム概略図 ★ ソリューション技術本部 応用ソフトウエア技術部 コーダ,JPEG,JPEG2000といった静止画 これらのオーディオ・デコーダミドルウエ 低プロセッサ負荷対応 (Annex A) , 無音区 コーデック, MPEG-4ビデオといった動画像 アの特長として少ない演算量で処理する 間圧縮対応(Annex B) といった特長があ コーデックのミドルウエアを紹介します。 ことにより低消費電力を実現しています。 ま ります。 た,命令コードをRAMにロードするタイプ MPEG-4 CELPは, ISO/IECでMPEG-4・ オーディオ・デコーダ のDSPを用い, ミドルウエアを入れ換えるこ オーディオパートの一部として標準化され オーディオ・デコーダ・ミドルウエアは, 当 とにより, 複数の圧縮方式に対応することが たCELP (Code Excited Linear Prediction) 社のDSP向けにMP3,AACを製品化して 可能となっています。 方式による音声コーデックです。通常の音 います。 MP3とは, オーディオ信号の圧縮方式の 声帯域である狭帯域(N a r r o w B a n d: 音声コーデック 3.4kHz帯域) に加え、音質向上のために広 ひとつで, 一般にMPEG-1 Audio Layer3お 現在,当社のDSP向けの音声コーデッ 帯域 (Wide Band:7kHz帯域) にも対応して よびMPEG-2 Audio Layer3 LSF(Low ク・ミドルウエアとしてG.723.1,G.729, います。狭帯域の場合は3.85-12.2kbbsの Sampling Frequency)のことを指します。人 MPEG-4 CELPを製品化しており,AMRを 28種類、広帯域の場合は10.9-23.8kbpsの 間の聴覚特性を利用して不要なデータを 製品化予定です。 30種類のビットレートを設定することができ 除去することにより圧縮率を高めています。 G . 7 2 3 . 1 は,I T U - T で 勧告された ます。 これは、通信回路の帯域や蓄積媒体 現在,MP3は携帯オーディオ機器に広く用 5.3kpbs, 6.3kbpsの音声圧縮/伸長コーデッ の容量といったシステムの制限に応じて、 いられており, 同様の圧縮方式のなかでは クで,ACELP(Algebraic Code Excited 最適な圧縮率を選択することを可能にしま もっとも普及しています。 また,携帯電話, Linear Prediction) とMP-MLQ (Multi-Pulse す。 また、エラーコンシールメントや無音圧 PDAなどにもカード・メディアの実装とともに Maximum Likelihood Quantization) を使用 縮(デコーダのみ) にも対応しています。 こ 使われるようになるでしょう。 した音声信号を符号化するためのアルゴ のMPEG-4 CELPには当社提案アルゴリズ サンプリング周波数は2 2 . 0 5 k H z ∼ リズムです。 ムが採用されています。 4 4 . 1 k H z ,対応ビットレートは8 k b p s ∼ おもな用途としては,低ビットレート通信 A M R 音声コーデックは,3 G P P(3 r d 320kbpsです。当社のミドルウエアはデコー 用テレビ電話システム (H.324) ,LAN用テ Generation Partnership Project) で規格され ダのみに対応しており, また規定されたビッ レビ電話システム (H.323), インターネット た,4.75kbps∼12.2kbpsの音声圧縮/伸長 トレート以外で圧縮されたフリーフォーマッ 電話,音声蓄積装置(V o i c e S t o r a g e コーデックです。A M Rとは,A d a p t i v e トといわれるデータには対応していません。 Equipment) です。特長としては,低ビット Multiple Rateの略で, 基地局からの距離や AACはMPEG-2 Advanced Audio レート (5.3/6.3kbpsデュアルレート) , 無音区 電波の干渉状態により通信速度を変化さ Codingのことを指します。MPEG-1オーディ 間圧縮対応(Annex A), 浮動小数点演算 せる可変速符号化方式です。 また, 次期携 オとの互換性を排除することによって高品 対応 (Annex B) , 無線用途向け誤り訂正符 帯電話サービス (W-CDMA) に採用される 質・高圧縮率を達成したマルチチャンネル 号化対応 (Annex C) ですが, 当社のミドル 規格であり, 通信音質の向上が考えられて (最大64チャンネル)対応のオーディオ符号 ウエアは, 浮動小数点演算対応のAnnex B います。マルチレート・スピーチCODER, 無 化方式です。 また,MP3と比較して高性能 を除いたすべてに対応しています。 音圧縮機能, エラーコンシルメント機能から である反面,符号化方式が複雑といった G.729は, ITU-Tで勧告された8kbpsの音 構 成されます。マルチレート・スピーチ 欠点があります。おもな用途として音楽配 声圧縮伸長コーデックで,C S - A C E L P CODERは, 8つのビットレートからビットレー 信,BSディジタル放送,地上波ディジタル (Conjugate Structure-Algebraic CELP) を トを選択することができ, 1フレーム (20ms) 放送などがあります。サンプリング周波数 使用した音声信号を符号化するためのア ごとにビットレートを切り換えることが可能 は8kHz∼96kHz, 対応ビットレートはサンプ ルゴリズムです。 おもな用途としては, です。おもな特長は以下の通りです。 リング周波数の6倍を最大値として任意の DSVD(Digital Simultaneous Voice and ● 値を取ります。当社のミドルウエアはフロン Data) (電話回線での音声・データ同時転 7.4.0 に対応(チャネル・コーデックは含 ト2チャンネルのみデコードし,5.1チャンネ 送) ,ATM, フレームリレー,PIAFSがありま まれません) ルには対応していません。 また出力データ す。当社のミドルウエアは,現在,低ビット ● 圧縮/伸長は,8つのビットレートに対応 はADTS,ADIF,RAWフォーマットに対応 レート (8kbpsに圧縮符号化),高品質音声 ● 無音圧縮機能対応(VAD1オプション, しています。 符号化(ADPCM/32kbpsと同等の音質), 3GPPのAMR音声コーデック Version VAD2オプションに対応) ● ● サンプリング周波数8kHzで160サンプ ているので, すべての仕様を満たすことは 解像度テレビ)を想定しており,最大ビット ル/フレームの符号化, 復号化を行う 必ずしも想定するアプリケーションに最適 レートは38.4Mbpsです。MPEG-4のプロ 音声入出力データはすべて16ビット・リ とは限りません。そのため,MPEG-4ビデオ ファイルとその想定される応用例を図2に ではアプリケーションを想定し,各アプリ 示します。 ケーションに必要な要素技術(ツール)の組 現在,製品化を予定している画像コー み合わせをとりまとめた9つの” プロファイ デックは当社のDSP:μPD7721xファミリ向 MPEG-4ビデオは,動き補償と離散コサ ル” を定めています。 けにMPEG-4シンプル・プロファイル レベ イン変換を組み合わせたハイブリッド符号 さらに, 各プロファイルでは, 扱われる画 ル1(ビットレート:64kbps) をターゲットに開 化技術です。MPEG-2とITU-T勧告H.263 像サイズやビットレートなどのパラメータを 発を進めています。QCIF(176×144)画像 の基本技術をあわせ持ち, さらに以下のよ 限定する” レベル” が定義されています。 と を最大15fps(frame per second)同時にエ うな特長を持っています。 くに重要なのが, シンプル・プロファイル, コ ンコード/デコードすることができます。 とくに ニアPCMデータ MPEG-4ビデオ・コーデック ● 符号化効率の向上 ア・プロファイル, メイン・プロファイルの3つ 画像処理用のアクセラレータや専用ハード ● 誤り耐性の向上 です。 この3つのプロファイルとレベルの定 ウエアをまったく使わずに,汎用DSPで上 ● オブジェクト(物体)単位の符号化 義を表1に示します。 シンプル・プロファイル 記画像コーデック性能を実現できます。そ ● コンピュータグラフィックスとの融合 は携帯電話や小型携帯端末を想定してお の要因として,各種高速演算法により演算 応用分野としては,比較的通信レートの り, 最大ビットレートは384kbpsです。 コア・プ 量を削減したことがあげられます。 この実 低い無線通信やインターネットから通信 ロファイルは次世代高機能携帯端末やイ 現はシステムを低消費電力で実現するた レートの高い放送領域までをカバーする統 ンターネットを想定しており, 最大ビットレー めに非常に有効であるといえます。 合的な画像符号化技術です。 このように トは2Mbpsです。メイン・プロファイルは放 MPEG-4ビデオは非常に幅広い規格となっ 送やHDTV(High Definition Television:高 JPEG JPEG (Joint Photographic Experts Group) 表1 MPEG-4ビデオプロファイルとレベル プロファイル シンプル コア メイン は濃淡画像とカラー静止画像に対する効 レベル1 レベル2 レベル3 レベル4 率のよい符号化方式として, インターネット 64kbps 176×144 384kbps 176×144 128kbps 352×288 2Mbps 352×288 2Mbps 352×288 384kbps 352×288 ー やディジタルスチルカメラなどの幅広い分 ー ー 野で利用されています。 15Mbps 720×480 38.4Mbps 1,920×1,088 ー JPEGの基本は,DCT(Discrete Cosine Transform:離散コサイン変換) という方式 を用いて画像の圧縮を行います。そして, 解像度 圧縮時に情報の一部を捨てることにより圧 MPEG4拡張(将来) 縮率を高めています。そのため,伸長した HDTV HDTV メイン (これをLossyといいます) 。 しかし,JPEGに MPEG2 Rec.601 コア CIF シンプル ビデオ 合成編集 はこのほかにもバリエーションが存在し, 画 放送 像が圧縮前の元画像に復元できる可逆方 式(LossLess方式), そして, 再生方法とし パッケージメディア て画像の上から下へ順次的に再生する インターネット シーケンシャル方式や, 最初に画像の概略 H.263 QCIF 画像は元の画像には戻らなくなっています を表示し, しだいに鮮明な表示へと変化さ 携帯端末 せていくプログレッシブ方式などが存在し ます。 10K 図2 MPEG-4ビデオの位置づけ 1M 10M ビットレート (bps) 当社では, こうした特長を持ったJPEG ファイルの圧縮・伸長を行うため,V830, V 8 5 0ファミリおよびV Rシリーズ用として JPEGミドルウエアを提供しています。 ミドルウエア構成例 ここまでマルチメディア・コーデックについ て個別のミドルウエアを紹介してきました が, これらのミドルウエアが搭載されるモバ イル機器のミドルウエア構成例をあげます。 音声CODEC AMR オーディオDECODER MP3,AAC,WMA他 動画像CODEC MPEG-4 Video (H.263) 次世代携帯電話サービスであるIMT2000に使われるW-CDMAシステム構成例 (注)ターゲットシステムによって構成が変わる場合があります。 図3 W-CDMAミドルウエア構成例 を図3に示します。通話機能として使用さ れる音声コーデックとしてAMR,動画像 コーデックとしてはMPEG-4ビデオが採用 されることが決まっています。音楽配信等 に使用されるオーディオ・デコーダとしては MP3,AAC,WMAなどが,必要となるで しょう。 オーディオDECODER MP3 AAC WMA ATRAC3 図4のように携帯用のオーディオ・プレー ヤでは, 各種のオーディオ圧縮方式に対応 したミドルウエアを用意しておくことでソー スを選ばないプレーヤが実現できます。 (注)ターゲットシステムによって構成が変わる場合があります。 図4 オーディオ・プレーヤ・ミドルウエア構成例 PDAではスケジュール管理,住所録と いった機能に加え,通信機能やカードメ ディアを実装することにより機能を拡張する 場合,図5に示されるような各種ミドルウエ アが必要となります。 図6に示すDSC(Digital Still Camera) で オーディオDECODER MP3,AAC他 動画像CODEC MPEG-4 Video は静止画を圧縮・伸長する機能に加え, 簡 易動画記録機能としてMPEG-4ビデオを 搭載しています。 このように従来の機能に新たな機能が 静止画CODEC JPEG (注)ターゲットシステムによって構成が変わる場合があります。 図5 PDAミドルウエア構成例 加わることにより,お互いに同様の機能を 持ち, ひとつのミドルウエアが多様な機器 で使われるでしょう。 今後のマルチメディア・コーデックの展開 静止画像CODEC JPEG マルチメディア・コーデックの展開を図7 に示します。 また, マルチメディア・コーデッ ク・ミドルウエアの一覧を表2に示します。 動画像CODEC MPEG-4 Video オーディオについては,MP3,AAC以外 にもいつかの圧縮方式が存在しています。 それらの新しい規格に対応したオーディ (注)ターゲットシステムによって構成が変わる場合があります。 図6 DSCミドルウエア構成例 オ・デコーダも開発する予定です。 また, 携 JPEG-LS 機能だけではなく, 録音機能を持つものが 現れるでしょう。そのような要求に対しては オーディオ・エンコーダの開発が必要です MPEG-4 Video Core Profile VIDEO 帯用のシリコン・オーディオ装置でも再生 2000年 AUDIO JPEG2000 MPEG-4 Video Simple Profile CODEC WMA Dec が, より高い性能を持つプロセッサ上でのミ ドルウエアを開発する予定です。 AAC Dec ATRAC3 Dec また,I M T - 2 0 0 0 では当初は双方向 64kbps, 下り方向384kbpsの通信レートでス MP3 Dec 開発済み タートしますが, 将来的にはさらに高い通信 JPEG JBIG MH/MR/MMR レートを実現できるようになるでしょう。通信 MPEG-4 CELP AMR レートの拡大が実現するとリアルタイムで の動画像通信においてもさらに大きな画像 G.726 SPEECH G.723.1 サイズ, フレーム・レートを向上したMPEG- G.729 開発済み 2000年 4ビデオ・コーデックが必要となります。 また, 現在商品化を進めているMPEG-4ビデオ 図7 マルチメディア・コーディック・ミドルウエアの展開 はシンプル・プロファイル レベル1を実現す る予定ですが, さらに上位レベルの実現も い,JPEGに対して圧縮性能の30%向上, セッサの高性能化,通信レートの高速化, 視野に入れて開発を進めていきます。 および, 低ビットレート符号化時の良好な画 ストレージ・メディアの大規模化などが進ん JPEGの規格動向としては, 2種類の標準 質などを求めたJPEG2000です。当社で でいくでしょう。そこで要求されるマルチメ 化が進められています。 ひとつは医療用画 は, これらの規格の動向を睨みつつ, ミドル ディア・コーデックもさらに高い性能,多様 像や衛星画像などの高精細さや画像の可 ウエア化の計画を進めています。 な機能を要求されます。当社ではそれらに 対応したミドルウエアをタイムリに提供して 逆性を必要とするアプリケーションでの利 用を目的としたJPEG-LS(LS:LossLess) 。 おわりに もうひとつはWavelet変換という方式を用 今後,モバイル機器に搭載されるプロ いきたいと考えています。 表2 ミドルウエア一覧 ミドルウエア 音声コーデック オーディオ・ デコーダ 動画像 コーデック 静止画 コーデック 機能 V850ファミリ VRシリーズ DSP G.723.1/A/C 3.4KHz 5.3/6.3Kbps A-CELP/MP-MLQ Codec ◎ G.729/A/B 3.4KHz 8Kbps CS-ACELP Codec ◎ G.726 3.4KHz 16/24/32/40Kbps ADPCM Codec ★ MPEG-4/CELP 3.4KHz 3.85-12.2Kbps/8KHz 10.9-23.8Kbps Speech Codec ◎ AMR 3.4KHz 4.75-12.2Kbps Speech Codec ◎ MP3 Decoder 11.05-48KHz 32-128Kbps Audio Decoder ◎ AAC Decoder 3.4-48KHz 8-128Kbps Audio Decoder ◎ WMA Decoder Audio Decoder ○ ATRAC3 Decoder Audio Decoder ○ H.263 Video Codec ○ ※1 MPEG-4 SP Video Codec JBIG Still Picture Codec ◎ ○ MH/MR/MMR Still Picture Codec ◎ ◎ JPEG Still Picture Codec ◎ ◎ JPEG2000 Still Picture Codec ◎:リリース中,○:開発中,△:企画中,★:ミドルウエア製品ではないがサンプル提供可能 ※1 SP:Simple Profile △ ◎
© Copyright 2024 Paperzz