音声コミュニケーションを支える技術(1)

2014 年 4 月
IP 電 話 普 及 推 進 センタ
技 術 解 説 第 1回
『音 声 コミュニケーションを支 える技 術 (1)』
従 来 、音 声 ネットワークはデータネットワークとは独 立 に構 築 されていました。しかし近 年
登 場 した VoIP(Voice over IP)技 術 を用 いることで IP ネットワークを介 した音 声 通 話 の
実 現 が可 能 となり、両 者 を統 合 したネットワークを構 築 出 来 るようになってきています。
本 技 術 解 説 ではまず VoIP を実 現 する 4 つの要 素 技 術 を解 説 します。
今 回 はこのうち音 声 コーデックについて取 り上 げます。
①アナログ音声とIPパ
ケットを相互に変換
(音声コーデック)
音声パケット
音声信号
音声信号
IPネットワーク
(インターネット/イントラネット)
電話機
②電話機間の接続を管
理(呼制御)
③ 音声パケットの伝送
に適したネットワーク性
能を確保(QoS)
電話機
④ 音声パケットを伝達
できるネットワーク構築
(NAT/NAPT透過)
図 1: VoIP を実 現 する要 素 技 術
音 声 コーデック技 術
●音 声 コーデックとは
IP ネットワークを介 して音 声 信 号 を電 話 機 A から電 話 機 B に送 信 するシステムにお
ける音 声 コーデックの模 式 図 を示 します。
符号化
音声信号
(アナログ)
AD変換
IPパケット
(デジタル)
圧縮
復号化
伸張
11000101
音声コーデック
IPネット
ワーク
DA変換
音声信号
(アナログ)
音声コーデック
電話機A
電話機B
IPネットワークはデジタル信号しか扱えま
せん。 アナログ信号である音声信号はデ
ジタル化する必要があります。
図 2:音 声 コーデック
電 話 機 A は音 声 信 号 の送 り側 です。IP ネットワークではデジタル信 号 しか扱 えませんの
で、IP ネットワークに音 声 信 号 を流 すには、送 り側 ではアナログの音 声 信 号 をデジタル
化 す る 必 要 が あ り ます 。 ま た 伝 送 路 を 効 率 良 く 利 用 す る た め にデ ジ タ ル 信 号 は 圧 縮 さ
れます。
電 話 機 B は音 声 信 号 の受 け側 です。音 声 信 号 は電 話 機 A でデジタル化 され、さらに圧
縮 されたデジタルデー タとなっています ので、これを元 の形 に復 元 す る必 要 があります 。
す な わち 、 受 け 取 っ たデ ジ タルデ ー タ を 伸 張 し 、 デ ジ タル 信 号 の アナ ログ 信 号 化 を 行 い
ます。
このアナログの音 声 信 号 からデジタル信 号 に変 換 する機 能 (AD 変 換 )と、デジタル信
号 の サイ ズを 小 さ くす る 機 能 ( 圧 縮 ) を ま とめ て エ ンコー ド ( 符 号 化 )と い います 。 逆 に 圧
縮 されたデジタルデータを元 のデジタル信 号 に戻 す 機 能 (伸 張 )と、デジタル信 号 からア
ナログ信 号 に変 換 する機 能 (DA 変 換 )をまとめてデコード(復 号 化 )といいます。
これらの機 能 をハードウェアやソフトウェアで実 現 したモジュールを「音 声 コーデック」と
呼 びます。コーデック(codec)とは coder(符 号 器 )と decoder(復 号 器 )の合 成 語 です。
電 話 機 A で入 力 された音 声 信 号 (アナログ信 号 )は、音 声 コーデックによって符 号 化
処 理 と圧 縮 処 理 が行 われ、IP データ化 されます 。IP データ化 された音 声 情 報 は RTP
(Real-time Transport Protocol)というリアルタイムデータを伝 送 するプロトコルで IP ネ
ットワーク上 に流 れます。電 話 機 B では同 じ音 声 コーデックによって伸 張 処 理 と復 号 化
処 理 が行 われ、電 話 機 A で入 力 された音 声 信 号 が再 現 され届 けられることなります。
●音 声 コーデック G.711 と G.729a
音 声 コーデックはいくつかの方 式 が ITU-T で勧 告 されており、代 表 的 な方 式 は G.711
と G.729a があります。
G.711 は電 話 回 線 等 でも使 用 されている、最 も一 般 的 な音 声 コーデックです。G.711
によってデジタル化 された信 号 のビットレートは 64kbps と大 きめですが、音 質 が良 好 な
ので広 帯 域 な IP ネットワークでは良 く用 いられる方 式 です。
電 話 回 線 における音 声 周 波 数 は最 高 で 3.4kHz です。原 信 号 の 2 倍 以 上 の周 波 数
で標 本 化 (サンプリング)を行 うと原 信 号 を劣 化 なく再 現 できることから、G.711 ではサン
プリング周 波 数 8kHz で標 本 化 を行 います。 そしてサンプリングしたそれぞれの信 号 強
度 を 8bit、256 段 階 で表 して量 子 化 (デジタル化 )します。
復 号 はこの 逆 の 操 作 を おこ ない 、デ ジ タ ル 信 号 からアナロ グ 信 号 へ 戻 し ます 。G.711
では音 声 圧 縮 処 理 を行 っていないため、原 音 の劣 化 を抑 えて再 現 できます。
量子化(デジタル化)
音声信号入力
標本化
10110001
10110101
10010101
時間
時間
時間 11111000
図 3: G.711 による符 号 化
G.729a は音 声 圧 縮 率 が高 く、IP ネットワークを効 率 良 く利 用 できる音 声 コーデックで
あり、 回 線 が 細 い 携 帯 電 話 でも 利 用 され てい ま す 。 音 声 信 号 その ものを 符 号 化 した 情
報 を伝 送 するのではなく、あらかじめ波 形 パター ンをコー ドブックというものに登 録 をして
おき、 波 形 パター ン番 号 と実 際 の 音 声 に近 づ け るための音 響 特 性 (フィ ルタ係 数 )を 伝
送 します。復 号 された音 質 は G.711 に比 べると劣 りますが、ビットレートは 8kbps と小 さく
なります。
実音声信号
(A0n)
オ
ハ
ヨ
A01
A02
A03
時間
ウ
A04は未来の
音声信号
A04
過去の信号から
次の信号を予測
実音声に近づける
ための音響特性
(A2n)
波形パターンに近似
された音声(A1n)
オ
ハ
A11
A12
ヨ
ウ
A13
A14
A21
オ
A22
ハ
A23
ヨ
A24
ウ
波形パターン番号
誤り符号を付加
して符号化
音響特性
(フィルタ係数)
IPネットワークへ
図 4: G.729a による符 号 化
次 回 は代 表 的 な呼 制 御 プロトコルである SIP について説 明 します。