OSSにおける逆フィルタ設計の自動化と改良 Automatic design and

OSSにおける逆フィルタ設計の自動化と改良
Automatic design and improvement of an inverse filter for OSS
大木
裕介(コンピュータ科学科)
Yusuke Ohki
数理音響学研究室 指導教員 中島 弘史准教授
1.はじめに
本研究は,スピーカーを用いた立体音場システム
OSS(Ortho-Stereophonic System)における逆フィルタの改
善及び自動化を目的としている.OSS とは,バイノーラル録
音された音源を 2ch スピーカーから再生する立体音場収音・
再生システムである.このシステムでは音源をスピーカーか
ら再生する際に,逆フィルタを用いて受聴者に届く音を耳元
でコントロールし,録音環境と同じ音を両耳の点で再現する
ことにより,立体音場の再現を可能にする.
2.背景,目的及びアプローチ
現在,2chスピーカーや5.1chサラウンドシステムを用いた
立体音場システム(OSS)に関する研究や開発が行われてお
り,2ch音場再現システム[1],フロントサラウンド・アドバ
ンス[2]などが存在する.だが,前者は非常に高価であり,
後者は5.1chサラウンドシステムを採用しているので,2chに
比べるとスペースが限定される.立体音場の研究では,多数
のスピーカー利用したシステムが主であり,少ないスピーカ
ーで立体音場を実感するシステムは少ない[3].そして,先
行研究[4]では2chスピーカーによる立体音場システム(OSS)
の構築に成功しているものの,構築過程に手動で行う箇所が
存在するため,非常に手間と時間がかかるという課題があ
る.そこで,本研究の目的は手軽にOSSを行えるようにする
こと,及びより立体音場を実感できるOSSを構築することと
した.そのためのアプローチとして,従来に手動で調整して
いたパラメータの自動決定や,逆フィルタ生成方法の改善,
従来のOSSとの比較・評価の3つを行う.
3.OSSの構築
まず,OSS構築環境の簡略図を示す.
𝑿𝑳 (𝜔)
𝑯𝑳𝑳 (𝜔)
𝒀𝑳 (𝜔)
𝑿𝑹 (𝜔)
𝑯𝑳𝑹 (𝜔) 𝑯𝑹𝑳 (𝜔)
𝑯𝑹𝑹 (𝜔)
𝒀𝑹 (𝜔)
図1 OSSの構築環境
図1から人の耳に届く音の周波数特性をベクトル
𝑌 (𝜔)
𝒀(𝜔) = ( 𝐿
)
(1)
𝑌𝑅 (𝜔)
スピーカーからの出力信号の周波数特性をベクトル
𝑋 (𝜔)
𝑿(𝜔) = ( 𝐿
)
(2)
𝑋𝑅 (𝜔)
事前に計測した頭部伝達関数を行列
𝐻 (𝜔) 𝐻𝑅𝐿 (𝜔)
𝑯(𝜔) = ( 𝐿𝐿
)
(3)
𝐻𝐿𝑅 (𝜔) 𝐻𝑅𝑅 (𝜔)
と定義する.ここで𝜔は角周波数である.𝐿は左,𝑅は右を表
し,𝐿𝐿,𝑅𝐿,𝐿𝑅,𝑅𝑅はスピーカーから人間の耳への音の伝
達経路を表す.𝑅𝐿を例に挙げると右のスピーカーから左の
耳に届くという意味である.𝑯(𝜔)をIFFTしたものを𝒉(𝑡)と
する. 𝑡は時間,IFFTは逆フーリエ変換であり周波数領域か
ら時間領域への変換を行う演算である.ここで定義した変数
及び関数は後述でも同じ意味で用いる.これらを元にOSSの
構築手順を説明する.
3.1 高いSN比を持つTSP信号[5]を左右2つのスピーカーか
ら順に再生し,同時に受聴者の両耳に付けたマイクロ
ホンで録音する.この音を元に𝐻𝐿𝐿 (𝜔),𝐻𝑅𝐿 (𝜔),
𝐻𝐿𝑅 (𝜔),𝐻𝑅𝑅 (𝜔)を算出する.以降𝐿𝐿を例として説明す
る.録音した出力信号𝑌𝐿 (𝜔)及び入力信号であるTSP信
号の周波数特性𝑆(𝜔)から伝達関数行列𝐻𝐿𝐿 (ω)を次式で
求める.今回はN=216 とした.
𝐻𝐿𝐿 (𝜔) = 𝑌𝐿 (𝜔) / 𝑆(𝜔)
(4)
3.2 インパルス(非常に短いパルス)信号を流した時に得られ
るシステムの出力であるインパルス応答を求める.式
(4)から得られた伝達関数行列を長さNでIFFTすること
で,インパルス応答を次式により算出する.
ℎ𝐿𝐿 (𝑡) = IFFT { 𝐻𝐿𝐿 (𝜔),N }
(5)
これを𝑅𝐿,𝐿𝑅,𝑅𝑅にもそれぞれ適用し,各経路のイン
パルス応答を求める.
3.3 3.2 により得られたインパルス応答ℎ𝐿𝐿 ,ℎ𝐿𝑅 ,ℎ𝑅𝐿 ,
ℎ𝑅𝑅 を用いて逆フィルタ𝒈(𝑡)を生成する.ここで測定
により得たインパルス応答には,不要な雑音部分や制
御が困難な長い残響が含まれる.高品質なOSSを実現
するためには,この不要部分を手動で切り出す必要が
ある.不要部を除去したインパルス応答をフーリエ変
̃ (𝜔)を利用し,逆フ
換することで求めた伝達関数行列𝑯
ィルタ生成を次式で求める.
̃ −𝟏 (𝜔),N } (6)
𝒈(𝑡) = IFFT { 𝑯
3.4 3.3 により得られた逆フィルタを𝒈(𝑡),音源ベクトル
𝑢𝐿 (𝑡)
𝒖(𝑡)=(
)とすると,出力すべき音のベクトル𝒛(𝑡)
𝑢𝑅 (𝑡)
は次式で計算できる.
𝒛(𝑡)= 𝒖(𝑡)*𝒈(𝑡)
(7)
ここで*は行列とベクトルの積を畳み込みに置き換え
た演算である.𝒛(𝑡)を出力することで,耳元の音のベ
クトル𝒚(𝑡)は,音源のベクトル𝒖(𝑡)と理論上一致し,
原音場での耳元の音圧が再生音場にて再現される.
4.インパルス応答の自動切り出し
設計作業の効率化のために3.3で述べたインパルス応答の
切り出しを自動化する.今回の切り出しでは想定条件とし
て,サンプリング周波数44100Hz,音速340m/s,マイクと
スピーカーの距離が1mとした.手動でインパルス応答を切
り出す場合のサンプル点は100~150程が最適であることが
実験的に明らかになっている.これは壁や床からの反射する
音の経路を含め,音源と受聴点の距離が1.7m程度までは逆
フィルタによる制御精度が高く,逆に2.2m程度を超えると
低くなることによる.これらの条件を元に,切り出しの始点
と終点の自動取得を行う.
4.1 初めに波形の概形であるエンベロープを算出する.こ
れにより波形の細かい変動が除去されて主要な範囲が求
めやすくなる.エンベロープ𝑦(𝑡)は以下の式(8)~(10)で
設計した.
𝑋(𝜔) = FFT { 𝑥(𝑡),N }
𝑋̃(𝜔)=
0
2𝑋(𝜔)
𝜔
>
0
𝜔
≦ 0
𝑒(𝑡) = |IFFT { 𝑋̃(𝜔) ,N }|
(8)
(9)
(10)
𝑋(𝜔)は𝑥(𝑡)の周波数特性,𝑒(𝑡)は時間波形𝑥(𝑡)のエンベ
ロープ波形である.
4.2
実際に始点と終点を自動取得した結果を図2に示す.
横軸は時間𝑡で縦軸は相対振幅である.具体的な手順を
説明する.始点は,最大値までの距離が1mであるこ
と,音が1m進むサンプル時間が129点となること,マイ
0.4
最大値から
88 を足した点
0.3
0.2
最大値から
88 を
引いた点
0.1
0
図.2
図.2
始点と終点の自動決定
最大値から
154 を足した点
2900 2950 3000 3050 3100 3150 3200 3250 3300 3350
時間
図2
始点と終点の自動取得
エンベロープ波形から得た2つの点により,元のインパル
ス応答の波形の切り出しを行う.
5.逆フィルタ比較実験
クロストークを除去する逆フィルタを2つの方法(A,B)
で設計した.クロストークとはそれぞれのスピーカーから出
た音が出力された側と左右反対側の耳に届く音の伝達経路の
ことである.この逆フィルタは先行研究[4]で逆行列により
設計した理論上完全な逆フィルタより音質が良いことが,実
験的に明らかになっている.左右それぞれの耳に届く音を頭
部伝達関数,スピーカーからの出力特性を用いて表すと式
(11)のようになる.なお,次の式から𝜔を省略する.
(
𝑌𝐿
𝐻 𝐻
𝑋
)=( 𝐿𝐿 𝐿𝑅 ) ( 𝐿 )
𝑌𝑅
𝐻𝑅𝐿 𝐻𝑅𝑅 𝑋𝑅
𝐻𝑅𝑅
逆フィルタ𝑮𝑨 により制御した耳元の音𝑌𝐴 (𝜔)は次式となる.
𝐻 𝐻
𝐻𝐿𝐿 − 𝑅𝐿 𝐿𝑅
0
𝑌𝐿
𝑋𝐿
𝐻𝑅𝑅
𝒀𝑨 = ( ) = (
𝐻𝐿𝑅 𝐻𝑅𝐿 ) (𝑋 ) (13)
𝑌𝑅
𝑅
0
𝐻𝑅𝑅 −
𝐻𝑅𝑅
設計法 B ではクロストークを打ち消し,さらに最終的に再
生する音を元のスピーカの音質と同じになるよう制御するも
のである.この逆フィルタ𝑮𝑩 は次式で考えられる.
𝐻𝐿𝐿 𝐻𝑅𝑅 −𝐻𝑅𝐿 𝐻𝑅𝑅
1
𝑮𝑩 =
(
)
(14)
𝐻𝐿𝐿 𝐻𝑅𝑅 −𝐻𝑅𝐿𝐻𝐿𝑅
−𝐻𝐿𝑅 𝐻𝐿𝐿 𝐻𝑅𝑅 𝐻𝐿𝐿
逆フィルタ𝐆𝑩 により制御した耳元の音𝑌𝐵 (𝜔)は次式となる.
𝑌
𝐻𝐿𝐿
0
𝑋
𝒀𝑩 = ( 𝐿 ) = (
)( 𝐿)
(15)
𝑌𝑅
0
𝐻𝑅𝑅
𝑋𝑅
2つの式(13),(15)ともクロストーク部分が計算式上で打ち
消され,値が 0 になっていることが分かる.なお,ここでは
分母が小さくなることで起こる発散を防ぐ処理を導入してい
𝐻𝑅𝐿
𝐻𝐿𝐿
の分母
𝐻𝐿𝐿 を例に発散防止処理について説明する.今回の発散防止
処理は次の式(16)で行った.
𝐺𝑅𝐿 =-𝐻𝑅𝐿 ×
𝐻𝐿𝐿 ∗
|𝐻𝐿𝐿 |2 +C
0
20
10
0
音圧[dB]
10
音圧[dB]
音圧[dB]
30
20
10
0
20
10
0
-10
-10
-10
-10
-20
-20
-20
-20
0
0.5
1
1.5
周波数[Hz]
RL
2
x 10
0
0.5
4
1
1.5
周波数[Hz]
RR
50
2
x 10
0
0.5
4
1
1.5
周波数[Hz]
RL
50
2
x 10
40
40
40
30
30
30
30
10
0
-10
-20
20
10
0
0
0.5
1
1.5
周波数[Hz]
-20
2
x 10
4
20
10
0
-10
-10
0
0.5
1
1.5
周波数[Hz]
-20
2
x 10
4
0.5
1
1.5
周波数[Hz]
RR
50
40
20
0
4
2
x 10
4
20
10
0
-10
0
0.5
1
1.5
周波数[Hz]
-20
2
x 10
4
0
0.5
1
1.5
周波数[Hz]
2
x 10
4
(a)従来の逆フィルタ𝐺𝐴
(b)新しい逆フィルタ𝐺𝐵
図3 逆フィルタで補正した TSP 応答の周波数特性
左が従来,右が新しい逆フィルタで補正したものである.
新しい逆フィルタの方が,直達成分𝐿𝐿,𝑅𝑅の特性が平坦に
近づいている.これは周波数特性として望ましいものである
が,主観的に評価の高いシステムが必ずしも周波数特性がフ
ラットであるとは限らない.また,実際に逆フィルタを音源
に畳み込み,インパルス応答を録音した環境で再生した場
合,どちらの逆フィルタが録音環境をより再現しているか,
客観的に評価を行うのは困難である.そこで,主観評価によ
りどちらの逆フィルタが良いか確かめる比較実験を行った.
実験内容は2つの逆フィルタで補正した音を5人の被験者に
実際に受聴させ,どちらがより録音環境を再現していたか答
えるものである.なお,音源は自分の周りを回転して収録し
た長さ 20 秒程のピアノの音であり,評価基準として,音質
よりも立体感を重視して選ぶよう教示した.実験の結果が表
1である.
表1 従来と新しい逆フィルタの比較実験
(11)
まず従来の設計法 A では,𝐻𝑅𝐿 (𝜔),𝐻𝐿𝑅 (𝜔)のクロストークの
みを打ち消し,その他の経路はそのまま制御を行わない(対角
成分は 1)として設計する.なお設計法 A ではクロストークキ
ャンセルによる音質の変化は補正されない.逆フィルタ𝑮𝑨 は
次式で設計する.
𝐻
1 − 𝑅𝐿
𝐻𝐿𝐿
𝑮𝑨 = (
)
(12)
𝐻
− 𝐿𝑅
1
る.式(12)の逆フィルタにおける右上の要素−
40
30
20
LR
50
40
30
音圧[dB]
相対振幅
0.5
LL
50
40
30
50
音圧[dB]
0.6
LR
50
40
音圧[dB]
LL
RR
0.7
最大値
この
範囲の
最小値
LL
50
音圧[dB]
エンベロープ波形
C はこの負担を軽減する役割も担う.本研究では C = 0.3 と
した.これら2つの逆フィルタによる制御精度の比較を行
う.図3はそれぞれの逆フィルタで補正した TSP 応答の振
幅周波数特性である.横軸は周波数で縦軸は音圧レベル[dB]
である.
音圧[dB]
クホンとスピーカーからの距離が1.7mまでは精度が高
いという3つから,最大値の点から88を引いた点と指定
した.次いで終点は,手動でインパルス応答を切り出す
場合のサンプル点は100~150程であることから,最大
値の点から88を足した点と,最大値の点から154を足し
た点の範囲の最小値と指定することとした.
(16)
ここで*は複素共役,C は発散防止係数を表す.分母分子に
𝐻𝐿𝐿 の複素共役を乗算し,分母で𝐻𝐿𝐿 の絶対値をとった後,C
を加算する.また,逆フィルタ𝐺の分母(元の信号)分子
(クロストーク除去信号)の比率が1を超えると,クロスト
ークキャンセルの負担が大きくなり,処理が不安定になる.
表1から新しい逆フィルタ𝑮𝑩 が良いという結果となった.
従来の逆フィルタでも音の拡がりを感じた被験者が多かった
が,新しい逆フィルタではそれがさらに大きく,音が遠くか
ら聴こえるという意見があった.音質に関しての違いは,特
に見受けられなかった.以上より,主観及び客観評価共に新
しい逆フィルタの方が良いという結果となった.今回の実験
の結果から,クロストークのみを打ち消すよりも,クロスト
ーク除去により,最終的に出力される音の周波数特性に着目
し,スピーカの音質を保つよう補正する方が良いといえる.
6.結論及び今後の課題
インパルス応答を自動的に切り出す処理を開発した.手動
で切り出す場合とほぼ同じ結果が得られ,自動化が有効に動
作することを確認した.逆フィルタ生成方法の改善に関して
は,客観的に音質が改善されただけで無く,5人の被験者によ
る主観評価でも良い結果が得られた.しかし,上下,前後の
立体感を感じた被験者は少なかった.2chの音の信号から上
下・前後の立体感を生み出す方法を模索することが今後の課
題である.
7.参考文献
[1] 日東紡音響エンジニアリング株式会社,”2ch音場再現シ
ステム OSS”
http://www.noe.co.jp/technology/18/18inv1.html
[2] パイオニア株式会社,”フロントサラウンド・アドバン
ス”
http://pioneer.jp/hometheater/archives_07_08/tech/tech
01.html
[3] 濱崎 公男,”高臨場感マルチチャンネル音響システムの
動向”,映像情報メディア学会誌,Vol. 61, No. 5,
pp. 624-628,2007
[4] 大庭 涼 ”OSS における逆フィルタ生成方法の改善” 卒
業論文 工学院大学 情報学部,2012
[5] 鈴木陽一他,”時間引き伸ばしパルスの設計法に関する考
察”,電子情報通信学会技術研究報告,Vol. 92, No. 380,
pp. 17-24, 1992