OSSにおける逆フィルタ設計の自動化と改良 Automatic design and improvement of an inverse filter for OSS 大木 裕介(コンピュータ科学科) Yusuke Ohki 数理音響学研究室 指導教員 中島 弘史准教授 1.はじめに 本研究は,スピーカーを用いた立体音場システム OSS(Ortho-Stereophonic System)における逆フィルタの改 善及び自動化を目的としている.OSS とは,バイノーラル録 音された音源を 2ch スピーカーから再生する立体音場収音・ 再生システムである.このシステムでは音源をスピーカーか ら再生する際に,逆フィルタを用いて受聴者に届く音を耳元 でコントロールし,録音環境と同じ音を両耳の点で再現する ことにより,立体音場の再現を可能にする. 2.背景,目的及びアプローチ 現在,2chスピーカーや5.1chサラウンドシステムを用いた 立体音場システム(OSS)に関する研究や開発が行われてお り,2ch音場再現システム[1],フロントサラウンド・アドバ ンス[2]などが存在する.だが,前者は非常に高価であり, 後者は5.1chサラウンドシステムを採用しているので,2chに 比べるとスペースが限定される.立体音場の研究では,多数 のスピーカー利用したシステムが主であり,少ないスピーカ ーで立体音場を実感するシステムは少ない[3].そして,先 行研究[4]では2chスピーカーによる立体音場システム(OSS) の構築に成功しているものの,構築過程に手動で行う箇所が 存在するため,非常に手間と時間がかかるという課題があ る.そこで,本研究の目的は手軽にOSSを行えるようにする こと,及びより立体音場を実感できるOSSを構築することと した.そのためのアプローチとして,従来に手動で調整して いたパラメータの自動決定や,逆フィルタ生成方法の改善, 従来のOSSとの比較・評価の3つを行う. 3.OSSの構築 まず,OSS構築環境の簡略図を示す. 𝑿𝑳 (𝜔) 𝑯𝑳𝑳 (𝜔) 𝒀𝑳 (𝜔) 𝑿𝑹 (𝜔) 𝑯𝑳𝑹 (𝜔) 𝑯𝑹𝑳 (𝜔) 𝑯𝑹𝑹 (𝜔) 𝒀𝑹 (𝜔) 図1 OSSの構築環境 図1から人の耳に届く音の周波数特性をベクトル 𝑌 (𝜔) 𝒀(𝜔) = ( 𝐿 ) (1) 𝑌𝑅 (𝜔) スピーカーからの出力信号の周波数特性をベクトル 𝑋 (𝜔) 𝑿(𝜔) = ( 𝐿 ) (2) 𝑋𝑅 (𝜔) 事前に計測した頭部伝達関数を行列 𝐻 (𝜔) 𝐻𝑅𝐿 (𝜔) 𝑯(𝜔) = ( 𝐿𝐿 ) (3) 𝐻𝐿𝑅 (𝜔) 𝐻𝑅𝑅 (𝜔) と定義する.ここで𝜔は角周波数である.𝐿は左,𝑅は右を表 し,𝐿𝐿,𝑅𝐿,𝐿𝑅,𝑅𝑅はスピーカーから人間の耳への音の伝 達経路を表す.𝑅𝐿を例に挙げると右のスピーカーから左の 耳に届くという意味である.𝑯(𝜔)をIFFTしたものを𝒉(𝑡)と する. 𝑡は時間,IFFTは逆フーリエ変換であり周波数領域か ら時間領域への変換を行う演算である.ここで定義した変数 及び関数は後述でも同じ意味で用いる.これらを元にOSSの 構築手順を説明する. 3.1 高いSN比を持つTSP信号[5]を左右2つのスピーカーか ら順に再生し,同時に受聴者の両耳に付けたマイクロ ホンで録音する.この音を元に𝐻𝐿𝐿 (𝜔),𝐻𝑅𝐿 (𝜔), 𝐻𝐿𝑅 (𝜔),𝐻𝑅𝑅 (𝜔)を算出する.以降𝐿𝐿を例として説明す る.録音した出力信号𝑌𝐿 (𝜔)及び入力信号であるTSP信 号の周波数特性𝑆(𝜔)から伝達関数行列𝐻𝐿𝐿 (ω)を次式で 求める.今回はN=216 とした. 𝐻𝐿𝐿 (𝜔) = 𝑌𝐿 (𝜔) / 𝑆(𝜔) (4) 3.2 インパルス(非常に短いパルス)信号を流した時に得られ るシステムの出力であるインパルス応答を求める.式 (4)から得られた伝達関数行列を長さNでIFFTすること で,インパルス応答を次式により算出する. ℎ𝐿𝐿 (𝑡) = IFFT { 𝐻𝐿𝐿 (𝜔),N } (5) これを𝑅𝐿,𝐿𝑅,𝑅𝑅にもそれぞれ適用し,各経路のイン パルス応答を求める. 3.3 3.2 により得られたインパルス応答ℎ𝐿𝐿 ,ℎ𝐿𝑅 ,ℎ𝑅𝐿 , ℎ𝑅𝑅 を用いて逆フィルタ𝒈(𝑡)を生成する.ここで測定 により得たインパルス応答には,不要な雑音部分や制 御が困難な長い残響が含まれる.高品質なOSSを実現 するためには,この不要部分を手動で切り出す必要が ある.不要部を除去したインパルス応答をフーリエ変 ̃ (𝜔)を利用し,逆フ 換することで求めた伝達関数行列𝑯 ィルタ生成を次式で求める. ̃ −𝟏 (𝜔),N } (6) 𝒈(𝑡) = IFFT { 𝑯 3.4 3.3 により得られた逆フィルタを𝒈(𝑡),音源ベクトル 𝑢𝐿 (𝑡) 𝒖(𝑡)=( )とすると,出力すべき音のベクトル𝒛(𝑡) 𝑢𝑅 (𝑡) は次式で計算できる. 𝒛(𝑡)= 𝒖(𝑡)*𝒈(𝑡) (7) ここで*は行列とベクトルの積を畳み込みに置き換え た演算である.𝒛(𝑡)を出力することで,耳元の音のベ クトル𝒚(𝑡)は,音源のベクトル𝒖(𝑡)と理論上一致し, 原音場での耳元の音圧が再生音場にて再現される. 4.インパルス応答の自動切り出し 設計作業の効率化のために3.3で述べたインパルス応答の 切り出しを自動化する.今回の切り出しでは想定条件とし て,サンプリング周波数44100Hz,音速340m/s,マイクと スピーカーの距離が1mとした.手動でインパルス応答を切 り出す場合のサンプル点は100~150程が最適であることが 実験的に明らかになっている.これは壁や床からの反射する 音の経路を含め,音源と受聴点の距離が1.7m程度までは逆 フィルタによる制御精度が高く,逆に2.2m程度を超えると 低くなることによる.これらの条件を元に,切り出しの始点 と終点の自動取得を行う. 4.1 初めに波形の概形であるエンベロープを算出する.こ れにより波形の細かい変動が除去されて主要な範囲が求 めやすくなる.エンベロープ𝑦(𝑡)は以下の式(8)~(10)で 設計した. 𝑋(𝜔) = FFT { 𝑥(𝑡),N } 𝑋̃(𝜔)= 0 2𝑋(𝜔) 𝜔 > 0 𝜔 ≦ 0 𝑒(𝑡) = |IFFT { 𝑋̃(𝜔) ,N }| (8) (9) (10) 𝑋(𝜔)は𝑥(𝑡)の周波数特性,𝑒(𝑡)は時間波形𝑥(𝑡)のエンベ ロープ波形である. 4.2 実際に始点と終点を自動取得した結果を図2に示す. 横軸は時間𝑡で縦軸は相対振幅である.具体的な手順を 説明する.始点は,最大値までの距離が1mであるこ と,音が1m進むサンプル時間が129点となること,マイ 0.4 最大値から 88 を足した点 0.3 0.2 最大値から 88 を 引いた点 0.1 0 図.2 図.2 始点と終点の自動決定 最大値から 154 を足した点 2900 2950 3000 3050 3100 3150 3200 3250 3300 3350 時間 図2 始点と終点の自動取得 エンベロープ波形から得た2つの点により,元のインパル ス応答の波形の切り出しを行う. 5.逆フィルタ比較実験 クロストークを除去する逆フィルタを2つの方法(A,B) で設計した.クロストークとはそれぞれのスピーカーから出 た音が出力された側と左右反対側の耳に届く音の伝達経路の ことである.この逆フィルタは先行研究[4]で逆行列により 設計した理論上完全な逆フィルタより音質が良いことが,実 験的に明らかになっている.左右それぞれの耳に届く音を頭 部伝達関数,スピーカーからの出力特性を用いて表すと式 (11)のようになる.なお,次の式から𝜔を省略する. ( 𝑌𝐿 𝐻 𝐻 𝑋 )=( 𝐿𝐿 𝐿𝑅 ) ( 𝐿 ) 𝑌𝑅 𝐻𝑅𝐿 𝐻𝑅𝑅 𝑋𝑅 𝐻𝑅𝑅 逆フィルタ𝑮𝑨 により制御した耳元の音𝑌𝐴 (𝜔)は次式となる. 𝐻 𝐻 𝐻𝐿𝐿 − 𝑅𝐿 𝐿𝑅 0 𝑌𝐿 𝑋𝐿 𝐻𝑅𝑅 𝒀𝑨 = ( ) = ( 𝐻𝐿𝑅 𝐻𝑅𝐿 ) (𝑋 ) (13) 𝑌𝑅 𝑅 0 𝐻𝑅𝑅 − 𝐻𝑅𝑅 設計法 B ではクロストークを打ち消し,さらに最終的に再 生する音を元のスピーカの音質と同じになるよう制御するも のである.この逆フィルタ𝑮𝑩 は次式で考えられる. 𝐻𝐿𝐿 𝐻𝑅𝑅 −𝐻𝑅𝐿 𝐻𝑅𝑅 1 𝑮𝑩 = ( ) (14) 𝐻𝐿𝐿 𝐻𝑅𝑅 −𝐻𝑅𝐿𝐻𝐿𝑅 −𝐻𝐿𝑅 𝐻𝐿𝐿 𝐻𝑅𝑅 𝐻𝐿𝐿 逆フィルタ𝐆𝑩 により制御した耳元の音𝑌𝐵 (𝜔)は次式となる. 𝑌 𝐻𝐿𝐿 0 𝑋 𝒀𝑩 = ( 𝐿 ) = ( )( 𝐿) (15) 𝑌𝑅 0 𝐻𝑅𝑅 𝑋𝑅 2つの式(13),(15)ともクロストーク部分が計算式上で打ち 消され,値が 0 になっていることが分かる.なお,ここでは 分母が小さくなることで起こる発散を防ぐ処理を導入してい 𝐻𝑅𝐿 𝐻𝐿𝐿 の分母 𝐻𝐿𝐿 を例に発散防止処理について説明する.今回の発散防止 処理は次の式(16)で行った. 𝐺𝑅𝐿 =-𝐻𝑅𝐿 × 𝐻𝐿𝐿 ∗ |𝐻𝐿𝐿 |2 +C 0 20 10 0 音圧[dB] 10 音圧[dB] 音圧[dB] 30 20 10 0 20 10 0 -10 -10 -10 -10 -20 -20 -20 -20 0 0.5 1 1.5 周波数[Hz] RL 2 x 10 0 0.5 4 1 1.5 周波数[Hz] RR 50 2 x 10 0 0.5 4 1 1.5 周波数[Hz] RL 50 2 x 10 40 40 40 30 30 30 30 10 0 -10 -20 20 10 0 0 0.5 1 1.5 周波数[Hz] -20 2 x 10 4 20 10 0 -10 -10 0 0.5 1 1.5 周波数[Hz] -20 2 x 10 4 0.5 1 1.5 周波数[Hz] RR 50 40 20 0 4 2 x 10 4 20 10 0 -10 0 0.5 1 1.5 周波数[Hz] -20 2 x 10 4 0 0.5 1 1.5 周波数[Hz] 2 x 10 4 (a)従来の逆フィルタ𝐺𝐴 (b)新しい逆フィルタ𝐺𝐵 図3 逆フィルタで補正した TSP 応答の周波数特性 左が従来,右が新しい逆フィルタで補正したものである. 新しい逆フィルタの方が,直達成分𝐿𝐿,𝑅𝑅の特性が平坦に 近づいている.これは周波数特性として望ましいものである が,主観的に評価の高いシステムが必ずしも周波数特性がフ ラットであるとは限らない.また,実際に逆フィルタを音源 に畳み込み,インパルス応答を録音した環境で再生した場 合,どちらの逆フィルタが録音環境をより再現しているか, 客観的に評価を行うのは困難である.そこで,主観評価によ りどちらの逆フィルタが良いか確かめる比較実験を行った. 実験内容は2つの逆フィルタで補正した音を5人の被験者に 実際に受聴させ,どちらがより録音環境を再現していたか答 えるものである.なお,音源は自分の周りを回転して収録し た長さ 20 秒程のピアノの音であり,評価基準として,音質 よりも立体感を重視して選ぶよう教示した.実験の結果が表 1である. 表1 従来と新しい逆フィルタの比較実験 (11) まず従来の設計法 A では,𝐻𝑅𝐿 (𝜔),𝐻𝐿𝑅 (𝜔)のクロストークの みを打ち消し,その他の経路はそのまま制御を行わない(対角 成分は 1)として設計する.なお設計法 A ではクロストークキ ャンセルによる音質の変化は補正されない.逆フィルタ𝑮𝑨 は 次式で設計する. 𝐻 1 − 𝑅𝐿 𝐻𝐿𝐿 𝑮𝑨 = ( ) (12) 𝐻 − 𝐿𝑅 1 る.式(12)の逆フィルタにおける右上の要素− 40 30 20 LR 50 40 30 音圧[dB] 相対振幅 0.5 LL 50 40 30 50 音圧[dB] 0.6 LR 50 40 音圧[dB] LL RR 0.7 最大値 この 範囲の 最小値 LL 50 音圧[dB] エンベロープ波形 C はこの負担を軽減する役割も担う.本研究では C = 0.3 と した.これら2つの逆フィルタによる制御精度の比較を行 う.図3はそれぞれの逆フィルタで補正した TSP 応答の振 幅周波数特性である.横軸は周波数で縦軸は音圧レベル[dB] である. 音圧[dB] クホンとスピーカーからの距離が1.7mまでは精度が高 いという3つから,最大値の点から88を引いた点と指定 した.次いで終点は,手動でインパルス応答を切り出す 場合のサンプル点は100~150程であることから,最大 値の点から88を足した点と,最大値の点から154を足し た点の範囲の最小値と指定することとした. (16) ここで*は複素共役,C は発散防止係数を表す.分母分子に 𝐻𝐿𝐿 の複素共役を乗算し,分母で𝐻𝐿𝐿 の絶対値をとった後,C を加算する.また,逆フィルタ𝐺の分母(元の信号)分子 (クロストーク除去信号)の比率が1を超えると,クロスト ークキャンセルの負担が大きくなり,処理が不安定になる. 表1から新しい逆フィルタ𝑮𝑩 が良いという結果となった. 従来の逆フィルタでも音の拡がりを感じた被験者が多かった が,新しい逆フィルタではそれがさらに大きく,音が遠くか ら聴こえるという意見があった.音質に関しての違いは,特 に見受けられなかった.以上より,主観及び客観評価共に新 しい逆フィルタの方が良いという結果となった.今回の実験 の結果から,クロストークのみを打ち消すよりも,クロスト ーク除去により,最終的に出力される音の周波数特性に着目 し,スピーカの音質を保つよう補正する方が良いといえる. 6.結論及び今後の課題 インパルス応答を自動的に切り出す処理を開発した.手動 で切り出す場合とほぼ同じ結果が得られ,自動化が有効に動 作することを確認した.逆フィルタ生成方法の改善に関して は,客観的に音質が改善されただけで無く,5人の被験者によ る主観評価でも良い結果が得られた.しかし,上下,前後の 立体感を感じた被験者は少なかった.2chの音の信号から上 下・前後の立体感を生み出す方法を模索することが今後の課 題である. 7.参考文献 [1] 日東紡音響エンジニアリング株式会社,”2ch音場再現シ ステム OSS” http://www.noe.co.jp/technology/18/18inv1.html [2] パイオニア株式会社,”フロントサラウンド・アドバン ス” http://pioneer.jp/hometheater/archives_07_08/tech/tech 01.html [3] 濱崎 公男,”高臨場感マルチチャンネル音響システムの 動向”,映像情報メディア学会誌,Vol. 61, No. 5, pp. 624-628,2007 [4] 大庭 涼 ”OSS における逆フィルタ生成方法の改善” 卒 業論文 工学院大学 情報学部,2012 [5] 鈴木陽一他,”時間引き伸ばしパルスの設計法に関する考 察”,電子情報通信学会技術研究報告,Vol. 92, No. 380, pp. 17-24, 1992
© Copyright 2024 Paperzz