頭部伝達関数の第 2 ピークが正中面上方の音像定位に及ぼす影響

一般社団法人 電子情報通信学会
THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS
信学技報
IEICE Technical Report
頭部伝達関数の第 2 ピークが正中面上方の音像定位に及ぼす影響
飯田 一博†
石井 要次‡
{†先進工学部, ‡大学院工学研究科 } 千葉工業大学
275-0016 千葉県習志野市津田沼 2-17-1
E-mail:
†[email protected],
‡[email protected]
あらまし 4kHz 付近の最も周波数の低いピーク(P1)と P1 より高い周波数で最も周波数の低い 2 つのノッチ(N1,
N2)だけで再構成されたパラメトリック頭部伝達関数(HRTF)は,前方と後方において実測 HRTF と同等の音像定位
精度を有することが報告されている.しかし,上方については,被験者によっては音像定位精度が低下する.本論
文では,上半球正中面において 2 つの音像定位実験を行った.実験結果は以下のとおりである.(1) N1N2P1 に P2
を加えることにより,90°および 120°で音像定位精度が向上した.(2) N1N2P1+P2 と実測 HRTF の音像定位誤差の差
は,目標とする 7 方向すべてにおいて 10°未満であった.(3) P2 だけを再現しても音像は上方に知覚されなかった.
また,HRTF を観察したところ,90°での N1 のレベルはノッチの検知限を超えないが,P2 を加えることにより N1
の相対レベルは検知可能となることが明らかになった.以上より,P2 それ自身はスペクトラルキューではないが,
P2 は N1 を強調することにより,正中面上方の音像定位に重要な役割を果たしていると言える.
Keyword 頭部伝達関数,音像定位,正中面,スペクトラルキュー,ピーク,ノッチ
Effects of the second lowest frequency spectral peak in head-related transfer
functions on the sound localization for the upper direction in the median plane
Kazuhiro IIDA† and
Yohji ISHII‡
{†Faculty of Advanced Engineering, ‡Graduate School } Chiba Institute of Technology
2-17-1 Tsudanuma, Narashino, Chiba, 275-0016 Japan
E-mail:
†[email protected],
‡[email protected]
Abstract It is reported that the parametric head-related transfer function (HRTF) recomposed of only the lowest frequency
peak around 4 kHz (P1) and the two lowest frequency notches (N1 and N2) above P1 provided approximately the same
localization performance as the measured HRTFs for the front and rear directions. However, for the upper directions, the
localization performance for some of the subjects decreased. In the present study, two localization tests were carried out in the
upper median plane. The results revealed the following: (1) the localization performance was improved by adding P2 to
N1N2P1 at the vertical angles of 90° and 120°; (2) the difference in localization error between N1N2P1+P2 and the measured
HRTF was less than 10° at all seven target vertical angles; and (3) a sound image was not perceived in the upward direction by
reproducing only P2. An observation of the HRTFs revealed that the level of N1 doesn’t exceed the threshold for the notch
detection at a vertical angle of 90°. However, by adding P2, the relative level of N1 becomes detectable. Therefore, P2 is not a
spectral cue, but, by enhancing N1, plays an important role in the localization for the upper directions in the median plane.
Keyword head-related transfer function, sound localization, the median plane, spectral cue, peak, notch
1. は じ め に
は周波数応答曲線における明確なノッチは,音源が前
ヒ ト の 頭 部 伝 達 関 数 (HRTF: head-related transfer
半球正中面の上方から下方に移動すると,低い周波数
function)の 5 kHz 以 上 の ノ ッ チ や ピ ー ク が 音 像 の 上 昇
に 移 動 す る こ と を 示 し た .Raykar et al. (2005)は 耳 介 に
角知覚に顕著に貢献していることは広く知られている.
よる深いノッチは仰角知覚に重要な特徴であり,ノッ
Shaw and Teranishi (1968)は 音 源 の 仰 角 が –45°か ら 45°
チ周波数は耳介の物理的な寸法や形状に関連すると報
に 変 化 す る と ノ ッ チ 周 波 数 が 6 kHz か ら 10 kHz に 変 化
告している.
す る こ と を 報 告 し て い る . Butler and Belendiuk (1977)
ノッチやピークの生成メカニズムも研究されてい
This article is a technical report without peer review, and its polished and/or extended version may be published elsewhere.
Copyright ©20●● by IEICE
る . Gardner and Gardner (1973)は 耳 介 の 窪 み を 順 次 埋
像定位性能に影響しないこと,つまり正中面定位に利
めて正中面音像定位実験を行い,耳介の閉塞を進める
用 さ れ て い る 特 性 は 3.8 か ら 16 kHz で あ る こ と を 示 し
と音像定位性能が低下すること,および低域成分と比
た.さらに彼らは,フィルタ処理なしと比較して,あ
較して高域成分がより重要であることを示した.
る 方 向 に 1.5 倍 以 上 の 回 答 が 得 ら れ た フ ィ ル タ を ス ペ
Musicant and Butler (1984)は , 4 kHz 低 域 通 過 ノ イ ズ と
クトラルキューと定義し,前方のキューは低域側のカ
比 較 し て , 4 kHz 高 域 通 過 ノ イ ズ は 有 意 に 重 要 で あ る
ッ ト オ フ 周 波 数 が 4 kHz か ら 8 kHz の 間 に あ る 1 オ ク
こ と , お よ び 4 kHz 高 域 通 過 ノ イ ズ に お い て は 耳 介 の
タ ー ブ ノ ッ チ と 13 kHz 以 上 の エ ネ ル ギ ー の 上 昇 ,上 方
閉塞により多くの前後誤判定が発生することを報告し
の キ ュ ー は 7 kHz か ら 9 kHz の 間 の 1/4 オ ク タ ー ブ の
た . Iida et al. (1998)は 耳 介 の 主 要 な 3 つ の 窪 み , す な
ピ ー ク , そ し て 後 方 の キ ュ ー は 10 kHz か ら 12 kHz の
わ ち 舟 状 窩 (scapha), 三 角 窩 (fossa), 耳 甲 介 腔 (concha)
間 に あ る 小 さ な ピ ー ク (こ の ピ ー ク の 高 域 側 お よ び 低
を 粘 土 で 閉 塞 し て 音 像 定 位 実 験 と HRTF 測 定 を 行 っ た
域 側 で の エ ネ ル ギ ー の 減 衰 を 伴 う )で あ る と 報 告 し た .
(粘 土 に は 外 耳 道 と 同 じ 直 径 の 穴 を 開 け ,外 耳 道 を 外 と
Iida et al. (2007)は 上 昇 角 音 像 定 位 を シ ミ ュ レ ー ト す
繋 げ て い る ). そ の 結 果 , 3 kHz 以 下 で は 全 て の 窪 み を
る パ ラ メ ト リ ッ ク HRTF モ デ ル を 提 案 し た . パ ラ メ ト
閉 塞 し て も ,そ の HRTF は 閉 塞 し て い な い 耳 介 の HRTF
リ ッ ク HRTF は , 音 源 の 上 昇 角 に 依 存 し な い 4 kHz の
と 同 等 で あ る が , 耳 甲 介 腔 を 閉 塞 す る だ け で 4 kHz 付
ピ ー ク (Shaw and Teranishi, 1968)を 下 限 周 波 数 と し て ,
近 の ピ ー ク と 4 kHz か ら 10 kHz の 間 の 鋭 い ノ ッ チ が 消
受 聴 者 の 実 測 HRTF か ら 抽 出 し た ノ ッ チ や ピ ー ク か ら
滅 し た . ま た , 耳 甲 介 腔 を 閉 塞 し た HRTF の 音 像 定 位
再構成される.ノッチとピークは周波数の順にラベル
精 度 は 閉 塞 し て い な い HRTF と 比 較 し て 有 意 に 低 下 し
が つ け ら れ る (P1, N1, P2, N2, ・ ・ ・ の よ う に ). ノ ッ
た.これらより,彼らは正中面音像定位のスペクトラ
チとピークは中心周波数,レベル,先鋭度でパラメト
ル キ ュ ー は 耳 甲 介 腔 の 伝 達 関 数 の 4 kHz 以 上 に 存 在 す
リックに表現される.彼らは上半球正中面において音
る と 結 論 付 け た . Takemoto et al. (2012) は FDTD
像 定 位 実 験 を 行 い 以 下 の こ と を 示 し た . (1) す べ て の
(finite-difference time-domain)法 を 用 い て 頭 部 形 状 か ら
ノ ッ チ と ピ ー ク で 再 構 成 さ れ た パ ラ メ ト リ ッ ク HRTF
HRTF を 計 算 し , 耳 介 が HRTF の 基 本 的 な ピ ー ク ・ ノ
は 被 験 者 本 人 の 実 測 HRTF と 同 等 の 定 位 性 能 を 有 す る .
ッチパターンを決定していると報告した.ピークは耳
(2) 4 kHz 付 近 の 第 1 ピ ー ク (P1)と ,P1 周 波 数 よ り 高 く
介のノーマルモードと一致する.ノッチ周波数では耳
最 も 周 波 数 の 低 い 2 つ の ノ ッ チ (N1, N2)だ け で 再 構 成
甲 介 舟 (cymba)と 三 角 窩 に 腹 が 生 じ ,耳 甲 介 腔 に 節 が 生
さ れ た パ ラ メ ト リ ッ ク HRTF は , 前 方 と 後 方 に お い て
じる.
は 被 験 者 本 人 の 実 測 HRTF と 同 等 の 定 位 性 能 を 有 す る .
ノッチとピークについては,微細構造よりむしろ概
(3) し か し 上 方 に お い て は , N1, N2, P1 で 再 構 成 さ れ
形 が 重 要 で あ る こ と が 報 告 さ れ て い る . Asano et al.
た パ ラ メ ト リ ッ ク HRTF の 音 像 定 位 性 能 は , 被 験 者 に
(1990)は ARMA モ デ ル で 平 滑 化 し た HRTF を ヘ ッ ド ホ
よ っ て は 本 人 の 実 測 HRTF と 比 較 し て 低 下 す る .(4) N1
ンで再生する正中面音像定位実験を行い,仰角判断の
と N2 の 周 波 数 は 音 源 の 上 昇 角 に 強 く 依 存 す る が , P1
主 要 な 手 掛 か り は 5 kHz 以 上 の 高 域 に あ り , ピ ー ク や
周波数はほぼ一定で上昇角に依存しない.これらの結
ノッチの微細部分ではなく巨視的なパターンの情報が
果 よ り ,彼 ら は N1 と N2 は ,少 な く と も 前 方 と 後 方 で
利 用 さ れ て い る こ と を 示 し た . Kulkarni and Colburn
は,スペクトラルキューとして重要な役割を果たして
(1998) は チ ュ ー ブ ホ ン (tube-phones)を 用 い て , 水 平 面
いると結論付けた.さらに彼らは,ヒトの聴覚システ
内 (方 位 角 : –45°, 0°, 45°, 180°)の 被 験 者 本 人 の HRTF
ム が 耳 入 力 信 号 か ら N1 と N2 を 分 析 す る た め の 参 照 情
の振幅スペクトルを 7 段階で平滑化して音像定位実験
報 と し て P1 を 用 い て い る 可 能 性 を 指 摘 し た .
を行い,微細なスペクトル構造は,ノッチやピークの
先 に 述 べ た よ う に ,Hebrank and Wright (1974)は 上 方
概形と比較すると,相対的に重要ではないことを示し
の ス ペ ク ト ラ ル キ ュ ー は 7 kHz か ら 9 kHz の 間 の 1/4
た.ただし,ノッチの 1 つが消滅するような過度な平
オクターブのピークであると主張した.このピークは
滑化を施すと,音像の仰角は上昇した.
P2 と 一 致 し , さ ら に Blauert (1969/70)が 提 案 し た 上 方
上昇角知覚のスペクトラルキューについても研究
の方向決定帯域とも一致する.しかし,狭帯域信号を
が 進 め ら れ て い る .Hebrank and Wright (1974)は 上 半 球
用いて得られた方向決定帯域が広帯域信号に対するス
正 中 面 (–30°か ら +210°ま で ,30°間 隔 )に 設 置 さ れ た ス ピ
ペクトラルキューの役割を果たすか否かは不明であ
ーカを用いて無響室で音像定位実験を行った.刺激は
る.
帯 域 幅 が low-pass, high-pass, band-pass, band-stop
本 論 文 は 2 つ の 目 的 を 有 す る . 1 つ は , N1,N2,P1 に
filters で 制 限 さ れ た 白 色 雑 音 で あ る .彼 ら は 16 kHz 以
P2 を 加 え , N1,N2,P1,P2 で 再 構 成 さ れ た パ ラ メ ト リ ッ
上 も し く は 3.8 kHz 以 下 の ス ペ ク ト ル エ ネ ル ギ ー は 音
ク HRTF が 上 方 に お い て 実 測 HRTF と 同 等 の 音 像 定 位
性能を有するか否かを検証することである.もう 1 つ
30°か ら 150°で は , 被 験 者 に よ っ て は N1,N2 は 浅 く
の 目 的 は , 正 中 面 上 方 の 音 像 定 位 に お け る P2 の 役 割
て不明瞭な場合があるので,以下のアルゴリズムによ
を解明することである.
り N1,N2 を 抽 出 し た .
(1) FFT に よ り 512 サ ン プ ル の HRIR の 振 幅 ス ペ ク ト
本論文では,方位角と仰角ではなく,側方角と上昇
角 で 表 現 し た 耳 軸 座 標 系 (Morimoto and Aokata, 1984)
ルを求め,差分法で極小値をすべて検出する.
(2) Iida and Ishii (2011)が 報 告 し た 以 下 の 回 帰 式 を 用
を用いる.上昇角は,音源を通る矢状面において,音
源と耳軸を結ぶ直線と水平線がなす角と定義する.
い て N1,N2 周 波 数 を 算 出 す る . 彼 ら は , 正 面 方 向 の
N1,N2 周 波 数 は 被 験 者 に 強 く 依 存 す る が , 上 昇 角 の 関
2. パ ラ メ ト リ ッ ク HRTF の 再 構 成 方 法
数 と し て の N1,N2 周 波 数 の 振 舞 い は 被 験 者 間 で 共 通 で
2.1. HRTF の 測 定
あるとみなせると報告している.
無 響 室 に お い て ,22–24 歳 の 3 人 の 男 性 被 験 者 (MKI,
OIS, OTK)お よ び 1 人 の 女 性 被 験 者 (YSD)の 上 半 球 正 中
面 7 方 向 (30°間 隔 )の HRTF を 測 定 し た .測 定 用 信 号 は
swept sine wave で ,サ ン プ リ ン グ 周 波 数 は 48 kHz で あ
る . 測 定 用 信 号 は 上 半 球 正 中 面 に 30°間 隔 で 設 置 し た
直 径 80mm の ス ピ ー カ (FOSTEX FE83E)か ら 提 示 し た .
ス ピ ー カ か ら 被 験 者 の 頭 部 中 心 ま で の 距 離 は 1.2m で
ある.被験者の外耳道入口で測定用信号を収録するた
め ,耳 栓 型 マ イ ク ロ ホ ン (Iida et al., 2014)を 用 い た .マ
10
𝑓𝑓/0
60
𝛽𝛽 = 1.001×1067 ×𝛽𝛽 8 − 6.431×106= ×𝛽𝛽 = + 8.686×
×𝛽𝛽 @ − 3.265×1060 ×𝛽𝛽 + 𝑓𝑓/0 0
[Hz]
(2)
𝑓𝑓/@ 𝛽𝛽 = 1.310×1067 ×𝛽𝛽 8 − 5.154×106= ×𝛽𝛽 = + 5.020×
1060 ×𝛽𝛽 @ + 2.563×10×𝛽𝛽 + 𝑓𝑓/@ 0
[Hz]
(3)
こ こ で 𝑓𝑓/0 と 𝑓𝑓/@ は そ れ ぞ れ N1,N2 周 波 数 を 表 し ,𝛽𝛽は 上
昇角である.
イクロホンの振動板は被験者の外耳道入口に位置し,
(3) (1)で 検 出 し た 極 小 値 の う ち , (2)で 算 出 し た N1,
blocked-entrances condition (Shaw and Teranishi, 1968)と
N2 周 波 数 か ら 0.2 オ ク タ ー ブ 以 内 で 最 も 深 い 極 小 値 を
み な せ る . HRTF は 以 下 の よ う に 求 め た .
𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻%,' 𝜔𝜔 = 𝐺𝐺%,' 𝜔𝜔
𝐹𝐹(𝜔𝜔)
そ れ ぞ れ N1,N2 と す る .そ の 理 由 は ,上 昇 角 知 覚 に お
け る N1,N2 の 丁 度 可 知 差 (JND)は 0.1 か ら 0.2 オ ク タ ー
(1)
ブ と 考 え ら れ る (Iida and Ishii, 2011)か ら で あ る .
P1,P2 周 波 数 は 上 昇 角 に 依 存 し な い の で , 30° か ら
150°の P1,P2 は 0°と 同 様 と し た .
こ こ で , 𝐹𝐹(𝜔𝜔)は 被 験 者 の い な い 自 由 空 間 に お い て 被 験
2.3. パ ラ メ ト リ ッ ク HRTF の 生 成
て被験者の外耳道入口で耳栓型マイクロホンにより測
成したノッチとピークを重ね合わせることにより生成
定したインパルス応答のフーリエ変換である.
し た . 実 測 HRTF, N1,N2,P1 で 再 構 成 し た パ ラ メ ト リ
者の頭部中心に相当する位置で測定したインパルス応
答 𝑓𝑓(𝑡𝑡)の フ ー リ エ 変 換 で あ り ,𝐺𝐺%,' 𝜔𝜔 は 自 由 空 間 に お い
2.2. ノ ッ チ と ピ ー ク の 抽 出
N1, N2, P1, P2 は 耳 介 で 生 成 さ れ て い る た め (Shaw
パ ラ メ ト リ ッ ク HRTF は , 2 次 の IIR フ ィ ル タ で 作
ッ ク HRTF(以 降 N1N2P1 と 呼 ぶ ), N1,N2,P1,P2 で 再 構
成 し た パ ラ メ ト リ ッ ク HRTF(以 降 N1N2P1+P2 と 呼 ぶ )
and Teranishi, 1968; Lopez-Poveda and Meddis, 1996;
の 例 を FIG. 1 に 示 す .パ ラ メ ト リ ッ ク HRTF は 再 構 成 し
Takemoto et al., 2012),0°と 180°に つ い て は 被 験 者 の 頭
たノッチとピークを精度よく再現し,その他の帯域の
部 イ ン パ ル ス 応 答 (HRIR)の 初 期 部 分 か ら 抽 出 し た .そ
スペクトルは平坦である.
の ア ル ゴ リ ズ ム (Iida et al., 2014) を 以 下 に 示 す .
20
(1) HRIR の 絶 対 値 が 最 大 と な る サ ン プ ル を 検 出 す る .
(3) 全 て の 要 素 を ゼ ロ と し た 512 ポ イ ン ト の 配 列 を
用 意 し , (2) で 切 り 出 し た HRIR を 上 書 き す る . た だ
し , 最 大 サ ン プ ル を 配 列 の 257 番 目 に 合 わ せ る
Amplitude [dB]
(2) 検 出 し た サ ン プ ル を 中 心 と し て 4 次 96 サ ン プ ル
の Blackman-Harris 窓 で HRIR を 切 り 出 す .
Measured
P1
10
N1N2P1
P2
0
-10
N2
(4) FFT に よ り 512 ポ イ ン ト の 配 列 の 振 幅 ス ペ ク ト
ルを求め,差分法で極大値および極小値をすべて検出
する.
N1N2P1+P2
-20
N1
0
4
8
12
Frequency [kHz]
16
20
(5) 3 kHz 以 上 で 最 も 周 波 数 の 低 い 2 つ の 極 大 値 を そ
れ ぞ れ P1,P2 と し ,P1 よ り 高 い 帯 域 で 最 も 周 波 数 の 低
い 2 つ の 極 小 値 を N1,N2 と す る .
FIG. 1. Examples of a measured HRTF and parametric HRTFs
(N1N2P1 and N1N2P1+P2) for a vertical angle of 90°.
ホ ン に 覆 わ れ て い な い (FIG. 2(a))). ヘ ッ ド ホ ン か ら 耳
3. 音 像 定 位 実 験 1
N1N2P1+P2 が 上 方 に お い て 実 測 HRTF と 同 等 の 音 像
栓 型 マ イ ク ロ ホ ン ま で の 200 Hz か ら 17 kHz ま で の 代
定位精度を有するか否かを検証するため, 上半球正中
表 的 な peak-to-peak レ ン ジ は 約 20 dB で あ っ た が , 補
面において音像定位実験を行った.
正 フ ィ ル タ G に よ り 約 3 dB ま で 低 減 し た (FIG. 3).
DT990 で は ,耳 介 が ヘ ッ ド ホ ン に 覆 わ れ て い る た め
3.1. 実 験 方 法
被 験 者 は 2.1 節 で HRTF の 測 定 を 行 っ た 4 人 (MKI,
OIS, OTK, YSD)で あ る . HRTF を 以 下 の 3 種 類 を 用 い
(FIG. 2(b)), 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃を 測 定 す る に は ヘ ッ ド ホ ン の 着 脱
が 必 要 と な る .𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃は ヘ ッ ド ホ ン の 装 着 位 置 に よ り
た . (1) 被 験 者 本 人 の 実 測 HRTF, (2) 被 験 者 本 人 の
変化するので,それを測定してもヘッドホンの着脱を
N1N2P1, (3) 被 験 者 本 人 の N1N2P1+P2.
行 う と 正 確 な 補 正 は 保 証 さ れ な い .以 上 の 理 由 に よ り ,
音 像 定 位 実 験 は 防 音 室 で 行 っ た . 室 の 内 法 は 4.6m
(W) × 5.8m (D) × 2.8m (H)で , 暗 騒 音 は 19.5 dB(A)
で あ っ た . 実 験 シ ス テ ム の 構 成 は , ノ ー ト PC (DELL
XPS M1330),オ ー デ ィ オ イ ン タ フ ェ イ ス (RME Fireface
DT990 で は 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃の 補 正 は 行 わ な か っ た .参 考 の た め ,
FIG. 4 に 4 人 の 被 験 者 の DT990 の 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃の 測 定 例 を 示
す . peak-to-peak レ ン ジ は , Møller et al. (1995)の 報 告
と 同 様 30 dB を 超 え る .
400) , ア ン プ (Marantz PM4001) , A/D コ ン バ ー タ
(Roland M-10MX), オ ー プ ン タ イ プ ヘ ッ ド ホ ン , 耳 栓
(a)
(b)
型マイクロホンである.
外耳道入口を開放した状態における鼓膜での音圧 P
は,閉塞した状態の外耳道入口の音圧に以下に示す補
正フィルタ G を施してヘッドホンから提示することに
FIG. 2. Headphones used in the experiments. (a): K1000 (AKG),
よ り 得 ら れ る (Møller et al., 1995).
𝐺𝐺 =
≜
0
E×FGH
0
E×FGH
×
IJKLNKOKP QIRJKSTRUOJ
IJKLNKOKP QILKSVKWVUO
×𝑃𝑃𝑃𝑃𝑃𝑃,
(4)
10
(5)
0
(6)
ここで,S は音源,M は耳栓型マイクロホンの伝達関
Relativelevel[dB]
𝑃𝑃 = 𝑆𝑆×𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻×𝐺𝐺,
(b): DT990 (Beyerdynamic).
-10
-20
数 ,𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃は 閉 塞 し た 外 耳 道 入 口 で 測 定 し た ヘ ッ ド ホ
-30
ン の 伝 達 関 数 , 𝑍𝑍\]'^]_]` と 𝑍𝑍a\]bcad_\ は そ れ ぞ れ 外 耳 道
-40
お よ び ヘ ッ ド ホ ン の イ ン ピ ー ダ ン ス , 𝑍𝑍']be]fed_ は 外 耳
道から外側をみた放射インピーダンスである.G の第
2 項 は PDR (pressure division ratio)と 呼 ば れ , Møller et
al. は PDR が 1 と な る ヘ ッ ド ホ ン を FEC(free-air
0
4000
8000
12000
16000
20000
24000
Frequency [Hz]
FIG. 3. An example of transfer functions between K1000 and the
earplug-type microphone with a compensation filter, G.
equivalent coupling to the ear)ヘ ッ ド ホ ン と 定 義 し た .
0
2 種 類 の ヘ ッ ド ホ ン , K1000 (AKG)お よ び DT990 PRO
-10
(Beyerdynamic)(以 降 DT990 と 記 述 )を 用 い た .
-20
K1000 で は , 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃の 補 正 は 200 Hz か ら 17 kHz の
範 囲 で 行 っ た . 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃 は 以 下 の 手 順 で 測 定 し た . 被
験者は防音室の中央に座り,耳栓型マイクロホンを外
耳 道 に 装 着 し た . マ イ ク ロ ホ ン の 振 動 板 は 2.1 節 の
HRTF 測 定 と 同 様 に 外 耳 道 入 口 に 位 置 し た . 被 験 者 に
ヘ ッ ド ホ ン を 装 着 し て M 系 列 信 号 (48kHz サ ン プ リ ン
グ , 12 次 , 繰 返 し な し )を 提 示 し , 耳 栓 型 マ イ ク ロ ホ
ン ま で の 伝 達 関 数 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃を 測 定 し た . さ ら に , ヘ ッ ド
ホンを装着したまま,その位置を変えないようにして
耳 栓 型 マ イ ク ロ ホ ン だ け を 取 り 外 し た (耳 介 は ヘ ッ ド
MPTF[dB]
本 実 験 で は ,彼 ら が FEC ヘ ッ ド ホ ン と み な せ る と し た
MKI
OIS
OTK
YSD
-30
-40
-50
-60
0
4000
8000
12000
16000
20000
24000
Frequency [Hz]
FIG. 4. Transfer functions between DT990 and the earplug-type
microphone, 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃.
K1000 と DT990 の 再 生 条 件 の 違 い を 表 現 す る た め に ,
実 測 HRTF と 比 べ て や や 後 方 に 分 布 す る 傾 向 が あ っ た .
以 降 ,K1000 を 用 い て 式 (6)が 1 と み な せ る 条 件 を FEC
N1N2P1+P2 の 回 答 は ,0°, 30°, 60°, 180°で は 実 測 HRTF
条 件 ,DT990 を 用 い て 1/(𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃)が 残 る 条 件 を 準 FEC
お よ び N1N2P1 と 同 様 で あ っ た . 90°, 120°で は 回 答 分
条 件 と 表 す .Møller et al. (1995)が 定 義 し た FEC ヘ ッ ド
布 は N1N2P1 よ り 実 測 HRTF に 近 づ い た .し か し ,150°
ホ ン と の 違 い に 注 意 さ れ た い .準 FEC 条 件 は 理 論 的 厳
では上方寄りに知覚した.
密さに欠けるが,伝達関数の測定が不要であるため,
被 験 者 OTK で は ,実 測 HRTF に 対 し て は 0°, 30°, 90°,
一般の受聴者が使いやすいという利点を有している.
180°で は 目 標 方 向 に 回 答 し た .し か し ,60°, 120°, 150°
つ ま り , 準 FEC 条 件 は 実 用 性 の 観 点 か ら 検 証 し た .
で は 90°付 近 に 回 答 し た . N1N2P1 の 回 答 は 0°, 150°,
音 源 信 号 は 200Hz か ら 17kHz の 広 帯 域 ホ ワ イ ト ノ
180°で は 実 測 HRTF と 同 様 で あ っ た .し か し ,30°で は
イ ズ で あ る . 刺 激 は 被 験 者 の 左 右 の 外 耳 道 入 口 で 63
前 方 に 寄 る 傾 向 が み ら れ , 60°, 90°, 120°で は 0°と 90°
dB SPL で 提 示 し た . 刺 激 の 提 示 時 間 は 1.2 秒 (立 上 が
付 近 の 両 方 に 回 答 が 分 布 し た . N1N2P1+P2 の 回 答 は ,
り ,立 下 が り そ れ ぞ れ 0.1 秒 を 含 む )で あ る .目 標 方 向
す べ て の 目 標 方 向 に お い て 実 測 HRTF と 同 様 で あ っ た .
は 上 半 球 正 中 面 に お け る 30°間 隔 の 7 方 向 で あ る . 被
N1N2P1 で 観 測 さ れ た 回 答 の 分 離 は み ら れ な か っ た .
験者が目標方向を推測することを避けるため,回答方
被 験 者 YSD で は , 実 測 HRTF に 対 す る 回 答 は 逆 S
法 に は マ ッ ピ ン グ 法 を 用 い た . ノ ー ト PC の 画 面 上 に
字 カ ー ブ を 描 き , 30°, 60°, 120°で や や 上 方 に 寄 る 傾 向
正中面を示す円周と矢印を表示した.被験者のタスク
が あ っ た . N1N2P1 の 回 答 は , 90°, 120°, 180°で は 実 測
は,知覚した上昇角を円周上にスタイラスペンでクリ
HRTF と 同 様 で あ っ た . し か し , 0°, 30°, 60°で は 実 測
ックすることである.頭内定位した場合はチェックボ
HRTF と 比 べ て や や 上 方 に 分 布 す る 傾 向 が あ っ た .150°
ックスに印を入れるよう指示した.
で は 目 標 方 向 付 近 に 回 答 し た . N1N2P1+P2 の 回 答 は
実 測 HRTF と 2 種 類 の パ ラ メ ト リ ッ ク HRTF の 音 像
定 位 実 験 は 別 々 に 行 っ た .Møller et al. (1995)は 2 つ の
60°を 除 き N1N2P1 と 同 様 で あ っ た . 60°で は 回 答 の 分
散 は N1N2P1 よ り 大 き い .
条 件 ,す な わ ち (1) 1 人 の 被 験 者 の HRTF を ラ ン ダ ム 化
し た 条 件 と (2) 数 人 の HRTF を ラ ン ダ ム 化 し た 条 件 を
比較し,同じ刺激群を分離して実験しても混合して実
Subj:
MKI
験しても有意な差はないことを示している.
1 回 の 試 行 で 35 刺 激 (7 方 向 ×5 回 )を ラ ン ダ ム 化 し て
被 験 者 に 提 示 し た .1 試 行 の 所 要 時 間 は 約 7 分 で あ る .
3 種 類 の HRTF に つ い て 2 試 行 ず つ 実 験 を 行 っ た . つ
OIS
ま り , 被 験 者 は 各 刺 激 に 対 し て 10 回 ず つ 回 答 し た .
3.2. 実 験 結 果
3.2.1. FEC 条 件
A. 回 答 分 布
FIG. 5 に 実 測 HRTF,N1N2P1,N1N2P1+P2 に 対 す る
OTK
4 人の被験者の回答を示す.縦軸は知覚した上昇角,
横軸は目標上昇角である.円の直径は回答の頻度に比
被 験 者 MKI で は ,実 測 HRTF に 対 す る 回 答 は ほ ぼ 対
角 線 上 に 分 布 し た .N1N2P1 の 回 答 は 0°, 30°, 150°, 180°
で は 実 測 HRTF と 同 様 で あ っ た . し か し , 他 の 3 方 向
(60°, 90°, 120°)で は 回 答 の 分 散 は 実 測 HRTF よ り 大 き
い . N1N2P1+P2 の 回 答 は , 0°, 30°, 150°, 180°で は 実 測
HRTF お よ び N1N2P1 と 同 様 で あ っ た . 90°, 120°で は
YSD
Perceivedrisingangle[deg.]
例 し , 回 答 方 向 は 5°間 隔 で 丸 め て い る .
Targetrisingangle[deg.]
Measured HRTF
N1N2P1
N1N2P1+P2
分 散 は 実 測 HRTF よ り や や 大 き く , N1N2P1 よ り や や
小 さ い . し か し , 60°で は 分 散 は N1N2P1 よ り 大 き い .
被 験 者 OIS で は ,実 測 HRTF に 対 す る 回 答 は 逆 S 字
FIG. 5. Responses to the measured HRTF, N1N2P1, and
N1N2P1+P2 under the FEC condition. The ordinate represents
カ ー ブ を 描 き , 30°, 60°, 120°で や や 上 方 寄 り に 回 答 す
the perceived vertical angle, and the abscissa represents the
る 傾 向 が あ っ た . N1N2P1 の 回 答 は , 0°, 30°, 60°, 180°
target vertical angle. The diameter of each circle is proportional
で は 実 測 HRTF と 同 様 で あ っ た が ,90°, 120°, 150°で は
to the number of responses with a resolution of 5°.
B. 平 均 上 昇 角 定 位 誤 差
C. 前 後 誤 判 定 率
各 HRTF と 各 目 標 方 向 の 平 均 上 昇 角 定 位 誤 差 (𝐸𝐸𝐸𝐸)を
TABLE I に 前 後 誤 判 定 率 を 示 す . こ こ で , 前 後 誤 判
求 め た (FIG. 6).こ こ で ,平 均 上 昇 角 定 位 誤 差 は 目 標 の
定率は上半球正中面において目標方向と異なる四分円
上昇角と回答した上昇角の差の絶対値の平均と定義す
に音像を知覚した率と定義する.
る . さ ら に パ ラ メ ト リ ッ ク HRTF と 実 測 HRTF の 𝐸𝐸𝐸𝐸の
0°と 180°で は , い ず れ の HRTF に お い て も 前 後 誤 判
差 𝛥𝛥𝛥𝛥𝛥𝛥を 求 め た (FIG. 7).
定 率 は 0%で あ っ た .し か し ,他 の 4 方 向 に お い て は ,
(2010)の 報 告 と 同 様 , 水 平 面 上 の 0°, 180°で は 小 さ く
そ れ よ り 高 く , N1N2P1+P2 の 前 後 誤 判 定 率 は N1N2P1
(3.1°, 1.8°),水 平 面 か ら 上 昇 し た 30°か ら 150°で は 大 き
よりやや低い.
実 測 HRTF の 𝐸𝐸𝐸𝐸は ,Carlile et al. (1997)や Majdak et al.
N1N2P1 と N1N2P1+P2 の 前 後 誤 判 定 率 は 実 測 HRTF の
い (18.1-29.1°)傾 向 が あ る .N1N2P1, N1N2P1+P2 で も 同
HRTF 間 の 前 後 誤 判 定 率 に 統 計 的 有 意 な 差 が あ る か
様 の 角 度 依 存 性 が み ら れ た .N1N2P1, N1N2P1+P2 の 𝐸𝐸𝐸𝐸
否かを明らかにするためにカイ 2 乗検定を行った.そ
は 実 測 HRTF よ り 大 き い が ,N1N2P1+P2 の 𝐸𝐸𝐸𝐸は 0°, 30°,
の 結 果 , い ず れ の 目 標 方 向 に お い て も HRTF 間 に 有 意
れ は 被 験 者 OIS が 上 方 寄 り に 回 答 し た こ と に 依 る が ,
TABLE I Ratio of front-back confusion for each HRTF and target
90°, 120°で N1N2P1 よ り 小 さ い . 特 に 90°で は 10.8°減
な差は認められなかった.
少 し た . た だ し , 150°で は N1N2P1 よ り 増 加 し た . こ
vertical angle under the FEC condition.
上方に寄った原因は不明である.
N1N2P1 と 実 測 HRTF の 𝐸𝐸𝐸𝐸の 差 (𝛥𝛥𝛥𝛥𝛥𝛥)は 150°,180°で は
小 さ く (0.6°, 0.4°) , 他 の 上 昇 角 に お い て は 8.1° か ら
14.0°で あ っ た . N1N2P1+P2 の 𝛥𝛥𝛥𝛥𝛥𝛥は 90°, 120°, 180°に
お い て 小 さ く (–0.4°, 0.4°, 0.4°),そ れ 以 外 の 上 昇 角 で も
2������������������������
.12-
�
��
��
��
���
���
���
�.12-
����
����
����
�
����
����
����
������
����
����
����
�
����
����
����
���������
����
����
����
�
����
����
����
5.9°か ら 8.9°で あ り ,す べ て の 上 昇 角 で 10°未 満 で あ っ
D. 頭 内 定 位 率
た.
被 験 者 YSD が 60°の 実 測 HRTF に 対 し て 1 度 だ け 頭
Measured
Meanvertical
localizationerror,Ev [deg.]
60
N1N2P1
内 に 音 像 を 知 覚 し た こ と を 除 き , い ず れ の HRTF に お
N1N2P1+P2
50
いても頭内定位は生じなかった.
40
3.2.2. 準 FEC 条 件
A. 回 答 分 布
30
FIG. 8 に 実 測 HRTF,N1N2P1,N1N2P1+P2 に 対 す る
20
4 人の被験者の回答を示す.
10
0
被 験 者 MKI で は ,実 測 HRTF に 対 す る 回 答 は ほ ぼ 対
0
30
60
90
120
150
180
Ave.
Targetverticalangle[deg.]
角 線 上 に 分 布 し た .N1N2P1 の 回 答 は ,90°と 120°以 外
で は 実 測 HRTF と 同 様 で あ っ た . 90°と 120°で は 回 答
FIG. 6. Mean vertical localization error, 𝐸𝐸𝐸𝐸, for each HRTF and
target vertical angle under the FEC condition.
の 分 散 は 実 測 HRTF よ り 大 き い .N1N2P1+P2 の 回 答 は
120°を 除 き 実 測 HRTF と 同 様 で あ っ た . 120°で は 上 方
寄 り に 回 答 す る 傾 向 が あ っ た .90°で は ,回 答 の 分 散 は
N1N2P1 よ り 小 さ く , 実 測 HRTF と 同 等 で あ っ た .
Differenceinmeanvertical
localizationerror,Δ Ev [deg.]
30
N1N2P1
被 験 者 OIS で は ,実 測 HRTF に 対 す る 回 答 は 逆 S 字
N1N2P1+P2
カ ー ブ を 描 き , 30°, 60°で は や や 上 方 に , 90°で は や や
20
後 方 に 回 答 す る 傾 向 が あ っ た . N1N2P1 の 回 答 は , 0°,
180°で は 実 測 HRTF と 同 様 で あ っ た .し か し , 90°, 120°
10
0
-10
で は や や 後 方 に 回 答 し , 30°, 150°で は 回 答 の 分 散 は 大
き い .N1N2P1+P2 の 回 答 は ,90°, 150°を 除 き 実 測 HRTF
0
30
60
90
120
150
180
Ave.
Targetverticalangle[deg.]
FIG. 7. Difference in 𝐸𝐸𝐸𝐸 between the parametric HRTF and the
measured HRTF, 𝛥𝛥𝛥𝛥𝛥𝛥, the under FEC condition.
と 同 様 で あ っ た . 90°, 150°で は N1N2P1 と 同 様 の 分 布
であった.
被 験 者 OTK で は , 実 測 HRTF に 対 し て は 0°, 180°で
は 目 標 方 向 に 回 答 し た が , 30°で は 前 方 か ら 後 方 , 60°
か ら 150° で は 上 方 か ら 後 方 の 広 い 範 囲 に 回 答 が 分 布
し た . N1N2P1 の 回 答 は , 0°, 180°で は 実 測 HRTF と 同
様 で あ っ た . し か し 30°で は 回 答 の 分 散 は 実 測 HRTF
特 に 60°, 90°, 120°で は , N1N2P1 と 比 較 し て そ れ ぞ れ
と 比 べ て 大 き い . 60°か ら 150°で は 後 方 に 回 答 し た .
13.4°, 17.5°, 11.8°減 少 し た .
N1N2P1+P2 の 回 答 は 30°を 除 き 実 測 と 同 様 で あ っ た .
30°で は 回 答 の 分 散 は 実 測 HRTF よ り も 大 き い .
被 験 者 YSD で は , 実 測 HRTF に 対 す る 回 答 は 逆 S
字 カ ー ブ を 描 き , 30°, 60°で は や や 上 方 に , 90°で は や
や 後 方 に 回 答 す る 傾 向 が あ っ た .N1N2P1 の 回 答 は 60°,
N1N2P1 と 実 測 HRTF の 𝐸𝐸𝐸𝐸の 差 (𝛥𝛥𝛥𝛥𝛥𝛥)は 0°, 150°, 180°
で は 小 さ く (3.2°, 2.7°, 2.2°) , 他 の 上 昇 角 に お い て は
9.9°か ら 23.5°で あ っ た . N1N2P1+P2 の 𝛥𝛥𝛥𝛥𝛥𝛥は 30°で は
19.6°で あ っ た が , 他 の 方 向 で は 10°未 満 で あ っ た .
90°を 除 き 実 測 HRTF と 同 様 で あ っ た . 60°, 90°で は 回
は す べ て の 目 標 方 向 で N1N2P1 と 同 様 で あ っ た . た だ
し ,90°の 回 答 の 分 散 は や や 狭 ま り ,150°の 回 答 の 分 散
はやや広がった.
Measured
60
Meanvertical
localizationerror,Ev [deg.]
答 は 上 方 か ら 後 方 に 広 く 分 布 し た .N1N2P1+P2 の 回 答
Subj:
MKI
N1N2P1
N1N2P1+P2
50
40
30
20
10
0
0
30
60
90
120
150
180
Ave.
Targetverticalangle[deg.]
FIG. 9. Mean vertical localization error, 𝐸𝐸𝐸𝐸, for each HRTF and
target vertical angle under the quasi-FEC condition.
OIS
Differenceinmeanvertical
localizationerror, Δ Ev [deg.]
30
OTK
N1N2P1
20
10
0
0
30
Perceivedrisingangle[deg.]
-10
YSD
N1N2P1+P2
60
90
120
150
180
Ave.
Targetverticalangle[deg.]
FIG. 10. Difference in 𝐸𝐸𝐸𝐸 between the parametric HRTF and the
measured HRTF, 𝛥𝛥𝛥𝛥𝛥𝛥, under the quasi-FEC condition.
C. 前 後 誤 判 定 率
Targetrisingangle[deg.]
Measured HRTF
N1N2P1
N1N2P1+P2
FIG. 8. Responses to the measured HRTF, N1N2P1, and
N1N2P1+P2 under the quasi-FEC condition.
TABLE II に 前 後 誤 判 定 率 を 示 す .0°と 180°で は ,い
ず れ の HRTF に お い て も 前 後 誤 判 定 率 は 0%で あ っ た .
し か し ,他 の 4 方 向 に お い て は ,N1N2P1 と N1N2P1+P2
の 前 後 誤 判 定 率 は 実 測 HRTF の そ れ よ り 高 い .
TABLE III に カ イ 2 乗 検 定 の 結 果 を 示 す . 120°に お
B. 平 均 上 昇 角 定 位 誤 差
各 HRTF と 各 目 標 方 向 の 平 均 上 昇 角 定 位 誤 差 (𝐸𝐸𝐸𝐸)お
よ び , パ ラ メ ト リ ッ ク HRTF と 実 測 HRTF の 𝐸𝐸𝐸𝐸の 差
い て 実 測 HRTF と N1N2P1 の 間 に , 30°に お い て 実 測
HRTF と N1N2P1+P2 の 間 に 統 計 的 有 意 な 差 (p < 0.05)
が認められた.
(𝛥𝛥𝛥𝛥𝛥𝛥)を そ れ ぞ れ 求 め た (FIGs. 9, 10).
実 測 HRTF の 𝐸𝐸𝐸𝐸は ,FEC 条 件 と 同 様 に 水 平 面 上 の 0°,
180°で は 小 さ く (4.7°, 2.1°), 水 平 面 か ら 上 昇 し た 30°
TABLE II Ratio of front-back confusion for each subject, HRTF,
and target vertical angle under the quasi-FEC condition.
か ら 150°で は 大 き い (16.2°-37.6°)傾 向 が あ る .N1N2P1,
N1N2P1+P2 で も 同 様 の 角 度 依 存 性 が み ら れ た .し か し ,
こ れ ら の 𝐸𝐸𝐸𝐸は 実 測 HRTF よ り 大 き い .N1N2P1+P2 の 𝐸𝐸𝐸𝐸
は 30°を 除 く す べ て の 目 標 方 向 で N1N2P1 よ り 小 さ い .
2������������������������
.12-
�
��
��
��
���
���
���
�.12-
����
����
����
�
����
����
����
������
����
����
����
�
����
����
����
���������
����
����
����
�
����
����
����
TABLE III Results of chi-square tests for the ratio of front-back
confusion
under the FEC condition. *: p < 0.05, **: p < 0.01.
"$ "&
!"%
!# !# 同 様 に 分 布 し た .す な わ ち ,MKI と OIS は 前 方 か ら 後
方 ,OTK は 上 方 か ら 後 方 ,YSD は 斜 め 後 ろ か ら 後 方 に
広く分布した.いずれの被験者においても,上方に回
一 方 , P1, P2, P1P2 に 対 す る 回 答 は 被 験 者 内 で ほ ぼ
答が集中することはなかった.
(a)MKI
D. 頭 内 定 位 率
3 人 の 被 験 者 (MKI, OIS, OTK)で は ,い ず れ の HRTF
においても頭内定位は生じなかった.しかし被験者
YSD で は ,N1N2P1 (30°, 90°で 1 回 ,60°で 3 回 )お よ び
N1N2P1+P2 (30°, 60°, 90°, 120°で 1 回 )で 頭 内 定 位 が 生
じた.
P1
4. 音 像 定 位 実 験 2
P2Measured N1N2P1+P2
P1P2
N1N2P1
(b)OIS
音 像 定 位 実 験 1 で は ,N1N2P1 に P2 を 加 え る こ と に
より正中面上方の音像定位精度が向上することを示し
た .音 像 定 位 実 験 2 の 目 的 は ,P2 が 正 中 面 上 方 の 音 像
定位で担う役割を解明することである.
4.1. 実 験 方 法
実験方法は音像定位実験 1 と同様である.ただし,
被 験 者 本 人 の 90°の (1) P1, (2) P2, (3) P1P2 で 再 構 成 し
P1
た 3 種 類 の パ ラ メ ト リ ッ ク HRTF を 用 い た .
P2Measured N1N2P1+P2
P1P2
N1N2P1
(c) OTK
FIG. 11 に 実 測 HRTF と P1, P2, P1P2 で 再 構 成 し た パ
ラ メ ト リ ッ ク HRTF の 例 を 示 す .パ ラ メ ト リ ッ ク HRTF
は再構成したピークを精度よく再現し,その他の帯域
のスペクトルは平坦である.
20
Amplitude [dB]
Measured
P1
P2
P1P2
P1
P2Measured N1N2P1+P2
P1P2
N1N2P1
10
(d)YSD
0
-10
-20
0
4
8
12
Frequency [kHz]
16
20
P1
P2Measured N1N2P1+P2
P1P2
N1N2P1
FIG. 11. Examples of a measured HRTF and parametric HRTFs
FIG. 12. Responses to P1, P2, and P1P2 under the FEC condition.
(P1, P2, and P1P2) for a vertical angle of 90°.
For comparison, the responses to the measured HRTF, N1N2P1,
and N1N2P1+P2 for a target vertical angle of 90° obtained in
4.2. 実 験 結 果
4.2.1. 回 答 分 布
FEC 条 件 で の P1, P2, P1P2 に 対 す る 回 答 分 布 を FIG.
12 に 示 す .音 像 定 位 実 験 1 で 求 め た 目 標 方 向 90°に お
け る 実 測 HRTF, N1N2P1, N1N2P1+P2 の 回 答 分 布 も 併
せ て 示 す . N1N2P1+P2 の 回 答 分 布 は , 3.2.1.項 で 示 し
た よ う に MKI で や や 分 散 が 大 き く な る も の の , 実 測
HRTF の そ れ と 同 様 で あ る .
localization test 1 are also shown.
準 FEC 条 件 で の 回 答 分 布 を FIG. 13 に 示 す . 各 被 験
者 の 回 答 分 布 を Fig.13 に 示 す .N1N2P1+P2 で は ,3.2.2.
項 で 示 し た よ う に , OIS で や や 分 散 が 大 き く な る も の
の , 実 測 HRTF と 同 様 の 回 答 分 布 で あ っ た .
一 方 , P1, P2, P1P2 に 対 す る 回 答 は , FEC 条 件 と 同
様 に ,被 験 者 内 で ほ ぼ 同 様 に 分 布 し た .MKI は 前 方 か
ら 後 方 ,OIS は 前 方 か ら 斜 め 後 ろ に 広 く 分 布 し た .OTK
と YSD は 斜 め 後 ろ か ら 後 方 に 分 布 し た .い ず れ の 被 験
者 に お い て も ,上 方 に 回 答 が 集 中 す る こ と は な か っ た .
𝐸𝐸𝐸𝐸(52.9°, 51.6°, 54.6°)は 実 測 HRTF と 比 較 し て 顕 著 に
大きい値であった.
Meanrisingangle
localizationerror,Ev [deg.]
60
(a)MKI
(a)FECcondition
50
40
30
20
10
0
P1
P2Measured N1N2P1+P2
P1P2
N1N2P1
P1
P2
P1+2
60
Meanrisingangle
localizationerror,Ev [deg.]
(b)OIS
Measured N1N2P1 N1N2P1+2
(b)Quasi-FEC condition
50
40
30
20
10
P1
P2Measured N1N2P1+P2
P1P2
N1N2P1
0
P1
P2
P1+2
Measured N1N2P1 N1N2P1+2
FIG. 14. Mean vertical localization error, Ev, under (a) the FEC
(c) OTK
condition and (b) the quasi-FEC condition at a target vertical
angle of 90°.
4.2.3. 頭 内 定 位 率
P1, P2, P1P2 の い ず れ に お い て も , ど の 被 験 者 も 頭
P1
P2Measured N1N2P1+P2
P1P2
N1N2P1
(d)YSD
内定位は生じなかった.
5. 考 察
5.1. 従 来 の 研 究 と の 比 較
先 に 述 べ た よ う に ,Hebrank and Wright (1974)は フ ィ
ル タ 処 理 な し と 比 較 し て , あ る 方 向 に 1.5 倍 以 上 の 回
答が得られたフィルタをスペクトラルキューと定義し
た . 彼 ら は , 上 方 の キ ュ ー は 7 kHz か ら 9 kHz の 間 の
P1
P2Measured N1N2P1+P2
P1P2
N1N2P1
FIG. 13. Responses to P1, P2, and P1P2 under the quasi-FEC
condition.
4.2.2. 平 均 上 昇 角 定 位 誤 差
平 均 上 昇 角 定 位 誤 差 (𝐸𝐸𝐸𝐸)を Fig.14 に 示 す .
FEC 条 件 (a)に お い て は ,N1N2P1+P2 の 𝐸𝐸𝐸𝐸(17.7°)は 実
測 HRTF(18.1°)と 同 等 で あ っ た . し か し , P1, P2, P1P2
の 𝐸𝐸𝐸𝐸(56.7°, 48.8°, 42.1°)は 実 測 HRTF と 比 較 し て 顕 著
に大きい値であった.
準 FEC 条 件 (b)に お い て は ,実 測 HRTF と N1N2P1+P2
の 𝐸𝐸𝐸𝐸は そ れ ぞ れ 27.9°, 34.4°で あ っ た .P1, P2, P1+P2 の
1/4 オ ク タ ー ブ の ピ ー ク で あ る と 主 張 し た . こ の ピ ー
ク は P2 と 一 致 し ,さ ら に Blauert (1969/70)が 提 案 し た
上方の方向決定位帯域とも一致する.
し か し , 第 3,4 章 の 結 果 は , 広 帯 域 信 号 に 対 し て は
P2 を 再 現 し た だ け で は 上 方 に 音 像 定 位 し な い こ と を
明 確 に 示 し て い る . つ ま り , Hebrank and Wright の 主
張するピークは上方のスペクトラルキューではない.
5.2. 正 中 面 上 方 に お け る P2 の 役 割
FIG. 15 は , FEC 条 件 の 目 標 方 向 90° に お い て ,
N1N2P1 で 上 方 と 前 方 に 回 答 し , N1N2P1+P2 で は 上 方
に 回 答 し た 被 験 者 OTK の N1, N2, P1, P2 の 周 波 数 と レ
ベ ル の 関 係 を 示 し た も の で あ る .白 丸 は 0°,黒 丸 は 90°
の N1, N2, P1, P2 を 示 す . 2 本 の 破 線 は , Moore et al.
(1989)が 中 心 周 波 数 8 kHz,帯 域 幅 が 中 心 周 波 数 の 25%
のノッチを用いて求めた 3 人の被験者のノッチ検知閾
の最大値と最小値を示している.すなわち,ノッチレ
で は FEC 条 件 よ り も 準 FEC 条 件 の 方 が 𝐸𝐸𝐸𝐸は や や 小 さ
い . こ れ は , 準 FEC 条 件 で は FEC 条 件 と 比 較 し て 後
方 に 知 覚 す る 傾 向 が あ る こ と に 起 因 す る (FIGs. 5,8 参
ベ ル が –9dB 以 上 で は す べ て の 被 験 者 が ノ ッ チ を 検 知
照 ).後 方 に 音 像 を 知 覚 す る 本 質 的 な 理 由 は 不 明 で あ る
で き ず , –20dB 以 下 で は す べ て の 被 験 者 が 検 知 し た .
が , Fig.4 に 示 し た 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃の peak-to-peak レ ン ジ の 広
0°の N1, N2 の レ ベ ル は と も に 検 知 閾 を 超 え て い る .
さ が 根 底 に あ る 理 由 の 1 つ か も し れ な い .準 FEC 条 件
し か し , 90°の N1 は 検 知 で き な い レ ベ ル で あ り , N2
において上方から後方への回答が頻繁にみられた被験
は被験者により検知の可否が分かれるレベルである.
者 OTK の 𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃の peak-to-peak レ ン ジ は 他 の 被 験 者 と
周 波 数 軸 上 で み る と ,90°で は ノ ッ チ と ピ ー ク は 周 波
数 の 低 い 方 か ら P1, P2, N1, N2 の 順 で 並 ん で い る . P2
比べて大きく,定位誤差の大きさと対応している.
N1N2P1(b)で も 0°, 180°で は FEC 条 件 と 準 FEC の 𝐸𝐸𝐸𝐸
を 再 現 し な い 場 合 , P1 は N1 か ら 離 れ た 周 波 数 に あ る
の 差 は 小 さ い (–1.5°, 2.1°).し か し ,30°, 60°, 90°で は 準
た め 対 比 効 果 は 期 待 で き な い . し か し P2 を 再 現 す る
FEC 条 件 の 𝐸𝐸𝐸𝐸は FEC 条 件 と 比 較 し て 顕 著 に 大 き く ,そ
と , P2 か ら み た N1 の 相 対 的 な レ ベ ル は –14.7dB と な
る.これは被験者によってはノッチの検知が可能なレ
ベルである.
以 上 よ り ,P2 そ れ 自 体 は ス ペ ク ト ラ ル キ ュ ー で は な
い が ,N1 を 強 調 す る こ と に よ り ,正 中 面 上 方 の 音 像 定
位精度を向上させる重要な役割を果たしている.
条 件 の 𝐸𝐸𝐸𝐸は FEC 条 件 と 比 較 し て 顕 著 に 大 き く ,そ の 差
は そ れ ぞ れ 27.9°, 16.3°で あ っ た .
(a)MeasuredHRTF
Meanvertical
localizationerror,Ev [deg.]
FEC
50
0
Notch
undetectable
-10
30
P2
20
90°N1
partly
detectable
-20
detectable
-30
10
0
90°N2
4000
0
30
60
90
120
150
180
Ave.
Targetverticalangle[deg.]
0°N1
8000
12000
Frequency[Hz]
(b)N1N2P1
60
0°N2
0
Quasi-FEC
40
P1
16000
20000
FIG. 15. Relationship between the frequencies and the levels of
N1, N2, P1, and P2 for subject OTK. Open and closed circles
denote N1, N2, P1, and P2 for 0° and 90°, respectively. Broken
Meanvertical
localizationerror,Ev [deg.]
10
Level [dB]
N1N2P1+P2(c) で は , 30°, 90° を 除 き FEC 条 件 と 準
FEC の 𝐸𝐸𝐸𝐸の 差 は 小 さ い . し か し , 30°, 90°で は 準 FEC
60
20
-40
の 差 は そ れ ぞ れ 16.5°, 14.9°, 23.0°で あ っ た .
50
10
0
0
30
60
90
120
(c)N1N2P1+P2
60
Meanvertical
localizationerror,Ev [deg.]
実 測 HRTF(a)で は ,0°, 180°に お い て は ,FEC 条 件 と
準 FEC の 𝐸𝐸𝐸𝐸の 差 は 小 さ い (1.5°, 0.3°). し た が っ て , 前
後 方 向 の 音 像 定 位 に お い て は ,𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃の 補 正 は 必 要 で
Ave.
Targetverticalangle[deg.]
50
比 較 す る . FIG. 16 に 各 HRTF と 各 条 件 の 𝐸𝐸𝐸𝐸を 示 す .
180
20
which is 8 kHz and the bandwidth of which is 25 % of the center
FEC 条 件 と 準 FEC 条 件 の 平 均 上 昇 角 定 位 誤 差 (𝐸𝐸𝐸𝐸)を
150
30
subjects for the detection of the notch, the center frequency of
5.3. FEC 条 件 と 準 FEC 条 件 の 比 較
Quasi-FEC
40
lines indicate the maximum and minimum thresholds of three
frequency, as reported by Moore et al. (1989).
FEC
FEC
Quasi-FEC
150
180
40
30
20
10
0
0
30
60
90
120
Ave.
Targetverticalangle[deg.]
は な い . し か し , 30°, 60°, 90°に お い て は , 準 FEC 条
FIG. 16. Mean vertical localization error, Ev, for the FEC and
件 の 𝐸𝐸𝐸𝐸は FEC 条 件 と 比 較 し て 顕 著 に 大 き く ,そ の 差 は
quasi-FEC conditions for (a) the measured HRTF, (b) N1N2P1,
そ れ ぞ れ 16.4°, 13.0°, 9.8°で あ っ た . 一 方 , 120°, 150°
and (c) N1N2P1+P2.
以 上 を ま と め る と ,実 測 HRTF,N1N2P1,N1N2P1+P2
の い ず れ に お い て も , 0°お よ び 120°か ら 180°で は 準
FEC 条 件 は FEC 条 件 と 同 等 の 音 像 定 位 性 能 を 有 し て い
る .し か し 30°か ら 90°に お い て は ,準 FEC 条 件 の 𝐸𝐸𝐸𝐸は
FEC 条 件 と 比 較 し て 顕 著 に 大 き く ,𝑀𝑀×𝑃𝑃𝑃𝑃𝑃𝑃の 補 正 が 必
要である.
Blauert, J. (1969/70). “Sound localization in the median plane,”
Acustica, 22, 205–213.
Butler, A., and Belendiuk, K. (1977). “Spectral cues utilizes in
the localization of sound in the median sagittal plane,” J. Acoust.
Soc. Am. 61, 1264–1269.
Carlile, S., Leong, P., and Hyams, S. (1997). “The nature and
distribution of errors in sound localization by human listeners,”
6. 結 論
本 論 文 で は , 音 像 定 位 実 験 1 に よ り , N1, N2, P1 に
P2 を 加 え て 再 構 成 し た パ ラ メ ト リ ッ ク HRTF
(N1N2P1+P2)に よ り 正 中 面 上 方 で 実 測 HRTF と 同 等 の
音像定位精度が得られるか否かを検証した.さらに,
音像定位実験 2 により,正中面上方の音像定位におけ
Hear. Res. 114, 179–196.
Gardner, B., and Gardner, S. (1973). “Problem of localization in
the median plane: effect of pinna cavity occlusion,” J. Acoust.
Soc. Am. 53, 400–408.
Hebrank, J., and Wright, D. (1974). “Spectral cues used in the
る P2 の 役 割 を 考 察 し た .
FEC 条 件 に お け る 結 果 を 以 下 に 示 す .
localization of sound sources on the median plane,” J. Acoust.
(1) N1N2P1 に P2 を 加 え る こ と に よ り ,正 中 面 の 90°
Soc. Am. 56, 1829–1834.
お よ び 120°で 音 像 定 位 性 能 が 向 上 し た .
(2) N1N2P1+P2 と 実 測 HRTF の 間 の 平 均 上 昇 角 定 位
誤 差 の 差 は 上 半 球 正 中 面 の 全 7 方 向 に お い て 10°未 満
であった.
Iida, K., Yairi, M., and Morimoto, M. (1998). “Role of pinna
cavities in median plane localization,” Proceedings of 16th
International Congress on Acoustics, 845–846.
(3) P1, P2, P1P2 を 再 現 し て も 音 像 は 上 方 に 知 覚 さ れ
Iida, K., Itoh, M., Itagaki, A., and Morimoto, M. (2007).
なかった.言い換えれば,これらのスペクトラルピー
“Median plane localization using parametric model of the
クは上方のスペクトラルキューではない.
head-related transfer function based on spectral cues,” Appl.
(4) 0°の N1 と N2 の レ ベ ル は と も に ノ ッ チ の 検 知 閾
を 超 え る が , 90°の N1 は 検 知 で き な い . し か し , P2
を 加 え る こ と に よ り , P2 か ら み た N1 の 相 対 レ ベ ル は
検知可能となる.
(5) 以 上 よ り , P2 は N1 を 強 調 す る こ と に よ り , 正
中面上方の音像定位精度を向上する重要な役割を果た
していると考えられる.
さ ら に , 準 FEC 条 件 に お け る 結 果 を 以 下 に 示 す .
(6) N1N2P1 に P2 を 加 え る こ と に よ り ,正 中 面 の 60°
か ら 120°で 音 像 定 位 性 能 が 向 上 し た .
(7) 0°お よ び 120°か ら 180°で は , FEC 条 件 と 同 等 の
音 像 定 位 性 能 が 得 ら れ た . し か し , 30°か ら 90°で は 音
像 定 位 性 能 は FEC 条 件 と 比 較 し て 低 下 し た .
謝
辞
Acoust. 68, 835–850.
Iida,
K.,
and
Ishii,
Y.
(2011).
“Individualization
of
the
head-related transfer functions in the basis of the spectral cues
for sound localization,” in Principles and Applications of Spatial
Hearing, edited by Y. Suzuki, D. Brungard, Y. Iwaya, K. Iida, D.
Cabrera, and H. Kato (World Scientific, Singapore), pp. 159–
178.
Iida, K., Nishioka, S., and Ishii, Y. (2014). “Personalization of
head-related transfer functions in the median plane based on the
anthropometry of the listener ’s pinnae,” J. Acoust. Soc. Am. 136,
317–333.
Kulkarni, A., and Colburn, H. S. (1998). “Role of spectral detail
in sound- source localization,” Nature 396, 747–749.
本 研 究 の 一 部 は 科 研 費 ( 基 盤 研 究 (A) 15H01790) に
Lopez-Poveda, E. A., and Meddis, R. (1996). “A physical model
より実施した.また,神戸大学の森本政之名誉教授に
of sound diffraction and reflections in the human concha,” J.
は有益な議論をしていただいた.記して感謝いたしま
Acoust. Soc. Am. 100, 3248–3259.
す.
Majdak, P., Goupell, M. J., and Laback, B. (2010). “3-D
文
献
Asano, F., Suzuki, Y., and Sone, T. (1990). “Role of spectral
cues in median plane localization,” J Acoust. Soc. Am. 88, 159–
168.
localization
of
virtual
sound
sources:
Effects
of
visual
environment, pointing method, and training,” Atten. Percept.
Psychophys. 72, 454–469.
Møller, H., Hammershøi, D., Jensen, C. J., and Sørensen, M. F.
(1995). “Transfer characteristics of headphones measured on
human ears,” J. Audio Eng. Soc. 43, 203–217.
Moore, B. C. J., Oldfield. R., and Dooley, G. J. (1989).
“Detection and discrimination of peaks and notches at 1 and 8
kHz,” J. Acoust. Soc. Am. 85, 820–836.
Morimoto, M., and Aokata, H. (1984). “Localization cues of
sound sources in the upper hemisphere,” J. Acoust. Soc. Jpn. (E)
5, 165–173.
Musicant,
A.,
and
Butler,
R.
(1984).
“The
influence
of
pinnae-based spectral cues on sound localization,” J. Acoust.
Soc. Am. 75, 1195–1200.
Raykar, V. C., Duraiswami, R., and Yegnanarayana, B. (2005).
“Extracting the frequencies of the pinna spectral notches in
measured head related impulse responses,” J. Acoust. Soc. Am.
118, 364–374.
Shaw, E. A. G., and Teranishi, R. (1968). “Sound pressure
generated in an external-ear replica and real human ears by a
nearby point source,” J. Acoust. Soc. Am. 44, 240–249.
Takemoto, H., Mokhtari, P., Kato, H., Nishimura, R., and Iida, K.
(2012). “Mechanism for generating peaks and notches of
head-related transfer functions in the median plane,” J. Acoust.
Soc. Am. 132, 3832–3841.