梗概集 - 日本文理大学

日本文理大学
工学部
情報メディア学科
2007 年度卒業研究
梗概集
福島研究室
(コミュニケーションネットワーク研究室)
2008 年 2 月 6 日
目次
200424002 北川 創一朗
ユビキタスネットワーク基盤技術としての無線LAN電波伝搬状況把握手法
の実験的検討
1ページ
200424027 小橋川 美共
ユビキタス社会におけるバイオメトリクスを使用した生体認証技術に関する
研究 - 話者識別システム -
4ページ
200424035
末廣 一美
200424071
山田 雄大
200424032
佐藤 祐希
200424038
砂田 智彦
200224002
秋山 勇二
200424039
曽我 健太
200424046
中嶋 恵一
200424054
野村 宜範
200424057
深澤 友貴
200424030
坂田 啓輔
200424043
鳥羽 伸紀
200424031
佐藤 毅
200424040
高岡 創
ユビキタス社会を支えるトランスメディア実現のための情報記述に関する研
12ページ
究 - 狭帯域包絡線情報を用いた伝送路特性の記述 -
ユビキタス社会におけるコンテンツ保護・管理技術のための品質制御を可
能とする暗号化技術に関する研究
23ページ
ユビキタスネットワークにおける符号化率によるコンテンツ品質変化の心的
印象による評価に関する研究
30ページ
ユビキタスネットワーク基盤を支える伝送経路制御手法のネットワークシ
ミュレータ(NS2)による検討
35ページ
ユビキタスネットワークを支える仮想マシン環境に関する研究
41ページ
ユビキタスネットワークにおける情報提示技法に関する研究
45ページ
著者の進路先(進学の場合進学先,就職の場合は就職先)が記載されています.
平成19年度卒業研究発表会 プログラム
2月6日(水)
濱田研
200424003
200424007
200424017
200424018
200424021
穴井
有馬
片岡
兼瀬
川原
隆博
インターネットによる投票システムの構築
恵祐
文平
保幸 在学生向けの就職活動ポータルサイトの構築
達也
2008/2/5
開始時刻 終了時刻
9:20
9:35
9:40
9:55
吉森研
200424079 浅久野 真一 携帯電子書籍アプリケーションのユーザビリティ評価と考察
10:10
10:25
岡本研
200424059
楽曲のスペクトル解析
10:30
10:45
ユビキタスネットワーク基盤技術としての無線LAN電波伝搬状況把握手法の実験的検討
ユビキタス社会におけるバイオメトリクスを使用した生体認証技術に関する研究 - 話者識別システム -
13:00
13:20
13:15
13:35
ユビキタス社会を支えるトランスメディア実現のための情報記述に関する研究 - 狭帯域包絡線情報を用いた伝送路特性の記述 -
13:40
13:55
ユビキタス社会におけるコンテンツ保護・管理技術のための品質制御を可能とする暗号化技術に関する研究
14:00
14:15
ユビキタスネットワークにおける符号化率によるコンテンツ品質変化の心的印象による評価に関する研究
14:20
14:35
ユビキタスネットワーク基盤を支える伝送経路制御手法のネットワークシミュレータ(NS2)による
14:40
14:55
ユビキタスネットワークを支える仮想マシン環境に関する研究
15:00
15:15
ユビキタスネットワークにおける情報提示技法に関する研究
15:20
15:35
福永 嵩肖
福島研
200424002 北川 創一朗
200424027 小橋川 美共
200424035 末廣 一美
200424071 山田 雄大
200424032 佐藤 祐希
200424038
砂田 智彦
200224002 秋山 勇二
200424039 曽我 健太
200424046 中嶋 恵一
200424054 野村 宜範
200424057 深澤 友貴
200424030 坂田 啓輔
200424043 鳥羽 伸紀
200424031
佐藤 毅
200424040
高岡 創
2月7日(木)
伊藤研
200424029
200424060
200424075
200424078
坂口
藤井
劉
村上
星芝研
200424006
200424020
200424077
足立研
200424001
200424005
200424026
200424012
200424016
200424023
200424024
200424036
200424037
200424049
200424067
200424072
200424074
200424080
敬士
博史 第40回一木祭完全記録
梟銘
祐輔 新しいアニメーション表現の探求
開始時刻 終了時刻
10:15
10:30
10:35
10:50
有長 宏二 コンピュータミュージックによるヴァイオリンのリアルな演奏表現に関する研究
亀石 和成 デスメタルにおけるブラストビート奏法のコンピュータミュージックでの再現に関する研究
濱田 恵太 コンピュータミュージックによる和太鼓の演奏表現に関する研究
11:05
11:25
11:45
11:20
11:40
12:00
相原 亮一
雨川 翔吾
神 智之
江藤 恭平
小野 雄太
木原 博史
金城 雄大
菅田 紘史
杉内 慎作
長友 亮之
森 俊之
山田 若葉
横山 武尊
金 範秀
13:15
グラデーションを用いた迫力ある静止画の作成
13:00
実写の背景と3DCGの合成
13:20
13:35
Light Waveを使った3DCGアニメーション
CDジャケットの制作
13:40
14:00
13:55
14:15
2010年サッカーワールドカップ南アフリカ大会ポスター
14:20
14:35
3DCGによるヴィジュアルアート
デジタルとアナログの色彩融合
Flashによる仮想3D空間の創作および動画
線のアート
画像表現「語る沈黙~廻って~」
色彩効果を用いた平面表現の一例
インターネット漫画について
14:40
15:00
15:20
15:40
16:00
16:20
16:40
14:55
15:15
15:35
15:55
16:15
16:35
16:55
2月8日(金)
坪倉研
200424002
200424044
200424050
200424045
200424052
200424058
200424070
200424084
200324011
赤峰 優一
冨森 翔平
成松 拓郎
鳥居 亮
西庄 誠司
福井 翔吾
山下 敏明
呉 氷峰
井上俊介
濱田研
200424062
赤星研
200324024
200424055
200424085
200424009
200424011
200424013
200424014
200424015
200424047
200424051
200424063
200424064
200424066
200424048
200424073
200424081
200424082
開始時刻 終了時刻
映像作品と時代背景における表現・趣向の調査
9:00
9:15
日本文理大学・学内地図の構築
9:20
9:35
9:40
10:00
10:20
10:40
11:00
11:20
9:55
10:15
10:35
10:55
11:15
11:35
松下 道彦 CMSを用いた大分情報発信:大分探検隊
11:40
11:55
北澤 知足
日髙 裕
三吉 奈菜
板井 貴裕
江隈 和彦
衛藤 恭尚
小野 太一
小野 剛志
中城 明紀
仁木 祐樹
見越 俊介
宮崎 茂明
宮平 克敏
中村 巧一
横川 順一
金 霊山
權 孝眞
不可能図形設計
魚の様々な表現
外界からの情報の認知について
タイピングソフトのシステム構築
小説系ポータルサイト・小説天地の構築
WUIに限定したヒューリスティック評価法の調査検討
自然言語処理学習ツールキット「NLTK」のローカライズ
13:00
13:15
ウォーターフォールモデルに基づいた「子育て支援携帯ネット」システムの構築
13:20
13:35
Python入門書の作成
13:40
13:55
プログラミング支援システムの開発
14:00
14:15
「アンビエント・ファインダビリティ」オンライン用語集の作成
WindowsユーザーのためのLinux入門サイトの構築
ハード&ソフト(Hardware & Software)
「日程管理プログラム」の開発
14:20
14:40
15:00
15:20
14:35
14:55
15:15
15:35
コミュニケーションネットワーク Lab.(福島研究室)
2007 年度卒業研究概要
日本文理大学・工学部・情報メディア学科
Nippon Bunri Univ.
Department of Media Technology
ユビキタスネットワーク基盤技術としての無線 LAN 電波伝送状況把握手
法の実験的検討
北川 創一朗†
†株式会社ソフトウェアサービス 〒103-0015 東京都中央区日本橋箱崎町 16-9
あらまし 本研究では無線 LAN 環境の構築において,安定した通信を行うことを目的としている.そのために
は,無線 LAN 通信を行う受信側の端末が観測できる電波強度である受信信号強度を一定値確保できる距離を把握
しなければならない.不可視である無線 LAN での電波伝送状況の把握を行うためには,電波の受信を行う地点ご
とに受信信号強度の観測を行い,それを基にした間接的な可視化が必要になる.本論文では,4 点の観測点で端末
が受信した受信信号強度の観測結果を基に,最近隣内挿法と共一次内挿法の 2 種の内挿によって,予測点の受信信
号強度を予測補間する.予測結果をもとに内挿手法ごとに間接的な可視化手法として受信信号強度の等値線図を描
画し,最近隣内挿法と共一次内挿法による予測値と実測値との誤差と,等値線図によって電波伝送状況の把握がで
きるかを比較検討する.その結果,最近隣内挿法と共一次内挿法の比較の場合,最近隣内挿法の方が実測値との誤
差がより少ないが,等値線で電波伝送状況の把握を行うには不安定な予測手法であることがわかった.
キーワード 無線 LAN,伝送距離,最近隣内挿法,共一次内挿法,受信信号強度
に近く,また実測値に近ければ等値線図として可視化
1. は じ め に
した場合,空間の電波伝送状況を把握できるかを検討
ユ ビ キ タ ス ネ ッ ト ワ ー ク で は ,「 い つ で も , ど こ で
する.
も,なんでも」誰でも情報技術の恩恵を受けられるこ
とで,情報収集にかける手間を省き,より知的活動に
専念できる豊かな世界を構築することを目的としてい
2. 実 験 内 容
る [1]. こ れ を 実 現 す る た め に e-Japan 政 策 と し て , 通
2.1. 実 験 概 要
信インフラストラクチャである情報通信網の整備が行
位 置 を 固 定 し た ア ク セ ス ポ イ ン ト と 無 線 LAN ア ダ
わ れ , 現 在 50.9%の カ バ ー 率 と な っ て い る [2]. こ の 整
プ タ 内 臓 の ノ ー ト PC と を 無 線 通 信 さ せ , 受 信 信 号 強
備 を 受 け , 情 報 通 信 技 術 ( ICT) を い か に 活 か す か と
度を実際に 5 点の観測点から観測する.観測した 5 点
いうユビキタス社会の実現に向けた次なるステップと
のうち 1 点を予測点 g とし,予測点 g を除いた 4 点の
し て u-Japan 政 策 が 策 定 ・ 実 施 さ れ て い る [1].
観 測 点 を a,b,c,d と 仮 定 す る .最 近 隣 内 挿 法 と 共 一 次 内
ユビキタスネットワークの実現において不可視現
挿を用いて予測点 g の受信信号強度を内挿計算によっ
象 で あ る 電 波 を 利 用 す る 無 線 LAN は 有 用 で あ る [4].
て予測し,導き出された g 点の予測値と,観測点 g で
本 研 究 で は 無 線 LAN 通 信 に お い て 安 定 し た 通 信 を 行
実測した受信信号強度とを比較検討する.また,それ
うことを目的としており,そのために必要な要素は電
ぞ れ の 内 挿 法 に お い て ,デ ー タ の 整 合 性 を と る こ と と ,
波強度が確保できる距離を把握することであると考え
等 値 線 を 描 画 す る た め MATLAB 言 語 [6]の 最 近 隣 内 挿
る .不 可 視 現 象 で あ る 電 波 を 利 用 す る 無 線 LAN に お い
関 数 nearest と 共 一 次 内 挿 入 関 数 bilinear を 用 い た 計 算
て空間全体の電波強度を把握するには,それぞれの観
を 行 う . MATLAB 言 語 を 使 用 し て 得 た 内 挿 結 果 は
測点での電波強度をとる必要があり,多大な労力を要
contour 関 数 に よ り 等 値 線 と し て 描 画 す る こ と で ,受 信
する.本論文では,受信側で観測した電波強度である
信号強度の距離による段階的な変化について間接的な
受 信 信 号 強 度 (RSSI:Received Signal Strength Indication)
可視化を行う.
を少数の観測点から観測し,未観測の空間の電波伝送
状況の把握手法を検討するため最近隣内挿法と共一次
2.2. 受 信 信 号 強 度 の観 測 条 件
内 挿 法 の 二 つ の 内 挿 手 法 [5] に よ っ て 予 測 点 に 受 信 信
受 信 信 号 強 度 の 単 位 は 絶 対 値 と し て dBm を 用 い る .
号強度の予測値を求め,誤差の比較を行う.また,電
但し,受信位置を固定しても受信信号強度は変動する
波伝送状況の間接的な可視化による把握手法として受
ため,記録して内挿計算に用いる受信信号強度は概算
信信号強度の等値線図を描画し,どちらが実測した値
と な る .無 線 通 信 は IEEE802.11b 規 格 で 行 う .受 信 信
1
号 強 度 の 観 測 に は , 観 測 用 の ノ ー ト PC に フ リ ー ウ ェ
d (1,1) a(1,3)  1
2]
 
c(5,1) b(5,3) 1
8
[2
ア の Network Stumbler[7]を イ ン ス ト ー ル し ,使 用 す る .
g (3,2) =
観 測 を 行 う 空 間 の 観 測 点 a,b,c,d と ア ク セ ス ポ イ ン ト
(AP) 及 び , 予 測 点 (g)の 位 置 関 係 を 図 2.1 に 示 す .
(3)
計 算 を 簡 単 に す る た め , 空 間 は 縦 :横 比 を 3:5 と し ,
高さを考慮せず平面として考える.
3. 実 験 結 果
図 2.1 の 空 間 は 内 挿 計 算 を 簡 単 に す る た め , 縦 横 の
3.1. 受 信 信 号 強 度 の観 測 結 果
比率を基に 3 行 5 列の領域をもつ行列として考え,行
図 2.1 の 空 間 に お い て , 4 点 の 観 測 点 (a,b,c,d)と 予 測
列 に は 座 標 を 持 た せ る . 行 列 の 四 隅 に , 観 測 点 a,b,c,d
点 g の 受 信 信 号 強 度 を 観 測 し た 結 果 を 表 3.1 に 示 す .
点で観測した受信信号強度をそれぞれ代入し,内挿に
よ っ て 補 間 す る 予 測 点 g(3,2)の 受 信 信 号 強 度 は 未 観 測
a(AP)
68dBm
点とする.また,他の未観測点にはそれぞれ仮定とし
表 3.1 各 観 測 点 の 受 信 信 号 強 度
b
c
d
54dBm
48dBm
52dBm
g
48dBm
て x によって補間しておく.
3.2. 行 列 への代 入
行 列 (1) で 表 し た 行 列 の 観 測 点 と 対 応 す る 座 標 に 表
3-1 か ら 得 た 受 信 信 号 強 度 を 代 入 す る と 次 の 行 列 に な
る.
68 x1
x x
5
 4
52 x8
x2
x3
g
x6
x9
x10
54
x7 
48
(4)
3.3. 内 挿 による予 測 結 果
図 2.1 受 信 信 号 強 度 観 測 時 の 位 置 関 係
観測する空間を座標と考えた場合の行列への変換
3.3.1. 最 近 隣 内 挿 法 に よ る 予 測 結 果
で の 各 観 測 点 の 代 入 位 置 を 行 列 (1)に 示 す .
式 (2) よ り 最 近 隣 内 挿 に よ る 予 測 点 g の 予 測 値 は
 a(1,3) x1 (2,3) x2 (3,3) x3 (4,3) b(5,3) 
x (1,2) x (2,2) g(3,2) x (4,2) x (5,2) (1)
5
6
7
 4

 d(1,1) x8 (2,1) x9 (3,1) x10 (4,1) c(5,1) 
54dBm と な る .実 際 に 観 測 し た 観 測 点 g の 受 信 信 号 強
度 と 比 較 し た 場 合 , 誤 差 は +6dBm と な る .
ま た , MATLAB の nearest 関 数 に よ っ て 内 挿 を 行 っ
た 結 果 を 行 列 (3)に 示 す .
68 68 54 54 54
52 52 48 48 48


52 52 48 48 48
2.3. 内 挿
2.3.1. 最 近 隣 内 挿 法
最近隣内挿法は,幾何学補正の際のリサンプリング
(5)
法の一種であり,内挿される座標から最も近い座標の
行 列 (5)よ り ,予 測 点 g(3,2)の 予 測 値 は 48dBm と な る .
値 を そ の ま ま 配 置 す る 手 法 で あ る . 行 列 (1) に お け る
実際に観測した観測点 g の受信信号強度と比較した
g(3,2)に 配 置 さ れ る 値 を も つ 座 標 は 式 (2)に よ っ て 求 め
場 合 , 誤 差 は 0dBm と な る . ま た , 図 3.1 に 示 し た 行
ら れ る . 但 し , 内 挿 を 行 う 座 標 を 基 準 に し た f(x,y)に
列 (5)を 基 に 描 画 し た 等 値 線 図 は い び つ な 形 を と っ た .
図 3.1 は , 行 列 (5)の 3 行 5 列 の 空 間 内 で , ア ク セ ス
代入する形となる.
g(3,2) = f([3 + 0.5],[2 + 0.5])
ポイントであり,受信信号強度が最も高い観測点 a か
(2)
ら , 最 も 値 が 低 い 観 測 点 c に 向 か っ て 2dBm ご と に 同
じ受信信号強度をとる等値線を描画することで,空間
2.3.2. 共 一 次 内 挿 法
内の受信信号強度の変化を間接的に可視化を行った結
共一次内挿法は,ふたつの線形補間より構成され,
果 で あ る .x 軸 ,y 軸 は ,観 測 点 a か ら の 距 離 を 示 す .
内挿を行う点の周りの 4 点の値と距離による重みとの
積をとり,平均値を求める手法である.重みとは,補
間する点と補間する座標を通る線の始点と終点との距
離 の 割 合 で あ る .行 列 (1)に お け る g(3,2)の 値 は ,式 (3)
によって求められる.
2
であり,共一次内挿による予測と実測値の誤差は
+7.5dBm で あ る . ふ た つ の 手 法 を 比 較 し た 場 合 , 本 論
文において,より実測値との誤差が少ないのは,最近
隣内挿法であることがわかる.しかし,予測と同時に
描画した等値線図を比較すると,最近隣内挿による等
値線図はいびつな形をとっているのに対し,共一次内
挿による等値線図は整った形をしている.このことか
ら,不可視現象である電波の伝送状況を,間接的に可
視化し把握する点については,共一次内挿法の方が安
定しており把握しやすいと考えられる.
また,最近隣内挿に関して,公式に基づいた計算結
果 と , MATLAB の nearest 関 数 を 用 い た 計 算 結 果 は 異
な る 値 を と っ た .こ れ は MATLAB 言 語 の 実 装 上 の 誤 差
図 3.1 最 近 隣 内 挿 法 に よ る 内 挿 予 測 結 果 の 等 値 線 図
であると考えられる.通信に使用する電波の周波数や
電波伝送を行う空間の条件によって誤差が変わるため,
全ての条件において最近傍内挿法による予測が正解に
3.3.2. 共 一 次 内 挿 法 に よ る 予 測 結 果
近いわけではないと考えられる.
式 (3)よ り 共 一 次 内 挿 法 に よ る 予 測 点 g の 予 測 値 は
55,5dBm と な る . 実 際 に 観 測 し た 観 測 点 g の 値 と 比 較
4. お わ り に
し た 場 合 , 誤 差 は +7.5dBm と な る .
ま た ,行 列 (2)に MATLAB の bilinear 関 数 に よ っ て 内
本論文の目的は,少数の観測点から未観測の空間の
電波伝送状況を把握する手法を検討することである.
挿を行った結果を以下に示す.
61 57.5 54
68 64.5
52 57.75 55.5 53.25 51


52
51
50
49
48
そ の た め 受 信 側 の ノ ー ト PC で 観 測 し た 電 波 強 度 で あ
る受信信号強度を少数の観測点から観測し,最近隣内
(6)
挿法と共一次内挿法によって予測点にそれぞれの内挿
手法による受信信号強度の予測値を求め,実測した受
予 測 点 g(1,1)の 受 信 信 号 強 度 g の 値 は 55.5dBm と な
信信号強度との誤差の比較を行った.また,電波伝送
る.実際に観測した観測点 g の値と比較した場合,誤
状況の間接的な可視化による把握手法として受信信号
差 は +7.5dBm と な る . ま た , 図 3.2 に 示 し た 行 列 (6)を
強 度 の 等 値 線 図 を 描 画 し ,ど ち ら が 実 測 し た 値 に 近 く ,
基に描画した等値線図は波模様をとった.
また実測値に近ければ等値線図として可視化した場合,
図 3.1 と 同 様 に , 図 3.2 も 行 列 (6)を 基 に 電 波 強 度 の
空間全体の電波伝送状況を把握できるかを比較検討し
変化を間接的に可視化したものである.
た.その結果,最近隣内挿法の方が実測値との誤差が
少 な い が ,等 値 線 図 に よ る 間 接 的 な 可 視 化 に お い て は ,
不安定な予測手法であることがわかった.
文
献
[1] 総 務 省 , http://www.soumu.go.jp/.
[2] イ ン タ ー ネ ッ ト 白 書 2007,財 団 法 人 イ ン タ ー ネ ッ
ト 協 会 監 修 , 株 式 会 社 イ ン プ レ ス R&D, 2007.
[3] 日 高 昇 治 ,手 に と る よ う に ユ ビ キ タ ス が わ か る 本 ,
株 式 会 社 か ん き 出 版 , 東 京 , 2001.
[4] デ ィ ジ タ ル 画 像 処 理 , デ ィ ジ タ ル 画 像 処 理 編 集 委
員 会 監 修 , 財 団 法 人 画 像 情 報 教 育 振 興 協 会 ,東 京 ,
2004.
[5] MATLAB マ ニ ュ ア ル ,( 社 ) サ イ バ ネ ッ ト シ ス テ
ム , http://dl.cybernet.co.jp/matlab/support/manual/.
[6] NetStumbler.com, http://www.netstumbler.com/.
図 3.2 共 一 次 内 挿 法 に よ る 内 挿 予 測 結 果 の 等 値 線 図
3.4. 検 討
最 近 隣 内 挿 法 に よ る 予 測 と 実 測 値 の 誤 差 は , 0dBm
3
コミュニケーションネットワーク Lab.(福島研究室)
2007 年度卒業研究概要
日本文理大学・工学部・情報メディア学科
Nippon Bunri Univ.
Department of Media Technology
ユビキタス社会におけるバイオメトリクスを使用した
生体認証技術に関する研究
-話者識別システム-
小橋川
美共†
†NEC ネッツエスアイ株式会社 〒140-8260 東京都品川区東品川 1-39-9
あらまし
本研究室プロジェクトでは,生体認証技術の 1 つとして音声時間波形を 1/4 オクターブバンドの狭帯域に分割し
た信号の包絡線から狭帯域包絡線間相関係数を求め,それを特徴パラメータとする話者識別システムの提案を行っている.本卒
業研究ではその研究室プロジェクトで使用されている話者識別システムを使い,1)話者識別に有用な個人性を多く含む帯域につ
いて調査,2)音声基本周波数の時間変動から平均と分散を求め,それが識別率の向上を補えるかの調査,を行った結果を報告す
る.登録人数 11 名,登録語を共通の 5 語/人,識別語を約 8 語/人として正解率を調べた.その結果,調査 1)では全帯域(39 帯
域)で 88%の正解率が,1/4 オクターブバンドの中心周波数 68Hz~273Hz(帯域番号 6~14)と 1091Hz~5187Hz(帯域番号 22~
31)の範囲(19 帯域)を用いることで正解率 81%となった.使用範囲が周波数範囲で約 21%に制限したにもかかわらず正解率
が約 7%しか低下しなかったことから,この範囲が有用であることがわかった.またその範囲は,声帯音源周波数,第 2 フォル
マント周波数,副鼻腔の共振周波数と関連する範囲であることがわかった.この結果により,システム負荷を 21%に軽減する効
果が得られた.調査 2)ではさらに正解率を上げるための検討として,音声基本周波数の時間変動が個人により異なることに着目
し,それの平均と分散により正解率が向上するかについての調査を行った.その結果,両者を組み合わせることで正解率が向上
する可能性があることがわかった.
キーワード 話者識別,狭帯域,包絡線,識別率,時間波形,相関係数,鼻腔,基本周波数
例 が 報 告 さ れ て い る .こ の こ と か ら も 盗 難 等 に 対 す る ,
1. は じ め に
情報通信の整備によりブロードバンドインフラス
端末に保存される情報および端末の利用に関する安全
トラクチャおよび携帯電話の高機能化が進んでいる
性を確保するためのセキュリティが必要不可欠になる
[1]. 特 に 「 い つ で も ・ ど こ で も ・ 誰 で も ・ な ん で も 」
と考えられる.
ネットワークにつながることを掲げているユビキタス
高いセキュリティを実現する方法として,利用者の
ネットワークにおいて,ワイヤレスで大容量通信回線
バイオメトリクスを用いた本人認証技術が提案されて
が重要な役割を担うことが予想されている.これに対
い る [4].利 用 者 を 特 定 す る 認 証 技 術 の 1 つ と し て 音 声
応 し て 広 域 公 衆 無 線 通 信 で あ る 携 帯 電 話 は , ITU( 国
に含まれる個人性により話者を識別し判断する話者認
際 電 気 通 信 連 合 ) に よ っ て 定 め ら れ た IMT-2000 に 準
識 が あ る [5][6].特 に 今 後 の 携 帯 型 情 報 端 末 の 主 流 と な
拠 し た デ ィ ジ タ ル 携 帯 電 話 第 3 世 代( 3G)に て 384kbps
ることが予想される携帯電話では,通話に必要な音響
の 通 信 速 度 が 実 用 化 さ れ ,2007 年 7 月 か ら 下 り 最 大 約
メディアを利用するための入出力装置が必ず装備され
300Mbps の 伝 送 速 度 を 目 指 し た 実 証 実 験 [2] が 開 始 さ
ている.このことから本研究室プロジェクトでは音響
れており,今後さらなる高速データ通信が計画されて
メディアで伝えられる情報から利用者のバイオメトリ
い る [3].ま た 通 話 サ ー ビ ス を 基 本 機 能 と し た 携 帯 電 話
クスによる認証について検討することとする.
話者識別は発話語を特定するテキスト依存型方式
業界も,データ通信やサービスを基本機能とした業態
が 認 め ら れ ,そ の 分 野 の 発 展 が 促 さ れ る に 至 っ て い る .
と 特 定 し な い テ キ ス ト 独 立 型 方 式 が あ る [7].広 い 年 代
これらの電気通信業界の動向を反映して,通話を主
層および利用方法を考えると発話語を特定することが
とした電話という位置付けから携帯情報端末としての
難しい場合がある.このため,発話語を特定しないテ
位置付けへと移り変わっている.これにより,高機能
キスト独立型方式が有用であると考えられる.
発話語を特定しないテキスト独立型の代表的な方
携帯電話では高速通信を活かすことが求められている.
携帯電話の高機能化は,個人情報を含む情報そのも
法 に ,長 時 間 平 均 ス ペ ク ト ル に よ る 方 法 [5],ベ ク ト ル
のを保存する媒体または本人専用アクセス端末として
量 子 化 に よ る 方 法 [8][9], HMM を 用 い る 方 法 [10]等 が
の利用を加速することが考えられる.総務省の
ある.これらは主に周波数領域で個人性の抽出を行っ
「 u-Japan ベ ス ト プ ラ ク テ ィ ス 事 例 集 [1]」 で は , 携 帯
ている.これらに対し,音声時間波形を狭帯域分割し
電話を用いたサービスおよびセキュリティに関する事
て求めた包絡線の帯域間相関を用いた識別手法が提案
4
さ れ て い る [11][12].
さとなる.
表 1
一方,音声に含まれる個人性情報が偏った周波数帯
域 に 存 在 す る と の 報 告 も な さ れ て い る [13]-[15].ま た ,
1/4 オ ク タ ー ブ バ ン ド の 中 心 周 波 数
Band Center Freq. Band Center Freq.
No.
(Hz)
No.
(Hz)
1
28.9
21
917
2
34.4
22
1090.5
3
40.9
23
1296.8
4
48.6
24
1542.2
5
57.3
25
1834
6
68.1
26
2181
7
81
27
2593.7
8
96.3
28
3084.4
9
114.6
29
3668
10
136.3
30
4362
11
162.1
31
5187.4
12
192.7
32
6168.8
13
229.2
33
7336
14
272.6
34
8724.1
15
324.2
35
10375
16
385.5
36
12338
17
458.5
37
14672
18
545.2
38
17448
19
648.4
39
20749
20
771.1
個 人 性 知 覚 に 重 要 な 帯 域 の 調 査 [16]お よ び 音 声 時 間 波
形を狭帯域分割して求めた包絡線の帯域間相関を用い
た 話 者 識 別 性 能 の 評 価 が 行 わ れ て い る [17]. し か し そ
こでは手法の有効性と重要な帯域が存在するかどうか
の調査が中心であり,重要となる帯域が何に起因して
いるかについての検討が十分ではなかった.
本卒業論文では,重要な帯域の調査として正解率を
指標とし,使用する帯域による変化から重要な帯域を
調べることおよび重要な帯域が何に起因しているかの
調査,また音声基本周波数の時間変動から平均と分散
を求め,それが正解率の向上を補えるかの調査を行っ
た結果を報告する.
2. 狭 帯 域 包 絡 線 間 相 関 係 数 に よ る 話 者 の 識 別
携帯電話のマイク等で観測可能な音声信号は,母音
であれば声帯膜の開閉動作と呼気により発生する過渡
的信号である声帯波を音源とし,声道等で生じる共振
現象の結果である.ここで狭帯域分割した音声時間波
形 v(n) を 搬 送 波 c(n) と 包 絡 線 e(n) の 積 と 考 え る と , 異
包絡線抽出方法には低域通過フィルタを使用する
なる帯域の搬送波は相関が 0 となることが期待される.
一方包絡線は,例えば母音であれば呼気の流量に対応
方法,移動平均を取る方法等があるが,いずれも数学
する音源エネルギーを反映すると考えられる.このた
的な裏付が十分とは言えない.そこでここでは数学的
め,声帯波が多くの周波数を含む同じ音源により生じ
に包絡線を求める手法として解析的信号表現に基づく
る共振現象のエネルギー変動である包絡線情報は異な
包絡線抽出手法を用いる.ここでは狭帯域分割した音
声 時 間 波 形 vb (n) か ら ス ペ ク ト ル Vb (k ) を
る帯域で相関が高くなることが予想される.特に共振
現象の発生状況が個人の骨格等の特性に依存すること
N −1
V b ( k ) ≡ ∑ v b ( n )e
を考えると,この狭帯域に分割した音声時間波形の包
(2)
但 し ,k は 離 散 周 波 数 に 相 当 す る サ ン プ ル 番 号 ,N
であると考えられる.
は信号サンプル数,
で 求 め る .こ こ か ら vb (n) の 片 側 ス ペ ク ト ル と な る 解 析
的 信 号 表 現 v~ (n)
そ こ で , 音 声 時 間 波 形 v(n) と , 表 1 に 示 す 中 心 周 波
数 と な る 1/4 オ ク タ ー ブ バ ン ド の 狭 帯 域 通 過 フ ィ ル タ
hb (n) の 畳 み 込 み 演 算 に よ り , b 帯 域 の 音 声 時 間 波 形
b
v~b (n)
vb (n) を 得 る .
kn
M −1
∑ v(n − p)hb ( p)
kn
N
n=0
絡線の帯域間相関で個人の特徴を計測することが可能
vb (n) ≡
− j 2π
≡
(1)
p =0
但し,b は帯域番号,n は離散時刻に相当するサ
j 2π
Vb (0) 1 N / 2
+ ∑ Vb (k )e N
2
2 k =1
= v b ( n ) e jθ
ンプル番号,M は狭帯域フィルタの長さ.
狭 帯 域 フ ィ ル タ は , FIR フ ィ ル タ と し , 長 さ を 2048
(3)
但し, X は X の絶対値, θ は位相角,
サ ン プ ル , サ ン プ リ ン グ 周 波 数 fs を 44100Hz と す る .
を 求 め る .式 (3) は v~b (n) が 包 絡 線 と 瞬 時 位 相 特 性 の 積 で
表 さ れ て い る こ と と , v~ (n) の 絶 対 値 か ら 包 絡 線 情 報 が
こ の た め 狭 帯 域 フ ィ ル タ の 周 波 数 分 解 能 は 21.5Hz ,フ
ィ ル タ の 長 さ が 約 46ms と な る . 低 域 の 特 性 が 悪 く な
b
得られることを示している.そこで狭帯域分割した音
声 時 間 波 形 の 包 絡 線 eb (n) を
る が ,本 手 法 で は 音 声 の 狭 帯 域 包 絡 線 を 100ms で 区 切
り使用することとしているため,フィルタ長が影響し
ない程度とした.結果的に声帯音源波で約 4 周期の長
eb ( n) ≡ v~b (n)
5
(4)
より求める.この包絡線をヒルベルト包絡線と呼ぶ.
こ れ を さ ら に 振 幅 を dB 変 換 し d b (n) を 得 る .
おり,発話語によらない識別条件を満たしていること
本 手 法 では狭 帯 域 包 絡 線 の類 似 性 を相 関 係 数 により求
ないことを示している.
正 解 率 C A は ,正 し く 識 別 さ れ た 数 を s ,登 録 者 A の
を示している.また図 2 は,音素分布に極端な偏りが
め る . 相 関 係 数 が, 狭 帯 域 包 絡 線 の 小 さ い 振 幅 範 囲 で 決
まるのを防 ぐため, dB 変 換 し- 30dB で 打 ち 切 る こ と と す
識別語数を u とすると
CA ≡ s / u
る . d b1 (n) と d b2 (n) よ り 帯 域 番 号 b1 と b2 の 狭 帯 域 包 絡 線
全登録者の平均正解率 C を得る.
識別に使用する範囲を 1 帯域ずつ追加していき,帯
間 相 関 係 数 γ db db を 次 式 に よ り 得 る .
1
γ db db ≡
1
2
2
∑ {d
N −1
1
σ db σ d b
1
n=0
2
b1 ( n ) d b2 ( n) − d b1 d b2
(7)
で 求 め る . 正 解 率 CA の 総 和 を 登 録 者 数 で 割 る こ と で ,
}
域を追加することで平均正解率 C が高くなれば追加
(5)
し た 帯 域 が 重 要 で あ る と 判 断 で き る と 考 え た .そ こ で ,
帯 域 番 号 1 か ら 順 に 帯 域 を 追 加 し ,平 均 正 解 率 C の 変
化を調べる.その結果を図 1 に示す.図は横軸に使用
但 し , σ x は x の 分 散 , X は X の 平 均 ,N は 信 号 サ
範囲の終了帯域番号を示しており,縦軸に平均正解率
ンプル数.
C を 示 し て い る .得 ら れ た 平 均 正 解 率 C を「 ×」記 号
こ こ で は 狭 帯 域 分 割 数 が 39 で あ る た め ,狭 帯 域 包 絡
で示し,それらから多項式近似により求めた近似曲線
も併せて示す.
線 間 相 関 係 数 γ db db は 39 行 39 列 の 行 列 と な る . こ こ
1
2
1
ではこれを狭帯域包絡線間相関係数行列と呼ぶことと
0.9
する.
0.8
γ 2,1
γ 2, 2
M
γ 2,39
L γ 39,1 

L
M 
L
M 

L γ 39,39 
0.7
0.6
(6)
C
 γ 1,1

γ 1, 2
Γ ≡ 
M

γ
 1,39
0.5
0.4
話者を識別するシステムでは,収録した音声情報か
0.3
ら,この狭帯域包絡線間相関係数行列 Γ を求め蓄積す
0.2
る .こ れ に 対 し て 識 別 対 象 X の 音 声 情 報 か ら 求 め た 狭
帯 域 包 絡 線 間 相 関 係 数 行 列 ΓX を 求 め ,そ れ と 蓄 積 さ れ
0.1
0
た Γ A と の 相 関 係 数 γ XA を 求 め る . 本 シ ス テ ム で は γ XA
2
5
10
15
20
25
30
35
39
Stopping band number
の 最 大 値 γ max を 識 別 候 補 A と す る .識 別 候 補 A が 本 人
図 1
と一致した場合に正解とし,正解した回数から正解率
CA を求 め る .
識別用使用帯域を帯域番号 1 から横軸の帯域
番号までとして求めた平均正解率 C と近似曲線
こ こ で は ,式 (1) に 示 し た 帯 域 番 号 b の 使 用 範 囲 を 制
限 し た 場 合 に ,正 解 率 C A が ど の よ う に 変 化 す る か を 調
次に,識別で使用する範囲を全帯域から 1 帯域ずつ
外 し て い き ,帯 域 を 外 す こ と で 平 均 正 解 率 C が 低 く な
れば外した帯域が重要であると判断できると考えた.
べ,その変化から重要な帯域を調べる.
そこで,帯域番号 1 から順に識別に使用する範囲から
調 査 の た め 予 め 話 者 を 識 別 す る シ ス テ ム に ,20 歳 ~
外し,平均正解率 C の変化を調べる.その結果を図 2
に示す.図は横軸に使用範囲の開始帯域番号を示して
25 歳 の 成 人 男 性 11 名 を 登 録 す る . 登 録 語 は 全 員 共 通
お り ,縦 軸 に 平 均 正 解 率 C を 示 し て い る .図 1 同 様 に
の 5 語とする.1 語当たり約 1 秒であり,登録者全員
得 ら れ た 平 均 正 解 率 C を 「 ×」 記 号 で 示 し , そ れ ら か
ら多項式近似により求めた近似曲線も併せて示す.
3. 話 者 の 識 別 に 重 要 な 帯 域 の 調 査
共 通 で 計 55 語 を 登 録 す る .識 別 に 用 い る 識 別 語 は 登 録
語と異なる語とし,登録者により異なる.識別語は 1
人 当 た り 約 8 語 と し ,計 82 語 と す る .識 別 語 も 登 録 語
と同様に 1 語当たり約 1 秒である.また登録語と識別
語は共通しない部分があり,発話語によらない識別条
件を満たしている.
音素で見ても共通しない部分があることを示して
6
1
Accuracy and Ratio (%)
0.9
0.8
0.7
C
0.6
0.5
0.4
0.3
0.2
0.1
0
図 2
1
5
10
15
20
25
Starting band number
30
35
100
90
80
70
60
50
40
30
20
10
0
1-39
6-31
6-14, 22-31
Used Band Number
38
図 3
識別に使用するデータ範囲の制限率と
識別用使用帯域を横軸の帯域番号から帯域番
平均正解率 C の関係
号 39 ま で と し て 求 め た 平 均 正 解 率 C と 近 似 曲 線
( :周波数範囲, :帯域数, : 平均正解率 C )
図 1 の 近 似 曲 線 よ り , 1) 帯 域 番 号 6 か ら 正 解 率 が
急 激 に 向 上 し て い る こ と , 2 ) 帯 域 番 号 15 ~ 21 ま で の
図 3 よ り 全 帯 域( 39 帯 域 )で 88% の 平 均 正 解 率 C が ,
帯 域 番 号 6 ~ 31 の 26 帯 域 を 用 い る こ と で 86% の 平 均
正 解 率 の 変 化 が 他 の 範 囲 と 比 べ 緩 や か で あ る こ と , 3)
正 解 率 C と な る こ と を 示 し て い る .こ れ は ,情 報 の 使
帯 域 番 号 22 ~ 31 の 範 囲 で 正 解 率 が 向 上 し て い る こ と ,
用 率 を 周 波 数 範 囲 で 約 25 % ,帯 域 数 で 約 67 % に 制 限 し
がわかる.
図 2 の 近 似 曲 線 よ り , 1) 帯 域 番 号 6 か ら 正 解 率 が
た と き に , 平 均 正 解 率 C が 約 2% 低 下 す る こ と を 示 し
て い る . 同 様 に 使 用 帯 域 を , 帯 域 番 号 6 ~ 14 と 帯 域 番
低 下 し て い る こ と , 2 ) 帯 域 番 号 15 ~ 21 ま で の 正 解 率
号 22 ~ 31 の 19 帯 域 を 用 い る こ と で 81 % の 平 均 正 解 率
の 変 化 が 他 の 範 囲 に 比 べ て 緩 や か で あ る こ と ,3 )帯 域
C と な る こ と を 示 し て い る .こ れ は ,情 報 の 使 用 率 を
番 号 22 か ら 正 解 率 が 急 激 に 低 下 し て い る こ と ,が わ か
周 波 数 範 囲 で 約 21 % ,帯 域 数 で 約 49% に 制 限 し た と き
る.
図 1 横 軸 右 端 が 39 行 39 列 , 左 端 が 2 行 2 列 を 示 し
に ,平 均 正 解 率 C が 約 7% 低 下 す る こ と を 示 し て い る .
こ れ ら の こ と か ら , 使 用 率 を 周 波 数 範 囲 で 約 20% ,帯
て お り , 図 2 横 軸 は 右 端 が 2 行 2 列 , 左 端 が 39 行 39
域 数 で 約 50% に 制 限 し た の に 対 し て ,平 均 正 解 率 C の
列を示している.このため図 1 左端および図 2 右端は
低 下 が わ ず か で あ る こ と か ら , 帯 域 番 号 6 ~ 14 と 帯 域
小さい行列での計算結果であるため,この範囲の傾向
番 号 22 ~ 31 の 19 帯 域 が 重 要 な 個 人 性 を 含 ん で い る と
は配慮しないこととする.
判断できる.
図 1 および図 2 から,重要な帯域として,帯域番号
この結果が,何に起因するかを検討することで結果
6 ~ 31 が 考 え ら れ ,帯 域 番 号 15 ~ 21 の 重 要 度 が そ れ 以
の妥当性を検証する.
外に比べて低いことが考えられる.そこで識別に使用
す る 帯 域 を ,1 )全 帯 域( 39 帯 域 ),2 )帯 域 番 号 6 ~ 31 ,
4. 調 査 結 果 の 検 討
3 ) 帯 域 番 号 6 ~ 14 と 帯 域 番 号 22 ~ 31 , と し て 平 均 正
日本語の特徴として母音の出現確率が高いことに
解 率 C を 調 べ る .そ の 結 果 と ,使 用 し た 周 波 数 範 囲 の
着目し,まず母音の共振特性であるフォルマント周波
制限率を周波数の広さの比および帯域数の比と合わせ
数 で 検 討 す る . 図 4 に 母 音 の フ ォ ル マ ン ト 分 布 図 [18]
て図 3 に示す.図は横軸に実験条件である使用した帯
を示す.図は横軸に第 1 フォルマント周波数を,縦軸
域 番 号 の 範 囲 , 縦 軸 に , 全 帯 域 を 100 % と し た 周 波 数
に第 2 フォルマント周波数を示している.
の 絞 り 込 み 率 , 全 帯 域 を 100% と し た 帯 域 の 絞 り 込 み
図 4 と表 1 より,横軸に示した第 1 フォルマント周
率,平均正解率 C ,を示している.
波 数 が 帯 域 番 号 12 ~ 24 に 対 応 し , 縦 軸 に 示 し た 第 2
フ ォ ル マ ン ト 周 波 数 が 帯 域 番 号 18 ~ 30 に 対 応 し て い
ることがわかる.このことから,第 2 フォルマントの
約 1kHz よ り 高 い 周 波 数 範 囲 が 個 人 性 と 対 応 す る こ と
がわかった.
7
100%
corrective judgement ratio
The second formant F 2 (kHz)
4.0
3.8
3.4
3.0
/i/
2.5
2.2
2.0
1.8
/e/
/a/
1.5
1.4
/u/
mo-ni n'gu
musume
mekara uroko
neko fu n'jatta
nakayama kin'niku n'
ueda shi n'ya
neko shi n'jatta
matsuzaka daisuke
80%
70%
60%
mito koumo n'
no n'biriya
50%
40%
niho n' chi n'botsu
30%
1.0
1
2
3
4
5
6
7
8
9
10
11
number of subjective word
0.8
/o/
0.6
0.2
図 4
netto sa-fi n'
nosutora damusu
90%
図 6
0.5
1.0
The first formant F 1 (kHz)
識別語の違いによる正解率の違い
図 6 に示した識別語の発話者を図 5 で確認したとこ
母 音 の 第 1 ・ 第 2 フ ォ ル マ ン ト 分 布 図 [18]
ろ,発話者による差異は見られなかった.このことか
ら図 6 に示した識別語の違いにより平均正解率が変化
次に,第 2 フォルマント周波数の範囲よりも高い周
したと考えた.
正解率が高く多くの被験者が発話している識別語
波数範囲について考える.
と し て ,「 ネ ッ ト サ ー フ ィ ン ( netto sa-fin') 」,「 ノ ス ト
識 別 に 使 用 す る 帯 域 に よ る 平 均 正 解 率 C は 約 7% の
違いであるが,図 5 に示す様に発話者により正解率が
ラ ダ ム ス (nostora
こ と な る . 図 は 横 軸 に 平 均 正 解 率 C ( 図 中 「 All 」) と
登 録 者 , 縦 軸 に 正 解 率 CA を 示 し て い る .
( mo-ningumusume) 」 が あ る . 本 シ ス テ ム で は 1 秒 の
damusu) 」,「 モ ー ニ ン グ 娘
音声信号を使用しているが「モーニング娘」は発話者
によって全長が異なるため,ここでは 1 秒間に単語全
体 が お さ ま る「 ネ ッ ト サ ー フ ィ ン( netto sa-fin') 」を 比
88% 0.9
86% 0.85
81% 0.8
較対象とする.正解率が低く多くの被験者が発話して
CA
1
0.95
0.75
0.7
0.65
0.6
0.55
0.5
い る 識 別 語 と し て「 水 戸 黄 門( mito koumo n' )」と「 日
本 沈 没( niho n' chinbotsu) 」が あ る .こ ち ら も 発 話 者 に
Band No.
+ 1-39
よって全長が異なるため,ここでは 1 秒間に単語全体
が お さ ま る「 水 戸 黄 門( mito koumo n' )」を 比 較 対 象 と
× 6-31
する.
□ 6-14
22-31
比較候補の識別語の時間波形例を図 7 に示す.図 7
は 横 軸 に 時 間 , 縦 軸 に 振 幅 絶 対 値 を dB で 示 す .
All
All A
E
K
M
N SA SB SC TA TB Y
amplitude (dB)
図5
ne
0
Talker
全 39 帯 域 を 使 用 し た 正 解 率 と 帯 域 を 制 限 し て
得られる正解率の比較
amplitude (dB)
人または特徴を持つ語句が存在するかを調べる.
図 6 に識別語の種類による正解率の違いを示す.図
6 は 識 別 に 使 用 す る 帯 域 を 帯 域 番 号 6 ~ 14 と 22 ~ 31 と
し て い る .図 の 横 軸 に 出 現 回 数 ,縦 軸 に 正 解 率 C A を 示
図 7
し,各記号にはそれがなんという識別語かも併せて示
している.
a
fi n'
0.6
0.8
-10
-15
0
0.2
0.4
time(s )
mi
0
て異なる.このため,高い周波数範囲に特徴を持つ個
s
-5
本実験ではデータベースに登録する語句を全員共
通としているが,識別に使用する語句は被験者によっ
to
to
ko
mo
1
n'
-5
-10
-15
0
0.2
0.4
time(s )
0.6
0.8
1
正解率が高い識別語(ネットサーフィン:上
段)と正解率が低い識別語(水戸黄門:下段)の時間
波形の比較
8
図 7 は,母音の継続時間に顕著な差がないが,鼻音
5. 音 声 基 本 周 波 数 に よ る 特 徴 量 抽 出
の継続時間に違いがあることを示している.ネットサ
情 報 の 使 用 率 を 周 波 数 範 囲 で 約 21 % , 帯 域 数 で 約
ー フ ィ ン に 含 ま れ る 鼻 音 「 ne 」「 n' 」, 水 戸 黄 門 に 含 ま
49% に 制 限 し た に も か か わ ら ず 81% の 正 解 率 が 得 ら れ
れ る 鼻 音 「 mi 」「 mo 」「 n' 」, が あ る . そ こ で 鼻 音 の 継
た が ,残 り 約 20% の 正 解 率 を ど う 補 う か が 問 題 と な る .
続時間を調べた.その結果,平均継続時間が
そこで基本周波数の変動が本人の身体的特徴を示す
ネットサーフィン
[23]-[26] こ と か ら , 音 声 基 本 周 波 数 の 時 間 変 動 か ら 平
ne
132(ms)
均 と 分 散 を 求 め ,そ れ が 残 り の 正 解 率 約 20% を 補 え る
n'
109(ms)
かの調査を行った.
mi
96(ms)
を 求 め る . 音 声 時 間 波 形 v(t ) を フ ー リ エ 変 換 し V ( f ) を
mo
95(ms)
得る.
n'
72(ms)
水戸黄門
まず音声基本周波数を推定するためケプストラム
2
次 に V ( f ) の パ ワ ー ス ペ ク ト ラ ム V ( f ) を 求 め る .こ
であり,ネットサーフィンの鼻音はシステムが音声を
処 理 用 フ レ ー ム で 区 切 る 100(ms) よ り も 長 く , 水 戸 黄
2
こでは V( f ) を次のように定義する.
門の鼻音はそれよりも短いことがわかった.
声の個性を決めるものとして声道形状および鼻腔
P( f ) ≡ V ( f )
形状の複雑さが指摘されており,特に鼻腔は高い周波
数 に お け る 個 人 差 へ の 関 係 が 示 唆 さ れ て い る [19] .
2
(8)
次 に P( f ) を dB 変 換 し d p ( f ) を 得 る .
鼻腔には主鼻道以外に副鼻腔と呼ばれる空洞が数
多 く 存 在 し て い る .主 な 副 鼻 腔 に は 蝶 形 骨 洞 ,上 顎 洞 ,
dp( f ) をフーリエ変換をすることでケプストラムを
前頭洞がある.上顎洞の容積がもっとも大きく約
38cm 3 ,次 は 蝶 形 骨 洞 で 約 20cm 3 ,前 頭 洞 が も っ と も 小
求める.
3
さ く 約 8cm で あ る .副 鼻 腔 容 積 の 相 対 偏 差 は 、蝶 形 骨
T
cq =
洞 で 14% ,上 顎 洞 で 13% ,前 頭 洞 で 27% で あ る [20] [21] .
∫ d p ( f )e
− j 2πft
dt
(9)
t =0
これらからサイズが小さい部位の共振周波数を求
め る と ,前 頭 洞 で 3103 Hz ~ 5398Hz で あ り ,帯 域 番 号
また,
28 ~ 31 に 対 応 す る .こ の こ と か ら ,重 要 な 帯 域 と し て
+ = sign(c´ ( q −1) ) = − sign(c ´ ( q +1) )
得 ら れ た 帯 域 番 号 22 ~ 31 の 高 い 周 波 数 範 囲 は 副 鼻 腔
形状によるものであると考えられる.
(10)
を 満 た す q を ケ プ ス ト ラ ム の ピ ー ク pc と し て
pc ≡ q
最後に,重要な帯域として選ばれた帯域のうち,低
い 周 波 数 で あ る 帯 域 番 号 6 ~ 14 に つ い て 考 え る . こ れ
(11)
までの検討から第 2 フォルマントの要因となる部位お
と定義する.
こ こ で は サ ン プ リ ン グ 周 波 数 fs で サ ン プ ル さ れ た
よび副鼻腔の共振により生じるエネルギー変動量であ
音 声 信 号 v(n) か ら 式 (8) ~ 式 (11) に 基 づ い て 離 散 ケ プ ス
る包絡線間に相関がある,すなわち同じ音源により生
トラムを求める.そこで離散周波数を
じる現象であるならば,多くの周波数要素を含む過渡
fs p p ≡ fs / p p
的な音源である声帯音源が関係していることが考えら
れ る . 声 帯 音 源 基 本 周 波 数 は 成 人 男 性 で 100 Hz ~
(12)
但し, pp はピークのポイント,
150Hz ,女 性 で 250 Hz ~ 300Hz で あ り [22] ,帯 域 番 号 8
~ 14 に 対 応 す る . こ の こ と か ら , 帯 域 番 号 6 ~ 14 の 8
で求め,離散ケプストラムを得る.得たデータによっ
~ 14 は 声 帯 音 源 と 対 応 し て い る も の と 考 え ら れ る .帯
て個人の違いが出るのであれば,包絡線情報で得た
域番号 8 よりも低い帯域番号 6 および 7 は中心周波数
80% の 正 解 率 の 残 り 20% を 補 え る の で は な い か と 考 え
が そ れ ぞ れ 68.1Hz , 81Hz で あ り , 声 帯 音 源 基 本 周 波
た.
数の成人男性の下限の約半分となり,その範囲につい
そこで個人によって特徴量の違いが出るか調べる
ては何と対応するかの検討が必要であるが,概ね重要
ために,話者を識別するシステムに登録した 2 名から
な帯域の低い周波数範囲は声帯音源基本周波数である
同じ発話語を用いたときのケプストラムのピークから
求 め た 基 本 周 波 数 f 0 を 図 8 に 示 す .図 は 横 軸 に フ レ ー
と考えられる.
ム 番 号 を 示 し て お り ,縦 軸 に 基 本 周 波 数 f 0 を 示 し て い
る.
9
また,2 人が同じ単語を発話したときのケプストラ
周波数を示しており,縦軸に標本標準偏差を示してい
ムのピークから求めたヒストグラムを図 9 に示す.図
る.
は 横 軸 に 周 波 数 を 示 し て お り ,縦 軸 に 出 現 頻 度 を 示 す .
標本標準偏差
300
f0
(Hz)
250
200
150
100
50
20
40
60
80
100
120
140
160
frame no.
180
160
140
120
100
80
60
40
20
200
比較
対象者
登録者
識別語
250
300
350
400
Hz
300
図 10
(Hz)
平均と標本標準偏差による個人の比較
200
f0
250
150
図 10 よ り 比 較 対 象 者 の 付 近 に 識 別 語 が 分 布 し て い
100
ることから,個人の比較が可能であることが考えられ
50
0
20
40
60
80
100
120
140
160
るが,比較対象者付近の登録者も識別されてしまう可
180
能 性 が あ る . し か し こ こ で は , 残 り 約 20% の 正 解 率 を
frame no.
図 8 2 人の人が同じ単語を発話したときのケプス
ト ラ ム の ピ ー ク か ら 求 め た 基 本 周 波 数 f0
補うためのものであるため考慮しないこととする.
話者を識別するシステムに組み込み正解率を出して
出現頻度
はいないので検証が必要であるが,この結果から音声
50
基本周波数の時間変動から平均と分散を求めることで,
40
残 り の 平 均 正 解 率 20 % が 補 え る 可 能 性 が あ る こ と が
30
わかった.
20
10
0
6. お わ り に
100
200
300
400
Hz
500
600
700
800
本研究室プロジェクトでは,利用者のバイオメトリ
クスを用いた本人認証技術の 1 つである話者を識別す
出現頻度
50
40
るシステムの実現を目指している.発話語に依存せず
30
安定して識別する手法の検討として,音声時間波形を
20
1/4 オ ク タ ー ブ バ ン ド の 狭 帯 域 に 分 割 し た 信 号 の 包 絡
10
線から狭帯域包絡線間相関係数行列を特徴パラメータ
0
図 9
100
200
300
400
Hz
500
600
700
とする手法の検討を行っている.本卒業論文では,重
800
要な帯域の調査として正解率を指標とし,識別に使用
2 人の人が同じ単語を発話したときのケプス
する周波数範囲として重要な帯域を調べることおよび
トラムのピークから求めたヒストグラム
その個人性が何に依存するものであるかの調査,また
音声基本周波数の時間変動から平均と分散を求め,正
図 8 から,同じ単語によるものであるため似たよう
解率の向上を補えるかの調査,を行った.
な形をしており個人の比較ができないと考えられる.
そ の 結 果 , 帯 域 番 号 6 ~ 14 ( 中 心 周 波 数 68Hz ~
しかし図 9 より,ヒストグラムでは個人によって分布
273Hz ) と 帯 域 番 号 22 ~ 31 ( 中 心 周 波 数 1091Hz ~
が違うことがわかる.このことからケプストラムのピ
5187Hz )の 範 囲( 19 帯 域 )が 重 要 な 個 人 性 を 含 ん で い
ークから平均と分散を求めることで個人性が求められ
ることがわかった.またそれらが,声帯音源基本周波
るのではないかと考えた.そこでケプストラムのピー
数,母音の第 2 フォルマント周波数,副鼻腔の共振周
ク よ り ,各 登 録 者 11 人 の 平 均 を 求 め る .次 に 分 散 を 標
波数と関連することがわかった.そして,音声基本周
本標準偏差で求める.
波数の時間変動から求めた平均と分散を使用すること
登 録 者 11 人 の 登 録 語 か ら 求 め た 平 均 と 標 本 標 準 偏
で,正解率の向上を補える可能性があることがわかっ
差 の 結 果 を 図 10 に 示 す .ま た 登 録 者 の 中 か ら 1 人 を 比
た.
較 対 象 者 (図 中 「 □ 」 )と し , 比 較 対 象 者 の 各 識 別 語 に
おける平均と標本標準偏差も併せて示す.図は横軸に
10
文
the human paranasal sinuses derived from
transmission
characteristic
measurement
and
morphological observation," J. Acoust. Soc. Am.,
100, 3374-3383,1996
[22] 中 田 和 男( 日 本 音 響 学 会 編 ),”音 声 ”,コ ロ ナ 社 ,
pp.40 , 1977
[23] 福 島 学 , 中 山 喜 代 志 , 永 嶋 育 美 , 柳 川 博 文 , " 音
声のピッチに着目した声質の変化要因に関する
検 討 ", 電 子 情 報 通 信 学 会 応 用 音 響 研 究 会 ,
EA2005-86, pp.39-44, 2005
[24] 永 嶋 育 美 , 柳 川 博 文 ,福 島 学 , " 音 声 の ピ ッ チ に 着
目 し た 声 質 の 変 化 要 因 に 関 す る 検 討 ", 日 本 音 響
学 会 秋 季 研 究 発 表 会 , 3-Q-21, 2005
[25] 福 島 学 , 中 山 喜 代 志 , 八 子 勲 , 柳 川 博 文 , " 音 声
のピッチに着目した声質の変化要因に関する検
討 ", ヒ ュ ー マ ン ラ イ フ 情 報 技 術 研 究 会 , 2005 年
10 月
[26] 柳 田 鉄 兵 , 加 村 健 一 郎 , 福 島 学 , " 嚥 下 障 害 患 者 音
声 の 分 析 に 関 す る 一 考 察 ", 電 子 情 報 通 信 学 会 九
州 支 部 学 生 発 表 会 , pp.5, 2001
献
[1] 平 成 19 年 度 版 情 報 通 信 白 書 , 総 務 省 , 2007
[2] http://www.nttdocomo.co.jp/info/news_release/page/
070713_02.html ( 報 道 発 表 資 料 )
[3] 中 村 武 宏 ,安 部 田 貞 行 ,”Super3G の 技 術 動 向 そ
の 1 Super 3G の 概 要 お よ び 標 準 化 活 動 状 況 ”,
NTT DoCoMo テ ク ニ カ ル ジ ャ ー ナ ル ,Vol.14, No.2,
pp.50-55 , 2006
[4] 鷲 見 和 彦 ,” バ イ オ メ ト リ ク ス セ キ ュ リ テ ィ 概
論 ”,電 子 情 報 通 信 学 会 誌 ,Vo.89 ,No.1 ,pp.27-30 ,
2006
[5] 古 井 貞 煕 ,”音 声 に よ る 個 人 識 別 の 技 術 ”,シ ス テ
ム 制 御 情 報 学 会 , Vo.35 , No.7 , pp.408-414 , 1991
[6] 古 井 貞 煕 ,”音 声 の 個 人 性 情 報 と 話 者 認 識 ”,電 子
情 報 通 信 学 会 誌 , Vo.75 , No.6 , pp.631-632 , 1992
[7] 古 井 貞 煕 ,” 声 の 個 人 性 の 話 ”, 日 本 音 響 学 会 誌 ,
Vol.51 , No.11 , 1995
[8] F.K.Soong and A.E.Rosenberg,"On the use of
instantaneous and transitional spectral information
in speaker recognition", Proc. ICASSP 86,
pp.877-880, 1986
[9] 松 井 知 子 , 古 井 貞 煕 ,” 音 源 ・ 声 道 特 徴 を 用 い た
テ キ ス ト 独 立 型 話 者 識 別 ”, 電 子 情 報 通 信 学 会 論
文 J75-A , pp.703-709 , 1992
[10] 松 井 知 子 , 古 井 貞 煕 ,” VQ , 離 散 / 連 続 HMM に
よ る テ キ ス ト 独 立 話 者 認 識 方 の 比 較 検 討 ”, 電 子
情 報 通 信 学 会 論 文 J77-A , pp.601-606 , 1994
[11] F. Bimbot I. Margin-Chagnolleau and L. Mathan,
"Second-Order
Statistical
Measures
for
Text-Independent Speaker Identification", Speech
Communication, Vo.17, No.1-2, pp.177-192, 1995
[12] S.Gotoh,M.Kazama,M.Tohyama, and Y.Yamasaki,"
Speaker Verification Using Narrow-band Envelope
Correlation Matrices", 2006 IEEE International
Symposium on Signal Processing and Information
Technology, pp.310-313 , 2006 August
[13] 早 川 昭 二 , 板 倉 文 忠 ,” 音 声 の 高 域 に 含 ま れ る 個
人 性 情 報 を 用 い た 話 者 認 識 ”, 日 本 音 響 学 会 誌 ,
Vol.51 , No.11 , pp.861-868 , 1995
[14] 北 村 達 也 , 赤 木 正 人 ,” 短 母 音 の 話 者 識 別 に 寄 与
す る ス ペ ク ト ル 包 絡 成 分 ”,日 本 音 響 学 会 誌 ,Vo.53 ,
No.3 , pp.185-191 , 1997
[15] Tatsuya Kitamura, Masato Akagi, " Speaker
individualities in speech spectral envelopes", Journal
of the Acoustical Society of Japan, Vo.16, No.5,
pp.283-289, 1995
[16] 長 尾 優 次 , 村 上 尚 , 中 山 喜 代 志 , 加 村 健 一 郎 , 永
嶋 育 美 , 福 島 学 , 柳 川 博 文 ,“ 音 声 の 包 絡 線 情 報
に着目した個人性知覚特性に重要な周波数帯域
調 査 に 関 す る 一 検 討 ”, 日 本 音 響 学 会 秋 季 講 演 論
文 集 Ⅰ , pp.595-596, 2002
[17] 長 尾 優 次 , 福 島 学 , 柳 川 博 文 ,” 雑 音 下 で 発 話 し
た音声による狭帯域包絡線を用いた話者識別性
能 の 評 価 ”, 日 本 音 響 学 会 春 季 研 究 発 表 講 演 論 文
集 , Vo.2005, No1, pp.449-450, 2005
[18] 国 立 天 文 台 編 ,” 理 科 年 表 平 成 19 年 机 上 版 ”,
丸 善 出 版 , 2006
[19] 党 建 武 ,”声 の 個 性 を 決 め る も の ”,ATR ジ ャ ー ナ
ル , Vo.36 , pp.6-7 , 1996
[20] Dang, J., Honda, K., and Suzuki, H. "Morphological
and acoustical analysis of the nasal and paranasal
cavities," J. Acoust. Soc. Am., 96, 2088-2100, 1994
[21] Dang, J., and Honda, K.."Acoustic characteristics of
11
コミュニケーションネットワーク Lab.(福島研究室)
2007 年度卒業研究概要
日本文理大学・工学部・情報メディア学科
Nippon Bunri Univ.
Department of Media Technology
ユビキタス社会を支えるトランスメディア実現のための
情報記述に関する研究
-狭帯域包絡線情報を用いた個人性・伝送路特性の記述-
末廣一美 † 山田雄大
‡
† 日 本 文 理 大 学 大 学 院 〒 870-0397 大 分 県 大 分 市 一 木 1727
‡ ゴ ー ド ー ビ ジ ネ ス マ シ ン 株 式 会 社 〒 870-0127 大 分 県 大 分 市 下 郡 北 1 丁 目 2 番 12 号
あらまし 本研究は,ユビキタス社会実現の課題となっている個人性・利用状況の違いをなくし円滑なコミュ
ニケーションをとるための情報記述に基づいた適応的なメディア変換を行うトランスメディアの研究を行ってい
る.トランスメディア実現のためにメディアに依存しない情報源が持つ「特徴量」を適切に伝送し,個人性・利
用状況に合わせて適切なメディアに再構成することを目的としている.本卒業論文では,トランスメディア実現
に必要な「システムによる個人性・利用状況の自動判別」のうち,音響信号の狭帯域包絡線情報の特徴量抽出を
行い,
「 話 者 の 識 別 」お よ び「 室 種 別 の 類 別 」が 可 能 で あ る か に つ い て 調 査 を 行 っ た .調 査 結 果 ,狭 帯 域 包 絡 線 情
報を共通の特徴量とすることで,個人を識別,室種別を類別,できることがわかった.また使用する周波数範囲
を 絞 り 込 ん で 約 20%に し て も 平 均 正 解 率 の 低 下 が 7%程 度 で あ る こ と か ら , 少 な い 特 徴 量 で の 記 述 が 可 能 で あ る
ことがわかった.
キーワード ユビキタス,トランスメディア,情報記述,狭帯域包絡線,伝送路
1. は じ め に
こではこれを「特徴量」と呼ぶ)を適切に伝送し,個
人差・利用状況に合わせて適切なメディアに再構成す
ることを目的とする.特徴量による情報の記述をデー
タの符号化であるデータ記述と区別するために「情報
記述」と呼ぶこととする.
情報記述を個人差・利用状況に合わせて適切に行う
ために必要な現状把握は,現実世界の計測に基づくも
のでなければならない.ここでは計測されたデータを
そ の ま ま 使 う の で は な く ,計 測 デ ー タ か ら 個 人・状 況・
現象を認証するのに必要な特徴量を使用することを考
えている.すなわち「情報が持つ特徴量による情報記
述」である.ここでは個人差・利用状況に合わせたメ
ディア制御であるため,個人を特定するための「話者
識別」および利用状況を特定するために空間認証の一
つである「室種別の類別」を対象とする.
次に計測データから個人差・利用状況を認証するの
に必要な特徴量の抽出方法について考える.人間の識
別方法を考えると,聴覚の物理的メカニズムは対象に
よって変化していない.このことから,聴覚による知
覚特性を元に「話者」と「室種別」の知覚特性上の共
通項を見つけることが可能であると考える.このこと
から人の聴覚メカニズムに基づき信号を狭帯域分割し
て求めた包絡線が有効であると考えられる.少なくと
も 音 声 時 間 波 形 を狭 帯 域 分 割 して求 めた包 絡 線 の帯 域
間 相 関 を用 いて話 者 の識 別 が可 能 であることは報 告 さ れ
て い る [8].
以上のことから本卒業論文では,トランスメディア
実現に必要な「システムによる個人差・利用状況の自
動判別」のうち,日常生活の中で一般的に用いられる
「音響信号」において狭帯域分割した包絡線情報を特
徴 量 と し ,「 話 者 識 別 」と「 室 種 別 の 類 別 」が 可 能 で あ
るかについて調査を行う.
ユ ビ キ タ ス 社 会 で は「 い つ で も ,ど こ で も ,誰 で も ,
何でも」情報技術の恩恵に授かることで,より知的活
動に専念できる豊かな世界の構築をすることを目的と
し て い る [1].こ れ を 実 現 す る た め の u-Japan 政 策 [2]の
一 環 と し て ,誰 で も ICT を 簡 単 に 利 用 で き ,世 代 や 地
域を越えたコミュニケーションの実現を目指している.
世代や地域を越えて多様な人々がコミュニケーション
しようとするとき,文化,言語,知識,身体的能力の
違いといった壁(バリア)が存在し,それが障害とな
ってコミュニケーションを阻む.従って,ユビキタス
社会の実現にはこれらのバリアから生まれるコミュニ
ケーション間の障害を解消(フリー)するための技術
創 出 が 必 要 で あ る と 報 告 さ れ て い る [3].
現在,このバリアを解消するため様々な研究が行わ
れ て い る [4-5]が , こ れ ら は 「 常 時 変 換 」 ま た は 「 利 用
者 に よ る 使 用 す る メ デ ィ ア の 選 択 」を 必 要 と し て お り ,
「システムによる適応的な自動判別」には至っていな
い.このため,使用できる利用者・利用状況を限定し
て お り ,「 情 報 通 信 機 器 利 用 の 負 担 や 存 在 を 感 じ る こ
となく,誰もが個人差や利用状況などの違いを気にせ
ず,気軽にコミュニケーションをとることができる」
バリアフリーには至っていない.
本研究では,このバリアフリーを実現するシステム
による適応的な自動判別に必要な「適応的メディア制
御」および適応処理に必要な「システムによる現状把
握」を目的とする.ここではシステムによる適応的な
自動判別に基づく適応的なメディアを「トランスメデ
ィ ア ( 可 換 型 メ デ ィ ア )」 と 呼 ぶ こ こ と す る .
トランスメディアは「制御可能なメディア」の確立
が必要であり,本研究では様々なメディアのうち「音
響メディア」と「言語メディア」に着目する.これま
でに「音響情報による室空間の心的印象の尺度化」と
そ れ に 基 づ く「 記 述 言 語 」 の 可 能 性 検 証 が 報 告 [6-7]さ
れていることから,これらの成果を元にしたメディア
制御を行う.ここではメディアに依存しない情報源が
持 つ「 目 的 の 情 報 を 想 起 」す る の に 必 要 十 分 な 情 報( こ
2. 情 報 記 述
2.1. 人 の情 報 伝 送 路 特 性 モデル
人が情報をどのように伝えるかを考えるために,人
12
と人との間の情報伝送路をモデル化することを考える.
音声を含む音響事象をモデルとした,言語野レベル,
脳 内・空 間 物 理 変 換 レ ベ ル ,音 響 事 象 レ ベ ル ,で 図 2.1
のように発話による情報伝送路のモデルが提唱されて
い る [9].こ の モ デ ル で は ,情 報 の 起 源 が 言 語 と し て 表
現可能なものを対象としているため,脳内・空間物理
変換レベルは言語発声のための調音動作および聴知覚
特性となる.ここで,発話者言語野の情報から,それ
に対応する調音動作を経て空間の振動現象が生じ,こ
れにより鼓膜の振動という空間物理・脳内変換が行わ
れ,言語野の情報が生じる.ここで発話者と受話者が
入 れ 替 わ る こ と で ,連 鎖 す な わ ち チ ェ イ ン が 発 生 す る .
図 2.1 は こ の 他 に , 発 話 者 が 生 じ た 物 理 現 象 が 発 話 者
聴知覚器官を経て言語野に行くという 2 つのチェイン
が 存 在 す る こ と を 示 し て い る . こ の こ と か ら 図 2.1 は
「 The Speech Chain」 と 呼 ば れ て い る .
により求めることができる.
音響信号である P は空気という伝播媒体により伝播
さ れ 聴 取 者 の 聴 覚 で 知 覚 さ れ る .知 覚 さ れ た P は 伝 播
媒体である空気の特性を含み,また伝播過程で情報を
~
消失する可能性があるため P の近似である物理現象 P
~
~
になり,言語構造 L に置きなおされ解読される. P か
~
ら L へ の 変 換 は 式 (2.6)の 逆 過 程 で あ る た め
~ ~
FLP −1 ( ~
p ) = {{ ln } | l p }
(2.7)
GPL ≡ FLP −1 ( ~
p)
但し, F および G は F の逆関数.
により求めることできる.脳内で解読された言語構造
~
~
~
~
L は I と変換され理解される. L から I への変換は式
(2.4)の 逆 過 程 で あ る た め
~
~ ~
FIL −1 ( l ) = {{ in } | ip }
(2.9)
~
GLI ≡ FIL −1 ( l )
(2.10)
~
I
により求めることができる.話者が伝えたかった情報
~
I と聴取者が理解した情報 I の誤差 e
~
e≡ I −I
(2.11)
が限りなく 0 に近づけば情報は正確に伝わったと考え
ら れ る . こ こ で は , 式 (2.2) の L を 「 言 語 野 レ ベ ル
(Linguistic Level)」, 式 (2.5)の P を 「 脳 内 ・ 空 間 物 理 レ
ベ ル (Physiological Level)」,P に よ っ て 生 じ る 音 声 メ デ
ィ ア を 「 音 響 事 象 レ ベ ル (Acoustic Level)」, と 呼 ぶ .
The Speech Chain で は , 音 声 に よ る コ ミ ュ ニ ケ ー シ
ョンに限定している.しかし,我々は映像,音楽,動
作 な ど に よ る メ デ ィ ア ( こ こ で は こ れ を Media Level
と呼ぶ)を用いたコミュニケーションも行っているこ
と か ら , The Speech Chain に 基 づ き 対 象 の 拡 張 を 図 る
必要がある.
対 象 の 拡 張 を 図 る に あ た り ,物 理 現 象 P に よ っ て 生
じた音声が I によって形成されることを考えると I は
次式のように物理現象 P の情報の基になっていると考
えることができる.
P = FLP FIL (i )
(2.12)
I
~
L
L
P
~
P
図 2.1 脳 内 で 発 生 し た 情 報 を 相 手 に 伝 え る ま で の
伝 播 過 程 [9]
図 2.1 は 物 理 的 な 伝 播 媒 体 を 空 気 と す る 音 声 伝 播 を
示している.ここでは,脳内で発生した情報を相手に
伝播するまでの情報伝播過程を考えることで,トラン
ス メ デ ィ ア 実 現 の 可 能 性 を 考 え る . 図 2.1 の 過 程 を 記
号に置きなおして考える.
あ る 話 者 (SPEAKER) が 聴 取 者 (LISTENER) に 伝 え た
い 内 容 I は , 複 数 の 要 素 i ま た は 一 つ の ip で 構 成 さ れ
また,I が物理現象 P の情報の基になっているなら
ば,次式のように物理現象 P から I を推定することが
可能であると考えられる.
~
I = G G (~
p)
(2.13)
ている.
I ≡ { i1 , i2, L | i p }
(2.1)
但 し , i p は i の 素 要 素 (primitive element).
LI
こ の i は 情 報 の 要 素 で あ り ,i の 状 態 で 伝 え る こ と が
できないため,脳内で i を言語化または記号化して,
言語的メッセージ(文法に基づく言語構造)L に変換
する.言語構造 L は I 同様に
L ≡ { l1 , l2, L | l p }
(2.3)
PL
しかし,I は「情報そのもの」あるいは「脳内構造
により産み出されたもの」であるため直接的に観測・
制 御 す る こ と は 難 し く ,式 (2.13) に 示 す 逆 関 数 を 成 立 さ
せることが難しい.
一方,人はメディアが異なっても同一の情報 I を受
け 取 る こ と が で き て い る . こ の こ と か ら , The Speech
Chain の 一 連 の 処 理 は , 脳 内 で 発 生 し た 情 報 を メ デ ィ
アによらず相手に伝播にするまでの情報伝播過程とし
て扱うことができると考えられる.
そ こ で こ こ で は , The Speech Chain に 基 づ い た
Media Level 間 で の 相 互 変 換 に 着 目 し , 各 知 覚 特 性 で
「 何 を( 特 徴 量 )」受 け 取 っ て い る の か を 明 ら か に す る
ことで,I を人あるいは計算機が扱える「データ」に
することを考える.
以上のことから本卒業論文では,観測可能である物
理現象 P により生じた「音響メディア」を対象とし,
観測データから「話者」および「室種別」の特徴量抽
但 し , l は S+V, S+V+C と い っ た 文 法 構 造 .
と な り , 複 数 の l ま た は 一 つ の lp で 構 成 さ れ て い る .
また I から言語構造 L への変換は
FIL (i ) = {{ ln } | l p }
(2.8)
−1
(2.4)
に よ り 求 め る こ と で き る .言 語 化 さ れ た L を 調 音 運 動
に よ っ て 物 理 現 象 P で あ る 音 響 信 号 に 変 換 す る .物 理
現象 P も言語構造 L ,I 同様に
P ≡ { p1 , p2, L | p p }
(2.5)
で 構 成 さ れ て い る .ま た 言 語 構 造 L か ら 物 理 現 象 P で
ある音響信号への変換は
FLP (l ) = {{ pn } | p p }
(2.6)
13
出を行う.
2 章 2 項 で 我 々 が 観 測 で き る 情 報 の 観 測 方 法 ,2 章 3
項 か ら 2 章 5 項 で 式 (2.12) の 関 数 F の 推 定 方 法 , 2 章 6
項 で 式 (2.13) の 逆 関 数 G の 推 定 方 法 , を 述 べ る .
トルで書き直すと,次式が得られる.
 y1 
 x1 
1
 
 

y
x
 2
 2
1




y = y3 = a x3 + b 1 = ax + bd
(2.21)
 
 

 y4 
 x4 
1
y 
x 
 !

 5
 5
但 し ,y は 出 力 信 号 ベ ク ト ル ,x は 入 力 信 号 ベ ク ト
ル,a と b は未知パラメータ.
未知パラメータである a と b を求めるためには,式
(2.20) の 連 立 方 程 式 を 解 け ば 求 め る こ と が で き る .し か
し,ここでは一次関数の性質上,y と x は互いに影響
を 及 ぼ さ な い 直 交 で あ る こ と か ら 最 小 誤 差 (LSE:Least
Square Error ) 法 を 用 い て 近 似 解 で 求 め る こ と を 考 え る
~
と , a と b の 近 似 解 で あ る a~ と b は 次 式 に よ っ て 得 ら
れる.
2.2. 情 報 の観 測
本卒業論文では,情報を計算機で扱うことを前提
に 考 え る た め ,物 理 現 象 P を 計 算 機 で 観 測 す る 方 法 を
考 え る . こ こ で は , あ る 現 象 x(t ) を 観 測 に よ っ て , 観
測 値 xn と す る と 次 式 の よ う に 表 現 で き る .
xn = x(t )δ (t − nTs )
(2.16)
但 し , xn は あ る 現 象 か ら 生 ま れ た 数 列 , n は 離 散
時 間 に 相 当 す る サ ン プ ル 番 号 , Ts は サ ン プ リ ン グ 周 期 .
式 (2.16) が 成 立 す る 条 件 と し て ,周 期 信 号 を sin と cos
の合成と仮定するならば,ある現象 1 周期に 2 点のサ
ンプリングが必要になる.このため,未知パラメータ
の数だけ連立方程式が必要になる.
以 上 の こ と か ら ,物 理 現 象 P は 計 算 機 で 観 測 す る こ
とは可能であると判断できる.
xT y
a~ = T
(2.22)
x x
T
~ d y
b = T
(2.23)
d d
但 し , x Td = 0 で な け れ ば 成 立 し な い .
式 (2.20) よ り 観 測 さ れ た 信 号 は 関 数 の 観 測 値 で あ る
ことがわかる.観測値で構成される連立方程式は関数
で規定される y と x の関係を観測したものである.こ
の連立方程式を解くことにより,変換関数を推定すれ
ば観測値によらない y と x の関係が明らかにでき,式
(2.22) と 式 (2.23) の よ う に 元 の 関 数 の パ ラ メ ー タ を 予 測
することができる.
2.3. 情 報 のモデル化
ある現象が雑音(ある時間だけ成立し,繰り返さな
い)によらず生じる事柄を表現するものだけで表した
も の を モ デ ル 化 と い う .前 節 で 述 べ た「 周 期 信 号 を sin
と cos の 合 成 と 仮 定 す る 」 が モ デ ル 化 の 一 例 で あ る .
モデル化には共通部分を関数によって表現したモデル
関数がある.モデル関数の例として周期的な現象
∞
周期的な現象 ≡ ∑{ Ak sin( 2πf k t ) + Bk cos(2πf k t )} (2.18)
2.5. 源 信 号 と観 測 信 号 から伝 送 特 性 を求 める
k =0
2 章 4 項のモデル化した情報のパラメータ推定は,
源信号と観測信号が 1 対 1 に対応していることを前提
にしている.しかし,実際には源信号は何かしらの媒
体を通じて伝送されて観測されるため,観測信号は媒
体 の 伝 送 特 性 を 含 む こ と に な る .こ こ で は ,源 信 号 xn
1
但 し , fk = k , T は 周 期 的 な 現 象 の 周 期 ,
T
と表現できる.
2.4. モデル化 した情 報 のパラメータ推 定
が 未 知 の 伝 送 特 性 hn と な る 系 を 通 過 し ,観 測 信 号 yn が
式 (2.18) の よ う に ,あ る 現 象 が モ デ ル 化 さ れ て い る と
考えているならば,観測値からモデルパラメータを推
定してそれに基づけば復元できる.
未知パラメータが n 個のとき,n 本の連立方程式で
解くことができる.ここでは,観測値からどのように
連立方程式ができるかを考える.連立方程式を解く上
で 理 解 し や す い よ う に 観 測 値 x(t ) を x , x n を y と し ,
得 ら れ る 図 2.2 に 示 す 線 形 シ ス テ ム を 考 え る . 図 中 の
n は離散時間を表す.但し,n は整数.
xn
図 2.2 の 関 係 は
yn =
表 2.1 観 測 さ れ た 値
x1
x2
x3
x4
x5
y1
y2
y3
y4
y5
M −1
∑ xn − τ hτ
τ =0
≡ xn ∗ hn
(2.24)
但 し , M は hn の 総 サ ン プ ル 数 .
と な る .式 (2.24) は 畳 み 込 み 演 算 と い う .改 め て , xn と
hn , yn の 関 係 を 考 え る と hn は xn に よ っ て 反 応 す る も
表 2.1 の x と y の 関 係 が 一 次 関 数 で あ る と す る な ら
の で あ り , 反 応 し た 結 果 が yn で あ る こ と か ら 図 2.3 の
ば
よ う に 表 現 す る こ と が で き る .こ こ で は ,M =3 と す る .
x0 x0 h0 x0h1 x0 h2
y1 = ax1 + b
y2 = ax2 + b
y3 = ax3 + b
yn
図 2.2 源 信 号 と 系 と 観 測 信 号 の 関 係
観 測 値 が 表 2.1 で あ る と す る .
x
y
hn
x1
(2.20)
x1h0
x2
y4 = ax4 + b
y0
y5 = ax5 + b
y1
x1h1
x1h2
x2 h0
x2 h1 x2 h2
y2
y3
y4
図 2.3 源 信 号 と 系 と 観 測 信 号 の 関 係
と 仮 定 す る こ と が で き る .式 (2.20) の 連 立 方 程 式 を ベ ク
14
図 2.3 か ら 次 式 を 得 ら れ る .
y0 = x0 h0
y1 = x1h0 + x0 h1
(2.26)
y2 = x2 h0 + x1h1 + x0 h2
(2.27)
 x0 2 + x12 + x32

XT Xh = 
0

0

y3 =
x2 h1 + x1h2
(2.28)
= ( x0 + x1 + x3 )Eh
y3 =
x2 h2
(2.29)
(2.25)
2
2
0
x0 + x12 + x32
0
2
2
 h0 
0
 
0
  h1 
x0 2 + x12 + x32  h2 

(2.38)
となる.
式 (2.27) を 考 え る と yn の n は 2 で あ り ,右 辺 の x p hq の
式 (2.38) よ り ,( x0 2 + x12 + x32 ) は ス カ ラ の た め x1 , x2 ,
p と q の 関 係 は p + q =2 で あ る .こ の こ と か ら 式 (2.27)
は
x3 の い ず れ か が 0 で な い 限 り 逆 数 が 必 ず 存 在 す る .ま
た E = E−1 で あ る た め ,式 (2.35) の 左 辺 に XT を 積 算 す る
ことで
2
yn = ∑ x2 − r h r
(2.30)
r =0
と表すことができる.
こ こ で は , 式 (2.30) が 成 立 す る 条 件 が
 0( n < 0)

xn =  0(n > M − 1)
 x (0 ≤ n < M )
 n
h=
XT y 1 T
= X y
sE
s
(2.39)
但 し , s は ス カ ラ で あ り , こ こ で は x0 2 + x12 + x32 ,
と な り , 逆 行 列 で あ る X −1 の 問 題 を 生 じ る こ と な く 未
知 系 hn を 求 め る こ と が で き る .近 似 解 と し て 未 知 系 の
(2.33)
h を求めたにもかかわらず,正しく解を求めることが
で き る こ と と ,そ の た め に 源 信 号 行 列 X の 各 列 ベ ク ト
ル xj が互いに直交するベクトルでなければならない
であり.この条件が成立することを前提として,未知
の 伝 送 特 性 hn を 既 知 の 源 信 号 xn と 観 測 信 号 yn で 求 め
る こ と を 考 え る . こ れ は 式 (2.25) か ら 式 (2.29) の 連 立 方
程式を解くことで求まる.
こ こ で は , 式 (2.25) か ら 式 (2.29) よ り
 0   x0 0 0 
 y0 
0 
 x0 
  

 
 
 
y
x
x
 0   x1 x0 0   h0 
 1
 0
 1
 y2  = h0  x2  + h1  x1  + h2  x1  =  x2 x1 x0   h1  (2.34)
  
 
 
 
 
x2   0 x2 x1  h2 
 y3 
x2 
0
x   0 0 x 
y 
0 
0
2
 
 
 4
 3 
と し て 考 え る .式 (2.34) は 5 要 素 か ら な る 5 次 元 ベ ク ト
ルであるのに対して,右辺は 3 ベクトルの和であるた
め 3 次 元 で あ る .こ の こ と か ら ,式 (2.34) は 左 辺 と 右 辺
の次元が異なり解を得ることができないため,近似解
を 求 め る こ と と す る . 式 (2.34) は
y = Xh
(2.35)
但 し ,y は 観 測 信 号 ベ ク ト ル ,X は 源 信 号 行 列 ,h
は伝送特性ベクトル,
と 表 現 す る . 式 (2.35) よ り
y
(2.36)
h=
X
と す れ ば 未 知 系 の hn が 求 ま る こ と が わ か り , 同 時 に
ことがわかった.
2.6. 観 測 信 号 と伝 送 特 性 から源 信 号 を求 める
2 章 5 項では,観測可能な源信号と観測信号から観
測不可能な未知系の伝送特性を求めた.本卒業論文で
は,源信号が観測不可能または生成する場合を考えて
いるため,観測信号と伝送特性から源信号を求めるこ
とを考える.
2 章 5 項 で 得 ら れ た 式 (2.25) か ら 式 (2.29) の 連 立 方 程
式 は ,未 知 系 の hn を 求 め や す く す る た め 源 信 号 xn を 行
列 と し , hn を ベ ク ト ル と し た .こ こ で は , xn を 求 め る
た め hn を 行 列 と す る .
式 (2.25) か ら 式 (2.29) よ り ,
 0   h0
 y0 
h0 
0 
  
 
 
 
 0   h1
 y1 
 h1 
h0 
 y2  = x0 h2  + x1 h1  + x2 h1  = h2
  
 
 
 
h2   0
 y3 
0
h2 
h   0
y 
0
0 
 
 
 4
 3 
0

0   x0 
 
h0   x1  (2.43)

h1   x2 
h2 
と し て 考 え る . 式 (4.43) は 式 (2.34) と 同 様 に 左 辺 と 右 辺
の次元が異なり解を得ることができないため,近似解
を 求 め る こ と と す る . 式 (2.43) よ り
y = Ηx
y
(2.44)
x=
H
X −1 が こ こ で の 問 題 で あ る こ と が わ か る . 逆 行 列 が 必
ず 存 在 す る も の と し て 単 位 行 列 E が あ る .そ こ で こ こ
では,X を単位行列のスカラ倍で表現することを考え
る.
0
h0
h1
h2
0
と す れ ば 源 信 号 xn が 求 ま る こ と が わ か り , 同 時 に H −1
がここでの問題であることがわかる.逆行列が必ず存
在 す る も の と し て 単 位 行 列 E が あ る の で ,H を 単 位 行
列のスカラ倍で表現することを考える.
XT Xh =
 x0 2 + x12 + x32
 h0 
x1x0 + x2 x1
x2 x0

 
2
2
2
x0 + x1 + x3
x1x0 + x2 x1   h1  (2.37)
 x0 x1 + x1 x2

x0 x2
x0 x1 + x1 x2
x0 2 + x12 + x32  h2 


こ こ で は ,源 信 号 行 列 X の 各 列 ベ ク ト ル x j が 互 い に
H T Hx =
h0 2 + h12 + h32
  x0 
h1h0 + h2 h1
h2 h0

 
2
2
2
h0 + h1 + h3
h1h0 + h2 h1   x1  (2.45)
 h0 h1 + h1h2

h0 h2
h0 h1 + h1h2
h0 2 + h12 + h32   x2 


こ こ で は , hn は 「 + 」 と 「 - 」 が あ る 信 号 で あ り ,
直 交 す る ベ ク ト ル と 仮 定 す る な ら , xi・x j = 0 ( 但 し ,
i ≠ j ) と な り , 式 (2.37) は
15
1
と す る な ら ば , hi h j が + に な る
2
確 率 お よ び - に な る 確 率 は 図 2.4 と な る .
hi h j hi h j
ある.このため,発 話 語 を特 定 しないテキスト独 立 型 方 式 が
有 用 であると考 えられる.
発 話 語 を特 定 しないテキスト独 立 型 の代 表 的 な方 法 に,
長 時 間 平 均 スペクトルによる方 法 [11],ベクトル量 子 化 によ
る方 法 [12-13],HMM を用 いる方 法 [14]等 がある.これらは
主 に周 波 数 領 域 で個 人 性 の抽 出 を行 っている.これらに対
し,音 声 時 間 波 形 を狭 帯 域 分 割 して求 め た包 絡 線 の帯 域
間 相 関 を用 いた識 別 手 法 が提 案 されている[15-16].
一 方 ,音 声 に含 まれる個 人 性 情 報 が偏 った周 波 数 帯 域
に存 在 する との報 告 もなされている[17-19].また 個 人 性 知
覚 に重 要 な帯 域 の調 査 [20]および音 声 時 間 波 形 を狭 帯 域
分 割 して求 めた包 絡 線 の帯 域 間 相 関 を用 いた話 者 識 別 性
能 の 評 価 が 行 わ れ て い る [21] . し か し そ こ で は 手 法 の 有 効
性 と 重 要 な 帯 域 が 存 在 す る か ど う か の 調 査 が 中 心 で あ り,
重 要 となる帯 域 が何 に起 因 しているかについての検 討 が十
分 ではなかった.
本 章 では, 重 要 な帯 域 の調 査 とし て正 解 率 を指 標 とし ,
使 用 する帯 域 による変 化 から重 要 な帯 域 を調 べること,およ
び重 要 な帯 域 が何 に起 因 しているかの調 査 を行 う.
+と-の出現確立を
+ +
+
+ −
−
− +
−
+
− −
図 2.4 「 + 」 と 「 - 」 の 出 現 確 率
1
である.このことから
2
hi h j の 総 和 は ,+ と - の 振 幅 に 極 端 な 偏 り が な け れ ば 0
図 2.4 よ り , 各 出 現 確 率 は
で あ る .こ の た め ,式 (2.45) の 右 辺 の 行 列 が 十 分 な 大 き
さ で あ れ ば 対 角 線 上 近 傍 の hi h j ( 但 し , i ≠ j )の 値 は 0
に近くなることが期待される.ここでは,ある一定以
下 の 値 を 0 と み な す こ と で , hi h j = 0 ( 但 し , i ≠ j )と
み な す こ と と す る な ら , 式 (2.45) は
2
2
2
H T Hx = (h0 + h1 + h3 )Ex
2
と な る .式 (2.46) よ り ,(h0 +
(2.46)
2
h1
3.2. 狭 帯 域 包 絡 線 間 相 関 係 数 による話 者 の識 別
2
+ h3 ) は ス カ ラ の た め h1 ,
携帯電話のマイク等で観測可能な音声信号は,母音
であれば声帯膜の開閉動作と呼気により発生する過渡
的信号である声帯波を音源とし,声道等で生じる共振
現象の結果である.ここで狭帯域分割した音声時間波
形 v( n) を 搬 送 波 と 包 絡 線 の 積 と 考 え る と , 異 な る 帯 域
の搬送波は相関が 0 となることが期待される.一方包
絡線は例えば母音であれば呼気の流量に対応する音源
エネルギーを反映すると考えられる.このため,同じ
音源により生じる共振現象のエネルギー変動である包
絡線情報は異なる帯域で相関が高くなることが予想さ
れる.特にその相関が共振現象の発生状況が個人の骨
格等の特性に依存することを考えると,この狭帯域に
分割した音声時間波形の包絡線の帯域毎の相関で個人
の特徴を計測することが可能であると考えられる.
そ こ で , 音 声 時 間 波 形 v(n) と , 表 3.1 に 示 す 中 心 周
波 数 と な る 1/4 オ ク タ ー ブ バ ン ド の 狭 帯 域 通 過 フ ィ ル
タ hb (n) の 畳 み 込 み 演 算 に よ り ,b 帯 域 の 音 声 時 間 波 形
h2 ,h3 の い ず れ か が 0 で な い 限 り 逆 数 が 必 ず 存 在 す る .
ま た E = E−1 で あ る た め ,式 (2.44) の 左 辺 に H T を 積 算 す
ることで
x=
HT y 1 T
= H y
sE
s
(2.47)
2
2
2
但 し , s は ス カ ラ で あ り , こ こ で は h0 + h1 + h3 ,
と な り , 源 信 号 xn を 求 め る こ と が で き る . 式 (2.40) か
ら 式 (2.42) と 同 様 の 方 法 で 式 (2.47) を 展 開 す れ ば ,
 x0 
 
(2.48)
x =  x1 
 x2 
となり,近似解として未知系の x を求めたにもかかわ
らず,正しく解を求めることができることと,そのた
めに H の行列が十分な大きさであればならないこと,
対 角 線 上 近 傍 の hi h j( 但 し , i ≠ j )の 値 を 0 に 近 く し ,
vb (n) を 得 る .
0 とみなさなければならいことがわかった.
またこれらのことより,2 章 2 項では情報の観測が
可能であること,2 章 3 項から 2 章 5 項では特徴量で
ある関数の推定およびそのパラメータの推定が可能で
あ る こ と ,2 章 6 項 で 逆 関 数 の 推 定 が 可 能 で あ る こ と ,
が わ か っ た .ま た 観 測 お よ び 関 数 推 定 を 行 う た め に は ,
様々な条件を成立させる必要があることがわかった.
本卒業論文では情報記述に必要な特徴量を用いた
vb (n) ≡
M −1
∑ v(n − p)hb ( p)
(3.1)
p =0
但 し ,b は 帯 域 番 号 ,n は 離 散 時 刻 に 相 当 す る サ ン
プル番号,M は狭帯域フィルタの長さ.
狭 帯 域 フ ィ ル タ は , FIR フ ィ ル タ と し , 長 さ を 2048
サ ン プ ル , サ ン プ リ ン グ 周 波 数 fs を 44100Hz と す る .
こ の た め 狭 帯 域 フ ィ ル タ の 周 波 数 分 解 能 は 21.5Hz ,フ
ィ ル タ の 長 さ が 約 46ms と な る . 低 域 の 特 性 が 悪 く な
る が ,本 手 法 で は 音 声 の 狭 帯 域 包 絡 線 を 100ms で 区 切
り使用することとしているため,フィルタ長が影響し
ない程度とした.結果的に声帯音源波で約 4 周期が対
象となる.
記述を行うために,人の聴覚メカニズムに基づいた狭
帯 域 包 絡 線 情 報 を 特 徴 量 と し て「 話 者 識 別 」お よ び「 室
種別の類別」が可能であるかの調査を行う.
3. 狭 帯 域 包 絡 線 情 報 を 特 徴 量 と し た 話 者 識 別
3.1. 狭 帯 域 包 絡 線 間 相 関 を用 いた話 者 識 別 にお
ける帯 域 と識 別 率 の検 討
話 者 識 別 は発 話 語 を特 定 するテキスト依 存 型 方 式 と特
定 しないテキスト独 立 型 方 式 がある[10].広 い年 代 層 および
利 用 方 法 を考 えると発 話 語 を特 定 することが難 しい場 合 が
16
表 3.1 1/4 オ ク タ ー ブ バ ン ド の 中 心 周 波 数
Band Center Freq. Band Center Freq.
No.
(Hz)
No.
(Hz)
1
28.9
21
917
2
34.4
22
1090.5
3
40.9
23
1296.8
4
48.6
24
1542.2
5
57.3
25
1834
6
68.1
26
2181
7
81
27
2593.7
8
96.3
28
3084.4
9
114.6
29
3668
10
136.3
30
4362
11
162.1
31
5187.4
12
192.7
32
6168.8
13
229.2
33
7336
14
272.6
34
8724.1
15
324.2
35
10375
16
385.5
36
12338
17
458.5
37
14672
18
545.2
38
17448
19
648.4
39
20749
20
771.1
こ こ で は 狭 帯 域 分 割 し た 音 声 時 間 波 形 vb ( n ) か ら そ
制 限 し た 場 合 に ,正 解 率 C A が ど の よ う に 変 化 す る か を
調べ,その変化から重要な帯域を調べる.
3.3. 話 者 の識 別 に重 要 な帯 域 の調 査
調 査 の た め 予 め 話 者 を 識 別 す る シ ス テ ム に ,20 歳 ~
25 歳 の 成 人 男 性 11 名 を 登 録 す る . 登 録 語 は 一 人 あ た
り 5 語とする.1 語当たり約 1 秒であり,登録者全員
共 通 で 計 55 語 を 登 録 す る .識 別 に 用 い る 識 別 語 は 登 録
語と異なる語とし,登録者により異なる.識別語は 1
人 当 た り 約 8 語 と し ,計 82 語 と す る .登 録 語 と 同 様 に
1 語当たり約 1 秒である.登録語と識別語の音素は,
共通しない部分があり,発話語によらない識別条件を
満たしている.また,音素分布に極端な偏りがない登
録 語・識 別 語 を 使 用 し て い る .正 解 率 C A は ,正 し く 識
別 さ れ た 数 を s, 登 録 者 A の 識 別 語 数 を u と す る と
CA ≡ s / u
(3.8)
で 求 め ,全 登 録 者 の C A の 総 和 を 登 録 者 数 11 名 で 割 っ
て,平均正解率 C を求める.識別に使用する範囲を 1
帯域ずつ追加・外していき,帯域を追加・外すことで
平 均 正 解 率 C が 高 く な れ ば 追 加・外 し た 帯 域 が 重 要 で
あると判断できると考えた.そこで,帯域番号 1 から
順 に 帯 域 を 追 加・外 し ,平 均 正 解 率 C の 変 化 を 調 べ る .
そ の 結 果 を 図 3.3 お よ び 図 3.4 に 示 す . 図 は 横 軸 に 使
用範囲の終了帯域番号を示しており,縦軸に平均正解
こ で 狭 帯 域 分 割 し た 音 声 時 間 波 形 の 包 絡 線 eb (n) を 求
める.この包絡線をヒルベルト包絡線と呼ぶ.これを
さ ら に 振 幅 を dB 変 換 し d b (n) を 求 め る .
率 C を 示 し て い る .得 ら れ た 平 均 正 解 率 C を「 ×」記
号で示し,それらから多項式近似により求めた近似曲
線も併せて示す.
本 手 法 では狭 帯 域 包 絡 線 の類 似 性 を相 関 係 数 により求
め る . 相 関 係 数 が, 狭 帯 域 包 絡 線 の 小 さ い 振 幅 範 囲 で 決
まるのを防 ぐため, d b (n) を - 30dB で 打 ち 切 る こ と と す
1
0.9
る . d b1 (n) と d b2 (n) よ り 帯 域 番 号 b1 と b2 の 狭 帯 域 包 絡 線
0.8
間 相 関 係 数 γ db db を 次 式 に よ り 得 る .
0.7
γ db db ≡
1
2
2
∑ {db (n)db (n) − db db }
σ db σ db
1
0.6
N −1
1
2
n=0
1
2
1
2
C
1
(3.6)
0.5
0.4
但 し , σ x は x の 分 散 , X は X の 平 均 ,N は d x の 長
0.3
さに相当するサンプル番号.
こ こ で は 狭 帯 域 分 割 数 が 39 で あ る た め ,狭 帯 域 包 絡
線 間 相 関 係 数 γ db db は 39 行 39 列 の 行 列 と な る . こ こ
1
0.2
0.1
0
2
2
5
10
15
20
25
30
35
39
Stopping band number
ではこれを狭帯域包絡線間相関係数行列と呼ぶことと
す る . こ れ を 1 つ の 音 声 時 間 波 形 v( n) か ら 求 め た 狭 帯
域包絡線情報とする.
 γ 1,1 γ 2,1 L γ 39,1 


γ 1, 2 γ 2, 2 L
M 
Γ ≡ 
(3.7)
M
M
L
M 


γ
γ 2,39 L γ 39,39 
 1,39
図 3.3
識別用使用帯域を帯域番号 1 から横軸の帯
域番号までとして求めた平均正解率 C と近似曲線
1
0.9
0.8
0.7
C
0.6
話者を識別するシステムでは,収録した音声情報か
ら,この狭帯域包絡線間相関係数行列 Γ を求め蓄積す
る .こ れ に 対 し て 識 別 対 象 X の 音 声 情 報 か ら 求 め た 狭
帯 域 包 絡 線 間 相 関 係 数 行 列 ΓX を 求 め ,そ れ と 蓄 積 さ れ
0.5
0.4
0.3
0.2
た Γ と の 相 関 係 数 γ XA を 求 め る .本 シ ス テ ム で は γ XA の
0.1
最 大 値 γ max を 識 別 候 補 と す る . 識 別 候 補 者 A が 本 人 と
0
一 致 し た 場 合 に 正 解 と し ,正 解 し た 回 数 か ら 正 解 率 C A
を求める.
こ こ で は , 式 (3.1) に 示 し た 帯 域 番 号 b の 使 用 範 囲 を
図 3.4
1
5
10
15
20
25
Starting band number
30
35
38
識別用使用帯域を横軸の帯域番号から帯域
番 号 39 ま で と し て 求 め た 平 均 正 解 率 C と 近 似 曲 線
17
かる.このことから,第 2 フォルマントの範囲が個人
性と対応することがわかった.
The second formant F 2 (kHz)
図 3.3 よ り ,1 )帯 域 番 号 6 か ら 正 解 率 が 急 激 に 向 上
し て い る こ と , 2 ) 帯 域 番 号 15 ~ 21 ま で の 正 解 率 の 変
化 が 他 の 範 囲 と 比 べ 緩 や か で あ る こ と , 3) 帯 域 番 号
22 ~ 31 の 範 囲 で 正 解 率 が 向 上 し て い る こ と ,が わ か る .
図 3.4 よ り ,1 )帯 域 番 号 6 か ら 正 解 率 が 低 下 し て い
る こ と , 2 ) 帯 域 番 号 15 ~ 21 ま で の 正 解 率 の 変 化 が 他
の 範 囲 に 比 べ て 緩 や か で あ る こ と , 3 ) 帯 域 番 号 22 か
ら正解率が急激に低下していること,がわかる.
図 3.3 お よ び 図 3.4 か ら , 重 要 な 帯 域 と し て , 帯 域
番 号 6 ~ 31 が 考 え ら れ ,帯 域 番 号 15 ~ 21 の 重 要 度 が そ
れ以外に比べて低いことが考えられる.そこで識別に
使 用 す る 帯 域 を ,1 )全 帯 域( 39 帯 域 ),2 )帯 域 番 号 6
~ 31 , 3 ) 帯 域 番 号 6 ~ 14 と 帯 域 番 号 22 ~ 31 , と し て
4.0
3.8
3.4
3.0
/i/
2.5
2.2
2.0
1.8
/e/
/a/
1.5
1.4
/u/
1.0
0.8
/o/
次に第 2 フォルマント周波数の範囲よりも高い周波
数範囲について考える.識別に使用する帯域による平
り込み率,平均正解率 C ,を示す.
均 正 解 率 C は 約 5% の 違 い で あ る が ,図 3.7 に 示 す 様 に
図 3.5
(
100
90
80
70
60
50
40
30
20
10
0
0.6
0.2
図 3.6
0.5
1.0
The first formant F 1 (kHz)
母 音 の 第 1 ・ 第 2 フ ォ ル マ ン ト 分 布 図 [22]
発 話 者 に よ り 正 解 率 が 異 な る .図 横 軸 に 平 均 正 解 率 C
( 図 中 「 All 」) と 登 録 者 , 縦 軸 に 正 解 率 C A を 示 す .
1
0.95
88% 0.9
86%
0.85
83%
CA
Accuracy and Ratio (%)
平 均 正 解 率 C を 調 べ る .そ の 結 果 と ,使 用 し た 周 波 数
範囲の制限率を周波数の広さの比および帯域数の比と
合わせて図 5 に示す.図は横軸に実験条件である使用
した帯域番号の範囲を示す.ここでは平均正解率と使
用する情報の使用率の対応を見るため,縦軸に,全帯
域 を 100% と し た 周 波 数 の 絞 り 込 み 率 お よ び 帯 域 の 絞
1-39
6-31
6-14, 22-31
Used Band Number
識別に使用する帯域範囲の制限率と C の関係
:周波数絞り込み率,
0.8
Band No.
0.75
0.7
+ 1-39
0.65
× 6-31
0.6
□ 6-14
22-31
0.55
0.5
:帯域絞り込み率, : C )
All
A
E
K
M
N SA SB SC TA TB Y
Talker
図 3.7
図 3.5 よ り 全 帯 域( 39 帯 域 )で 88% の 平 均 正 解 率 C
が , 帯 域 番 号 6 ~ 31 の 26 帯 域 を 用 い る こ と で 86% の
平 均 正 解 率 C と な る こ と を 示 し て い る .こ れ は ,情 報
の 使 用 率 を 周 波 数 範 囲 で 約 25 % ,帯 域 数 で 約 67 % に 制
全 39 帯 域 を 使 用 し た 正 解 率 と 帯 域 を 制 限 し
て得られる正解率の比較
本実験ではデータベースに登録する語句を全員共
通としているが,識別に使用する語句は被験者によっ
て異なる.このため,高い周波数範囲に特徴を持つ個
人または特徴を持つ語句が存在するかを調べる.
図 3.8 に 識 別 語 の 種 類 に よ る 正 解 率 の 違 い を 示 す .
図 3.8 は 識 別 に 使 用 す る 帯 域 を 帯 域 番 号 6 ~ 14 と 22 ~
31 と し て い る .図 横 軸 に 出 現 回 数 ,縦 軸 に 正 解 率 C A を
限 し た と き に , 平 均 正 解 率 C が 約 2% 低 下 す る こ と を
示 し て い る . 同 様 に 使 用 帯 域 を , 帯 域 番 号 6 ~ 14 と 帯
域 番 号 22 ~ 31 の 19 帯 域 を 用 い る こ と で 81 % の 平 均 正
解率 C となることを示している.これらのことから,
利 用 率 を 周 波 数 範 囲 で 約 20% ,帯 域 数 で 約 50% に 制 限
し た の に 対 し て ,平 均 正 解 率 C の 低 下 が わ ず か で あ る
こ と か ら , 帯 域 番 号 6 ~ 14 と 帯 域 番 号 22 ~ 31 の 19 帯
域が重要な個人性を含んでいると判断できる.この結
果が,何に起因するかを検討することで結果の妥当性
を検証する.
示し,各記号には識別語を併せて示している.
corrective judgement ratio
100%
3.4. 調 査 結 果 の検 討
日本語の特徴として母音の出現確率が高いことに
着目し,まず母音の共振特性であるフォルマント周波
数 で 検 討 す る .図 3.6 に 母 音 の フ ォ ル マ ン ト 分 布 図 [22]
を示す.図は横軸に第 1 フォルマント周波数を,縦軸
に 第 2 フ ォ ル マ ン ト 周 波 数 を 示 し て い る . 図 3.6 と 表
3.1 よ り , 横 軸 に 示 し た 第 1 フ ォ ル マ ン ト 周 波 数 が 帯
域 番 号 12 ~ 24 に 対 応 し ,縦 軸 に 示 し た 第 2 フ ォ ル マ ン
ト 周 波 数 が 帯 域 番 号 18 ~ 30 に 対 応 し て い る こ と が わ
netto sa-fi n'
nosutora damusu
90%
mo-ni n'gu
musume
mekara uroko
neko fu n'jatta
nakayama kin'niku n'
ueda shi n'ya
neko shi n'jatta
matsuzaka daisuke
80%
70%
60%
mito koumo n'
no n'biriya
50%
40%
niho n' chi n'botsu
30%
1
2
3
4
5
6
7
8
9
10
number of subjective word
図 3.8 識 別 語 の 違 い に よ る 正 解 率 の 違 い
18
11
図 3.8 に 示 し た 識 別 語 の 発 話 者 を 図 3.7 で 確 認 し た
ところ,発話者による際は見られなかった.このこと
か ら 図 3.8 に 示 し た 識 別 語 の 違 い に よ り 平 均 正 解 率 が
変化したと考えた.正解率が高く多くの被験者が発話
し て い る 識 別 語 と し て ,「 ネ ッ ト サ ー フ ィ ン ( netto
sa-fin') 」,「 ノ ス ト ラ ダ ム ス (nostora damusu) 」,「 モ ー
ニ ン グ 娘 ( mo-ningumusume) 」 が あ る . 本 シ ス テ ム で
は 1 秒の音声信号を使用しているが「モーニング娘」
は発話者によって全長が異なるため,ここでは 1 秒間
に 単 語 全 体 が 1 秒 以 内 で あ る「 ネ ッ ト サ ー フ ィ ン( netto
sa-fin') 」 を 比 較 対 象 と す る . 正 解 率 が 低 く 多 く の 被 験
者 が 発 話 し て い る 識 別 語 と し て「 水 戸 黄 門( mito koumo
n' )」 と 「 日 本 沈 没 ( niho n' chinbotsu) 」 が あ る . こ ち
らも発話者によって全長が異なるため,ここでは 1 秒
間 に 単 語 全 体 が 1 秒 以 内 で あ る「 水 戸 黄 門( mito koumo
n' )」を 比 較 対 象 と す る .比 較 候 補 の 識 別 語 の 時 間 波 形
例 を 図 3.9 に 示 す . 図 3.9 は 横 軸 に 時 間 , 縦 軸 に 振 幅
絶 対 値 を dB で 示 す .
ne
amplitude (dB)
0
to
a
3.5. 重 要 帯 域 近 傍 での平 均 正 解 率 の変 化
重 要 な 帯 域 の 更 な る 検 討 と し て , 図 3.5 横 軸 に 示 し
た使用帯域近傍での C を調べることで,この帯域の重
要 性 の 検 証 を 行 う . 調 べ た 結 果 を 図 3.10 か ら 図 3.13
fi n'
に 示 す .図 は 横 軸 に 変 化 さ せ る 帯 域 番 号 V ,縦 軸 に C ,
-5
を 示 す . 図 3.10 は 帯 域 番 号 V か ら 31 , 図 3.11 は 帯 域
-10
-15
番 号 6 か ら V ,図 3.12 は 帯 域 番 号 6-V と 22-21 ,図 3.13
0
0.2
0.4
0.6
time(s )
mi
0
to
ko
0.8
mo
は 帯 域 番 号 6-14, V-31 , を 調 べ た 結 果 で あ る .
1
90%
n'
85%
-5
C
amplitude (dB)
s
までの検討から第 2 フォルマントの要因となる部位お
よび副鼻腔の共振で高い周波数の重要な帯域となって
いるならば,過渡的な音源である声帯音源が関係して
いることが考えられる.声帯音源基本周波数は成人男
性 で 100 Hz ~ 150Hz ,女 性 で 250 Hz ~ 300Hz で あ り [26] ,
帯 域 番 号 8 ~ 14 に 対 応 す る . こ の こ と か ら , 帯 域 番 号
6 ~ 14 の 8 ~ 14 は 声 帯 音 源 と 対 応 し て い る も の と 考 え
られる.帯域番号 8 よりも低い帯域番号 6 および 7 は
中 心 周 波 数 が そ れ ぞ れ 68.1Hz , 81Hz で あ り , 声 帯 音
源基本周波数の成人男性の下限の約半分となり,その
範囲については何と対応するかの検討が必要であるが,
概ね重要な帯域の低い周波数範囲は声帯音源基本周波
数であると考えられる.
-10
80%
75%
-15
0
0.2
0.4
time(s )
0.6
0.8
70%
1
4
(48.6)
図 3.9 正 解 率 が 高 い 識 別 語 ( ネ ッ ト サ ー フ ィ ン :
上段)と正解率が低い識別語(水戸黄門:下段)の
時間波形の比較
5
(57.3)
6
(68.1)
7
(81)
8
(96.3)
V(Band Number (freq.(Hz)))
図 3.10
識別用使用帯域を横軸の帯域番号から帯域番
号 31 ま で と し て 求 め た 平 均 正 解 率 ( V-31 )
図 3.9 は , 母 音 の 継 続 時 間 に 顕 著 な 差 が な い が , 鼻
音の継続時間に違いがあることを示している.ネット
サ ー フ ィ ン に 含 ま れ る 鼻 音 「 ne 」「 n' 」, 水 戸 黄 門 に 含
ま れ る 鼻 音 「 mi 」「 mo 」「 n' 」, が あ る . そ こ で 鼻 音 の
継続時間を調べた.その結果,ネットサーフィンの鼻
音はシステムが音声を処理用フレームで区切る
100(ms) よ り も 長 く ,水 戸 黄 門 の 鼻 音 は そ れ よ り も 短 い
ことがわかった.
声の個性を決めるものとして声道形状および鼻腔
形状の複雑さが指摘されており,特に鼻腔は高い周波
数 に お け る 個 人 差 へ の 関 係 が 示 唆 さ れ て い る [23] .
鼻腔には主鼻道以外に副鼻腔と呼ばれる空洞が数
多 く 存 在 し て い る .主 な 副 鼻 腔 に は 蝶 形 骨 洞 ,上 顎 洞 ,
前頭洞がある.上顎洞の容積がもっとも大きく約
38cm 3 ,次 は 蝶 形 骨 洞 で 約 20cm 3 ,前 頭 洞 が も っ と も 小
さ く 約 8cm 3 で あ る .副 鼻 腔 容 積 の 相 対 偏 差 は 、蝶 形 骨
洞 で 14% ,上 顎 洞 で 13% ,前 頭 洞 で 27% で あ る [24-25] .
これらからサイズが小さい部位の共振周波数を求める
と , 前 頭 洞 で 3103 Hz ~ 5398Hz で あ り , 帯 域 番 号 28
~ 31 に 対 応 す る .こ の こ と か ら ,重 要 な 帯 域 と し て 得
ら れ た 帯 域 番 号 22 ~ 31 の 高 い 周 波 数 範 囲 は 副 鼻 腔 形
状によるものであると考えられる.
最後に,重要な帯域として選ばれた帯域のうち,低
い 周 波 数 で あ る 帯 域 番 号 6 ~ 14 に つ い て 考 え る . こ れ
90%
C
85%
80%
75%
70%
29
(3.7k)
30
(4.4k)
31
(5.2k)
32
(6.2k)
33
(7.4k)
V(Band Number (freq.(Hz)))
図 3.11
識別用使用帯域を帯域番号 6 から横軸の帯域
番 号 ま で と し て 求 め た 平 均 正 解 率 ( 6-V )
90%
C
85%
80%
75%
70%
10
11
12
13
14
15
16
(136) (162) (192) (229) (272) (324) (385)
V(Band Number (freq.(Hz)))
図 3.12
識 別 用 使 用 帯 域 を 帯 域 番 号 22 か ら 31 は 固 定
とし,帯域番号 6 から横軸の帯域番号までとして求め
た 平 均 正 解 率 ( 6-V, 22-31 )
19
とが知られている.一方,人は同じ形状の室でも例え
ば洋室と和室といった室の種別を識別している.室種
別を識別している要因がわかれば,仮想空間における
室印象を少ない特徴量で記述できるようになることが
期待できる.そこでここでは,室種別の違いが何に起
因するかを明らかにすることを目的としている.これ
までに実測インパルス応答の初期残響包絡係数を変更
することで空間印象「広さ」感の制御が可能であるこ
と,制御を施しても元の室種別が変化しないことが報
告 さ れ て い る [7][29][30] . ま た 室 に よ り 帯 域 毎 の 寄 与
率に違いがあることも報告されている.これらの結果
から狭帯域包絡線に着目することで室種別を識別でき
るのではないかと考えた.
本 章 で は ,床 面 が 剛 体 の 室( 以 下 ,洋 室 (Western style
room) と 呼 ぶ ) と 床 面 が 畳 の 室 ( 以 下 , 和 室 (Japanese
style room) と 呼 ぶ ) を 対 象 と し , 1) 同 一 室 の 異 な る 計
測 位 置 で の 比 較 , 2) 室 種 別 の 異 な る 2 室 の 比 較 , 3)
同一種別の室の比較,を行い,狭帯域包絡線情報によ
って識別が可能であるかの検討を行う.
90%
C
85%
80%
75%
70%
19
18
20
21
22
23
24
(0.5k) (0.6k) (0.8k) (0.9k) (1.1k) (1.3k) (1.5k)
V(Band Number (freq.(Hz)))
図 3.13
識 別 用 使 用 帯 域 を 帯 域 番 号 6 か ら 14 は 固 定
と し ,横 軸 の 帯 域 番 号 か ら 帯 域 番 号 31 ま で と し て 求 め
た 平 均 正 解 率 ( 6-14, V-31 )
図 3.10 と 図 3.11 よ り , 使 用 す る 帯 域 範 囲 は 帯 域 番
号 7( 中 心 周 波 数 81Hz )以 上 か ら 帯 域 番 号 31( 中 心 周
波 数 5187.4Hz )以 下 で あ れ ば よ い こ と が わ か る .ま た ,
図 3.13 と 図 3.14 よ り 帯 域 番 号 12 か ら 21( 中 心 周 波 数
4.2. 狭 帯 域 包 絡 線 情 報 の抽 出
192.1 ~ 917Hz ) の 範 囲 を 除 い て も C の 変 化 が 微 小 で あ
室 の 受 音 点 位 置 番 号 r の イ ン パ ル ス 応 答 hr (n) か ら
ることがわかった.
1/4 オ ク タ ー ブ バ ン ド で 狭 帯 域 分 割 し た イ ン パ ル ス 応
答 hrb (n) を 求 め る . こ こ で 使 用 す る 狭 帯 域 フ ィ ル タ は ,
こ の こ と か ら 図 3.5 に 示 し た 重 要 な 帯 域 ( 帯 域 番 号
FIR フ ィ ル タ と し ,長 さ を 2048 サ ン プ ル ,サ ン プ リ ン
グ 周 波 数 fs を 44100 Hz と す る . 直 達 音 の 遅 延 を 除 く
た め に hrb (n) か ら ケ プ ス ト ラ ム Crb (q) を 求 め る .こ れ の
6-14 ,22-31 )は 妥 当 な 結 果 で あ る こ と の 検 証 が で き た
と 判 断 す る .ま た ,使 用 す る 帯 域 を 帯 域 番 号 7 か ら 11
( 中 心 周 波 数 81Hz ~ 162.1Hz ),帯 域 番 号 22 か ら 31( 中
ヒ ル ベ ル ト 包 絡 線 erb (q) を 求 め , 振 幅 を dB 変 換 し た
心 周 波 数 1090.5Hz ~ 5187.4Hz )と 更 に 絞 り 込 み ,全 帯
d rb (q) を 求 め る .d rb1 (q) と d rb2 (q ) よ り 帯 域 番 号 b1 と b2 の
域 を 100% と し た 周 波 数 の 絞 り 込 み 率 は 約 19% , 帯 域
狭 帯 域 包 絡 線 間 相 関 係 数 γ d rb
の 絞 り 込 み 率 は 約 38% と で き る こ と が わ か っ た .
d
1 rb2
を 求 め る .こ こ で は 狭
帯 域 分 割 数 を 39 と す る た め , γ d rb
d
1 rb2
から狭帯域包絡
線 間 相 関 係 数 行 列 Γr を 39 行 39 列 の 行 列 と す る .こ れ
3.6. 話 者 識 別 のまとめ
を 1 つのインパルス応答から求めた狭帯域包絡線情報
とする.
本 稿 で は ,1) 同 一 室 の 異 な る 位 置 で 計 測 し た hr (n) で
ここでは,利用者のバイオメトリクスを用いた本人
認証技術の 1 つである話者を識別するシステムの実現
を目指している.発話語に依存せず安定して識別する
Γr の 類 似 度 , 2) 洋 室 と 和 室 で Γr の 類 似 度 , 3) 容 積 は 異
手 法 の 検 討 と し て , 音 声 時 間 波 形 を 1/4 オ ク タ ー ブ バ
な る が 同 一 種 別 ( 洋 室 ) と な る 2 室 で Γr の 類 似 度 ,を
ンドの狭帯域に分割した信号の包絡線から狭帯域包絡
調 査 す る .こ こ で は 調 査 元 と な る 室 A の 包 絡 線 情 報 ΓA
線間相関係数行列を特徴パラメータとする手法の検討
と 調 査 対 象 と な る 室 X の 包 絡 線 情 報 ΓX の 類 似 度 を 相
を行っている.本章では,識別に使用する周波数範囲
関 係 数 γ ΓX ΓA で 求 め る .
として重要な帯域を調べることおよびその個人性が何
4.3. 狭 帯 域 包 絡 線 情 報 の類 似 度 調 査
に依存するものであるかの調査を行った.
調査には 1 つの室において計測位置の異なる 3 個の
インパルス応答を使用する.対象とする室は洋室 2 室
( W1, W2 ), 和 室 1 室 ( J ) と し , 計 9 個 ( 3 ヶ 所 × 3
室)のインパルス応答を使用する.室形状が特徴量の
差異に直接影響することを防ぐため,ここでは室種別
によらず室形状を全て矩形室にする.
調 査 項 目 1) と し て , 洋 室 の 1 室 ( W1 ) と 和 室 ( J )
の各 3 個のインパルス応答から狭帯域包絡線情報を求
め ,そ れ ら の γ ΓX ΓA を 調 べ る .そ の 結 果 を 図 .4.1 に 示 す .
そ の 結 果 , 帯 域 番 号 7 か ら 11 ( 中 心 周 波 数 81Hz ~
162.1Hz ) と 帯 域 番 号 22 ~ 31 ( 中 心 周 波 数 1091Hz ~
5187.4Hz )の 範 囲( 19 帯 域 )が 重 要 な 個 人 性 を 含 ん で
いることがわかった.またそれらが,声帯音源基本周
波数,母音の第 2 フォルマント周波数,副鼻腔の共振
周波数と関連することがわかった.
図 は 横 軸 に γ ΓX ΓA の X で 示 さ れ る 室 種 別( W1 , J )と 計
4. 狭 帯 域 包 絡 線 情 報 を 特 徴 量 と し た 室 種 別 の
類別
4.1. インパルス応 答 の狭 帯 域 包 絡 線 間 相 関 を用 い
た室 印 象 類 別 手 法 の一 検 討
測 位 置 番 号( 1 ,2 ,3 )を 示 す .縦 軸 に 類 似 性 を 示 す γ ΓX ΓA
の 値 を 示 す .な お γ ΓX ΓA の A は 図 中 の 記 号 で 示 す .ま た
比 較 の た め に γ ΓX ΓA の 平 均 γ Γ
室 の 伝 達 特 性 に 室 形 状 の 特 徴 量 が 現 れ る [27-28] こ
20
X ΓA
を
γΓ
3
X ΓA
3
≡ (∑∑ γ ΓX _ p ΓA _ q ) / 9
(4.1)
図 4.2 は , γ ΓW ΓW =0.72 で あ り , い ず れ の γ ΓX ΓA も ほ
p =1 q =1
ぼ 0.5 以 上 と な っ て い る こ と を 示 し て い る . ま た
γ ΓX ΓA
で求め図中に直線で示す.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
γ ΓJ ΓW =0.35 で あ る こ と を 考 え る と ,室 容 積 が 異 な る 場
γ ΓW 1ΓW 1
W1_1
W1_2
W1_3
J_1
J_2
J_3
γ ΓW 1ΓJ
W1_1 W1_2 W1_3
J_1
J_2
合でも室種別が同じであれば類似度が高くなるものと
判断できる.
A
γ ΓJ ΓJ
4.4. 室 種 別 類 別 のまとめ
本章では,室のインパルス応答から狭帯域包絡線情
報を抽出し,それらの相関係数による室種別を類別す
る こ と が で き る か の 検 討 と し て , 1) 同 一 室 の 異 な る 計
測 位 置 で の 比 較 , 2) 室 種 別 の 異 な る 2 室 の 比 較 , 3)
同一種別の室の比較,を行った.
調査の結果から,室のインパルス応答から求めた狭
帯域包絡線情報を抽出し,それらの類似性を相関係数
で求めることで,室印象の 1 つである室種別を類別で
きる可能性が示唆されたものと判断する.
J_3
X (Room Type_Point Number)
図 4.1 同 一 室 の 異 な る 計 測 位 置 の 類 似 度 比 較 お よ び
室 種 別 の 異 な る 2 室 ( W1, J ) の 類 似 度 比 較
(W : 洋 室 , J : 和 室 )
5. ま と め
図 4.1 は , γ ΓW 1ΓW 1 =0.85 で あ り , γ ΓJ ΓJ =0.74 で あ り ,
本研究は,個人性・利用状況の違いを気にせず円滑
同一室では計測位置が異なっても類似度が高いことを
示 し て い る .ま た 調 査 項 目 2 )と し て 図 4.1 を 見 る と ,
なコミュニケーションを実現するために情報記述に基
γ ΓW 1ΓJ が 0.5 以 下 で あ り ,両 者 が 分 離 し て い る こ と が わ
づいた適応的なメディア変換を行うトランスメディア
かる.
しかし,これだけでは異なる 2 室のインパルス応答
の特徴に差があったのか,室種別に差があるのかが判
断 で き な い . そ こ で 調 査 項 目 3) と し て 容 積 の 異 な る
同 一 種 別 の 2 室 ( W1=63.1m 3 , W2=333.0m 3 ) を 比 較 す
る . 調 査 結 果 を 図 4.2 に 示 す . 図 の 横 軸 お よ び 縦 軸 は
図 4.1 と 同 じ で あ る . こ こ で は 洋 室 の 比 較 で あ る が 参
の研究を行っている.トランスメディア実現のために
考 デ ー タ と し て γ ΓWM _ p ΓJ を
ち , 音 響 信 号 の 狭 帯 域 包 絡 線 情 報 を 特 徴 量 と し て , 1)
メディアに依存しない情報源が持つ「特徴量」を適切
に伝送し,個人性・利用状況に合わせて適切なメディ
アに再構成することを目的としている.
本卒業論文では,トランスメディア実現に必要な
「システムによる個人性・利用状況の自動判別」のう
「話者識別」において個人性を含む重要な帯域を調べ
3
γ ΓWM _ p ΓJ ≡ (∑ γ ΓWM _ p ΓJ _ q ) / 3
(4.2)
ることにより少ない特徴量での識別が可能であるか,
q =1
2) 話 者 識 別 と 同 様 の 特 徴 量 を 用 い て 「 室 種 別 の 類 別 」
但 し , M は W1, W2 を 示 す 番 号 (1, 2) ,
が可能であるか,についての調査を行った.
で 求 め て , 各 γ ΓWM _ p ΓJ を 図 横 軸 J に 示 す . ま た 比 較 の
1) の 調 査 結 果 よ り , 音 声 時 間 波 形 か ら 求 め た 狭 帯 域
た め に γ ΓW ΓW と γ ΓW ΓJ を
包絡線情報を抽出し,それらの類似性を相関係数で求
γ ΓW ΓW ≡ (γ ΓW 1ΓW 1 + γ ΓW 1ΓW 2 + γ ΓW 2ΓW 2 ) / 3
(4.3)
めることで,個人を識別することが可能であることが
γ ΓW ΓJ ≡ (γ ΓW 1ΓJ + γ ΓW 2ΓJ ) / 2
(4.4)
わかった.また全帯域を使用した際の平均正解率 C が
88% で あ っ た の に 対 し て , 帯 域 番 号 6 か ら 31 ( 中 心 周
γ ΓX ΓA
で求め図中に直線で示す.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
波 数 68 Hz ~ 5187 Hz )と し た 際 に 86% ,さ ら に 絞 り 込
γ ΓW ΓW
γ ΓW ΓJ
W1_1 W1_2 W1_3 W2_1 W2_2 W2_3
X (Room Type_Point Number)
A
( 中 心 周 波 数 68 Hz ~ 273 Hz )と 22-31
ん で 帯 域 番 号 6-14
W1_1
W1_2
W1_3
W2_1
W2_2
W2_3
( 中 心 周 波 数 1091 Hz ~ 5187 Hz )と し た 際 に 81% で あ
り ,計 算 量 を 約 20% に し て も 平 均 正 解 率 C の 低 下 が 7%
程度であることがわかった.この重要な帯域の妥当性
検討として,重要帯域近傍調査を行った結果,帯域番
号 7 か ら 11 ( 中 心 周 波 数 81Hz ~ 162.1Hz ) と 帯 域 番 号
22 ~ 31 ( 中 心 周 波 数 1091Hz ~ 5187.4Hz ) の 範 囲 ( 19
J
帯 域 ) と 絞 り 込 ん で も 平 均 正 解 率 が 数 %の 低 下 に 収 ま
る こ と が わ か っ た .こ の こ と よ り ,「 何 が 」個 人 性 を 決
図 4.2 容 積 が 異 な る 同 一 種 別 の 室 ( W1, W2 ) の
めているのかを明らかにすれば,少ない特徴量パラメ
類似度比較
(W : 洋 室 , J : 和 室 )
ータで「話者」を識別できることがわかった.
21
Text-Independent Speaker Identification", Speech
Communication, Vo.17, No.1-2, pp.177-192, 1995
[16] S.Gotoh,M.Kazama,M.Tohyama, and Y.Yamasaki,"
Speaker Verification Using Narrow-band Envelope
Correlation Matrices", 2006 IEEE International
Symposium on Signal Processing and Information
Technology, pp.310-313 , 2006 August
2) の 調 査 結 果 よ り , 室 の イ ン パ ル ス 応 答 か ら 求 め た
狭帯域包絡線情報を抽出し,それらの類似性を相関係
数で求めることで,室印象の 1 つである室種別を類別
できる可能性が示唆できた.
これらの結果により,本研究論文の目標である「適
応的メディア制御」および「現状把握技術」に必要な
[17] 早 川 昭 二 , 板 倉 文 忠 ,” 音 声 の 高 域 に 含 ま れ る 個
人 性 情 報 を 用 い た 話 者 認 識 ”, 日 本 音 響 学 会 誌 ,
Vol.51 , No.11 , pp.861-868 , 1995
「 個 人 性 を 特 定 す る た め の 話 者 識 別 」,「 利 用 状 況 を 特
定するための室種別類別」の特徴量抽出・特徴量によ
る識別の可能性が示唆できたと判断する.
参
考
文
[18] 北 村 達 也 , 赤 木 正 人 ,” 短 母 音 の 話 者 識 別 に 寄 与
す る ス ペ ク ト ル 包 絡 成 分 ”,日 本 音 響 学 会 誌 ,Vo.53 ,
No.3 , pp.185-191 , 1997
献
[19] Tatsuya Kitamura, Masato Akagi, " Speaker
individualities in speech spectral envelopes", Journal
of the Acoustical Society of Japan, Vo.16, No.5,
pp.283-289, 1995
[1] 平 成 19 年 度 版 情 報 通 信 白 書 , 総 務 省 , 2007
[2] http://www.soumu.go.jp/s-news/2006/060908_3.html
[3] http://www.soumu.go.jp/s-news/2005/051215_3.html
[20] 長 尾 優 次 , 村 上 尚 , 中 山 喜 代 志 , 加 村 健 一 郎 , 永
嶋 育 美 , 福 島 学 , 柳 川 博 文 ,“ 音 声 の 包 絡 線 情 報
に着目した個人性知覚特性に重要な周波数帯域
調 査 に 関 す る 一 検 討 ”, 日 本 音 響 学 会 秋 季 講 演 論
文 集 Ⅰ , pp.595-596, 2002
[4] ア ー レ ム ベ ン ハ ッ シ ン , 他 ,” 言 語 グ リ ッ ド
( Language Grid )の 構 想 - 異 文 化 コ ラ ボ レ ー シ ョ
ン 基 盤 の 構 築 を 目 指 し て - ”, 人 工 知 能 学 会 全 国
大 会 ( 第 20 回 ), 3E1-6 , 2006
[5] 上 羽 貞 行 , 荒 井 隆 行 , 栗 栖 清 浩 , 他 ,” 音 バ リ ア
フ リ ー の 現 状 と 課 題 ”, 日 本 音 響 学 会 誌 , Vol.63 ,
No.12 , pp.723 ~ 730 , 2007
[21] 長 尾 優 次 , 福 島 学 , 柳 川 博 文 ,” 雑 音 下 で 発 話 し
た音声による狭帯域包絡線を用いた話者識別性
能 の 評 価 ”, 日 本 音 響 学 会 春 季 研 究 発 表 講 演 論 文
集 , Vo.2005, No1, pp.449-450, 2005
[6] 柳 川 博 文 , 福 島 学 , "ISFN(Interactive Sound Field
Network) の 研 究 ", 通 信・ 放 送 機 構 助 成 研 究「 創 造
的 情 報 . 通 信 技 術 研 究 開 発 推 進 制 度 」報 告 書 ,2003
年
[22] 国 立 天 文 台 編 ,” 理 科 年 表
丸 善 出 版 , 2006
平 成 19 年 机 上 版 ”,
[23] 党 建 武 ,”声 の 個 性 を 決 め る も の ”,ATR ジ ャ ー ナ
ル , Vo.36 , pp.6-7 , 1996
[7] 八 子 勲 , 福 島 学 , 柳 川 博 文 , " 双 方 向 音 場 共 有 ネ ッ
ト ワ ー ク (ISFN : Interactive Sound Field Network)
構 築 の た め の 音 場 表 現 語 の 選 定・類 別 と 音 場 表 現
語「 広 い 」に 対 す る 知 覚 量 の 制 御 ", R&D 研 究 開 発
報 , 株 式 会 社 パ イ オ ニ ア , pp.1- 11, No.3, 2001
[24] Dang, J., Honda, K., and Suzuki, H. "Morphological
and acoustical analysis of the nasal and paranasal
cavities," J. Acoust. Soc. Am., 96, 2088-2100, 1994
[25] Dang, J., and Honda, K.."Acoustic characteristics of
the human paranasal sinuses derived from
transmission
characteristic
measurement
and
morphological observation," J. Acoust. Soc. Am.,
100, 3374-3383,1996
[8] S.Gotoh,M.Kazama,M.Tohyama, and Y.Yamasaki,"
Speaker Verification Using Narrow-band Envelope
Correlation Matrices", 2006 IEEE International
Symposium on Signal Processing and Information
Technology, pp.310-313 , 2006 August
[26] 中 田 和 男( 日 本 音 響 学 会 編 ),”音 声 ”,コ ロ ナ 社 ,
pp.40 , 1977
[9] Peter B.Denes, Elliot N.Pinson(1963), "The Speech
Chain: The Physics and Biology of Spoken
Language", W.H.Freeman, 1993
[10] 古 井 貞 煕 ,” 声 の 個 人 性 の 話 ”, 日 本 音 響 学 会 誌 ,
Vol.51 , No.11 , 1995
[27] 羽 田 陽 一 , 牧 野 , 昭 二 , 金 田 豊 ,” 室 内 音 場 伝 達 関
数 の 共 通 極 ・ 零 モ デ ル 化 ”, 電 子 情 報 通 信 学 会 技
術 研 究 報 告 , EA93-101 , 1994
[11] 古 井 貞 煕 ,”音 声 に よ る 個 人 識 別 の 技 術 ”,シ ス テ
ム 制 御 情 報 学 会 , Vo.35 , No.7 , pp.408-414 , 1991
[28] 東 山 三 樹 夫 , 藤 坂 洋 一 ,” 室 内 音 場 と カ オ ス ”,日
本 音 響 学 会 誌 , Vol.53 , No.2 , pp.154-159 , 1997
[12] F.K.Soong and A.E.Rosenberg,"On the use of
instantaneous and transitional spectral information
in speaker recognition", Proc. ICASSP 86,
pp.877-880, 1986
[29] 中 村 篤 史 ,森 山 利 彦 ,福 島 学 ,柳 川 博 文 ,”「 広 さ 」
感とインパルス応答の周期構造及び狭帯域包絡
線 ・ エ ネ ル ギ ー と の 対 応 調 査 ”, 電 子 情 報 通 信 学
会 技 術 研 究 報 告 , EA2004-111 , pp.49-54 , 2004
[13] 松 井 知 子 , 古 井 貞 煕 ,” 音 源 ・ 声 道 特 徴 を 用 い た
テ キ ス ト 独 立 型 話 者 識 別 ”, 電 子 情 報 通 信 学 会 論
文 J75-A , pp.703-709 , 1992
[30] Manabu Fukushima , Hirofumi Yanagawa, " An
investigation of the disturbance factor of 'Spacious'
impression and its control in a re-produced sound
filed", AES 12th Regional Convention Tokyo,
pp.188-pp.191, 2005
[14] 松 井 知 子 , 古 井 貞 煕 ,” VQ , 離 散 / 連 続 HMM に
よ る テ キ ス ト 独 立 話 者 認 識 方 の 比 較 検 討 ”, 電 子
情 報 通 信 学 会 論 文 J77-A , pp.601-606 , 1994
[15] F. Bimbot I. Margin-Chagnolleau and L. Mathan,
"Second-Order
Statistical
Measures
for
22
コミュニケーションネットワーク Lab.(福島研究
日本文理大学・工学部・情報メディア学科
室)
Nippon Bunri Univ.
Department of Media Technology
2007 年度卒業研究概要
ユビキタス社会におけるコンテンツ保護・管理技術
のための品質制御を可能とする暗号化技術に関する研究
佐藤
祐希 1
砂田
智彦 2
1 株式会社日本テクシード〒460-0008 名古屋市中区英 3-18-1 ナディアパークビジネスセンタービル 20F
2 株式会社 CIT 〒107-6228 東京都港区赤坂 9-7-1 ミッドタウン・タワー28F
あらまし
ネットワーク技術が日常生活で当然のように利用できるユビキタス社会では,コンテンツの流通と保護という相
反する要素を両立させなければならない.そこで本研究では,暗号化による完全秘匿性とウォーターマークによるマークの透明
性の間を段階的に調整可能な暗号化技術の研究を行う.段階的に品質の調整を可能とするためには,完全な秘匿性ではなく平文
の意味を残せるようにする必要があると考えた.そこで数列と直交行列の射影に着目した.行列内で直交するベクトルは互いに
干渉せず独立し 1:1 射影が可能である.互いに直交するベクトルで構成されている行列ならば,元の数列と行列の内積を出し
射影された値は,元の数列が各ベクトルの要素をどの程度含んでいるかを示す数値になるので,段階的に品質を調整することが
可能になると考えた.そこで直交行列を暗号化の鍵として使用し,直交行列を調整することにより段階的にコンテンツの品質制
御が可能であるか検討する.その結果,直交行列を暗号化の鍵として使うことで段階的な品質制御は可能であることが明らかと
なった.
キーワード 暗号化,復号化,直交行列,逆行列,データ
値 に す る た め ,秘 匿 性 を 確 保 す る 暗 号 化 技 術 と い え る .
1. は じ め に
しかし,秘匿性を確保する暗号化技術では品質を落と
ユビキタス社会では様々なジャンルのコンテンツ
すことが実現できないと考えた.
が,適切な取り扱いに基づいて維持しながら伝播する
こ と が 求 め ら れ て い る [1].電 子 化 コ ン テ ン ツ の 流 通 に
そこで数列と直交であるベクトルで構成される行
お い て は ,海 賊 版 防 止 の ウ ォ ー タ ー マ ー ク 技 術 [2]や 秘
列の射影に着目した.行列内で直交するベクトルは互
匿 性 を 確 保 す る た め の 暗 号 化 技 術 [3]が あ る . し か し ,
い に 干 渉 せ ず 独 立 し 1:1 射 影 が 可 能 で あ る .互 い に 直
流通時には簡便性が求められ,保護に秘匿性が求めら
交するベクトルで構成されている行列ならば,元の数
れるため,公開用と取引用の 2 種類のファイルを準備
列と行列の内積を出し射影された値は元の数列が各ベ
することがある.公開用はコンテンツの一部を切り出
クトルの要素をどの程度含んでいるかを示す数値にな
し て 作 成 さ れ て い る こ と が 多 い .そ の た め 「コ ン テ ン ツ
る の で ,品 質 を 低 下 さ せ る こ と が 可 能 に な る と 考 え た .
本 来 の 品 質 」が ,コ ン テ ン ツ の 一 部 を 切 り 出 す こ と で 適
そして,ベクトルの要素を変えることで品質の低下を
切 に 伝 わ ら ず , 消 費 者 に 「不 当 な 価 格 」と 評 価 さ れ る こ
制御することが可能になると考えた.
本研究では,直交であるベクトルで構成される行列
と が あ る .ま た ,
「 不 当 な 価 格 」と 評 価 さ れ る こ と に よ
を暗号化の鍵として扱い,直交行列と元の数列の内積
り海賊版に拍車を掛ける危険性が発生する.
そこで,コンテンツ本来の品質をある程度落とした
を射影することを暗号化方式として提案する.また,
ものを公開用とすることで,コンテンツの全体を見る
直交行列の数値の幅と品質の低下が関係しているのか
ことができる.そのため消費者に本来の品質が,コン
を調査し,暗号化の鍵を調整することによって暗号化
テンツの一部を切り出して公開用とするよりは伝わる
による品質の段階的な制御が可能となるかを検討する.
のではないかと考えた.単にコンテンツの品質を落し
たものを公開用として扱うと,消費者は 2 種類のファ
2. 原 理
イルを両方ダウンロードする必要がある.しかし,暗
2.1. RSA 暗 号 方 式
号化技術を使い品質を落とすことが出来れば,公開用
代 表 的 な 暗 号 方 式 と し て 公 開 鍵 暗 号 方 式 の RSA 暗
のコンテンツをダウンロードしたのち取引用として解
号方式がある.
除キーをダウンロードすることで,ダウンロード自体
こ の RSA 暗 号 方 式 は 素 因 数 分 解 問 題 の 難 し さ に 安
の回数は変わらないがコンテンツをダウンロードする
全 性 の 根 拠 を 置 い て い る [4][5].こ れ は 素 因 数 分 解 の 効
手間は一度で済むようになる.
率 的 な 解 法 が 見 つ か っ て お ら ず 300~ 600 桁 の 素 因 数
現 在 , 代 表 的 な 暗 号 化 技 術 と し て RSA 暗 号 方 式 [3]
分解は実質的不可能とされているためである.
がある.この暗号方式は,元の数列を規則性のない数
この暗号方式は完全に規則性のない数値になるた
23
め数値の配列に意味がある画像データや音響データの
ないものは規則性のない数列になり,数値の配列に意
元の意味を全く残せない.よって,本研究では段階的
味がある画像や音響データは元の意味をある程度残し
な秘匿を行えるような異なる方式を考える.
た 数 列 に な る と 考 え ら れ る .そ こ で ,式 (5)と 式 (1)の 内
積を出した数列を暗号文とする方法を考えた.
具体的な暗号方法について考えると,例えば平文
2.2.直 交 行 列 を 用 い た 暗 号 化 方 式
[a
完全な秘匿性ではなく段階的に品質の制御を可能と
する方法について考える.品質の制御を可能とするた
b c d ]が あ り こ れ を
m ≡ [a b c d ]
めには数値の配列に意味があるデータの場合数値の配
列に意味を残せばよいと考えた.そこで直交であるベ
(6)
クトルで構成される行列と数列の射影に着目した.
と 定 義 し た と き ,こ れ に 式 (6)の 平 文 と 式 (1)の 直 交 行
行列を
 a1
b
A≡ 1
 c1

d1
a2
a3
b2
b3
c2
d2
c3
d3
a4 
b4 
c4 

d4 
と 定 義 し , 式 (1)行 列 の ベ ク ト ル
v 1 ≡ [a1
b1
c1
b2
mA
d1 を
d1 ]
c2
d2 ]
 aa1 + bb1 + cc1 + dd 1 
aa + bb + cc + dd 
2
2
2
= 2
 aa 3 + bb3 + cc 3 + dd 3 


aa 4 + bb4 + cc 4 + dd 4 
(1)
a1 b1 c1
と 定 義 し ,式 (1)の 行 列 の ベ ク ト ル
v 2 ≡ [a 2
列を次式のように積算し内積を出すと,
b2
c2
得られる.この数列は,平文が各ベクトルの要素をど
の程度含んでいるかを出すので,平文の要素を完全に
秘匿するものではないという特徴を持っている.
d2 を
本 研 究 で は 式 (7)右 辺 を 暗 号 文 と し て 扱 う .
復号化の際は逆行列と暗号文を積算し平文を求める.
(3)
そこで逆行列が必要となる.
行列を
と 定 義 し ,式 (2)と 式 (3)を 次 式 の よ う に 積 算 し 内 積 を 出
すと
 e1
f
B≡ 1
 g1

 h1
v・
1 v 2 ≡ v 1 v 2 cos θ
T
1
T
= v v 2 = v 2 v1 = 0
(7)
と な り ,結 果 と し て 平 文 と は 異 な る 式 (7)右 辺 の 数 列 が
(2)
a2
T
(4)
と な り 結 果 と し て 内 積 は 0 と な る .こ れ は 式 (2)に 式 (3)
e2
f2
e3
f3
g2
g3
h2
h3
e4 
f 4 
g4 

h4 
(8)
と定義し,直交行列 A と行列 B を積算し
の 成 分 は 含 ま れ て お ら ず ,式 (3)に 式 (2)の 成 分 は 含 ま れ
て な い こ と を 意 味 す る .そ し て ,式 (1)の ベ ク ト ル 全 て
1
0
AB = BA = 
0

0
に 式 (4)が 成 り 立 て ば ,式 (1)は 直 交 で あ る ベ ク ト ル で 構
成された行列となる.行列内で直交するベクトルは互
い に 干 渉 せ ず 独 立 し 1:1 射 影 が 可 能 で あ る . 数 列 が 直
交しているということは,1つの数列に対して直交す
る 2 つの数列の内積を求めることで,元の1つの数列
0
1
0
0
0
0
1
0
0
0
0

1
(9)
を 2 つの互いに干渉しない数値に変換することが出来
と 式 (9)右 辺 の 単 位 行 列 を 得 ら れ れ ば ,行 列 B は 直 交 行
ることを意味する.
列 A に対する逆行列となる.
復 号 化 の 際 は 式 (9)で 得 ら れ た 逆 行 列 B を 使 い 次 式
ここに 4 要素の数列を
x ≡ [x1 x 2 x3 x 4]
のように右除算すると,
(5)
と し た 時 ,式 (5)の 数 列 を 別 の 空 間 に 射 影 す る 行 列 が 互
いに直交するベクトルで構成されるならば,射影され
た 値 は ,式 (9)の 数 列 が 各 ベ ク ト ル の 要 素 を ど の 程 度 含
んでいるかを示す値となるので,数値の配列に意味が
24
ても数値化されていないため扱うことが出来ない.し
T
 aa1 + bb1 + cc1 + dd1 
aa + bb + cc + dd 
2
2
2
 2
Β
 aa3 + bb3 + cc3 + dd 3 


aa 4 + bb4 + cc 4 + dd 4 
=m
たがって人間の特性を扱うには四則演算に依存しない
心理量を測定して数値表現にし,無意味な数列から意
味のある計算可能な数列に置き換えなければならない.
この際に用いられる測定法は心理学的測定法である.
またこのようにして事象を意味のある数列に置き換え
(10)
る た め に 数 量 化 す る 行 為 を 「尺 度 化 」と 呼 ぶ . 数 量 化 の
と な り , 結 果 と し て 式 (6)の 平 文 m を 得 る .
際に参照するルールとして,ここではサーストンの心
本 研 究 で は 暗 号 化 に 式 (7)を 使 い , 復 号 化 に 式 (10)を
理 尺 度 構 成 法 [6]を 用 い る .
使用する.
式 (7)の 原 理 を 使 用 す る に は ,平 文 と し て 使 う 数 列 は
尺度には,次の 4 つがある.
直交行列のベクトル数と配列数に合わせる必要がある
①
名義尺度:数値でないものに対する尺度
ため 4 文字でなくてはならない.そこで,平文を 4 つ
②
順 序 (序 数 )尺 度 : 順 位 の 決 定 な ど に 使 う 尺 度
ずつ区切り暗号化に使うことにする.但し,4 の倍数
属性の与えられている値に関
でない平文を暗号化した場合は平文を 4 で割った余り
係 し ,事 象 そ の も の の 増 大 の 幅 は
の数だけ 0 という数値を追加する.
関係しない
この暗号化方式を用いて実際に暗号化を行ってみ
ることにする.
③
距 離 (間 隔 )尺 度 : 2 点 間 の 距 離 に 対 す る 尺 度
④
比 例 (比 率 )尺 度 : 絶 対 的 な 0 が 存 在 す る 尺 度
暗号化の鍵として使用する行列は,正方行列であり
要素が互いに直交である直交行列を使用する.使用す
本研究では,尺度化を行い低下した音響データの順
る直交行列は,C 言語で直交行列探索用のプログラム
序を決める.
を作製し,出力した直交行列の中から任意に数個選ぶ
こととする.
3.2.
一対比較法
ま ず は ,マ ト リ ク ス が 4 で 数 値 の 幅 -1~ 1 と -2~ 2 の
一対比較法は,数個の刺激を 2 つずつ対にした判断
直交行列を直交行列探索プログラムで探索する.得ら
を求める方法であり,間接法の中でも判断が容易なた
れ た 直 交 行 列 か ら 任 意 に 数 個 選 び 式 (6) の 変 換 に 使 う
め適応範囲が広く,判断の信頼性も高い.但し,一対
直交行列として使用し,音響データと画像データの暗
比較法で得られるデータは順序尺度である.本研究で
号化と復号化を行った.
は順序尺度を得たいので一対比較法を聴取実験に用い
そ の 結 果 音 響 デ ー タ (wav 形 式 )は 音 質 の 低 下 を 確 認
ることとする.
出 来 た . 画 像 デ ー タ (bmp 形 式 )は 画 質 の 低 下 を 確 認 出
来 た が , RGB ご と に 分 割 さ れ て 表 示 を さ れ て い た .
3.3.
画 像 が RGB ご と に 分 割 さ れ た 原 因 の 調 査 ,及 び 問 題
心理尺度値の算出方法
心理実験でよく使われる一対比較法で得られた実
の解決に時間がかかると判断した.そのため,本研究
験データの意味を考える.一対比較法とは 2 つの刺激
の 暗 号 化 の 対 象 と し て 1 次 元 数 列 で あ る wav デ ー タ を
を 与 え , い ず れ か が 「○ ○ で あ る か 」を 被 験 者 に 判 断 し
対 象 と す る .ま た 音 響 デ ー タ は 正 規 化 を 行 っ て wav フ
てもらう実験法である.今ここで刺激 i と刺激 j の 2
ァイルとして出力することとする.なぜなら正規化を
つ を 考 え る .こ れ を 被 験 者 に 10 回 提 示 す る 一 対 比 較 法
行わずに出力をすると,音として出力する最大を超え
を用いた聴取実験を行ったとき,次の結果が得られた
るデータは切り取られてしまい,暗号化したデータと
と考える.
出 力 し た wav フ ァ イ ル が 異 な る デ ー タ と な り ,正 常 に
(i,j)を 10 回 提 示 し た 場 合
復号化を行えなかったからである.
i の 音 質 が 悪 い : 3 回 /10 回
→
0.3
j の 音 質 が 悪 い : 7 回 /10 回
→
0.7
主観評価だけでは品質に順序を決めることが難し
いため,本研究の分析には尺度化を用いる.そして心
試行回数で除算することで正規化され,すべての実
理尺度値を求めることによって,暗号化した音響デー
験結果を 1 以下の値で扱うことができるようにする.
タに順序を決めることとする.
尺度化とは必ずどこかにある
3.
手法
3.1.
Zi と Z j が等しくなる点
Z ij 0 を 求 め る こ と で あ る .
尺度化とは
規 準 化 正 規 分 布 は 標 準 と な る 面 積 が 0.5 で あ る こ と
ある刺激に対する人の反応を計算機で扱おうとし
25
4. 実 験 項 目
Z ij 0 を 求 め る こ と を 考 え る と ,
か ら ,0.7 と い う 結 果 か ら
4.1. 直 交 行 列 の マ ト リ ク ス を 変 え 品 質 の 調 査
Z ij 0 と な る 面 積 は
4.1.1. 実 験 概 要
0.7-0.5=0.2
(15)
0.3-0.5=-0.2
(16)
2 章 で 述 べ た よ う に ,式 (11)が あ る と き ,そ れ を 別 の
空間に射影する行列が互いに直交するベクトルで構成
されるならば,射影された値は,元の数列が各ベクト
である.
ルの要素をどの程度含んでいるかを示す値となる.
式 (15)と 式 (16)の 値 0.2 を 付 録 1 の 正 規 分 布 表 で 調 べ
つまり,行列のベクトル数とマトリクス数が多くな
る と ,こ の 面 積 に 対 応 す る Z の 値 が 0.5244 で あ る こ と
れば元の数列が各ベクトルの要素をどの程度含んでい
が わ か る .上 記 の 過 程 を 表 2.1,2.2,2.3,2.4 に 示 す .
るかを示す値は少なくなり品質は低下すると予想され
但 し ,i よ り も j の ほ う が 「音 質 が 悪 い 」と 感 じ た 場 合 と ,
る.また,行列のベクトル数とマトリクス数を減らせ
j よ り i の ほ う が 「音 質 が 悪 い 」と 感 じ た 場 合 と す る .
1)
ば元の数列が各ベクトルの要素をどの程度含んでいる
かを示す値は多くなり品質の低下が少なくなると予想
一対比較法を用いた聴取実験を行い出た実験デ
される.
ー タ を 表 3.1 の よ う に ま と め る .
表 3.1
i
5
3
i
j
2)
本研究で使用している直交行列のマトリクスは 4 で
実験結果
ある.そこで,現在使用しているマトリクス数+1 の
j
7
5
マ ト リ ク ス 数 5 と -1 の マ ト リ ク ス 数 3 を 作 製 し 品 質 変
化の傾向を調査する.実験を行う上での条件は次の通
りである.
条件
表 3.1 の 実 験 結 果 を 10 で 割 る と 表 2.2 の 結 果 が
1). 数 値 の 幅 は -3~ 3 を 使 用 す る
得られる.
表 3.2
i
0.5
0.3
i
j
3)
2). 使 用 す る マ ト リ ク ス 数 は 3 と 4 と 5 を 使 用 す る
実 験 結 果 を 10 で 割 っ た 結 果
これらの条件に基づき暗号化を行い,暗号化したデ
j
0.7
0.5
ータの品質変化を調査する.
4.1.2. 実 験 手 順 及 び 結 果
1)
表 3.2 か ら 基 準 化 正 規 分 布 の 標 準 面 積 の 0.5 を 引
く と 表 3.3 の 結 果 が 得 ら れ る .
表 3.3
i
j
4)
2)
表 3.2 か ら 0.5 を 引 い た 結 果
i
0
-0.2
j
0.2
0
3)
3)の 結 果 マ ト リ ク ス の 増 加 に 伴 い 音 質 が 低 下 す る 傾
向にある.よって,マトリクス数を調整することによ
り音質の制御が出来る可能性を得られた.
面積から求めた Z の値
i
j
2)を 主 観 評 価 に よ り マ ト リ ク ス に よ る 音 質 低 下 順
を分けた
の 値 は 表 3.4 の よ う に な る .
i
0
-0.5244
1) で 取 り 出 し た 直 交 行 列 を 暗 号 化 鍵 と し て 使 い
wav フ ァ イ ル を 作 製 し た
付 録 1 の 正 規 分 布 表 を 見 て 表 3.3 の 面 積 か ら Z
表 3.4
直 交 行 列 探 索 プ ロ グ ラ ム で 作 製 し た 数 値 幅 -3 ~ 3
の直交行列を任意に数個取り出す
4.2. 直 交 行 列 の 数 値 の 幅 を 変 え 品 質 の 調 査 及
j
0.5244
0
び段階的な品質制御の検討
4.2.1. 実 験 概 要
この実験では,直交行列に使う数値の幅を変えるこ
表 3.4 の i 列 と j 列 の 列 平 均 を 求 め る と , i 列 は
とで,品質にどう影響するかを調査し,その結果を用
-0.2622 に な り ,j 列 は 0.2622 と な る .こ の 値 が 一 対 比
いることで品質の段階的な制御が可能であるか検討を
較法で得られる列平均である.この列平均が心理尺度
行 う . -1~ 1, -2~ 2 の 数 値 の 幅 は 以 前 調 査 し た た め ,
5)
こ こ で は -4~ 4, -5~ 5, -6~ 6, -7~ 7 の 数 値 の 幅 で 調
値となる.
査を行う.
1)~ 5)の 一 対 比 較 法 を 用 い た 聴 取 実 験 結 果 か ら 心 理
各数値の幅で直交行列探索プログラムを使用し,得
尺度値が得られる.
られた直交行列の中から任意に 4 個の直交行列を選ぶ.
26
使 用 し た 直 交 行 列 の マ ト リ ク ス は 3×3 で あ る .当 初
4)
3)で 得 ら れ た 音 質 低 下 順 で 各 数 値 幅 の 最 小 の 音 質
の 予 定 で は 4×4 で 行 お う と 考 案 し て い た が ,予 定 よ り
低 下 と 最 大 の 音 質 低 下 を 示 し た wav デ ー タ を 抜 き 出 す
4×4 の 直 交 行 列 探 索 に 時 間 が か か っ た 為 ,3×3 の マ ト
一 対 比 較 法 を 用 い た 聴 取 実 験 を 行 う に あ た り ,16 個
の wav デ ー タ を 全 て 使 う と 一 回 の 実 験 に 約 1 時 間 か か
リクスで調査を行うことにした.
ることを計算で求めた.それを 5 回行うので約合計 5
選ぶ条件として
1). 各 数 値 の 幅 で 最 大 か 最 小 の 数 値 を 含 む 行 列 を 使 用
時間かかることになる.被験者の負担や時間の都合を
すること
考 え て 実 験 に 使 う wav デ ー タ を 減 ら し て 品 質 の 段 階 的
2) . 直 交 行 列 は 最 初 の 数 値 が 最 大 値 , 最 小 値 , -1 , 1
な制御が可能であるかの検証することとする.実験に
の 4 個を選ぶこと
使 う wav デ ー タ は 半 分 の 8 個 に 減 ら し た .半 分 に し た
1)は , 各 数 値 の 幅 で 最 小 か 最 大 の 数 値 を 含 ん で い な
理由は,8 個でも尺度化を行うために,十分な実験デ
い場合,その数値幅より狭い数値幅で出せる直交行列
ータが得られると考えたためである.
実 験 に 使 う wav デ ー タ は , 表 4.1 で 得 ら れ た 音 質 低
になるからである.
2)は , 使 用 す る 直 交 行 列 を 分 散 さ せ る こ と で 数 値 幅
下順を参照し,各数値幅で音質低下が最小と最大を示
したものを使い合計 8 個とする.
全体の調査を行いたいからである.
1)と 2)の 条 件 の 下 wav デ ー タ を 暗 号 化 し ,実 験 実 施
5)
者の主観評価による音質低下順を出す.
4)の wav デ ー タ を 使 い 一 対 比 較 聴 取 実 験 を 行 う
wav デ ー タ を ラ ン ダ ム か つ 同 じ パ タ ン に な ら な い 組
その音質低下順を参照し各数値幅で音質の低下が
最大のものと最小のものを抜き出し,合計 8 個のデー
み合わせをプログラムで作成する.
そ し て ,マ ー カ 音 の 後 に 一 対 の wav デ ー タ を 組 み 合
タ で 心 理 尺 度 値 を 求 め wav デ ー タ に 順 序 を つ け る .
わせの数だけ作成した組み合わせで再生する.
PC か ら wav デ ー タ を 出 力 し ヘ ッ ド フ ォ ン AMP に 入
4.2.2. 実 験 手 順 及 び 実 験 結 果
1)
力 す る . ヘ ッ ド フ ォ ン AMP か ら ヘ ッ ド フ ォ ン に wav
直交行列探索プログラムより得られた直交行列
を任意に 4 個選択する
データを出力する.被験者はヘッドフォンで一対の
2)
wav デ ー タ を 聴 き , ど ち ら が よ り 「音 質 が 低 い 」と 感 じ
1)で 選 ん だ 直 交 行 列 を 暗 号 化 の 鍵 と し て 使 い wav
データを作成する
たかを判断し,所定の解答用紙に記入する.1 人あた
3)
りの総試行回数は 5 回とした.これは 1 回の実験で 2
2)で 作 成 し た wav デ ー タ を 主 観 評 価 に よ り 音 質 低
個 の 結 果 が 得 ら れ 合 計 10 の 結 果 が 得 ら れ る た め で あ
下順を決める
る . 被 験 者 の 数 は 10 人 と し た .
各被験者の実験データを使用出来るかの判断をする
表 4.1 主 観 評 価 に よ る 音 質 低 下 順
低下順
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
た め , 1% の 危 険 性 を 回 避 す る 方 法 で 識 別 し た .
数値の幅
7
6
5
4
4
7
6
7
5
6
7
5
5
6
4
4
10 デ ー タ で 0 回 /10 回 選 択 し た 時 と 10 回 /10 回 選 択
した時の確率は次式のようになる.
1
1
=
10
1024
2
(11)
10 デ ー タ で 1 回 /10 回 選 択 し た 時 と 9 回 /10 回 選 択 し
た時の確率は次式のようになる.
1
1
10
C =
×
10 10 1
1024 1
2
=
低下順の項目の 1 が最も音質が低下したものになり,
16 が 一 番 元 に 音 質 が 近 い も の と な る .数 値 の 幅 の 項 目
は直交行列の数値の幅を示している.
27
10
0.97
=
1024 100
(12)
10 デ ー タ で 2 回 /10 回 選 択 し た 時 と 8 回 /10 回 選 択 し
表 4.3
た時の確率は次式のようになる.
=
45
4.4
=
1024 100
ベクトル1
[7 1 -4]
[1 1 2]
[-4 -1 -2]
[-5 4 1]
[5 4 1]
[-6 -2 -4]
[-7 6 5]
[4 2 2]
7
5
2
4
3
6
8
1
1
1
10 × 9
×
C =
10 10 2
1024 2 × 1
2
(13)
心理尺度値による音質低下順
ベクトル2
[-1 -1 -2]
[2 -4 1]
[-1 -2 3]
[1 1 1]
[1 -1 -1]
[4 -4 -4]
[7 4 5]
[-1 4 -2]
ベクトル3
[2 -6 2]
[-6 -2 4]
[-1 2 1]
[1 2 -3]
[1 -2 3]
[1 5 -4]
[-1 -7 7]
[-2 1 3]
心理尺度値
2.018113
1.41615
0.644363
0.611925
-0.7277
-1.05935
-1.4562
-1.96063
式 (11)と 式 (12)で は 1% に 満 た し て お ら ず 、 式 (13)で
1% を 超 え て い る こ と か ら , 選 択 回 数 が 10 回 /10 回 ,9
縦 軸 の 1~ 8 に 対 応 し た 直 交 行 列 の ベ ク ト ル を 横 軸
回 /10 回 ,1 回 /10 回 ,0 回 /10 回 の も の は 被 験 者 が 確 実
の ベ ク ト ル 1,ベ ク ト ル 2,ベ ク ト ル 3 に 示 し ,縦 軸 の
に判断をしたこととなる.それ以外は判断がついてい
1~ 8 に 対 応 す る 心 理 尺 度 値 を 横 軸 の 心 理 尺 度 値 に 示
ないとする.
す.
全体の集計結果を出し被験者 1 人ずつ判断している
心理尺度値が大きいほど音質が悪いと判断され,心
ところと判断していないところの傾向を比較すると,
理尺度値が小さいほど音質の低下が少ないと判断され
全体の集計結果と被験者のパタンに大きな違いがない
ている.
ことが分かった.よって実験に使えないデータを持つ
被 験 者 は お ら ず 合 計 10 人 全 て の デ ー タ が 使 用 可 能 で
4.2.3.
あると判断した.
結果の検討
本実験の目的は,直交行列を鍵として使用した暗号
化方式で,使用する直交行列の数値の幅を変更するこ
6)
5)の 結 果 を 元 に 心 理 尺 度 値 を 算 出 す る
とにより音質が低下するかの調査と,品質の段階的な
3 章 3 項 で 説 明 し た 手 法 を 用 い て 表 4.1 に 心 理 尺 度
制 御 が 可 能 で あ る か の 調 査 で あ っ た . 表 4.3 を 見 る と
値を算出した.
数値の幅と音質の低下は直接的には関係していないと
い え る . ま た , 表 4.3 を 用 い れ ば 段 階 的 な 品 質 の 制 御
表 4.2
1
2
3
4
5
6
7
8
使用した直交行列と心理尺度値
ベクトル1
[4 2 2]
[-4 -1 -2]
[5 4 1]
[-5 4 1]
[1 1 2]
[-6 -2 -4]
[7 1 -4]
[-7 6 5]
ベクトル2
[-1 4 -2]
[-1 -2 3]
[1 -1 -1]
[1 1 1]
[2 -4 1]
[4 -4 -4]
[-1 -1 -2]
[7 4 5]
ベクトル3
[-2 1 3]
[-1 2 1]
[1 -2 3]
[1 2 -3]
[-6 -2 4]
[1 5 -4]
[2 -6 2]
[-1 -7 7]
は可能であることが明らかになった.
心理尺度値
-1.96063
0.644363
-0.7277
0.611925
1.41615
-1.05935
2.018113
-1.4562
4.3. 他 の 音 響 デ ー タ で も 同 じ 品 質 低 下 順 を 示
すかの傾向調査
4.3.1. 実 験 概 要
4 章 2 項の結果を用いて暗号化に使用した直交行列
を使い,他の音響データでも同じような品質の低下順
を示すのか傾向を調査する.他の音響データでも同じ
ような低下順を得るならば,応用分野がさらに広がる
と考えている.
縦 軸 の 1~ 8 に 対 応 し た 直 交 行 列 の ベ ク ト ル を 横 軸
しかし,研究に使用した暗号化原理は 2 章で述べた
の ベ ク ト ル 1,ベ ク ト ル 2,ベ ク ト ル 3 に 示 し ,縦 軸 の
ように,暗号文は平文が各ベクトルの要素をどの程度
1~ 8 に 対 応 す る 列 平 均 を 心 理 尺 度 値 と し ,横 軸 の 心 理
含んでいるかを出しているので,変換に使用する音響
尺度値に示す.
データという元の数列が変われば,品質の低下の度合
こ れ を 心 理 尺 度 値 の 順 序 で 並 び 替 え る と 表 4.3 の よ
い も 変 わ り , 表 4.1 で 出 し た デ ー タ と は 異 な る 結 果 が
うになる.
出ると予想される.そのため本実験では尺度化を使用
せず傾向を調査することとする.
4.3.2. 実 験 結 果 と 検 討
4 章 2 項で使用した直交行列と同じ直交行列を用い
て他の音響データを暗号化する.その結果を主観評価
で 音 質 低 下 順 を 決 め た 結 果 と 表 4.1 の 結 果 を 比 較 し や
す く ま と め た 表 を 表 4.4 に 示 す .
28
表 4.4
田中秀幸,寺井亜希,寺崎明,道傅愛子,新山
陽子,西垣通,長谷川貞夫,長谷川洋,浜田
純一,藤本貴也,三崎吉剛,吉見俊哉,″ユ
ビ キ タ ス で つ く る 情 報 社 会 基 盤 ″ ,pp151-153,
主観評価による音質低下順比較
音響データ1
低下順
数値の幅
1
7
2
6
3
5
4
4
5
4
6
7
7
6
8
7
9
5
10
6
11
7
12
5
13
5
14
6
15
4
16
4
音響データ2
低下順
数値の幅
1
7
2
6
3
5
4
4
5
4
6
7
7
6
8
7
9
5
10
6
11
7
12
5
13
5
14
6
15
4
16
4
[2]
[3]
[4]
[5]
[6]
音 響 デ ー タ 1 は 4 章 2 項 で 暗 号 化 し た wav デ ー タ で
あ り ,音 響 デ ー タ 2 は 本 実 験 で 暗 号 化 し た wav デ ー タ
である.低下順の項目は 1 が最も音質が低いものであ
り ,16 が 最 も 元 の 音 質 に 近 い も の と な る .数 値 の 幅 の
項目は暗号化の鍵として使用した直交行列の数値の幅
となる.
表 4.4 を 見 る と 音 響 デ ー タ 1 と 音 響 デ ー タ 2 は 同 じ
数値の幅で同じような低下順を示していることがわか
ったが音質の低下の度合いは異なった.しかし,尺度
化を行っていないため同じ低下順であると証明するこ
とが出来なかった.
5. お わ り に
本研究は,音響データの品質を暗号化により段階的
に制御可能とする暗号化技術に関する研究である.直
交行列を暗号化の鍵として使う暗号化方式の提案をし,
この方式によって音響データの品質を段階的に制御可
能かどうかの検証,直交行列の数値の幅と品質の低下
が関係しているかを検証した.
その結果,直交行列の数値の幅と品質の低下は関係
しておらず,数値の幅を増加させることで品質の低下
はしないということと,音響データを段階的に制御が
可能であるということがわかった.また,マトリクス
を変化させることで品質を制御可能である可能性と,
得られた音質低下順が違う音響データに対しても有効
である可能性を得られた.
文
献
[1] 編 者 坂 村 健 , 著 者 飯 塚 久 夫 , 石 田 英 敬 ,大 石
久 和 ,大 江 和 彦 ,門 脇 俊 介 ,川 嶋 弘 尚 ,鬼 頭 達 男 ,
越 塚 登 ,小 向 太 郎 ,須 藤 修 ,須 藤 徳 之 ,竹 中 ナ ミ ,
29
財 団 法 人 東 京 大 学 出 版 会 , 2006
井 上 彰 ,″ マ ル チ メ デ ィ ア 時 代 の 暗 号 シ ス テ ム ″ ,
pp11-15, 株 式 会 社 丸 山 学 芸 図 書 , 1997
岡 本 栄 司 ,″ 暗 号 理 論 入 門 ″ ,pp88-98,共 立 出 版
株 式 会 社 , 1993
岡 本 栄 司 ,″ 暗 号 理 論 入 門 ″ ,pp98-99,共 立 出 版
株 式 会 社 , 1993
岡 本 栄 司 ,″ 暗 号 理 論 入 門 ″ ,pp167-169,共 立 出
版 株 式 会 社 , 1993
難 波 精 一 郎 ,桑 野 園 子 ,″ 音 の 評 価 の た め の 心 理
学 的 測 定 法 ″ , コ ロ ナ 社 , pp.87-89, 1998
ユビキタスネットワークにおける符号化率による
コンテンツ品質変化の心的印象による評価に関する研究
秋山
株式会社アルトナー
東京本社
勇二
〒105-0012東京都港区芝大門2-5-5
住友不動産芝大門ビル10F
あらまし
データの通信や保存の際に活用するデータ圧縮の技術があり,これらには符号
化技術が使われている.この符号化技術の中に動画像を圧縮する MPEG という規
格があり,地上デジタル放送や DVD などに使用されている.MPEG は人間の特
性を利用し知覚不可能な情報を削除,または高圧縮をかけてデータ量を減らして
いる.この高能率に符号化されたコンテンツである MPEG にさらに圧縮をかける
ことにより,印象や品質がどのように変化するのか,また,どの程度の圧縮率な
らば品質を保つことができるかを主観評価により調査した.結果,コンテンツの
圧縮率の変化によって,元となる情報データが半分以下になる圧縮率では,一部
のコンテンツで品質が劣化した.また,圧縮率の変化によりある程度の圧縮率で
は目立たなかったが,圧縮率が向上するにつれ,映像が劣化し品質が低下するの
が確認された.
キーワード 情報符号化,MPEG,圧縮率,主観評価,品質
ー ト ,情 報 量 を 削 減 し て い る .伝 送 ビ ッ ト レ ー ト と は ,
単位時間あたりに何ビットのデータが処理されている
1. は じ め に
現在の私たちの生活の中では,生まれたとき既にテ
かを表し,圧縮された映像データや音声データが 1 秒
レビ,電話,パソコンといった情報通信ができるよう
毎あたりどのくらいの情報量で表現されているかを示
になっていた.これらの情報通信は,電波や通信ケー
している.そして,圧縮率の変化により変動する伝送
ブル大量のデータ伝送が可能な光ファイバなどがあり,
ビットレート,情報量にコンテンツの品質が心的印象
インターネットを使った社会基盤が整い始めた.その
にどのような影響を及ぼすことついての検証は十分と
ようなハードウェア機器に関連した技術ではなく,機
言えない.
器がそろえられたときに,どのような形式の情報を流
本 研 究 で は ,DVD,地 上 デ ジ タ ル 放 送 と い っ た コ ン
通させれば,効率的かつ安全に信頼度の高い通信が可
テ ン ツ で あ る MPEG が ,圧 縮 率 の 変 化 に よ っ て 情 報 量
能かという問題が出てくる.この「効率的」を重視し
の減少したデータが品質変化にどのように影響するの
た技術が符号化である.符号化技術には,さまざまな
かを主観評価により調査し,コンテンツの品質はどの
方式がありどんな種類のデータをどのような方式で符
程度の圧縮率まで保てるかを主観評価により調査した
号化するかという点で最適な手法がとられている.一
ものを報告する.
般的なデータ圧縮なども符号化技術であり,データの
2. 情 報 理 論 と 符 号 理 論 の 考 え 方
保存や通信の際に使用する場合が多いと思われる.
2.1 情 報 理 論
動 画 像 の 符 号 化 技 術 の 一 つ と し て MPEG[1]が あ る .
情報は,自然に生まれて存在するものではなく,人
こ の MPEG は 技 術 の 進 歩 ,規 格 が 進 む に つ れ よ り 広 範
間が現象を知覚し,音声,音,文字,絵などに表現す
囲 な 内 容 へ と 変 わ っ て い き ,地 上 デ ジ タ ル 放 送 や DVD
ることによって意味のある情報となる.そしてそれら
といったコンテンツも含まれるようになっていった.
はある一定の形式で蓄積,加工,伝送される.さらに
こ の MPEG は ,人 間 の 特 性 を 利 用 し 知 覚 不 可 能 な 範 囲
整理され知識,法則などと呼ばれる.この情報を量的
の情報を削除,または高圧縮することで伝送ビットレ
に定義し,ビット単位で測ることが情報理論の考え方
30
である.
の発生も考えられる場合の,誤り修正可能な情報の符
号 化 法 で あ る , 通 信 路 符 号 化 の 2 つ が 存 在 す る . [3]
情報理論で扱う情報の量は,事象が生起する確率を
用 い て 定 義 さ れ ,あ る 事 象 E が ,確 率 p で 生 起 す る と
する.すなわち,
P(E) = p
2.3 情 報 源 符 号 化
情報源符号化とは,データ圧縮技術のことであり,
(1)
代表的な符号理論は,ハフマンの符号構成法や,シャ
と す る .そ の 事 象 E が ,実 際 に 生 起 す る こ と を 知 っ
ノンの情報源符号化定理などがある.これらの符号理
た 場 合 に 得 ら れ る 情 報 の 量 は , -log2p ビ ッ ト と 定 義 さ
論 を 応 用 し た も の に , MPEG と い っ た 規 格 が あ る . こ
れ る .こ れ は シ ャ ノ ン (Shannon)[2]に よ る 定 義 で ,一 般
れらは,人の視覚や聴覚の特性が利用されている.
的に利用されているものである.そして,事前に生起
MPEG と い っ た 規 格 は , 非 可 逆 圧 縮 方 式 が と ら れ て お
する確率が q であることが知らせられていれば,確率
り,人間の視覚,聴覚の特性を利用し,高能率に符号
が は っ き り し た と き に 得 ら れ る 情 報 の 量 は , -log2q ビ
化されたものである.
ットと評価できるのである.
2.4 通 信 路 符 号 化
このように,情報源から発生される情報も,通信路
通信路符号化は,通信路に適した形に符号化され,
を流れる情報も,蓄積された情報も,ビット単位を使
発生する雑音に打ち勝つような符号の構成を目的とし
って量的に把握される.広い意味の情報をその対象と
ている.雑音のある環境で会話が通じない場合 2 度同
して扱い,それら外界から得られるものであっても,
じ事を繰り返し,相手が納得したことをさらに確かめ
あるいは思考の結果得られたものであっても,データ
るという冗長な行為を我々はとるが,通信系でも同様
という形から整理されて情報となる.情報理論ではそ
に,雑音に打ち勝つため,通信符号の中に冗長性を与
のような高度の知識ではなく,確率的に扱えるように
え,それを利用して雑音によって誤って受信されたか
整理された情報を対象としていると考えることもでき
もしれない符号を修正するものである.代表的な符号
る . [3]
理 論 に 線 型 ブ ロ ッ ク 符 号 や ,畳 み 込 み 符 号 な ど が あ り ,
伝 送 時 等 に 使 わ れ て い る . 図 (1 )は , 通 信 路 モ デ ル を
2.2
符号化
示す.
通信または記憶媒体において,情報は物理的波形ま
たは物理的状態で表されるが,それを抽象化して,有
限 個 の 記 号 (通 信 路 記 号 )か ら な る 列 と し て 表 さ れ る と
考 え る .た と え ば ,半 導 体 メ モ リ ,磁 気 デ ィ ス ク で は ,
2つの物理的状態として記憶されるが,それらを記号
0・1 で 表 す . バ イ ト 単 位 で 表 す ほ う が 便 利 な 場 合 は ,
図1.シャノンの通信路符号化モデル
256個の通信路記号でも,2 値とは限らない.
3.静 止 画 像 と 動 画 像 の 符 号 化
計算機の中では,ローマ字,数字,ひらがな,カタ
写真などの自然静止画像の場合,ある1点の状態が
カ ナ , 区 切 り 記 号 等 は , 一 定 長 の 通 信 路 記 号 0・1 で 表
周囲の状態との類似性が高く,任意の点の上下左右,
されている.情報源の各記号を異なる通信路記号に変
斜め四方に隣り合う画素の状態とほぼ同じとゆうこと
換し,通信路に送り出す,または記憶装置に書き込む
となる.これらの特性と人間の視覚特性を利用するこ
操作を符号化といい,対応を与える関数を符号化関数
とにより,冗長な構成部分の抑制,すなわち圧縮が可
という.
能となる.静止画像の場合,人間の視覚特性は,視覚
情報源の出力した系列を,その系列が持っている情
の空間周波数特性,画像の明るさ,画像の平滑度,輝
報を失うことなく短い系列に変換することを,情報源
度と色度の周波数帯域などが上げられる.符号化方式
符号化もしくは,情報源圧縮と呼び,圧縮された系列
は,予測符号化方式のフレーム内予測や,フレーム間
から,いつでも元のデータが正確に再現できる圧縮方
予測などがあげられる.
法を可逆圧縮と呼び,元のデータが正確に再現できな
予測符号化方式は,空間的,あるいは時間的に隣接
い場合があるような圧縮方法を非可逆圧縮と呼んでい
する画素の相関が高いことを用いて,伝送済みの画素
る.
からこれから伝送するがその値を予測し,予測値と実
この他に,符号を伝達する場合に物理的な通信路に
際の画素値の差分を符号化する手法である.
は ,単 位 時 間 あ た り 送 信 で き る 情 報 の 量 は 制 限 が あ り ,
フレーム内予測は,一般に,1枚の画像における隣
そのような通信路容量の制限のもとで最も効率的な情
接画素の相関は高く,その差信号はラプラス分布に近
報の符号化法,さらに雑音などによる回線の誤りなど
いと言われている.具体的な構成法には,フィードア
31
ー ド 型 (図 2)と , フ ィ ー ド バ ッ ク 型 (図 3)が あ り , 一 般
的には,量子化雑音の蓄積がないフィードバック型が
用いられる.なお,フレーム内予測は4~5ビット/
画素が限界といわれている.
図 2. フ レ ー ム 内 予 測 , フ ィ ア ー ド 型
図 3 フレーム内予測,フィードバック型
動画像の場合には,あるフレームの画像は前後のフ
レームの画像と酷似している,こうした性質を利用す
図 7, MPEG 方 式 の ブ ロ ッ ク 構 成
ることにより予測符号化を行なうことができる.図 4
で 表 し た フ レ ー ム 間 予 測 は MPEG 等 の 動 画 像 を 対 象 と
し た ブ ロ ッ ク 符 号 化 方 式 [4]に も 採 用 さ れ て い る .こ こ
4.実 験 概 要
で連続する2フレームの画像信号を比較する.図 4 の
4.1 圧 縮 率 の 変 化 に よ る 正 誤 の 調 査
ように背景の手前を人物が横切る場合,背景部は一致
4.1.1 実 験 準 備
する.一方の人物も,位置に多少のすれはあるが,部
高能率に圧縮された映像データに,データ圧縮をか
分的にほぼ似たような映像が現れる場面が生じるとす
け,それぞれの映像データを視聴し主観評価により判
る.このとき,図 4 に示すように,ブロックの近隣か
断してもらう.全てのデータの視聴を 1 セットとし,
ら最も似ている画像をブロックサイズで切り出し,そ
3~5セット行う.圧縮率の変化に伴い,なれによる
の差分を伝送する方法が用いられる.伝送済みのフレ
類似感等防止のため 1 セットごとに休憩をはさむ.サ
ームの中から,最も近似値の高い画像をブロック単位
ン プ ル 数 は 35 と し ,使 用 PC は ,CPU1 GHz・メ モ リ
で 探 し 出 し ,そ の ず れ を 動 き ベ ク ト ル と し て 伝 送 す る .
2 5 6 Mb 以 上 の も の と す る .
しかし,それらが完全に一致することはまずありえな
い の で ,そ の 差 分 信 号 を 離 散 コ サ イ ン 変 換 [4]し て 伝 送
4.1.2 実 験 用 映 像 デ ー タ
する.
実験で使用する映像データは,高圧縮をかけること
により画質の劣化が少ないと予測されるモノクロ,黒
塗りの多い映像を使う.モノクロは総データ量が少な
く , 黒 塗 り の 多 い 映 像 は モ ノ ク ロ の デ ー タ 量 の 1.2 倍
のデータ量とする.
元 と な る 映 像 デ ー タ を 100%と し , デ ー タ 量 が そ れ
ぞ れ 80%, 60%, 40%に な る よ う に 圧 縮 を か け る . そ
れぞれの映像データの伝送ビットレートは変動するた
めデータ量を基準とする.
4.1.3 実 験 方 法
主 観 評 価 実 験 は ,100%の デ ー タ を 基 準 に し ,無 作 為
図 4, フ レ ー ム 間 予 測 を ブ ロ ッ ク サ イ ズ で 切 り 出 し
に そ の 他 の 映 像 を 視 聴 , ど の 映 像 が ~ %の 映 像 か 判 断
た例
してもらい,その正誤の計測を行なう.正解率が高い
実 際 の , MPEG 方 式 の ブ ロ ッ ク 構 成 は 図 5 に 示 す .
ほ ど ,100% の 映 像 と 区 別 が 付 い て い る と 判 断 し ,低 い
上 は 送 信 側 ,下 が 受 信 側 に 対 応 す る .図 5 の DCT は 離
ほ ど 区 別 が 付 か ず , よ り 100% の デ ー タ と 遜 色 が な い
散コサイン変換方式を示す.
と判断する.
32
以上 4 段階中 4 という結果となった.元の映像データ
4.1.4 実 験 結 果
正 誤 に 関 し て ,モ ノ ク ロ 映 像 で は ,40%,60%,80%
自体の大きくないモノクロでは,データ量が半分以下
ともに正解率以下という結果となり,明らかに誤りの
になったとしてもその品質は落ちず,効率のより符号
選 択 し た 回 答 が 多 か っ た (表 1).そ の 他 ,背 景 に 黒 塗 り
化 が 用 い ら れ て い る こ と と な る (表 3.4.5).
表 3 モ ノ ク ロ 映 像 時 (40% )
の 多 い 映 像 は 40%の デ ー タ の 正 解 率 は 60%以 上 と な り ,
心的印象
(40%)
映像
音声
臨場感
品質
60%, 80%で は モ ノ ク ロ 同 様 50%以 下 と い う 結 果 と な
っ た (表 2).
表 .1 モ ノ ク ロ 映 像 時
実験データ
40%
60%
80%
正
36%
28%
32%
誤
64%
72%
68%
正
68%
32%
38%
3
2
1
92%
90%
88%
92%
8%
10%
12%
8%
0%
0%
0%
0%
0%
0%
0%
0%
表 4 モ ノ ク ロ 映 像 時 (60% )
心的印象
(60%)
映像
音声
臨場感
品質
表 .2 背 景 に 黒 塗 り 等 の 多 い 映 像 時
実験データ
40%
60%
80%
4
誤
32%
68%
62%
4
3
2
1
90%
94%
92%
88%
10%
6%
8%
12%
0%
0%
0%
0%
0%
0%
0%
0%
表 5 モ ノ ク ロ 映 像 時 (80% )
心的印象
(80%)
映像
音声
臨場感
表 1・2 は , 縦 を 実 験 用 映 像 デ ー タ の デ ー タ 量 . 横 を
4
3
2
1
92%
92%
94%
8%
8%
6%
0%
0%
0%
0%
0%
0%
正誤とする.
背 景 に 黒 塗 り の 多 い 映 像 デ ー タ で は , 40%の 実 験 デ
4.1.5 実 験 結 果 の 検 討
ータの場合,映像に違和感があり,ライト等黒塗り以
上の表 1 を見る限り,モノクロの映像データでは,
どの映像データであろうと正誤の判断がついていない
外の背景がにじんで見えるというものが多く,映像の
ように見え圧縮率の向上が見込める.しかし,背景の
品 質 も 共 に 劣 化 し て い る と い う 結 果 と な っ た .音 声 は ,
黒 塗 り の 多 い 映 像 で は ,デ ー タ 量 40% で は あ る 程 度 の
元データと遜色はなく,臨場感に関しても,多少の映
判別はできていると取れる.元の映像データ量の少な
像 の 劣 化 で は ,映 像 全 体 の 雰 囲 気 は 下 が ら な か っ た (表
い モ ノ ク ロ と 違 い , カ ラ ー や CG な ど と い っ た 映 像 で
6.7.8).
はデータ量が半分以上失われると正誤の判断が逆転し
表 6 背 景 に 黒 塗 り の 多 い 映 像 時 (40% )
明らかな品質の劣化が見える.このことからデータ量
の半分を上回ると品質は劣化するので,元の品質を保
心的印象
(40%)
映像
音声
臨場感
つ な ら ば 50 % 以 上 の 圧 縮 は か け な い ほ う が よ い と 推
察される.
4
3
2
1
0%
92%
74%
36%
8%
26%
64%
0%
0%
0%
0%
0%
4.2 圧 縮 率 変 化 に よ る 印 象 の 変 化 の 調 査
4.2.1 実 験 方 法
表 7 背 景 に 黒 塗 り の 多 い 映 像 時 (60% )
実験用データの変更はなく,主観評価により 4 段階
心的印象
(60%)
映像
音声
臨場感
で評価をつけてもらう.ここでは普通や 5 段階の真ん
中などあいまいな回答を避けるため必ず偏るようにす
る.数字が高くなるほど品質がよく,低くなるほど劣
4
3
2
1
82%
90%
86%
18%
10%
14%
0%
0%
0%
0%
0%
0%
化しているとする.
こ ち ら も 100%を 基 準 と し , そ の 他 の 映 像 を 視 聴 ,
表 8 背 景 に 黒 塗 り の 多 い 映 像 時 (80% )
映像に違和感がないか,音声に違和感がないか,臨場
心的印象
(80%)
映像
音声
臨場感
品質
感は失われていないか,品質は保たれているか,この
4つの問いを主に行った.
4.2.2 実 験 結 果
ま ず モ ノ ク ロ の 映 像 デ ー タ は ,実 験 デ ー タ 40%,60%,
4
3
2
1
88%
92%
88%
84%
12%
8%
12%
16%
0%
0%
0%
0%
0%
0%
0%
0%
表 3~8 は 縦 を 設 問 , 横 を 評 価 と す る .
80%全 て に 映 像 , 音 声 , 臨 場 感 , 品 質 の 問 い で , 80%
33
4.2.3 実 験 結 果 の 検 討
上 の 表 3・表 6 を 比 較 し て 見 る と ,デ ー タ 量 の 少 な い
ものは映像,音声などの劣化はモノクロでは確認され
ず ,背 景 に 黒 塗 り の 多 い 映 像 で は 40%の デ ー タ 量 に 明
ら か な 劣 化 が 認 め ら れ る . 表 4・5・7・8 を 見 る と わ ず か
な誤差しかなく,どれも元となるデータと遜色がない
よ う に 見 え る .こ の こ と か ら ,元 の 映 像 デ ー タ の 種 類 ,
データ量によるがある程度の圧縮率を保てば品質は低
下せず,印象の変化も感じられない.また,モノクロ
の 映 像 に 関 し て は 表 3・4・5 を 見 る 限 り こ れ 以 上 の 圧 縮
率によるデータ圧縮が可能といえる.
5.お わ り に
本研究では,高能率に符号化され,非可逆圧縮によ
り失われたデータが,圧縮率の変化によりコンテンツ
から受ける印象が品質に対してどのような影響を及ぼ
すか.また,圧縮率の変化により情報量の減少がコン
テンツの品質がどの程度までなら保てるかを主観評価
により調査した.
伝送レートやデータ量を変えることにより,元とな
るデータと遜色がないか,また,映像,品質の劣化が
目に見えて分かるのはどの程度なのかという点で,コ
ン テ ン ツ の 内 容 に も よ る が ,全 体 の デ ー タ 量 の 60% 以
上の圧縮率ならば,品質に目に見えた影響はなく元と
なるデータと遜色がなかったと言える.
結果,高能率に符号化されたコンテンツを,ある程度
の圧縮率を保つことにより品質を維持することができ
印象の変化も少ないことが分かった.また,高圧縮率
を か け る こ と に よ り ,映 像 ・品 質 の 劣 化 が コ ン テ ン ツ の
品質に影響を及ぼしていることが判明した.
文
献
[1] パ イ オ ニ ア 株 式 会 社 研 究 開 発 技 術 解 説 [MPE
技 術 解 説 ] http://pioneer.jp/crdl/tech/mpeg/1.html
[2] 人 名 ク ロ ー ド ・ シ ャ ノ ン (Claude Elwood
Shannon)1916~2001.
[3] 岩 垂 好 裕 情 報 伝 達 と 符 号 の 理 論 株 式 会 社 オ
ーム社 .
[4] 画
像
符
号
化
(ImageCoding)
http://laputa.cs.shinshu-u.ac.jp/~yizawa/InfSys1/adv
anced/image_cod/index.htm.
34
コミュニケーションネットワーク Lab.(福島研究室)
2007 年度卒業研究概要
日本文理大学・工学部・情報メディア学科
Nippon Bunri Univ.
Department of Media Technology
ユビキタスネットワーク基盤を支える伝送経路制御方式の
ネットワークシミュレータ(NS2)による検討
中嶋 恵一 1
曽我 健太 2
野村 宜範 3
深澤 友貴 4
1 兼松エレクトロニクス株式会社 〒104-8338 東京都中央区京橋 2 丁目 17 番 5 号
2 コンピューターシステム株式会社
3 新興サービス株式会社
〒790-0003 愛媛県松山市三番町 7 丁目 13 番地 13 ミツネビル 8 階
〒105-0003 東京都港区西新橋 3 丁目 7 番 1 号 ランディック第二新橋ビル 4 階
4 ネッツトヨタ山口株式会社 〒745-0802 山口県周南市大字栗屋 806 番地の 3
あらまし
ユビキタスネットワークを成立する為には膨大なネットワーク経路から効率的で安全なデータ伝送を
するために,適切な経路制御が必要不可欠である.本研究では,NS2 を使用し,仮想の小規模実機構
成ネットワークを構築し実験を行い,そこから得られるデータを基に適切な制御について検討するこ
とを目的とする.そこで帯域を変えた 2 つの経路にパケットを流す実験を行った.その結果として,
帯域が大きい場合と小さい場合ではパケットの流れ方が違うことが確認された.流すパケットに対し
て帯域が大きい場合は公平にパケットが流れる.流すパケットに対して帯域が小さい場合は,条件次
第でパケットは公平に流れることなく経路から溢れ,溢れた分のパケットが棄却される.このことか
ら,ネットワーク経路の適切な制御には回線の帯域が重要な条件の一つだということがわかった.
キーワード ユビキタスネットワーク,ネットワーク経路制御,ネットワークシミュレータ,NS2
用 し た こ と が な く , Unix 系 OS の 勉 強 を し た い と い う
1. は じ め に
近 年 ,「 誰 で も , い つ で も , ど こ で も 」 利 用 可 能 な
こ と で 実 験 室 に あ る Solaris を 使 用 す る こ と に し た .本
ユビキタスネットワーク社会により日常生活にインタ
研 究 で は , NS2 と 共 に NS2 の 実 験 パ ッ ケ ー ジ や NS 専
ーネットが浸透している.ユビキタスネットワークが
用トレースファイル解析ツールを使用し,小規模実機
成立している背後には膨大なネットワーク経路がある.
構成による基本データを取り,適切な制御について実
ただ闇雲に経路を通るだけでは,遠回りの経路を通る
験的に検討することを目的とする.
可 能 性・安 全 性 の 保 障 が で き な い な ど 効 率 的 で は な い .
2. TCP
さらに,データの盗難や紛失などの可能性もある.そ
ネ ッ ト ワ ー ク 経 路 制 御 は OSI 参 照 モ デ ル で 考 え る と
こ で ネ ッ ト ワ ー ク 経 路 制 御 [1]が 必 要 に な っ て く る .
ネットワーク経路制御は,伝送路の効率的かつ安全性
第 4 層 ト ラ ン ス ポ ー ト 層 の 機 能 と さ れ て い る . OSI 参
確保を可能とする重要な技術である.効率的かつ安全
照 モ デ ル の 実 装 モ デ ル の 1 つ で あ る TCP/IP モ デ ル で 考
性を確保するためには,ネットワーク設計時に施工前
えると,ネットワーク経路制御は第 4 層トランスポー
の適切な予測が必要不可欠である.しかし,実際に実
ト 層 の TCP の 役 割 と な る . そ こ で は じ め に TCP に つ
機で試験的なネットワーク構築をすると,適切な経路
いて説明する.
TCP と は ,イ ン タ ー ネ ッ ト で 利 用 さ れ る 標 準 プ ロ ト
制御をするために時間やコストが必要になってくるこ
コ ル で , OSI 参 照 モ デ ル 第 4 層 ト ラ ン ス ポ ー ト 層 に あ
とから,実機での検証は困難である.
たる.
そこで,本研究ではコンピュータ上で仮想ネットワ
OSI 参 照 モ デ ル と TCP/IP モ デ ル の 関 係 に つ い て 図 1
ークを構築してシミュレーションを行う.シミュレー
に示す.
ションを行うことにより,実機でネットワークを構築
して検証するために必要な時間・コストを削減するこ
とができる.本研究ではネットワークシミュレータの
1 つ で あ る NS2(Network Simulator 2)を 用 い る . NS2
を イ ン ス ト ー ル す る マ シ ン は ,ま ず Sun ワ ー ク ス テ ー
シ ョ ン で 採 用 さ れ て い る Unix 系 OS の Solaris を 使 用
す る こ と か ら 始 め る .こ れ ま で windows マ シ ン し か 使
35
が 流 れ る 様 子 を 観 察 で き る NAM の 作 業 ウ ィ ン ド ウ を
OSI参照モデル
TCP/IPモデル
プロトコル
応用層
FTP,HTTP,
プレゼンテーション層アプリケーション層
SMTP,POP
セッション層
トランスポート層
トランスポート層 TCP,UDP
ネットワーク層
インターネット層 IP
ネットワーク
2 データリンク層
インタフェース層
1 物理層
物理層
層
7
6
5
4
3
図 1
開きシミュレーションの様子を観察する.
本実験のネットワークトポロジについて図 2 に示す.
OSI 参 照 モ デ ル と TCP/IP モ デ ル の 関 係
TCP は OSI 参 照 モ デ ル 第 3 層 ネ ッ ト ワ ー ク 層 の IP
図 2
と , OSI 参 照 モ デ ル 第 5 層 セ ッ シ ョ ン 層 以 上 の プ ロ ト
本実験のネットワークトポロジ
コ ル (HTTP, FTP, SMTP, POP な ど )の 橋 渡 し を す る .
ま た ,TCP/IP モ デ ル 第 4 層 ト ラ ン ス ポ ー ト 層 の プ ロ
本 実 験 で は ノ ー ド を n0, n1, n2, n3 と 4 つ 用 意 す
ト コ ル と し て 本 章 で 説 明 し た TCP と 他 に UDP が あ る .
る . n0, n1 は パ ケ ッ ト の 出 発 点 で あ り , n2 は 中 継 点 ,
TCP は 信 頼 性 が 高 く ,転 送 速 度 が 低 い が ,UDP は 転 送
n3 は パ ケ ッ ト の 到 着 点 で あ る . n0, n1 か ら n2 を 経 由
速 度 が 高 く , 信 頼 性 が 低 い と い う 特 徴 が あ る [2].
し て n3 に パ ケ ッ ト が 流 れ る 様 子 を い く つ か の 条 件 で
観察し,考察する.
条 件 と し て , ネ ッ ト ワ ー ク ト ポ ロ ジ で n2, n3 間 の
3. ネ ッ ト ワ ー ク シ ミ ュ レ ー タ
本研究では,コンピュータ上で仮想の小規模ネット
帯 域 が n0,n1 か ら n2 を 経 由 し て n3 に 流 れ て く る パ ケ
ワークを構築することのできるネットワークシミュレ
ッ ト よ り 大 き い 場 合 (フ ァ イ ル 名 の 最 初 の 文 字 を l と す
ー タ [3]を 使 用 す る .ネ ッ ト ワ ー ク シ ミ ュ レ ー タ を 使 用
る )と 小 さ い 場 合 (フ ァ イ ル 名 の 最 初 の 文 字 を s と す る )
するのは,小規模な実機構成から実験データを取り,
の 2 種 類 .そ し て そ れ ぞ れ n0,n1 か ら 送 信 さ れ る CBR
実験データを検討していくためである.
トラフィックの開始時刻と停止時刻が同じでパケット
ネットワークシミュレータの中でもフリーウェア
を 流 す 時 間 も 同 じ 場 合 (l1.tcl,s1.tcl),n1 か ら 送 信 さ れ
で あ り , Unix 環 境 や Cygwin 環 境 で も 動 か す こ と が で
る CBR ト ラ フ ィ ッ ク の 開 始 時 刻 と 停 止 時 刻 を n0 よ り
き る NS2[4]と い う ソ フ ト に 注 目 し た .NS2 の 特 徴 と し
0.5 秒 ず つ 遅 く し パ ケ ッ ト を 流 す 時 間 が 同 じ 場 合 (l2.tcl,
て ,C++と OTcl の 2 つ の 言 語 を 使 用 し て い る .こ れ は ,
s2.tcl),n1 か ら 送 信 さ れ る CBR ト ラ フ ィ ッ ク の 開 始 時
処 理 速 度 が 要 求 さ れ る 部 分 を C++で , シ ミ ュ レ ー シ ョ
刻 を n0 よ り 0.5 秒 遅 く し 停 止 時 刻 は 0.1 秒 早 く し パ ケ
ン 時 に シ ナ リ オ を 記 述 す る 部 分 を OTcl で 記 述 し て い
ッ ト を 流 す 時 間 を 短 く し た 場 合 (l3.tcl,s3.tcl),n1 か ら
る た め で あ る .ま た ,NS2 に は Xgraph が 付 属 さ れ て い
送 信 さ れ る CBR ト ラ フ ィ ッ ク の 開 始 時 刻 は n0 と 同 じ
て,シミュレーションの結果をグラフ表示することも
で 停 止 時 刻 は 0.1 秒 早 く し パ ケ ッ ト を 流 す 時 間 を 短 く
できる.
し た 場 合 (l4.tcl,s4.tcl)の 合 計 8 つ (l1.tcl,s1.tcl,l2.tcl,
s2.tcl, l3.tcl, s3.tcl, l4.tcl, s4.tcl)で あ る .
このことから本研究では,小規模構成でのネットワ
こ の 実 験 を 行 う こ と に よ り ,n0,n1 そ れ ぞ れ か ら 送
ー ク 実 験 を 行 う た め NS2 を 使 用 す る こ と に し た .
信されるパケットの転送効率がどの要因で変化するの
かを調べる.
4. 本 研 究 の 実 験 内 容
実験前にどのような要因において転送効率が変化
するのかを検討した結果,帯域幅,転送時間,開始時
5. 実 験 機 材
刻,停止時刻が挙げられたのでそれぞれ条件を設けて
本実験で使用する機材を次に示す.
実験を行うことにした.
1).実 験 で 使 用 す る ハ ー ド .
使用するパソコン
本実験の大まかな流れは,
富 士 通 FMV-W10X131
1).始 め に ,NS2 で シ ミ ュ レ ー シ ョ ン す る 内 容 を C++と
型番
OTcl で 表 現 さ れ る NS 用 tcl ス ク リ プ ト を 作 成 す る .
OS
2).NS2 を 使 い ,NS2 で 行 な わ れ た シ ミ ュ レ ー シ ョ ン の
2 Service Pack 2
結 果 を NAM(Network Animator)ト レ ー ス フ ァ イ ル と し
CPU
て保存する.
MEM
760 MB RAM
3).そ れ ら の NAM ト レ ー ス フ ァ イ ル を 実 際 に パ ケ ッ ト
GPU
グラフィックアクセラレータ チップセットに
36
Microsoft Windows XP Professional Version
200
Pentium(R) 4 2.60GHz
内蔵
をクリックする.
VRAM
MAX64MB(メ イ ン メ モ リ と 共 有 )
2).「 VMware Server Console」の 画 面 で「 New Virtual
2).実 験 で 使 用 す る ソ フ ト .
仮想マシン
Machine」を ク リ ッ ク し 仮 想 マ シ ン 作 成 ウ ィ ザ ー ド を 起
VMware Server Console Version 1.0.2 b
動する.
uild-39867
OS
3).仮 想 マ シ ン の 作 成 ウ ィ ザ ー ド か ら 作 業 が で き 設 定
Vine Linux4.1
ネットワークシミュレータ
が 簡 単 な 「 Typical」 を 選 択 す る .
ns-allinone-2.31( NS2)
4).VMware の 設 定 が 終 了 し た 後 に 仮 想 マ シ ン 上 に イ ン
ス ト ー ル し , 使 用 す る ゲ ス ト OS を 予 め 選 択 す る .「 G
uest Operating System」 で OS の 種 類 を 「Linux」に ,「 V
6. 実 験 の 準 備
ersion」で 一 覧 に Vine Linux が な い の で「 Other」を 選
環境によって設定を変更する必要があるので文献
択する.
を基にこの章で記述する.
5).仮 想 マ シ ン の 名 前 を 「 Vine Linux」 に し , イ ン ス ト
文献を調べた結果,他に記載されているものが見つ
からなかったものについては個人のホームページを文
ールするディレクトリを必要に応じて修正する.
献とする.
6).ネ ッ ト ワ ー ク の 設 置 画 面 が で る の で ゲ ス ト OS か ら
6.1.1.VMware のインストール
LAN を 使 用 し IP ア ド レ ス を 付 与 す る 「 Use Bridged n
etworking」 を 選 択 す る .
本 実 験 は 仮 想 マ シ ン 上 で 実 験 を 行 う た め , Windows
7).仮 想 マ シ ン の デ ィ ス ク サ イ ズ を 設 定 し ,「 Split disk
OS に 仮 想 マ シ ン を 作 成 す る こ と が で き る VMware の
into 2GB files」 の チ ェ ッ ク を は ず し て 完 了 す る . 仮
インストールを行う.
想 デ ィ ス ク は ホ ス ト OS の デ ィ ス ク 上 に 作 成 さ れ る の
VMware の イ ン ス ト ー ル 方 法 が 公 開 さ れ て い る ホ ー
ム ペ ー ジ の 手 順 [5]に 基 づ き イ ン ス ト ー ル を 行 う .
で 空 き 容 量 が 必 要 . 本 実 験 で は 5GB に 設 定 し た .
1).VMware の 公 式 ペ ー ジ [6]で「 無 償 の シ リ ア ル 番 号 を
8).仮 想 マ シ ン に 割 り 当 て る メ モ リ 容 量 を 設 定 す る た
登録する」でユーザ登録を行い,メールで届くシリア
め ,仮 想 マ シ ン 名「 Vine Linux」内 の「 Device」→「 M
ルナンバーを入手する.
emory」 を ダ ブ ル ク リ ッ ク す る .
2).公 式 ペ ー ジ で ロ グ イ ン し ,「 VMware Server Version
9).メ モ リ 容 量 が 表 示 さ れ る の で 必 要 に 応 じ て 修 正 す
る .物 理 メ モ リ が 1G の 場 合 256MB ほ ど に し て お け ば
1.0.2 build-39867」 か ら 「 VMware-server-installer-1.0.
問 題 な く 動 作 す る . 本 実 験 で は 256MB に 設 定 し た .
2-39867.exe」 を ダ ウ ン ロ ー ド す る .
3).ダ ウ ン ロ ー ド し た exe フ ァ イ ル を 実 行 す る .
10).仮 想 マ シ ン で 使 用 す る CD-ROM の 設 定 を す る た め ,
4).「 I accept the in the license agreement」に チ ェ ッ ク
仮 想 マ シ ン 名 「 Vine Linux」 内 の 「 Device」 → 「 CD-R
を入れ,ライセンスに同意する.
OM」 を ダ ブ ル ク リ ッ ク す る . デ フ ォ ル ト で は 「 Auto
5).セ ッ ト タ イ プ を 「 Complete」 に す る .
detect」に な っ て い る が ,検 出 さ れ な い 場 合 は ,「 Conn
6).Windows 版 の 場 合 ,「 VMware Management Interfac
ection」か ら CD-ROM を 選 び 仮 想 マ シ ン の 作 成 は 終 了 .
e」で IIS を 使 用 す る た め ,イ ン ス ト ー ル さ れ て い な い
本 実 験 で は ISO イ メ ー ジ フ ァ イ ル を 直 接 指 定 し て イ ン
警告文がでるが次に進む.
ストールするためここではデフォルトのままとする.
7).イ ン ス ト ー ル パ ス を 決 め る .
6.1.3.VMware の 起 動 時 の エ ラ ー の 対 処 法
8).CD-ROM の オ ー ト ラ ン を 停 止 す る た め に 「 Yes disa
VMware 起 動 時 に「 There was a problem connecting:
ble autorun」 に チ ェ ッ ク を 入 れ る .
9).「 install」 を ク リ ッ ク し イ ン ス ト ー ル を 開 始 す る .
511 vmware-serverd service is not running.」 と い う エ
10).ユ ー ザ 情 報 及 び シ リ ア ル ナ ン バ ー を 入 力 す る .
ラ ー が 出 た 場 合 は VMware Registration Service が 起
11).イ ン ス ト ー ル が 完 了 す る と デ ス ク ト ッ プ に ア イ コ
動 し て い な い の で OS の 設 定 を 変 更 す る .
VMware 起 動 時 に「 There was a problem connecting:
ンが作成される.
511 vmware-serverd service is not running.」 と い う エ
ラーが出た場合の対処法が公開されているホームペー
6.1.2.VMware の 設 定
ジ の 手 順 [7]に 基 づ き エ ラ ー の 対 処 を 行 う .
VMware の イ ン ス ト ー ル だ け で は 仮 想 マ シ ン の 作 成
1).「 ス タ ー ト 」 メ ニ ュ ー か ら 「 コ ン ト ロ ー ル パ ネ ル 」
は 行 わ れ て い な い た め , VMware の 設 定 を 行 う .
を開く.
VMware の 設 定 方 法 が 公 開 さ れ て い る ホ ー ム ペ ー ジ
の 手 順 [5]に 基 づ き 設 定 を 行 う .
2).「 コ ン ト ロ ー ル パ ネ ル 」→「 パ フ ォ ー マ ン ス と メ ン
1).VMware を 起 動 す る と 表 示 さ れ る コ ン ソ ー ル 画 面 か
テ ナ ン ス 」→「 管 理 ツ ー ル 」か ら「 サ ー ビ ス 」を 開 く .
ら 対 象 と な る ホ ス ト( local host)を 選 択 し ,「 Connect」
3).「 VMWare Registration Service」 を ダ ブ ル ク リ ッ ク
37
する.
は ソ フ ト ウ ェ ア に GUI を 提 供 す る ア プ リ ケ ー シ ョ ン で ,
4).サ ー ビ ス の 状 態 の 「 開 始 」 ボ タ ン を ク リ ッ ク す る .
OS の イ ン ス ト ー ル だ け で は イ ン ス ト ー ル さ れ て い な
い.
6.2.1.Vine Linux の イ ン ス ト ー ル
Vine Linux の 設 定 方 法 が 公 開 さ れ て い る ホ ー ム ペ ー
ジ の 手 順 [8]に 基 づ き 設 定 を 行 う .
VMware で 作 成 し た 仮 想 マ シ ン 上 で 使 用 す る ゲ ス ト
1).管 理 者 で ロ グ イ ン し , GNOME タ ー ミ ナ ル を 起 動 す
OS の Vine Linux の イ ン ス ト ー ル を 行 う .
Vine Linux の イ ン ス ト ー ル 方 法 が 公 開 さ れ て い る ホ
る.
ー ム ペ ー ジ の 手 順 [8]に 基 づ き イ ン ス ト ー ル を 行 う .
2).「 apt-get update」と 入 力 し 最 新 の ア ッ プ デ ー ト 情 報
1).Vine Linux の 公 式 ペ ー ジ [9]の 「 Vine Linux の 入 手
を取得する.
方 法 」→ ダ ウ ン ロ ー ド す る サ ー バ →「 Vine-4.1/」→「 C
3).「 apt-get dist-upgrade」と 入 力 し OS 全 体 の ア ッ プ グ
DIMAGE/」 か ら 「 Vine41-i386.iso」 を ダ ウ ン ロ ー ド す
レードを開始する.
る.
4).「 apt-get install XOrg-devel」 と 入 力 し XOrg-devel
2).VMware を 起 動 し「 Inventry」で 仮 想 マ シ ン 名「 Vine
をインストールする.
Linux」 を 選 ぶ .
6.3.1.NS2 の イ ン ス ト ー ル
3).仮 想 マ シ ン 名 「 Vine Linux」 内 の 「 Device」 → 「 CD
シ ミ ュ レ ー シ ョ ン に 使 用 す る NS2 の イ ン ス ト ー ル を
-ROM」を ダ ブ ル ク リ ッ ク す る .ISO イ メ ー ジ フ ァ イ ル
を 直 接 指 定 し て イ ン ス ト ー ル す る た め ,「 Connection」
行う.
NS2 の イ ン ス ト ー ル 方 法 が 記 載 さ れ て い る 書 籍 の 手
か ら「 Use ISO image」を 選 び ,ダ ウ ン ロ ー ド し た「 V
順 [10]に 基 づ き イ ン ス ト ー ル を 行 う .
ine41-i386.iso」 を 指 定 す る .
4).「 Power On」を ク リ ッ ク す れ ば 仮 想 マ シ ン が 起 動 す
1).Vine Linux に 一 般 ユ ー ザ で ロ グ イ ン す る .
る.警告がでるが自動起動しない旨のメッセージなの
2).The Network Simulator: Building Ns の ペ ー ジ [11]
で運用に併せて設定する.本実験ではチェックは入れ
の Getting everything at once に あ る 「 current release
ず に 「OK」 に し た .
2.31」 か ら 「 ns-allinone-2.31.tar.gz」 を ダ ウ ン ロ ー ド す
5).Vine Linux の 起 動 画 面 が 出 た ら 「 ENTER」 を 押 す .
る.
6).言 語 を 「 日 本 語 」 に す る .
3).ダ ウ ン ロ ー ド し た ソ フ ト を ホ ー ム デ ィ レ ク ト リ に
7).キ ー ボ ー ド の 設 定 を 「 Japanese」 に す る .
解凍する.
8).モ ニ タ ー の 設 定 を す る .
4).GNOME タ ー ミ ナ ル を 起 動 す る .
9).イ ン ス ト ー ル の 種 類 を「 全 て イ ン ス ト ー ル 」に す る .
5).ホ ー ム デ ィ レ ク ト リ → 「 ns-allinone-2.31」 と デ ィ レ
10).デ ィ ス ク パ ー テ ィ シ ョ ン の 設 定 を 「 自 動 パ ー テ ー
ク ト リ を 移 動 し「 ns-allinone-2.31; sh install」と 入 力 し
ション」を選び「初期化」する.
インストールする.
11).ネ ッ ト ワ ー ク 設 定 を「 DHCP 経 由 で 自 動 設 定 」に す
6).「 ns-allinone-2.31」 → 「 ns-2.31」 と デ ィ レ ク ト リ を
る.
移 動 し「 ns-2.31;./validate」と 入 力 し イ ン ス ト ー ル し た
12).フ ァ イ ヤ ー ウ ォ ー ル の 設 定 を 「 フ ァ イ ヤ ー ウ ォ ー
結果をチェックする.
ルなし」にし「続行」をクリックする.
6.3.2.NS2 の イ ン ス ト ー ル 中 の エ ラ ー の 対 処 法
13).追 加 の 言 語 サ ポ ー ト を 「 Japanese」 に す る .
イ ン ス ト ー ル 中 に xgraph-12.1 の エ ラ ー が 出 た 場 合
14).タ イ ム ゾ ー ン の 選 択 を 「 Asia/Tokyo」 に す る .
15).Root パ ス ワ ー ド の 設 定 お よ び 一 般 ユ ー ザ ア カ ウ ン
の対処法を次に示す.
トの作成で管理ユーザ及び一般ユーザの設定をする.
1).The Network Simulator: Building Ns の ペ ー ジ [11]
16).パ ッ ケ ー ジ グ ル ー プ の 選 択 は デ フ ォ ル ト の ま ま に
の xgraph に あ る「 version 12.1」か ら「 xgraph-12.1.tar.
する.
gz」 を ダ ウ ン ロ ー ド す る .
17).イ ン ス ト ー ル を 開 始 す る .
2).ダ ウ ン ロ ー ド し た ソ フ ト を 解 凍 し ,「 ns-allinone-2.3
18).イ ン ス ト ー ル 完 了 後 に X の カ ス タ ム 設 定 が 出 る の
1」 の 中 に あ る 「 xgraph-12.1」 に 上 書 き し て か ら NS2
で「グラフィカル」にする.
のインストールをする.
6.2.2.Vine Linux の 設 定
6.3.3.NS2 の 設 定
イ ン ス ト ー ル し た Vine Linux を 最 新 の 状 態 に ア ッ プ
イ ン ス ト ー ル し た NS2 の 環 境 変 数 の 設 定 を 行 う .
グ レ ー ド す る と と も に , NS2 の イ ン ス ト ー ル の 際 に 必
NS2 の 設 定 方 法 が 記 載 さ れ て い る 書 籍 の 手 順 [10]及
要 な XOrg-devel を イ ン ス ト ー ル す る .こ の XOrg-devel
び 公 開 さ れ て い る ホ ー ム ペ ー ジ の 手 順 [12]に 基 づ き 設
38
定を行う.
8. 実 験 結 果
1).GNOME タ ー ミ ナ ル を 起 動 す る .
n0, n1 か ら 送 信 さ れ る CBR ト ラ フ ィ ッ ク の 開 始 時
2).ホ ー ム デ ィ レ ク ト リ で 「 vi .bash_profile」 と 入 力 し
刻と停止時刻が同じでパケットを流す時間が同じ場合
環境変数に
(l1.tcl,s1.tcl)で は ,n2,n3 間 の 帯 域 を 大 き く し た も の
export PATH=$PATH:/home/ホ ー ム デ ィ レ ク ト リ 名 /ns-a
は 公 平 に 交 互 に パ ケ ッ ト が 流 れ た .し か し ,n2,n3 間
llinone-2.31/bin:/home/ホ ー ム デ ィ レ ク ト リ 名 /ns-allino
の帯域を小さくしたものでは,始めは公平に流れてい
ne-2.31/tcl8.4.14/unix:/home/ホ ー ム デ ィ レ ク ト リ 名 /ns-
た が , 次 第 に n0 か ら の パ ケ ッ ト が 優 先 さ れ 始 め , n1
allinone-2.31/tk8.4.14/unix:/home/ホ ー ム デ ィ レ ク ト リ
からのパケットは棄却されるものが多くなった.
名 /ns-allinone-2.31/ns-2.31/bin
n1 か ら 送 信 さ れ る CBR ト ラ フ ィ ッ ク の 開 始 時 刻 と
export LD_LIBRARY_PATH=/home/ホ ー ム デ ィ レ ク ト
停 止 時 刻 を n0 よ り 0.5 秒 ず つ 遅 く し パ ケ ッ ト を 流 す 時
リ 名 /ns-allinone-2.31/otcl-1.13:/home/ホ ー ム デ ィ レ ク
間 が 同 じ 場 合 (l2.tcl,s2.tcl)で は ,n2,n3 間 の 帯 域 を 大
ト リ 名 /ns-allinone-2.31/lib
きくしたものは公平に交互にパケットが流れた.しか
export TCL_LIBRARY=/home/ホ ー ム デ ィ レ ク ト リ 名 /n
し ,n2,n3 間 の 帯 域 を 小 さ く し た も の で は ,n1 の パ ケ
s-allinone-2.31/tcl8.4.14/library
ットが流れはじめたころは公平に流れていたが,次第
と 追 加 し ESC を 押 し 「 :wq」 と 入 力 し 保 存 し て 終 了 す
に n1 か ら の パ ケ ッ ト が 優 先 さ れ 始 め , n0 か ら の パ ケ
る.ホームディレクトリ名にはログインしているユー
ットは棄却されるものが多くなった.
ザアカウント名が入る.
n1 か ら 送 信 さ れ る CBR ト ラ フ ィ ッ ク の 開 始 時 刻 を
n0 よ り 0.5 秒 遅 く し 停 止 時 刻 は 0.1 秒 早 く し パ ケ ッ ト
7. 実 験
7.1. NS 用 tcl ス ク リ プ ト の 作 成
を 流 す 時 間 を 短 く し た 場 合 (l3.tcl,s3.tcl)で は ,n2,n3
間の帯域を大きくしたものは公平に交互にパケットが
NS2 で シ ミ ュ レ ー シ ョ ン す る ネ ッ ト ワ ー ク の 情 報 を
流 れ た .し か し ,n2,n3 間 の 帯 域 を 小 さ く し た も の で
書 い た NS 用 tcl ス ク リ プ ト の 作 成 を 行 う .
は ,n1 の パ ケ ッ ト が 流 れ は じ め た こ ろ は 公 平 に 流 れ て
NS 用 tcl ス ク リ プ ト の 作 成 方 法 が 記 載 さ れ て い る 書
い た が ,次 第 に n1 か ら の パ ケ ッ ト が 優 先 さ れ 始 め ,n0
籍 の 手 順 [13]に 基 づ き NS 用 tcl ス ク リ プ ト の 作 成 を 行
からのパケットは棄却されるものが多くなった.
n1 か ら 送 信 さ れ る CBR ト ラ フ ィ ッ ク の 開 始 時 刻 は
う.
1).GNOME タ ー ミ ナ ル を 起 動 す る .
n0 と 同 じ で 停 止 時 刻 は 0.1 秒 早 く し パ ケ ッ ト を 流 す 時
2).ホ ー ム デ ィ レ ク ト リ で「 vi」と 入 力 し 新 規 の NS 用 t
間 を 短 く し た 場 合 (l4.tcl,s4.tcl)で は ,n2,n3 間 の 帯 域
cl ス ク リ プ ト を テ キ ス ト エ デ ィ タ で 入 力 後 、ESC を 押
を大きくしたものは公平に交互にパケットが流れた.
し「 :wq フ ァ イ ル 名 .tcl」と 入 力 し 名 前 を つ け て 保 存 し
し か し ,n2,n3 間 の 帯 域 を 小 さ く し た も の で は ,は じ
て終了する.
め は 公 平 に 流 れ て い た が ,次 第 に n0 か ら の パ ケ ッ ト が
7.2. NS 用 tcl ス ク リ プ ト の 実 行
多くなった.
優 先 さ れ 始 め ,n1 か ら の パ ケ ッ ト は 棄 却 さ れ る も の が
作 成 し た NS 用 tcl ス ク リ プ ト を 使 い NS2 で シ ミ ュ
レーションする.
9. 実 験 結 果 の 検 討
NS 用 tcl ス ク リ プ ト の 実 行 方 法 が 記 載 さ れ て い る 書
4 つ の 実 験 結 果 か ら , n2, n3 間 の 帯 域 を 大 き く し た
籍 の 手 順 [13]に 基 づ き NS 用 tcl ス ク リ プ ト を 実 行 す る .
ものは,常にパケットが棄却されることなく公平に交
但 し ,実 験 を 行 う 際 に NS2 の 設 定 は デ フ ォ ル ト 状 態 で ,
互 に 流 れ る こ と が わ か っ た .し か し ,n2,n3 間 の 帯 域
特別な設定は行っていない.
を小さくしたものは,実験によって棄却されるパケッ
1).GNOME タ ー ミ ナ ル を 起 動 す る .
トが異なっていた.
2).ホ ー ム デ ィ レ ク ト リ で 「 ns フ ァ イ ル 名 .tcl」 と 入 力
パ ケ ッ ト が 棄 却 さ れ る 原 因 は ,n0,n1 か ら 流 れ て く
し 表 示 さ れ る NAM で シ ミ ュ レ ー シ ョ ン の 結 果 を 観 察
る パ ケ ッ ト に 対 し て ,n2,n3 間 の 帯 域 が 小 さ く ,パ ケ
する.
ットを流しきれなかったためである.
NAM で は 各 ノ ー ド か ら 送 信 さ れ る パ ケ ッ ト が 色 分
開 始 時 刻 が 同 じ 場 合 , n1 か ら 流 さ れ る パ ケ ッ ト の 8
けされており,その色でどこから送信されたパケット
割近くが棄却されていた.開始時刻が異なる場合,開
なのかを識別することができる.またノードに蓄積さ
始時刻が遅いノードから流れるパケットが優先して流
れ た パ ケ ッ ト は 作 成 し た NS 用 tcl ス ク リ プ ト で は 上 方
され,先に流していたパケットの 8 割近くが棄却され
向に表示され,蓄積されず棄却されたパケットは大き
ていた.このことから,棄却されるパケットが異なる
く表示される.
原因は開始時刻であると考えられる.
39
10. お わ り に
参
本研究は,膨大なネットワーク経路の中からネット
考
文
献
ワーク経路制御を行うために,コンピュータ上に仮想
[1]
http://ubila.cse.kyutech.ac.jp/ja/research.html
の小規模ネットワークを構築して実験し,実験から得
[2]
http://www.komazawa-u.ac.jp/~w3c/lecture/network/
ccna2.html
られたデータを基に適切な制御について検討していく
[3]
ことを目的として活動してきた.
http://www.it.ecei.tohoku.ac.jp/~bigtree/RESEARCH
/ns/docs/whatsns.pdf
本 研 究 を 始 め た 当 初 は Solaris と い う Unix 系 OS を
[4]
使 用 し 実 験 を 行 お う と し て い た .し か し ,Solaris の ネ
http://opentechpress.jp/developer/06/07/21/0249208.
shtml
ットワークの設定を行い他のパソコンと通信可能にし
[5]
て か ら , FTP で の 転 送 や MTBBS で NS2 を 転 送 し た が
http://www.aconus.com/~oyaji/windows/vmware_ser
ver_win.htm
Solaris に NS2 の イ ン ス ト ー ル が 順 調 に い か ず ,原 因 を
調べたが打開策を見出すことができなかった.
そ こ で Windows OS が イ ン ス ト ー ル さ れ て い る パ ソ
[6]
http://www.vmware.com/ja/download/server/
[7]
http://www.net.cne.okayama-u.ac.jp/~niboshi/study/l
inux/fedora.htm
コンに仮想マシンソフトをインストールし,仮想マシ
ン 上 で LinuxOS を 動 作 さ せ る こ と に し た .仮 想 マ シ ン
[8]
http://vine.1-max.net/
ソ フ ト は VMware に ,OS は Vine Linux に し た .OS は
[9]
http://vinelinux.org/
SUSE も 候 補 に 挙 が っ た が ,Linux 初 心 者 向 け で あ る こ
[10] 銭
飛 ,NS2 に よ る ネ ッ ト ワ ー ク シ ミ ュ レ ー シ ョ
ン ,pp.277-278,森 北 出 版 株 式 会 社 ,東 京 ,2006.
と ,日 本 語 化 の 充 実 な ど の 理 由 で Vine Linux を 導 入 す
[11] http://www.isi.edu/nsnam/ns/ns-build.html
ることに決定した.
[12] http://cube.kuee.kyoto-u.ac.jp/~osogoe/ns_install.ht
実 験 と し て , い く つ か の 条 件 で 作 成 し た NS 用 tcl
ml
ス ク リ プ ト を NS2 で ト レ ー ス し , 実 験 を 行 っ た .
[13] 銭
そ の 結 果 ,n2,n3 間 の 帯 域 を 大 き く し た も の は ,常
飛 ,NS2 に よ る ネ ッ ト ワ ー ク シ ミ ュ レ ー シ ョ
ン , pp.27-33, 森 北 出 版 株 式 会 社 , 東 京 , 2006.
に パ ケ ッ ト が 棄 却 さ れ る こ と な く 公 平 に 交 互 に 流 れ ,n
2, n3 間 の 帯 域 を 小 さ く し た も の は , 棄 却 さ れ る パ ケ
ットが異なり公平に流れていなかった.
実 験 結 果 か ら ,n2,n3 間 の 帯 域 を 小 さ く し た 場 合 に
パケットが棄却され,棄却されるパケットが異なる原
因は開始時刻にあると考えられた.パケットが棄却さ
れないためにも,ネットワーク経路の適切な制御には
回線の帯域が重要な条件の一つだということがわかっ
た.
し か し ,当 初 考 え て い た Solaris で の 実 験 環 境 の 構 築
に 時 間 を 割 い て し ま っ た こ と , VMware の エ ラ ー の 解
決 や NS2 の 環 境 整 備 に 時 間 が か か っ た こ と が あ り ,実
験 パ ッ ケ ー ジ や NS 専 用 ト レ ー ス フ ァ イ ル 解 析 ツ ー ル
を使えず十分な実験が行えなかった.
本研究を通して何かが起きてから解決方法を探すの
ではなく,事前に手順とどのようなエラーが起こりえ
るのかを確認しておくこと,チームで作業を行うとき
には作業を分担することによりスムーズに作業が進む
ことを実感した.
40
コミュニケーションネットワーク Lab.(福島研究室)
2007 年度卒業研究概要
日本文理大学・工学部・情報メディア学科
Nippon Bunri Univ.
Department of Media Technology
ユビキタスネットワークを支える仮想マシン環境に関する研究
0424030
坂田啓輔 1
指導教員:
1 株式会社クロステック
2 株式会社アルトナー
鳥羽伸紀 2
0424043
福島
学
〒222-0021 神奈川県横浜市港北区篠原北 2-4-1
〒105-0012 東京都港区芝大門 2-5-5 住友不動産芝大門ビル 10F
あらまし利用者の要求の多様化により,必要となるサーバ数が増加するとともに,最大負荷の出現頻度は散発の
傾向にある.このため,サーバに対し 1 台の実機を利用することはリソースコストが高くなり,物理的な設置スペ
ースを考えてもコストが高くなる要因となっている.サーバ数増加に伴う設置スペース問題を解決する技術の1つ
として仮想化技術が提案されており,最大負荷の出現頻度の散発化問題を解決する技術の1つとしてライブマイグ
レーション技術が提案されている.本研究では,仮想マシンの1つである Xen の導入,ライブマイグレーションの
動作検証,を通して,仮想化技術の有用性を調査する.調査の結果,代表的なインストール事例に基づいてインス
トールを行っても,対象とする計算機の状況に応じた修正が必要であることがわかった.
キーワード Xen,ライブマイグレーション,CentOS,VNC,VMware
1. は じ め に
想マシンを使うために必要なインストール手段につい
ユ ビ キ タ ス ネ ッ ト ワ ー ク [1] で は 「 い つ で も ・ ど こ で
て調査する.
も・だ れ で も・な ん で も 」ネ ッ ト ワ ー ク に よ り 結 ば れ 、
2. Xen を 用 い た 仮 想 化
システム全体として快適・安全で知的な活動を可能に
することを目標としている.利用者近傍の小型携帯情
Xen は ハ ー ド ウ ェ ア 上 で 動 作 [3]す る こ と で , Xen 上
報端末はバッテリおよび容積の関係から十分な処理機
で 複 数 の OS を 管 理 , 逆 に 複 数 の ハ ー ド ウ ェ ア 上 で 管
能および記録機能を持つことが難しい.このため,ネ
理することができる.これらを用いて高性能なマシン
ットワークを介して外部情報機器と連動することで情
があるかのように見せる技術がある.
報機器同士を統合し,必要な機能・サービスの提供を
高性能なマシンがあるかのように見せる技術として
可能とする手法が有用であると考えられている.外部
は仮想的に複数の計算機とみなす技術,仮想的に 1 台
情報機器の1つであるサーバは必要とされる頻度によ
の計算機とみなす技術がある.仮想的に複数の計算機
って負荷が変動する.従来は最大負荷を想定し,サー
とみなす技術,仮想的に 1 台の計算機とみなす技術の
バを構築することが多かったが,利用者の要求の多様
概 略 図 を そ れ ぞ れ 図 1, 図 2 に 示 す .
化により最大負荷の出現頻度が低くなり散発の傾向に
ある.このため,サーバ機能に対し 1 台の実機を利用
管 理 OS
することはリソースコストが高くなる.この問題の解
ゲ ス ト OS
ゲ ス ト OS
Xen
決策としてサーバ数増加に伴う設置スペース問題を解
決する技術の1つである仮想化技術が提案されており,
ハードウェア
また最大負荷の出現頻度の散発化問題を解決する技術
図 1
の 1 つ で あ る ラ イ ブ マ イ グ レ ー シ ョ ン 技 術 [2] が 提 案
仮想的に複数の計算機とみなす技術
されている.仮想マシン環境は,ネットワークからは
実機と認識されるが仮想マシンは完全にソフトウェア
として構成されており、ハードウェアコンポーネント
管 理 OS
は含まれていないため実態と異なる.すなわち仮想化
ゲ ス ト OS
Xen
とは「ネットワーク環境では実質的に実機に等しい」
環境を提供する技術である.本研究では,仮想マシン
ハードウェア
の 1 つ で あ る Xen の 導 入 と 動 作 確 認 を 通 し て ,負 荷 分
図 2
散、災害復旧、などリアルタイムでサーバメンテナン
ハードウェア
仮想的に 1 台の計算機とみなす技術
スを行うような事態に対応できるような保守性を高め
図 1 ではハイパフォーマンスなハードウェア上で
るためのライブマイグレーション技術を利用可能な仮
41
Xen を 動 作 さ せ ,複 数 の 計 算 機 と み な す こ と が で き る .
インストールする.うまくインストールできなかった
図 2 ではローパフォーマンスな複数のハードウェア上
た め , CD イ メ ー ジ が 破 損 し て い な い か チ ェ ッ ク を す
で Xen を 動 作 さ せ る こ と で ハ イ パ フ ォ ー マ ン ス な 計 算
る こ と に し た . チ ェ ッ ク す る た め に md5sum.exe と
機とみなすことができる.また,この2つの技術を併
md5sum コ マ ン ド フ ァ イ ル を ダ ウ ン ロ ー ド し コ マ ン ド
せ持つライブマイグレーション技術がある.
プロンプトで実行したが全てのファイルが破損してい
た . 再 度 ダ ウ ン ロ ー ド し CD に 書 き 込 み 、 イ ン ス ト ー
ライブマイグレーション技術とは実行中の仮想マシ
ンを無停止で移動させる技術である.ライブマイグレ
ルし直すと正常にインストールできた.
ーション技術の概略図を図 3 に示す.
4.2. サ ー バ 機 の CentOS4.3 の 設 定
インストール設定ではインストールで利用したサ
そこそそこそ
こな
こな
イ ト [5]と 本 [4]を 参 考 に 設 定 し た .基 本 的 な 設 定 は サ イ
空いている
ト [5]の 通 り に し た が 本 [4]に 書 か れ て い た と こ ろ は 本
マシンに移動
必 要 な
[4]の 通 り に 進 め る と す る .
処理能力
計算機計算機
インストール設定項目
1.Language Selection: Japanese(日 本 語 )
ハイパフォーマンス
2.キ ー ボ ー ド 設 定 : Japanese
ハイパフォーマンス
3.イ ン ス ト ー ル の 種 類 : ワ ー ク ス テ ー シ ョ ン
ネットワーク
4.デ ィ ス ク パ ー テ ィ シ ョ ン の 設 定 : 自 動 パ ー テ ィ シ ョ
ン設定.
図 3
ライブマイグレーション技術
5.自 動 パ ー テ ィ シ ョ ン 設 定 : シ ス テ ム の す べ て の パ ー
ティションを削除
図 3 では仮想的に複数の計算機とみなしたハイパフ
6.デ ィ ス ク の 設 定 : 本 [4]に は パ ー テ ィ シ ョ ン は /var を
ォーマンスな計算機に負荷がかかると,ネットワーク
大 き く 確 保 す る か /var/lib/xen を 大 き く 確 保 と 書 い て あ
を通じて別の空いているハイパフォーマンスな計算機
ったがそれ以上大きくできなかったのでデフォルトと
に負荷のかかった計算機を移動させるというものであ
する.
る.
7.ブ ー ト ロ ー ダ ー の 設 定 : デ フ ォ ル ト
8.ネ ッ ト ワ ー ク の 設 定 : 事 前 に 調 べ て お い た サ ー バ 機
3. 実 験 概 要
の IP ア ド レ ス ,サ ブ ネ ッ ト マ ス ク ,デ フ ォ ル ト ゲ ー ト
ここでは実験環境の構築から実験までの流れを記
ウェイとする.
述する.
9.フ ァ イ ヤ ー ウ ォ ー ル の 設 定 : フ ァ イ ヤ ー ウ ォ ー ル な
1).サ ー バ 機 へ CentOS4.3 の イ ン ス ト ー ル
し , SELinux を 無 効 と す る .
2).サ ー バ 機 の CentOS4.3 の 設 定
10.追 加 の 言 語 サ ポ ー ト : Japanese
3).サ ー バ 機 へ Xen3.0.2RPM パ ッ ケ ー ジ の イ ン ス ト ー
11.タ イ ム ゾ ー ン の 選 択 : ア ジ ア /東 京
ル
12.Root パ ス ワ ー ド を 設 定:事 前 に 決 め た パ ス ワ ー ド を
4).サ ー バ 機 の Xen3.0.2RPM パ ッ ケ ー ジ の 設 定
設定とする.
5).サ ー バ 機 の VNC サ ー バ の 設 定
13.パ ッ ケ ー ジ グ ル ー プ の 選 択:必 要 最 低 限 の も の を 選
6).Xenoppix の 設 定 調 査
択とする.
7).VMware へ CentOS4.3 の イ ン ス ト ー ル
パッケージグループの選択でデフォルトを選択しな
8). VMware の CentOS4.3 へ Xen3.0.2RPM パ ッ ケ ー ジ の
いとエラーが出たため、デフォルト設定にした.
インストール
4.3. サ ー バ 機 へ Xen3.0.2RPM パ ッ ケ ー ジ の イ
9).Telnet の 設 定 調 査
ンストール
10). VMware の CentOS4.3 へ VNC サ ー バ の イ ン ス ト ー
[4]本 の 通 り に CentOS の GNOME を 用 い て ダ ウ ン ロ ー
ル
ド,インストールとする.
11). VMware の CentOS4.3 の VNC サ ー バ の 設 定
1. xen3.2.0RPM パ ッ ケ ー ジ の ダ ウ ン ロ ー ド :
4. 実 験 環 境 の 構 築
# mkdir -p /var/lib/xen/packages
実際に環境の構築を行うとそれぞれのソフトで注
# cd /var/lib/xen/packages
意することがあるので文献を基に改めて記述する.
# wget -c
4.1. サ ー バ 機 へ CentOS4.3 の イ ン ス ト ー ル
http://bits.xensource.com/Xen/latest/xen-3.0-x86_32-rhel
4.1.bin.tar
本 [4]と サ イ ト [5]を 参 考 に CentOS4.3 を サ ー バ 機 へ
42
2. tar フ ァ イ ル の 解 凍 :
4.6. Xenoppix の 設 定 調 査
# tar xvf xen-3.0-x86_32-rhel4.1.bin.tar
CD を 入 れ る だ け で 起 動 で き Xen の 機 能 を 持 っ て い
3. bridge-utils の イ ン ス ト ー ル
る Xenoppix の Xen の 設 定 を 調 査 す る .
# yum install -y bridge-utils
Xen の 設 定 で エ ラ ー が 出 て い た フ ォ ン ト の 問 題 点 を
4. lksctp-tools の ア ン イ ン ス ト ー ル
探るためフォントファイルのリストをコピーし保存し
# rpm -e lksctp-tools lksctp-tools-devel
た.
5. TLS の 無 効 化
4.7. VMware へ CentOS4.3 の イ ン ス ト ー ル
# mv /lib/tls /lib/tls.disabled
サ ー バ 機 で の 実 験 は 長 時 間 行 え な い た め , 他 の PC
6. Xen 本 体 の イ ン ス ト ー ル
を 用 い て VMware 上 で サ ー バ 機 と 同 じ 環 境 を 構 築 す る .
# rpm -ihv xen-3.0.2.2-86.1_rhel4.1.i386.rpm
なお,サーバ機へのインストール方法と同じ方法でイ
4.4. サ ー バ 機 の Xen3.0.2RPM パ ッ ケ ー ジ の 設
ンストールとする.
定
4.8. VMware の CentOS4.3 へ Xen3.0.2RPM の イ
本 [4]の 通 り に 設 定 を す る .
ンストール
1. Xen 用 の カ ー ネ ル の イ ン ス ト ー ル
3.0.7. VMware に CentOS の イ ン ス ト ー ル の 項 目 と 同
# rpm -ihv xen-kernel-2.6.16-xen3_86.1_rhel4.1.i686.rpm
じく,サーバ機へのインストールと方法と同じ方法で
2. GRUB 設 定 フ ァ イ ル の バ ッ ク ア ッ プ
インストールとする.
# cp -p /boot/grub/grub.conf /boot/grub/grub.conf.orig
サーバ機へのインストール時と同様,フォント部分
3. GRUB 設 定 フ ァ イ ル (/boot/grub/grub.conf)に 追 記 す
でのエラーがメッセージが出た.
る行
4.9. Telnet の 設 定 調 査
title Xen 3.0.2 (linux-2.6.16-xen3_86.1_rhel4.1)
VNC が 使 え る か ど う か 事 前 調 査 の た め Telnet の 設 定 ,
root (hd0,0)
動作確認を行う.
kernel /boot/xen-3.gz dom0_mem=131072
最 初 は Telnet に 接 続 で き な か っ た が 原 因 を 究 明 し た
module /boot/vmlinuz-2.6.16-xen3_86.1_rhel4.1 ro
結 果 Telnet 自 体 が イ ン ス ト ー ル さ れ て い な か っ た こ と
root=LABEL=/
が 解 り Telnet を イ ン ス ト ー ル し て 接 続 で き る よ う に な
module /boot/initrd-2.6.16-xen3_86.1_rhel4.1.img
った.
4. 不 要 な サ ー ビ ス の 無 効 化
4.10. VMware の CentOS4.3 へ VNC サ ー バ の イ
# for service in acpid apmd autofs canna cpuspeed cups
ンストール
cups-config-daemon ¥(バ ッ ク ス ラ ッ シ ュ )
VMware に イ ン ス ト ー ル し た CentOS で は VNC が 正
gpm haldaemon iiim iptables isdn kudzu mdmonitor
常 に 動 か な か っ た た め , イ ン ス ト ー ル [7]す る .
messagebus netfs nfslock pcmcia ¥(バ ッ ク ス ラ ッ シ ュ )
# yum -y install vnc-server
portmap rawdevices readahead readahead_early rpcgssd
rpcidmapd xfs
4.11. VMware の CentOS4.3 の VNC サ ー バ の 設
do
定
chkconfig $service off
サ イ ト [7]を 参 考 に 設 定 を 行 う .
done
1. VNC サ ー バ の 起 動
5. Xen デ ー モ ン の 有 効 化
# vncserver
# chkconfig xend on
2. デ フ ォ ル ト ウ イ ン ド ウ マ ネ ー ジ ャ の 変 更 .デ フ ォ ル
6. シ ス テ ム の 再 起 動
ト マ ネ ー ジ ャ で は twm な の で Gnome に よ る グ ラ フ ィ
# reboot
フォントの設定の部分にエラーが出ていたため、正
常に動作しなかった.
カル画面で表示させる.
4.5. サ ー バ 機 の VNC サ ー バ の 設 定
換え,追加する.
# vi /root/.vnc/xstartup
xstartup 内 の 設 定 フ ァ イ ル の 記 述 を 下 記 の よ う に 書 き
サーバ室での実験は生徒だけではできないため遠
#twm &
隔 操 作 で サ ー バ 機 を 使 用 で き る よ う に す る た め VNC
最終行に追加
の 設 定 [6]を 行 う .VNC サ ー バ は 最 初 か ら イ ン ス ト ー ル
exec gnome-session
されている.
今 ま で 1 つ の デ ィ ス プ レ イ 番 号 以 外 、 CUI で し か 表
起 動 さ せ る と デ ィ ス プ レ イ 番 号 1 で は GUI で 動 作 し
示されなかったがどのディスプレイ番号でも表示され
た が そ の 他 の デ ィ ス プ レ イ 番 号 の 場 合 CUI で 動 作 し た .
るようになった.
43
5. 実 験 の 検 討
代表的なマシン構成に基づいて記されたインスト
ール方法を参考に実際のインストール作業を行った.
その結果,次の項目に関してはインストール対象の状
況に対応して修正しなければならないことがわった.
修 正 が 必 要 で あ っ た 項 目 は , X-Window 用 フ ォ ン ト で
あ り ,VNC の よ う に X-Window を 使 用 し た ロ グ イ ン を
ネ ッ ト ワ ー ク 経 由 で 行 う 場 合 , Linux を 単 独 で イ ン ス
ト ー ル し た 際 に は 問 題 に な ら な い X-Windows 用 フ ォ
ントの有無により,マシン操作に必要なコンソールが
使用できなくなることがわかった.
対 処 方 法 と し て , telnet 等 の CUI で も か ま わ な い の
で外部からシステム設定のために必要なログインが可
能な状況にした上で対応する必要がある.
6. お わ り に
本研究では,サーバの負荷状況に応じて動的にマシ
ンリソースの管理を行うための仮想化技術の有用性に
ついて,実際のインストールを通して検証することを
目 的 と し た .こ こ で は Xen と い う 仮 想 化 技 術 を 対 象 と
した.
こ こ で は , Xen の イ ン ス ト ー ル お よ び 動 作 確 認 ま で を
対象として行った.その結果,正しくインストールが
行え,仮想化技術環境が構築された.但し,ライブマ
イ グ レ ー シ ョ ン 等 の Xen 固 有 の 機 能 の 有 効 性 に 関 し て
はここでは対象としていない.
文
献
[1] HITACHI,電 子 行 政 用 語 集 , ユ ビ キ タ ス ネ ッ ト ワ
ー ク , 2004/11/19,
http://www.hitachi.co.jp/Div/jkk/glossary/0454.html
[2] び ぎ ね っ と ,ラ イ ブ マ イ グ レ ー シ ョ ン 技 術 の 解 説
と活用法,
http://begi.net/files/virt6/LiveMigrationL.pdf
[3] 實 田 健 , 日 経 BP, 第 1回 オ ー プ ン ソ ー ス の 仮 想
マ シ ン ・ ソ フ ト 「 Xen」, 2006/06/19,
http://itpro.nikkeibp.co.jp/article/COLUMN/2006061
2/240670/?ST=virtual
[4] 平 初 ,宮 原 徹 ,伊 藤 宏 通 ,野 津 新 ,鎌 滝 雅 久 ,
中村 正澄,宮本 久仁男,小野 雄太郎,大島 孝
子 ,オ ー プ ン ソ フ ト の 仮 想 化 技 術 , 仮 想 化 技 術 完
全 攻 略 ガ イ ド ,イ ン プ レ ス ジ ャ パ ン ,2006/10/05,
pp114~ 171
[5] CentOSで 自 宅 サ ー バ ー 構 築 , CentOS4,
http://centossrv.com/centos4.shtml
[6] Hot Linux, VNCの イ ン ス ト ー ル /設 定 ,
http://www.hot-linux.org/redhat/?rec_no=16
[7] は じ め て の 自 宅 サ ー バ ー 構 築 , ~ Fedora/CentOS
~ , http://kajuhome.com/vnc.shtml
44
コミュニケーションネットワーク Lab.(福島研究室)
2007 年度卒業研究概要
日本文理大学・工学部・情報メディア学科
Nippon Bunri Univ.
Department of Media Technology
ユビキタスネットワークにおける
情報提示技法に関する研究
0424031
†(株)エス・エスアヴェニュー
佐藤
毅†
0424040 高岡
〒870-0037 大分市東春日町 17-19
‡日本文理大学大学院 〒870-0397
あらまし
創‡
大分ソフィアプラザビル 4F
大分市一木 1727
本研究では,一般家庭のテレビなどで普及しているトランスオーラル再生系で,今までより高臨場感を得ること
を目標としている.本論文では高臨場感を得るためには ch(チャネル)の数が増やさなければならないか,被験者が年代別でも ch
数を増やすと高臨場感を得ることができるか,選択度数を求めることから検討する.ch とは伝送路のことである.実験は,1ch,
2ch,3ch を対象とし,一対比較法を用いた聴取実験を行い,2 回の信号音の内どちらが「臨場感があった」かを被験者が比較し
判断をする.一対比較法で求められた値から選択度数を求め分析を行う.その結果, 1ch よりも 2ch,3ch が「臨場感がある」
という傾向が見られた.2ch,3ch と多少増えた程度では,高臨場感の感じ方に差はないことが考えられる.また,被験者は年代
別であっても 2ch,3ch のようにスピーカは左右にあったほうが有効である傾向もみられた.さらに,ある一定の歳を越えたご
老人は,この傾向からはずれるのではないかということがわかった.
キーワード 高臨場感,ch 数,一対比較法,選択度数
1. はじめに
ユビキタスネットワークとは人や情報端末機が,ネ
の研究は,高臨場感システムの研究結果として高臨場
ットワークへの接続を「いつでも・どこでも・だれで
感 を 得 る に は ch 数 を 増 や し て い る . つ ま り , ch 数 を
も・なんでも」できるようになり,様々な機能の利用
増やさなければ,高臨場感を得ることができないとい
やサービスの提供が行えることを目標としている.総
う こ と に な る .実 際 に ,高 臨 場 感 を 得 る に は ch 数 を 増
務 省 の u-japan[1]計 画 に よ っ て ,様 々 な 機 能 の 利 用 や
やさなければならないかを考える.
サービスの提供が行われているが,伝達情報の欠落な
本 論 文 で は , 高 臨 場 感 を 得 る に は ch 数 を 増 や さ な
どといった不安や問題が意識されるようになってきた.
ければならないかについて調査・検討をする.
伝達情報の欠落は,相手に対し正しい情報が伝えられ
ていないことになる.
2. 手 法
2.1 主 観 評 価 実 験 方 法 と 結 果 の 分 析 方 法
伝達情報の欠落について一般に普及されているテ
レビ環境で考えてみる.現在のテレビ環境の多くはト
ある刺激に対する人の反応を計算機で扱おうとし
ラ ン ス オ ー ラ ル 再 生 系 の ス テ レ オ サ ラ ウ ン ド( 2ch)が
ても数値化されていないため扱うことが出来ない.従
用 い ら れ て い る . ch(チ ャ ネ ル )と は 伝 送 路 の こ と を 示
って人間の特性を扱うには四則演算に依存しない心理
し て お り , 2ch と は 2 つ の 伝 送 路 の こ と で あ る . テ レ
量を測定して数値表現にし,無意味な数列から意味の
ビが伝えようとしている情報は,収録時の雰囲気と考
ある計算可能な数列に置き換えなければならない.こ
え る . 収 録 時 の 雰 囲 気 の こ と を NiCT の 講 演 会 資 料 [2]
の際に用いられる測定法が心理学的測定法である.ま
か ら 高 臨 場 感 と す る . 2ch の 環 境 で , テ レ ビ が 伝 え よ
たこのようにして事象を意味のある数列に置き換える
うとしている高臨場感が視聴者に正しく伝わっている
ために数量化する行為を「尺度化」と呼ぶ.尺度には
のかは,わからない.
次の 4 つの種類がある.
現 在 ま で の テ レ ビ 環 境 は ス テ レ オ サ ラ ウ ン ド (2ch),
1.名義尺度:数量でないものに対する尺度
一 昔 前 の 型 で あ る モ ノ ラ ル サ ラ ウ ン ド (1ch),そ し て 現
2 . 順 序 (序 数 )尺 度 : 順 位 の 決 定 な ど に 使 う 尺 度 . 属
在の地上デジタル放送対応テレビに組み込まれている
性に与えられている値に関係し,事象そのものの
3ch, の 環 境 が あ る . 現 在 テ レ ビ の ch 数 が 3ch, 5.1ch
増大の幅は関係しない
と 増 え て き て い る . し か し , ch 数 を な ぜ 増 や し て い る
3 . 距 離 (間 隔 )尺 度 : 2 点 間 の 距 離 に 対 す る 尺 度
のかを考える.総務省が行っている高臨場感システム
4 . 比 例 (比 率 )尺 度 : 絶 対 的 な 0 が 存 在 す る 尺 度
45
本研究は心理学的測定法として心理実験でよく用
感じ取ることが出来たということである.
いられる一対比較法を用いた聴取実験から選択回数を
求 め る .一 対 比 較 法 と は ,数 個 の 刺 激 を 二 つ ず つ 対 に し
A
B
C
て判断を求める方法であり,間接法の中でも特に判断
がやさしく適用範囲も広い.また,判断がやさしいた
め判断の信頼性も高いことから手軽に分析を行うこと
が で き る の で こ の 手 法 を 選 択 し た [3].
一対比較法から得られるデータは順次尺度値なの
で サ ー ス ト ン の 比 較 判 断 の 法 則 [4]に 基 づ い て ,距 離 尺
度に変換する必要があり心理尺度値を求める.サース
トンの比較判断法則として,まず選択度数を出す必要
が あ る .選 択 度 数 と は 刺 激 A,刺 激 B が あ る 時 実 験 時
の 各 対 に 対 し て ,A>B と 解 答 し た と き の 被 験 者 の 人 数
g
を表す.
図 3.1
擬 似 3ch 化 が 出 来 た と き
3. 聴 取 実 験 内 容
し か し , 2ch で 録 音 し た 信 号 音 で 3 人 の 雰 囲 気 を 感
3.1. 実 験 概 要
じ 取 る に は 受 聴 者 g と 信 号 音 A,B,C, 間 の 伝 送 路 を 考
本 実 験 で は , テ レ ビ の ch を 考 え る と ch は ス ピ ー カ
えなければならない.
になる.スピーカで高臨場感が得られるかの聴取実験
を 1ch, 2ch, 3ch で 行 う . 出 力 す る 信 号 音 は , テ レ ビ
擬 似 3ch 化 を 行 う た め に , 本 実 験 で は , 音 源 を 3 点
放 送 の 収 録 時 環 境 を 考 え 2ch で 録 音 す る . 実 験 場 所 は
から出力し,2 点の観測位置から信号を録音し,聴取
家族が視聴することを想定して一般家屋である.聴取
実験で出力する信号音を作成する.作成した信号音を
実験の手法として第 2 章第 1 項で示している一対比較
1ch の 場 合 ,2ch の 場 合 ,3ch の 場 合 で 出 力 し ,被 験 者
法を用いる.一対比較法で得られたデータを個人の選
が聴取する.音源,受信位置,伝送路,聴取位置を図
択回数として集計を行う.集計した個人の選択回数の
3.2 に 示 す .
合計が正しいデータであるかどうかを分析し調べる.
p 2(t )
p1(t )
正しいと判断されたデータが求められたら,個人の選
択回数の合計から,被験者全員の選択回数の合計を求
p3(t )
める.被験者全員の選択回数の合計から選択度数を求
め検討を行う.
h1r (t )
3.2. 聴 取 実 験 時 の環 境 理 由
h2l (t ) h2r (t )
h3l (t )
一対比較法を用いた聴取実験を行うが,テレビの視
h1l (t )
聴は家であることが多く,家では家族での視聴も考え
られ視聴者の年代は別々になる.年代別の被験者は家
h3r (t )
xl (t )
族に頼み,実験を行ってもらったため被験者人数を増
xr (t )
xl (t ) + xr (t )
+
やすことは出来ない.このため,年代別の被験者と実
験場所を重要視する.
o2(t )
ol (t )
3.3. 信 号 音 の作 成
3 人 の 信 号 音 を 2ch で 録 音 し , ト ラ ン ス オ ー ラ ル 再
生系を用いて信号音を出力した場合を考える.高臨場
感 を 得 る た め に は ,2ch で 録 音 し た 信 号 音 を ,3 人 の 信
h'1l (t )
号音と感じ取ることである.つまり,録音時の状況を
で き る だ け 再 現 す る こ と で あ る . こ の こ と を 擬 似 3ch
化 と 考 え る こ と と し , 図 3.1 に 擬 似 3ch 化 が 出 来 た 時
図 3.2
の 予 想 図 を 示 す . 図 3.1 は 受 聴 者 g が 音 源 A , B , C
がそれぞれ別の場所から信号音を出力していることを
46
h'1r (t )
o3(t )
h'3l (t )
h'2l (t )
h'2r(t )
yl (t )
h'3r (t )
yr(t )
録音時の音源とマイクの関係図
左 側 音 源 を p1 (t ) ,中 央 音 源 を p2 (t ) ,右 側 音 源 を p3 (t ) ,
遅 れ て 出 力 さ れ る 信 号 音 は 小 さ く な る た め , P1 (t ) と
左 側 受 信 位 置 を xl (t ) ,右 側 受 信 位 置 を xr (t ) , p1 (t ) か ら
P3 (t ) が τ1 , 及 び τ 3 時 間 が ず れ る と ,
xl (t ) の 伝 送 路 を h1l (t ) , p1 (t ) か ら xr (t ) の 伝 送 路 を h1r (t ) ,
p2 (t ) か ら xl (t ) の 伝 送 路 を h2l (t ) , p2 (t ) か ら xr (t ) の 伝 送
p2 の 信 号 音 の 大
き く 聞 こ え , P1 (t ) と P3 (t ) 信 号 音 は 小 さ く な る と 考 え る .
P1 (t ) と P3 (t ) が 無 相 関 に な る と す れ ば , 式 (3)は
路 を h2 r (t ) , p3 (t ) か ら xl (t ) の 伝 送 路 を h3l (t ) , p3 (t ) か ら
xr (t ) + xl (t ) = 2( p2 (t ) ∗ h2 r (t ))
xr (t ) の 伝 送 路 を h3r (t ) , と す る . xl (t ) , xr (t ) を 和 算 し
(7)
た 信 号 音 を xr (t ) + xl (t ) , 左 側 セ ラ ミ ッ ク 振 動 ス ピ ー カ
と な る .そ こ で 式 (7)を 再 生 時 の 1ch 及 び 3ch セ ン タ 信
を o1 (t ) ,中 央 の セ ラ ミ ッ ク 振 動 ス ピ ー カ を o2 (t ) ,右 側
号 と す る . こ れ は 2ch 収 録 時 に 擬 似 3ch 化 す る 手 法 と
セ ラ ミ ッ ク 振 動 ス ピ ー カ を o3 (t ) ,左 側 聴 取 位 置 を yl (t ) ,
同 等 で あ る た め , TV な ど を 想 定 す る 本 研 究 で は 妥 当
右 側 聴 取 位 置 を yr (t ) , o1 (t ) か ら yl (t ) の 伝 送 路 を h'1l (t ) ,
な手法であると判断する.
o1 (t ) か ら yr (t ) の 伝 送 路 を h'1r (t ) , o2 (t ) か ら yl (t ) の 伝 送
図 3.2の 環 境 は ,擬 似 3ch化 が 可 能 と い う こ と を 考 え ,
1ch時 に は o2 (t ) か ら 式 (7)の 信 号 音 を 出 力 す る .2ch時 に
路 を h'2l (t ) , o2 (t ) か ら yr (t ) の 伝 送 路 を h'2 r (t ) , o3 (t ) か
ら yl (t ) の 伝 送 路 を h'3l (t ) , o3 (t ) か ら yr (t ) の 伝 送 路 を
は o1 (t ) か ら 式 (1)の 信 号 音 を 出 力 し ,o3 (t ) か ら 式 (2)の 信
h'3r (t ) ,と す る .
号 音 を 出 力 す る . 3ch時 に は o1 (t ) か ら 式 (1)の 信 号 音 を
p1 , p2 , p3 そ れ ぞ れ の 音 源 が 信 号
音 を 出 し た 時 , 受 信 位 置 xl に 届 く 信 号 音 の 式 が
出 力 し , o2 (t ) か ら 式 (7)の 信 号 音 を 出 力 し , o3 (t ) か ら 式
xl (t ) = p1(t ) ∗ h1l (t ) + p2 (t ) ∗ h2l (t ) + p3 (t ) * h3l (t )
(2)の 信 号 音 を 出 力 す る .
(1)
1ch 時 の 式 (7)の 信 号 音 を 図 3.3 に 示 す . 横 軸 が 時 間
と な る . 但 し , *は 畳 み 込 み 演 算 [6]で あ る . さ ら に ,
受 信 位 置 xr に 届 く 信 号 音 の 式 が
xr (t ) = p1(t ) ∗ h1r (t ) + p2 (t ) ∗ h2r (t ) + p3 (t ) ∗ h3r (t )
を示し,縦軸がアンプを示している.信号音の出力時
間 は 43 秒 で あ り , サ ン プ リ ン グ 周 波 数 は 44100Hz で
ある.
(2)
となる.
1ch 時 に 出 力 す る 信 号 音 は 式 (1),式 (2)を 和 算 し た 信
号 と な る . 式 (1), 式 (2)の 和 算 し た 式 が
xr (t ) + xl (t ) = p1 (t ) * h1r (t ) + p1 (t ) * h1l (t )
+ p2 (t ) * h2r (t ) + p2 (t ) * h2l (t )
+ p3 (t ) * h3r (t ) + p3 (t ) * h3l (t )
図 3.3
(3)
1ch で 出 力 し た 信 号 音 の 振 幅
2ch 時 の 信 号 音 を 図 3.4 に 示 す . 横 軸 が 時 間 を 示 し ,
縦 軸 が ア ン プ を 示 し て い る . 信 号 音 の 出 力 時 間 は 43
である.
3ch 時 に 出 力 す る 信 号 は 式 (1), 式 (2), 式 (3)と な り ,
秒 で あ り ,サ ン プ リ ン グ 周 波 数 は 44100Hz で あ る .上
こ れ は 擬 似 3ch 化 す る と い う こ と に な る . 擬 似 3ch 化
と は 図 3.2 で 考 え る と
段 の 振 幅 図 が 式 (1) の 信 号 音 で あ り 下 段 の 振 幅 図 が 式
(2)の 信 号 音 で あ る .
x r ,xl に 録 音 さ れ る 音 源 p1 ,p 2 ,
p3 を 可 能 な か ぎ り 再 現 す る と い う こ と で あ る .こ こ で
p 2 の h2l と h2 r は 周 り の 反 射 を 無 視 で き る と 考 え る と
h2 r (t ) = h2l (t )
となる.
(4)
p 2 の 信 号 音 は x r , xl に 一 番 近 く に あ る た め
p1 , p3 と は 時 間 差 が あ る . p1 , p3 の 時 間 差 は
h1r (t ) = h1l (t − τ1 )
(5)
h3l (t ) = h3r (t − τ 3 )
(6)
と な る . 式 (4), 式 (5), 式 (6)の 関 係 は , 先 行 音 効 果 [7]
図 3.4
に よ り ,出 力 さ れ る 音 源 か ら 複 数 の 信 号 音 が あ る 場 合 ,
47
2ch で 出 力 し た 信 号 音 の 振 幅
表 4.1
3ch 時 の 信 号 音 を 図 3.5 に 示 す . 横 軸 が 時 間 を 示 し ,
縦 軸 が ア ン プ を 示 し て い る . 信 号 音 の 出 力 時 間 は 43
個人別合計回数
10代 合計回数
ch数
1ch
1ch
2ch
3ch
20代 M1 合計回数
ch数
1ch
1ch
2ch
3ch
20代 M2 合計回数
ch数
1ch
1ch
2ch
3ch
50代 合計回数
ch数
1ch
1ch
2ch
3ch
70代 合計回数
ch数
1ch
1ch
2ch
3ch
秒 で あ り ,サ ン プ リ ン グ 周 波 数 は 44100Hz で あ る .上
段 の 振 幅 図 が 式 (1)の 信 号 音 で あ り ,中 央 の 段 の 振 幅 図
が 式 (7)の 信 号 音 で あ り ,下 段 の 振 幅 図 が 式 (2)の 信 号 で
ある.
図 3.5
個人の選択回数の合計
3ch で 出 力 し た 信 号 の 振 幅
3.4. 実 験 環 境
2ch
2
1
1
3ch
3
2
3
2ch
2
0
0
3
1
2
3ch
4
2
1
2ch
2
1
0
4
3
2
3ch
3
2
0
2ch
2
1
0
4
4
2
3ch
3
2
1
2ch
2
2
2
4
3
2
3ch
2
2
3
2
1
2
実験場所,使用機材は次の通りである.
実験場所:
佐藤家自宅
1階
4.2. 分 析
リビング
表 4.1 の デ ー タ が 使 用 可 能 で あ る か 判 断 す る た め に ,
使用機材
PC:
TOSHIBA
dynabook
二項分布を用いて判断する.二項分布とは結果が成功
再 生 用 セ ラ ミ ッ ク 振 動 ス ピ ー カ [8]: CEMI
か失敗かのいずれかである n 回の試行回数を行ったと
CERAMICS
きの確率分布である.縦軸が面積,横軸が選択回数を
SPEAKER
SYSTEM
入出力装置:
示している.横の直線が限界値,上の曲線が累積曲線
Hammerfall
であり,下の曲線が被験者のスコアである.限界値と
DSP-CardBus+Multiface
信号音:第 3 章 3 項で記した信号音
は 値 が そ こ ま で 使 用 可 能 と い う 限 界 の 値 を 示 す .図 4.1
以上の環境で聴取実験を行った.
の上段の二項分布では見づらいので,見やすくするた
め に 対 数 に し た の が 図 4.1 の 下 段 の 二 項 分 布 と な る .
図 4.1 に 総 サ ン プ ル 数 4 の 二 項 分 布 と 対 数 に し た 二
3.5. 実 験 手 順
項 分 布 を 示 す . 図 4.1 の 二 項 分 布 は 危 険 率 10%検 定 で
実 験 に 使 用 す る 元 音 源 を 録 音 す る .録 音 し た 元 音 源
行っているため,信頼性が低い.
を 第 3 章 第 3 項 か ら 擬 似 3ch 化 す る 信 号 音 を 作 成 す る .
作 成 し た 信 号 音 を Adobe Audition を 用 い , 入 出 力 装 置
図 4.1 は 危 険 率 10%検 定 の 場 合 , 1 サ ン プ ル 又 は 5
(DSP)で 出 力 す る 信 号 音 を 選 択 し ,セ ラ ミ ッ ク 振 動 ス ピ
サンプルすなわち,全て同じ回答を示した場合,統計
ーカから信号音を出力する.出力した信号音は一対比
的仮説検定により仮説が成立することを示している.
較 法 を 用 い て ,被 験 者 は 2 回 の 信 号 音 の 内 ど ち ら が「 臨
ここでは,いずれかを判断できるかどうかを検定する
場感がある」かを比較し判断をする.
ため,全てを同じ回答をした場合,検定通過の対象と
な る . 以 上 の 検 定 か ら 10 代 の 方 と 70 代 の デ ー タ は 正
し い デ ー タ で は な い こ と が わ か る . し か し , 図 4.1 は
4. 実 験 結 果
危 険 率 10%検 定 を 行 っ て い る が 総 サ ン プ ル 数 が 4 と あ
4.1. 集 計
ま り に も 少 な い . そ の た め , 10 代 と 70 代 の 方 の 選 択
個 人 の 選 択 回 数 の 合 計 の 値 を 表 4.1 に 示 す .
回数の結果が,正しいデータではないという傾向があ
48
るという判断しかできない.この聴取実験では,総サ
4.3. 検 討
ンプル数よりも年代別の被験者を重要視している.そ
本 実 験 で は ,高 臨 場 感 を 得 る に は ch 数 の 数 が 多 く な け
こで,2 人のデータを外す判断は,全員分の選択回数
れ ば な ら な い の か の 傾 向 を 調 査 す る こ と で あ り , 1ch
の 合 計 を ,付 録 2 を 用 い た 危 険 率 0.1%検 定 し た 二 項 分
よ り も 2ch,3ch が「 高 臨 場 感 が あ る 」と い う 傾 向 の が
布で判断する.そして,2 人のデータで正しい結果が
見られた.音像が 1 つよりも左右にあったほうがよい
求められた方のデータは使用可能と判断する.
の で は な い か と 考 え ら る .し か し ,2ch,3ch と 多 少 ch
そ の 結 果 10 代 の 方 は 使 用 可 能 と 判 断 し , 70 代 の 方
数が増えた程度では,高臨場感の感じ方に差は無いと
は分析から外すこととする.被験者 4 人の二項分布を
考えられる.そして,ある一定の歳を越えたご老人に
図 4.2 に 示 す . 縦 軸 , 横 軸 , は 図 4.2 と 同 じ で あ る .
は,この傾向にみだれが生じる傾向があるのではない
縦線は使用可能な選択回数の値の限界値を示している.
かということが考えられる.
1
累積曲線
5. お わ り に
確率
0.8
本研究では,一般家庭のテレビなどで用いられてい
0.6
スコア
0.4
限界値
0.2
0
10
るトランスオーラル再生系で今までより,高臨場感を
1
1.5
2
0
2.5
得ることを目標としている.本卒業論文では,高臨場
3
sample
3.5
4
4.5
感 を 得 る に は ch 数 を 増 や さ な け れ ば な ら な い か の 調
5
査 が 目 的 で あ る .本 卒 業 論 文 で は , 1ch,2ch,3ch を
累積曲線
対象にし,一対比較法を用いた聴取実験を行い,選択
スコア
確率
10
10
限界値
-1
度数を用いての検証を行った.選択度数は「選ばれた
か ど う か 」で あ り「 数 値 そ の も の の 意 味 は な い 」た め ,
-2
検 証 は 傾 向 の 判 断 を 行 う こ と と す る . そ の 結 果 , 1ch
10
-3
1
1.5
2
2.5
3
sample
3.5
4
4.5
よ り も 2ch,3ch が「 高 臨 場 感 が あ る 」と い う 傾 向 の が
5
見 ら る . し か し , ch 数 が 2ch, 3ch と 多 少 増 え た 程 度
図 4.1 総 サ ン プ ル 数 4 の 二 項 分 布
で は 高 臨 場 感 の 感 じ 方 に 差 は な い と 考 え ら れ る .ま た ,
被 験 者 が 年 代 別 で あ っ て も 2ch,3ch の よ う に ,ス ピ ー
1
カは左右にあったほうが有効である傾向がみられるが,
0.8
ある一定の歳を越えたご老人には,この傾向にみだれ
確率
累積曲線
0.6
が生じる傾向があるのではないかということが考えら
限界値
0.4
限界値
れる.
スコア
0.2
限界値
0
2
4
6
8
10
12
14
文
16
累積曲線
0
10
確率
-1
10
スコア
限界値
限界値
-2
10
限界値
-3
10
-4
10
2
4
6
8
10
12
14
16
サンプル数
図 4.2
総 サ ン プ ル 数 16 の 二 項 分 布
選 択 度 数 を 表 4.2 に 示 し , 表 の 中 の 回 数 は 総 サ ン プ
ル 16 回 の う ち 何 回 選 択 し た か を 示 し て い る .
表 4.2
ch数
1ch
2ch
3ch
被験者 4 人の選択度数
1ch
8回/16回
3回/16回
1回/16回
2ch
13回/16回
8回/16回
5回/16回
献
[1] 総 務 省 , http://www.soumu.go.jp/
[2] NiCT
http://www2.nict.go.jp/p/p463/event/super_event_pr
esen/PDF/enami-ED.pdf
[3] 難 波 精 一 郎 , 桑 野 園 子 , ”音 の 評 価 の た め の 心 理
学 的 測 定 法 (書 ),”日 本 音 響 学 会 (編 ),pp86-94,(社 )
コ ロ ナ , 東 京 , 1998 年
[4] 難 波 精 一 郎 , 桑 野 園 子 , ”音 の 評 価 の た め の 心 理
学 的 測 定 法 (書 ),”日 本 音 響 学 会 (編 ),pp87-89,(社 )
コ ロ ナ , 東 京 , 1998 年
[5] 難 波 精 一 郎 , 桑 野 園 子 , ”音 の 評 価 の た め の 心 理
学 的 測 定 法 (書 ),”日 本 音 響 学 会 (編 ),pp92-93,(社 )
コ ロ ナ , 東 京 , 1998 年
[6] 城 戸 健 一 ,デ ィ ジ タ ル 信 号 処 理 入 門 (書 ),pp83,(社 )
丸 善 株 式 会 社 , 東 京 , 1985 年
[7] B.C.J.ム ー ア , 大 串 健 吾 (監 訳 ), pp223-226, 聴 覚
心 理 学 概 論 (書 ), 誠 信 書 房 (社 ), 東 京 , 1997 年
[8] セ ラ ミ ッ ク 振 動 ス ピ ー カ ,
http://www.saneihouse.co.jp/cemi/index.html
3ch
15回/16回
11回/16回
8回/16回
49