第2章 関連研究

第2章
2.1
関連研究
はじめに
この章では,オンライン交渉における擬人化エージェントを作るために必要となる,
従来のオンライン交渉と擬人化エージェントについての研究を説明し,その問題点を
述べる.次に,擬人化エージェントの表情表出を考えるために,人間の表情の表出方
法および表情の種類の分類について,心理学や脳生理学の研究を基に述べる.さらに,
対人関係の感情を考慮した心理モデルである ABX モデルと,プレイヤ間に感情を用い
て行動を推測するソフトゲーム理論,および,確率モデルであるベイジアンネットワー
クについて述べる.
2.2
オンライン交渉
オンライン交渉とは,コンピュータを利用してネットワークを介して実施する交渉
である.図 2.1 はオンライン交渉の構成を示したものである.交渉参加者はクライア
ントツールを用いて,サーバを介して提案や意見を交換する.さらに必要に応じて画
像や詳細なデータ等を交換し,交渉を進めていく.ネットワーク上での交渉の研究に
ついては,交渉システムや交渉プロトコルなどのネットワークを用いて交渉するため
の手段やツールについての研究 [Lo 99, Kersten 97, Kersten 98] や,提案だけでなく評
価値や選好を入力することにより,ユーザの好みを反映した交渉をすることを目指す
研究 [新田 98a] がある.また,ゲーム理論的な考察から最適な提案を探る理論的研究
[Soo 00, Fatima 02],相手の交渉モデルを作成する研究 [Mudgal 00] などがある.
ここでは,代表的なオンライン交渉の例として,GUI で作成されたツールを用いて提案
や価格,効用値等の情報の提示や交換をする InterNEG[Lo 99, Kersten 97, Kersten 98]
の例を示す.InterNEG では,A と B の二者間で商品の売買をする場合,交渉提案は売
り手 A と買い手 B の双方から交互に提示されるものとする.
「価格」「保証」といった
交渉のパラメータに対して,あらかじめ重要度を入力する.なお,交渉の相手にはこ
5
図 2.1: オンライン交渉の構成
の重要度は見えないようになっている.そして,このような重要度の入力の後,提案
の交換が実施される.提案は「 価格は $ 220, 000, 保証期間は 6ヶ月 として売りた
い」という形式をとる.システムは各ユーザに対してお互いの提案を表示する.また,
あらかじめ入力した重要度から提案の効用値を計算し,これを提示する.そして,こ
の効用値は,図 2.2 のようなグラフの点として表示される.図 2.2 は,売り手から見た
提案の効用値を図示してあり,X0, X2, X4, ... は売り手による提案,X1, X3, X5, ... は
買い手による提案を示している.ユーザはこのグラフを見ることで,自分がどのくら
い妥協しているときに相手がどのくらい妥協しているか等を判断し,次の提案を決め
ていく.そして,図 2.2 のように効用値の差は交渉回数とともに減少していき,やがて
違いが無くなり,合意に達する.
多くの交渉支援ツールでは,このように効用値を用い,各ユーザに対してより高い
効用値を持つ提案で合意に至ることができるように,次の適切な提案を助言する.
実際の交渉では,交渉当事者自身の感情や相手の態度から生じる感情などの要素に
より,交渉の状況が変わる場合があるが,多くのシステムではこのような非言語情報
等による感情のやり取りを扱っていない.感情をやり取りするための手段のひとつと
して,擬人化エージェントによる表情を用いて,これを交換することが考えられる.
6
図 2.2: オンライン交渉における効用値の変化の例(売り手側)
2.3
表情の表出
様々な研究により,人間の表情の表出には二種類があるとされている [Ekman 87,
Ekman 92].一つは,自然に表出される表情であり,意図せずに無意識に思わず出して
しまうような表情である.この表情は,本当に感じているありのままの表情であり,意
図や思考とは無関係に表出される.もう一つは,意識的に表出する表情であり,心理
状態の他に目的や戦略を反映しているものである.たとえば,何かショッキングなこと
があったときに,隠すことのできない驚きの表情が自然な表情である.一方,相手か
ら悲しい知らせを受け取って本当は悲しいのだが,相手に対しては笑顔を見せる,と
いうのが意図的表情である.
このように表情の表出方法を大別できることは,脳損傷を受けた人が片方の表情の
表出が困難になる,という事例から述べることができる [Rinn 84, 岡田 01].また,脳
解剖学の研究から,情動の発生には二つの情報処理プロセスがあるが関与するとされ
ていること [海保 00] 等から説明される.情報処理プロセスの一つは大雑把で迅速な自
動的評価プロセスであり,もう一つはより高次な思考や記憶がからむ複雑で意識の介
在する評価プロセスがあるとされている.これらの情動の発生と二種類の表情の表出
が関連していると予想できる.
なお,Ekman は二種類の表情の違いについて詳しく研究している.自然な表情と意
図的な表情では用いる筋肉が違うため,微妙に作られる表情が違うことを述べている
[Ekman 92].例えば,意図的な愛想笑いは,本物の喜びの微笑みをつくる筋肉とは違
う筋肉でつくられている [Pinker 03].しかし,見た目でその違いを見分けることは極
めて難しい.また,自動的に表出されてしまう自然な表情を意図的な表情で隠そうと
7
した場合,隠すまでの時間は非常に短いため,区別することは大変困難である.この
ため,状況などの文脈に関する情報をもとに表情を識別することが必要である.さら
に識別が困難なことを利用し,状況に応じて意図的な表情を使うことで,相手から有
利になれる状況も作り出せる可能性がある.
コミュニケーションにおいて,隠したほうが有利になれる可能性がある正直な表情
がなぜ存在しているのか,なぜ偽物の表情ばかりを使い合うことにならないのか,に
ついては諸説ある.Pinker は,進化の過程で見せかけの表情をあらわす人が正直に感
情をあらわす人を駆逐してしまわないことについて述べている [Pinker 03].それによ
れば,不随意に表出される正直な表情によって自分がどのような状態であるかを示す
ことで,その感情が本物であると相手に信じさせることができ,それに伴う発言や行
動の真意も相手に伝えられることが理由であるとしている.
相手の顔を見たときに「喜びの顔」や「悲しそうな顔」をしているという表情の分類に
ついての研究がされている.表情の分類の方法と種類については議論が続いてきたが,お
おむね7±2の基本表情があると多くの研究者は述べている [乾 01].中でも,Ekman の
六つの基本表情,
「喜び,悲しみ,怒り,驚き,恐れ,嫌悪」は最も広く知られている表情分
類である [Ekman 87, Ekman 92, 乾 01].表情を分類するとき,各々の表情の間になんら
かの関係性や連続性があるかどうかについて議論がされている.表情の間に関係がある
と考える研究者は,表情間の連続性を説明できる心理次元の存在を仮定し,その心理次元
によって表情が分類されると考えている.具体的には,被験者に対して様々な表情の写真
を見せ,それについて類似性を判断させたり,SD 法によって評価させる等の実験により
意味次元を導いている.この次元的な考え方は,Woodworth,Schlosberg,Russell によっ
て研究されている [Woodworth 38, Schlosberg 52, Russell 97a, Russell 85].Schlosberg
は,
「快-不快」および「注意-拒否」といった感情的意味次元からなる空間に,6つの基
本的情動カテゴリーが円環的に配置される二次元空間モデルを提案している.Russell
は,
「快-不快」と「覚醒-睡眠」を基本的な感情的意味次元とした,図 2.3 のような次元
空間モデルを提案している.図 2.3 では,たとえば,嬉しい表情は快で覚醒の程度が高
いとき,悲しい表情は不快で覚醒の程度が低いときに分類されている.
なお,これらは連続的にカテゴリ分けをしているため,次元空間上で近いものは,混
同しやすいといえる.Schlosberg や Russell のモデルから,
「嫌悪」と「怒り」,
「驚き」
と「恐れ」の表情が似ていることが読み取れる.Ekman らの研究でも,この混同が指
8
図 2.3: Russell による表情の位置付け(Russell 1985 を簡略化)
摘されている.この混同は,
「快-不快」や「覚醒-睡眠」の次元を細かく観察することや,
新しくパラメータを導入し三つ目の次元を用いること等により解消すると考えられる.
このように表情を分類したときの「快-不快」「注意-拒否」「覚醒-睡眠」の感情次元
は,他の表情研究で確認されている.この快や覚醒といった次元は,表情に限らず,人
間が何かを見たとき等にも判断される一般的特徴でもある [Reeves 01, 海保 00].
以上のように,ここでは従来研究から,人間が表出する表情には二種類あることと,
表情の代表的な分類,表情を受け取ったときに主に快-不快の感情次元が現れることに
ついて述べた.表情によって快-不快の次元が現れることは重要であり,表情を受け取っ
たときの影響を快-不快で評価し利用することができる.
2.4
擬人化エージェント
IT 技術の普及により,様々な人が多様な用途でコンピュータを扱う必要性が高まっ
ている.しかし,子供や高齢者は,キーボードの扱いに慣れていなかったり,専門用
語や基礎知識を覚えるのが苦手であったりと,コンピュータの操作がうまくできない
ことがある.コンピュータに不慣れな人がやさしく扱えるようにするために,ディス
プレイ上に CG によって人間を模したキャラクタを登場させたり,さらに音声による
対話をさせたりすることで,ユーザの負担を減らすことを目指した擬人化エージェン
9
トインタフェースが開発されている.
擬人化エージェントの例としては,Web サイトの内容を読み上げるエージェントや
自動的プレゼンテーションをするエージェントなどがある.MPML[筒井 00] は擬人化
エージェントを容易に動作させるためのスクリプト言語であり,あらかじめ動作やイン
タラクションの内容を記述しておくことで,Web のガイドをさせたり,プレゼンテー
ションをさせたりすることができる.ニューロベビー [Tosa 95, Tosa 96] は,話す相手
の言葉の強さやイントネーションから感情を感じ取り,喜びや悲しみの表情を示すこ
とによりコミュニケーションを図るものである.より対話的な擬人化エージェントの研
究として,文字による簡単な会話ができるようにした車の販売をするセールスエージェ
ントや,教師の役割をするエージェントの開発を目指す Extempo1 ,Adele[Shaw 99] な
どがある.他に,人間の表情や仕草の変化を代理するものもあり,たとえば,Pala2 は
ネット参加者同士のコミュニケーションに,CG による参加者の分身を用い,その表情
や仕草を変化させることでコミュニケーションを豊かにするものである.FaceMail3 は,
メールの文章に書かれた絵文字や記号を基に,表情を変化させながらメールを読み上
げるものである.
擬人化エージェントの表情を表出させるための感情モデルでは,Cathexis モデル
[Velasquez 97] や OCC モデル [Ortony 88],Picard による HMM を用いたモデル [Picard 95]
などがある.
• Cathexis モデル
Cathexis モデルは,感情はいくつかの基本的な行動を支配するプロト−スペシャ
リストの集まりであるとするミンスキーの考え方 [Minsky 86] を基にしている.
複数のプロト−スペシャリストが内外からの刺激によって活性化され,ある値が
スレショールド値を超えたときに,特定の感情が表れると考える.簡単に言うと
「空腹」が「食べ物を求める」という行動を導くということである.
図 2.4 に Cathexis モデルのアーキテクチャを示す.Cathexis モデルは,ドライブ
(衝動)システム,感情生成システム,振舞いシステムから成り立つ.
ドライブシステムは「誘発因子 (Releaser)」の集合から成り立つ.これは,内外
1
http://www.extempo.com/
http://www.pala.jp/
3
http://www.lifefx.com/
2
10
図 2.4: Cathexis モデル [Velasquez 97]
の刺激を捉えるセンサであり,センサ値を測定し,スレショールド値やエラー値
であるかの判定をする.
感情生成システムでは,特徴を持った類似の状態を一つの「感情」と考え,それ
を生起させる.
「恐れ」や「パニック」など(fright, fear, terror, panic)を一つの
感情として,一つのプロト−スペシャリストを対応づける.それぞれの感情は,
独自のメカニズムと特性を持ち,表現,振る舞い,生理指標などの類似性を持
つ.モデルでは,anger, fear, distress(sadness), enjoyment(happyiness), disgust,
surprised の6つが基本的な感情としている.また,各プロト−スペシャリスト
ごとにそれぞれの減衰関数を持っており,感情が生起した後はそのプロト−スペ
シャリストに入力がない限り,その強度は減少していくとする.
そして,振る舞いシステムによって行動が選択される.行動の選択は誘発因子に
よって評価され,それが最大となるものが実際に行動する.
Velasquez は Cathexis モデルを具体的に Simon the toddler というコンピュータ
上に再現した幼児のシミュレータに実装した.これは,たとえば,遊びたいこと
を望むときに,おもちゃがあれば HAPPY の表情を出す.空腹のときに食べ物が
無ければ distress の状態になり,これが続くと ANGRY か SAD の表情になる.も
し空腹が満たされれば,ANGRY と SAD のレベルが下がり,HAPPY の表情に
なる.Simon は5つのプロト−スペシャリスト(「空腹」
「渇き」
「体温調節」
「興
11
図 2.5: OCC モデル (一部抜粋) [Picard 95]
味」
「疲労」)と6つの感情のプロト−スペシャリストを持ち,15 の行動をもって
いる.
• OCC モデル
OCC モデルは,感情の分類に焦点が当てられていて,感情は 22 のタイプに分類
されている.オブジェクトやエージェント,イベントなどにより状況を分類し,
プラスまたはマイナスの組で感情を考える.
OCC モデルは,感情のタイプを生成するためのルールベースシステムを持ってい
る.例として,
「joy」を考えてみる.D(p, e, t) を,
「時間 t における人間 p の持つイ
ベント e の望ましさ」であり,もしイベントが価値のある結果であったらプラスの
値,イベントが有害なものであったらマイナスの値を返すものとする.Pj (p, e, t)
は、joy の状態を生成するためのポテンシャルとする.
Ij というインテンシティを考え,Tj という閾値が与えられているとすると,次の
ようになる.
12
図 2.6: HMM による感情表出モデル [Picard 95]
IF
T HEN
ELSE
Pj (p, e, t) > Tj (p, t)
set
set
Ij (p, e, t) = Pj (p, e, t) − Tj (p, t)
Ij (p, e, t) = 0
ある p の,ある時間 t における joy に関する,ある閾値 Tj (p, t) を越えたときのみ
Ij は値を持つ.この joy の例はシンプルであるが,OCC モデルは、追加された
感情を発火させることや,繰り返し同じ感情を発火させることを許している.た
とえば,著しく激しい感情が抑えているものが,新しい感情を引き起こす場合が
ある.
• HMM による感情表出モデル
Picard は,直接観測できない感情の複数の状態を仮定し,外部刺激によって確率
的に遷移するモデルについて述べている.図 2.6 は,観測できない joy,distress,
interest の状態とその遷移を示している.Pr は遷移確率を示しており,P r(J | D)
は,Distress の状態から Joy の状態に遷移する確率である.O は表出を示しており,
O のパラメータである V は感情的表出や変化であり,たとえば声の抑揚や表情,
あるいは脈拍など自律的に変化するものを示す.V が表情であれば,O(V | D)
は Distress の状態であるときに,その表情が変化する確率といえる.
Cathexis モデルでは神経生理学や脳生理学などに基づき,人間に近い感情と表情や
仕草の表出を作成している.OCC モデルや Picard のモデルでも,内部に人間が持つ
であろう感情の状態を持たせ,感情を表出させている.本研究では,オンライン交渉
13
において動作するエージェントを作成するのが目的であるため,人間に近い感情や仕
組みのすべては必要ではない.Cathexis モデルでは,外界のセンサや環境として,
「空
腹」や「睡眠」といったパラメータを用意している.しかし,オンライン交渉では,外
部からの刺激として提案と表情しか用いることができないため,オンライン交渉エー
ジェントでは不要である.内部の時間的変化を考慮し,たとえば,
「怒った表情」から
「冷静な表情」に変化することも考えられるが,オンライン交渉では,相手に対して見
せている表情であるため,相手からの刺激によって変化することを優先させることで,
対人としての表情の効果を強めることができると考える.そして,交渉においては,交
渉特有の心理状態を考える必要があると考えられる.これらの点から,交渉において
は,従来の Cathexis モデルや OCC モデル,Picard のモデルをそのまま用いることは
適切ではない.オンライン交渉では特に対人関係に注目するモデルであることが望ま
れる.次では,対人関係の心理モデルである ABX モデルを述べる.
2.5
対人関係の心理モデル
人間は日常生活の中で,整合性や一貫性のあるものを好ましいと考え,そうでない
ものは除去しようと試みる傾向がある.たとえば,自分が最も好きな画家に対して,友
人や知人もその画家が好きであってほしいと思う.しかし,ある友人がその画家のこ
とが嫌いであるときには,その友人に画家の魅力を説明し,好きになるように説得す
るかもしれない.しかし,説得が失敗し,そのことが原因で二人の仲が悪くなってし
まうこともあるかもしれない.あるいは,仲が悪かった二人が,同じサッカーチーム
の熱烈なファンであることがわかると,それがきっかけで仲がよくなる,ということ
があるかもしれない.だが,逆に「あんな奴が好きなサッカーチームを,これからも
応援することはできない」と,それまで好きだったサッカーチームのことが嫌いになっ
てしまうこともあるかもしれない.
このように,私達は一貫性の無いものに直面すると,それを除去しようとするか,低減
しようと努力する.心理学や社会学の分野では,この人間の非整合性の処理の仕方につい
ての研究がなされており,それらを一括してバランス理論と呼ぶことがある [Taylor 78].
ここでは,ハイダーとニューカムによるバランス理論 [Newcomb 53, 齊藤 87] に関する
モデルについて述べる.
ハイダーのモデルでは,二人の人間 A,B が,ある一つの対象 X について取り扱っ
14
図 2.7: A の視点によるバランス状態とアンバランス状態
ていると考える.このときに,A と B のそれぞれが対象 X について好意や嫌悪または
因果関係を持つ.さらに,A と B の間でも相手に対して好意や嫌悪といった感情も持
つ.ハイダーは,これらの A,B が持つ対象や相手に対する感情を「肯定的な感情」と
「否定的な感情」に二極化している.また,ここでの感情は,焦点となる人物の視点か
ら捉えられたものとしている.A からの視点で見たとき,
「B から X への感情」は焦点
となる人物 A からの知覚になる.Aからの視点のみで捉えたときの (a)A の B に対す
る感情,(b)A の X に対する感情,(c)B の X に対する感情,という三種類の関係を図示
したものが図 2.7 である.図 2.7 では,一方が他方に対し肯定的な感情を持つときを+
符号,否定的な感情を持つときを−符号付きの矢印で示す.図の通り,三者の関係は
8つの状態(2×2×2)で表現され,バランス状態とアンバランス状態に二分されると
考える.たとえば,バランス状態とは,A と親しい B が同じ画家 X を共に支持してい
る状態(図 2.7 の (5)),アンバランス状態とは,A と親しい B が政党 X を支持してい
ない状態(図 2.7 の (2))などである.
前述のように,人間はアンバランス状態よりもバランス状態を好む.アンバランス
状態では,いわば不快,不愉快な状態であり,バランスを達成しようとする力あるい
は緊張が生じ,図 2.8 のように,いずれかの矢印の符号を変更しバランス状態に向か
おうとする.たとえば,(2) は,A はその対象 X に対しても B に対しても肯定的だが,
B は X へ否定的な感情を持っている状態である.この状態はアンバランス状態なので,
(5) または (8) のバランス状態に向かおうとする.もし B の X への感情が肯定的になっ
たとき,BX 間の符号が変わり,(5) のバランス状態に達する.しかし,A が B に否定
15
図 2.8: アンバランス状態からバランス状態への変化の例
図 2.9: ニューカムの ABX モデル
的になった場合,状態は (8) になる.前述の画家の例で言えば,はじめは,A と B の仲
は良いとすると,A は画家のことが好きだが,B は画家のことが嫌いな状態が (2) であ
る.そして,たとえば,A が B に対して画家を好きになるように説得しそれに成功し
たときには,(5) になる.しかし,このことが原因で仲が悪くなってしまった場合は,
(8) の状態になる.同様に,(3) は A も B が X に対して肯定的だが,A はその B に否定
的な感情を持つ状態である.そして,A が B に肯定的になったときには (5) に,あるい
は X への感情が否定的に変わったときは (6) になる.サッカーチームの例で言うと,A
は B のことが嫌いだが,A も B もサッカーチーム X のファンである状態が (3) である.
そして,同じファンであることがきっかけで仲が良くなる状態が (5) であり,A がチー
ムのことを嫌ってしまうようになる状態が (6) である.このように,ABX 間で矢印と
16
符号で示すことで三者の関係とその後の傾向を示すことができる.
ニューカムはバランス理論をさらに発展させた.ABX 間を,(a)A が B に感じる魅
力,(b)B が A に感じる魅力,(c)A の X に対する態度,(d)B の X に対する態度,とい
う4種類の関係で捉える.
X に対する焦点人物の方向付けは,態度とし評価的な方向付けとした.人間間は魅
力とし感情的な方向付けとした.そして,それらの魅力や態度を符号だけでなく強さ
で示した.A-X,B-X の尺度に差があると安定状態しているとは考えない.ニューカ
ムのモデルを示したものが図 2.9 になる.ニューカムのモデルでは,アンバランス状態
であったときには,A と B が X に関する情報の受信と送信というコミュニケーション
によってバランス状態へ変化すると考える.
このように,ABX モデルを用いることで,ある物への客観的な評価だけでなく,そ
れを介する人との人間関係を考慮した社会的関係の記述ができる.交渉に用いるとす
ると,提案を X とし交渉参加者を A と B とすることで,交渉における三者の関係を示
すことができる.
2.6
ソフトゲーム理論
ソフトゲーム理論は,囚人のジレンマの状況のような意思決定状況にある二者が,相
手に対する感情を持っていると想定し,そのときの意思決定行動を取り扱ったもので
ある [Howard 90, 猪原 02b, 猪原 02a, 木嶋 01].
通常のゲーム理論では,プレイヤ同士の間の感情的な関係については考慮していな
い.しかし,現実の意思決定状況では,相手に好感を持っているかどうか,好きか嫌
いか,といった感情的な関係がプレイヤ間に存在することがある.そして,そのよう
な感情的な関係が意思決定に影響を与える可能性がある.たとえば,好感を持てる相
手とともに意思決定をしなければならないとき,その相手にとって望ましいことをし
ようとする,というような「献身的な行動」をとるかもしれない.逆に,嫌いな相手
と意思決定をしなければならないとき,相手の望むことをあまり考慮せず,
「敵対的な
行動」をとるかもしれない.このように相手との感情的な関係により,プレイヤの意
思決定を大きくかわる可能性がある.そのため,ソフトゲーム理論では,相手の望む
ことに対して「献身的な行動をとる」あるいは「敵対的な行動をとる」ということの
予想に,プレイヤの持っている感情を用いている.
17
自分
交換情報
(C,C),D
(C,D),C
(C,D),D
(D,D),D
表 2.1: 囚人のジレンマの利得行列
相手
協力 C(黙秘) 非協力 D(自白)
協力 C(黙秘)
3,3
1,4
非協力 D(自白)
4,1
2,2
表 2.2: 囚人のジレンマにおける交換情報,約束,脅し
約束の誘惑 脅しの誘惑 肯定的感情を持つとき 否定的感情を持つとき
(D,C)
なし
(C,C),D
(D,C),D
(D,D)
(D,C)
(C,D),D
(D,D),C
(D,D)
なし
(C,D),D
(D,D),D
なし
なし
(D,D),D
(D,D),D
さらに,献身的あるいは敵対的な行動をするためには,相手のプレイヤが望むこと
を知る必要がある.プレイヤの望むこと,すなわち,各プレイヤがどの結果を導きたい
と考えているかを知るためには,どうしても情報交換が必要である.通常,囚人のジ
レンマやチキンゲームの状況などの意思決定状況では,当事者同士の事前の情報交換
を考慮しない.しかし,ソフトゲーム理論では,相手プレイヤの望むことを知るため
に,当事者が戦略を選択する前に,情報を交換する機会が与えられているとする.た
とえば,
「あなたが協力するならば,私は協力します,そうでなければ私は協力しませ
ん」ということをあらかじめお互いに宣言し,その後,実際に意思決定をすることを
想定している.
事前に交換される情報は,
「約束」と「脅し」から成り立つ.たとえば,
「あなたが協
力するならば,私は協力します,そうでなければ私は協力しません」という事前情報
では,
「あなたが協力するならば,私は協力します」の部分は「約束」であり,
「そうで
なければ(あなたが協力しないならば)私は協力しません」の部分は,
「脅し」である.
表 2.1 は,囚人のジレンマの状況を示したものである.このときの交換情報は,表
2.2 の1列目になる.たとえば,これらの表における「(C,C),D」は,交換情報「あな
たが協力するならば,私は協力します,そうでなければ私は協力しません」という意
味を示す.
情報を受け取った側は,受け取った情報と与えられた状況からその情報が信じるこ
とができるかどうかを判断する.約束の場合は,
「約束に対する誘惑」の有無によって
信頼性が評価される.
「約束に対する誘惑」とは,約束よりも好ましい戦略である.約
束を述べた主体が約束を守らないことで,この戦略が選択される可能性があり,誘惑が
18
存在する約束は信頼性が低い.たとえば「(C,C),D」は,
「あなたが協力するなら,私も
協力する」という約束であるが,
「あなたが協力するなら,私も協力する」の言葉に素
直に従って協力したとしても,相手は協力せずに裏切る (= D,C) かもしれない,とい
う誘惑がある.このような約束は信じることができない.同様に,脅しに対する誘惑
とは,脅しよりも好ましくない戦略である.誘惑が存在する脅しも信頼性が低い.な
お,約束,脅しには誘惑が存在しないときもあり,このときは,その約束と脅しは信
じることができる.表 2.2 の2列目と3列目は囚人のジレンマにおける誘惑と脅しを示
してある.
そして,ソフトゲーム理論では,主体は相手に対して肯定的な感情または否定的な
感情のどちらかを持つものとする.この感情はゲームにおいて変化するものではなく,
ゲームの始めから主体があらかじめ持っているものとする.さらに「肯定的な感情は,
誘惑を持つ約束に信頼性を与える」,
「否定的な感情は,誘惑を持つ脅しに信頼性を与
える」とする.これにより,相手が「(C,C),D」の情報を伝え,肯定的感情を持ってい
るときには,たとえ誘惑があったとしても,
「あなたが協力するなら私も協力する」と
いう約束を信じることができる.しかし,否定的感情を持っているときは,約束を信
じることはできない.つまり,相手に肯定的感情を持っている場合と否定的感情を持っ
ている場合によって,情報の信頼性が異なるとする.肯定的感情あるいは否定的感情
を持つときに信じることのできる情報を表 2.2 の4列目と5列目に示す.
交換された情報の信頼性が評価された後で,次に主体は戦略を選択する.主体が双
方が良い感情を持っているときには,誘惑が消え,相手の情報を信じることができ協
調行動ができる.よって,良い意思決定のためには,主体間の感情を良い状態に保つ
ことが必要である.たとえば,良い表情をお互いに表出することで,お互いの感情を
良くし,協力することも考えられる.
2.7
ベイジアンネットワーク
私達は,すべての状況を完全に把握せずに,限られた証拠から予想をたてて行動を
する場合がある.たとえば,カードゲームのポーカーでは相手がどのカードを持って
いるかわからないが,相手の顔色や賭けた金の額から相手の手札の良し悪しを推測し
て,自分が勝負に出るかどうかを判断する場合がある.このような場合に,確定して
いない状況を確率で示し,その因果関係を用いて物事を推測することを表現したもの
19
が,ベイジアンネットワークである [Pearl 88, Russell 97b, 本村 00].ここでは,ベイ
ジアンネットワークの構成要素である確率変数,条件付確率,グラフ構造について説
明し,多重リンクを持つときの解決方法であるクラスタリング法について説明する.
まず,確率変数と条件付確率について説明する.ゲームにおけるユーザの意図や将
来の天気などの不確定な対象を確率変数 A とする.この変数の取りうる状態を,a1 ,
a2 ,…とする.二つの確率変数 A と B があり,依存関係があるとする.たとえば,B の
要素である b1 の状態が成り立つときに,必ず a1 ,a2 が成り立つとき,A は B に依存し
ているという.たとえば,ポーカーで「良い手札を持っていると(b1 ),表情が明るく
なる(a1 )」ことや「良い手札を持っていると(b1 ),賭ける金額が増える(a2 )」こと
は,表情や賭け金は手札の良し悪しに依存しているといえる.しかし,たとえば,その
人の気分や体調によって表情の変化が出なくなったり,賭ける金額が変化したりする
かもしれない.このような予期できない原因によって,この依存関係は成立しない場
合があるかもしれない.このような不確実な場合を定量的に表すため,
「B = b1 である
ときの A = a1 であること」は確率的に起こることとし,これを「P (A = a1 | B = b1 )」
で示す.これを条件付確率と呼ぶ.そして,A の状態に対する B の状態における全て
の条件付確率を「条件付確率表」によって表す.この表により,B がある状態であると
きの A の状態の存在確率を知ることができる.
条件付確率をポーカーを例にして説明する.カードが配れたとき,相手の手札の良し
悪しの確率変数を C とする.相手の手札が良い確率が 70%であると予想したとき,以
下のように表す.
P (C) = 0.7
(2.1)
表情が明るくなるときの確率変数を F,賭け金が多くなるときの確率変数を M とす
る.手札が良くて表情が明るくなる確率を 80%,手札が良くて賭け金が多くなる確率
を 50%とすると条件付確率は,以下のように表記する.
P (F | C) = 0.8
(2.2)
P (M | C) = 0.5
(2.3)
次に,グラフ構造について述べる.ベイジアンネットワークでは,変数間の依存関係
を図 2.10 のようにノード,リンクで図示することができる.あるノード X からノード
Y への矢印の直感的な意味は,X が Y に直接的影響を及ぼすということである.ノー
20
ドの親とは,そのノードを矢印によって指すすべてのノードである.各ノードは親ノー
ドがそのノードへ及ぼす影響を示した条件付確率表を持つ.
さらに,ベイジアンネットワークでは,既知の確率から,ネット上の求めたい確率
を得たいときには,以下のベイズ規則を用いることができる.
P (C | F ) =
P (F | C)P (C)
P (F )
(2.4)
P (C),P (F ),P (F | C) の確率がわかっているときに,P (C | F ) の確率を得ること
ができる.つまり,手札に依存せずに表情が明るくなる確率 P (F ),手札が良い確率
P (C),手札が良かったときに表情が明るく確率 P (F | C) から,表情が明るくなった
ときに手札が良かった確率 P (C | F ) がわかる.このように不完全な情報しかない状況
でも得られる証拠から,未知の状態を推測することができる.
ベイジアンネットワークでは,ネットを図示することで依存関係を明確にでき,複雑
な確率的な関係を持つものの推論もできる.ただし,二個のノードが二本以上の経路
で結合されている多重結合を持つ構造では,計算が困難になる [Pearl 88, Russell 97b].
これが生じるのは,ある変数に対して二つ以上の可能な原因が存在し,それらの原因
が共通の原因を共有している場合である.図 2.11 は,
「手札が良かったときに,表情が
明るくなり,また賭け金が多くなり,相手の手札の良し悪しを判断する」ことを示した
例である.この例は,手札が良くて,表情が明るくなり,それにより相手が有利である
かどうか判断する場合と,手札が良くて,賭け金が多くなることによって,相手が有
利であるか判断する場合の両方があることを示している.多重結合の構造を持つとき
の計算方法として,クラスタリング法やカットセット条件付け法,確率論的シミュレー
ション法等がある [Pearl 88, Russell 97b].クラスタリング法について示したものが図
図 2.10: ベイジアンネットワーク
21
図 2.11: 多重リンクを持つネットワーク
図 2.12: クラスタ化したネットワーク
2.12 である.この方法は,ノードをまとめて大きいノードを作るものである.図 2.12
では,表情が明るくなる場合と賭け金が多くなる場合を「表情が明るくなり(T),賭け
金が多くなる(T)」「表情が明るくなり(T),賭け金が多くない(F)」「表情が変わら
ずに(F),賭け金が多くなる(T)」「表情が変わらずに(F),賭け金が多くない(F)」
にまとめ,TT,TF,FT, FF という場合を作り,これらの確率を計算に用いる.こ
うすることで,通常の確率計算ができるようになる.
ベイジアンネットワークを用いた例としては,たとえば,医療診断システム [Jensen 96,
Kappen 99] や,マイクロソフトの OS に用いられている Office アシスタント [Horvitz 98]
がある.ロボットの収集する不確実なセンサデータの処理やプランニングなどの問題
をモデル化するためにベイジアンネットを用いる研究等もある [稲邑 02].
2.8
まとめ
この章では,オンライン交渉と擬人化エージェントの研究と問題点,表情の表出と
分類の研究,対人関係の心理モデルとして ABX モデル,ソフトゲーム理論,ベイジア
22
ンネットワークについて述べた.オンライン交渉については,交渉参加者は効用値を
交換し交渉を進めていくのみで,交渉において大切な非言語情報のやり取りが含まれ
ていない.擬人化エージェントの表情のやり取り等を付加することで,コミュニケー
ションをより良くできる可能性がある.擬人化エージェントについては,その表情や
仕草の動作が不十分であり,表情をさらに活用する必要がある.表情については,自
然な表出である一次的表情と,意図的に表出する二次的表情があることを述べた.本
論文では,これらを二つに分け,3 章では一次的表情の表出について,4 章では二次的
表情の表出について,それぞれ述べる.特に一次的表情の表出では,相手への感情を
含めて相手を評価するモデルである ABX モデルとベイジアンネットワークを用い,一
次的表情の表出モデルを作成する.さらに,一次的表情と二次的表情をどのように使
うかについて,ゲーム理論を用いて考察する.
23