展開形ゲーム/部分ゲーム完全均衡

駒澤大学ゲーム理論A
第十一回
早稲田大学高等研究所
上條 良夫
1
講義のキーワード
• 展開形ゲームの戦略の数(前回の続き)
• 展開形ゲームを標準形ゲームにしたゲームの
Nash 均衡の奇妙な点 ・・・ 信憑性のない脅し
• 部分ゲーム
• 部分ゲーム完全均衡
• 完全情報ゲームとバックワードインダクション
2
後出しじゃんけんゲーム
Player 2
g
c
0,0
1,-1
p
-1,1
g
g
c
Player 1
c
-1,1
0,0
p
1,-1
p
Player 2
g
c
1,-1
-1,1
p
0,0
3
後出しじゃんけんゲーム
Player 2
g
c
p
g
g
c
Player 1
c
p
p
Player 2
g
c
p
0,0
1,-1
-1,1
-1,1
0,0
1,-1
1,-1
-1,1
Player 1の戦略集合
{g, c, p}
Player 2の戦略集合
{ggg, ggc, ggp,
gcg, gcc, gcp,
gpg, gpc, gpp,
cgg, cgc, cgp,
…
ppg, ppc, ppp}
3*3*3 = 27通り
0,0
4
強盗のハッタリ
• あなたが経営する個人商店に、爆弾を抱えた不審な男が侵
入してきた。
• 不審な男 「レジの中の金をよこせ。もし通報したらこの爆弾
を爆発させるぞ」
• さて、あなたは男の要求に従いお金を払うべきだろうか、そ
れともすぐに警察に通報するべきだろうか。
• レジの中には100万円はいっており、男の爆弾はどうも本物
のようだ。
• 100万円を渡すと、あなたの利得は-100。強盗の利得は
100である。
• 爆弾が爆発すると、利得に換算すると -200。
5
• 展開形ゲームは次のようになる。
強盗
爆発させない
-100,100
金を渡す
爆発
あなた
爆発させない
通報
強盗
爆発
-300,-100
0,0
-200,-200
6
• 標準形に直して、Nash 均衡を導出する。
強盗
爆発させない
金を渡す
爆発
あなた
爆発させない
通報
強盗
t:爆発させない
b:爆発
金
tt
tb
bt
bb
-1,1
-1,1
-3,-1
-3,-1
-2,-2
0,0
-2,-2
通報 0,0
00 は省略
爆発
-100,100
-300,-100
0,0
-200,-200
Nash 均衡は
(金, tb), (通報,tt), (通報, bt)
7
• Nash 均衡 (金, tb) を考察してみよう。
強盗
t
-100,100
• 強盗は、あなたが通
報したら、爆弾を爆
発させるといっている。
金
あなた
b
t
通報
強盗
b
-300,-100
0,0
• 強盗の発言を信じれ
ば、あなたの「金を渡
す」という選択は合理
的
• では、強盗の発言を
-200,-200
信じることに合理性
はあるのだろうか?
8
• Nash 均衡 (金, tb) を考察してみよう。
-100,100
t
強盗
• あなたが通報した後
のゲームを考えてみ
よう。
金
あなた
b
-300,-100
t
通報
強盗
b
強盗の「爆弾を爆発さ
せる」発言は疑わしい。
0,0
信憑性のない脅しであ
る。
-200,-200
9
• つまり、ナッシュ均衡 (金、tb) は「信憑性の無
い脅し」をもとに構成されている。
• 信憑性の無い脅しを含んでいるような均衡は、
ゲーム理論の想定するようなプレイヤーの合
理性を十分に反映しているとは言いがたい。
• しかし、展開形ゲームを標準形ゲームに変換
し、それに Nash 均衡を適用する、という手順
では、「信憑性の無い脅し」均衡を排除するこ
とが出来ないのである。
10
部分ゲーム完全均衡
• 「信憑性の無い脅し」均衡を排除するための、
展開形ゲームにおける新しい均衡概念。
• といっても、基本的には Nash 均衡のアイデ
アと同じ。
• ポイントは、Nash 均衡であることを、すべて
の部分ゲームにおいて要請することである。
11
• 部分ゲームとは、もとの展開形ゲームの一部
分であり、それ自身も展開形ゲームとしてみ
なせるものである。
Player 2
T
Player 1
B
Player 2
t
b
t
b
4,4
2,5
• 左の展開形ゲーム
の部分ゲームが何
かを考えてみよう
5,2
3,3
12
• 部分ゲームとは、もとの展開形ゲームの一部
分であり、それ自身も展開形ゲームとしてみ
なせるものである。
Player 2
T
b
Player 1
B
t
Player 2
t
b
4,4
2,5
Player 2 が t か b かを
選択するような、
Player 2 の一人ゲーム
5,2
3,3
Player 2 が t か b かを
選択するような、
Player 2 の一人ゲーム
13
• 部分ゲームとは、もとの展開形ゲームの一部
分であり、それ自身も展開形ゲームとしてみ
なせるものである。
Player 2
T
Player 1
B
Player 2
t
b
t
b
4,4
2,5
5,2
もともとの Player 1 と Player 2
のゲームの部分ゲームと
みなす
3,3
14
• 部分ゲームとは、もとの展開形ゲームの一部
分であり、それ自身も展開形ゲームとしてみ
なせるものである。
Player 2
T
Player 1
B
Player 2
t
b
t
b
4,4
2,5
5,2
• 結局、左の展開形
ゲームには、部分
ゲームが三つあるの
である。
3,3
15
• 部分ゲームとは、もとの展開形ゲームの一部
分であり、それ自身も展開形ゲームとしてみ
なせるものである。
Player 2
T
Player 1
B
Player 2
t
b
t
b
4,4
2,5
5,2
3,3
• では、次に左の展開
形ゲームについて考
えてみよう
• Player 2 は二つの
手番のどちらにいる
のかわからない状況。
16
• 部分ゲームとは、もとの展開形ゲームの一部
分であり、それ自身も展開形ゲームとしてみ
なせるものである。
Player 2
T
Player 1
B
Player 2
t
b
t
b
4,4
2,5
5,2
3,3
• これを部分ゲームと
みなせるだろうか?
• No!!!
• Player 2 は自分がこ
のゲームを行ってい
ること知ることができ
ないので、これを部分
ゲームとみなすことは
できない。
17
• 部分ゲームとは、もとの展開形ゲームの一部
分であり、それ自身も展開形ゲームとしてみ
なせるものである。
Player 2
T
Player 1
B
Player 2
t
b
t
b
4,4
• このゲームの部分ゲーム
は、もともとの展開形ゲー
ムだけである。
2,5
5,2
3,3
18
例 後出しじゃんけんゲーム
Player 2
g
c
p
g
g
c
Player 1
c
p
p
Player 2
g
c
p
0,0
1,-1
-1,1
-1,1
0,0
1,-1
1,-1
-1,1
0,0
19
例 後出しじゃんけんゲーム
Player 2
g
c
p
g
g
c
Player 1
c
p
p
Player 2
g
c
p
0,0
1,-1
-1,1
-1,1
0,0
1,-1
1,-1
-1,1
0,0
20
例 じゃんけんゲーム
Player 2
g
c
p
g
g
c
Player 1
c
p
p
Player 2
g
c
p
0,0
1,-1
-1,1
-1,1
0,0
1,-1
1,-1
-1,1
0,0
21
例 じゃんけんゲーム
Player 2
g
c
p
g
g
c
Player 1
c
p
p
Player 2
g
c
p
0,0
1,-1
-1,1
-1,1
0,0
1,-1
1,-1
-1,1
0,0
22
例
Player 2
Player 1
T
B
Player 2
t
4,4
4,4
Player 1
b
2,5
5,2
t
Player 1
3,3
b
3,3
23
強盗のはったり(再考)
強盗
t
金
あなた
b
t
通報
強盗
b
• 確認
• 左のような
– あなた 金
– 強盗 tb
-300,-100
• はナッシュ均衡であっ
た。
0,0
-100,100
• これは部分ゲーム完
全均衡か?
-200,-200
24
強盗のはったり(再考)
強盗
t
-100,100
金
あなた
b
t
通報
-300,-100
0,0
• 各部分ゲームごと
にナッシュ均衡に
なっているのかを
検証する。
• 上の部分ゲームで、
強盗が t を選ぶの
は Nash 均衡であ
る。
強盗
強盗
b
t
-200,-200
-1,1
b
-3,-1
25
強盗のはったり(再考)
強盗
t
-100,100
金
あなた
b
t
通報
-300,-100
• 下の部分ゲームを
考えると、
• 強盗が b を選ぶ
のは Nash 均衡で
はない!!!。
0,0
強盗
t
強盗
b
0,0
b
-2,-2
-200,-200
26
強盗のはったり(再考)
強盗
-100,100
t
金
あなた
b
-300,-100
0,0
t
通報
強盗
b
×
• つまり、
• 左のような
– あなた 金
– 強盗 tb
• はナッシュ均衡であっ
たが部分ゲーム完全
均衡ではない。
-200,-200
27
部分ゲーム完全均衡は (通報、tb)
金
tt
tb
bt
bb
-1,1
-1,1
-3,-1
-3,-1
-2,-2
0,0
-2,-2
通報 0,0
強盗
あなた
金
通報
強盗
t
Nash 均衡は
(金, tb), (通報,tt), (通報, bt)
-100,100
b
-300,-100
t
0,0
b
部分ゲーム完全均衡は
(通報,tt)
-200,-200
28
• 均衡パス ・・・ 均衡において実際に到達す
る手番における行動
• Nash 均衡 ・・・ 均衡パス上では合理的な
行動を行っている。均衡パス上以外では、非
合理的な行動をとっているのかもしれない。
• 部分ゲーム完全均衡 ・・・ 均衡パス以外
の手番でも合理的な行動(選択)を行う。
29
Nash 均衡
強盗
部分ゲーム完全均衡
あなた 金
強盗
金
あなた
通報
強盗
t
-100,100
b
t
通報
強盗
b
-300,-100
t
0,0
強盗
b
-200,-200
t
あなた 金
通報
強盗
b
t
-100,100
-300,-100
0,0
-200,-200
-100,100
b
-300,-100
t
0,0
b
-200,-200
30
部分ゲーム完全均衡をどうやって
求めるのか
• 展開形ゲームの、一番右(最後)の部分ゲームを考
えよ。
• この部分ゲームのナッシュ均衡を求めよ。
• もとの展開形ゲームの部分ゲームを、上で求めた
利得で置き換えろ。
• 以上を繰り返せ。
31
強盗のはったり
強盗
t
-100,100
金
金
b
t
通報
-300,-100
-300,-100
0,0
通報
0,0
強盗
b
-200,-200
32
Player 2
g
c
p
g
g
c
Player 1
c
p
p
Player 2
g
c
p
0,0
後だしじゃんけん
1,-1
-5,5
-5,5
-1,1
g
Player 1
c
0,0
-1,1
3,-3
5,-5
-3,3
p
-3,3
0,0
部分ゲーム完全均衡は
(c, pgc)
33
• 「強盗のはったり」や「後だしじゃんけん」では、後か
ら行動するプレイヤーは、前のプレイヤーの行動が
何かを分かった上で、自身の行動を決定できる。
– 言い換えると、情報集合はただひとつの手番だけを含む。
• このような展開形ゲームを、完全情報ゲームという。
• 完全情報ゲームでは、後ろから、各プレイヤーの最
適な行動を順次選んでいくことにより、必ず部分
ゲーム完全均衡が求まる。
34