ゲーム理論とは 目的: 合理的主体間の戦略的行動や利得分配の分析

¶
µ
¶
³
ゲーム理論とは
目的: 合理的主体間の戦略的行動や利得分配の分析
歴史: • フォン・ノイマン(1928)
• フォン・ノイマンとモルゲンシュテルン(1944)
• ナッシュ(1950)
方法:
• n人協力ゲームとn人非協力ゲーム(n ≥ 2)
• 戦略形,提携形,展開形
´
³
ケーキの分割問題1
• 1個のケーキを n 人(n ≥ 2)で公平に分ける方法(古典的
問題).
n = 2 の場合: divide and choose
n ≥ 3 の場合: クナスター=バナッハによる拡張
問題 1. n = 3 の場合の公平な分割法を考えなさい.
µ
¶
¶
³
ゼロ和2人ゲーム
a
b
c
d 2/3 3/2 2
e 0
2 1/3
µ
¶
´
µ
³¶
マックスミニ戦略
戦略 p がマックスミニ戦略であるとは
• ある値 v が確実にえられる
• p 以外では,その値 v は保証
されない
´
ジャンケン
³
G C P
G 0
1 −1
C −1 0
1
P 1 −1 0
´
ミニマックス戦略
³
戦略 q がミニマックス戦略であるとは
• 損失がある値 w を超えない
• q 以外では,その値 w は保証
されない
この値 v を利得の保証水準(マックス
この値 w を損失の保証水準(ミニマッ
ミニ値)という.
クス値)という.
µ
´µ
´
¶
³
例示1
a
d
2/3
e
0
max 2/3∗
b
3/2
2
2
µ
c
2
1/3
2
min
2/3∗
0
w = v = 2/3
´
1
¶
³
例示2
G
G
0
C −1
P
1
max 1
C
1
0
−1
1
P
−1
1
0
1
min
−1
−1
−1
w = 1 > −1 = v
µ
¶ ミニマックス定理
³
¶
³
注意
ミニマックス定理: ゼロ和
2人ゲームでは,混合戦略の
一般に,v ≤ w である.
µ
´ もとで,v = w となる.
µ
´
¶
問題
問題 2. ジャンケンにおいては,p = (1/3, 1/3.1/3) はマックスミニ
戦略であり,v = w = 0 である.
µ
¶
黙秘
黙秘 −2, −2
自白 0, −10
c
c 3, 3
d 4, 0
µ
¶
³¶
囚人のジレンマ
逢引のジレンマ
³
´
³
b
o
b 2, 1 0, 0
o 0, 0 1, 2
自白
−10, 0
−5, −5
d
0, 4
1, 1
µ
¶
交差点
´
³
go
stop
go −1, −1 2, 1
stop
1, 2
0, 0
´µ
ナッシュ均衡
各プレイヤーが採っている戦略の組がナッシュ均衡であるとは,ど
のプレイヤーについても,自分だけ他の戦略に切り替えて利得を増
加させることができないことをいう.このとき,各プレイヤーの戦
略は,他のすべてのプレイヤーの戦略の組に対する最適反応である
という.
µ
¶
´
例のナッシュ均衡
´
³
´
³
囚人のジレンマ: (d, d)
逢引のジレンマ: (b, b), (o, o) および ((2/3, 1/3), (1/3, 2/3)).
交差点: (stop, go), (go, stop) および ((1/2, 1/2), (1/2, 1/2)).
µ
´
2
¶
³
注意
ゼロ和2人ゲームでは,ナッシュ均衡とミニマックス定理は同値.
µ
¶
³¶
ケーキの分割問題2
問題
問題 3. 次のゲームのナッシュ
均衡.
a
c −1, 2
d 0, 0.5
´
³
問題 5.
2
B
1
b
0.5, 1
1, −1
Ẽ
問題 4. ジャンケンにおいては,
混合戦略の組
1/2
E∗
((1/3, 1/3, 1/3), (1/3, 1/3, 1/3))
はナッシュ均衡である.
O
1 A
1/2
1
´µ
µ
¶
´
囚人のジレンマの繰り返しにおける GT と TFT
³
GT: 誰かが d をとるまでは c, 以後は d TFT: c から始め,以後,相手の前回の行動と同じ行動をとる
c
c
d
c, d
c
d
c
d
d
d
c
GRIM TRIGGER (GT)
TIT FOR TAT (TFT)
µ
´
¶
GT の履歴と逸脱
履歴:
( )
( )( )( ) ( )
c
c
c
d
d
···
···
···
c
c d d
d
利得の流れ:
( ) ( )( )( ) ( )
3
3 0 1
1
···
···
···
3
3 4 1
1
µ
³
´
3
¶
¶
³
フォーク定理
2
B(0, 5)
C(3, 3)
D(1, 1)
µ
¶
1
A(5, 0)
µ
´
µ
¶
³
有限回繰り返しゲーム
• 囚人のジレンマの有限回
繰り返しでは,毎回 d を
とることが唯一のナッシ
ュ均衡である(逆向き推
論法).
逆向き推論法の例
• 不意打ち試験のパラドッ
クス
• アイスクリームの分割交
渉
´
³
´
³
アイスクリームの分割
• 提案者は分割を提案.合意されればこの提案が実現.拒否
されれば提案者を交代して同様のルールに従う.アイスク
リームの大きさは最初は n であるが,提案者が交代するた
びに1ずつ小さくなる.
• n = 3 の場合:
(x, 3 − x)
1
x
a
a
2
r
r
2
y
1
(2 − y, y)
z
1
(z, 1 − z)
a
2
r
(0, 0)
µ
¶
´
問題
問題 6. このアイスクリームの分割交渉のナッシュ均衡を求めな
さい.
µ
4
³
´
¶
³
新規参入と展開形ゲーム
大型店舗 M の参入をひかえて,地元商店街 I は,M が攻撃的なタ
イプ MA なのか協調的なタイプ MW なのかを各々確率 π ,1 − π
と見積もっている.参入が起きた場合,とりうる行動は,容認する
(acq) か,対抗する (fight) かの2通りである.他方,M は自分のタ
イプを知っているが,どちらであっても参入するか (ent) しないか
(not) の2通りの行動をとりうる.
(M. I)
(0, 0)
MA
not
(1, -1)
acq
π
ent
(-1, -4)
fight
fight
N
ent
1−π
acq
I
MW
not
(-2, -1)
(-1, -2)
(0, 0)
• N : 自然(偶然機構)
• M : 参入者
– M A: 攻撃的なタイプ
– M W : 協調的なタイプ
• ent: 参入する
• π: 参入者が攻撃的であるという先験確率
• I: 地元商店街
• acq: 容認する
• f ight: 対抗する
µ
¶
´
問題
³
問題 7. この展開形ゲームにおいて,戦略の組 (M A : ent, M W :
not, I : acq) はナッシュ均衡であることを確かめなさい.
µ
´
5