12.進化ゲーム(2)

戦略的最適行動論(2011.7.11)
12.進化ゲーム(2)
1.進化的に安定な戦略
進化的に安定な戦略とは、集団全員がある戦略 A をとっている状態において、いかなる
戦略 X がわずかな比率で侵入しても、戦略 X をもつエージェントが社会の中に広まらない
状態である。これを数学的に考察しよう。
いま、わずかな比率ε(>0)で戦略 X を選択する突然変異体が発生するとする。という
ことは、比率 1-εのエージェントが戦略 A をとっている。戦略 A をとっているエージェ
ントが戦略 A をとっているエージェントと出会ったときの利得を UAA、戦略 X をとってい
るエージェントと出会った時の利得を UAX とする。同様に、戦略 X をとっているエージェ
ントが戦略 A をとっているエージェントと出会ったときの利得を UXA、戦略 X をとってい
るエージェントと出会った時の利得を UXX とする。
このとき、戦略 A と戦略 X をもつエージェントの期待利得はそれぞれ下記の通りである。
EA=(1-ε)UAA+εUAX
EX=(1-ε)UXA+εUXX
戦略 A が進化的に安定なナッシュ均衡であるためには、EA がすべての戦略 X による EX
よりも適応的(利得が高い)でなければならない。
例3)囚人のジレンマを考える。
協力
非協力
協力
3,3
1,4
非協力
4,1
2,2
・協力戦略の組は進化的に安定だろうか?
・全員が協力している社会に、わずかな割合εだけ非協力をとるエージェントが現れると
する。
E 協力=(1-ε)×3+ε×1=-2ε+3
E 非協力=(1-ε)×4+ε×2=-2ε+4
非協力のときの方が利得が大きいので、社会の中で非協力戦略が増加していく。
⇒協力戦略は進化的に安定ではない。
1
戦略的最適行動論(2011.7.11)
・それでは非協力戦略は進化的に安定だろうか?
・全員が非協力している社会に、わずかな割合εだけ協力をとるエージェントが現れると
する。
E 協力=(1-ε)×1+ε×3=2ε+1
E 非協力=(1-ε)×2+ε×4=2ε+2
非協力のときの方が利得が大きいので、社会の中で協力戦略はひろがっていかない。
⇒非協力戦略は進化的に安定である。
・囚人のジレンマにおいて(非協力,非協力)の戦略の組はナッシュ均衡である。一般に、
進化的に安定な戦略の組はゲームのナッシュ均衡と一致する。
定理:進化的に安定な戦略の組はゲームのナッシュ均衡である。
(ただし、ナッシュ均衡であれば進化的に安定な戦略であるとは限らないので注意。)
例4)調整ゲームを考える。エスカレーターで左を空けるか、右を空けるか。
左を空ける
右を空ける
左を空ける
2,2
0,0
右を空ける
0,0
1,1
・混合戦略まで考慮すると、ナッシュ均衡は、
(左,左)(右,右)(1/3 左,1/3 左)である。
このうち、(左,左)が進化的に安定な戦略であるかを検討する。
・任意の確率の混合戦略 p 左戦略が侵入可能かを考える。つまり、εで p 左戦略,1-εで
左戦略に出会う。なお、p≠1 である。
E(左)=(1-ε)×2+ε×{2p+0(1-p)}=2εp-2ε+2
E(p 左)=(1-ε)×{2p+0(1-p)}+ε×{2p2+0p(1-p)+0p(1-p)+1(1-p)2}
=3εp2+(2+4ε)p+ε
E(左)-E(p 左)=(3εp2+(2+4ε)p+ε)-(2εp-2ε+2)
=-3εp2+(6ε-2)p+2-3ε
p=0 のとき、E(左)-E(p 左)=2-3ε>0 である(εはわずかな割合であるため)。
p=1 のとき、E(左)-E(p 左)=0 である。
したがって、0 ≤ p < 1 の範囲で、E(左)-E(p 左)は正の値である。任意の混合戦略
p 左の侵入を許さないので、左戦略は進化的に安定である。
2