2008/8/26 1 第3回 社会のゲーム(2) 文献 混合戦略の求め方 混合戦略

2008/8/26
文献
第3回 社会のゲーム(2)
松原望著
『社会読みとく数理トレーニング』
東京大学出版会
信憑性のない脅し
混合戦略の求め方
次のゲームのナッシュ均衡は?
„
„
混合戦略の求め方
„
純粋戦略と混合戦略
B社
„
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
信憑性のない脅し
混合戦略の求め方
混合戦略の求め方
このままでは、
A社の最適反応戦略
„
B社
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
B社の最適反応戦略
„
B社
ナッシュ均衡
は存在しない
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
1
2008/8/26
混合戦略による求め方
混合戦略の求め方
ここで・・・
„
A社が規格Aを採用する確率・・・
A社が規格Aを採用する確率
B社が規格Aを採用する確率・・・
B社
p
q
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
ただし、0≦p≦1かつ0≦q≦1
とする
混合戦略の求め方
混合戦略の求め方
B社の最適反応戦略
„
B社の最適反応戦略
Aの期待利得は (-2)×q+5×(1-q)
„
B社の最適反応戦略
„
B社
A社
規格A採用
規格B採用
Aの期待利得は
5×q+(-3)×(1-q)
A社
(-2)×q+5×(1-q)=5×q+(-3)×(1-q)のと
き、A社にとって任意の戦略が最適反
応戦略になる
B社
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
規格B採用
5,-4
-3,1
混合戦略の求め方
混合戦略の求め方
B社の最適反応戦略
q=8/15のとき、A社にとって任意の
戦略が最適反応戦略になる
„
B社
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
Bの期待利得は 3×p+(-4)×(1-p)
„ B社の最適反応戦略
B社
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
2
2008/8/26
混合戦略の求め方
3×p+(-4)×(1-p)=(-2)×p+1×(1-p)のと
Bの期待利得は -2×p+1×(1-p)
B社の最適反応戦略
き、B社にとって任意の戦略が最適反
応戦略になる
„ B社の最適反応戦略
混合戦略の求め方
„
B社
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
混合戦略の求め方
略が最適反応戦略になる
„ B社の最適反応戦略
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
B社の最適反応戦略
„
規格A採用
規格B採用
規格A採用
-2,3
5,-2
規格B採用
5,-4
-3,1
A社
規格A採用
混合戦略の求め方
p=1/2のとき、B社にとって任意の戦
B社
B社
A社
{p=1/2, q=8/15}のとき、
A社とB社の戦略は相
規格A採用
規格B採用
A社
手の戦略に対する最
規格A採用適反応戦略になってい
-2,3
5,-2
る
B社
規格B採用
5,-4
-3,1
混合戦略の求め方
„
B社の最適反応戦略
『A社は1/2の確率でA
を採用し、B社は8/15
規格A採用
規格B採用
A社
の確率でAを採用す
規格A採用 る』戦略の組合せが、
-2,3
5,-2
„
混合戦略の求め方
„
純粋戦略と混合戦略
„
信憑性のない脅し
B社
ナッシュ均衡
規格B採用
5,-4
-3,1
3
2008/8/26
純粋戦略と混合戦略
純粋戦略と混合戦略
問題 次のゲームのナッシュ均衡を求めよ
ナッシュ均衡
有限ゲームで、混合戦略も含めた場合、
ナッシュ均衡は必ず存在する
純粋戦略と混合戦略
Player B
Player A
X
Y
Z
X
4, 2
3, -1
1, 0
Y
0, -1
4, -2
2, 6
Z
-2, 1
2, 0
0, 5
純粋戦略と混合戦略
戦略Zは戦略Xに
支配されている
戦略Yは戦略Xに
支配されている
Player B
Player A
X
Y
Z
Player B
Player A
X
Y
Z
X
4, 2
3, -1
1, 0
X
4, 2
3, -1
1, 0
Y
0, -1
4, -2
2, 6
Y
0, -1
4, -2
2, 6
Z
-2, 1
2, 0
0, 5
Z
-2, 1
2, 0
0, 5
純粋戦略と混合戦略
純粋戦略と混合戦略
支配される戦略を取り除く
このゲームのナッシュ均衡を求めればよい・・・
Player B
Player A
X
Z
Player B
Player A
X
Z
X
4, 2
1, 0
X
4, 2
1, 0
Y
0, -1
2, 6
Y
0, -1
2, 6
4
2008/8/26
純粋戦略と混合戦略
純粋戦略と混合戦略
Player Aの最適反応戦略は?
Player Bの最適反応戦略は?
Player B
Player A
X
Z
Player B
Player A
X
Z
X
4, 2
1, 0
X
4, 2
1, 0
Y
0, -1
2, 6
Y
0, -1
2, 6
純粋戦略と混合戦略
純粋戦略と混合戦略
混合戦略についても検討する!
Player Bの最適反応戦略は?
ナッシュ均衡
ナッシュ均衡
Player B
Player A
X
Z
Player B
Player A
X
Z
X
4, 2
1, 0
X
4, 2
1, 0
Y
0, -1
2, 6
Y
0, -1
2, 6
純粋戦略と混合戦略
„
純粋戦略と混合戦略
まず
Player Aの期待利得は?
Aの期待利得は 4×q+1×(1-q)
Player B
Player A
Player AがXを選択する確率
Pl
AがXを選択する確率・・・ p
Player BがXを採用する確率・・・ q
X
Z
Aの期待利得は
0×q+2×(1-q)
X
4, 2
1, 0
Y
0, -1
2, 6
ただし、0≦p≦1かつ0≦q≦1
とする
5
2008/8/26
純粋戦略と混合戦略
純粋戦略と混合戦略
Bの期待利得は 2×p+(-1)×(1-p)
4q + 1 – q = 2 – 2q, すなわち
Player Aの期待利得は?
q = 1/5のとき、Aにとって任意の戦
略が最適反応戦略になる
Player B
X
Z
Player A
Player Bの期待利得は?
Bの期待利得は 0×p+6×(1-p)
Player B
Player A
X
Z
X
4, 2
1, 0
X
4, 2
1, 0
Y
0, -1
2, 6
Y
0, -1
2, 6
純粋戦略と混合戦略
2p – 1 + p = 6 – 6p, すなわち
p = 7/9のとき、 Bにとって任意の戦略
Player
Bの期待利得は?
が最適反応戦略になる
純粋戦略と混合戦略
Player Bの期待利得は?
Player B
Player A
X
Z
Player B
Player A
X
4, 2
1, 0
X
Y
0, -1
2, 6
Y
純粋戦略と混合戦略
„
したがって、ナッシュ均衡は3つ
① {p = 1,
1 q = 1}
② {p = 0, q = 0}
③ {p = 1/7, q = 7/9}
{p=1/7, q=7/9}のとき、
X
Z
A社とB社の戦略は相
手の戦略に対する最
4, 2
1, 0
適反応戦略になってい
る 0, -1
2, 6
純粋戦略と混合戦略
„
ナッシュ均衡の特徴
* 有限ゲームでは、必ず存在する
有限ゲームでは 必ず存在する
* 均衡は、一つとは限らない
6
2008/8/26
純粋戦略と混合戦略
„
純粋戦略と混合戦略
ナッシュ均衡の問題
„
簡単に求められるとは限らない
ナッシュ均衡の問題
直観に反する結果を導くことがある
将棋、囲
碁など
信憑性の
ない脅し
信憑性のない脅し
„
„
混合戦略の求め方
„
純粋戦略と混合戦略
次のゲームのナッシュ均衡は?
Player B
„
X
Y
X
3, 2
1,1
Y
1,1
2, 3
Player A
信憑性のない脅し
信憑性のない脅し
信憑性のない脅し
条件
„
Aの最適反応戦略は?
Aが先に選択し、BはAの手をみて戦略を決定する
Player B
X
Y
X
3, 2
1,1
Y
1,1
2, 3
Player A
Player B
X
Y
X
3, 2
1,1
Y
1,1
2, 3
Player A
7
2008/8/26
信憑性のない脅し
„
信憑性のない脅し
Bの最適反応戦略は?
„
Bの最適反応戦略は?
ナッシュ均衡
Player B
X
Y
X
3, 2
1,1
Y
1,1
2, 3
Player A
信憑性のない脅し
„
Player B
„
AがXを選択したら、
BはXを選択するほ
X かない
Y
Y
本当か?
X
3, 2
1,1
Y
1,1
2, 3
Bの最適反応戦略は?
Player B
Player A
Bが「自分はYを選
択する」と脅しをか
Xけても同じ・・・ Y
X
3, 2
1,1
X
3, 2
1,1
Y
1,1
2, 3
Y
1,1
2, 3
信憑性のない脅し
„
X
信憑性のない脅し
Bの最適反応戦略は?
Player A
Player B
Player A
信憑性のない脅し
Bの最適反応戦略は?
Player B
„
Bの最適反応戦略は?
信憑性のない脅し
Player B
ナッシュ均衡だか決
して実現しない解
X
Y
X
Y
X
3, 2
1,1
X
3, 2
1,1
Y
1,1
2, 3
Y
1,1
2, 3
Player A
Player A
8