経済原論

経済原論
第7回 ゲーム理論
1.ゲーム理論とは何か?
• 分析対象
– 企業、国、消費者
– 登場するのは2人以上
• ゲーム理論(Game Theory)
– 「自分の利益が相手の行動に依存し、
相手の利益が自分の行動に依存しているときの
行動について分析をする研究分野」
2
1.ゲーム理論とは何か?
• ゲーム理論の材料
– プレイヤー(Player)
「誰が参加しているか、何人参加しているか」
– 戦略(Strategy)
「『相手がこうしたら自分はこうする』というような、
状況に応じた行動の計画」
– 利得(Payoff)
「ゲームから得られる効用や利潤」
– 情報構造(Information Structure)と手番(Move)
「誰が何を知っているか」
「行動をとる順番、同時手順と逐次手順」
3
1.ゲーム理論とは何か?
• 2人ジャンケン
– プレイヤー(Player)
プレイヤー1、プレイヤー2
– 戦略(Strategy)
「グーか、チョキか、パーを出す」
– 利得(Payoff)
「勝てば10、負ければ-10、あいこは0」
– 情報構造(Information Structure)と手番(Move)
「相手が何を出すかは知らない」
「同時手番(同時に出す)」
4
1.ゲーム理論とは何か?
• すれ違いゲーム(同時手番)
– プレイヤー(Player)
プレイヤー1、プレイヤー2
– 戦略(Strategy)
「右によけるか左によける」
– 利得(Payoff)
「相手と同じ選択をすると-10違うと0」
– 情報構造(Information Structure)と手番(Move)
「相手がどちらに行くかわからない」
「同時手番(同時に出す)」
5
1.ゲーム理論とは何か?
• すれ違いゲーム(逐次手番)
– プレイヤー(Player)
プレイヤー1、プレイヤー2
– 戦略(Strategy)
「右によけるか左によける」
– 利得(Payoff)
「相手と同じ選択をすると-10違うと0」
– 情報構造(Information Structure)と手番(Move)
「相手がどちらに行くかわからない」
「プレイヤー1が先に右か左によける」
6
1.ゲーム理論とは何か?
• ゲームの表現方法
– 戦略形
プレイヤー2
プレイヤー1
グー
グー
チョキ
パー
チョキ
0
0
-10
0
10
0
-10
10
10
-10
10
-10
パー
-10
10
0
10
-10
0
7
1.ゲーム理論とは何か?
• ゲームの表現方法
– 展開形
プレイヤー1
右
左
プレイヤー2
右
(0, 0)
左
(-1,-1)
右
(-1,-1)
左
(0, 0)
8
2.囚人のジレンマ
• 囚人のジレンマ
– プレイヤー(Player)
囚人A、囚人B
– 戦略(Strategy)
「自白する」「黙秘する」
– 利得(Payoff)
「2人とも自白すると共に-10」
「2人とも黙秘はともに-2」「片方が黙秘、片方が
自白は、自白した方が0、黙秘した方が-15」
– 情報構造(Information Structure)と手番(Move)
「相手がどちらに行くかわからない」「同時手番」
9
2.囚人のジレンマ
• 囚人のジレンマ
– 2人はどのような選択をするだろうか?
囚人B
囚人A
自白
自白
黙秘
黙秘
-10
-10
-15
0
0
-15
-2
-2
10
2.囚人のジレンマ
• 囚人のジレンマの解き方
– 囚人Bの選択を想定し、囚人Aの行動を考える
囚人B
囚人A
自白
自白
黙秘
黙秘
-10
-10
-15
0
0
-15
-2
-2
– 囚人Bが黙秘をしたら、囚人Aは自白をする方が
得である(0>-2)
11
2.囚人のジレンマ
• 囚人のジレンマの解き方
– 囚人Bの選択を想定し、囚人Aの行動を考える
囚人B
囚人A
自白
自白
黙秘
黙秘
-10
-10
-15
0
0
-15
-2
-2
– 囚人Bが自白をしても、囚人Aは自白をする方が
得である(-10>-15)
12
2.囚人のジレンマ
• 囚人のジレンマの解き方
– 囚人Bの選択を想定し、囚人Aの行動を考える
囚人B
囚人A
自白
自白
黙秘
黙秘
-10
-10
-15
0
0
-15
-2
-2
– 囚人Bがどのような選択をしても、囚人Aは自白を
行う。逆のケースも同じようになる。
13
2.囚人のジレンマ
• 囚人のジレンマの解き方
囚人B
自白
囚人A
– 2人とも自白をする。
– これまでは、個人が自分
の効用(利得)を高める選
択をすることが社会的に
望ましいことであると話し
てきたが、囚人のジレン
マは、ゲームの状況では
それが当てはまらないこ
ともあると示した。
自白
黙秘
-10
-10
0
-15
黙秘
-15
0
-2
-2
14
2.囚人のジレンマ
• 囚人のジレンマの応用
– 2国間の軍縮・軍拡
国家B
国家A
軍拡
軍拡
軍縮
軍縮
-1
-1
-2
5
5
-2
3
3
– 両国とも軍縮をすることが望ましいが、
15
2.ナッシュ均衡と色々なゲーム
• ナッシュ均衡(Nash Equilibrium)
– 「全てのプレイヤーが予測される他のプレイヤー
の戦略に対して、最適反応をとっていること」
最適反応とは、「他のプレイヤーの戦略に対して
自分の利得を最大にする戦略」
1. 適当な戦略の組み合わせを選ぶ。
2. それぞれのプレイヤーについて、その戦略が最適反
応であるかを調べる。
3. 誰かが最適反応をとっていなければ、ナッシュ均衡
でない。全てのプレイヤーが最適反応をとっていれ
ばナッシュ均衡。
4. これを全ての組み合わせで調べる。
16
2.ナッシュ均衡と色々なゲーム
• 2人ジャンケン
– プレイヤー(Player)
プレイヤー1、プレイヤー2
– 戦略(Strategy)
「グーか、チョキか、パーを出す」
– 利得(Payoff)
「勝てば10、負ければ-10、あいこは0」
– 情報構造(Information Structure)と手番(Move)
「相手が何を出すかは知らない」
「同時手番(同時に出す)」
17
2.ナッシュ均衡と色々なゲーム
• ジャンケン
– 相手がパーを出せばチョキ、チョキを出せば…。
プレイヤー2
プレイヤー1
グー
グー
チョキ
パー
チョキ
0
0
-10
0
10
0
-10
10
10
-10
10
-10
パー
-10
10
0
10
-10
0
18
2.ナッシュ均衡と色々なゲーム
• ジャンケンの均衡
– 相手がパーを出せばチョキ、チョキを出せば…。
– ジャンケンのナッシュ均衡は、1/3の確率でそれぞれ
の手を出すというもの。
• たとえば、Aがグーを出す確率を高めると、相手はパーを
出し、Aの利得が1/3ずつ出す場合よりも低くなる。そこで、
Aは1/3ずつ出すという戦略に変更する。詳しい説明は省
略。
• ゼロサムゲーム
– 自分が勝つと相手が負けるゲームをゼロサムゲー
ムという。
– 囚人のジレンマのように、プレイヤーが共に勝利(敗
北)するゲームをノンゼロサムゲームという。
19
2.ナッシュ均衡と色々なゲーム
• バトル・オブ・セックス
– プレイヤー(Player)
夫、妻
– 戦略(Strategy)
「オペラ観賞」「野球観戦」
– 利得(Payoff)
「2人ともオペラは夫が2,妻が3」 「2人とも野球は夫
が3,妻が2」 「2人が違うものをみると、ともに0」
– 手番(Move)
「同時手番(同時に出す)」
20
2.囚人のジレンマ
• 3つ目の均衡
夫
妻
オペラ
野球
夫が野球を選択するとき、
(1-q)
(q)
妻の期待利得は、
p*0+(1-p)*2=2-2p、夫が
オペラ
2
0
(p)
3
0
オペラを選択するときは、
3*p+(1-p)*0=3pである。
野球
0
3
夫がどちらでも選択する
(1-p)
0
2
可能性があると考えると、
2-2p=3pでp=2/5で、妻は2/5の確率でオペラを選ぶこ
とになる。夫は同様の方法で3/5の確率でオペラを選択
するのが望ましい。2つ以上の行動を確率的にとること
を混合戦略という。
これは、講義の範囲を超えるので覚えなくてよい。
21
2.ナッシュ均衡と色々なゲーム
• イオンvsヨーカドー
– プレイヤー(Player)
イオン、ヨーカドー
– 戦略(Strategy)
イオン「参入」「非参入」
ヨーカドー「低価格路線」「現状維持」
– 利得(Payoff)
次ページを参照
– 手番(Move)
「逐次手番(イオンが最初に行動)」
22
2.ナッシュ均衡と色々なゲーム
• イオンvsヨーカドー
イオン
参入
参入しない
ヨーカドー
(0, 100)
低価格路線
(-50, -50)
現状維持
(50,50)
23
2.ナッシュ均衡と色々なゲーム
• ナッシュ均衡は2つある
イオン
参入
参入しない
ヨーカドー
(0, 100)
低価格路線
(-50, -50)
現状維持
ヨーカドーが低価格路線を必ず選
択するのならば、イオンは参入をす
ると利得が-50になってしまうので、
参入しない(利得が0)の選択をとる。
(50,50)
24
2.ナッシュ均衡と色々なゲーム
• ナッシュ均衡は2つある
イオン
参入
参入しない
ヨーカドー
(0, 100)
低価格路線
(-50, -50)
現状維持
(50,50)
イオンが参入をした場合には、ヨー
カドーは現状維持をとった方が利得
が高くなるので(50>-50)、低価格
路線はとらない。
イオンが利得の情報を理解してい
れば、参入さえしてしまえばヨーカ
ドーが現状維持を選択するので、こ
のナッシュ均衡が選ばれる。
25
2.ナッシュ均衡と色々なゲーム
• ナッシュ均衡は2つある
イオン
②
参入
ヨーカドー
①
低価格路線
(-50, -50)
参入しない
(0, 100)
現状維持
(50,50)
選ばれないナッシュ均衡もそんざいする
ことがわかる。2つめのナッシュ均衡を
求めるときは、先に枝の先の方の均衡
を求め、幹の方にたどっていくやり方を
とる。
① ヨーカドーは現状維持を選択。
② イオンは50>0の利得から参入する。
この均衡をサブゲーム完全均衡という。
26
2.ナッシュ均衡と色々なゲーム
• 手抜きレストラン
– プレイヤー(Player)
客、レストラン
– 戦略(Strategy)
客「店に入る」「入らない」、店「うまいご飯」「手抜き
のご飯」を客に出す
– 利得(Payoff)
次ページを参照
– 手番(Move)
「逐次手番(客が最初に行動)」
27
3.繰り返しゲームと協調
• 手抜きレストラン
客
入る
入らない
レストラン
(0, 0)
おいしいご飯
(2, 1)
手抜きご飯
(-1, 2)
28
3.繰り返しゲームと協調
• 手抜きレストランのナッシュ均衡
客
入る
入らない
レストラン
(0, 0)
おいしいご飯
(2, 1)
手抜きご飯
(-1, 2)
この場合、客が店に入ってもレストラン
は手抜きのご飯しか出さないため(利得
が2>1のため)に、客は店に入るという
選択をとらない(0>-1のため)。その結
果、客とレストランは(入らない、手抜き
ご飯)という組み合わせが唯一のナッ
シュ均衡でサブゲーム完全均衡。
29
3.繰り返しゲームと協調
• 手抜きレストランのナッシュ均衡
客
入る
入らない
レストラン
(0, 0)
おいしいご飯
(2, 1)
手抜きご飯
(-1, 2)
この場合、客が店に入ってもレストラン
は手抜きのご飯しか出さないため(利得
が2>1のため)に、客は店に入るという
選択をとらない(0>-1のため)。その結
果、客とレストランは(入らない、手抜き
ご飯)という組み合わせが唯一のナッ
シュ均衡でサブゲーム完全均衡。この
時のお互いの利得は(0,0)である。
30
3.繰り返しゲームと協調
• ゲームを繰り返すとどうなるか?
– レストランの利得
1
2
3
4
5
6
7
・・・・
美味い
ご飯
1
1
1
1
1
1
1
・・・・
手抜き
ご飯
2
0
0
0
0
0
0
・・・・
– 一度、客の期待を裏切って手抜きのご飯を出すと、1回目
に利得2を得られたとしても、2回目以降は客は来なくなり、
0の利得しか得られない。美味いご飯を出せば、客は繰り
返し来るので、利得1を得続けることが出来る。レストラン
はこの状況を予測して、最初からおいしいご飯を出す。
31