ゲーム理論(¾¼¼ 年夏学期) 第七回講義(改訂版)

ゲーム理論( 年夏学期)
第七回講義(改訂版)
奥野(藤原)正寛
年 月 日
展開型ゲーム
¯ ゲームの構造を始点から終点群まで詳細に記述
誰(どのプレイヤー、偶然を決める自然)の手番なのか
その手番では、どんな行動が選択可能か
どの行動をとると次に誰のどの手番に行くか
(自然を含めて)皆がどの手番でどの行動とるかをきめれば、
パス(経路)が決まり、終点と利得の組が決定
自分の手番が、具体的にどの手番にいるかわからないとき
(情報集合)には行動選択に一定の制約
同時手番に対する逐次手番ゲーム
¯ 同時手番ゲーム
相手の行動が分からないままに 自分の行動を選択
戦略的優位性は対称的
¯ 逐次手番ゲームにおける先行者
追随者・後発者より時間的に先に動ける
追随者・後発者は先導者の行動を所与として行動
情報集合の問題(追随者・後発者に自分の行動が知られる)
¯ 逐次手番における後発者
先導者に先手をとられる!
後発者の行動選択の後で起こる不確実性を把握可能
同時手番 戦略形と展開型
S
1
S
2
S
(2,1)
L
(0.0)
S
1
(0,0)
L
(0,0)
S
(0,0)
2
L
L
(2,1)
(1,2)
L
(1,2))
¯ どちらのプレイヤーを先にしても同じゲームの展開形をかける
¯ 同じ情報集合内(点線部分)では、各ノード で同じ行動
逐次手番 戦略形と展開型
2
1
S
L
SL
SS
SL SL
SL LS
SL
LL
(2,1) (2,1) (0,0) (0,0)
2
S
S
(2,1)
L
(0,0)
S
(0,0)
1
L
(0,0) (1,2) (0,0) (1,2)
2
L
(1,2))
¯ 戦略 ¸ ゲーム開始前に各情報集合での選択行動を予
め決めておくこと
¯ 上の例なら、 が それぞれそ選択した場合に、 は のど
ちらを選ぶかを決めておく必要 µ つの可能性 µ つの均衡
チェーンストア・ゲーム:ナッシュ均衡 (-5,-5)
FIGHT
1
F
A
2
E
N
1
ENTER
(-5,-5)
(1,1)
(10.0)
ACCOMMODATE
(1,1)
2
NOT
ENTER
(10,0)
(10,0)
¯ (新規参入者)は が受け入れる(
)と予想し参
入 ¯ (既存企業)は が参入 するので、諦めて協調
チェーンストア・ゲーム:ナッシュ均衡 (-5,-5)
F
1
2
E
N
1
E
F
(-5,-5)
(10.0)
A
(1,1)
2
N
A
¯
(1,1)
(10,0)
(10,0)
は、参入すると が価格戦争するという脅し に屈する)
¯ は、 が参入したら、損をしても価格戦争を行うと脅す
¯ 戦略ペアがつなぐ始点から終点間の経路が ¯ それ以外のノードは (特に図の紫の点)µ
は実現しない µ パスに直接影響しない µ もっともらしい?
均衡選択:均衡 の問題点
¯ 展開形からの視点
紫のノードは だから実現するはずがないという予想
µ だから自分も損をする
を選んでしまったのではないか?
ひょっとして誰かが間違えたり、偶然が作用して紫のノードに行くつ
いたときにも、 は
を選ぶだろうか?
要は、紫のノードで を選ぶという の主張は、カラ脅し ではないか?
だとしたら、 はそんな脅しは無視すべきではないか?
¯ 戦略形からの疑問
にとって、 は弱い意味でではあるが によって支配されてい
る戦略ではないか?
そんな戦略を合理的な が使うだろうか?
展開形ゲームと部分ゲーム
¯ 展開形ゲームと部分ゲーム(チェーンストア・ゲームを例として)
問題の紫のノードから先を考えれば、それは一つの小さな展
開形ゲーム(部分ゲーム )
元のゲームの二つの戦略それぞれについて、その戦略のうち
部分ゲーム上だけに制限した部分戦略を考える
それらの部分戦略が部分ゲームのナッシュ均衡になっている
µ 元の戦略はその部分ゲームをプレイする戦略として適切
¯ 部分ゲームとは?
単独ノードからなる情報集合から始まり、その先がひとつの
小さな展開形ゲームとみなせる場合
µ 当該ノードから始まる部分ゲーム と呼ぶ
部分ゲーム完全均衡
¯ 次の性質を満たすナッシュ均衡を、部分ゲーム完全均衡 と呼ぶ
本来の展開形ゲームとそのナッシュ均衡戦略の組を考える
個々の部分ゲームを考え、本来の均衡戦略の組のうち、当該部分
ゲーム上に制限した戦略の組を考える
与えられた展開形ゲームの全ての部分ゲーム(本来の展開型ゲーム
全体を含む)において、当該ゲーム上に制限された戦略の組がナッ
シュ均衡になっている
¯ チェーンストア・ゲームでは、
均衡 の部分ゲームはナッシュµ 均衡 は である
均衡 の部分ゲームは非ナッシュµ 均衡 は でない
継続利得と逆向き推論法
¯ 紫色のノードから始まる部分ゲームの均衡は µ 利得の組は ¯ µ 部分ゲームを、利得の組 で置き換えることが出来る
部分ゲームで両者が得るのは継続利得 ¯ 後ろの部分ゲームのナッシュを順次継続利得に置き換えれば µ 逆向き推論法 後ろ向き推論法 ! (-5,-5)
F
1
E
(1,1)
A
(1,1)
2
E
2
N
N
(10,0)
(10,0)
展開形ゲームの定義:
プレイヤー集合は
、各プレイヤーは ただし、 は自然 で、偶然を決める母なる自然
ゲームの樹は、ノード 点 の集合 で構成される、各ノードは 上の二点の関係を表す枝 が定義されることがある
なら と の間に枝 があり、 で を選ぶと に行くことを示す
なら で を選ぶと に行くことを示す
と 間に枝がないこともある
¼
¼
¼
¼
¼
始点、終点、手番
上に始点 がある
上に、これ以上先に進めない終点 の集合 がある
各終点 と始点 を結ぶ枝の列をパス と呼ぶ
終点以外の点 は手番 の集合
から次の へのすべての枝の集合を で表す
は ¼ ½ とプレイヤー分割される。
なら はプレイヤー の手番、¼ は偶然手番の集合
展開形ゲームの定義:
情報分割
され、各 各 について分割された集合 はさらに再分割 ½
を の一つの情報集合 と呼ぶ
同一の情報集合内の点
からない
にいる場合、 はどちらの点にいるかがわ
¼
は同一の行動 あるいは
で表す。
したがって、同一の情報集合 内では、 は同一の行動 を選択
当然、同一の情報集合 に属する点
¼
枝の集合
を持つ。これを
¼
しなければならない
確率分布
¼ も ¼½ ¼¼ と再分割される
各偶然手番の枝 には、
´¼ ¼ を満たす確率 偶然手番の集合
¼¾
¼
が予め定義されている
利得関数
各終末点
に対応して、各プレイヤーの利得 が与えられる。
純戦略、混合戦略、行動戦略
¯ 純戦略
ゲームが始まる前に自分の情報集合 すべてでどの行動 ¾ を選ぶかを予め決めておくことを純戦略 と呼ぶ。
純戦略の組が決まれば、ゲームのパスが決まり、最終的に到達する
最終点とそこでの各プレイヤーの利得の組が決まる
¯ 混合戦略
各プレイヤーの純粋戦略の確率混合を、混合戦略と呼ぶ
¯ 行動戦略
各プレイヤーが自分の情報集合それぞれでどの様に行動するかを予
め決めておくことが、行動戦略 " # である。
¯ 各プレイヤーがゲームをどうプレイしたかについて完全な記憶を持って
いる場合( と呼ぶ)、純戦略(または混合戦略)と行動戦
略は同値であることが知られている
コミットメント:自分の手を縛る
¯ チェーンストア・ゲーム再考
プレイヤー が、自分で戦略 が取れない状態に追い込めば、均衡
が実現せざるを得ない。
を仕掛けられたときに自動発動される対抗手段
µ 自分の手を縛る
自分が をとったら、第三者が制裁措置を自分に課す
(-5,-5)
F
1
A
(1,1)
E
2
N
(10,0)
シュタッケルベルグ均衡
¯ シュタッケルベルグ均衡 が自己生産量を決定・公開 µ がそれを見て自己生産量を決定
! 先導者 "、 ! 追随者 # 間の逐次手番ゲーム
の へのコミットを知っていれば、 は ¾ を取る
µ はナッシュより高い利得を実現できる
y2
BR1(y2e)
y*
NE
SE
BR2(yS)
y*
yS
BR2(y1e)
yC
y1
手番の順序と時間整合性
¯ 事前に を計画するのは合理的 µ 時間整合性は? µ 事後的には Ë にコミットするインセンティブはない
¯ 事後的なインセンティブを考えれば、ナッシュしか実現できない!
¯ にコミットするにはそれなりの工夫が必要
y2
BR1(y2e)
y*
y2'
BR2(yS)
NE
SE
y*
y1''
yS
BR2(y1e)
yC
y1
工場建設や政府補助金
¯ クールノー均衡 µ 戦略的代替性 µ タフな行動が利益増大
µ 自分のタフさに "$ が必要 µ が変化
例1:%!% を引き下げる工場建設 µ 等利潤曲線は青から赤へ
µ 建設費用がサンクされれば最適反応曲線は右シフト
例2:政府の生産・輸出補助金 µ 私的費用低下 µ
等利潤曲線は青から赤へ µ 最適反応曲線の右シフト
y2
^
BR1(y2e)
BR1(y2e)
y*
NE
SE
BR2(yS)
yS
y*
BR2(y1e)
yC
y1