ゲーム理論（¾¼¼ 年夏学期）第七回講義（改訂版）

ゲーム理論（年夏学期）
第七回講義（改訂版）
奥野（藤原）正寛
年月日
展開型ゲーム
¯ ゲームの構造を始点から終点群まで詳細に記述
誰（どのプレイヤー、偶然を決める自然）の手番なのか
その手番では、どんな行動が選択可能か
どの行動をとると次に誰のどの手番に行くか
（自然を含めて）皆がどの手番でどの行動とるかをきめれば、
パス（経路）が決まり、終点と利得の組が決定
自分の手番が、具体的にどの手番にいるかわからないとき
（情報集合）には行動選択に一定の制約
同時手番に対する逐次手番ゲーム
¯ 同時手番ゲーム
相手の行動が分からないままに自分の行動を選択
戦略的優位性は対称的
¯ 逐次手番ゲームにおける先行者
追随者・後発者より時間的に先に動ける
追随者・後発者は先導者の行動を所与として行動
情報集合の問題（追随者・後発者に自分の行動が知られる）
¯ 逐次手番における後発者
先導者に先手をとられる！
後発者の行動選択の後で起こる不確実性を把握可能
同時手番戦略形と展開型
S
1
S
2
S
(2,1)
L
(0.0)
S
1
(0,0)
L
(0,0)
S
(0,0)
2
L
L
(2,1)
(1,2)
L
(1,2))
¯ どちらのプレイヤーを先にしても同じゲームの展開形をかける
¯ 同じ情報集合内（点線部分）では、各ノードで同じ行動
逐次手番戦略形と展開型
2
1
S
L
SL
SS
SL SL
SL LS
SL
LL
(2,1) (2,1) (0,0) (0,0)
2
S
S
(2,1)
L
(0,0)
S
(0,0)
1
L
(0,0) (1,2) (0,0) (1,2)
2
L
(1,2))
¯ 戦略 ¸ ゲーム開始前に各情報集合での選択行動を予
め決めておくこと
¯ 上の例なら、がそれぞれそ選択した場合に、はのど
ちらを選ぶかを決めておく必要 µ つの可能性 µ つの均衡
チェーンストア・ゲーム：ナッシュ均衡 (-5,-5)
FIGHT
1
F
A
2
E
N
1
ENTER
(-5,-5)
(1,1)
(10.0)
ACCOMMODATE
(1,1)
2
NOT
ENTER
(10,0)
(10,0)
¯ （新規参入者）はが受け入れる（
）と予想し参
入 ¯ （既存企業）はが参入するので、諦めて協調
チェーンストア・ゲーム：ナッシュ均衡 (-5,-5)
F
1
2
E
N
1
E
F
(-5,-5)
(10.0)
A
(1,1)
2
N
A
¯
(1,1)
(10,0)
(10,0)
は、参入するとが価格戦争するという脅しに屈する）
¯ は、が参入したら、損をしても価格戦争を行うと脅す
¯ 戦略ペアがつなぐ始点から終点間の経路が ¯ それ以外のノードは（特に図の紫の点）µ
は実現しない µ パスに直接影響しない µ もっともらしい？
均衡選択：均衡の問題点
¯ 展開形からの視点
紫のノードはだから実現するはずがないという予想
µ だから自分も損をする
を選んでしまったのではないか？
ひょっとして誰かが間違えたり、偶然が作用して紫のノードに行くつ
いたときにも、は
を選ぶだろうか？
要は、紫のノードでを選ぶというの主張は、カラ脅しではないか？
だとしたら、はそんな脅しは無視すべきではないか？
¯ 戦略形からの疑問
にとって、は弱い意味でではあるがによって支配されてい
る戦略ではないか？
そんな戦略を合理的なが使うだろうか？
展開形ゲームと部分ゲーム
¯ 展開形ゲームと部分ゲーム（チェーンストア・ゲームを例として）
問題の紫のノードから先を考えれば、それは一つの小さな展
開形ゲーム（部分ゲーム）
元のゲームの二つの戦略それぞれについて、その戦略のうち
部分ゲーム上だけに制限した部分戦略を考える
それらの部分戦略が部分ゲームのナッシュ均衡になっている
µ 元の戦略はその部分ゲームをプレイする戦略として適切
¯ 部分ゲームとは？
単独ノードからなる情報集合から始まり、その先がひとつの
小さな展開形ゲームとみなせる場合
µ 当該ノードから始まる部分ゲームと呼ぶ
部分ゲーム完全均衡
¯ 次の性質を満たすナッシュ均衡を、部分ゲーム完全均衡と呼ぶ
本来の展開形ゲームとそのナッシュ均衡戦略の組を考える
個々の部分ゲームを考え、本来の均衡戦略の組のうち、当該部分
ゲーム上に制限した戦略の組を考える
与えられた展開形ゲームの全ての部分ゲーム（本来の展開型ゲーム
全体を含む）において、当該ゲーム上に制限された戦略の組がナッ
シュ均衡になっている
¯ チェーンストア・ゲームでは、
均衡の部分ゲームはナッシュµ 均衡はである
均衡の部分ゲームは非ナッシュµ 均衡はでない
継続利得と逆向き推論法
¯ 紫色のノードから始まる部分ゲームの均衡は µ 利得の組は ¯ µ 部分ゲームを、利得の組で置き換えることが出来る
部分ゲームで両者が得るのは継続利得 ¯ 後ろの部分ゲームのナッシュを順次継続利得に置き換えれば µ 逆向き推論法後ろ向き推論法 ! (-5,-5)
F
1
E
(1,1)
A
(1,1)
2
E
2
N
N
(10,0)
(10,0)
展開形ゲームの定義：
プレイヤー集合は
、各プレイヤーはただし、は自然で、偶然を決める母なる自然
ゲームの樹は、ノード点の集合で構成される、各ノードは上の二点の関係を表す枝が定義されることがある
ならとの間に枝があり、でを選ぶとに行くことを示す
ならでを選ぶとに行くことを示す
と間に枝がないこともある
¼
¼
¼
¼
¼
始点、終点、手番
上に始点がある
上に、これ以上先に進めない終点の集合がある
各終点と始点を結ぶ枝の列をパスと呼ぶ
終点以外の点は手番の集合
から次のへのすべての枝の集合をで表す
は ¼ ½ とプレイヤー分割される。
ならはプレイヤーの手番、¼ は偶然手番の集合
展開形ゲームの定義：
情報分割
され、各各について分割された集合はさらに再分割 ½
をの一つの情報集合と呼ぶ
同一の情報集合内の点
からない
にいる場合、はどちらの点にいるかがわ
¼
は同一の行動あるいは
で表す。
したがって、同一の情報集合内では、は同一の行動を選択
当然、同一の情報集合に属する点
¼
枝の集合
を持つ。これを
¼
しなければならない
確率分布
¼ も ¼½ ¼¼ と再分割される
各偶然手番の枝には、
´¼ ¼ を満たす確率偶然手番の集合
¼¾
¼
が予め定義されている
利得関数
各終末点
に対応して、各プレイヤーの利得が与えられる。
純戦略、混合戦略、行動戦略
¯ 純戦略
ゲームが始まる前に自分の情報集合すべてでどの行動 ¾ を選ぶかを予め決めておくことを純戦略と呼ぶ。
純戦略の組が決まれば、ゲームのパスが決まり、最終的に到達する
最終点とそこでの各プレイヤーの利得の組が決まる
¯ 混合戦略
各プレイヤーの純粋戦略の確率混合を、混合戦略と呼ぶ
¯ 行動戦略
各プレイヤーが自分の情報集合それぞれでどの様に行動するかを予
め決めておくことが、行動戦略 " # である。
¯ 各プレイヤーがゲームをどうプレイしたかについて完全な記憶を持って
いる場合（と呼ぶ）、純戦略（または混合戦略）と行動戦
略は同値であることが知られている
コミットメント：自分の手を縛る
¯ チェーンストア・ゲーム再考
プレイヤーが、自分で戦略が取れない状態に追い込めば、均衡
が実現せざるを得ない。
を仕掛けられたときに自動発動される対抗手段
µ 自分の手を縛る
自分がをとったら、第三者が制裁措置を自分に課す
(-5,-5)
F
1
A
(1,1)
E
2
N
(10,0)
シュタッケルベルグ均衡
¯ シュタッケルベルグ均衡が自己生産量を決定・公開 µ がそれを見て自己生産量を決定
! 先導者 "、 ! 追随者 # 間の逐次手番ゲーム
のへのコミットを知っていれば、は ¾ を取る
µ はナッシュより高い利得を実現できる
y2
BR1(y2e)
y*
NE
SE
BR2(yS)
y*
yS
BR2(y1e)
yC
y1
手番の順序と時間整合性
¯ 事前にを計画するのは合理的 µ 時間整合性は？ µ 事後的には Ë にコミットするインセンティブはない
¯ 事後的なインセンティブを考えれば、ナッシュしか実現できない！
¯ にコミットするにはそれなりの工夫が必要
y2
BR1(y2e)
y*
y2'
BR2(yS)
NE
SE
y*
y1''
yS
BR2(y1e)
yC
y1
工場建設や政府補助金
¯ クールノー均衡 µ 戦略的代替性 µ タフな行動が利益増大
µ 自分のタフさに "$ が必要 µ が変化
例１：%!% を引き下げる工場建設 µ 等利潤曲線は青から赤へ
µ 建設費用がサンクされれば最適反応曲線は右シフト
例２：政府の生産・輸出補助金 µ 私的費用低下 µ
等利潤曲線は青から赤へ µ 最適反応曲線の右シフト
y2
^
BR1(y2e)
BR1(y2e)
y*
NE
SE
BR2(yS)
yS
y*
BR2(y1e)
yC
y1

Download Report