第 7 章:逐次合理性(Sequential Rationality)

1
2016 年 5 月 9 日(5 月 11 日)
第 7 章:逐次合理性(Sequential Rationality)
「逐次合理性」をみたすナッシュ均衡
ナッシュ均衡の精緻化概念
部分ゲーム完全ナッシュ均衡
完全ベイジアン均衡
逐次均衡(Sequential Equilibrium)
1
2
7.1. 部分ゲーム完全(ナッシュ)均衡
Subgame Perfect (Nash) Equilibrium
逐次合理性のもっとも基礎的な概念
部分ゲームとは
特定の Node から先をひとつの「独立した展開形ゲーム」とみなす
1
部分ゲーム
2
・
1
・
・
・
・
・
・
・
2
3
「部分ゲーム」とみなされるための条件
部分ゲームの外にある Node と区別できないとだめ
部分ゲームにならない例
部分ゲーム
ではない
3
4
行動戦略プロファイル   ( i )iN      i は、以下の条件をみたす時
i N
部分ゲーム完全均衡であるという:

は(全体のゲームにおける)ナッシュ均衡である
任意の部分ゲームにおいて をプレイすることが、その部分ゲームのナッシュ均
衡である
4
5
部分ゲーム完全均衡をつかって
完備情報の動学ゲームを分析しよう
部分ゲーム完全均衡に適した動学ゲームの類型:
完全情報の動学ゲーム
「後方帰納法(Backward Induction)」の適用
多段階ゲーム
各段階(Stage)において静学ゲームをプレイ
過去の行動観察可能 Perfect Monitoring, Observed Actions)
繰り返しゲーム
同じゲームが繰り返しプレイ
有限回繰り返しゲーム、無限回繰り返しゲーム
5
6
7.2. 完全情報の動学ゲーム
後方帰納法(Backward Induction)によって逐次合理性を導く
完全情報:
全ての情報集合は一つの手番(Single-Valued)からなる
∴ 全ての手番から先の Game Tree は必ず「部分ゲーム」になっている
後方帰納法:
後ろから順番に解く方法
定理(Zermelo?):
・展開形ゲームが有限の場合、最後の手番から順に最大化を解いていけば、つまり後方帰納
法に従えば、全ての部分ゲーム完全均衡を導くことができる。
・任意のプレーヤーに対して、異なる Terminal Node がことなる利得をもたらすならば、部
分ゲーム完全均衡は一意に定まる。
*Zermelo の定理(1913 年)
:
「チェスや将棋では、先手か後手のどちらかに「決して負けない」戦略があ
る。だから先手と後手を決めた時点でもはや勝負は決まった。」Do you believe in it?
6
7
7.2.1. ムカデゲーム(Centipede Game)
1
2
1
(1,4)
H
(1, 1)
1
(1, 1)
2
(0, 3)
(0, 3)
1
(2, 2)
(2, 2)
2
1
(1, 4) (m, m)
2
(m+1,m-1)
(m-1,m+2)
みんな、いつでも、たかだか1ポイントの差で、exit しちゃう……
あまり長い(m が大きい、後に行くと大きな利得)と、逐次合理性の妥当性に疑いあり
(「相手が逐次合理的でない(限定合理的)かもしれない」と予想するかも……)
7
8
7.2.2. シュタッケルベルク複占
クールノー複占:
2企業が同質財の供給量を選択
si  [0,  )
生産費用ゼロ
p  1  s1  s2 で売却
各企業 i の利得(利潤)は ui ( s )  (1  s1  s2 ) si
需給均衡価格
シュタッケルベルク複占:
企業1が先手、企業 2 が後手
部分ゲーム完全均衡は?
8
9
企業1(先手)の戦略
s1  [0,  )
企業2(後手)の戦略
企業 2 の手番は無数!
企業1の選択 s1  [0,  ) ごとに企業 2 の手番がある
∴
s2 :[0,  )  [0,  )
「企業1の供給が s1  [0,  ) の場合、
企業2の供給量は s2 ( s1 )  [0,  ) 」
9
10
後方帰納法:
企業2から解け!
∴
∴
企業2は企業1の供給 s1 に対する最適反応を選択する
s2 ( s1 )  BR2 ( s1 )  0
if
s1  1
s2 ( s1 )  BR2 ( s1 ) 
1  s1
2
if
s1  [0,1]
10
11
こちらは企業1の等利潤曲線群(よくよく理解せよ)
11
12
こちらが企業2の等利潤曲線群および最適反応曲線つまり
後方帰納法から導かれる、後手企業2の最適戦略!
12
13
相手の反応を読め!
企業1(先手)は「企業2(後手)が s2 ( s1 )  BR1 ( s1 ) を選択する」ことを読み込む
「供給量を変えると相手の供給量も変わる」ことを利用して最大化
max{1  s1  BR2 ( s1 )}s1
s1 [0,1]
First-Order Condition:

1  s1
{1  s1 
}s1  0
s1
2
∴
s1  1 (  1 )
2
3
s2  BR2 ( 1 )  1 (  1 )
2
4
3
13
14
なぜこうなるか、考えよ!
14
15
企業1は
「私がクールノーより多めに供給すれば
相手企業2にとってクールノーより少なめに供給するのが逐次合理的になる」
ことを読み込んで
クールノーより「多めに」供給することを選択する
( s1  1 (  1 ))
2
3
価格はクールノーと比べて
1 から 1 にダウンするも
3
4
企業1の利潤は 1 から 1 にアップ
9
8
一方、企業2は 1 から 1 にダウン
9
16
15
16
宿題7
問1(展開形ゲームの表現)
:ある日レポートの採点をしていると、学生 A と学生 B が瓜二つの誤答をしていることに気が
付いた。先生はそのうち学生 A がカンニングの犯人ではないかと疑い、調査に乗り出した。実際、真犯人は学生 A なのだ
が、その調査によって明確な証拠がつかめる確率は半々である。学生 A は、先生に調査されていることはわかっているが、
先生が証拠を得ることができたかどうかはわからない。このとき次のようなゲームを考えよう。
まず、先生は証拠の有無を確認した後、学生 A を告発するか見逃すかを決定する。告発をした場合、学生 A は自白する
か否認するかを選択する。
いま、両者の利得を(先生の利得,学生の利得)と書くことにする。先生が見逃した場合、利得は(0,0)である。先生が告発を
した場合は証拠の有無によって異なる。先生が証拠を握っているとき、学生が自白をしたら(2,-2)、否認をした場合は(4,-4)
である。先生が証拠を握っていないとき、学生が自白をしたら(2,-2)、否認をした場合は(-4,4)である。
(1)この展開形ゲームをゲームの木によって図示せよ。
(2)先生・学生それぞれの純粋戦略集合を明らかにせよ。
(3)(1)を標準形ゲームとしてみなし、マトリックス表現せよ。
(4)このゲームにおけるナッシュ均衡を全て求めよ。
問2(固定費用):シュタッケルベルク複占において、後手企業2の生産費用は、生産ゼロの時ゼロ、生産量が正の場合固
定額 F  0 とする。(企業1は生産費用ゼロのまま。)
(1)部分ゲーム完全均衡を、 F について場合分けして、全てもとめよ。
(2)先手である企業1は供給の上限が 1 であったとする。今、企業1が、供給の上限を 1 から1に引き上げた、と報じ
2
2
た。すると、企業2は市場から撤退することになった。このような状況が生じうる場合の F の範囲を示せ。
問3(経営戦略):企業1は市場1と市場2の両方で事業展開している。市場1は企業 1 の独占である。市場2には企業2
というライバルがいる。企業1は、市場1で事業拡大するか否か、を検討している。近日中にこの事業戦略を決断して、記
者会見を開く予定である。事業戦略は、以下の3つの観点から、決定される。「市場2は価格競争か、数量競争か。」「企業
2は市場2から撤退する可能性がどの程度あるか。
」
「市場1での事業拡大は、企業1の市場2での事業展開に技術面でプラ
スになるかマイナスになるか。
」以上を踏まえて、企業1の望ましい事業戦略について論じよ。
16
17
問4:K 教授と M 教授が講義について話し合っている。K 教授は課題量を 1 とするのが望ましいと考えており, M 教授は
課題量を 3 とするのが望ましいと考えている。実現した課題量を y としたとき, 各教授の効用を u1 , u2 とすると,
u1  10  1  y
u2  10  3  y
を満たす。二人は次のような交渉をする。まず, 過去の慣習から課題量を 4 とする暫定案があり, これを踏まえて K 教授は
課題量を x   0, 5 とする案を出す。これを踏まえ, M 教授は課題量を x または 4 のどちらかに決定する。
(1) 部分ゲーム完全均衡を求めよ。
(2) 部分ゲーム完全均衡ではないナッシュ均衡をすべて求めよ。
17
18
第 7 章:逐次合理性(Sequential Rationality):まとめ
動学ゲームを均衡分析する際には、ナッシュ均衡のみならず、逐次合理性をもみたすことが大事である。
「逐次合理性をみたすナッシュ均衡」についての概念としては、
「部分ゲーム完全均衡」、
「(弱)完全ベイジアン均衡」
、
「逐
次均衡」が知られている。
部分ゲーム完全均衡は、完全情報、完全モニタリングの多段階ゲーム、繰り返しゲームに有用である。
完全情報の場合、部分ゲーム完全均衡は後方帰納法(Backward Induction)によって導くことができる。
完全情報の動学ゲームの重要な応用としてスタッケルベルク寡占、逐次交渉などがある。
部分ゲーム完全均衡は、無限回の展開形ゲームについても定義できるが、後方帰納法は適用できない。
「One-Stage Deviation
Principle」によって均衡かどうかが確認される。
無限回繰り返しゲームにおいては、暗黙の協調を、部分ゲーム完全均衡によって説明できる。部分ゲーム完全均衡によって
達成できる利得ベクトルは、割引ファクターが十分に1に近い場合無数に存在し、広範囲である。この性質は「フォーク定
理」と呼ばれる。
部分ゲーム完全均衡は、多くの不完全情報の動学ゲームに適さない。よって、別の概念として「(弱)完全ベイジアン均衡」
がある。完全ベイジアン均衡は、部分ゲーム完全均衡でなかったり、構造的整合性をみたさなかったりする。逐次均衡は、
完全ベイジアン均衡の欠点を克服する精緻な概念である。
18