1.ゲーム理論の基礎

2007 年度 現代法過程論レジュメ
第Ⅰ部
分析のための道具
1.ゲーム理論の基礎
1.1 標準形による表現――同時手番ゲーム
A.プレーヤー・戦略・利得
自分の行動が相手の行動に依存して決まるという状況(戦略的相互作用状況)をモデル化
[例 1]Aさんは道を歩いていたが、Bさんと正面衝突しそうになっている。
*「左によける」「右によける」「そのまま進む」のいずれかを選択
[例 2]CさんとDさんがじゃんけんをする。
[例 3]甲駅付近に住むEさんとFさん(家はそれぞれ別)は、乙駅の近くで開催されている花火大会
に行った。しかし、会場から乙駅までの帰り道が非常に混んでいたため、2 人は途中で離れば
なれになってしまった。なお、お互いに連絡手段はない。
*「甲駅で待つ」「乙駅で待つ」「家に帰る」のいずれかを選択
[例 1]を「標準形(戦略形とも;normal form / strategic form)」として表現する
<Step 1> AさんとBさんの行動の組み合わせを考える
<Step 2> 各組み合わせに対応する利得を設定する
<Step 3> ゲームの結果を予測する
<Step 1> AさんとBさんの行動の組み合わせを考える
次のような表を用いると便利
《表 1.1》
B
左
A
直進
右
左
直進
右
<Step 2> 各組み合わせ (上の9つのセル) に対応する利得2を設定する
ここでは例として
・左右のいずれかによけるコストを 1
・衝突したときに負うコストを 10
と設定する(AB共通)
2
この「利得」は効用の一種です。もう少し詳しく言うと、利得には「フォン・ノイマン=モルゲンシュテルン効用」と
いう効用をあてるのが普通です。なお、これが序数的効用なのか基数的効用なのかについては議論がありますが、ここで
は気にしなくて構いません。
5
2007 年度 現代法過程論レジュメ
《表 1.2》
A
B
左
直進
右
左
−1 , −1
0 , −1
−11,−11
直進
−1 , 0
−10,−10
−1 , 0
右
−11,−11
0 , −1
−1 , −1
各セルの左側の数字はAさんの利得、右側の数字はBさんの利得を表している
標準形表現の3つの要素
・プレーヤー … ここではAさん(行プレーヤー)、Bさん(列プレーヤー)
・戦略 … プレーヤーがとりうる行動
・利得 … 行動の組み合わせのそれぞれに割り当てられた効用の値
通常、行プレーヤーの利得を左、列プレーヤーの利得を右に書く
※《表 1.2》のような表を利得表と呼びます。利得表はゲーム描写の一方法にすぎず、3 つの要素さえ特
定すればゲームは完成します。利得表はプレーヤーが 2 人しかいないケースでは簡単に書けますが、
プレーヤーが 3 人、4 人…と増えると書くのが難しくなります。
※この例では、プレーヤーは戦略を同時に選択します(正確に言うと、相手の選択した戦略が分からない
状況で選択を行わなければならない、ということ)。「Aさんが選んだのを見てからBさんが決めるこ
とができる」「工場が選択した戦略を観察した後で住民が選択を行う(もっと後で出てくる例です)」
というような場合は、後で述べる展開形(extensive form)による表現を用います。
【練習問題1】
5 ページの[例 2]と[例 3]の状況を利得表で表してください。利得の大きさは、文脈に適合する範
囲で自由に設定して構いません(もちろん、唯一の正解があるわけではありません)。
B.最適反応
<Step 3> ゲームの結果を予測する
まずAさんの立場で考える(Aさんの利得に注目する)
《表 1.3》
A
B
左
直進
右
左
−1 , −1
0 , −1
−11,−11
直進
−1 , 0
−10,−10
−1 , 0
右
−11,−11
0 , −1
−1 , −1
↑縦で比較
自分の利得を最大にする戦略を選択する
相手がどのような戦略を選択するかで場合分け
・Bさんが「左」を選択する場合
→「直進」
・Bさんが「直進」を選択する場合
→「左」または「右」
・Bさんが「右」を選択する場合
→「直進」
6
2007 年度 現代法過程論レジュメ
このように、「相手の戦略を固定したときに、自分の戦略の中で最も大きな利得をもたらして
くれるもの」を最適反応という
例)「直進」は、相手の「左」または「右」に対する最適反応である
相手の「直進」に対する最適反応は「左」と「右」
最適反応の戦略をチェックしておく
=相手の戦略ごとに「最大の利得」に印をつけておく(《表 1.4》参照)
《表 1.4》
A
B
左
直進
右
左
−1 , −1
0 , −1
−11,−11
直進
−1 , 0
−10,−10
−1 , 0
右
−11,−11
0 , −1
−1 , −1
(注意)最大の利得が複数ある場合はすべてに印をつけておくこと
次にBさんの立場で考え、同様に最適反応をチェックする
《表 1.5》
A
B
左
直進
右
左
−1 , −1
0 , −1
−11,−11
直進
−1 , 0
−10,−10
−1 , 0
《表 1.6》
A
右
−11,−11
0 , −1
−1 , −1
←横で比較
B
左
直進
右
左
−1 , −1
0 , −1
−11,−11
直進
−1 , 0
−10,−10
−1 , 0
右
−11,−11
0 , −1
−1 , −1
《表 1.4》と《表 1.6》を組み合わせると、次の《表 1.7》のようになる
《表 1.7》
A
B
左
直進
右
左
−1 , −1
0 , −1
−11,−11
直進
−1 , 0
−10,−10
−1 , 0
右
−11,−11
0 , −1
−1 , −1
プレーヤー全員について印がついている状態(この例では印のついた所がたまたま一致している)
=最適反応である戦略をプレーヤー全員がとっている状態
=ナッシュ均衡
7
2007 年度 現代法過程論レジュメ
C.ナッシュ均衡
ナッシュ均衡(Nash equilibrium)
各プレーヤーのとっている戦略が、互いに「他の人の戦略に対する最適反応」になっている状態。
言い換えると、「自分が一方的に戦略を変更しても何ら得をしない」ということが、プレーヤー
全員について成り立っている状態。
=一方的に行動を変更するインセンティヴを誰ももたない状態
★ナッシュ均衡に関する注意点
(ⅰ) 利得が変化しないならプレーヤーは戦略を変更しない、と仮定する
(ⅱ) 他のプレーヤーのとる行動は所与のもの(固定されたもの)として考える
(ⅲ) ナッシュ均衡は複数存在する場合がある
ナッシュ均衡を《表 1.7》で確認すると…
(Aの戦略,Bの戦略) ←この書き方は今後も使います。
(「行プレーヤーのとる戦略」、「列プレーヤーのとる戦略」)とします。
▼(直進,左)(直進,右)(左,直進)(右,直進)の 4 つがナッシュ均衡
→これらの状況では、AさんもBさんも戦略を変更しようとはしない
例)(直進,左)
Aさんの利得は 0、Bさんの利得は−1
Aさんが直進から左に変えると、Aさんの利得は−1 に減る
〃 直進から右に変えると、Aさんの利得は−11 に減る
Bさんが左から直進に変えると、Bさんの利得は−10 に減る
〃 左から右に変えてもBさんの利得は変わらない(上記注意点(ⅰ)参照)
▼その他の組み合わせはナッシュ均衡ではない
→これらの状況では、AさんかBさんのどちらかが戦略を変更しようとするはず
例)(左,左)
Aさんの利得は−1、Bさんの利得も−1
Aさんが左から直進に変えると、Aさんの利得は 0 に増える
あるいは、Bさんが左から直進に変えると、Bさんの利得は 0 に増える
※2人が同時に直進に変更すると利得は下がってしまいますが、「相手が戦略を変更しないこと」を前提
として考えればよい(上記注意点(ⅱ)参照)ので、均衡を調べるときはそのことを気にする必要はあり
ません。
《表 1.8》
A
B
左
直進
右
左
−1 , −1
−1 , 0
−11,−11
直進
0 , −1
−10,−10
0 , −1
右
−11,−11
−1 , 0
−1 , −1
8
2007 年度 現代法過程論レジュメ
★ナッシュ均衡が複数あるケース(8 ページ注意点(ⅲ)参照)
最終的にどの均衡に落ち着くかは、初期状態がいずれであるか、そしてどのようなプロセ
スをたどるかに依存する(経路依存性;path dependence)。ただし、ある均衡にいったん
落ち着くとそこからは動かない。
・《表 1.8》参照
・どの均衡になるかを予測するには別の道具立てが必要になる(後の章で述べる予定)
【練習問題2】
【練習問題1】で作ったゲームのナッシュ均衡を求めてください。
【練習問題3】
次の(1)∼(5)のナッシュ均衡をすべて見つけてください。
(1)
2
(2)
L
1
T
B
R
5,
3,
(3)
0
0
1,
2,
1
3
2
T
M
B
2,
1,
4,
1,
3,
4,
9,
6,
R
3
1
3,
1,
L
3
2
4
T
M
B
1
1
3
2
R
3
9
8
(5)
T
B
(4)
L
3,
4,
2,
C
7
2
5
2,
3,
4,
R
5
0
6
1,
3,
3,
2
1
0
2
L
1
L
2
1
2
T
M
B
2,
0,
3,
C
2
0
2
0, 0
0, 0
−2, 4
R
−1, 2
0, 1
0, 0
※各セルの左側の数字がプレーヤー1の利得、右側の数字がプレーヤー2の利得です。
9
2007 年度 現代法過程論レジュメ
【練習問題4】
歩行者と運転者がいる状況を考え、次のような仮定を置きます。
・事故が起きると、歩行者だけがケガをする。(−100)
・歩行者も運転者も注意を怠ると、事故が発生する確率は 70%となる。
(したがって、歩行者の負う期待損害は 70)
・運転者だけが注意を怠ると、事故が発生する確率は 50%となる。
・歩行者だけが注意を怠ると、事故が発生する確率は 20%となる。
・歩行者も運転者もちゃんと注意を払っていれば、事故は発生しない。
・注意を払うときのコストはそれぞれ 5 ずつである。
(1)∼(3)それぞれの場合の利得表を作り、ナッシュ均衡を求めてください。各プレーヤーの戦略は「注
意する」「注意しない」とします。
(1) 法的ルールが存在しない。
(2) 運転者が注意を払っていない場合にのみ、運転者が損害額を補償する(過失責任ルール)。
(3) 運転者が注意を払ったか否かに関係なく、運転者が損害額を補償する(無過失責任ルールないし
厳格責任ルール)。
なお、補償額は事故によって生じた損害額全部とします。
1.2 囚人のディレンマ
A.支配戦略
囚人のディレンマのストーリー
2 人の被疑者(PとQ)が別々の取調室に入れられている(したがって、PとQは話し合うことができ
ない)。検察官は 2 人が重罪を犯したのだろうと思っているが、裁判にかけて重罪で有罪にできるほど
の十分な証拠はない。そこで、この検察官は各被疑者に「黙秘」「自白」の 2 つの選択肢を示す。双方
とも黙秘すれば軽い罪で起訴するしかないため、それぞれ 1 年ずつの懲役となる。もし一方が黙秘して
他方が自白すれば、自白した方は証拠を提供してくれたということで 3 ヵ月の懲役に減軽され、反対に
黙秘した方は懲役 10 年の判決を受けることになる。そして両方とも自白した場合は 8 年ずつの懲役判
決を受ける3。
《表 1.9》囚人のディレンマ(prisoner’s dilemma)
Q
P
黙秘
自白
黙秘
−1, −1
−10, −1/4
自白
−1/4, −10
−8, −8
※単位は年
3
Luce and Raiffa, GAMES AND DECISIONS: INTRODUCTION AND CRITICAL SURVEY (1957) より。
10
2007 年度 現代法過程論レジュメ
前節と同様に最適反応およびナッシュ均衡を調べると、
《表 1.10》
Q
P
黙秘
自白
黙秘
−1, −1
−10, −1/4
自白
−1/4, −10
−8, −8
⇒
ナッシュ均衡は(自白,自白)
この例では、
相手が「黙秘」を選択している場合
相手が「自白」を選択している場合
…
…
「自白」が最適反応
「自白」が最適反応
↑
常に「自白」が最適反応
支配戦略(dominant strategy)
相手の戦略がどれであるかにかかわらず、常に最適反応になる戦略。
支配戦略均衡(dominant strategy equilibrium)
プレーヤー全員が支配戦略をとっている状態。
囚人のディレンマでは「自白」が支配戦略であり、(自白,自白)が支配戦略均衡となる
=相手がどの戦略を選択しようと、自分は「自白」を選択する方が得
★ナッシュ均衡と支配戦略均衡の関係
支配戦略均衡はナッシュ均衡の特殊ケース
支配均衡が存在すれば、その点は必ずナッシュ均衡でもある
ナッシュ均衡
支配戦略均衡
【練習問題5】
次の(1)・(2)の支配戦略および支配戦略均衡をすべて見つけてください。
(1)
(2)
2
L
1
T
B
3,
2,
L
R
3
3
5,
4,
4
7
1
11
T
M
B
1,
4,
3,
3
0
2
2
C
4, 5
5, 2
2, 4
R
1,
2,
0,
4
1
3
2007 年度 現代法過程論レジュメ
B.囚人のディレンマの意味とパレート最適
囚人のディレンマの基本形
プレーヤー1
C(協力)
D(裏切り)
プレーヤー2
C(協力)
D(裏切り)
R, R
S, T
T, S
P, P
・T > R > P > S,
2R > T + S
とする
・これは2人プレーヤーの場合だが、N人プレーヤーに拡張することも可能
数値例
プレーヤー1
C
D
プレーヤー2
C
D
2, 2
0, 3
3, 0
1, 1
均衡は(D,D)だが、2 人が協力することができれば双方の利得は増加する
〔(D,D)から(C,C)への移行はパレート改善;下の囲み参照〕
しかし(C,C)は均衡ではないので、その点に落ち着くことはない
囚人のディレンマの特徴
① Dが支配戦略になっている
② 自分がDを選択すると相手の利得は下がる
③ 双方が自分の利益を追求する結果、パレート劣位の状態に陥る
★パレート改善(Pareto improvement)
誰の効用も低下させることなく、少なくとも1人の効用を上昇させること
「パレート劣位の状態」
パレート改善
「パレート優位の状態」
★パレート最適(Pareto optimal) → パレート最適な状態は「パレート効率的」
「他の誰かの効用を下げることなく誰かの効用を上げる」ことが不可能な状態。
言い換えると、パレート改善がこれ以上できないという状態。
【練習問題6】
囚人のディレンマにおける戦略の組み合わせの中で、パレート最適となっているものをすべて挙げて
ください。また、【練習問題5】のゲームでパレート最適になっている点も探してください。
12
2007 年度 現代法過程論レジュメ
【練習問題7】
A・Bの 2 人しかいない社会があり、実現可能な状態が次の 5 つだけであったとします。下記のカッ
コ内は(Aの効用, Bの効用)を表します。
状態 α
(15, 60)
状態 β
(30, 20)
状態 γ
(30, 35)
状態 δ
(20, 65)
状態 ε
(40, 10)
(1) パレート優位・劣位の関係にある組み合わせをすべて挙げてください。
(2) α∼ε の中でパレート最適となっているものをすべて選んでください。
C. 法の役割(その1)――利得構造の変換
[囚人のディレンマの例]
・対立関係にある国家間での軍拡競争
・担当範囲や責任の所在が明確にされていない共同作業
・契約法がない状況での約束の遵守
【練習問題8】
囚人のディレンマの具体例(上記の例を除く)を挙げてください。
契約法の役割(のひとつ)
利得構造を変換し、両当事者をパレート最適な均衡へと誘導する
例)AがBに対し、ある財xを 10000 円で売るという約束をした。
Aはxを 7000 円で評価し、Bはxを 12000 円で評価している。
諸事情により、AとBは同時に履行することができないとする。
x
A
B
売 主
買 主
10000 円
約束が守られれば、Aは 3000 円、Bは 2000 円の利益を得る
A: 10000[売買代金] − 7000[Aの評価額]= 3000
B: 12000[Bの評価額]− 10000[売買代金] = 2000
↑
ここがプラスでないと、そもそも約束をしないはず
13
2007 年度 現代法過程論レジュメ
◆約束を破って持ち逃げしても損害賠償義務が課されない場合
《表 1.11》
A
B
履行
不履行
履行
3000, 2000
10000, -10000
不履行
-7000, 12000
0, 0
⇒ ナッシュ均衡は(不履行,不履行)
◆不履行時に損害賠償義務が課される場合
売主不履行のときの賠償額を「相手の評価額」(12000 円)、
買主不履行のときの賠償額を「売買代金プラス遅延損害金」(仮に 11000 円とする)
と設定すると
《表 1.12》
B
履行
不履行
A
履行
3000, 2000
4000, 1000
不履行
-2000, 2000
-1000, 1000
⇒ ナッシュ均衡は(履行,履行)
※ここでは裁判や交渉にかかるコストは無視しています。
※上の表では(履行,不履行)のときのAの利得を 4000(=11000−7000)としていますが、代金の支払
いが遅れることで実際にAに損害が生じるとすると(普通はそうなるでしょう)、Aの利得は 4000 未
満に下がります。ただし結論に大きな違いは出ません。
※《表 1.11》でも《表 1.12》でも、ナッシュ均衡は同時に支配戦略均衡にもなっています。
[双務契約の基本構造]数値は 12 ページの「数値例」を使用
2
履行(C)
不履行(D)
1
履行(C)
2, 2
0, 3
不履行(D)
3, 0
1, 1
2
1
履行(C)
不履行(D)
履行(C)
2, 2
3−a, 0+a
不履行(D)
0+b, 3−b
1−a+b, 1+a−b
a:プレーヤー1 から 2 に支払われる賠償額
b:プレーヤー2 から 1 に支払われる賠償額
【練習問題9】
上の例で、a および b がどの範囲にあれば(履行,履行)が唯一のナッシュ均衡となるでしょうか。
14
2007 年度 現代法過程論レジュメ
1.3 スタグハントゲームとチキンゲーム
A.スタグハントゲーム(stag hunt game; 鹿狩りゲーム)
スタグハントゲームのストーリー
コミュニケーションがとれない状況にある 2 人のハンター(PとQ)がいる。各ハンターは「協力し
てシカを捕まえる」か「ひとりでウサギを捕まえる」かを選ぶことができる。協力すれば確実にシカを
捕まえて2人で分け合うことができ、それぞれ利得2を得る。ひとりでウサギを捕まえに行くと、その
ハンターは利得1を得る。しかし、ひとりでシカを捕まえることは不可能であり、単独でシカを捕まえ
に行くと利得はゼロになる4。
《表 1.13》スタグハントゲーム
Q
シカ
P
ウサギ
シカ
2,
2
0,
1
ウサギ
1,
0
1,
1
スタグハントゲームは《表 1.14》の「安心ゲーム」と構造的に似ており、以下の説明はスタグ
ハントゲームにも安心ゲームにも同様に当てはまる(スタグハントゲームと安心ゲームが同義
に用いられる場合もある)。
《表 1.14》安心ゲーム(assurance game)
2
L
1
3,
2,
T
B
R
0, 2
1, 1
3
0
スタグハントゲームの最適反応およびナッシュ均衡は次の通り。
《表 1.15》
Q
シカ
P
ウサギ
シカ
2,
2
0,
1
ウサギ
1,
0
1,
1
⇒
4
ナッシュ均衡は(シカ,シカ)と(ウサギ,ウサギ)5
この話はジャン=ジャック・ルソー『人間不平等起原論』の中の一節を題材としています(中公文庫版では 84 ページ
を参照)。
5
厳密に言うとナッシュ均衡はもうひとつあるのですが(2 人とも 1/2 の確率でシカ、1/2 の確率でウサギを選択する混
15
2007 年度 現代法過程論レジュメ
2 つの均衡のうち、どちらの結果に落ち着くか?
・相手も「シカ」を選んでくれるという確信がお互いにあれば、おそらく(シカ,シカ)と
いう結果になる
・その一方で、「自分に保証される利得を最大にしたい」という希望を各ハンターがもって
いるとすれば6、
シカを選ぶ
→ 相手がウサギを選んでしまうと自分の利得は 0 になる
ウサギを選ぶ → 相手がどちらをとろうと自分は利得 1 を確保できる
となるので、(ウサギ,ウサギ)となる可能性がある
スタグハントゲーム(および安心ゲーム)の特徴
① ナッシュ均衡が複数存在し、ある均衡が他の均衡と比べてパレート優位になっている
② 「パレート優位な状態をもたらす選択肢を相手がとってくれる」と確信できるかどうかで
結果は大きく変わってくる
★囚人のディレンマとスタグハントゲームの共通点と相違点
囚人のディレンマ
L
1
スタグハントゲーム
2
2,
3,
T
B
L
R
0, 3
1, 1
2
0
2
1
T
B
2,
1,
<共通点>
全体として最も望ましいのは(T,L)
相手に別の行動をとられると、自分は損失を受ける
<相違点>
囚人のディレンマ
2
0
R
0, 1
1, 1
(T, L)からの逸脱で得をする
スタグハント
(T, L)から逸脱しても得しないが、自分にとって最悪の事態は回避できる
現実の事例では、囚人のディレンマなのかスタグハントなのか分かりにくいケースが多い
例)年金保険料
1
2
払う
払わない
払う
2, 2
?
払わない
?
1, 1
※便宜上 2 人ゲームとして表現していますが、何人になっても構造は同じです。
【練習問題10】
スタグハントゲーム(あるいは安心ゲーム)の具体例を挙げてください。
合戦略ナッシュ均衡)、ここでは純粋戦略だけを考えます。以下でも同じです。
6
このように、
「各選択肢をとったときに生じうる最悪の事態をそれぞれ考え、そのときの利得が最も高い選択肢をとる」
つまり「利得の最小値が最大になっている選択肢をとる」という選択基準をマキシミン原理(最小値を最大にするという
こと。最大損失を最小にするという意味で、ミニマックス原理ともいう)と呼びます。
16
2007 年度 現代法過程論レジュメ
B.チキンゲーム(chicken game;弱虫ゲーム)
チキンゲームのストーリー
2 人のプレーヤー(PとQ)が別々の車に乗り、お互いの車に向かって一直線に走り出す。衝突を回
避するためにはハンドルを切らねばならないが、相手より先に切ってしまうと「チキン(臆病者、弱虫)」
と呼ばれて屈辱を受けることになる。これに対し、ハンドルを切らずにそのまま直進すれば勇気がある
として称賛される。もちろん、どちらもハンドルを切らずに直進すると衝突し、2 人とも大怪我をして
しまう。各プレーヤーにとっていちばん悪いのは「2 人とも直進」、次に悪いのは「自分だけ回避」で
ある。最も好ましいのが「自分だけ直進」であることは言うまでもない7。
《表 1.16》チキンゲーム
Q
回避
P
0,
回避
1,
直進
0
−1
直進
−1,
1
−10, −10
チキンゲームは《表 1.17》の「タカハトゲーム」と構造的に同じであり、以下の説明はチキン
ゲームにもタカハトゲームにも同様に当てはまる8。
《表 1.17》タカハトゲーム(Hawk-Dove game)
2 人のプレーヤー間で資源を分け合うが、「ハト(譲歩策)」と「タカ(強硬策)」のいず
れかを選択できる。「ハト」同士なら均等に分け合い、「ハト」「タカ」1 人ずつなら「タ
カ」を選択した方が多くを得る。最悪なのは「タカ」同士になる場合で、争いの過程で資源
を食いつぶし、双方の利得はゼロになってしまう。
2
1
7
ハト
タカ
ハト
2, 2
3, 1
タカ
1, 3
0, 0
2 台の車が崖や岸壁に向かって走り、先にブレーキをかけた方が「チキン」と呼ばれる、というバージョンの方が有名
です。けれどもこのバージョンの場合、利得構造は《表 1.16》のようにはなりません(どうなるでしょうか。余力と時
間のある方は考えてみてください)。
8
ただし、タカハトゲームは進化ゲーム理論の文脈で出てくるのが普通です。進化ゲーム理論はこの授業では扱いません
が、考え方の概要だけを示しておきます(興味のある方は専門書を参照してください)。自然界に「ハト」戦略をとる個
体と「タカ」戦略をとる個体が存在するとします。そのとき、「ハト」と「タカ」の分布はどのように変化していくのか、
というのが進化ゲーム理論の問題関心です。まず、《表 1.17》の利得を「繁殖力(適応度;どれだけ多くの子孫を残せ
るかを表したもの)」と考えます。そして、各個体は他の個体のどれかとランダムに遭遇すると仮定します。たとえば「タ
カ」と「ハト」が出会うと、「タカ」は資源をたくさん奪えるので相対的に多くの子孫を残せますが、「ハト」はあまり
多くの子孫を残せません。このようなプロセスを繰り返していくと、《表 1.17》のケースでは、「『ハト』戦略をとる
個体と『タカ』戦略をとる個体が半分ずつ存在する」という状態が進化論的に安定となります(計算は省略)。以上の議
論では合理的な行為者を想定していないという点に注意してください。進化ゲームの枠組みをうまく使うと、合理的行動
(2 ページ参照)を仮定せずに行動の分布の変化をモデル化することが可能になります。
17
2007 年度 現代法過程論レジュメ
チキンゲームの最適反応およびナッシュ均衡は次の通り。
《表 1.18》
Q
回避
P
回避
直進
0,
直進
0
−1,
−1
1,
⇒
1
−10, −10
ナッシュ均衡は(回避,直進)と(直進,回避)
2 つの均衡のどちらに落ち着くかはこれだけでは予測できない
チキンゲーム(およびタカハトゲーム)の特徴
① 強硬策同士は各プレーヤーにとっても(そして全体的に見ても)最悪の結果をもたらす
② ナッシュ均衡が複数存在し、どちらの均衡が好ましいかについては各プレーヤー間で意見
が一致していない
【練習問題11】
チキンゲーム(あるいはタカハトゲーム)の具体例を挙げてください。
★参考――男女の争い(battle of the sexes)
上記②に関連して…
P: F1 好きの妻
Q: ミュージカル好きの夫
「夫婦揃って同じ場所に行く」ということを優先させたいが、どちらの場所に行きたい
かに関しては意見が違っている
Q
F1
P
ミュージカル
F1
3,
2
0,
0
ミュー
ジカル
0,
0
2,
3
・ナッシュ均衡は?
・夫婦で異なる場所に行ってしまうのを防ぐためにはどうすればよいか?
18
2007 年度 現代法過程論レジュメ
C.法の役割(その2)――他者の行動に関する期待の形成
▼スタグハントゲームの状況
例)取り付け騒ぎ――昭和金融恐慌
1927(昭和 2)年 3 月 14 日の衆議院予算委員会で、震災手形の処理をめぐり、野党の立憲政友会
が与党の憲政党を攻撃していた。立憲政友会が業績の悪い企業の名を明らかにするよう執拗に求めてい
たところ、信用不安を恐れて慎重に答えていたはずの片岡直温蔵相がうっかり「今日正午頃において、
東京渡辺銀行がとうとう破綻をいたしました」と発言してしまう。東京渡辺銀行はたしかに(放漫経営
がたたって)危機に瀕していたが、この時点ではかろうじて破綻まではしていなかった。この片岡蔵相
の失言を受けて、東京渡辺銀行の経営陣は渡りに舟とばかりに翌日から休業することを決定した(つい
でに、姉妹銀行の「あかぢ貯蓄銀行」も休業した)。
これを受けて、全国で「銀行は危機に陥っている」「もし銀行が潰れたら預金が引き出せなくなる」
という不安が広がり、取り付け騒ぎが発生した。この取り付け騒ぎによって、中井銀行、左右田銀行、
八十四銀行、中沢銀行、村井銀行が次々と休業に追い込まれる。
なおはる
《表 1.19》取り付け騒ぎ(2人ゲーム版)
仮定 ・みんなが預金をしていれば銀行は存続でき、しかも預金に利息がつく
・預金を払い戻せるだけのお金は銀行に残されている
・しかし、どちらか一方または両方のプレーヤー(預金者の半分)が預金を引き出す
と銀行の資金が減り、やがて銀行は潰れてしまう
Q
P
預ける
引き出す
預ける
2, 2
1, 0
引き出す
0, 1
1, 1
「他の人が預金を引き出す」と各プレーヤーが予想
⇒(引き出す,引き出す)の均衡
「他の人は預金を引き出さずに預けたままにする」と各プレーヤーが予想
⇒(預ける,預ける)の均衡
他者の行動に対する信頼を確保できるか否かで結果は変わる
一般に、プレーヤーの数が増えると信頼は確保しにくくなり、不確実性が高まる
→それでは、どのように「他者の行動に対する信頼」を確保すればよいか?
説得、情報提供、サンクション(正 or 負)、連鎖反応食い止めのための施策 etc.
←☆は「今はできなくても構いません、後で戻ってきて考えてください」という意味です。
【練習問題12】☆
取り付け騒ぎの例では、具体的にどのような政策をとれば望ましい均衡に落ち着くでしょうか。
※ここでは取り付け騒ぎをスタグハントゲームで表現しましたが、場合によっては囚人のディレンマにも
なります(なぜでしょう?
16 ページの記述を参考にしてください)。
19
2007 年度 現代法過程論レジュメ
▼チキンゲームの状況
例)交渉――キューバ危機
1959 年のキューバ革命の後、キューバはアメリカと距離をとるようになる一方で、ソ連に接近する
ようになった。1962 年、キューバの了承のもと、ソ連はキューバ国内に核ミサイルを配備するという
作戦(アナディル作戦)を開始する。同年 10 月、偵察によってミサイルの存在を確認したアメリカは、
ミサイルの撤去を要求して海上封鎖を行った。その後、アメリカも核ミサイルを準備し、それと同時に
ソ連に対してミサイル撤去の交渉を始める。
ソ連の第一書記であったフルシチョフは、「アメリカがキューバに侵攻しない」という条件でミサイ
ルの撤去を書簡で提案、アメリカ大統領ケネディはこれを受け入れた。この間、アメリカの偵察機がキ
ューバ上空で撃墜されるという事件が起きるが、フルシチョフが譲歩し、米ソの衝突の危機は回避され
た。ソ連がキューバに建設中だった基地を解体してミサイルを撤去、アメリカも海上封鎖を解除した。
《表 1.20》キューバ危機
ソ連
アメリカ
ミサイル撤去
ミサイル撤去
0, 0
瀬戸際戦略
−5, 5
瀬戸際戦略
5, −5
−100, −100
※瀬戸際戦略(brinkmanship; 瀬戸際戦術、瀬戸際外交)
衝突も辞さないと覚悟して緊張を高め、相手に譲歩を迫るという方法
両国の選好順序
① ≻ ② ≻ ③
①自分が強硬策、相手が譲歩策
② 〃 譲歩策、 〃 譲歩策
③ 〃 譲歩策、 〃 強硬策
④ 〃 強硬策、 〃 強硬策
≻ ④
→
→
→
→
核戦争回避 + 威信の保持
核戦争回避
核戦争回避 + 威信の低下
核戦争
交渉では、「双方が強硬策をとると結局はどちらも損をしてしまう」という場面が多い
[法律に関係のある交渉の例]
・離婚のための協議
・使用者と労働組合の話し合い
・会社の合併
・土地の境界をめぐる紛争
→どのようにすれば(強硬,強硬)という組み合わせを回避することができるか?
【練習問題13】☆
法的交渉の場面において、具体的にどのようなことをすれば強硬策同士の衝突を回避できるでしょう
か。そのような衝突を回避するために役立っていると考えられる制度や仕組みを挙げてください。
スタグハントゲームおよびチキンゲームでの法の役割(まとめ)
◎「他の人の行動に関する予想」を形成することによって、望ましい均衡を導く
◎人々の行動を調整(coordinate)して、社会的な損失を未然に防ぐ
20
2007 年度 現代法過程論レジュメ
1.4 展開形による表現――逐次手番ゲーム
※…という見出しですが、展開形は逐次手番ゲームだけでなく同時手番ゲームも表現できます。
A.展開形表現の構成要素
5 ページの[例 1]の別バージョン
[例 1 ]Aさんは道を歩いていたが、Bさんと正面衝突しそうになっている。
*「左によける」「右によける」「そのまま進む」のいずれかを選択
ただし、Aさんが先に動き、BさんはAさんの行動を見た後で自分の行動を決定することがで
きる(Bさんはもちろん、Aさんもそのことを知っているとする)。
展開形(extensive form)…意思決定の順序とその結果について、時間を追って記述
《図 1.1》例1′の展開形による表現
B
左
直進
右
B
左
直進
右
左
A
直進
左
直進
右
右
B
(−1 ,−1)
(−1 , 0)
(−11,−11)
( 0, −1)
(−10,−10)
( 0, −1)
(−11,−11)
(−1, 0)
(−1, −1)
↑
↑
Aの利得
Bの利得
◆ゲームの樹(game tree)
枝(ブランチ)
行動の名称を横に書いておく
終点
決定点(意思決定ノード)
意思決定を行うプレーヤーを横に書いておく
対応する利得を書く
決定点と終点を合わせてノード(node)という
・1 個の決定点では 1 人のプレーヤーだけが意思決定を行う
・枝が入ってこない点(根;root)が 1 個だけある
・どの点に関しても、根から枝をたどってその点に至る経路が 1 つだけ存在する
21
2007 年度 現代法過程論レジュメ
◆情報集合(information set)
5 ページ[例 1]のような同時手番ゲームを展開形で表現するにはどうすればよいか?
「同時手番」 …
他のプレーヤーのとった行動を見ずに決定する
=相手の過去の行動に関する情報がない
[例 1]に即して述べると、
Aさんが「左」「直進」「右」のいずれを選択したかが分からない
=Bさんは自分がどの決定点にいるのか区別できない
⇒「区別できない」決定点の集合を囲むことによって9、Bさんのもっている情報を表す
∥
情報集合
《図 1.2》例1の展開形による表現
左
直進
右
B
左
A
左
直進
右
直進
左
直進
右
右
(−1 ,−1)
(−1 , 0)
(−11,−11)
( 0, −1)
(−10,−10)
( 0, −1)
(−11,−11)
(−1, 0)
(−1, −1)
《図 1.3》は強いて書けば次のようになる
《図 1.3》例1′の展開形に情報集合を付加したもの
B
h1
左
直進
右
h2
左
直進
右
左
A
直進
B
h3
右
B
左
直進
右
(−1 ,−1)
(−1 , 0)
(−11,−11)
( 0, −1)
(−10,−10)
( 0, −1)
(−11,−11)
(−1, 0)
(−1, −1)
以下では、情報集合が 1 個の決定点しか含まないときは囲みを省略する10
9
10
文献によっては、決定点を点線で結んで情報集合を表しています。どちらの描き方でも結構です。
どの情報集合も 1 つの決定点しか含まないゲーム、つまり、各プレーヤーが過去にとった行動がすべて分かるゲーム
を完全情報(perfect information)ゲームと呼びます。これに対し、複数の決定点を包含する情報集合が存在するゲーム
22
2007 年度 現代法過程論レジュメ
◆展開形表現における戦略
各情報集合で選択する行動をあらかじめすべて記述した行動計画
たとえば[例 1 ]の場合(《図 1.3》)
「情報集合h1では『直進』、h2では『右』、h3では『左』」
というように行動を指定したものが「戦略」となる11
cf. [例 1]の場合(《図 1.2》)は情報集合が 1 つしかないので、「右」「直進」「左」が戦略
B.バックワード・インダクションと「カラ脅し」
※以下、しばらくは完全情報ゲーム(どの情報集合も決定点を 1 つしか含まないゲーム)を扱います。
[例 4]HさんはGさんと中古パソコンの売買契約を結び、Gさんに代金を支払った。1 ヵ月後に目的
物をGさんからもらうことになっている。GさんとHさんが住んでいる国の訴訟にかかるコス
トは非常に高く、利得構造は《図 1.4》のようになっているとする。
《図 1.4》
訴え提起
不履行
G
H
泣き寝入り
( −5, −5 )
( 5, 0 )
履行
( 0, 10 )
↑ ↑
Gの利得
Hの利得
《図 1.4》のゲームの解き方
ゲームの終わりの方から順に見ていき、プレーヤーの意思決定を考える
①Hさんの意思決定
「訴え提起」と「泣き寝入り」で選択
→高い利得をもたらす「泣き寝入り」を選ぶはず
②Gさんの意思決定
①でのHの選択を見越したGさんは
不履行 → Gの利得 5
履行
→ Gの利得 0
となるので、「不履行」を選ぶはず
以上のような推論のしかたをバックワード・インダクション(backward induction;後ろ向き帰納
法)という
は不完全情報(imperfect information)ゲームと呼ばれます。
11
実際にその情報集合に到達するか否かにかかわらず、全情報集合について行動を指定しなければなりません。
23
2007 年度 現代法過程論レジュメ
《図 1.5》バックワード・インダクション
訴え提起
不履行
( −5, −5 )
H
G
( 5, 0 )
泣き寝入り
履行
( 0, 10 )
というわけで、(不履行,泣き寝入り)という結果になると予想できる
ところが、展開形表現ではなく標準形表現を用いて分析すると、やや奇妙なことが起こる
《図 1.4》のゲームを標準形で表して分析すると…
H
G
訴え提起
0, 10
履行
不履行
泣き寝入り
0, 10
−5, −5
⇒
5,
0
ナッシュ均衡は(履行,訴え提起)と(不履行,泣き寝入り)
(不履行,泣き寝入り)の他に(履行,訴え提起)も均衡として出てきてしまう
☆バックワード・インダクションを用いると(不履行,泣き寝入り)が唯一の解になるのに、どうして(履行,訴
え提起)もナッシュ均衡になっているのか?
(履行,訴え提起)の状態を解釈すると、
Hさん:「私は訴訟を起こしますから、不履行を選ぶとあなたは損しますよ」
Gさん:「そうか、それなら履行しよう」
という状態だということになる。すなわち、Hさんは「自分が意思決定できる場面になれば
訴え提起を選択しますよ」と言って脅しをかけているのである(《図 1.6》参照)。
だが、この脅しは信じるに値するだろうか?
《図 1.6》(履行,訴え提起)のナッシュ均衡(脅しが効いている状況)
訴え提起
不履行
G
H
泣き寝入り
履行
( 0, 10 )
24
( −5, −5 )
( 5, 0 )
2007 年度 現代法過程論レジュメ
Hさんが決定点に到達した時点で考えると、「訴え提起」を選択するのは不合理
(Hさんが合理的であれば、「訴え提起」ではなく「泣き寝入り」を選択するはず)
→つまり、先ほどのHさんの脅しは信憑性のない脅し(カラ脅し、ハッタリ)だという
ことになる
※上述の通り、意思決定の流れを考えると、カラ脅しの効いた(履行,訴え提起)は不合理な均衡
です。しかし、ナッシュ均衡は意思決定の時間差を考慮した概念ではありませんから、このよう
なカラ脅しの効いた均衡を排除することができません。バックワード・インダクションの方法を
使うとこうした均衡の排除が可能なのですが、《図 1.2》のように、決定点を複数含む情報集合が
存在するゲーム(不完全情報ゲーム)ではバックワード・インダクションの方法自体が使えませ
ん(試してみてください)。バックワード・インダクションに頼らずに不合理な均衡を取り除く
にはどうすればよいか、ということで考え出されたのが次のサブゲーム完全均衡の概念です。
【練習問題14】
《図 1.3》(22 ページ)のゲームをバックワード・インダクションで解いてください。
【練習問題15】
次の(1)・(2)のゲームをバックワード・インダクションで解いてください。また、それぞれのゲームを
標準形で表現し、ナッシュ均衡を求めてください。
(1)
現状維持
企業B
企業A
( 2, 2 )
参入
値下げ
不参入
(−1, −1 )
( 0, 4 )
↑ ↑
A
B
(2) [20 ページ《表 1.20》の別バージョン]
ソ連
ミサイル撤去
( 0, 0 )
瀬戸際戦略
(−5 , 5 )
ミサイル撤去
( 5, −5)
ミサイル撤去
アメリカ
瀬戸際戦略
ソ連
瀬戸際戦略
(−100, −100)
↑
↑
アメリカ
25
ソ連
2007 年度 現代法過程論レジュメ
C.サブゲーム完全均衡
◆サブゲーム(subgame;部分ゲーム)
次の条件すべてを満たす展開形の一部分を「サブゲーム」と呼ぶ
(ⅰ)1 つの決定点から始まる
(ⅱ)それ以降の枝やノードを全部含む
(ⅲ)情報集合が外にはみ出していない
なお、全体のゲームも「サブゲーム」と考える
←この例では
サブゲームは 3 つ
【練習問題16】
ゲームの樹および情報集合が次のようになっているとき、サブゲームはいくつあるでしょうか。
(1)
(2)
◆サブゲーム完全均衡(subgame-perfect equilibrium;部分ゲーム完全均衡)
すべてのサブゲームでナッシュ均衡になっている均衡を「サブゲーム完全均衡」という
[例 4]を使って説明すると、
(不履行,泣き寝入り)のナッシュ均衡
⇒ サブゲーム完全均衡でもある
訴え提起
不履行
G
H
泣き寝入り
履行
( 0, 10 )
26
( −5, −5 )
( 5, 0 )
2007 年度 現代法過程論レジュメ
⇒ サブゲーム完全均衡ではない
(履行,訴え提起)のナッシュ均衡
訴え提起
不履行
G
H
泣き寝入り
( −5, −5 )
( 5, 0 )
履行
( 0, 10 )
このサブゲームでは
ナッシュ均衡になっていない
・このように、「カラ脅しの効いた均衡」はサブゲーム完全均衡とはならない
・過去の履歴が完全に分かるゲーム(=どの情報集合も決定点を 1 点しか含まないゲーム=完
全情報ゲーム)では、バックワード・インダクションの方法でサブゲーム完全均衡を求める
ことができる
・「カラ脅しをカラ脅しではないようにさせる方法」については後の章で触れる予定
ナッシュ均衡
サブゲーム完全均衡
まとめ
同時手番ゲーム
(静学ゲーム)
標準形表現
ナッシュ均衡
逐次手番ゲーム
(動学ゲーム)
展開形表現
サブゲーム完全均衡
▼展開形表現は標準形表現より情報量が多い
▼逐次手番ゲームを標準形で表現すると重要な情報が消えてしまう
▼結果として、ナッシュ均衡の中に合理的でないものが混ざってくることがある
ナッシュ均衡のうち、よりもっともらしい均衡を選り分けること=ナッシュ均衡の精緻化
27
2007 年度 現代法過程論レジュメ
【練習問題 おまけ】 ホテリングの立地ゲーム
甲地点と乙地点は一直線の道で結ばれており、道沿いに(非現実的かもしれませんが)同じ密度で一
様に住民が存在するとします。この道沿いに、同じ商品を扱うA社とB社がそれぞれ自分の店を出そう
と考えています。
・住民は自分の家から近い方の店に行く。同じ距離の場合はどちらか一方をランダムに決める。
・A社とB社は客をなるべく多く集めたいと思っている。
・A社とB社はお互いの存在や目的を知っている。
・A社とB社以外の会社が参入してくる可能性はない。
このとき、A社とB社はどの位置に店を構えることになるでしょうか。
甲
乙
Bibliographical Note
4 ページで挙げた文献の他、本章の記述に関連するものとして以下の文献を挙げておきます。余力のある
方はどうぞ。
ゲーム理論については、
■武藤滋夫『ゲーム理論入門』(日経文庫、2001 年)
■岡田章『ゲーム理論』(有斐閣、1996 年)←この本の内容は高度です
■ディキシット・ネイルバフ『戦略的思考とは何か:エール大学式「ゲーム理論」の発想法』
(菅野隆・嶋津祐一訳、TBS ブリタニカ、1991 年)
■梶井厚志『戦略的思考の技術:ゲーム理論を実践する』(中公新書、2002 年)
その他、最近はいろいろな形の入門書が出版されていますので、そちらも参考にしてください。なお、こ
の授業で紹介した内容は非協力ゲームと呼ばれる分野に属します。「協力行動を前提とせず、プレーヤーが
独自に意思決定する場面」を扱うのが非協力ゲームです。それに対し、協力ゲームでは「プレーヤーの間で
話し合いと合意がなされ、合意が拘束力をもつような場面」を扱います(これだけではイメージしにくいと
思いますが、詳しくは上記専門書に譲ります。もっとも、これらは相互に関連していますから、ことさら厳
密に区別する必要はないです)。以上のことを頭の片隅に入れておくと、文献を探す際に少し楽になるかも
しれません。
囚人のディレンマをめぐる議論に関しては、
■パウンドストーン『囚人のジレンマ:フォン・ノイマンとゲームの理論』(松浦俊輔訳、青土社、1995 年)
スタグハントゲームに関してはあまり本がないのですが、
■Skyrms, Stag Hunt and the Evolution of Social Structure, Cambridge University Press, 2003
を挙げておきます。
また、次の本はキューバ危機を分析した古典です。
■アリソン『決定の本質:キューバ・ミサイル危機の分析』(宮里政玄訳、中央公論新社、1977 年)
28