第2章 同時手番のゲーム (PDF) - J-marketing.net produced by JMR

戦略的マーケティングのためのゲーム理論
第2章
同時手番のゲーム
この章では、各人が同時に1) 戦略を決定し、それに応じて利得が決まるゲー
ムを分析する。同時手番のゲーム(games with sequential move)では、ナッ
シュ均衡が重要な均衡概念となる。
2.1
純粋戦略ナッシュ均衡
本節では、はじめに抽象的にゲームを定式化したあと、それを具体的な例
を通して説明することにする。
2.1.1
ゲームの数学的定式化 (1) 戦略型
以下の要素から構成されるゲームを考える。
• プレイヤー i = 1, 2, . . . , N
• 戦略 Ai:プレイヤー i の取りうる選択肢の集合。A ≡ A1 × · · · × AN
• 利得
πi (a1 , a2 . . . , aN ) :プレイヤーの戦略の組に実数を対応させる
関数。π : A → R
ゲームは次のようにプレイされる。
1)
同時手番のゲームのことを静学ゲームともいう。本質は、戦略の決定のタイミングにあるのではなく、相
手の戦略を知ってから自分の戦略を決定するのか、相手の戦略を知らないうちに自分の戦略を決定するのかに
ある。詳細は次節で扱う。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4
第2章
同時手番のゲーム
1. 各プレイヤー i は、他のプレイヤーのとる戦略を知らずに、自分の取り
うる戦略の選択肢 Ai の中から、どれかひとつ(ai ∈ Ai )を選ぶ。
2. 全プレイヤーの選んだ戦略 a1 , . . . , aN に応じて、プレイヤーの利得が決
まる。
プレイヤー N 、戦略 {Ai }i=1,...,N 、利得 {πi }i=1,...,N の三つ組みでゲーム
を表現したものを戦略型(strategic form)または標準型(normal form)と
いい、
G(N, {Ai }i∈N , {πi }i∈N )
などと書く2) 。
2.1.2
ナッシュ均衡
「他のプレイヤーが戦略を変えないならば、自分一人が戦略を変えても得
をしない」ことが、全てのプレイヤーについて生じている状態のことをナッ
シュ均衡という。お互いに最適反応をしている状態、ということもできる。数
式で表すと次のようになる。
¨
∗
定義 1. 下をみたす a =
¥
(a∗1 , . . . , a∗N )
を、ナッシュ均衡という。
πi (a∗ ) = πi (ai , a∗−i )
∀i, ∀ai ,
§
¦
2.1.3
シンプルなゲーム∼利得表による表現
人数が有限(とくに2人)で、戦略の数が有限のゲームは、利得表を用い
て標準型を表現することができる。
2)
記号法について。ベクトルはなるべく太字で表すことにするが、混乱が生じない場合には通常の字体を用
いる場合もある。
a
≡
(a1 , a2 . . . , aN )
πi (a)
≡
πi (a1 , a2 . . . , aN )
また、ゲーム理論ではしばしば以下の記法を用いる。
∗
∗
∗
∗
∗
(ai , a−i ) ≡ (a1 , . . . , ai−1 , ai , ai+1 , . . . , aN )
これは、プレイヤー i だけが戦略 a を選び、その他のプレイヤーは a∗ を選ぶことを表す。)
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.1. 純粋戦略ナッシュ均衡
5
例 1. 囚人のジレンマ (Prisoners’ Dilemma)
ある強盗事件を起こした二人の容疑者が、別件の軽い窃盗容疑で捕
まって別々の部屋で取り調べを受けている。強盗事件については決定的
な証拠がまだあがっておらず、自白がないと起訴することができない。
一計を案じた刑事は容疑者に次のように言った。
「もし二人とも自白しな
ければ、窃盗の罪だけで 2 年の懲役だ。二人とも自白すれば、強盗の罪
で 8 年の懲役だ。だがもし一人が自白して一人が自白しなかったら、自
白した方は大幅に減刑して 1 年にしてやるが、自白しなかった方は 10 年
の刑に処す。どうだ。」容疑者はどのように行動するか?
C
D
自白しない(協調:C )
−2, −2
−10, −1
自白する(裏切り:D)
−1, −10
−8, −8
上の例を、さきにあげた標準型で表すと次のようになる。
プレイヤー i = 1, 2
戦略 A1 = A2 = { 自白する ,自白しない }
利得関数
π1 (C, C) = −2, π1 (C, D) = −10, π1 (D, C) = −1, π1 (D, D) = −8,
π2 (C, C)
= −2, π2 (D, C) = −10, π2 (C, D) = −1, π2 (D, D) = −8.
このゲームのナッシュ均衡を求めてみよう。まず、プレイヤー 2 の戦略を
固定して、それに対してプレイヤー 1 がどのような戦略をとるかを考える。
利得表の上でゲームを解く際には、プレイヤー 2 の戦略に対応する列の上で、
プレイヤー 1 の利得が最も大きくなる所に印をつけると便利である。
プレイヤー 2 が戦略 C をとるとすると(表 2.1)、プレイヤー 1 が C をとっ
た場合の利得は π1 (C, C) = −2、D をとった場合の利得は π1 (D, C) = −1 で
ある。π1 (C, C) < π1 (D, C) であるから、プレイヤー 1 は D を選択すること
がわかる。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
6
第2章
同時手番のゲーム
つぎに、プレイヤー 2 が戦略 D をとるとすると(表 2.2)、プレイヤー
1 が C をとった場合の利得は π1 (C, D) = −10、D をとった場合の利得は
π1 (D, D) = −8 である。π1 (C, D) < π1 (D, D) であるから、プレイヤー 1 は
やはり D を選択することがわかる。
表 2.1: 2 が C なら 1 は?
C
D
C
−2, −2
−10, −1
D
−1, −10
−8, −8
表 2.2: 2 が D なら 1 は?
C
D
C
−2, −2
−10, −1
D
−1, −10
−8, −8
同様に、プレイヤー 2 がどのような戦略をとるかを考える。プレイヤー 1
が戦略 C をとるとすると(表 2.3)、プレイヤー 2 が C 、D をとった場合の
利得はそれぞれ π2 (C, C) = −2、π2 (C, D) = −1 であるから、プレイヤー 2
は D を選択する。
つぎに、プレイヤー 1 が戦略 D をとるとすると(表 2.4)、プレイヤー 2 が
C 、D をとった場合の利得はそれぞれ π2 (D, C) = −10、π2 (D, D) = −8 で
あるから、プレイヤー 2 はやはり D を選択する。
表 2.3: 1 が C なら 2 は?
C
D
C
−2, −2
−10, −1
D
−1, −10
−8, −8
表 2.4: 1 が D なら 2 は?
C
D
C
−2, −2
−10, −1
D
−1, −10
−8, −8
以上をまとめたものが表 2.5 である。相手の戦略を所与としたときに自分の
利得が最も大きくなる戦略に印を付けたので、全てのプレイヤーの利得に印
がついているセルがナッシュ均衡となる。ここでは (D, D) が唯一のナッシュ
均衡となっていることがわかる。
どちらのプレイヤーにとっても、両者とも自白しない方が明らかによいの
だが、プレイヤーがそれぞれに自らの利得を追求する結果、両方とも自白し
てしまうという最悪の結果を招くことになる。囚人のジレンマは、個人の利
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.1. 純粋戦略ナッシュ均衡
7
表 2.5: 囚人のジレンマ:ナッシュ均衡
C
D
自白しない(協調:C )
−2, −2
−10, −1
自白する(裏切り:D)
−1, −10
−8, −8
益の追求と集団の利益3) の追求とが相反する状況を最もシンプルに表したモ
デルである。ゲーム理論において最も有名なモデルであり、政治学や法学・
心理学など他の分野でもしばしば引用される。
2.1.4
やや複雑なゲーム∼反応関数による表現
人数が2人で、戦略・利得が無限個ある場合には、最適反応関数を用いて
均衡を求めるのが便利である。最適反応関数の組をみたす解、すなわち反応
曲線(=最適反応関数のグラフ)の交点がナッシュ均衡となる。
例 2. クールノー競争(Cournot Competition)
2 つの企業1と2(=プレイヤー)が同質な財を生産して市場に供
給している。生産費用は両企業に共通で財 1 単位あたり c であるとし、
固定費用はないとする。企業 i(i = 1, 2) の供給量を qi = 0 と表す。市場
における財の価格 p は(逆)需要関数
p = a − b(q1 + q2 )
で定まるとする。このとき企業 i の利潤関数は、
πi = (p − c)qi
となる。企業1と2は利潤(=利得)の最大化を目的としてそれぞれ独
立に生産量(=戦略)を決定する。どのような生産量が選ばれるか。
上の例を、さきにあげた標準型で表すと次のようになる。
3)
ここでは、囚人の利得を何らかの基準(社会厚生関数)を用いて評価したもの。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
8
第2章
同時手番のゲーム
プレイヤー i = 1, 2
戦略 Ai = {qi ∈ R|0 ≤ qi },
i = 1, 2
利得関数
π1 (q1 , q2 )
= (p − c1 )q1 = (a − b(q1 + q2 ) − c)q1 ,
π2 (q1 , q2 )
= (p − c2 )q2 = (a − b(q1 + q2 ) − c)q2 .
企業 2 の生産量が q2 であるとき、企業 1 の利得が最大になる生産量を求
める。
max π1 (q1 , q2 ) = (a − b(q1 + q2 ) − c)q1
q1
を満たす q1 を求めればよい。一階条件は
∂π1
= a − c − 2bq1 − bq2 = 0
∂q1
これを解くと
1
a−c
q1∗ = − q2 +
≡ R1 (q2 )
2
2b
となる。q2 が変化すると、企業 1 がとるべき q1∗ もそれに応じて変化する。そ
の関係を関数 BR1 (q2 ) という形で表したものを(最適)反応関数と呼ぶ。
同様に、企業 1 の生産量が q1 であるとき、企業 2 の利得が最大になる生産
量は、
1
a−c
q2∗ = − q1 +
≡ R2 (q1 )
2
2b
となる。
2 つの最適反応関数
q1 = BR1 (q2 ),
q2 = BR2 (q1 )
が同時に満たされているとき、両企業は互いに相手の生産量に対して最適反
応をしている。言い換えると、相手の戦略を所与として自らの利得が最大に
なるような生産量を選択しているので、これがナッシュ均衡となる。連立方
程式を解くと、
q1∗ = q2∗ =
a−c
≡ Qc
3b
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
(2.1)
戦略的マーケティングのためのゲーム理論
2.1. 純粋戦略ナッシュ均衡
9
を得る。これはクールノー(Cournot)解と呼ばれる。
戦略・利得が連続である場合には、自分の利得関数を、自分の戦略変数で
偏微分したものがゼロとなること、すなわち
∂πi
=0
∂qi
∀i,
が(内点の)ナッシュ均衡であるための必要条件4) となる。この条件は、
「ど
のプレイヤーも、自分だけがほんの少し(プラス方向でも、マイナス方向で
も)戦略を変えたとしても、利得を増加させることはできない」ということ
を表す。これを本講では微分アプローチと呼ぶことにしよう。
微分アプローチを用いると、ナッシュ均衡解( = 個人の合理性)とパレー
ト効率解( = 全体の合理性)は一般に異なることがわかる。ナッシュ均衡解
は πi を最大化する点であるから、その一階条件は先述の通り ∀i,
あるのに対し、パレート効率解は π1 + · · · + πN =
であるから、その一階条件は ∀i,
∀i,
PN
∂πi
i=1 ∂qi
PN
i=1
∂πi
∂qi
=0で
πi を最大化する点
= 0、すなわち
∂πi X ∂πi
+
=0
∂qi
∂qi
j6=i
となる。つまり、一般に5) ナッシュ均衡解はパレート効率解とは異なる。こ
れは、各人が自由に利潤を追求しさえすればパレート効率的な状態が実現さ
れる(厚生経済学の第1基本定理)という完全競争の状況と対照的である。
2.1.5
複雑なゲーム∼文章による表現
プレイヤーが3人以上いる場合には利得表や反応曲線をかくのが難しいし、
戦略・利得が無限の場合(あるいはたくさんある場合)には利得表を書くこと
ができない。また戦略・利得が連続でない場合には微分アプローチで均衡の
候補を探すことができない。このような場合には、文章に表されたルールか
ら論理的に考えて、ナッシュ均衡を求める。また数式で解けるゲームであっ
ても、文章で考えた方が簡潔に解ける場合も多い。
4)
ただしこれは十分条件ではないので二階条件などのチェックが必要である。また端点は別に調べる必要が
ある。
5)
たまたま
P
∂πi
j6=i ∂qi
= 0 になっているのでない限り。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
10
第2章
同時手番のゲーム
例 3. 同質財のベルトラン競争(Bertrand Competition)
2 つの企業1と2(=プレイヤー)が同質な財を市場で販売してい
る。仕入れ価格 c は企業1と2に共通である。企業 i(i = 1, 2) は販売価
格 pi を同時に決定する。消費者(100 人)は価格の安い方から買う。同
じ価格の場合には半分が企業 1 から買い、もう半分は企業 2 から買うと
する。企業 1、2 はどのような価格をつけるか。
まず数式で表現してみよう。両者のつける価格 p1 , p2 によって、販売数量
q1 , q2 は次のように決まる。



 100 if
q1 =
50 if


 0
if
p1 < p 2
p1 = p2 ,
p1 > p 2


if

 0
q2 =
50 if


 100 if
p1 < p 2
p 1 = p2
p1 > p 2
したがって、上の例を標準型で表すと次のようになる。
プレイヤー i = 1, 2
戦略 Ai = {pi ∈ R|c ≤ pi },
i = 1, 2
利得関数



 100(p1 − c)
π1 (p1 , p2 ) = (p1 − c)q1 (p1 , p2 ) =
50(p1 − c)


 0



 0
π2 (p1 , p2 ) = (p2 − c)q2 (p1 , p2 ) =
50(p2 − c)


 100(p − c)
2
if p1 < p2
if
p 1 = p2
if p1 > p2
if p1 < p2
if
p 1 = p2
if p1 > p2
これを数式の操作だけで解くのは面倒である。そこで、次のように考える。
いま、プレイヤー1はプレイヤー2と同じかそれよりも安い価格をつけて
いる(p1 ≤ p2 )と仮定する。
• プレイヤー1が c よりも高い価格 p1 を付けているならば、プレイヤー
2はそれよりもわずかに低い価格 p2 = p1 − ² を付ければ、すべての
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.1. 純粋戦略ナッシュ均衡
11
需要を奪うことができ、利得を高めることができる。したがってこの
状態はナッシュ均衡ではない。
• プレイヤー1が c よりも低い価格 p1 を付けているならば、プレイヤー
1は赤字を出していることになる。このときプレイヤー1は、価格を
c 以上にすることで赤字をなくすことができる。したがってこの状態
はナッシュ均衡ではない。
• プレイヤー1が価格を p1 = c と付けているならば、プレイヤー2も
p2 = c とするのが最適反応となる。このとき両者ともに手を変化させ
るインセンティヴはない。したがってこの状態はナッシュ均衡である。
以上で p1 = p2 = c が唯一のナッシュ均衡であることが示された。
2.1.6
【発展】難しいゲームでナッシュ均衡を探すコツ
次のような手順で考えてみるとよい。
• まず、均衡になりそうな戦略の組を考える。対称ゲーム(戦略・利得
がすべてのプレイヤーに共通であるゲーム)であれば、対称均衡(す
べてのプレイヤーが同じ戦略をとっているナッシュ均衡)を考えてみ
ると6) 、ナッシュ均衡が見つかりやすくなることが多い。
• 次に、均衡候補の戦略の組において、全てのプレイヤーの戦略が最適反
応となっている(=他の手を取るインセンティヴがない)ことを示す。
• 最後に、それ以外の場合が均衡でないことを示す。あるひとりのプレ
イヤーが戦略を変える(=均衡から deviate する)ことで得をするこ
とを示せばよい。ただしこの段階の証明(一意性の証明)はできなく
ても、有用な結果とされることもある。
例 4. ホテリングの立地ゲーム(Hotelling Competition)
海岸にかき氷の屋台を出そうとしているプレイヤー 1 と 2 がいる。
消費者は海岸線 [0, 1] 上に一様に分布しており、各消費者は近い方の屋
6)
ただし、対称ゲームに必ず対称均衡が存在するわけではない。たとえばチキンゲームでは純粋戦略の範囲
では対称均衡は存在しない。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
12
第2章
同時手番のゲーム
台からかき氷を一つだけ買う(もし等距離にあれば半々の確率でどちら
から買うか決める)。獲得した消費者の数をプレイヤーの利得とする。プ
レイヤー 1、2 はどこに屋台を出すだろうか。
上の手順に従ってナッシュ均衡を探してみよう。
• プレイヤー 1 と 2 の条件は対等なので、このゲームは対称ゲームであ
る。したがって、プレイヤー 1 と 2 が左右対称な位置、または同じ位
置にいる場合が均衡の有力な候補となる。さらにこのゲームは左右対
称でもあるから、中央に両方のプレイヤーが立地する場合がナッシュ
均衡である可能性が高いのではないか、と見当をつける。
• 実際にそれがナッシュ均衡であることを示す。プレイヤー 2 が中央に
いるとき、プレイヤー 1 はそこから右に離れても左に離れても損をす
ることがわかる (右または左に x ∈ [0, 1/2] だけ離れた場合の利得は
(1 − x)/2 で、真ん中にいる場合の 1/2 を下回る)。ゆえに、両プレイ
ヤーとも中央に立地するという戦略はナッシュ均衡である。
• それ以外の戦略がナッシュ均衡でないことは、以下のようにして示さ
れる(数式は省略する)。
–
両プレイヤーが離れて立地している場合、プレイヤー 1 はプレイ
ヤー 2 に近づくことで利得を高めることができる。したがってこ
の状態はナッシュ均衡ではない。
–
両プレイヤーが中央以外の同じ点に立地している場合、プレイヤー
1(または 2)は中央に近い点に移動することで利得を高めること
ができる。したがってこの状態はナッシュ均衡ではない。
以上で、両プレイヤーとも中央に立地するというのが唯一のナッシュ均衡で
あることが示された。この結果をホテリング均衡と呼ぶこともある。
また、海岸線をイデオロギーの軸(たとえば左翼←→右翼)、消費者を有
権者と見立てて、このモデルを政治学に応用したものとして中位投票者定
理(median voter theorem) がある。中位投票者定理とは、二大政党制におい
て各政党が得票数の最大化を目指す場合には、どちらの政党も有権者のイデ
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.1. 純粋戦略ナッシュ均衡
13
オロギー分布の中央値付近にある政策を主張するので、結果としては似たり
寄ったりの公約を掲げることになるというものである。
2.1.7
【発展】なぜナッシュ均衡がプレイされるか?
ナッシュ均衡の定義は、相手が戦略を変えない限りこちらも戦略を変える
誘因を持たない、ということであるが、この定義からは、ナッシュ均衡がプ
レイヤーの行動の予測に役立つという理由が見えづらいかもしれない。また、
「実際にはプレイヤーはゲーム理論など知らず、利得表を思い浮かべて計算し
ているわけではないから、ナッシュ均衡がプレイされるとは考えられない」
という反論もあろう。これらに対し、ナッシュ均衡を意義づけるものとして、
次のような説明が用意されている。
合理的推論? ナッシュ均衡が支配戦略均衡になっている場合には、合理的推
論だけから均衡が導かれる(【例】囚人のジレンマ)。しかし、ナッシュ均衡
が複数ある場合に、どの均衡が実際にプレイされるのかはわからない(【例】
チキン・ゲーム、両性の諍い)。
話し合い
話し合いでいったん決まったら、罰則などがなくても、自発的に
守られる口約束がナッシュ均衡である(【例】協調ゲーム)。ナッシュ均衡で
ない口約束は、罰則なしには維持することができない(【例】囚人のジレンマ
の (C,C) は口約束では達成できない)。
試行錯誤
同じプレイヤーどうしで同じゲームを何度もプレイする際に、相
手が今回も前回と同じ戦略をとるとして、今回の自分の利得が最大になるよ
うに戦略を決定する、とする7) 。この場合、いったんナッシュ均衡に至ると、
次回以降は両者とも戦略を変更するインセンティヴがないナッシュ均衡では、
相手の戦略が変わらないならば、自分が戦略を変えても利得は増えないから
である。したがって、このような試行錯誤の調整過程の行き着く先がナッシュ
7)
この試行錯誤の調整過程は、プレイヤーが今期の利得のことしか考えていない点や、前期の相手の戦略し
か考慮に入れない点、戦略が各回ごとに分断されている点で、後述する繰り返しゲームの場合とは異なる(そ
れほど賢くない)ことに注意する。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
14
第2章
同時手番のゲーム
均衡であると説明される。この解釈は経済学の主要な任務である「定型化さ
れた事実」の説明として非常に適している。
試行錯誤によってナッシュ均衡に至るというのは、ただ、相手が昨日と同
じ行動をとると単純に考えて、その日その日の利得が最大になるように各人
が行動していれば自然とナッシュ均衡に至るということである。したがって
この解釈を採用する場合には、プレイヤーに、遠い将来についての予測や、
「こちらの行動が変化したら相手の行動が変化するので…」といった高度な知
能を要請する必要はない。またプレイヤーがゲーム理論を知らなくても何の
問題もない。
2.1.8
【発展】どのナッシュ均衡がプレイされるか?
ナッシュ均衡が複数ある場合にどのナッシュ均衡がプレイされるのかにつ
いては、ここまでに紹介した分析手法の範囲では全く知ることができない。
しかしゲーム理論の進展に伴い、いくつかのアプローチが提唱されているの
で、ここで紹介する。
歴史的経緯
ナッシュ均衡が複数ある場合に、どの均衡に落ち着くかは歴史
的経緯による。これを経路依存性(path dependence) という。現在における
社会の制度の存在理由を説明するためには、その歴史を知る必要があるとい
うことになり、これはゲーム理論の立場から経済史の研究を意義づけるもの
となっている。
フォーカル・ポイント
複数のナッシュ均衡が存在するゲームをプレイする
場合、事前の話し合いが無いなら、何らかの形で「目立つ」ナッシュ均衡が
選ばれる。このようななんとなく「目立つ」点のことをフォーカル・ポイン
トという。
【例】場所を指定することなく「渋谷で待ち合わせ」といわれた場
合、特に心当たりがなければ、とりあえず駅の近くにいるほうが相手に会え
る可能性が高い。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.2. 混合戦略均衡とナッシュ均衡の存在定理
均衡の精緻化
15
ナッシュ均衡ではあるが、何らかの理由により、
「あまりプレ
イされないと思われる」均衡というのがある。それを排除するような、より
強い均衡概念を導入することで予測力を高める。後述の部分ゲーム完全均衡、
震える手完全均衡、ベイジアン完全均衡、逐次均衡など。
進化的視点
突然変異や外敵の侵入などによって、ときどき均衡から外れた
ことが起こるとしても、結局元に戻るような安定な均衡であれば、長くプレイ
されると考えられる。進化的安定戦略 (Evolutionaly StableStrategy, ESS)、
長期確率安定状態 (Long-Run Stochastically Stable state, LRSS) などの考
え方。
2.2
2.2.1
混合戦略均衡とナッシュ均衡の存在定理
混合戦略均衡
2人で「じゃんけん」をする場合を考えよう。じゃんけんはいうまでもなく
同時手番であり、プレイヤーが2人で、戦略は両プレイヤー共に { グー, チョキ
, パー } であるから、あとは利得を適当に設定すれば、ゲームとして定式化で
きる。たとえば利得を、勝つと 1 点、負けると −1 点、あいこを 0 点と設定
すれば、表 2.6 のような利得表を書くことができる。
表 2.6: じゃんけん
グー
チョキ
パー
グー
0, 0
1, −1
−1, 1
チョキ
−1, 1
0, 0
1, −1
パー
1, −1
−1, 1
0, 0
表 2.6 では最適反応戦略に下線を付したが、これをみるとじゃんけんには
(純粋戦略の)ナッシュ均衡は存在しないことがわかる。では、じゃんけんの
最適戦略とはどのようなものだろうか。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
16
第2章
同時手番のゲーム
もし相手がグーをよく出すとわかっていれば、こちらはパーを多く出せば
よい8) 。それを予想した相手はチョキを多く出すように戦略を変更すると思
われるので、グー・チョキ・パーを偏った比率で出す戦略は、ナッシュ均衡
にはなりそうにない。お互いがグー・チョキ・パーを等確率で出しあうのが、
お互いに最適反応をし合っている状態であると予想できる。
じゃんけんのようなゲームを分析するためには、
「いくつかの戦略を確率的
に組み合わせて出す戦略」を定式化しておくと便利である。このような戦略
は混合戦略(mixed strategy)と呼ばれる。それに対し、もともとの戦略を
純粋戦略(pure strategy)と呼ぶ。純粋戦略は、ある純粋戦略を確率 1 でと
る特殊な混合戦略とみることもできる。プレイヤーが混合戦略をとることを
許容すると、ゲームは次のように表されることになる。
• プレイヤー i = 1, 2, . . . , N :
これは同じ9) 。
• プレイヤー i の混合戦略 αi (ai ):
プレイヤー i が純粋戦略 ai をとる確率を αi (ai ) と表す10) 。また、プ
レイヤー i の取りうる混合戦略全体の集合を ∆i と書く。
• 混合戦略のもとでの期待利得 gi (α1 , . . . , αN ):
混合戦略 α = (α1 , . . . , αN ) のもとでのプレイヤーの期待利得。a =
(a1 , . . . , aN ) がプレイされる確率 Pr(a1 , . . . , aN ) は、個々の ai がプレ
QN
イされる確率 αi (ai ) を掛け合わせたもの、すなわち i=1 αi (ai ) であ
ることに注意すると11) 、混合戦略のもとでの利得関数 gi は、純粋戦略
8)
この場合、100 %パーを出すのが相手の戦略に対する最適反応となる。これが直観に反するとすれば、そ
れは相手がこちらの手をみて次回以降に戦略を変化させるというような学習のプロセスを考慮に入れていない
ためであると思われる。
9)
ただし混合戦略均衡を考える際には、プレイヤーが基数的効用を有することが前提となる。それに対し
て、純粋戦略均衡だけを考えるのであれば、プレイヤーは序数的効用を有することを仮定すれば十分である。
10)
αi : Ai → [0, 1] は確率関数であるから、
X
αi (ai ) = 1
ai ∈Ai
が成り立っていなければならない。
P
は掛け算の記号で、足し算の
に対応する。たとえば、
11) Q
N
Y
i ≡ 1 × 2 × · · · × N.
i=1
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.2. 混合戦略均衡とナッシュ均衡の存在定理
17
のもとでの利得関数 πi を用いて次のように表されることがわかる12) 。
gi (α)
=
X
a∈A
=
X
(πi (a) · Pr(a1 , . . . , aN ))
Ã
πi (a) ·
a∈A
N
Y
!
αi (ai )
i=1
混合戦略を許容したゲームでも、純粋戦略だけの場合と同じようにナッシュ
均衡を定義することができる。
¨
∗
定義 2. 下をみたす α =
¥
∗
)
(α1∗ , . . . , αN
を、混合戦略ナッシュ均衡(あ
るいは混合戦略均衡)という。
∀i, ∀αi ,
∗
gi (α∗ ) = gi (αi , α−i
)
§
¦
じゃんけんは戦略が 3 つあるため、混合戦略均衡を求める計算がやや煩雑
になる。ここでは、じゃんけんによく似た、ゲーム理論においてよく引用さ
れる次のゲームの混合戦略均衡を求めてみよう。
例 5. マッチング・ペニー(matching pennies)
2 人のプレイヤーがそれぞれコインを持っており、同時に表を出す
か裏を出すかを選ぶ。もし 2 枚とも表か、または 2 枚とも裏であれば、
プレイヤー 2 がプレイヤー 1 のコインをもらい、表裏 1 枚ずつであれば
プレイヤー 1 がプレイヤー 2 のコインをもらう。このゲームに純粋戦略
のナッシュ均衡が存在しないことを確認した後、混合戦略ナッシュ均衡
を求めよ。
P
12)
a∈A は可能なすべての戦略の組合せについて和をとることを意味する。例えば囚人のジレンマでプレ
イヤーが 2 人の場合、A = {{C, C}, {C, D}, {D, C}, {C, D}} のすべてについて、(各戦略の組が生じ
る確率×その戦略の組に対応するプレイヤーの期待利得)を足し合わせることになる。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
18
第2章
同時手番のゲーム
表
裏
表
−1, 1
1, −1
裏
1, −1
−1, 1
まず、プレイヤー 1 が { 表, 裏 } を確率 (p, 1 − p) で選ぶと仮定して、この
場合にプレイヤー 2 がとるべき戦略を考える。表を出したときの期待利得は
1 × p + (−1) × (1 − p) = 2p − 1
裏を出したときの期待利得は
−1 × p + 1 × (1 − p) = −2p + 1
表を出したときと裏を出したときでどちらのほうが期待利得が大きくなるか
は、p の値により異なり、



 p < 1/2 ならば 2p − 1 < −2p + 1
p = 1/2 ならば 2p − 1 = −2p + 1


 p > 1/2 ならば 2p − 1 > −2p + 1
である。したがって、プレイヤー 2 のとるべき戦略は、



 p < 1/2 ならば、裏を出す。
p = 1/2 ならば、どちらを出しても同じ


 p > 1/2 ならば、表を出す。
となる。これをグラフで表したものが図 2.1 である。BR2 (p) は、プレイヤー
1 の戦略(=表を出す確率 p)に対するプレイヤー 2 の最適反応を表すグラフ
である。p < 1/2 のときには常に裏を出し(q = 0)、p > 1/2 のときには常
に表を出す(q = 1)のが最適反応である。なお p = 1/2 のときは、どのよう
な確率で表を出すのも(q ∈ [0, 1])最適反応である13) 。
13)
p = 1/2 という一つの引数に対して、q ∈ [0, 1] という複数の値が対応しているため、BR2 (p) は関
数の定義を満たさない。一つの引数に対して、多くの値が対応するものを対応(correspondence)と呼ぶの
で、BR2 (p) は最適反応対応(best response correspondence)と呼ばれる。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.2. 混合戦略均衡とナッシュ均衡の存在定理
q
19
q
BR 2 (p)
BR 1 (q)
1/2
O
p
1/2
図 2.1: プレイヤー 2 の最適反応
O
p
図 2.2: プレイヤー 1 の最適反応
次に、プレイヤー 2 が { 表, 裏 } を確率 (q, 1 − q) で選ぶと仮定して、この
場合にプレイヤー 1 がとるべき戦略を考える。表を出したときの期待利得は
−1 × q + 1 × (1 − q) = −2q + 1
裏を出したときの期待利得は
1 × q + (−1) × (1 − q) = 2q − 1
先程と同様、表を出したときと裏を出したときでどちらのほうが期待利得が
大きくなるかは、q の値により異なり、



 q < 1/2 ならば − 2q + 1 > 2q − 1
q = 1/2 ならば − 2q + 1 = 2q − 1


 q > 1/2 ならば − 2q + 1 < 2q − 1
である。したがって、プレイヤー 2 のとるべき戦略は、



 q < 1/2 ならば、表を出す。
q = 1/2 ならば、どちらを出しても同じ


 q > 1/2 ならば、裏を出す。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
20
第2章
同時手番のゲーム
となる。これをグラフで表したものが図 2.2 である。BR1 (q) は、プレイヤー
2 の戦略(=表を出す確率 q )に対するプレイヤー 1 の最適反応を表すグラフ
である。q < 1/2 のときには常に表を出し(p = 1)、q > 1/2 のときには常
に裏を出す(p = 0)のが最適反応である。q = 1/2 のときは、どのような確
率で表を出すのも(p ∈ [0, 1])最適反応である。
両者の最適反応のグラフを合わせたものが図 2.3 である。
q
BR 2 (p)
BR 1 (q)
1/2
O
p
1/2
図 2.3: マッチング・ペニーの混合戦略ナッシュ均衡
グラフの交点においては両者ともに相手の戦略に対して最適反応をしてい
る。これがナッシュ均衡である。したがって、混合戦略ナッシュ均衡はただ
一つ、
µ
(p, q) =
1 1
,
2 2
¶
であることがわかる。
2.2.2
【発展】混合戦略均衡を探すコツ
混合戦略均衡において、プレイヤー i が正の(0 でない)確率で選ぶ純粋戦
略は、どれも同じ期待利得を i にもたらす。そうでなければ、一番期待利得
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.3. 支配戦略均衡
21
の高いものを確率 1 で取るのが得になる。したがって混合戦略均衡において
選ばれない戦略は、選ばれる戦略と同じかそれよりも少ない期待利得しか i
にもたらさない。この性質を用いると、混合戦略均衡を効率よく探すことが
できる。
2.2.3
【発展】ナッシュ均衡の存在定理
混合戦略を許容すると、どんなゲームにもナッシュ均衡が最低ひとつは必
ず存在することが知られている。
定理 1. (Nash, 1950)純粋戦略の数が有限で、プレイヤーが有限であるよ
うなどんなゲームにも、(混合戦略まで含めると)ナッシュ均衡が存在する。
モデルを上手く工夫すれば、現実におこる状況のほとんどを、純粋戦略が
有限個のゲームで表現することができるので、この定理の適用範囲はきわめ
て広い。また非常に広範なクラスのゲームについて均衡の存在を保証すると
いう意味で、理論的には重要な定理である。しかしこの定理は「均衡がある」
と言っているだけでどこに均衡があるかについては何も語っていない。また
均衡が何個あるかもわからない。したがって、現実に「使える」シーンはあ
まり無いともいえる。
2.3
支配戦略均衡
ここでは、ナッシュ均衡とは別の考え方によって、プレイヤーの戦略を予
測する方法を考えてみることにする。
2.3.1
支配戦略
たとえば囚人のジレンマでは、相手が C 戦略でこようと D 戦略でこよう
と、自分は D 戦略を取る方が得である。このとき、
(自分にとっての)D 戦略
は C 戦略を支配(dominate)しているといい、C を被支配戦略(dominated
strategy)という。また、混合戦略まで考えて、相手が C 戦略・D 戦略をど
んな確率で取ってきたとしても、自分は常に D 戦略を取る方が得であること
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
22
第2章
同時手番のゲーム
がわかる。したがって、被支配戦略は混合戦略の一部としてもプレイされる
ことはない。支配・被支配の関係は次のように定義される。
¨
¥
定義 3.
(αi0 , α−i ) > gi (αi00 , α−i )
∀α−i , gi
のとき、αi0 は αi00 を強く支配する(strongly dominate)という。また
§
∀α−i ,
gi (αi0 , α−i ) = gi (αi00 , α−i )
かつ ∃α−i ,
gi (αi0 , α−i ) > gi (αi00 , α−i )
のとき、αi0 は αi00 を弱く支配する(weakly dominate)という。
¦
次の命題は有用である。
命題 1. 合理的14) なプレイヤーであれば、強く支配される戦略をとることは
ない。
2.3.2
強く支配される戦略の反復消去
先述の通り、合理的なプレイヤーは強く支配される戦略をとることはない。
たとえば2人ゲームにおいて、もし相手が合理的であることを知っていれば、
相手が強く支配される戦略をとらないことがわかる。
例 6. 強く支配される戦略の反復消去
1\2
L
C
R
U
3, 3
2, 2
1, 1
M
2, 4
4, 3
1, 2
D
1, 1
2, 4
3, 3
このゲームは、支配される戦略を反復消去だけで解くことができる。
14)
意思決定の際に、(1) 起こりうる状態の全てを列挙し、(2) そのうちのどれが起こるかわからないときに
は客観確率か主観確率かを与え、(3) 期待効用を最大化するような主体を、(ベイジアン)合理的である、と
いう。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.3. 支配戦略均衡
23
プレイヤー 1 がどんな戦略をとろうと、プレイヤー 2 は R を選ぶよりは C
を選ぶほうがよい(戦略 R は戦略 C に支配されている)。つまりプレイヤー
2 が合理的であれば決して R を選ぶことはないので、R 列はゲームから除い
て考えればよいことになる(表 2.7)。
表 2.7: R 列を除いた後のゲーム
表 2.8: D 行を除いた後のゲーム
1\2
L
C
R
1\2
L
C
R
U
3, 3
2, 2
1, 1
U
3, 3
2, 2
1, 1
M
2, 4
4, 3
1, 2
M
2, 4
4, 3
1, 2
D
1, 1
2, 4
3, 3
D
1, 1
2, 4
3, 3
次に、表 2.7 をみると、プレイヤー 1 が M を選んだときの利得は、D を
選んだときよりも常に高いことがわかる。
(戦略 D は戦略 M に支配されてい
る)。したがって、合理的なプレイヤー 1 は、プレイヤー 2 が合理的である
(= 決して R をとらない)ことを知っているならば決して D を選ぶことはな
いので、今度は D 行をゲームから除いて考えればよいことになる(表 2.8)。
さらに、表 2.8 におけるプレイヤー 2 の戦略を考えると、戦略 C は戦略 L
に支配されている。そこで C 列を消去すると、残るはプレイヤー 1 の意思決
定のみとなり、(U, L) だけが残る(表 2.9)。このように、支配戦略を繰り返
し消去することによってひとつを除く全ての戦略を消去することができた場
合、最後に残った戦略の組を支配戦略均衡と呼ぶ。
一般に、支配戦略均衡は存在するとは限らないが、もし存在すれば、それ
は必ずそのゲームで唯一のナッシュ均衡となっている15) 。表 2.10 では相手の
戦略を所与としたときの最適戦略に下線をつけた。これにより、唯一のナッ
シュ均衡は (U, L) であることが確認できる。
15)
逆は必ずしも成り立たない。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
24
第2章
表 2.9: 支配戦略均衡
同時手番のゲーム
表 2.10: ナッシュ均衡
1\2
L
C
R
1\2
L
C
R
U
3, 3
2, 2
1, 1
U
3, 3
2, 2
1, 1
M
2, 4
4, 3
1, 2
M
2, 4
4, 3
1, 2
D
1, 1
2, 4
3, 3
D
1, 1
2, 4
3, 3
2.3.3
周知の事実
以上のような反復消去を実現するには、両者の間で互いの合理性が徹底的
に知られている必要がある。自分が合理的であり、自分が合理的であること
を相手は知っており、自分が合理的であることを相手が知っていることを自
分は知っており、自分が合理的であることを相手が知っていることを自分が
知っていることを相手は知っており、
・
・
・という連鎖が好きなだけ続くのでな
ければ反復消去はできない。
このような知識の構造を(一応)数学的に定式化しておく。プレイヤー i が
ある事象 X を知っていることを Ki X と書こう。たとえばプレイヤーが2人
(A, B )であるとして、
KA X, KB X, KB KA X, KA KB X, KA KB KA X, KB KA KB X, . . .
のように無限に続けることができるとき、X は周知の事実(common knowl-
edge)であるという。
ゲームの構造(プレイヤー、戦略、利得)とプレイヤーの合理性とが周知
の事実であれば、強く支配される戦略を何回でも反復消去することができる。
この操作だけでナッシュ均衡(=支配戦略均衡)を求めることができるゲーム
を dominance solvable なゲームという。dominance solvable なゲームでは、
上記の周知の事実のもとで、お互いが連絡を取り合わなくても各人が徹底的
に考えさえすれば、必ずナッシュ均衡がプレイされる。また、プレイヤーがそ
れほど考えない場合でも、被支配戦略をとったときには他の戦略をとったと
きに比べていつも利得が少ないということを学んでゆけば、試行錯誤でナッ
シュ均衡にたどり着く可能性が高い。つまり、dominance solvable なゲーム
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.4. 静学ゲーム:練習問題
25
においてはナッシュ均衡は非常に安定しており、ナッシュ均衡がプレイされ
る可能性は高いといえる。
2.3.4
【発展】弱く支配される戦略と「震える手」完全均衡
プレイヤーが弱く支配される戦略をとることはない、というためには、プ
レイヤーに合理性を仮定するだけでは不十分で、合理性プラス一種の「用心
深さ」を仮定する必要がある。
例 7. 弱く支配される戦略があるゲーム
L
R
U
1, 1
1, 0
D
1, 1
−100, 0
このゲームのナッシュ均衡は (U, L), (D, L) である。しかし「ひょっとした
らプレイヤー 2 は間違って R をとるかもしれない」と考えると怖くて D は
取れないし、そもそも D を取ってもプレイヤー1にとって良いことは何一
つないので、プレイヤー1は D を取りそうにない。この直観を支持するべ
く、何かが 100 %起こるという考えを排除してナッシュ均衡を考えたものが
震える手完全均衡(trembling hand perfect equilibrium)である。この均衡
概念を用いれば、弱く支配される戦略を排除することができる16) 。この例で
は (U, L) だけが均衡となる。
2.4
2.4.1
静学ゲーム:練習問題
純粋戦略ナッシュ均衡
練習 1. 下のゲームの純粋戦略ナッシュ均衡を求めよ。
16)
震える手完全均衡は摂動均衡とも呼ばれ、いくつかバリエーションがあるようである。数学的には、たと
えば、どの戦略も十分小さな確率 ² で選ばれうると考えて、² を 0 に収束させたときの均衡を求めるという
操作をする。利得表で表現されるようなゲームであれば、弱く支配される戦略を消去するだけでよく、操作も
易しい上に応用上も有用であると考え、ここに紹介した。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
26
第2章
同時手番のゲーム
チキン・ゲーム (Chicken Game)
突進
回避
突進
−10, −10
1, −1
回避
−1, 1
0, 0
両性の諍い (Battle of the Sexes)
野球
ドラマ
野球
3, 1
0, 0
ドラマ
0, 0
1, 3
協調ゲーム(Coordination Game)
ドコモ
AU
ドコモ
1, 1
0, 0
AU
0, 0
3, 3
屈服
牽制
懐柔策
3, 3
1, 4
強硬策
4, 2
2, 1
弱者の脅し(Called Bluff)
練習 2. 太郎と次郎がみかん 5 個を 2 人で分けるにあたって、次のような方法
をとる。まず太郎と次郎が、いくつみかんがほしいかをお母さんにそれぞれ
耳打ちする。お母さんは、太郎の言った数(x)と次郎の言った数(y )とを聞
いて、x + y 5 5 ならば太郎に x 個、次郎に y 個のみかんをあげる。x + y > 5
ならばお母さんが全部食べて太郎・次郎にはひとつもあげない。このゲーム
のナッシュ均衡を求めよ。(ヒント:利得表を書くとわかりやすい。)
練習 3. (設例は内田貴『民法I』初版 p.316)小型飛行機が墜落してBの土
地に転がり込んだため、大きな庭石がはねとばされ、隣地であるAの土地に
転がり込んだ。庭石を元に戻すには 10 万円の費用がかかる。庭石をそのまま
にしておくと、土地を利用できないA・庭石を鑑賞できないBはともに 8 万
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.4. 静学ゲーム:練習問題
27
円ずつの損害を被る。なおこの件についてA・Bに過失はなく、小型飛行機
の操縦士は死亡している。
(1) 物権的請求権を行為請求権と解する場合、BはAに対して庭石の返還
を請求できる。またAはBに対して庭石の除去を請求できる。両者が共に出
廷した場合には和解が成立して、庭石の修復費用を折半することとする。A・
Bの戦略を{訴える,訴えない}と考えてこの状況を利得表に表し、ナッシュ
均衡を求めよ。
(2) 物権的請求権を受忍請求権と解する場合、Aの持つ権利は庭石を取り戻
すために隣地にはいることをBに受忍させるにとどまる。またBの持つ権利
は庭石をAの土地に押し戻すことをAに受忍させるにとどまる。双方が自主
的に修復しようとした場合には修復費用を折半することとする。A・Bの戦
略を{修復する,何もしない}と考えてこの状況を利得表に表し、ナッシュ
均衡を求めよ。
練習 4. (岡田 p.52)ある町の町長が N 人(N ≥ 3)の住民に対して公共
事業のための寄付を募り、次のように公約した。「1000 円までの金額を自由
に寄付して下さい。公共事業が終了した後、寄付金総額の 2 倍を住民の皆さ
んに平等に分配することにします」。いくらの寄付金が集まるだろうか。ただ
しこの公約は拘束的なものであって、後で公約を破ることはできないものと
する。
練習 5. 差別化された財のベルトラン競争 (Bertrand Competition with Dif-
ferenciated Goods)。2 つの企業1と2(=プレイヤー)が同質な財を生産し
て市場に供給している。財 1 単位あたりの生産費用は、企業1は c1 、企業2
は c2 である。企業 i(i = 1, 2) は価格 pi を同時に決定する。市場における財
の販売量 qi は以下のような関数
q1
= α − βp1 + γp2
q2
= α − βp2 + γp1
で定まるとする(β > γ > 0 を仮定する)。このとき企業 i の利潤関数は、
πi = (pi − ci )qi
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
28
第2章
同時手番のゲーム
となる。企業1と2は利潤最大化を目的としてそれぞれ独立に価格を決定す
る。どのような価格が選ばれるか。
2.4.2
混合戦略ナッシュ均衡
練習 6. ストレートとスライダーが持ち球である投手(プレイヤー2)が打
者(プレイヤー1)と対峙する。狙っている球種と実際に来た球種によって、
打者の打率は下の表のように変化する。この打率表は周知の事実であるとす
る。打者はなるべく打率が高くなるように狙い球を定め、投手はなるべく打
率が低くなるように考えて投球する。混合戦略均衡を求めよ。
打率
ストレート
スライダー
ストレート待ち
.500
.200
スライダー待ち
.100
.400
練習 7. 「両性の諍い」の状況で、夫は野球狂である一方、妻はドラマには
さして興味がないが野球を見るよりはマシだと考えているとする(下表)。こ
のときの混合戦略均衡を求め、ゲームが対称である場合と比較せよ。
野球
ドラマ
野球
9, 1
0, 0
ドラマ
0, 0
1, 3
練習 8. 「グリコ・チョコレート・パイナップル」のようなゲームを考える
(ただしここではアイコ=再勝負は考えないので、若干アレンジしてある)。
このゲームに純粋戦略ナッシュ均衡がないことを確認し、混合戦略均衡を求
めよ。
グー
チョキ
パー
グー
0, 0
3, −3
−6, 6
チョキ
−3, 3
0, 0
6, −6
パー
6, −6
−6, 6
0, 0
練習 9. (岡田 p.58 改)ある国では洋酒は 3 本まで無税で輸入できる。洋酒
の内外価格差のため、旅行者は洋酒を 1 本余分に持ち帰ると 2000 円の利益
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2.4. 静学ゲーム:練習問題
29
を得る。いま旅行者は、余分の洋酒を持ち帰らない(合法行為)か、2 本余
分に持ち帰る(違法行為)かの選択肢を持つ。ただし違法行為が税関の検査
で判明したときには、余分の持ち込み分につき没収を受けて 10,000 円の損害
を被るとする。このとき没収した洋酒は処分するため、税関には利得は生じ
ないものとする。一方、国は税関において旅行者の鞄を検査するか、検査し
ないかの選択肢を持つ。検査には 1000 円のコストがかかる。また不法に洋酒
を持ち込まれた場合には一本あたり 2000 円の税収減が生じる。したがって
旅行者が違法行為を行った場合、国は 2 本で 4000 円の損害を被る。
(1) この状況を静学ゲームとして定式化して利得表を書き、純粋戦略ナッ
シュ均衡がないことを確認せよ。
(2) 混合戦略ナッシュ均衡を求めよ。(ヒント:たとえば旅行者が違法行為
を行う確率を p、税関が検査をする確率を q とする。)
練習 10. クールノーの数量競争ゲーム(Cournot Competition)で、プレイ
ヤーが n 人になった場合について考える。企業 i の生産量を qi で表し、需要
関数は
p=a−b
N
X
qi
i=1
であるとする。また生産コストはどの企業も同じであるとする(∀i, ci = c)。
このとき、プレイヤーの数が多くなると完全競争価格に近づく、すなわち
lim p = c
N →∞
となることを確認せよ。
(この結果はクールノーの極限定理として知られる)。
2.4.3
支配戦略均衡
練習 11. ホテリングの立地ゲームを、(1)3 人で行う場合、(2)2 人で丸い池
の周りで行う場合、(3) 2人で丸い公園の中で行う場合、(4)2 人で正三角形
の公園の中で行う場合、純粋戦略ナッシュ均衡はそれぞれどうなるか。
練習 12. 再びホテリングの立地ゲームを考える。100m の海岸に、かき氷の
屋台を出せるポイントが 1m おきに 100 箇所ある(これらのポイントを第 0
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
30
第2章
同時手番のゲーム
地点∼第 100 地点と名付ける)。先ほどと同様、消費者は海岸線に沿って一
様に分布している。このとき、
(1)「第 0 地点に立地する」という戦略は、「第 1 地点に立地する」という
戦略に強く支配されていることを示せ。
(2) 強く支配される戦略を反復消去することによって、ナッシュ均衡を求
めよ。
練習 13. S 駅エリアで Y カメラ店と B カメラ店が競争している。両店は「価
格維持」「大幅値引」のどちらかを選ぶ。利得表は以下の通りである。
価格維持
大幅値引
価格維持
4, 4
0, 6
大幅値引
6, 0
1, 1
(1) 被支配戦略を消去し、均衡を求めよ。また、このゲームと同じ構造を持
つゲームを指摘せよ。
(2) いま Y カメラ店・B カメラ店がともに「他店の価格を提示して頂けれ
ばそれよりも安くします」という最低価格保証キャンペーンを行ったとする。
このとき利得表はどのように変化するか考えよ。またそのときのナッシュ均
衡を求めよ。
練習 14. (1) 下のゲームの純粋戦略ナッシュ均衡を求めよ。
(2) 下のゲームに「強く支配される戦略」はあるか。あるならばそれはどの
プレイヤーのどの戦略か。
(3) もしプレイヤー1が戦略Dを自ら捨てたならば、ゲームのナッシュ均衡
はどのように変化するか。
L
C
R
U
6, 4
4, 2
1, 3
M
7, 3
3, 2
0, 1
D
8, 2
5, 5
2, 8
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.