第3章 交互手番のゲーム

戦略的マーケティングのためのゲーム理論
第3章
交互手番のゲーム
この章では、各人が順番に次の一手を選択するような交互手番のゲーム(game
with sequential moves)を扱う。交互手番のゲームのことを動学ゲームとも
いう。交互手番のゲームにおいては、ナッシュ均衡を強めたものである部分
ゲーム完全均衡が重要な均衡概念となる。
3.1
交互手番のゲーム入門
まず手始めに、もっともシンプルな交互手番ゲームを考え、交互手番のゲー
ムに特有の概念を紹介することにする。ここでは次のような性質を満たすゲー
ムを考える。
• 偶然によって左右される要素がない
• プレイヤーは、前の手番で他のプレイヤーがどのような行動をとった
かをすべて把握している
• すべてのプレイヤーは、ゲームの構造や、いま自分が置かれている状
況について、あらゆる情報を知っている
後で、これらの条件が満たされない状況を表現する方法を順次紹介してゆく
ことにしよう。
例 8. 参入ゲーム
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2
第3章
交互手番のゲーム
これまで○○電機(プレイヤー2)の商圏であったところに、商売敵
の△△カメラ(プレイヤー1)が参入するかどうかを検討している。プ
レイヤー1が参入した場合、プレイヤー2はそれを受け入れて利潤を分
け合うか、赤字覚悟で徹底的に値下げ合戦を行うかの 2 つの選択肢があ
るとする。プレイヤー1が参入しなかった場合両者の利得は (0, 2)、プレ
イヤー1が参入し、プレイヤー2がそれを受け入れた場合は (1, 1)、戦っ
た場合は (−1, −1) であるとする。各プレイヤーはどのような行動をと
るか?
(-1, -1)
Player 2
battle
Player 1
in
accomodate
(1, 1)
out
(0, 2)
図 3.1: 参入ゲーム
3.1.1
直観とナッシュ均衡との乖離
はじめに、このゲームがどのような結末に至るかを素朴に考えてみる。プ
レイヤー1は「もし自分が参入した場合、2は受け入れると利得 1 だが、戦
うと利得 −1 になる。だから必ず受け入れるだろう」と予想して、参入する
だろう。そしてプレイヤー2はその参入を受け入れざるを得ないだろう。
つぎに、このゲームを利得表で表現し、ナッシュ均衡を求めてみる。表 3.1
のように利得表を作ると、
(参入する,受け入れる)、
(参入しない,戦う)1) の
2つが純粋戦略のナッシュ均衡となる。
1)
(参入しない,戦う)は、プレイヤー1は「参入しない」を選び、プレイヤー2はもしプレイヤー1が参
入してきたら「戦う」を選ぶということを意味する。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.1. 交互手番のゲーム入門
3
表 3.1: 参入ゲーム:利得表
1\2
戦う
受け入れる
参入する
−1, −1
1, 1
参入しない
0, 2
0, 2
しかし、実際にプレイヤー1が参入してきたとき、プレイヤー2は本当に
「戦う」を選ぶだろうか。プレイヤー2は1が参入してこないから「参入すれ
ば徹底抗戦」とでも何とでも言えるのであって、もしプレイヤー1が実際に
参入すれば、前言を翻して受け入れざるを得ない。そう考えると、
(参入しな
い,戦う)が均衡となるというのは非現実的と思われる。
動学のゲームにおいては、ナッシュ均衡はこのようなハッタリの効いた均
衡を含んでしまうので、均衡概念としては広すぎる。ではハッタリの均衡を
排除するためには、どのような考え方をすればよいだろうか。
3.1.2
後ろ向き帰納法
ゲーム理論では、時間の流れに沿って意思決定が行われる状況を図 3.1 の
ようなゲームの木(game tree)を用いて表現する。このような形でゲームを
表現したものを展開型(extensive form) という。
点と点とを結んでいる辺を枝といい、枝分かれしている所を決定点あるい
は単に点という。各決定点には、そこで意思決定を行うプレイヤーの名前を
書いておく。枝には選択肢の名前を書いておく。終点には、その状態に至っ
たときに各プレイヤーが得る利得を書く。
図 3.1 において、ゲームは一番左の Player 1 と書かれた決定点2) から始ま
り、プレイヤーの意思決定に従って右へと移動してゆく。たとえばプレイヤー
1が上の枝「参入」を選ぶと、上の枝に沿って移動し、次の Player 2 と書か
れた点に至る。そこでプレイヤー 2 が下の枝「受け入れ」を選ぶと、下の枝
に沿って移動し、(1, 1) と書かれた終点に至る。ゲームはそこで終わり、プレ
2)
スタート地点となる決定点のことを根(root)ということもある。ゲームの木には必ず一つだけ根が存
在しなければならない。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4
第3章
交互手番のゲーム
イヤー 1 と 2 は双方共に 1 の利得を得る。
展開型で表されたゲームを解く場合には、ゲームの木の終端に近い点から
順番に考えてゆく。まず、時点2(第 2 ステージ)におけるプレイヤー2の
最適戦略を考える(図 3.2)。プレイヤー1が参入した場合には、プレイヤー
2は必ず「受け入れ」を選ぶことがわかる。次に、時点1(第 1 ステージ)に
おけるプレイヤー1の最適戦略を考える。時点2についての考察をふまえる
と、ゲームの木は図 3.3 のように書き換えられる。するとプレイヤー1は必
ず「参入」を選ぶことがわかる。
(-1, -1)
(-1, -1)
Player 2
battle
accomodate
Player 1
in
(1, 1)
accomodate
(1, 1)
out
(0, 2)
図 3.2: 第 2 ステージ
図 3.3: 第 1 ステージ
このように後の時点から考えていけば、プレイヤーが全ての時点において
最適な戦略を選択しているような場合だけを選ぶことができ、根拠無きハッタ
リに惑わされなくてすむ。この方法を後ろ向き帰納法(backward induction)
という。
3.1.3
部分ゲーム完全均衡
ある任意の点から始まるゲームのことを部分ゲーム(subgame) と呼び3) 、
それに対応してもとのゲームのことを全体ゲームと呼ぶことにする。全体
3)
厳密な定義:次の条件を満たす展開型ゲームの一部分のことを部分ゲーム(subgame)という:(1) 1
つの決定点から始まり、(2) それ以降の枝や点をすべて含み、(3) 情報集合が外にはみ出さない。最後の条件
は、全てのプレイヤーが、いま自分がその部分ゲームをプレイしていることを知っているということを保証す
るものである。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.1. 交互手番のゲーム入門
5
ゲームも部分ゲームのひとつであると決めておく。後ろ向き帰納法によって
得られる均衡では、各プレイヤーが全ての部分ゲームにおいて最適な戦略を
とっていることから、これを部分ゲーム完全均衡(subgame perfect (Nash)
equilibrium, SPNE or SPE)と呼ぶ。
ゲームにおいて(相手の戦略を所与としたとき)各プレイヤーが最適な戦
略を選択している状態をナッシュ均衡と呼ぶことを思い出せば、部分ゲーム
完全均衡とは、全ての部分ゲームにおいてナッシュ均衡となっているような
均衡のことである。
設例 8 において、(参入しない,戦う)という戦略は、時点1から始まる
ゲームのナッシュ均衡ではあるが、
「参入」の後の時点2から始まるゲームの
ナッシュ均衡にはなっていないため、この戦略は部分ゲーム完全均衡ではな
い。なお、定義より部分ゲーム完全均衡は全体ゲーム(=部分ゲームのひと
つ)のナッシュ均衡でもあるから、部分ゲーム完全均衡は必ずナッシュ均衡
となる。
部分ゲーム完全均衡を均衡概念として用いることで、実際に決断を迫られ
たら実行されないようなハッタリ、すなわち信頼性のない脅し(incredible
threat)によって支持されるような均衡を排除し、現実的に妥当な均衡だけ
を残すことができる。
3.1.4
コミットメント
ここで、参入の噂を聞きつけたプレイヤー2が一計を案じ、店頭に次のよ
うな張り紙をしたとする。
「他店より1円でも高い値段が付いている場合には係員に御相
談ください。必ずその価格よりも安くします。」
この宣伝文句が実行されるならば、もしプレイヤー1が参入した場合には、
プレイヤー2は同等またはそれより安い価格で対抗することになる。ゲーム
は図 3.4 のように変化し、
(参入しない,戦う)が唯一の部分ゲーム完全均衡
となる。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
6
第3章
交互手番のゲーム
(-1, -1)
Player 2
battle
Player 1
in
Χ
Χ
accomodate
Χ1)
(1,
out
(0, 2)
図 3.4: 参入ゲーム:コミットメント
このように、自らの手を縛って事後的に最適でないような行動しかとれな
くする(これを「ある行動にコミットする」と表現する)と、相手の行動が
それを見越して変化して、結果として事前の利益が高まることがある4) 。一
般に、
• プレイヤーが確実にある行動をとるということを、プレイの前に他の
プレイヤーに対して意思表明し、
• さらに将来において確実にその行動を実行せざるを得ない状況に自分
を追い込むこと
を、コミットメント(commitment)5) という。
コミットメントが成立するかどうかを考える際には、後者の要件がポイン
トとなる。「参入してきたら徹底抗戦」とただ口にするだけでは、相手に信
用してもらえない。実際に参入したら受け入れるだろうと高をくくられてし
まうからである。したがって、いざ参入してきたときに自分が他の選択肢を
とることを不可能にするような何らかの手段を、自分に対して強制力があり、
また相手にもわかるような形で講じる必要がある。宣伝文句を張り紙にした
場合、それを反故にすれば顧客の信頼をひどく損なうので、プレイヤー2は
この文句を守らざるを得ない。またそのことはプレイヤー1にも伝わる。
コミットメントを利用している例として、たとえば次のようなものがある。
• ハイジャックが起きた場合、乗客の安全を考えると、強硬策を採るよ
4)
ちなみに、一人で多時点にわたる最適化を行う場合には、このような現象を考慮する必要がないので、各
時点ごとに最適解をとってそれをつなげたものが期間全体での最適解となる。
5)
適当な訳語がないが、背水の陣というのが近いように思う。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.2. とりうる戦略が連続の場合
7
りも懐柔策を採った方がよいのかもしれない。しかし、
「ハイジャック
には屈しない」というルールを自ら設定してそれにコミットすること
で、ハイジャックを抑止することができる。
• 版画を制作する際、
「22/100」
(100 枚刷ったうちの 22 枚目)などとナ
ンバリングを行い、100 枚なら 100 枚を刷った時点で版木を壊してし
まう。一見もったいないように思われるが、こうすることで購入者に
「これ以上増刷されることがない」という確信を抱かせ、購入のインセ
ンティヴを保っていると考えられる。版画がよく売れた場合には制作
者は増刷したくなる。しかし増刷されると1枚あたりの相場が下落す
るので、買い手は増刷されるかもしれないと思うと買う気を失ってし
まうのである。他にも、たとえばセールをしないブランドなどでも同
様の事がいえよう。
3.2
とりうる戦略が連続の場合
たとえば、プレイヤーが製品を何トン生産すればよいかを考えているとす
る。生産量は少しだけ増やしたり減らしたりすることが自由にできるので、
戦略は連続的に無限個存在することになる。一般に、このような最大化問題
を解くのには微分を用いるのが便利である。
交互手番ゲームの場合には、各決定点における利得最大化問題を、後方に
ある決定点から順番に解く(後ろ向き帰納法)。前方にある決定点では、後方
の決定点での最大化問題の解を代入した上で最大化問題を解けばよい。
例 9. シュタッケルベルク競争 (Stackelberg Competition)
6)
次のようなゲームを考える。第 1 期(t = 1)において、企業 1 が生
産量 q1 を決定する。第 2 期(t = 2)において、企業 2 は企業1の生産
量 q1 を観察した上で生産量 q2 を決定する。両企業が生産量を決定した
後に市場が開き、需要関数 P = a − bQ(P は市場価格、Q は市場におけ
る供給量) に応じて価格が決定し、両企業の利潤 πi (i = 1, 2) が決まる。
生産コストは両企業に共通で c とする。このとき両企業の生産量はどう
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
8
第3章
交互手番のゲーム
なるか。
後ろ向き帰納法の考え方に従い、一番最後のステージから考える。
• まず t = 2 について、q1 が与えられた後の部分ゲームの解 q2∗(=プレ
イヤー2の最適反応関数 R2 (q1 ))を求める。
• 次に t = 1 について、企業1は R2 (q1 ) をふまえて、利潤 π(q1 , q2∗ ) =
π(q1 , R2 (q1 )) を最大にするような q1 を求める。
上記のプランに従って数式を展開してゆこう。
t=2 企業 2 の直面する問題は、
max π2 (q1 , q2 ) = (a − b(q1 + q2 ) − c)q2
q2
である。企業1はすでに生産量を決定しているので、q1 は定数と考え
る。一階条件は
∂π2
= a − c − bq1 − 2bq2 = 0
∂q2
これを解くと
a−c
1
≡ R2 (q1 )
q2∗ = − q1 +
2
2b
となる。
t=1 企業 1 の直面する問題は、
max π1 (q1 , q2∗ ) =
q1
π1 (q1 , R2 (q1 )) = (a − b(q1 + R2 (q1 )) − c)q1
µ
¶
b
a−c
=
− q1 +
q1
2
2
である。一階条件は
∂π1
a−c
− bq1 = 0
=
∂q1
2
これを解くと
q1∗ =
a−c
2b
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.3. 不確実性がある場合
9
となり、これをの式に代入して、
q2∗ =
a−c
4b
を得る。
これはシュタッケルベルク(Stackelberg)解と呼ばれる。
情報を知らない方が得をする?
ところで、同じ条件の下で、企業1と企業
2が同時に生産量を決定した場合(第1章参照)の両企業の生産量は
q1∗ = q2∗ =
a−c
3b
であった。両者を比較すると、
先手番プレイヤーの生産量>同時決定の時の生産量>後手番プレイヤーの生産量
であることがわかる。利潤もこの順になる。
もし企業2が企業1の生産量を知らないまま生産量を決定する場合、これ
は同時手番と同じことであるから7) 、結果もクールノー競争の場合と同じに
なる。したがって企業2は、企業1の生産量という重要な情報を知らない方
が、むしろ利潤を高められるということになる。正確には、企業2が企業1
の生産量を知らないと企業1が考えていることが、企業2の利益を高めてい
るのである。このように、情報を知らない(ことが相手に知られている)こ
とが逆に幸いして良い結果を生む場合もあることが、交互手番のゲームの分
析からわかる。
3.3
不確実性がある場合
偶然によって左右される要素、すなわち不確実性をゲームで表現するには、
自然(nature)という名のダミープレイヤーを用いる。たとえば 50 %の確率
で晴れ、50 %の確率で雨が降るのであれば、「自然」という名のプレイヤー
7)
3.4.2 節で詳述する。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
10
第3章
交互手番のゲーム
-1
[0.6]
自然
fine
rain
Player 1
傘を持っていく
[0.4]
傘を持たない
[0.6]
-1
0
fine
rain
[0.4]
-2
図 3.5: 傘持っていく?
-1
Player 1
傘を持っていく
傘を持たない
-0.8
図 3.6: 傘持っていく?
:縮約後
が、それぞれ半々の確率で「天気を晴れにする」
「雨にする」という行動を選
択すると考えてモデル化すればよい。
例 10. 傘持っていく?
ようこさんは出かけるときに傘を持って出るかどうか悩んでいる。
傘を持ち歩くのは億劫であるため 1 のコストを感じるが、傘を持たずに
雨に降られると不愉快であり 2 のコストを感じる。天気予報によれば今
日の降水確率は 40 %である。この状況を交互手番のゲームで表現し、よ
うこさんの最適戦略および期待利得を求めよ。
この状況をゲームの木で表現すると図 3.5 のようになる。図中で [0.4] とあ
るのは、プレイヤー「自然」が確率 0.4(40 %)で「雨を降らせる」という
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.4. ゲームの書き換え
11
行動を選択することを表している。
ここではプレイヤーは利得の期待値(これを期待利得という)を最大にす
るように戦略を決定するものとしよう8) 。プレイヤー 1 が「傘を持っていく」
を選んだ場合の期待利得は、
0.6 × (−1) + 0.4 × (−1) = −1
「傘を持たない」を選んだ場合の期待利得は、
0.6 × 0 + 0.4 × (−2) = −0.8
である。したがってゲームの木は図 3.6 のように書き換えられる。プレイヤー
1 は傘を持たないで出かけることがわかる。
3.4
ゲームの書き換え
この節では、交互手番ゲームを同時手番ゲームへ、また、同時手番ゲーム
を交互手番ゲームへ書き換える方法を紹介する。
交互手番ゲームから同時手番ゲームへの書き換えでは、交互手番のゲーム
における「戦略」をどのように定義するかが重要なポイントとなる。また、同
時手番ゲームから交互手番ゲームへの書き換えでは、プレイヤーが他のプレ
イヤー選んだ戦略を知らずに自分の戦略を決定するという状況を表現するた
めに「情報集合」という概念が必要になる。情報集合を用いた展開型ゲーム
8)
プレイヤーが期待利得を最大化するという仮定は、プレイヤーがリスク中立的であるというのと同値であ
ることに注意する。プレイヤーがリスク中立的でない(リスク回避的、もしくは、リスク愛好的である)場合
には、期待効用を最大化する戦略を選ぶことになる。利得 x に対するプレイヤーの効用関数を u(x) をとす
ると、プレイヤー 1 が「傘を持っていく」を選んだ場合の効用の期待値(期待効用)は、
0.6u(−1) + 0.4u(−1) = u(−1),
「傘を持たない」を選んだ場合の期待効用は、
0.6u(0) + 0.4u(−2)
となる。たとえば、プレイヤーの効用関数が u(x) = −x2 (x ≤ 0) であるとすると、u00 (x) = −2 < 0 か
らこのプレイヤーはリスク回避的であることが分かる。傘を持っていく場合の期待効用は −1、傘を持たない
場合の期待効用は −1.6 となることから、このプレイヤーは傘を持って出ることがわかる。リスク回避的なプ
レイヤーは、傘を持たないで外出した場合に、雨が降ったり降らなかったりする偶然によって自分の利得が変
化することを不快に思う傾向を持つのである。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
12
第3章
交互手番のゲーム
を一般的に解くためには「信念」という概念が不可欠であるが、それは後の
章に譲ることにして、ここではさしあたり同時手番ゲームの展開型表現に必
要な範囲で、情報集合とはどのようなものであるかを説明するにとどめる。
3.4.1
交互手番→同時手番
ゲーム開始前(時点 0)に、将来のありとあらゆる場合に対応した行動計
画を各プレイヤーが同時に提出する、と考えることで、交互手番のゲームを
同時手番のゲームに置き換えることができる。これを交互手番のゲームの標
準型による表現という。
同時手番ゲームとは、各プレイヤーが同時に戦略を提示するとそれに従っ
て利得が決定されるというものであった。交互手番ゲームも、将来時点で何
が起こったら自分はどう対応するかを、あらゆる場合についてもれなく定め
た条件付行動計画のことを戦略(strategy)と呼ぶことにすれば、同時手番
ゲームと同様に分析することができるようになる。すると、ナッシュ均衡や
支配戦略などの概念もそのまま用いることができて、便利である。
それに対し、各時点においてどの選択肢をとるかをプレイヤーの行動(ac-
tion)と呼び、戦略と区別する。同時手番のゲームでは選択肢をとる機会が
1回だけなので、どの行動をとるかがすなわち戦略であり、行動と戦略とを
区別する必要がなかったが、交互手番のゲームではこれらを区別する必要が
ある。
ただし、同時手番のゲームを利得表の上で解いて得られるのはあくまでナッ
シュ均衡であり、部分ゲーム完全均衡であるとは限らないことに注意しなけ
ればならない。結局のところ、部分ゲーム完全均衡かどうかをチェックする
には展開型によるほかない。
例 11. 生産量調整ゲーム
稀少な天然資源を有する A・B 両国が本年度の生産計画を立てる。
毎年、まず A 国(プレイヤー 1)が生産計画を発表し、その状況を見て
から B 国(プレイヤー 2)が生産計画を発表するのが通例である。諸事
情あって、いったん発表した生産計画は変えることができず、計画通り
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.4. ゲームの書き換え
13
に生産・出荷が行われるものとする。生産量が多くなると価格が下がっ
て利幅が小さくなるため、両国の利得は図 3.7 のようになる。このゲー
ムのナッシュ均衡・部分ゲーム完全均衡はどうなるか。
多
Player 2
Player 1
(40, 40)
少
多
(100, 60)
少
多
(60, 100)
少
(80, 80)
図 3.7: 生産量調整ゲーム
プレイヤー 1 のとりうる戦略は「多」
「少」の2通りであるが、プレイヤー
2 のとりうる戦略は次のように4通り考えられる。
{多,多} 1 が「多」といっても「少」といっても「多」をとる。
{多,少} 1 が「多」といったら「多」を、
「少」といったら「少」をとる。
{少,多} 1 が「多」といったら「少」を、
「少」といったら「多」をとる。
{少,少} 1 が「多」といっても「少」といっても「少」をとる。
ここでプレイヤー 2 の戦略{A,B}は、1 の生産量が「多」である場合
にはAを、
「少」である場合にはBをとるという戦略を表す。この交互手番の
ゲームは、下のような利得表で表現できる。
1\2
{多,多}
{多,少}
{少,多}
{少,少}
多
40, 40
40, 40
100, 60
100, 60
少
60, 100
80, 80
60, 100
80, 80
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
14
第3章
交互手番のゲーム
ナッシュ均衡は、
(多,
{少,多})(
, 多,
{少,少})(
, 少,
{多,多}),
の3つである。しかしこれには、交互手番であることを考慮に入れていない
ために生じるハッタリの均衡が含まれている。プレイヤー 1 が「多」をとっ
た後の部分ゲームではプレイヤー 2 は「少」をとるのが最適反応であるから、
プレイヤー 2 の{多,∗}(∗ は多・少どちらでもよい)という戦略は部分ゲー
ム完全均衡にならない。またプレイヤー 1 が「少」をとった後の部分ゲーム
ではプレイヤー 2 は「多」をとるのが最適反応であるから、プレイヤー 2 の
{∗, 少}という戦略は部分ゲーム完全均衡にならない。したがって部分ゲーム
完全均衡は
(多、{少,多})
の1つだけとなる。
3.4.2
同時手番→交互手番
たとえば、前章では同時手番ゲームとして扱った「じゃんけん」を、今度
は交互手番ゲームで表現する方法を考えよう。次のようなルールでじゃんけ
んをプレイすると考える。
• まず、プレイヤー 1 が{グー、チョキ、パー}のいずれかひとつを選
んで紙に書いて、審判に渡す。
• 次にプレイヤー 2 が、プレイヤー 1 が何を選んだかを知ることなく、
自分の手を決めて紙に書いて、審判に渡す。
• 審判はプレイヤー 1・2 から受け取った紙をもとに、両者に利得を分配
する。
これが普通のじゃんけんと同じゲームであることはすぐにわかるだろう。
「プ
レイヤー1とプレイヤー2が同時に戦略を決定する」という状況は、
「プレイ
ヤー1が戦略を決定した後、1がどの戦略をとったかを知らないままプレイ
ヤー2が戦略を決定する」という状況と同じと考えられる。同時手番ゲーム
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.4. ゲームの書き換え
Player 2
グー
15
(0, 0)
チョキ
パー
グー
Player 1
(-1, 1)
グー
チョキ
(1, -1)
(-1, 1)
チョキ
パー
パー
(0, 0)
(1, -1)
グー
(1, -1)
チョキ
パー
(-1, 1)
(0, 0)
図 3.8: じゃんけん:展開型表現
の本質は、プレイヤーが同時に手を選択する所にあるのではなく、お互いに
相手の決定を知らないまま自分の手を選択するという所にある、ということ
になる。
じゃんけんをゲームの木で表したものが図 3.8 である。プレイヤー 2 の決
定点 3 つが丸で囲まれているが、これはプレイヤー 2 が相手の手を知らない
まま、すなわち自分が上・中・下のどの決定点にいるのかを知らないまま、自
らの戦略を決定するという状況を表すためのものである。この丸のことを情
報集合(information set)という。
情報集合とは、プレイヤー i が動く決定点のうち、自分が動く時点で自分が
どこにいるのかを区別できない点をまとめたものである。図では情報集合に
含まれる決定点を○で囲む9) 。必要ならばその横にそこで動くプレイヤーの
名前を書いたり、どの情報集合か特定するための記号をつけておいたりする。
情報集合に関する注意点をいくつか挙げる。
• 情報集合がひとつの決定点からなる場合、ふつうは情報集合の丸を省
略する。これは、プレイヤーが自分がどの決定点にいるかを知ってい
る、すなわち、それまでのゲームの歴史をすべて把握しているという
ことを表す。
9)
決定点どうしを点線でつなぐ流儀もある。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
16
第3章
交互手番のゲーム
• 同じ情報集合内の決定点から出る枝の数はどの点についても同じでな
ければならない。そうでなければ、提示された選択肢の数からどの決
定点にいるのかを特定できてしまうからである。
• 部分ゲームの定義として、始点は必ず1点からなる情報集合でなけれ
ばならない。逆に言うと、他の決定点を含む情報集合に含まれる点を
始点とするゲームは部分ゲームとはいわない。
(部分ゲーム完全均衡の
解説の注を参照)。たとえば図 3.8 において部分ゲームはただひとつ、
全体ゲームのみである10) 。
(2つ以上の決定点を含む)情報集合のあるゲームを解く場合には、自分
が情報集合の中のどの点にいるのかという予想、すなわち「信念」を考えね
ばならず、これについては後の章で扱うが、なかなか面倒である。ナッシュ
均衡を求めるには、利得表を用いるほうが良い。
とはいえ、同時手番ゲームをゲームの木で表すことにメリットが無いわけ
ではない。理論的に統一した取り扱いが可能であるということだけではなく、
たとえば同時手番と交互手番が混在するようなゲーム(練習問題 21)では、
同時手番ゲームを展開型で表せば、ひとつのゲームの木でゲーム全体を見渡
すことができ、便利である。また、同時手番と交互手番の違いを図式的に表
現することもできる。たとえば、第 1 章で扱ったクールノー競争のゲームの
木は図 3.9 となるのに対し、シュタッケルベルク競争のゲームの木は図 3.10
のようになる。
3.5
【発展】完全情報/不完全情報
完全情報(perfect imformation)とは、全てのプレイヤーが全ての手番に
おいて、それまでにどのようなプレイが行われたかを知っているということ
である。ゲームの木では、すべての情報集合が1つの決定点だけからなるこ
とと定義される。囲碁や将棋、オセロは完全情報ゲームである。また人生ゲー
10)
したがって、このゲームの部分ゲーム完全均衡戦略は、たとえばプレイヤー 2 の上の決定点、すなわち
プレイヤー 1 がグーを出したことを知った状態から始まるゲームにおいて、プレイヤー 2 の最適反応となっ
ている必要はない。実際、このゲームの唯一の部分ゲーム完全均衡となる混合戦略はグー・チョキ・パーを等
確率で出すことだが、それは相手がグーを出したことを知っている状態における最適反応とはいえない。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.5. 【発展】完全情報/不完全情報
17
Player 2
Player 2
Player 1
Player 1
q1
q2
q1
q2
図 3.9: クールノー競争(展開型
表現)
図 3.10: シュタッケルベルク競争
ムやモノポリー、ルーレットは、偶然手番のある完全情報ゲームである。
有限回で終わる完全情報ゲームにおいては、各プレイヤーの最適行動を後
ろから順に定めてゆけば、唯一の純粋戦略の部分ゲーム完全均衡を求めるこ
とができる。したがって、結果が「先手の勝ち」
「後手の勝ち」
「引き分け」の
どれかになるような、偶然手番のない2人完全情報ゲームは
• 先手必勝
• 後手必勝
• 双方が必ず引き分けに持ち込める
のいずれかになる。これはツェルメロの定理(Zermelo’s theorem)と呼ばれ
る11) 。
それに対し不完全情報(imperfect information)とは、他のプレイヤーが
どのような選択肢をとったのかを知らないままプレイを行うことがある場合
をさす。ポーカーやブラックジャック、麻雀は不完全情報ゲームである。ゲー
ムの木では、2つ以上の決定点をふくむ情報集合があるようなゲームとして
定義される。同時手番ゲームは展開型にすると不完全情報の交互手番ゲーム
として表現される。
完全情報でない場合には、自分がプレイする前に相手がどの手をプレイし
たのかについて何らかのルールに基づいて推論する必要がある。経済学が想
11)
囲碁(コウは適当に処理する)や将棋(千日手は引き分けとする)もこのクラスのゲームに属する。ただ
し、これらのゲームはあまりにも複雑なので、どのような戦略が支配戦略となるのかはまだ知られていない。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
18
第3章
交互手番のゲーム
定する、期待効用を最大化することを望む人の場合には、どの手がプレイさ
れたについてベイズ法則(Bayes’ rule)にもとづいて12) 主観的な確率判断を
行うと考えるのが自然である。
3.6
【発展】ゲームの数学的定式化 (2) 展開型
以上の道具立てを全部扱えるように交互手番のゲームを数学的に定式化す
ると、次のようになる。ただし、実際にこれに従ってゲームを記述すること
はほとんどなく、これらの諸要素が正確にわかるように文章でモデルを書け
ばそれで良い。
• プレイヤー i = 0,1, 2, . . . , N
プレイヤー 0 は自然という名のダミープレイヤーで、不確実性を表す
のに用いる。
• ゲームの木 T
木は点と枝からなる。点(node)は決定点(各プレイヤーがどの手を
とるか決断するところ13) )と終点(利得の書いてあるところ)からな
る。枝(branch)は点と点を結ぶ向きのついた矢印(有向グラフ)で
ある。ここで木とは、(a) 枝の入ってこない点(=根(root))が一つ
だけあり、(b) どの点に対しても根から枝をたどってその点に到る経
路が一つだけあるようなものをいう。ゲームの進行を最も詳しく表そ
うとすると、必ず木の形になる。
• 情報集合 hi ∈ Hi
プレイヤー i が動く決定点のうち、自分が動く時点で自分がどこにい
るのかを区別できない点をまとめたもの。
• 行動 ai (hi ) ∈ Ai , α
各決定点から出ている枝が、そこで動くプレイヤーの行動に対応して
いる。ただし同じ情報集合に含まれる点の中で、実際にどの点にいる
12)
このことから不完全情報ゲームはベイジアンゲームとも呼ばれる。
なお、1つの決定点では1つのプレイヤーだけが動くと約束する。同時に動くケースも、どちらかが先に
動いて、次にもう片方が相手の行動を見ずに動く、と表現することができる(同時手番のゲームの動学ゲーム
による表現)。
13)
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.6. 【発展】ゲームの数学的定式化 (2) 展開型
19
h2
u1
d1
u2
d2
図 3.11: 枝と行動との対応を指定する関数
のかをプレイヤーは知ることができないので、行動は決定点ではなく
情報集合に応じて決まる。各情報集合 hi においてプレイヤー i の取り
うる選択肢の集合を Ai (hi ) と表す。
α は枝と行動との対応を指定する関数である。たとえば図 3.11 で、プ
レイヤー 2 が情報集合 h2 において「up」「down」のどちらかを選択
するという状況を記述するには、
A2 (h2 ) = {up, down},
α(u1 ) = α(u2 ) = up,
α(d1 ) = α(d2 ) = down
とする。
• 不確実性 ρ
自然(i = 0)というダミープレイヤーが、各決定点において生じうる
事態の集合 A0 (h0 ) 上に設定された確率分布 ρ(h0 ) に従って枝を選ぶ。
• 利得 ui
ゲームの木の終点に利得を設定する。
以上の各要素でゲームを表現したものを展開型(extensive form)という。
G(T, {Hi }i∈N , {Ai }i∈N , α, ρ, {ui }i∈N )
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
20
第3章
3.7
交互手番のゲーム
まとめ
• 交互手番のゲームはゲームの木で表現できる。これを展開型によるゲー
ムの表現という。
• 交互手番のゲームのナッシュ均衡の中には、信頼性のない脅し、すな
わちハッタリが効いた非現実的なものも混ざってしまう。そうしたも
のを排除するには、ゲームの木の枝の末端から順にゲームを解いてゆ
けばよい。この方法を後ろ向き帰納法という。
• 最後のゲームから順にナッシュ均衡を求めていくことによって得られ
る均衡を部分ゲーム完全均衡という。部分ゲーム完全均衡とは、すべ
ての部分ゲームにおいてナッシュ均衡となっているような戦略の組の
ことである。
• 先手が有利であるとは限らないし、後手が有利であるとも限らない。
• 情報が多い方が良いとは限らない。情報を知らない(ことが相手に知
られている)ことが逆に幸いして、良い結果を生む場合もある。
• 自分のとりうる選択肢が多いほど有利であるとは限らない。信憑性の
あるコミットメントを用いて自分の行動の選択肢を狭めてそれを相手
に示す――背水の陣をしく――ことで、かえって利得が高まる場合が
ある。
• 交互手番のゲームにおける戦略 とは、将来何が起こったら自分はどう
対応するかを、あらゆる場合についてもれなく定めた行動計画のこと
である。この「戦略」をゲーム開始時点ですべてのプレイヤーが同時
に選ぶと考えることによって、交互手番のゲームを同時手番のゲーム
に書き換えることができる。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.8. 練習問題
3.8
21
練習問題
3.8.1
完全情報ゲーム
練習 15. 金融政策ゲーム
図 3.12 で表されるゲームの部分ゲーム完全均衡を求めよ。
(-1, -1)
Government
leave
Bank
negligent
(1, 1)
help
diligent
(0, 2)
図 3.12: 金融政策ゲーム
練習 16. ローゼンタールのムカデ
図 3.13 で表されるゲームの部分ゲーム完全均衡を求めよ。
Player 1 Player 2 Player 1 Player 2 Player 1 Player 2 Player 1 Player 2
(100, 100)
(1, 0)
(0, 2)
(4, 1)
(2, 8)
(16, 4)
(8, 32)
(64, 16) (32, 128)
図 3.13: ローゼンタールのムカデ
練習 17. 優雅なる冷酷(梶井・松井 (2000) p.52)
一人の君主とその座をねらう N 人の大臣がいる。家来たちには偉い順に大
臣 1 から大臣 N まで序列があり、側近である大臣 1 だけが君主を暗殺する
ことができる。暗殺は必ず成功し、君主が死ぬと大臣 1 が君主となるが、今
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
22
第3章
交互手番のゲーム
度は次の側近である大臣 2 にその地位を狙われることになる。つまり君主と
なった元・大臣 k を暗殺できるのは大臣 k + 1 だけである。それぞれの大臣
にとっては、自分が君主となるのが最も望ましく、ついで大臣のままでいる
のが良く、自分が君主になって暗殺されるのが最悪である。以下の問いに答
えよ。
(1) N = 2 として、このゲームを展開型で表現し、後ろ向き帰納法によって
解を求めよ。
(2) N = 3 として、このゲームを展開型で表現し、後ろ向き帰納法によって
解を求めよ。
(3) 一般の N について、このゲームの解を求めよ。(ヒント:奇妙な答にな
ります)
練習 18. シュタッケルベルク競争・価格モデル(商品差別化あり)
次のようなゲームを考える。第 1 期(t = 1)において、商店 1 が小売価格
p1 を発表する。第 2 期(t = 2)において、商店 2 は p1 を観察した上で小売
価格 p2 を決定する。両商店とも一度発表した価格は変えることができないも
のとする。また仕入れ価格は両商店に共通とし、これを正規化して 0 とする。
両商店が価格を決定した後に市場が開く。各商店の売上数量は、両商店のつ
けた価格に応じて
q1
= α − βp1 + γp2
q2
= α − βp2 + γp1
となると仮定する(ただし β > γ > 0 とする)。両商店は、利潤
πi = p i q i ,
i = 1, 2
を最大化するように行動する。どのような価格が選ばれるか。
練習 19. 二重の限界価格(double marginalization)
メーカーが小売店に商品を卸し、小売店は市場において独占的に商品を販
売する状況を考える。まずメーカーは1個あたりの卸価格 w を小売店に呈示
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.8. 練習問題
23
し、小売店は商品を何個仕入れるかを決定する。次に小売店が市場において
小売価格 p で販売する。需要 q は p に応じて q = 100 − 4p と決まる。ただし
メーカーの生産費用は 0 とし、生産にかかる固定費用、および販売にかかる
費用はないものとする。
(1) 小売店とメーカーは別会社であるとする(図 3.14)。メーカー・小売店
ともに自らの利潤を最大化する場合、市場価格と卸売価格、メーカーお
よび小売店の得る利潤はいくらになるか。
(2) 小売店がメーカーの 100 %子会社であるとする(図 3.15)。メーカーと
小売店の得る利潤の合計が最大になるように協力し合う場合、市場価格・
販売数量、および利潤合計はいくらになるか。
(ヒント:このとき得られ
る利潤の最大値は、メーカーが小売店を通さずに自ら市場で商品を販売
できる場合の利潤の最大値と同じである。)
(3) 前問で得られたのと同じ販売数量を、独立経営の場合に達成しようとす
るならば、メーカーは卸価格をいくらにしなければならないか。
(4) メーカーが小売店に対して、二部料金型の契約
(
W (x) =
F + wx
(x > 0)
0
(x = 0)
を呈示できるとする(図 3.16)。これは仕入を行う場合に卸価格 w に加
えて、数量にかかわらず一定額の負担 F を課すという契約を表す14) 。こ
のような契約が利用可能である場合、市場価格、販売数量、メーカーお
よび小売店の得る利潤はいくらになるか。
練習 20. ホールドアップ問題(hold-up problem)
部品製造業者(プレイヤー1)と組立業者(プレイヤー2)の間で行われ
る次のようなゲームを考える。まずプレイヤー1が部品を製造する。プレイ
ヤー1の造る標準の部品の価値は x、生産コストは 0 であるが、コスト c を
かけてプレイヤー2の造る製品に合わせた独自の改造をほどこした場合、プ
14)
フランチャイズ料、ライセンス料などがここでの F にあたる。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
24
第3章
Maker
交互手番のゲーム
Maker
w
Maker
w,F
Retailer
Retailer
Retailer
p
p
p
Market
Market
Market
図 3.14: 垂直取引
図 3.15: 垂直統合
図 3.16: 二部料金
レイヤー2にとっての部品の価値が v 増加する(v > c とする)。つぎに、プ
レイヤー2はプレイヤー1の造った部品を見た上で、支払額を呈示する。プ
レイヤー1はその提案を見て、プレイヤー2に納入するか、納入をやめて市
場で販売するかを決定する。部品の市場価格は標準品・改造品ともに x であ
る。このとき両プレイヤーはどのような行動をとるか。
3.8.2
不完全情報ゲーム
練習 21. 銀行取付け(ギボンズ p.69 改)
2人の投資家が銀行にそれぞれ 4 億円ずつ資金を預けており、銀行はその
預金を長期プロジェクトに投資している。もし銀行が当該プロジェクトの完
了以前にその投資を回収する必要に迫られた場合には、全部で 6 億円の資金
しか回収できない。他方、プロジェクトが完了した場合には全部で 10 億円の
資金を回収することができる。プロジェクトは第2期末に完了する。また割
引率は 0 とする。
第1期に2人とも資金を引き出した場合の2人の利得はそれぞれ3億円、
1人だけ資金を引き出しにいった場合は、引き出した者には全額の4億円が
支払われるが、引き出さなかった者には2億円しか支払われない。2人とも
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.8. 練習問題
25
引き出さなかった場合には資金は第2期に持ち越される。
1\2
引き出す
引き出さない
引き出す
3, 3
4, 2
引き出さない
2, 4
(第 2 期につづく)
第2期に2人とも資金を引き出した場合の2人の利得はそれぞれ3億円、
1人だけ資金を引き出しにいった場合は、引き出した者には全額の4億円が
支払われるが、引き出さなかった者には2億円しか支払われない。2人とも
引き出さなかった場合にはプロジェクトが完遂され、それぞれ 5 億円が支払
われる。
1\2
引き出す
引き出さない
引き出す
3, 3
4, 2
引き出さない
2, 4
5, 5
(1) このゲームを展開型で表現し、解を求めよ。
(2) 取付騒ぎがおこらずプロジェクトが必ず完遂されるようにするためには、
早期解約者が他の資金提供者に支払う違約金を何億円以上に設定すれば
よいか。
練習 22. 部分ゲームに複数のナッシュ均衡がある場合(MWG p.278)
(1) 図 3.17 に表されたゲームの部分ゲーム完全均衡を求めよ。
(2) 【発展】均衡の妥当性について考えよ。
練習 23. 同時手番ゲームと交互手番ゲームの比較 (1) 数量競争
企業1と企業2(プレイヤー i = 1, 2)が同じ商品を輸入して市場に供給し
ている。商品の卸価格は両企業に共通で(正規化して)0 とし、固定費用な
ど仕入以外の費用はないものとする。市場における財の価格 P は、両企業の
供給量の合計 Q = q1 + q2 に応じて、
P = (120 − Q)/10
で定まるとする。両企業は生産量を、たくさん(q = 60)
・ふつう(q = 40)
・
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
26
第3章
交互手番のゲーム
Player 2
(-3, -3)
L
S
Player 1
(3, 1)
L
Player 1
S
in
(1, 3)
L
S
out
(-6, -6)
(2, 0)
図 3.17: large nich or small nich
控えめ(q = 30)のいずれかから選択する。するとその決定に応じて、利潤
は次のように定まる。
1\2
多
中
少
多
0, 0
120, 80
180, 90
中
80, 120
160, 160
200, 150
少
90, 180
150, 200
180, 180
(1) 各企業がどれだけ生産するかを同時に決定する場合、どのような生産量
の組がナッシュ均衡となるか。またそのときの企業 1・2 の利潤はどのよ
うになるか。
(2) はじめに企業 1 が生産量を決定し、つぎに企業 2 が企業 1 の生産量を見
てから生産量を決定する場合、どのような生産量の組が部分ゲーム完全
均衡となるか。またそのときの企業 1・2 の利潤はどのようになるか。た
だし、企業 1 は企業 2 の生産量を決定してから自らの生産量を変更する
ことは(増やすことも減らすことも)できないとし、また以上の設定は
周知の事実であるとする。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
3.8. 練習問題
27
player 1
player 2
50
120
L
50
R
M
cost = 1
cost = 1
図 3.18: 同時手番と交互手番との比較 (2) 価格競争
練習 24. 同時手番ゲームと交互手番ゲームの比較 (2) 価格競争
ある所に L,M,R の 3 つの村がある(図 3.18)。L 村の L 商店(プレイヤー
1)と R 村の R 商店(プレイヤー 2)が似たような商品を仕入れて、店頭で
販売している。商品の卸価格は両企業に共通で(正規化して)0 とし、固定
費用など仕入以外の費用はないものとする。
L 村・M 村間、M 村・R 村間の移動には、片道 1 の費用がかかる。M 村の
人(120 人)は、L か R かどちらか安い方で購入する。同じ価格の場合には、
半数(60 人)が L で、もう半数が R で購入する。L 村・R 村の人(各 50 人)
は、価格差が 4 以下の場合には地元の店で購入し、価格差が 4 よりも大きく
なると安い方の店で購入する。
両企業は価格を、高め(p = 9)
・ふつう(p = 6)
・安め(p = 4)のいずれ
かから選択する。するとその決定に応じて、利潤は次のように定まる。
1\2
高
中
安
高
990, 990
450, 1020
0, 880
中
1020, 450
660, 660
300, 680
安
880, 0
680, 300
440, 440
(1) 各商店が価格をいくらに設定するかを同時に決定する場合、どのような
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
28
第3章
交互手番のゲーム
価格の組がナッシュ均衡となるか。またそのときの両商店の利潤はどの
ようになるか。
(2) はじめに L 商店が価格を設定し、つぎに R 商店が L 商店のつけた価格
を見てから価格を決定する場合、どのような価格の組が部分ゲーム完全
均衡となるか。またそのときの L 商店・R 商店の利潤はどのようになる
か。ただし、L 商店は・R 商店が価格を設定してから自らの価格を変更
することはできないとし、また以上の設定は周知の事実であるとする。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.