第4章 不完全情報ゲーム

戦略的マーケティングのためのゲーム理論
第4章
不完全情報ゲーム
本章では不完全情報ゲームについて、特に情報集合とその上における信念の
取り扱いについて説明し、完全ベイズ均衡という均衡概念を新たに導入する。
完全ベイズ均衡は、情報集合を用いる動学ゲームにおいて不可欠な概念で
はあるが、経済学への応用という面では、完全ベイズ均衡を知らないと理解
できないモデルというのはそれほど多くないというのが現状である1) 。
完全情報/不完全情報(復習)
はじめに、完全情報/不完全情報の概念に
ついておさらいしておく。完全情報とは、ゲームに参加しているすべてのプ
レイヤーが、ゲームのルールや利得、および、自分がプレイするまでに他の
プレイヤーがどのような行動をとったのか――ゲームにおける行動決定以前
の歴史(history)――を全て知っているということであり、ゲームの木では、
すべての情報集合が1つの決定点からなる(いくつかの決定点を丸で囲む必
要がない)こととして表される。それに対し、不完全情報とは、前のプレイ
ヤーがどのような行動をとったのかを知らないまま、行動を選択するような
プレイヤーがいることをいう。ゲームの木では、2つ以上の決定点をふくむ
情報集合があるようなゲームとして定義される。
1)
シグナリングは重要な例外であるが。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
2
第4章
不完全情報ゲーム
Player 2
戦う
(-1, -1)
協調
(3, 0)
戦う
(-1, -1)
協調
(2, 1)
大規模参入
Player 1
小規模参入
参入しない
(0, 2)
図 4.1: 参入ゲーム (2):SPNE が妥当でないケース
参入ゲーム (2):SPNE が妥当でないケース
不完全情報のゲームでは、部
分ゲーム完全均衡が妥当でないと感じられる場合がある。図 4.1 において、プ
レイヤー1はプレイヤー2の「参入してきたら戦う」という脅しを真に受け
て、「参入しない」を選択している。この戦略の組について検討してみよう。
もしプレイヤー2が「参入してきたら戦う」のであればプレイヤー1は退出
するのが最適であるし、プレイヤー2にとっても、プレイヤー1が退出する
のであれば戦略を変更するインセンティヴがない(そもそも手番が回ってこ
ないので、戦略を変えても利得は変化しない)。相手の戦略を所与とすると双
方とも戦略を変えても得をしないことから、これはナッシュ均衡である。ま
た、このゲームの部分ゲームは1つだけ(全体ゲームだけ)なので、この戦
略の組は定義上、部分ゲーム完全均衡でもある。
しかし、実際にプレイヤー1が参入したら、それが大規模参入・小規模参
入のどちらであったとしてもプレイヤー2は協調策をとるだろう。したがっ
てプレイヤー2の「参入してきたら戦うぞ」というのはハッタリにすぎない。
このようなハッタリを排除するために導入されたのが、完全ベイズ均衡とい
う均衡概念である。
完全ベイズ均衡を定義する際には、情報集合の中のどの点にどのような確
率でいるのかについての主観的確率を表す信念という概念が必要となる。そ
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.1. 信念
3
こで以下では、まず信念について解説し、その後で完全ベイズ均衡の定義お
よびその求め方を述べる。
4.1
信念
不完全情報のゲームでは、自分が情報集合上のどの点にいるのかについて
なんらかの見積もりをする必要がある。自分が情報集合の中のどの点にいる
のかについての見積もり確率を信念(belief)という。合理的なプレイヤーの
信念は、事前に与えられた確率、および、確率論におけるベイズ法則にした
がって見積もられたものでなければならない。
自然の営為を予想する
情報集合の前の手番をプレイしているのが「自然」
2)
だけである場合 、合理的な信念はただ一通りに定まる。プレイヤーは単純
に期待利得(あるいは期待効用)を計算してそれが最大になるように戦略を
決定すればよい。
例 12. ロシアン・ルーレット
ミサコちゃんがシシトウ(獅子唐辛子)を食べようかどうか迷って
いる。辛くないシシトウならば食べたい(利得 1)が、辛いシシトウな
らば食べたくない(利得 −4)。辛いシシトウは 6 本に 1 本の割合で入っ
ているものとする。この状況をゲームの木で表現すると図 4.2 のように
なる。
(1) 図 4.2 の情報集合上の合理的な信念を求めよ。
(2) ミサコちゃんはシシトウを食べるほうがよいか、食べないほうがよ
いか。
このゲームでは、
µ
(U にいる確率, D にいる確率)=
1 5
,
6 6
¶
2)
このような場合には、情報集合という概念は必須のものではなく、「自然」とプレイヤーの手番を入れ替
えることで、情報集合を用いずにゲームを書き表すこともできる。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4
第4章
不完全情報ゲーム
プレイヤー
-4
食べる
辛いシシトウ
[1/6]
U
食べない
0
自然
1
辛くないシシトウ
D
[5/6]
食べる
食べない
h
0
図 4.2: ロシアン・ルーレット
が情報集合 h における合理的なプレイヤーの信念である。かりにプレイヤー
が勝手に (0, 1) すなわち「あたしの食べるシシトウが辛いわけはない」など
と楽観的な見積もりをしたとしても、それは事前に知られた確率から導かれ
たものではないので、合理的とはいえない。
シシトウを食べるという行動を、ゲームの木で表すと図 4.3 のようになる。
このときの期待利得は、
5
1
1
× (−4) + × 1 =
6
6
6
である。それに対し、シシトウを食べない場合には図 4.4 のようになる。こ
のときの期待利得は 0 である。1/6 > 0 であるから、プレイヤーはシシトウ
を食べるものと考えられる。
他人の行動を予想する
自然はあらかじめ知られた確率に従って手を選択す
るだけなので、その行動は簡単に予想できる。それに対して、情報集合より
も前の手番で、自然以外のプレイヤーが行動を決定する場合には、
• 相手のプレイヤーがどのような行動をとるかを予測する必要がある
• 自分の持つ信念(についての相手の予想)によって相手の行動が変化
する可能性がある
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.1. 信念
5
プレイヤー
-4
食べる
辛いシシトウ
[1/6]
U
食べない
0
自然
1
辛くないシシトウ
D
[5/6]
食べる
食べない
0
h
図 4.3: ロシアン・ルーレット:食べる場合
プレイヤー
-4
食べる
辛いシシトウ
[1/6]
U
食べない
0
自然
1
辛くないシシトウ
D
[5/6]
食べる
食べない
h
0
図 4.4: ロシアン・ルーレット:食べない場合
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
6
第4章
不完全情報ゲーム
Player 2
(-2, -2)
する
プレゼントする
U
しない
(1, 3)
Player 1
(3, 1)
プレゼントしない
D
する
しない
h
(0, 0)
図 4.5: 賢者の贈り物
ために、問題は複雑になる。
例 13. 賢者の贈り物 (The gift of the Magi)
明日はクリスマス。デラ(プレイヤー1)は家の中で鏡を見ながら、
ジムの時計にぴったり合うプラチナの鎖をプレゼントするかどうか考え
ている。鎖を買うためには、自慢の髪を切って売らなければならない。
一方、ジム(プレイヤー2)は会社で帳簿に数字を埋めながら、デラに
鼈甲の櫛をプレゼントするかどうか考えている。櫛を買うためには、祖
父から譲り受けた金時計を売らなければならない。利得は図 4.5 の通り
である。
(1) 「デラはプレゼントを買ってくる」と考える場合、ジムはどのよう
な行動を取るか。
(2) 「『デラはプレゼントを買ってくる』とジムは考える」とデラが考え
た場合、デラはどのような行動を取るか。
ゲームの木で表現すると図 4.5 のようになる。ジムが「デラはプレゼント
を買ってくるだろう」と予想した場合、ジムはプレゼントを買わないほうが
得である。また、デラが以上の事態を予想した場合、デラはプレゼントを買っ
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.1. 信念
7
てくることを選ぶ。このように、他のプレイヤーの行動について自分の抱い
た信念と、自分の選ぶ行動を前提としたときの他のプレイヤーの行動とが一
致する場合、プレイヤーの信念は戦略と整合的であるという。
なおこのゲームでは、ジムが「デラはプレゼントを買わないだろう」と考
えることも整合的な信念として成立する。その場合、ゲームの帰結は全く逆
になる。このように、ひとつのゲームにおいて複数の信念が併存しうること
があり、その場合にはプレイヤーがどのような信念を共有するかによって、
ゲームの帰結が異なることになる(次章「シグナリング」を参照)。
戦略と信念が整合的でないこともある。次の例で簡単に見ておこう。
例 14. 戦国ゲーム
時は戦国、天下統一を目指してまさに上京せんとするU家(プレイ
ヤー1)の隣に所領を持つ弱小大名であるJ家(プレイヤー2)におい
て、U家の軍門に降るか独立を堅持するかについて評定が行われている。
U家がJ家に攻め込んできた場合にはまず勝ち目はない。両者の利得は
図 4.6 に整理されている。ある家臣が次のように言った。
「ワシはUは攻
め込んでこないと信じておる。軍門に降るなどまっぴら御免、独立を守
るべきじゃ。」はたしてこの考えは適切だろうか。
この家臣の信念は図 4.6 のように表される。しかし、プレイヤー2が必ず
「独立を守る」を選ぶのであればプレイヤー1は「領土拡張」を選ぶほうが利
得が高くなるので必ずそちらを選ぶ、これはプレイヤー2の信念とは矛盾し
てしまう。プレイヤー2の戦略を予想したプレイヤー1がとる行動と、プレ
イヤー2の抱いたプレイヤー1の行動に関する信念とがうまくかみあってい
ないのである。このように、自分の抱いた信念と、自分の選ぶ行動を前提と
したときの他のプレイヤーの行動とが矛盾する場合、プレイヤーの信念は整
合的でないという。なおこのゲームでは、
「領土拡張」がプレイヤー1にとっ
ての支配戦略となっているのでプレイヤー2の持ちうる合理的な信念は、
「プ
レイヤー1は必ず領土拡張策をとる」ということをおいて他にない。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
8
第4章
不完全情報ゲーム
Player 2
領土拡張
[100%]
Player 1
(4, -3)
独立堅持
[0%]
[100%]
内政重視
軍門に降る
(5, -1)
(2, 1)
独立堅持
軍門に降る
[0%]
h
(3, -1)
図 4.6: 戦国ゲーム:不適切な信念
4.2
完全ベイズ均衡
信念と戦略の相互作用
前節で見たように、信念は好き勝手に形成して良い
というものではなく、実際にとられる戦略と整合的でなければ妥当なものと
はいえない。戦略によって信念は規定されるが、逆に信念によってプレイヤー
の取る行動は変化するので、信念と戦略とは互いに影響し合うのである。この
ような状況において、すべてのプレイヤーが、他者の行動を正しく予想してお
り、その予想のもとで自分がもっともよいと考える行動を選択している状態
が完全ベイズ均衡( Perfect Baysien (Nash) Equilibrium, PBE or PBNE)
である。
定義
ナッシュ均衡や部分ゲーム完全均衡は「戦略の組」s∗ として定義され
たが、完全ベイズ均衡は、戦略とそれに対応する信念の組として、次のよう
に定義される3) 。
3)
完全ベイズ均衡にはいくつかのバリエーションがあるが、どれを用いるにせよ、信念の形成の自由度が高
すぎるために若干の問題が生じる場合があることが知られている。より強い概念がほしい場合には、逐次均衡
(sequential equilibrium)を用いるとよい。詳しくは岡田 (2000) などを参照のこと。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.2. 完全ベイズ均衡
¨
9
¥
戦略の組 s∗ と信念の組 b∗ において、
• (逐次合理性)各情報集合 hi において各人が信念 b∗ のもとでの
期待利得を最大化している。
∀i, ∀hi , ∀si ,
ui (s∗ , b∗ |hi ) = ui (s∗−i , si , b∗ |hi )
• (信念の整合性)各情報集合 hi 上の信念 b∗ (hi ) は、できる限りa) hi
よりも前の情報集合上の信念と均衡戦略とを用いて、ベイズの定
理で導かれたものである。
が成立するとき、(s∗ , b∗ ) を完全ベイズ均衡という。
a)
ここで「できる限り」という意味は、オフパス(均衡経路外)であるためにベイズ法則で確率を割
り振ることができない場合には任意の信念を抱いてよい、ということである。
§
¦
言葉で言い換えるならば、完全ベイズ均衡とは、全てのプレイヤーが全ての
手番において、各自の信念のもとで期待利得を最大化するような戦略を選ん
でおり(逐次合理性)また、プレイヤーの信念が不合理でなく他のプレイヤー
の取る戦略とも整合的である(信念の整合性)ような戦略と信念の組のこと
である。
完全ベイズ均衡の求め方
たとえば図 4.7 における完全ベイズ均衡を求める
には、次のような手順を踏む。
(1) 情報集合 h2 におけるプレイヤー 2 の信念 (b2 , 1 − b2 ) を仮定する (0 ≤
b2 ≤ 1)。その信念のもとで、プレイヤー2の利得が最も大きくなるよう
な戦略 (s2 , 1 − s2 ) を求める。
(2) プレイヤー 1 は、プレイヤー2の戦略 (s2 , 1 − s2 ) を所与として、利得が
最も大きくなるような戦略 (s1 , 1 − s1 ) を決定する。
(3) 戦略と信念の整合性をチェックする。(s1 , 1 − s1 ) = (b2 , 1 − b2 ) であれ
ば、信念 b2 と戦略 s1 , s2 の組は完全ベイズ均衡である。
ここで si (i = 1, 2) などはそれぞれの枝を選ぶ確率を表す。純粋戦略しか考え
ないのであれば、si は 0 か 1 かどちらかの値しかとらないことになる。する
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
10
第4章
不完全情報ゲーム
Player 2
s2
s1
1-s 2
b2
Player 1
1-s 1
1-b 2
s2
1-s 2
h2
図 4.7: 完全ベイズ均衡の求め方
と信念もそれに対応するものだけを考えればよく、分析はずいぶん楽になる。
参入ゲーム (2):完全ベイズ均衡で解決
はじめにあげた参入ゲームを、信
念を用いて考え直してみよう。図 4.8 において、情報集合上にプレイヤー 2
の信念 (b, 1 − b) を仮定する。プレイヤー 2 が「協調する」を選んだ場合の利
得は
3 × b + 2 × (1 − b) = 2 − b
それに対し、「戦う」を選んだ場合の利得は
−1 × b + −1 × (1 − b) = −1
である。0 ≤ b ≤ 1 であるから、協調する方が常に利得が高くなることがわ
かる。したがって、プレイヤー2はいかなる信念のもとでも「戦う」を選ぶ
ことはなく、
(参入しない,参入してきたら戦う)という戦略の組は完全ベイ
ズ均衡にはならない。(b, 1 − b) = (1, 0) だけが戦略と整合的な信念として維
持される。したがってこのゲームの唯一の完全ベイズ均衡は、プレイヤー1
は上の枝を選んで参入し、プレイヤー2は協調する、というものである(図
4.9)。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.2. 完全ベイズ均衡
Player 2
大規模参入
[b]
Player 1
小規模参入
[1-b]
11
戦う
(-1, -1)
協調
(3, 0)
戦う
(-1, -1)
協調
(2, 1)
参入しない
(0, 2)
図 4.8: 参入ゲーム (2):信念の形成
Player 2
大規模参入
[1]
Player 1
小規模参入
戦う
(-1, -1)
協調
(3, 0)
戦う
(-1, -1)
協調
(2, 1)
[0]
参入しない
(0, 2)
図 4.9: 参入ゲーム (2):完全ベイズ均衡
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
12
第4章
完全ベイズ均衡:賢者の贈り物
不完全情報ゲーム
もうひとつの例としてさきにあげた「賢者
の贈り物」ゲーム(図 4.5)における完全ベイズ均衡を求めよう。ただし、こ
こでは純粋戦略だけを考えることにする4) 。情報集合 h においてプレイヤー 2
は、自分が決定点 U にいるのか、それとも D にいるのかを知らないまま、自
らの戦略を決定せねばならない。純粋戦略の均衡を考える場合、プレイヤー
1 の戦略は、「プレゼントする」か「プレゼントしない」かのいずれかである
から、プレイヤー 2 の抱きうる信念はそれに対応して、
(プレイヤー 1 がプレゼントする確率, しない確率)= (100%, 0%)
または
(プレイヤー 1 がプレゼントする確率, しない確率)= (0%, 100%)
のいずれかとなる。
はじめに、プレイヤー 2 が前者の信念を抱いていると仮定して、どのよう
な戦略をとるかを考える。情報集合 h においてプレイヤー 2 が「プレゼント
する」を選択した場合の期待利得は、
100% × (−2) + 0% × 1 = −2
「プレゼントしない」を選択した場合の期待利得は、
100% × 3 + 0% × 0 = 3
となる。したがってプレイヤー 2 は「プレゼントしない」を選択する。つぎ
に、このプレイヤー 2 の戦略を所与として、プレイヤー 1 がどのような戦略
をとるかを考える。プレイヤー 2 は「プレゼントしない」を選ぶので、プレ
イヤー 1 は「プレゼントする」を選ぶことがわかる。これは、はじめに仮定
した「プレイヤー 1 はプレゼントするだろう」というプレイヤー 2 の信念と
整合的である。
4)
混合戦略の完全ベイズ均衡の求め方については練習問題を参照。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.3. まとめ
13
つぎに、プレイヤー 2 が後者の信念を抱いていると仮定する。プレイヤー
2 が「プレゼントする」を選択した場合の期待利得は、
0% × (−2) + 100% × 1 = 1
「プレゼントしない」を選択した場合の期待利得は、
0% × 3 + 100% × 0 = 0
であるから、プレイヤー 2 は「プレゼントする」を選択する。これを所与とし
てプレイヤー 1 がどのような戦略をとるかを考えると、プレイヤー 1 は「プレ
ゼントしない」を選ぶことがわかる。これは、はじめに仮定した「プレイヤー
1 はプレゼントしないだろう」というプレイヤー 2 の信念と整合的である。
したがってこのゲームでは
(プレゼントする, しない), (プレゼントしない, する)
の2つが完全ベイズ均衡となる。前者は「プレイヤー 1 はきっとプレゼント
を買ってくるだろう」という信念に対応し、後者は「買ってこないだろう」と
いう信念に対応している。
ただし、このように複数の信念に対応する複数の均衡があるゲームを、両
者が申し合わせることなく一回だけプレイする場合、必ずしも均衡がプレイ
されるとは限らない。プレイヤーの信念がうまくかみ合うとは限らないから
である――小説でそうだったように。
4.3
まとめ
• 不完全情報のゲームでは自分が情報集合の中のどの点にいるのかを見
積もる必要がある。その主観的確率を信念(belief)という。合理的な
信念は、自然の振る舞いや、他のプレイヤーの戦略と整合的なもので
なければならない。
• 不完全情報のゲームにおいて用いられる均衡概念である完全ベイズ均
衡とは、すべての手番において全プレイヤーが期待利得を最大にする
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
14
第4章
不完全情報ゲーム
Player 2
(-2, -2)
する
プレゼントする
[1]
しない
(1, 3)
Player 1
(3, 1)
プレゼントしない
[0]
する
しない
(0, 0)
h
図 4.10: 賢者の贈り物:信念 (1)
Player 2
(-2, -2)
する
プレゼントする
[0]
しない
(1, 3)
Player 1
(3, 1)
プレゼントしない
[1]
する
しない
h
(0, 0)
図 4.11: 賢者の贈り物:信念 (2)
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.3. まとめ
15
ような行動(最適反応戦略)をとっており、かつ、全ての情報集合に
おいて信念が合理的に形成されているような、戦略と信念の組のこと
である。完全ベイズ均衡は必ず部分ゲーム完全均衡であるが、その逆
は成り立たない。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
16
第4章
4.4
不完全情報ゲーム
練習問題
練習 25. 新製品投入ゲーム
中堅メーカーのプレイヤー1が新製品を開発して、既存大手メーカーのプ
レイヤー2と市場を争う。新製品の出来が良いか悪いかの確率は半々である。
プレイヤー1は新製品の出来を知ってから戦略を決定するが、プレイヤー2は
知ることができない。両プレイヤーは積極策(strong)または消極策(weak)
いずれかの戦略を同時に選択する。利得は新製品の出来に応じて下のように
変化する。純粋戦略のベイズ均衡をすべて求めよ。
1\2
strong
weak
新製品上出来の場合 strong
−2, −4
2, 0
weak
0, 2
0, 0
1\2
strong
weak
新製品不出来の場合 strong
−4, 2
−2, 0
0, 2
0, 0
weak
練習 26. 部分ゲーム完全均衡と完全ベイズ均衡図 4.12 に表されたゲームに
ついて、
(1) 部分ゲーム完全均衡となる戦略の組を求めよ。
(2) 完全ベイズ均衡となる戦略と信念の組を求めよ。
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
4.4. 練習問題
Player 1
enter
強い1
自然
(0, 2)
not enter
Player 2
p=1/2
battle
acc.
battle
p=1/2
弱い1
17
enter
acc.
(-1, -1)
(1, 1)
(-2, 0)
(1, 1)
not enter
(0, 2)
図 4.12: 部分ゲーム完全均衡と完全ベイズ均衡
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.
戦略的マーケティングのためのゲーム理論
AKANE Mitsuyuki,"a textbook of game theory",2004
Copyright©2004 Japan Consumer Marketing Research Institute. All rights reserved.