6.展開形ゲーム

戦略的最適行動論(2011.5.23)
6.展開形ゲーム
1.ゲームの⽊と逆向き帰納法
・これまでは扱ってきた戦略型ゲームは同時手番であり、すべてのプレイヤーが相手の行
動を知らずに同時に意思決定を行っていた。しかし現実には、相手の行動に反応するな
ど、意思決定に時間差を伴うことが多い。
➢展開形ゲームの導入。
例1)チェーンストア・ゲーム
・A 町は大手チェーン店が独占している。今、ある投資家が A 町にピザ店を開業して新規
参入するか、それとも参入しないで別の事業を行うかの選択に直面している。
-投資家が参入しなければ、チェーン店は独占を維持できるので 5 の利得が得られる。
一方、投資家は別の事業で 1 の利得を得る。
-投資家が参入すれば、チェーン店はそれと対立して値下げするか、それとも協調するか
という選択に直面する。対立すれば互いに値下げ合戦が続き、双方とも利得は 0 になっ
てしまう。協調すれば双方とも利得は 2 になる。チェーン店からすると独占状態よりは
利得が減少する。一方、投資家は事業に参入しないよりは利得が大きい。
・このゲームでは、投資家が事業に参入しない限り、チェーン店は選択する必要がない。
また、チェーン店は、投資家が参入するという行動を選択したことを知った上で、自ら
の選択を行う。つまり、プレイヤーの意思決定に時間差がある。
・図で表現すると…
・展開型ゲームを図示したものをゲ
ームの⽊(ゲーム・ツリー)と呼ぶ。
・利得は上が投資家、下がチェー
ン店である。
・ゲームにおける各プレイヤーの
手番(枝の分かれ目)をノードと
呼ぶ。
・ゲームの開始からあるノードま
でをパスまたは履歴と呼ぶ。
・ゲームの開始からあるノードま
でをゲームのプレイと呼ぶ。
投資家
参入する
参入しない
チェーン店
協調
対立
1
5
2
0
2
0
1
戦略的最適行動論(2011.5.23)
・展開型ゲームの解き方
-ゲームは投資家がピザ事業に参入するかどうかの選択から始まる。投資家は大手ピザ
チェーンの行動に対して最適に反応する。そのためには、チェーン店がどのような選
択をするかを推測しなければならない。
-そこで、チェーン店の選択を先に考える。チェーン店の利得は協調すれば 2、対立すれ
ば 0 なので、協調を選択する。
-チェーン店が協調を選択すると、投資家がピザ事業に参入した時の利得は 2 である。
参入しない時の利得は 1 なので、ピザ事業に参入する。
-というわけで、投資家はピザ事業に参入し、チェーン店は協調するのがゲームの解(ナ
ッシュ均衡)である。
-ナッシュ均衡となるプレイを均衡プレイ(均衡経路)とよぶ。
➢このように各プレイヤーは相手の行動に対する最適反応をとるので、相手の将来の行動
を先読みしなければならない。なので、ゲームの終点に近い手番から順々にプレイヤー
の最適行動を求めていく。このような解き方を逆向き帰納法(バックワード・インダクション)と
よぶ。
・ここでおさらい。ゲームにおける戦略とは、プレイヤーがゲームをプレイするために立
案する行動計画であり、行動そのものではない。つまり、プレイヤーがすべてのノード
において選択する行動を指定する計画である。
➢実際のゲームでたどることのないパスについても、どの行動を行うか決めておく。
例2)食事デート
・2 人の男女が食事に行こうとしています。女性はイタリアンを食べに行きたいと思ってい
ます。それに対して、男性は焼き肉を食べたいと思っています。こんなことでケンカに
なってデートが中止になるのは、お互い避けたいところです。今度は、女性が先にどち
らを食べに行くか決めていいことになりました(レディー・ファーストなので)
。
女性
イタ
焼肉
男性
イタ
男性
焼肉
イタ
2
0
0
1
1
0
0
2
焼肉
2
・このゲームの解は以下の通り。女性
はイタリアンを選ぶ。男性は女性が
イタリアンならイタリアン、女性が
焼肉なら焼肉を選ぶ。
➢実際に女性が焼肉を選ぶことはな
いが、男性はその場合の行動も決め
ておく。
・均衡プレイでは、イタリアンを食べ
に行くことになる。このように先に
行動したり、意思表明することで
をコミットメントとよぶ。
戦略的最適行動論(2011.5.23)
2.部分ゲーム完全均衡(テキスト p122-132)
・チェーンストア・ゲームの解衡は、(参入、協調)であった。これを戦略型ゲームでも確
認してみる。
チェーン店
投資
家
協調
対立
参入
2,2
0,0
非参入
1,5
1,5
・このゲームのナッシュ均衡は、(参入、協調)と(非参入、対立)。展開型ゲームでは導
出されない均衡点がある。
・(非参入、対立)はチェーン側が参入を阻止するために対立すると脅して、投資家が参入
をとりやめると解釈できる。しかし、実際に投資家が参入すれば、チェーン店にとって
協調したほうが利得が大きい。というわけで、この脅しはウソっぽい(信憑性のない脅し)。
・このような信憑性のない脅しはナッシュ均衡であるが、不完全均衡とよばれる。それに
対して、信憑性のない脅しを取り除いたものは完全均衡とよばれる。
・完全均衡だけを求めるにはどうしたらよいか?それは、すべての部分ゲーム(ゲームの
枝分かれした部分)において、ナッシュ均衡を導く戦略の組でなければならない(部分ゲ
ーム完全なナッシュ均衡)。
・この場合は(参入、協調)が部分ゲーム完全なナッシュ均衡である。
➢でも、こんなことしてたら、チェーン店は新規参入されまくりになってしまう…(チ
ェーン・ストアのパラドクス)。
・一般に、次の定理が成り立つ。
定理:有限の情報をもつ完全情報 n 人ゲームでは、先読み推論によって定まるプレイヤ
ーの戦略の組は部分ゲーム完全なナッシュ均衡である。
定理:有限の情報をもつ完全情報 n 人ゲームでは、純戦略による部分ゲーム完全なナッ
シュ均衡点が少なくとも1つは存在する。
3.ゲームの情報構造
・展開型ゲームであっても、相手のプレイヤーがどのような行動を選択したのかわからな
いということがある。そのような場合、ゲーム・ツリー上では、2 つのノードをつないで
表現する(情報集合)。
➢プレイヤーの情報集合は互いに交わらない。また、情報集合の中のすべての分岐点
は同じ数の選択肢をもつ。
・各プレイヤーがすべての手番において、過去の履歴を完全に知っているとき、各情報集
3
戦略的最適行動論(2011.5.23)
合における手番は1つである。これを完全情報ゲームとよぶ。一方、過去の履歴を完全に
知っていないプレイヤーがいるために、複数の手番を含む情報集合が存在するゲームを
不完全情報ゲームとよぶ。
➢戦略型ゲームはプレイヤーが同時に行動を選択する(=過去のプレイヤーの行動を
知らない)ので不完全情報ゲームである。
・このゲームでは、女性が先に選択し
ているものの、男性は女性がどちら
を選択したのかがわからない。
・このような不完全情報ゲームでは、
先読み推論法で解くことはできな
い。戦略形ゲームに変換して解く。
女性
イタ
焼肉
男性
男性
イタ
焼肉
イタ
2
0
0
1
1
0
0
2
焼肉
4
戦略的最適行動論(2011.5.23)
練習問題
番号・名前
1)次のゲームの部分ゲーム完全なナッシュ均衡を求めなさい。L と R はそれぞれのプレイ
ヤーP1, P2 の行為の選択肢です。また、上が P1 の利得、下が P2 の利得です。
P1
L
R
P2
P2
L
R
0
4
2
-1
L
R
-1
3
0
1
2)電車の駆け込み乗車が後を絶ちません。ドアに挟まれてケガをするのは乗客なのに、
なぜみな駆け込み乗車をやめないのでしょうか。ここで、乗客が駆け込んできて、車
掌がドアを閉めると、乗客はドアに挟まれて-10 の利得となります。一方、車掌も挟ま
った乗客に対応するために電車が遅れて-3 の利得となります。乗客が駆け込んでも車
掌がドアを閉めなければ、乗客は早く目的地に行けるので+2 の利得となります。車掌
はドアを余計に開けている分、電車が遅れるので-1 の利得となります。さて、そもそ
も乗客が駆け込まなければ、乗客は次の電車を待つだけ時間をロスするので-1 の利得
となります。車掌はスムーズに電車を運行できるので+1 の利得です。この状況を展開
形ゲームで表現し、部分ゲーム完全均衡を求めなさい。そのうえで、なぜ駆け込み乗
車がなくならないかを考察しなさい。
5