6．展開形ゲーム

戦略的最適行動論（2011.5.23）
６．展開形ゲーム
１．ゲームの⽊と逆向き帰納法
・これまでは扱ってきた戦略型ゲームは同時手番であり、すべてのプレイヤーが相手の行
動を知らずに同時に意思決定を行っていた。しかし現実には、相手の行動に反応するな
ど、意思決定に時間差を伴うことが多い。
➢展開形ゲームの導入。
例１）チェーンストア・ゲーム
・A 町は大手チェーン店が独占している。今、ある投資家が A 町にピザ店を開業して新規
参入するか、それとも参入しないで別の事業を行うかの選択に直面している。
－投資家が参入しなければ、チェーン店は独占を維持できるので 5 の利得が得られる。
一方、投資家は別の事業で 1 の利得を得る。
－投資家が参入すれば、チェーン店はそれと対立して値下げするか、それとも協調するか
という選択に直面する。対立すれば互いに値下げ合戦が続き、双方とも利得は 0 になっ
てしまう。協調すれば双方とも利得は 2 になる。チェーン店からすると独占状態よりは
利得が減少する。一方、投資家は事業に参入しないよりは利得が大きい。
・このゲームでは、投資家が事業に参入しない限り、チェーン店は選択する必要がない。
また、チェーン店は、投資家が参入するという行動を選択したことを知った上で、自ら
の選択を行う。つまり、プレイヤーの意思決定に時間差がある。
・図で表現すると…
・展開型ゲームを図示したものをゲ
ームの⽊（ゲーム・ツリー）と呼ぶ。
・利得は上が投資家、下がチェー
ン店である。
・ゲームにおける各プレイヤーの
手番（枝の分かれ目）をノードと
呼ぶ。
・ゲームの開始からあるノードま
でをパスまたは履歴と呼ぶ。
・ゲームの開始からあるノードま
でをゲームのプレイと呼ぶ。
投資家
参入する
参入しない
チェーン店
協調
対立
1
5
2
0
2
0
1
戦略的最適行動論（2011.5.23）
・展開型ゲームの解き方
－ゲームは投資家がピザ事業に参入するかどうかの選択から始まる。投資家は大手ピザ
チェーンの行動に対して最適に反応する。そのためには、チェーン店がどのような選
択をするかを推測しなければならない。
－そこで、チェーン店の選択を先に考える。チェーン店の利得は協調すれば 2、対立すれ
ば 0 なので、協調を選択する。
－チェーン店が協調を選択すると、投資家がピザ事業に参入した時の利得は 2 である。
参入しない時の利得は 1 なので、ピザ事業に参入する。
－というわけで、投資家はピザ事業に参入し、チェーン店は協調するのがゲームの解（ナ
ッシュ均衡）である。
－ナッシュ均衡となるプレイを均衡プレイ（均衡経路）とよぶ。
➢このように各プレイヤーは相手の行動に対する最適反応をとるので、相手の将来の行動
を先読みしなければならない。なので、ゲームの終点に近い手番から順々にプレイヤー
の最適行動を求めていく。このような解き方を逆向き帰納法（バックワード・インダクション）と
よぶ。
・ここでおさらい。ゲームにおける戦略とは、プレイヤーがゲームをプレイするために立
案する行動計画であり、行動そのものではない。つまり、プレイヤーがすべてのノード
において選択する行動を指定する計画である。
➢実際のゲームでたどることのないパスについても、どの行動を行うか決めておく。
例２）食事デート
・2 人の男女が食事に行こうとしています。女性はイタリアンを食べに行きたいと思ってい
ます。それに対して、男性は焼き肉を食べたいと思っています。こんなことでケンカに
なってデートが中止になるのは、お互い避けたいところです。今度は、女性が先にどち
らを食べに行くか決めていいことになりました（レディー・ファーストなので）
。
女性
イタ
焼肉
男性
イタ
男性
焼肉
イタ
2
0
0
1
1
0
0
2
焼肉
2
・このゲームの解は以下の通り。女性
はイタリアンを選ぶ。男性は女性が
イタリアンならイタリアン、女性が
焼肉なら焼肉を選ぶ。
➢実際に女性が焼肉を選ぶことはな
いが、男性はその場合の行動も決め
ておく。
・均衡プレイでは、イタリアンを食べ
に行くことになる。このように先に
行動したり、意思表明することで
をコミットメントとよぶ。
戦略的最適行動論（2011.5.23）
2．部分ゲーム完全均衡（テキスト p122-132）
・チェーンストア・ゲームの解衡は、（参入、協調）であった。これを戦略型ゲームでも確
認してみる。
チェーン店
投資
家
協調
対立
参入
２，２
０，０
非参入
１，５
１，５
・このゲームのナッシュ均衡は、（参入、協調）と（非参入、対立）。展開型ゲームでは導
出されない均衡点がある。
・（非参入、対立）はチェーン側が参入を阻止するために対立すると脅して、投資家が参入
をとりやめると解釈できる。しかし、実際に投資家が参入すれば、チェーン店にとって
協調したほうが利得が大きい。というわけで、この脅しはウソっぽい（信憑性のない脅し）。
・このような信憑性のない脅しはナッシュ均衡であるが、不完全均衡とよばれる。それに
対して、信憑性のない脅しを取り除いたものは完全均衡とよばれる。
・完全均衡だけを求めるにはどうしたらよいか？それは、すべての部分ゲーム（ゲームの
枝分かれした部分）において、ナッシュ均衡を導く戦略の組でなければならない（部分ゲ
ーム完全なナッシュ均衡）。
・この場合は（参入、協調）が部分ゲーム完全なナッシュ均衡である。
➢でも、こんなことしてたら、チェーン店は新規参入されまくりになってしまう…（チ
ェーン・ストアのパラドクス）。
・一般に、次の定理が成り立つ。
定理：有限の情報をもつ完全情報 n 人ゲームでは、先読み推論によって定まるプレイヤ
ーの戦略の組は部分ゲーム完全なナッシュ均衡である。
定理：有限の情報をもつ完全情報 n 人ゲームでは、純戦略による部分ゲーム完全なナッ
シュ均衡点が少なくとも１つは存在する。
３．ゲームの情報構造
・展開型ゲームであっても、相手のプレイヤーがどのような行動を選択したのかわからな
いということがある。そのような場合、ゲーム・ツリー上では、2 つのノードをつないで
表現する（情報集合）。
➢プレイヤーの情報集合は互いに交わらない。また、情報集合の中のすべての分岐点
は同じ数の選択肢をもつ。
・各プレイヤーがすべての手番において、過去の履歴を完全に知っているとき、各情報集
3
戦略的最適行動論（2011.5.23）
合における手番は１つである。これを完全情報ゲームとよぶ。一方、過去の履歴を完全に
知っていないプレイヤーがいるために、複数の手番を含む情報集合が存在するゲームを
不完全情報ゲームとよぶ。
➢戦略型ゲームはプレイヤーが同時に行動を選択する（＝過去のプレイヤーの行動を
知らない）ので不完全情報ゲームである。
・このゲームでは、女性が先に選択し
ているものの、男性は女性がどちら
を選択したのかがわからない。
・このような不完全情報ゲームでは、
先読み推論法で解くことはできな
い。戦略形ゲームに変換して解く。
女性
イタ
焼肉
男性
男性
イタ
焼肉
イタ
2
0
0
1
1
0
0
2
焼肉
4
戦略的最適行動論（2011.5.23）
練習問題
番号・名前
１）次のゲームの部分ゲーム完全なナッシュ均衡を求めなさい。L と R はそれぞれのプレイ
ヤーP1, P2 の行為の選択肢です。また、上が P1 の利得、下が P2 の利得です。
P1
L
R
P2
P2
L
R
0
4
2
-1
L
R
-1
3
0
1
２）電車の駆け込み乗車が後を絶ちません。ドアに挟まれてケガをするのは乗客なのに、
なぜみな駆け込み乗車をやめないのでしょうか。ここで、乗客が駆け込んできて、車
掌がドアを閉めると、乗客はドアに挟まれて-10 の利得となります。一方、車掌も挟ま
った乗客に対応するために電車が遅れて-3 の利得となります。乗客が駆け込んでも車
掌がドアを閉めなければ、乗客は早く目的地に行けるので+2 の利得となります。車掌
はドアを余計に開けている分、電車が遅れるので-1 の利得となります。さて、そもそ
も乗客が駆け込まなければ、乗客は次の電車を待つだけ時間をロスするので-1 の利得
となります。車掌はスムーズに電車を運行できるので+1 の利得です。この状況を展開
形ゲームで表現し、部分ゲーム完全均衡を求めなさい。そのうえで、なぜ駆け込み乗
車がなくならないかを考察しなさい。
5

Download Report