戦略的最適行動論(2011.5.23) 6.展開形ゲーム 1.ゲームの⽊と逆向き帰納法 ・これまでは扱ってきた戦略型ゲームは同時手番であり、すべてのプレイヤーが相手の行 動を知らずに同時に意思決定を行っていた。しかし現実には、相手の行動に反応するな ど、意思決定に時間差を伴うことが多い。 ➢展開形ゲームの導入。 例1)チェーンストア・ゲーム ・A 町は大手チェーン店が独占している。今、ある投資家が A 町にピザ店を開業して新規 参入するか、それとも参入しないで別の事業を行うかの選択に直面している。 -投資家が参入しなければ、チェーン店は独占を維持できるので 5 の利得が得られる。 一方、投資家は別の事業で 1 の利得を得る。 -投資家が参入すれば、チェーン店はそれと対立して値下げするか、それとも協調するか という選択に直面する。対立すれば互いに値下げ合戦が続き、双方とも利得は 0 になっ てしまう。協調すれば双方とも利得は 2 になる。チェーン店からすると独占状態よりは 利得が減少する。一方、投資家は事業に参入しないよりは利得が大きい。 ・このゲームでは、投資家が事業に参入しない限り、チェーン店は選択する必要がない。 また、チェーン店は、投資家が参入するという行動を選択したことを知った上で、自ら の選択を行う。つまり、プレイヤーの意思決定に時間差がある。 ・図で表現すると… ・展開型ゲームを図示したものをゲ ームの⽊(ゲーム・ツリー)と呼ぶ。 ・利得は上が投資家、下がチェー ン店である。 ・ゲームにおける各プレイヤーの 手番(枝の分かれ目)をノードと 呼ぶ。 ・ゲームの開始からあるノードま でをパスまたは履歴と呼ぶ。 ・ゲームの開始からあるノードま でをゲームのプレイと呼ぶ。 投資家 参入する 参入しない チェーン店 協調 対立 1 5 2 0 2 0 1 戦略的最適行動論(2011.5.23) ・展開型ゲームの解き方 -ゲームは投資家がピザ事業に参入するかどうかの選択から始まる。投資家は大手ピザ チェーンの行動に対して最適に反応する。そのためには、チェーン店がどのような選 択をするかを推測しなければならない。 -そこで、チェーン店の選択を先に考える。チェーン店の利得は協調すれば 2、対立すれ ば 0 なので、協調を選択する。 -チェーン店が協調を選択すると、投資家がピザ事業に参入した時の利得は 2 である。 参入しない時の利得は 1 なので、ピザ事業に参入する。 -というわけで、投資家はピザ事業に参入し、チェーン店は協調するのがゲームの解(ナ ッシュ均衡)である。 -ナッシュ均衡となるプレイを均衡プレイ(均衡経路)とよぶ。 ➢このように各プレイヤーは相手の行動に対する最適反応をとるので、相手の将来の行動 を先読みしなければならない。なので、ゲームの終点に近い手番から順々にプレイヤー の最適行動を求めていく。このような解き方を逆向き帰納法(バックワード・インダクション)と よぶ。 ・ここでおさらい。ゲームにおける戦略とは、プレイヤーがゲームをプレイするために立 案する行動計画であり、行動そのものではない。つまり、プレイヤーがすべてのノード において選択する行動を指定する計画である。 ➢実際のゲームでたどることのないパスについても、どの行動を行うか決めておく。 例2)食事デート ・2 人の男女が食事に行こうとしています。女性はイタリアンを食べに行きたいと思ってい ます。それに対して、男性は焼き肉を食べたいと思っています。こんなことでケンカに なってデートが中止になるのは、お互い避けたいところです。今度は、女性が先にどち らを食べに行くか決めていいことになりました(レディー・ファーストなので) 。 女性 イタ 焼肉 男性 イタ 男性 焼肉 イタ 2 0 0 1 1 0 0 2 焼肉 2 ・このゲームの解は以下の通り。女性 はイタリアンを選ぶ。男性は女性が イタリアンならイタリアン、女性が 焼肉なら焼肉を選ぶ。 ➢実際に女性が焼肉を選ぶことはな いが、男性はその場合の行動も決め ておく。 ・均衡プレイでは、イタリアンを食べ に行くことになる。このように先に 行動したり、意思表明することで をコミットメントとよぶ。 戦略的最適行動論(2011.5.23) 2.部分ゲーム完全均衡(テキスト p122-132) ・チェーンストア・ゲームの解衡は、(参入、協調)であった。これを戦略型ゲームでも確 認してみる。 チェーン店 投資 家 協調 対立 参入 2,2 0,0 非参入 1,5 1,5 ・このゲームのナッシュ均衡は、(参入、協調)と(非参入、対立)。展開型ゲームでは導 出されない均衡点がある。 ・(非参入、対立)はチェーン側が参入を阻止するために対立すると脅して、投資家が参入 をとりやめると解釈できる。しかし、実際に投資家が参入すれば、チェーン店にとって 協調したほうが利得が大きい。というわけで、この脅しはウソっぽい(信憑性のない脅し)。 ・このような信憑性のない脅しはナッシュ均衡であるが、不完全均衡とよばれる。それに 対して、信憑性のない脅しを取り除いたものは完全均衡とよばれる。 ・完全均衡だけを求めるにはどうしたらよいか?それは、すべての部分ゲーム(ゲームの 枝分かれした部分)において、ナッシュ均衡を導く戦略の組でなければならない(部分ゲ ーム完全なナッシュ均衡)。 ・この場合は(参入、協調)が部分ゲーム完全なナッシュ均衡である。 ➢でも、こんなことしてたら、チェーン店は新規参入されまくりになってしまう…(チ ェーン・ストアのパラドクス)。 ・一般に、次の定理が成り立つ。 定理:有限の情報をもつ完全情報 n 人ゲームでは、先読み推論によって定まるプレイヤ ーの戦略の組は部分ゲーム完全なナッシュ均衡である。 定理:有限の情報をもつ完全情報 n 人ゲームでは、純戦略による部分ゲーム完全なナッ シュ均衡点が少なくとも1つは存在する。 3.ゲームの情報構造 ・展開型ゲームであっても、相手のプレイヤーがどのような行動を選択したのかわからな いということがある。そのような場合、ゲーム・ツリー上では、2 つのノードをつないで 表現する(情報集合)。 ➢プレイヤーの情報集合は互いに交わらない。また、情報集合の中のすべての分岐点 は同じ数の選択肢をもつ。 ・各プレイヤーがすべての手番において、過去の履歴を完全に知っているとき、各情報集 3 戦略的最適行動論(2011.5.23) 合における手番は1つである。これを完全情報ゲームとよぶ。一方、過去の履歴を完全に 知っていないプレイヤーがいるために、複数の手番を含む情報集合が存在するゲームを 不完全情報ゲームとよぶ。 ➢戦略型ゲームはプレイヤーが同時に行動を選択する(=過去のプレイヤーの行動を 知らない)ので不完全情報ゲームである。 ・このゲームでは、女性が先に選択し ているものの、男性は女性がどちら を選択したのかがわからない。 ・このような不完全情報ゲームでは、 先読み推論法で解くことはできな い。戦略形ゲームに変換して解く。 女性 イタ 焼肉 男性 男性 イタ 焼肉 イタ 2 0 0 1 1 0 0 2 焼肉 4 戦略的最適行動論(2011.5.23) 練習問題 番号・名前 1)次のゲームの部分ゲーム完全なナッシュ均衡を求めなさい。L と R はそれぞれのプレイ ヤーP1, P2 の行為の選択肢です。また、上が P1 の利得、下が P2 の利得です。 P1 L R P2 P2 L R 0 4 2 -1 L R -1 3 0 1 2)電車の駆け込み乗車が後を絶ちません。ドアに挟まれてケガをするのは乗客なのに、 なぜみな駆け込み乗車をやめないのでしょうか。ここで、乗客が駆け込んできて、車 掌がドアを閉めると、乗客はドアに挟まれて-10 の利得となります。一方、車掌も挟ま った乗客に対応するために電車が遅れて-3 の利得となります。乗客が駆け込んでも車 掌がドアを閉めなければ、乗客は早く目的地に行けるので+2 の利得となります。車掌 はドアを余計に開けている分、電車が遅れるので-1 の利得となります。さて、そもそ も乗客が駆け込まなければ、乗客は次の電車を待つだけ時間をロスするので-1 の利得 となります。車掌はスムーズに電車を運行できるので+1 の利得です。この状況を展開 形ゲームで表現し、部分ゲーム完全均衡を求めなさい。そのうえで、なぜ駆け込み乗 車がなくならないかを考察しなさい。 5
© Copyright 2024 Paperzz