¶ µ ¶ ³ ゲーム理論とは 目的: 合理的主体間の戦略的行動や利得分配の分析 歴史: • フォン・ノイマン(1928) • フォン・ノイマンとモルゲンシュテルン(1944) • ナッシュ(1950) 方法: • n人協力ゲームとn人非協力ゲーム(n ≥ 2) • 戦略形,提携形,展開形 ´ ³ ケーキの分割問題1 • 1個のケーキを n 人(n ≥ 2)で公平に分ける方法(古典的 問題). n = 2 の場合: divide and choose n ≥ 3 の場合: クナスター=バナッハによる拡張 問題 1. n = 3 の場合の公平な分割法を考えなさい. µ ¶ ¶ ³ ゼロ和2人ゲーム a b c d 2/3 3/2 2 e 0 2 1/3 µ ¶ ´ µ ³¶ マックスミニ戦略 戦略 p がマックスミニ戦略であるとは • ある値 v が確実にえられる • p 以外では,その値 v は保証 されない ´ ジャンケン ³ G C P G 0 1 −1 C −1 0 1 P 1 −1 0 ´ ミニマックス戦略 ³ 戦略 q がミニマックス戦略であるとは • 損失がある値 w を超えない • q 以外では,その値 w は保証 されない この値 v を利得の保証水準(マックス この値 w を損失の保証水準(ミニマッ ミニ値)という. クス値)という. µ ´µ ´ ¶ ³ 例示1 a d 2/3 e 0 max 2/3∗ b 3/2 2 2 µ c 2 1/3 2 min 2/3∗ 0 w = v = 2/3 ´ 1 ¶ ³ 例示2 G G 0 C −1 P 1 max 1 C 1 0 −1 1 P −1 1 0 1 min −1 −1 −1 w = 1 > −1 = v µ ¶ ミニマックス定理 ³ ¶ ³ 注意 ミニマックス定理: ゼロ和 2人ゲームでは,混合戦略の 一般に,v ≤ w である. µ ´ もとで,v = w となる. µ ´ ¶ 問題 問題 2. ジャンケンにおいては,p = (1/3, 1/3.1/3) はマックスミニ 戦略であり,v = w = 0 である. µ ¶ 黙秘 黙秘 −2, −2 自白 0, −10 c c 3, 3 d 4, 0 µ ¶ ³¶ 囚人のジレンマ 逢引のジレンマ ³ ´ ³ b o b 2, 1 0, 0 o 0, 0 1, 2 自白 −10, 0 −5, −5 d 0, 4 1, 1 µ ¶ 交差点 ´ ³ go stop go −1, −1 2, 1 stop 1, 2 0, 0 ´µ ナッシュ均衡 各プレイヤーが採っている戦略の組がナッシュ均衡であるとは,ど のプレイヤーについても,自分だけ他の戦略に切り替えて利得を増 加させることができないことをいう.このとき,各プレイヤーの戦 略は,他のすべてのプレイヤーの戦略の組に対する最適反応である という. µ ¶ ´ 例のナッシュ均衡 ´ ³ ´ ³ 囚人のジレンマ: (d, d) 逢引のジレンマ: (b, b), (o, o) および ((2/3, 1/3), (1/3, 2/3)). 交差点: (stop, go), (go, stop) および ((1/2, 1/2), (1/2, 1/2)). µ ´ 2 ¶ ³ 注意 ゼロ和2人ゲームでは,ナッシュ均衡とミニマックス定理は同値. µ ¶ ³¶ ケーキの分割問題2 問題 問題 3. 次のゲームのナッシュ 均衡. a c −1, 2 d 0, 0.5 ´ ³ 問題 5. 2 B 1 b 0.5, 1 1, −1 Ẽ 問題 4. ジャンケンにおいては, 混合戦略の組 1/2 E∗ ((1/3, 1/3, 1/3), (1/3, 1/3, 1/3)) はナッシュ均衡である. O 1 A 1/2 1 ´µ µ ¶ ´ 囚人のジレンマの繰り返しにおける GT と TFT ³ GT: 誰かが d をとるまでは c, 以後は d TFT: c から始め,以後,相手の前回の行動と同じ行動をとる c c d c, d c d c d d d c GRIM TRIGGER (GT) TIT FOR TAT (TFT) µ ´ ¶ GT の履歴と逸脱 履歴: ( ) ( )( )( ) ( ) c c c d d ··· ··· ··· c c d d d 利得の流れ: ( ) ( )( )( ) ( ) 3 3 0 1 1 ··· ··· ··· 3 3 4 1 1 µ ³ ´ 3 ¶ ¶ ³ フォーク定理 2 B(0, 5) C(3, 3) D(1, 1) µ ¶ 1 A(5, 0) µ ´ µ ¶ ³ 有限回繰り返しゲーム • 囚人のジレンマの有限回 繰り返しでは,毎回 d を とることが唯一のナッシ ュ均衡である(逆向き推 論法). 逆向き推論法の例 • 不意打ち試験のパラドッ クス • アイスクリームの分割交 渉 ´ ³ ´ ³ アイスクリームの分割 • 提案者は分割を提案.合意されればこの提案が実現.拒否 されれば提案者を交代して同様のルールに従う.アイスク リームの大きさは最初は n であるが,提案者が交代するた びに1ずつ小さくなる. • n = 3 の場合: (x, 3 − x) 1 x a a 2 r r 2 y 1 (2 − y, y) z 1 (z, 1 − z) a 2 r (0, 0) µ ¶ ´ 問題 問題 6. このアイスクリームの分割交渉のナッシュ均衡を求めな さい. µ 4 ³ ´ ¶ ³ 新規参入と展開形ゲーム 大型店舗 M の参入をひかえて,地元商店街 I は,M が攻撃的なタ イプ MA なのか協調的なタイプ MW なのかを各々確率 π ,1 − π と見積もっている.参入が起きた場合,とりうる行動は,容認する (acq) か,対抗する (fight) かの2通りである.他方,M は自分のタ イプを知っているが,どちらであっても参入するか (ent) しないか (not) の2通りの行動をとりうる. (M. I) (0, 0) MA not (1, -1) acq π ent (-1, -4) fight fight N ent 1−π acq I MW not (-2, -1) (-1, -2) (0, 0) • N : 自然(偶然機構) • M : 参入者 – M A: 攻撃的なタイプ – M W : 協調的なタイプ • ent: 参入する • π: 参入者が攻撃的であるという先験確率 • I: 地元商店街 • acq: 容認する • f ight: 対抗する µ ¶ ´ 問題 ³ 問題 7. この展開形ゲームにおいて,戦略の組 (M A : ent, M W : not, I : acq) はナッシュ均衡であることを確かめなさい. µ ´ 5
© Copyright 2024 Paperzz