組合せゲーム理論入門 (1) 川辺 治之 2011 年 11 月 2 日 組合せゲーム ■ ■ ■ ■ 二人の対局者が交互に手を打つ. ゲームは,ど ちらかの対局者が自分の手番に規則に 従った手を打つことができなくなるまで続く. サイコロやルーレット,切り混ぜたトランプを配ると いうような偶然に左右される要素はない. それぞれの対局者は,常にゲームの局面 (状態) につい てのすべての情報を知らされている. 2 / 90 組合せゲームの勝敗 ■ ■ 正規形 (normal play):最後の手を打った対局者の勝ち 逆形 (misère play):最後の手を打った対局者の負け 3 / 90 組合せゲームではないゲーム ■ ■ ■ 点と線 (dots & boxes) では,対局者は続けて 2 手を打 つことがある. チェッカーの多くの局面には同形反復があり,限りな く手を打ち続けることができる. 囲碁やチェスでは,最後の手を打った対局者の勝ちと ならない場合がある. 4 / 90 (経済) ゲームとの違い ■ ■ 古典的な数学理論で扱う (経済) ゲームを分析すること の難しさは,同時並行して行われる判断に起因する. それぞれの参加者は,相手の選択した手を知らずに打 つ手を決めなければならない. 組合せゲームの難しさは,与えられた局面で取りうる 手の純然たる多さに起因する. 5 / 90 二人の対局者 左 右 ルイーズ リチャード 正 負 黒 白 青 赤 縦 横 女性 男性 緑 灰色 6 / 90 選択肢 ■ ■ ■ ■ 左選択肢:その局面から左がどれかの手を選らんで 打った結果として得られる局面 左選択肢:その局面から右がどれかの手を選らんで 打った結果として得られる局面 すべての局面において左選択肢と右選択肢が同じとな るゲームを不偏 (impartial) ゲームという. 不偏ゲームでないゲームを非不偏 (partizan) ゲームと いう. 7 / 90 ド ミナリング 左は,上下に隣り合う二つの空きマスにド ミノ牌を置く. 同様に,右は,左右に隣り合う二つの空きマスにド ミノ牌 を置く. 左 → 右 → 左 右 → ··· → 左 → 8 / 90 ゲーム木 局面の左選択肢および右選択肢を,その局面のそれぞれ 左下および右下にくるように図示する. 9 / 90 ゲームの局面 ゲーム (の局面) G を,その局面における左および右選 択肢の集合 G L および G R によって G= n L G G R o と定義する. 通常,集合 G L および G R の要素を囲む「 { 」および「 } 」 は省略して表記する. 10 / 90 クロバー 左は,黒石を隣り合う上、下、左または右の白石のあるマ スに移動させ,その白石を取り除く. 右は,白石を隣り合う上、下、左または右の黒石のあるマ スに移動させ,その黒石を取り除く. 左 → 右 → 左 左 → ··· → 右 → 11 / 90 ゲームの局面の例 = n , , o , 再帰的にこの表記を用いることもできる. = { = {{ = | | | } }| } 再帰的な表記では、内側の「 { 」および「 } 」は略記できる. 12 / 90 帰結類 帰結類 名称 定義 N ファジー 先手番 (N ext:次) の対局者が 勝つ. P 零 後手番 (Previous:直前) の対局 者が勝つ. L 正 左 (Left) が勝つ. R 負 右 (Right) が勝つ. 右が先手番 右の勝ち 左の勝ち 左が 左の勝ち N L 先手番 右の勝ち R P 13 / 90 選択肢と帰結類 n G= G L G R o ∃GL ∈ G L GL ∈ L ∪ P ∀GL ∈ G L GL ∈ R ∪ N ∃GR ∈ G R GR ∈ R ∪ P G∈N G∈R ∀GR ∈ G R GR ∈ L ∪ N G∈L G∈P ゲーム木の葉となる局面は,G R = G L = ∅ より、 ∀GR ∈ G R GR ∈ L ∪ N および ∀GL ∈ G L GL ∈ R ∪ N が 成り立つので、P 局面となる. 14 / 90 ゲーム木から帰結類を求める ド ミナリングのゲーム木: 15 / 90 ゲーム木から帰結類を求める ゲーム木の葉となる局面は P 局面となる. P P P P P P P P P P P P P P P PP P P P 16 / 90 ゲーム木から帰結類を求める 葉から根に向かって順次すべての節点の帰結類を決定 できる. N P N N L N P P PN P P P P L N PN P N N N P P P P P P P PP P P P 17 / 90 局面の分解 = 18 / 90 直和による分解 (正規形ゲームに対する)コンウェイの洞察: ■ ■ ■ ■ ゲームの手とは,ある局面から別の局面に移ること. 最後の手を打った対局者の勝ち. ゲームの直和では,対局者はその直和成分のいずれに 対しても手を打つことができる. ゲームの (符号の) 反転とは,そのゲームでのそれぞれ の対局者の役割を入れ替えること. 直和成分 A を含む任意の直和において A を B で置き換 えることで左が不利にならないならば,(左にとっ て )A は B よりも悪くはない. 19 / 90 後手必勝のゲーム G を任意のゲームとし,Z を後手必勝の任意のゲーム とすると,G の帰結類は G + Z の帰結類と一致する. 逆に、Z が 、つねに G + Z は G と同じ帰結類に属する という性質をもつならば 、とくに G = 0 とすると Z は 0 と 同じ帰結類に属する、すなわち Z は後手必勝となる. 任意の後手必勝ゲーム,そしてそれらだけが 直和演算における単位元となる. 20 / 90 直和の帰結類 L P R N L L L ? L または N P L P R N R N ? L または N R N R R または N R または N ? 21 / 90 ゲームの定義 n o G L G R と定義する. R ゲーム G を、 ここで、G L および G はゲームの集合とする. n o ゲームの定義より、G L = G R = ∅ となる G = G L G R はゲームとなる. このゲームを零ゲームという. 0={|} 22 / 90 ゲームの直和 def n L G+H = G + H, G + ここで ■ L H R G + H, G + H R o ゲーム G とゲームの集合 S の和は, G + S = {G + X}X∈S ■ と定義する. ‘,’ は集合の和を表す. 23 / 90 ゲームの直和の例 = G = n = H = n に対して G+H = z L G +H }| + { z , G+H }| + L { z o o , R G +H }| + { z , + G+H }| , R + { 24 / 90 直和の性質 ■ ■ G + H = H + G (交換法則) (G + H) + J = G + (H + J) (結合法則) 証明は帰納法を用いる. 25 / 90 ゲームの( 符号の)反転 ゲームの (符号の) 反転の定義 def n −G = R −G −G L o は,対局者の役割の交換に対応する. ここで、集合に対する符号の反転は,その集合のすべて の要素それぞれに対して符号を反転した集合、たとえば −G R = {−GR }GR ∈G R とする. 反転によって,右選択肢と左選択肢が入れ替わり,そし てそれぞれの選択肢に対して再帰的に対局者の役割が入 れ替わる. 26 / 90 ゲームの差 符号の反転を用いて,ゲームの差を G − H = G + (−H) と定義する. 27 / 90 ゲームの等価性 二つのゲームの等価性を次のように定義する. def G = H ⇔ (∀X) G + X は H + X と同じ帰結類に属する. 本質的には,ゲームの直和に関して G が H と同じ振舞 いをするならば,G = H となる. = は同値関係となる、つまり,反射法則,対称法則お よび推移法則が成り立つ. 28 / 90 帰結類とゲームの値 定理 G が P 局面となる (すなわち,後手番の対局者が勝 つ) とき,そしてそのときに限り,G = 0 が成り立つ. 証明 (⇐:) G = 0 ならば,すべてのゲーム X に対して G + X は 0 + X = X と同じ帰結類に属する.とくに X = 0 とすると,G は 0 と同じ帰結類に属する.これは G が P 局面ということ. 29 / 90 帰結類とゲームの値 証明 (⇒:) G を P 局面とするとき,どのような局面 X に ついても,G + X が X と同じ帰結類に属することを示す. X において左が後手番で勝つならば,その戦略を使っ て G + X においても左は後手番で勝つ. ( 相手が手を打っ た構成要素に応手すればよい. ) X において左が先手番で勝つならば,左はまず G + X の 2 番目の直和成分にそれと同じ手を打ち,その後は前述 の後手番のときと同じ戦略を使って勝つ. 右についても同様. 30 / 90 等価性の判定 定理 G − H = 0 、つまり G − H が P 局面となるとき,そ してそのときに限り,G = H となる. 証明 G − H = 0 より (G − H) + H = 0 + H が成り立つ. ( 証明略) これに結合法則および交換法則を使うと、 G = G + 0 = G + (H − H) = (G − H) + H = 0 + H = H となる. この定理は、G = H かど うかを判定するための構成的 な方法を示している. 31 / 90 ゲームの比較 def G≥H ⇔ def G≤H ⇔ (∀X) H + X において左が勝つときは G + X においてもつねに左が勝つ. (∀X) H + X において右が勝つときは G + X においてもつねに右が勝つ. 32 / 90 ゲームの符号と帰結類 定理 次の各項は同値となる. 1. G ≥ 0 2. G において左は後手番で勝つ.つまり,G ∈ P または G ∈ L が成り立つ. 3. 任意のゲーム X に対して,X において左が後手番で 勝つならば,G + X においても左は後手番で勝つ. 4. 任意のゲーム X に対して,X において左が先手番で 勝つならば,G + X においても左は先手番で勝つ. 33 / 90 証明の概略 ■ ■ ■ ■ 1 ⇔ 3, 4: ≥ の定義より. 2 ⇒ 3: G + X のそれぞれの構成要素に後手番の必勝 戦略を使う. 3 ⇒ 2: X = 0 とすると明らか. 4 ⇒ 2: 4 の対偶「 G + X において左が先手番で勝て ないならば,X においても左は先手番で勝てない. 」で X = −G とする. 34 / 90 ゲームの大小関係の求め方 定理 G − H において左は後手番で勝つとき,そしてその ときに限り,G ≥ H が成り立つ. 証明 G − H ≥ H − H = 0(つまり G − H ≥ 0) が成り立つ とき,そしてそのときに限り,G ≥ H が成り立つ. この定理が 、G と H の比較の仕方を具体的に与える. 35 / 90 ゲームの比較のまとめ G>0 G=0 G<0 G 0 G>H G=H G<H G H ⇔ ⇔ ⇔ ⇔ ⇔ ⇔ ⇔ ⇔ Gは 左 の勝ち G は後手番の対局者の勝ち Gは 右 の勝ち G は先手番の対局者の勝ち G−Hは 左 の勝ち G − H は後手番の対局者の勝ち G−Hは 右 の勝ち G − H は先手番の対局者の勝ち 36 / 90 ゲームの半順序構造 定理 関係 ≥ はゲーム全体の上の半順序となる. つまり、任意のゲーム G,H および J に対して ■ ■ ■ G ≥ H かつ H ≥ J ならば G ≥ J ( 推移法則) G ≥ G ( 反射法則) G ≥ H かつ H ≥ G ならば G = H ( 反対称法則) が成り立つ. 37 / 90 ゲームの群構造 定理 ゲーム全体の集合は可換群となる. 任意のゲーム G,H および J に対して ■ ■ ■ ■ ■ G および H を群の要素とするとき,G + H もまた群の 要素となる. ( 演算について閉じていること ) (G + H) + J = G + (H + J) ( 結合法則) G + 0 = G ( 単位元の存在) G + (−G) = 0 ( 逆元の存在) G + H = H + G ( 可換) 38 / 90 ゲームの標準形 すべてのゲーム G に対して,それと等しい「最小」の ゲームがただ一つ存在する.この最小のゲームを G の標 準形という. G および H のそれぞれの標準形が一致するかど うかを 調べることによって,それらが等しいかど うかを判定する ことができる. 39 / 90 劣位な選択肢 定理 ゲーム G = {A, B, C, . . . | H, I, J, . . .} において B ≥ A ならば, G′ = {B, C, . . . | H, I, J, . . .} に対して G = G′ となる. 左にとって,B は A より優位な選択肢,A は B より劣位 な選択肢という. ( 右にとっても同様. ) 40 / 90 劣位な選択肢:証明 G − G′ において後手番の対局者が勝つことを示す. A, B, C, . . . | {z √ √ √ G √ √ √ √ √ √ √ H, I, J, . . . − B, C, . . . H, I, J, . . . } | {z ′ G } A − G′ A−B B ≥ A なので右 が勝つ. 41 / 90 打消し 可能な選択肢 打消し可能な左選択肢とは,右の応手による結果が左が 手を打つ前よりも少なくとも悪くならないように,右がす ぐ さま応手するであろう手のこと. ゲーム G の左選択肢 A は,右にとって G より悪くなら ない,つまり AR ≤ G となる右選択肢 AR があるとき,打 消し可能という. 「左がまず A とし,右が AR と応手すると,その左選択 肢の一つを選ぶ」という手の応酬を経ずに,G から AR の 左選択肢を直接選択すると考えることができる. 42 / 90 打消し 可能な選択肢 定理 ゲーム G = {A, B, C, . . . | H, I, J, . . .} に対して,A のある右選択肢 AR が G ≥ AR を満たすと き、AR = {W, X, Y, . . . | . . .} とすると, G′ = {W, X, Y, . . . , B, C, . . . | H, I, J, . . .} に対して G = G′ が成り立つ. 43 / 90 打消し 可能な選択肢:証明 √ √ √ √ √ H, I , J, . . . − W, X, Y, . . . , B, C, . . . A, B, C, . . . {z } | {z | √ √ G′ G A − G′ G−W √ √ √ H, I , J, . . . } G ≥ AR なので 左が勝つ. AR − G′ AR − H X − G′ AR ≤ G なので 右が勝つ. X −X 44 / 90 標準形への簡約化 ゲーム G および G の全局面が劣位な選択肢および打消 し可能な選択肢をもたないとき,G を標準形という. 定理 G および H がど ちらも標準形で G = H が成り立つ ならば,G ∼ = H が成り立つ、つまり、同一のゲーム木を もつ. 45 / 90 証明の概略 G = H より,G − H において左は後手番で勝つ.とく に,左は,GR − H に対する勝つための応手がある.この 応手は,GR に対して打つ手ではありえない.なぜなら, もしそうだとすると,GRL − H ≥ 0 となる GRL があるこ とになるが,これは GRL ≥ H = G ということで,G に打 消し可能な選択肢があることになる.つまり,GR − H に 対して左が勝つための応手は,H に対する手であって, その手を打つと GR − H R となる.これは,GR ≥ H R が成 り立つ H R があるということ. R R R′ 対称的な議論により G ≥ H ≥ G となるが,GR と R′ G は同一の選択肢でなければならない. ( もし同一でない なら,GR は劣位な選択肢となる. )つまり,G のすべての 右選択肢は,H の右選択肢のどれかに等しい. 46 / 90 ゲームの値 左が自由に n 手を打つことができるゲームの値を n と定 義する.同様に,右が自由に n 手を打つことができるゲー ムの値は −n となる. 形式的には,正整数 n に対して、次のように定義する. 0 def = {|} n def = {n−1 | } −n def { | −(n−1)} = 例: 2 = {1 | } = {{0 | } | } = {{{ | } | } | } 47 / 90 ゲームの値についての考察 n を整数とし,N は n を値とするゲームとする. ■ n = 0 ならば,N にはど ちらの対局者も打つ手はない. ■ n > 0 ならば,N において,左には n − 1 を値とする ゲームにする手があるが,右には打つ手はない. n < 0 ならば,N において,右には n + 1 を値とする ゲームにする手はあるが,左には打つ手はない. ■ 48 / 90 ゲームの和に関する不等式 ゲーム A,B および C は,それぞれ整数の値 a,b および c をもつとする. 補題 ゲームとして A + B + C ≥ 0 が成り立つとき,そし てそのときに限り,整数として a + b + c ≥ 0 が成り立つ. (同様に,A + B + C ≤ 0 が成り立つとき,そしてそのと きに限り,a + b + c ≤ 0 が成り立つ.) 証明は、|a| + |b| + |c| および A, B, C のゲーム木の大きさ に関する帰納法. 49 / 90 ゲームの和に関する等式 定理 a + b = c が成り立つとき,そしてそのときに限り, A + B = C が成り立つ. 証明 補題より,a + b + (−c) = 0 が成り立つとき,そして そのときに限り,A + B + (−C) = 0 が成り立つ.これら の等式の両辺にそれぞれ c および C を加えると,定理の主 張が得られる. 50 / 90 ゲームの順序構造 定理 a ≥ b が成り立つとき,そしてそのときに限り, A ≥ B が成り立つ. 証明 補題より,a + (−b) + 0 ≥ 0 が成り立つとき,そして そのときに限り,A + (−B) + 0 ≥ 0 が成り立つ. これで、整数とそれを値にもつゲームを同一視することが できる. 51 / 90 整数でない値をもつゲーム = に対して 0< < 1 および = {0 | 1} + =1 が成り立つ. 52 / 90 2 進有理数 19 のような 2 のベ 2 進有理数は,たとえば 12 , 83 および 32 キを分母とする分数. j > 0 および奇数 m に対して,数を次のように定義 する. m = j 2 たとえば ( ( m−1 m+1 2j 2j ) ( ) 19 18 20 9 5 = = 32 32 32 16 8 ) 53 / 90 1 2 1 2 + =1 証明 差分ゲーム 12 + 21 − 1 において,後手番の対局者が勝 つことを示す. ど ちらの対局者が 21 に対して手を打っても,もう一方の 対局者がもう一方の 21 に応手すれば,1 − 1 = 0 となって 先手番の対局者の負けとなる. 一方,右が −1 を 0 とする手を打ったときは 21 + 12 が残 り,左が 12 に手を打つと右のもう一方の 12 への応手で 1 と し,左がその 1 を 0 として勝つ. 54 / 90 三つのゲームの和 ゲーム A,B および C は,それぞれ値 a,b および c を もつとする. 補題 a + b + c = 0 ⇐⇒ A + B + C = 0 a + b + c > 0 ⇐⇒ A + B + C > 0 a + b + c < 0 ⇐⇒ A + B + C < 0 55 / 90 証明の概略 ■ 互いに排他的な条件なので、=⇒ 向きだけを証明する. ■ a + b + c ≥ 0 を仮定して、A + B + C において左が後 手番で勝つことを示す. ( 帰納法) a + b + c > 0 ならば,A + B + C において左が先手番 でも勝つことを示す. ( 帰納法) ■ a,b および c はすべて整数で,その中のどれかは 0 よりも大きい場合 ◆ A + B + C = 2ij (i が奇数かまたは j = 0) とすると き、a,b または c のどれかは, j ′ ≥ j および i′ > 0 i′ について 2j ′ の形で,a + b + c − 21j ′ ≥ 0 が成り立つ 場合 ◆ 56 / 90 ゲームの和と比較 定理 ■ ■ a + b = c が成り立つとき,そしてそのときに限り, A + B = C が成り立つ. a ≥ b が成り立つとき,そしてそのときに限り, A ≥ B が成り立つ. 証明 補題より,a + b − c = 0 が成り立つとき,そしてそ のときに限り,A + B − C = 0 が成り立つ. 同様に,a − b + 0 ≥ 0 が成り立つとき,そしてそのとき に限り,A − B + 0 ≥ 0 が成り立つ. 57 / 90 弱数避定理 定理 x は数で,G は数でないとき,G + x において左が先 手番で勝つならば,G に対する手で勝つことができる. 証明 x は標準形としてよい. ある xL について G + xL ≥ 0 とすると,G は数でない (G 6= −xL ) ので,G + xL > 0 、つまり,G + xL において 左が先手番で勝ち,帰納法により,ある GL について GL + xL ≥ 0 が成り立つ.すると,x > xL より, GL + x ≥ 0 が成り立つ. 58 / 90 もっとも簡単な数 ■ ■ n G L o ゲーム G = G R の誕生日を,G L ∪ G R に含まれ るゲームの誕生日の最大値に 1 を加えたものと定義す る.G L = G R = ∅ のときは,G の誕生日は 0 とする. 数 xL < xR に対して,xL と xR の間のもっとも簡単な 数 x とは,xL と xR の間 (両端は含まない) にある数の 中で最もさい誕生日をもつ数と定義する. 定理 ゲーム G のすべての選択肢 GL および GR が数であっ て GL < GR が成り立つならば,G は G L < x < G R を満た すもっとも簡単な数 x に等しい. 59 / 90 定理の証明 証明 x − G において後手番の対局者が勝つことを示す. 右は先手番で,x − GL とする手または xR − G とする手 を打つことができる.G L < x < G R となる x を選んだの で,x − GL > 0 となる.また,xR < G R となることはな い.なぜなら,もし xR < G R ならば,G L < x < xR < G R となり,xR は x よりも簡単な数なので,x が G L と G R の 間のもっとも簡単な数という仮定に反する.これより, xR ≥ GR を満たす GR が存在し,左は xR − GR とする手を 打って勝つことができる. 左についても同様. 60 / 90 最も簡単な数の例 ■ ■ ■ ( ) 1 2 =1 (2 ) 1 5 1 = 2 ) (8 8 27 3 9 −1 −1 = −1 64 32 8 61 / 90 プッシュ 対局者は、自分の色の駒を一つ 1 マス左に移動させる.そ れぞれのマスには一つより多くの駒を置くことはできな いので,その駒の左側の連続するマスにある駒はすべて 1 マス左に移動される.駒は盤の左端から盤外に押し出さ れる. 左 → 右 → 左 → 右 → 62 / 90 プッシュの局面の値 (1) 局面 は明らかに左にとって 1 手の価値がある. = {0 | } = 1 これより = {1 | } = 2 および = {2 | } = 3 となる. 63 / 90 プッシュの局面の値 (2) 白駒があるときは, ={ 3 } = {1 | 2} = 2 | となるので,これより ={ ={ となる. | | ( ) 3 3 =2 }= 2 ( ) 3 7 }= 2 = 2 4 64 / 90 プッシュの局面の値 (3) = { | , } ( ) ( ) 37 3 7 13 ,2 = = = 2 4 2 4 8 となるので,これらの局面の直和は + + + 13 1 3 7 =− = − + +(−2)+ 2 4 8 8 となり,右が勝つ. 65 / 90 無限小ゲーム 定義 ゲーム G は,任意の正の数 x に対して −x < G < x が成り立つとき,無限小 (infinitesimal) という. 例 ∗ = {0 | 0} は無限小ゲームであることを示す. 66 / 90 ∗ が無限小であること ∗ は 0 と比較不能 (∗ において先手番の対局者が勝つ) な ので,∗ は数ではない. また,∗ = −∗ に注意すると,対称性より任意の正の数 x に対して ∗ < x が成り立つ、すなわち x − ∗ = x + ∗ にお いて左は先手番でも後手番でも勝つことを示せば十分. 左が先手番であれば,∗ を 0 とする手を打って,その結 果 x とすることで勝つ. 一方、弱数避定理を用いると、x + ∗ において勝つこと のできる第 1 手が右にあるならば,それは ∗ に対する手と してよい.しかし,その手を打った結果は x > 0 となり, ここから左が先手番で勝つ. 67 / 90 ↑と ↓ ↑ def = {0 | ∗} ↓ def {∗ | 0} = たとえば,クロバーでは, = ↑ = ↓ となる. 68 / 90 ↑ が無限小となること 任意の x > 0 に対して,0 < ↑ < x が成り立つことを 示す. ↑ において左は先手番でも後手番でも勝つので,↑ > 0 が成り立つ. x > 0 が標準形で与えられたとき,x − ↑ を x にする右 の手はすぐに負けとなり,xR − ↑ にする手があれば, xR > x もまた数となるので帰納法より右の負けとなる. これより x ≥ ↑ が成り立つ. 一方,∗ は無限小なので x − ∗ は正となり,左は x − ↑ を x − ∗ にする手で勝つ.つまり,x > ↑ が成り立つ. 69 / 90 全微小ゲーム 定義 ゲーム G は,G の全局面 H が条件「右に打つ手が あるとき,そしてそのときに限り,左にも打つ手がある」 を満たすとき,全微小 (all-small) ゲームという. ゲーム ∗ および ↑ は,ど ちらも全微小ゲームとなる. 一方,全微小な数は 0 のみ. 70 / 90 ↑ および ∗ の和 ↓<0<↑ ↓ ∗ ↑ ⇓=↓+↓<∗<↑+↑=⇑ 4 3 2 1 0 −1 −2 −3 −4 ∗ ⇑ ↑ 0 ↓ ⇓ 71 / 90 + を省略した表記法 帯分数と同様の省略記法を採用して,ゲームの名前を並 べて表記することでそれらの和を表す.その際には,かな らず数,↑/↓,そして ∗ の順に並べるものとする. たとえば, 2⇑∗ = 2 + ⇑ + ∗ となるが,∗↑ と表記することはない. 後ほど ,∗2 というゲームを定義するが,これは 2∗ = 2 + ∗ とは異なる. 72 / 90 n·↑ および n·↑ ∗ の標準形 ↑∗ は ⇑ の選択肢なので,↑∗ を先に計算する. ↑∗ のゲーム木は次のとおり. ↑∗ ∗ ↑ × ∗+∗ = 0 ↑ 右の ↑ とする手は 0 とする手より劣位となり,このほか に劣位な選択肢はない. 73 / 90 ↑∗ のゲーム木( 続き) ↑∗ ∗ ↑ 0 ∗ 0 打消し可能な選択肢を調べると,↑∗ は 0 と比較不能だ が,↑ > 0 なので ∗ < ↑∗ となることに注意すると、↑∗ を ↑ とする手は,∗ で打ち消されて 0 となる. 74 / 90 ↑∗ のゲーム木( 続き) このほかに劣位な選択肢および打消し可能な選択肢は ないので,↑∗ の標準形は {0, ∗ | 0} となる. ↑∗ ∗ 0 0 75 / 90 ⇑ の標準形 左には一方の ↑ を 0 とする手,右には一方の ↑ を ∗ とす る手がある.つまり,⇑ = {↑ | ↑∗} となる.それぞれの対 局者の選択肢は一つだけなので,劣位となる選択肢は ない. 右の ↑∗ = {0, ∗ | 0} とする手は打ち消せない.なぜなら ⇑ > 0 および ⇑ > ∗ となるから.一方、⇑ > ∗ なので,左 の ↑ とする手は ∗ で打ち消されて 0 となる. ⇑ ↑ ↑∗ ∗ 0 76 / 90 ⇑ の標準形( 続き) 結果として,⇑ の標準形は {0 | ↑∗} となる. ⇑ 0 ↑∗ 同様にして ↑ = {0 | ∗} ⇑ = {0 | ↑∗} = {0 | ⇑∗} = {0 | ∗} ↑∗ ⇑∗ ∗ ∗ = = = = {0, ∗ | 0} {0 | ↑} {0 | ⇑} {0 | } 77 / 90 −n n·↑ および 2 1 32 0 のゲーム木 5·↑ 1 16 0 ∗ 0 1 8 0 0 1 4 0 0 ⇑∗ 0 1 2 ↑ 0 1 0 ∗ よく似たゲーム木をもつゲームの間でも代数的な振舞い が驚くほど 異なることがある. 78 / 90 無限小ゲームの例 5·↑ = 0 ∗ = = 0 0 ⇑∗ = 0 ↑= 0 ∗= 79 / 90 転換ゲーム y > z となる二つの数 y および z に対して,{y | z} を転換 (switch) ゲームという. 転換ゲームは {y | z} = a + {x | −x} = a ± x と書き換えて正規化できる.ただし,a = y+z 2 および x = y−z 2 とし,±G は {G | −G} の省略表記とする. 80 / 90 タイニーとマイニー G G def def = = 0 0 | −G G|0 0 G をすべての負の数より大きいゲームとすると、G は, 正の無限小ゲームとなる. 81 / 90 タイニー G は正の無限小とな ること 証明 x を正の数として x − G = x + G > 0 を示す. 左が先手番で x + {G | 0} とする手を打つと,x > 0 とす る右の応手はすぐに右の負けとなる.また,xR + {G | 0} とする右の応手は,左が xR + G と打つと,xR > x もまた 正の数となることから,xR + G も正となる. 一方,右が先手番で x > 0 とする手は右の負けとなる. または右が xR + G とする手は,xR > x は x より簡単な 正の数となるので,帰納法により xR + G は正となる. 82 / 90 相対的な無限小 ゲーム g > 0 は,すべての整数 n に対して n·g < h となる とき,h > 0 に対して無限小という.正のゲームは,1 に 対して無限小となるとき,そしてそのときに限り,無限小 となる. 定理 任意の正の数 x について,x は ↑ に対して無限小と なる. 83 / 90 定理の証明 任意の整数 n に対して,↑ + n· x ≥ 0 を示せば十分. 右の第 1 手がなんであろうと,左は残っている x のひ とつを {x | 0} とする手を打つ.その {x | 0} に右が応手す れば,左はまた同じように残っている x のひとつを {x | 0} とする.ここで、右が {x | 0} に応手しなければ, 左はそれを x とする.この手はそのほかの選択肢より優位 となる.(x が唯一残っている局面となる前に,左がそれ を無視してほかの手を打っても、その間に右が x に手を 打っても x が xR に増えるだけだから.) こうして,すべての x がなくなったら,左は ↑ または (右が第 1 手を ↑ に打ったときは )∗ を 0 にする. 84 / 90 x > y > 0 を数とすると,x は y に対して無限小となる. 証明 任意の整数 k に対して y − k · x = y + k · x ≥ 0 を 示す. 左は,常に x のひとつを {x | 0} とする手を打つ.右が この局面に応手しなければ,左はこれを x とする.この手 はそのほかの選択肢より優位となる. ( 直前の定理の証明 と同様に,x が唯一残っている局面となる前に,左がそれ を無視してほかの手を打てば 、その間に右が x に手を打っ ても x が xR に増えるだけだから. ) 結局,すべての x 直和成分に手が打たれて,最後に左 は y または {0 | −y} に手を打つ.このど ちらの場合も左 の勝ちとなる. 85 / 90 無限小の間の大小関係 4 3 2 1 0 −1 −2 −3 −4 ∗ ⇑ 4· 3 3· 3 2· 3 34 0 34 2· 3 3· 3 4· 3 4 4 4 4· 1 3· 1 2· 1 1 0 1 2· 1 3· 1 4· 1 4 4 ⇓ 0 4 ↓ ↑ 86 / 90 ド ミノ倒し 左は,黒または灰色のド ミノ牌を一つ選んで,それを左 側 (または右側) に倒し,そのド ミノ牌およびその左側 (ま たは右側) にあるすべてのド ミノ牌を取り除く. 同様に,右は,白または灰色のド ミノ牌を一つ選んで, それを倒す. 左 → 右 → 左 → 87 / 90 ド ミノ倒しの局面の値 = 8 = ±3 = ∗ = ↑ = 4 1 = 16 = ∗4 88 / 90 ド ミノ倒しの局面の値 ■ ■ ■ ■ ■ ■ n 個の連続する黒ド ミノ牌からなる局面 (n ≥ 0) の 値は n m + 1 個の黒ド ミノ牌に続く n + 1 個の白ド ミノ牌から なる局面 (m, n ≥ 0) の値は転換ゲーム {m | −n} 2 個の黒ド ミノ牌で n + 2 個の白ド ミノ牌をはさんだ局 面 (n ≥ 0) の値は n n + 1 個の黒ド ミノ牌と n 個の白ド ミノ牌を交互に並 べた局面の値は 21n n 個の黒ド ミノ牌および白ド ミノ牌を交互に並べた局 面は ∗n(∗n については後述) ↑∗ および ⇑ を直和以外で構成する方法は知られてい ない. 89 / 90 ド ミノ倒しの局面の値 ( 2 進)有理数 x ≥ 0 が整数ならば,n 個の連続する黒 ド ミノ牌からなる局面が x を値にもつ.そうでなければ, x = gL gR L R が成り立つ.ここで, g および g は,x の標準形を n o xL xR としたときにそれぞれ xL および xR を値とする ド ミノ倒しの局面とする. n o 3 7 2 4 = 3 2 7 4 = 13 8 = = 90 / 90
© Copyright 2025 Paperzz