ゲーム 認知科学・人工知能とゲーム 認知科学 小笠原秀美 2011 年 10 月 20 日 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム ゲーム木 ゲーム木 二人完全情報ゲーム: オセロ,将棋,チェス,囲碁 状態が指し手 (オペレータ) により変換されて行く状態空間の 探索 プレーヤはお互い自分にとって良い局面になるように手を決 める 相手は自分にとって悪い局面になるように手を決める. ゲーム木/ゲーム木探索 MAX プレーヤ 評価値が最大になるような手を選択する. MIN プレーヤ 評価値が最小になるような手を選択する. MAX(MIN) ノード MAX(MIN) プレーヤの手番に対応する ノード. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム ゲーム木探索 ゲーム木探索:ミニマックス法 各ノードにおける評価値の決定方法 MAX ノードの評価値は評価値最大の子ノードの評価値とする. MIN ノードの評価値は評価値最小の子ノードの評価値とする. 現在の状態から先読みを行い,葉ノードから順次上方のノー ドの評価値を決定し,その中の最善手を選択する. MAX f=7 認知科学 f=2 MIN f=9 f=7 f=2 f=9 小笠原秀美 ゲーム 認知科学・人工知能とゲーム ゲーム木探索 ミニマックス法:課題 ミニマックス法で各ノードの評価値を決定しなさい. 左から右に評価値を決定するとして,根の評価値を決める上 で評価値を計算しなくて良いノードに印をつけなさい. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム ゲーム木探索 アルファ・ベータ枝刈り法 あるノードの子ノードの一つの評価値が得られると MAX ノードではそれより評価値が減少することはない. MIN ノードではそれより評価値が増大することはない. そのノードの評価値の範囲に関する情報 アルファ(α):下界–評価値の最小値 ベータ (β):上界–評価値の最大値 ノード p の上界と下界の値,αβ (p)=(α, β) 枝刈り: 不要な評価値の計算の回避 アルファ・カット 評価値の上界 (β) が上位の MAX ノードの 下界 (α) 以下になったときに枝刈りする. ベータ・カット 評価値の下界 (α) が上位の MIN ノードの上 界 (β) 以上になったときに探索を打ち切る (枝 刈りする). 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム 認知科学と人工知能 人工知能: 人間の知的な活動を実現する. 人間の認知についての仮説を検証するため. 知的活動を代行して役に立てるため. チェスをプレーするシステムの作成 人工知能の目標の一つ (だった) 上級者に勝つには,単純な探索などの方法だけでは計算機で 扱えない程の計算時間とメモリが必要と考えられていた. いろいろなゲームの局面数 チェッカー オセロ チェス 将棋 囲碁 (9 路盤) 囲碁 (19 路盤) 認知科学 1020 1028 1050 1071 1038 10171 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon Chase & Simon Chase, W. G. & Simon, H.A., Perception in Chess, Cognitive Psychology, 1973, 4, 55-81. チェスの上級者は一目見ただけで盤面を記憶できる. それはいくつかの駒のまとまり (チャンク) ごとに記憶するこ とで達成されており,上級者は経験を通してそのようなチャ ンクを利用することができるようになったと考えられる. ここでは盤面上に知覚されたり,短期記憶に入れられる チャ ンクの特徴を調べる. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 実験 被験者:3 人のチェスプレーヤ: (マスター,A クラス,初心者) 材料:チェスの場面 (中盤・終盤) × (実際のゲームの配置,ランダム配置) 実際にあったゲームは上級者間のゲームから 20 例 中盤:21 手目,24-26 駒 終盤:41 手目,12-15 駒 ランダムは上のゲームの中から 4 例ずつ選び,駒をランダム に再配置したもの. 半数を記憶課題に,半数を知覚課題に使用する. 被験者の正面に駒を置いていない盤,その右に駒,その左に 駒を置いた盤を配置. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 実験 課題 記憶課題 左の盤を 5 秒間提示→正面の盤に再生させる. これを正確に再生できるまで繰り返す. 知覚課題 左の盤を見ながら正面の盤に同じように駒を置く. 仮定:被験者は一回見ることで一つのチャンクだけをコード化 するだろう. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:記憶課題–再生の正確さ 実際にあった場面:熟達度が高い程,再生が正確. ランダムな場面:熟達度が高くても正確に再生できない. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:記憶課題–再生の正確さ もし熟達者の方が一般的に記憶に優れたとしたなら... どのような場面でも熟達者の再生は正確 結果は実際にあった場面の場合のみ再生が正確 熟達者の場合,記憶は実際にあった場面の特徴に影響されて いる 初級者の場合は影響されない ランダムな場面と実際にあった場面の違いは何か プレーの結果 チェスの知識を適用した結果 チェスのプレーヤにとり意味のある場面 どのような知識により解釈されているのか 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:ある置駒と次の置駒—時間間隔 記憶課題,知覚課題共に 2 秒くらいまでが多く,それ以上は 少ないが続く. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:ある置駒と次の置駒—時間間隔 知覚課題の詳細 within-glance:ある駒と次の駒の間にターゲットを見ない場合 between-glance:ある駒と次の駒の間にターゲットを見た場合 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:ある置駒と次の置駒—関係 続けて再生されるコマの塊がある 知覚課題の「一目」で置かれた駒は一つのチャンクに対応 記憶課題で 2 秒以内の間隔で置かれた駒は一つのチャンクに 対応 続けて置かれた駒と駒の関係 例えば攻撃,防御,同色,同種など いくつかの関係が組み合わせられる 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:ある置駒と次の置駒—関係 知覚課題 between-glance ほぼどの関係の組合せの出現率もチャンスレベル within-glance 組合される関係の数が多い組合せではチャンスレベル以上 少ない関係の組合せではチャンスレベル以下 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:ある置駒と次の置駒—関係 記憶課題 間隔が長くなると駒間の関係の数が減少する. 2 秒以下の間隔だけについては within-glance と同じ傾向 2 秒より長い間隔だけについては between-glance と同じ傾向 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon 結果:チャンクのサイズと数 知覚課題の「一目」で置かれた駒や記憶課題の 2 秒以内の間 隔の駒は一つのチャンクに属していると考えられる 最初に再生される数個のチャンクのサイズは熟達度が高い程 大きい. 再生されるチャンクの数は熟達度が高い程大きい. 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム Chase & Simon チェスにおける熟達 初心者:盤面を覚えられない,熟達者:盤面を覚えられる de Groot 初級者も上級者も読む手数には差がない 上級者は盤面の記憶に優れている それがいくつかのまとまり (chunk) で記憶されていること それを支えているメカニズムは何か 問題解決における知識の重要性 認知科学 小笠原秀美 ゲーム 認知科学・人工知能とゲーム 認知科学・人工知能とゲーム – 再び ゲームをプレーするシステム チェスをプレーするシステム: IBM Deep Blue 並列計算機 + チェス専用ハードウェア 特徴 問題空間探索 計算リソース (速度とメモリ) データベース 評価関数 認知科学 小笠原秀美
© Copyright 2024 Paperzz