講義資料

ゲーム
認知科学・人工知能とゲーム
認知科学
小笠原秀美
2011 年 10 月 20 日
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
ゲーム木
ゲーム木
二人完全情報ゲーム: オセロ,将棋,チェス,囲碁
状態が指し手 (オペレータ) により変換されて行く状態空間の
探索
プレーヤはお互い自分にとって良い局面になるように手を決
める
相手は自分にとって悪い局面になるように手を決める.
ゲーム木/ゲーム木探索
MAX プレーヤ 評価値が最大になるような手を選択する.
MIN プレーヤ 評価値が最小になるような手を選択する.
MAX(MIN) ノード MAX(MIN) プレーヤの手番に対応する
ノード.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
ゲーム木探索
ゲーム木探索:ミニマックス法
各ノードにおける評価値の決定方法
MAX ノードの評価値は評価値最大の子ノードの評価値とする.
MIN ノードの評価値は評価値最小の子ノードの評価値とする.
現在の状態から先読みを行い,葉ノードから順次上方のノー
ドの評価値を決定し,その中の最善手を選択する.
MAX
f=7
認知科学
f=2
MIN
f=9
f=7
f=2
f=9
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
ゲーム木探索
ミニマックス法:課題
ミニマックス法で各ノードの評価値を決定しなさい.
左から右に評価値を決定するとして,根の評価値を決める上
で評価値を計算しなくて良いノードに印をつけなさい.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
ゲーム木探索
アルファ・ベータ枝刈り法
あるノードの子ノードの一つの評価値が得られると
MAX ノードではそれより評価値が減少することはない.
MIN ノードではそれより評価値が増大することはない.
そのノードの評価値の範囲に関する情報
アルファ(α):下界–評価値の最小値
ベータ (β):上界–評価値の最大値
ノード p の上界と下界の値,αβ (p)=(α, β)
枝刈り: 不要な評価値の計算の回避
アルファ・カット 評価値の上界 (β) が上位の MAX ノードの
下界 (α) 以下になったときに枝刈りする.
ベータ・カット 評価値の下界 (α) が上位の MIN ノードの上
界 (β) 以上になったときに探索を打ち切る (枝
刈りする).
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
認知科学と人工知能
人工知能: 人間の知的な活動を実現する.
人間の認知についての仮説を検証するため.
知的活動を代行して役に立てるため.
チェスをプレーするシステムの作成
人工知能の目標の一つ (だった)
上級者に勝つには,単純な探索などの方法だけでは計算機で
扱えない程の計算時間とメモリが必要と考えられていた.
いろいろなゲームの局面数
チェッカー
オセロ
チェス
将棋
囲碁 (9 路盤)
囲碁 (19 路盤)
認知科学
1020
1028
1050
1071
1038
10171
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
Chase & Simon
Chase, W. G. & Simon, H.A., Perception in Chess, Cognitive
Psychology, 1973, 4, 55-81.
チェスの上級者は一目見ただけで盤面を記憶できる.
それはいくつかの駒のまとまり (チャンク) ごとに記憶するこ
とで達成されており,上級者は経験を通してそのようなチャ
ンクを利用することができるようになったと考えられる.
ここでは盤面上に知覚されたり,短期記憶に入れられる チャ
ンクの特徴を調べる.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
実験
被験者:3 人のチェスプレーヤ: (マスター,A クラス,初心者)
材料:チェスの場面
(中盤・終盤) × (実際のゲームの配置,ランダム配置)
実際にあったゲームは上級者間のゲームから 20 例
中盤:21 手目,24-26 駒
終盤:41 手目,12-15 駒
ランダムは上のゲームの中から 4 例ずつ選び,駒をランダム
に再配置したもの.
半数を記憶課題に,半数を知覚課題に使用する.
被験者の正面に駒を置いていない盤,その右に駒,その左に
駒を置いた盤を配置.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
実験
課題
記憶課題
左の盤を 5 秒間提示→正面の盤に再生させる.
これを正確に再生できるまで繰り返す.
知覚課題
左の盤を見ながら正面の盤に同じように駒を置く.
仮定:被験者は一回見ることで一つのチャンクだけをコード化
するだろう.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:記憶課題–再生の正確さ
実際にあった場面:熟達度が高い程,再生が正確.
ランダムな場面:熟達度が高くても正確に再生できない.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:記憶課題–再生の正確さ
もし熟達者の方が一般的に記憶に優れたとしたなら...
どのような場面でも熟達者の再生は正確
結果は実際にあった場面の場合のみ再生が正確
熟達者の場合,記憶は実際にあった場面の特徴に影響されて
いる
初級者の場合は影響されない
ランダムな場面と実際にあった場面の違いは何か
プレーの結果
チェスの知識を適用した結果
チェスのプレーヤにとり意味のある場面
どのような知識により解釈されているのか
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:ある置駒と次の置駒—時間間隔
記憶課題,知覚課題共に 2 秒くらいまでが多く,それ以上は
少ないが続く.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:ある置駒と次の置駒—時間間隔
知覚課題の詳細
within-glance:ある駒と次の駒の間にターゲットを見ない場合
between-glance:ある駒と次の駒の間にターゲットを見た場合
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:ある置駒と次の置駒—関係
続けて再生されるコマの塊がある
知覚課題の「一目」で置かれた駒は一つのチャンクに対応
記憶課題で 2 秒以内の間隔で置かれた駒は一つのチャンクに
対応
続けて置かれた駒と駒の関係
例えば攻撃,防御,同色,同種など
いくつかの関係が組み合わせられる
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:ある置駒と次の置駒—関係
知覚課題
between-glance
ほぼどの関係の組合せの出現率もチャンスレベル
within-glance
組合される関係の数が多い組合せではチャンスレベル以上
少ない関係の組合せではチャンスレベル以下
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:ある置駒と次の置駒—関係
記憶課題
間隔が長くなると駒間の関係の数が減少する.
2 秒以下の間隔だけについては within-glance と同じ傾向
2 秒より長い間隔だけについては between-glance と同じ傾向
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
結果:チャンクのサイズと数
知覚課題の「一目」で置かれた駒や記憶課題の 2 秒以内の間
隔の駒は一つのチャンクに属していると考えられる
最初に再生される数個のチャンクのサイズは熟達度が高い程
大きい.
再生されるチャンクの数は熟達度が高い程大きい.
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
Chase & Simon
チェスにおける熟達
初心者:盤面を覚えられない,熟達者:盤面を覚えられる
de Groot
初級者も上級者も読む手数には差がない
上級者は盤面の記憶に優れている
それがいくつかのまとまり (chunk) で記憶されていること
それを支えているメカニズムは何か
問題解決における知識の重要性
認知科学
小笠原秀美
ゲーム
認知科学・人工知能とゲーム
認知科学・人工知能とゲーム – 再び
ゲームをプレーするシステム
チェスをプレーするシステム: IBM Deep Blue
並列計算機 + チェス専用ハードウェア
特徴
問題空間探索
計算リソース (速度とメモリ)
データベース
評価関数
認知科学
小笠原秀美