統計的システム論 マルコフ連鎖モンテカルロ法 林 和則 京都大学大学院情報学研究科 E-mail: [email protected] 講義資料: http://www.msys.sys.i.kyoto-u.ac.jp/~kazunori/sst.html 1 2 AGENDA ! 次元の呪い ! メトロポリス法とギブス・サンプラー ! マルコフ連鎖と定常分布 ! 既約性と非周期性 ! 定常分布への収束 ! 詳細釣り合い条件 ! メトロポリス・ヘイスティングス法 ! 参考文献 3 次元の呪い - 2次元の場合: 円の面積 正方形の面積 - N次元の場合: N次元球の体積 N次元立方体の体積 Nが大きくなると,N次元立方体の中の一様分布から乱数を発生させ たときにN次元球の中にヒットする確率は非常に小さくなる 4 マルコフ連鎖モンテカルロ法 マルコフ連鎖の不変分布=(興味のある)事後分布 そのマルコフ連鎖のからのサンプル=(興味のある)事後 分布からのサンプル マルコフ連鎖モンテカルロ法 (Markov Chain Monte-Carlo: MCMC) 1950年代に統計物理の分野で誕生(計算機ができてすぐ) 1990年代に統計的情報処理の世界で広く利用 -離散,連続を問わず様々な分布に適用可能 -非常に多変量の場合にも適用可能 5 モンテカルロ法 モンテカルロ法 マルコフ連鎖モンテカルロ法 (動的モンテカルロ) ポピュレーション型 のモンテカルロ メトロポリス・ヘイスティングス法 ギブス・ サンプラー (熱浴法) メトロポリス法 独立サンプラー 逐次モンテカルロ 6 メトロポリス法の適用(離散変数の場合) 3つの離散確率変数: 分布 からのサンプルを生成したい 7 離散変数のメトロポリス法 の任意の初期状態からはじめて,以下を繰り返す 1. 変数を一つを選択 (順番は一定でもランダムでも可) 2. の値を で置き換え,他はそのままにした状態を次の「候補」 3. 「候補」の状態の確率と現在の状態の確率の比 を計算 を選択: 4. の一様乱数を生成 5. ならば「候補」を次の状態に(受理, accept), そうでなければ 現在の状態を次の状態に(棄却, reject) 8 離散変数のメトロポリス法:注意点 - (「候補」の確率が大きい)ならば,「候補」は必ず採用 - であっても,確率 で「候補」を採用 - この確率的ルールがマルコフ連鎖を定め,サンプル列が生成される - マルコフ連鎖の「定常分布」=所望の同時分布 - 初期状態から十分長く経った出力列から,十分に間隔をあけてとった サンプルは,所望の分布からの独立なサンプル(混合時間) - サンプル列の最初を用いても正しい期待値が得られるが,実際は捨 てたほうがよい(burn-in) 9 メトロポリス法の適用(連続変数の場合) 2変数正規分布の場合: [2変数正規分布に対するメトロポリス法] の任意の初期状態からはじめて,以下を繰り返す 1. を原点対称の確率密度 から発生 2. 「候補」 3. 「候補」と現在の状態の確率の比: 4. の一様乱数を生成し, ならば , そうでなければ何もしない 10 連続変数のメトロポリス法:注意点 - 密度 は対称性 を満たせばほぼなんでもよい 例) を適当なステップ幅として - 分散 平均 の正規分布から を独立に選択 - 区間 上の一様分布から を独立に選択 -同時に を変える代わりに,以下の(i)(ii)を交互に行ってもよい (i) とした候補を受理するか判定 (ii) 逆に だけを動かした候補を受理するか判定 11 2変数分布に対するギブス・サンプラー の任意の初期状態からはじめて,以下を繰り返す 1. の新しい値を で選ぶ 2. の新しい値を で選ぶ - 変数の場合 からサンプリング - 連続変数のメトロポリス法は効率がステップ幅 の影響を受けるが, ギブス・サンプラーはステップ幅を決める必要がない - 条件付分布からのサンプリングが容易 ⇒ ギブス・サンプラーの実装 が容易 12 マルコフ連鎖とMCMCにおける要請 マルコフ連鎖: 次の状態 を取る確率が,直前の状態 にのみ依存する ルールで動くシステム 遷移確率: 状態 から に移る確率 ステップtの分布 はステップt+1では次のように変換 要請: どんな初期分布 から初期状態 を選んでも で は分布 に収束 13 定常分布(不変分布) が に収束するためには, は,任意の について は遷移確率 で決まるマルコフ連鎖の定常分布(不変分布) 14 既約性と非周期性 ある初期状態 からたどり着けない状態 で ならアウト マルコフ連鎖の遷移グラフが強連結であることが必要(既約性) A. 任意の について,ある があって,遷移確率 による遷移を ちょうど 回繰り返して, から に有限の確率で到達できる B. ある があって,任意の について,遷移確率 による遷移を ちょうど 回繰り返して, から に有限の確率で到達できる 条件A(既約性) 条件B(既約性+非周期性) 15 定常分布への収束の証明 で定まる遷移を 回繰り返したものを改めて とおく 条件Bの を1に→条件B* 定常分布 の存在を仮定して,任意の初期分布 から への収束を証明 証明のポイント: 任意の分布 から出発し,遷移を一回したあと の分布が次のように書ける (*) は によらない定数 は に依存してもよいが, 16 定常分布への収束の証明(続) 17 (*)の証明 (*) は によらない定数 は に依存してもよいが, 条件B*より,任意の について 18 (*)の証明 は の値に依存するが, のとる値は有限個しかない とすると によらない について ( を小さくしてもこの不等式は成立するので の場合は とする) 任意の について と定義 , より 両辺 について和をとる から 以上より,(*)および付随する条件が示された 19 詳細釣り合い条件 「 が定常分布になる」という条件は非常に緩い (逆にこれを満たすマルコフ連鎖の設計が難しい) 詳細釣り合い(detailed balance)条件: 任意の について 詳細釣り合い条件は, 定常分布であることの 十分条件 が成り立つ 詳細釣り合い条件を... 満足できる 満足できない メトロポリス法とメトロポリス・ヘイスティ ングス法 状態 にいるときに, が候補として選ばれる確率: (しばらく対称性 を仮定) - ならば を必ず受理 - ならば を確率 で受理 メトロポリス法の遷移確率: と がともに0でない任意の異なる2状態 について の場合: 20 メトロポリス法とメトロポリス・ヘイスティ ングス法(続) メトロポリス法における詳細つりあい条件の確認: と がともに0でない任意の異なる2状態 について の場合 の場合: の定義を から メトロポリス・ヘイス ティングス(MH)法 に変更すればよい 21 22 ギブス・サンプラー(熱浴法) 変数が と書けるとき,各成分 毎に 以外の変数 を 固定した条件付分布 からのサンプル で の値を置き換える操作を繰り返す : からのサンプル(状態) : 条件付分布に従って成分 を取り直した状態 取り直した後の と の同時分布: は定常分布 23 ギブス・サンプラー(熱浴法)(続) ギブス・サンプラーの各ステップは詳細釣り合い条件を満たす (ギブス・サンプラーはMH法の特殊な場合) - と が一つの成分 以外は同じとき: - それ以外: ( : が選ばれる確率) 全ての候補が採用され,ギブス・サンプラーが再現される 24 参考文献 1. C. M. Bishop, Pattern Recognition and Machine Leaning, Springer, 2006 2. 伊庭幸人, 講座物理の世界 ベイズ統計と統計物理, 岩波書店, 2003. 3. 伊庭幸人ほか, 統計科学のフロンティア12 計算統計II, 岩波書店, 2005. 4. 小西貞則ほか, 計算統計学の方法 -ブートスラップ・EMアルゴリズム・MCMC-, 朝倉書店, 2008. 5. 豊田秀樹, マルコフ連鎖モンテカルロ法, 朝倉書店, 2008. 6. 中妻照雄, 入門ベイズ統計学, 朝倉書店, 2007. 7. 樋口知之, “粒子フィルタ,” 電子情報通信学会誌, vol. 88, no. 12, pp. 989-994, Dec. 2005.
© Copyright 2024 Paperzz