保険・年金論(第3回) リスクプーリング

統計基礎(第3回)
確率の基礎
早稲田大学大学院商学研究科
2016年4月20日
大塚忠義
1
講義資料
http://tyotsuka.cocolog-nifty.com/blog/
から各自事前にダウンロードしてください
2
Agenda
第3回 確率の基礎
• 確率とは
• 確率の用語
• 確率変数と確率関数
• 等確率の世界
• 条件付き確率
• 事象の独立
3
確率とは(1)
確率( probability)とは、ある現象が起こる度
合い、ある事象が現れる割合
対象となる現象、事象は、結果があらかじ
め定まっていないもの
「起こる度合い」「現れる割合」は偶然性を含
まない一意に定まった数値であり、発生の
度合いを示す指標
4
確率とは(2)
ある現象が起きる度合いを0から1までの数
値で表した尺度
結果が不確実・不確定な現象を確率を使っ
て解釈することができる
将来ある事象が(偶然に)発生する度合(可
能性)を偶然性を含まない数値で表現した
もの
5
確率の用語(1)
離散型:加算型
数えることができる世界:
人数、表の数:コイン投げ、サイコロ、合格
率、死亡率(単純計算の場合)
賭けの勝ち負け(骰子賭博やポーカー)
直感的でわかりやすい
大量計算処理に向かない
事象が1万件を超すと扱いずらい
6
確率の用語(2)
連続型:不加算型
数えることができない世界またはそれに近
似される大量のデータ:時間、距離、価格
・明日の株価
・来年の地価
・国民全体の死亡率と50年後の人口
・今後100年間の大地震の発生
・CMの効果
・選挙の予測
7
確率の用語(3)
微分積分により数学的に処理することが可
能
⇒相当正確な近似をすることができる
大量処理が可能
⇒大量データ処理の場合に計算が容易
大量処理の場合すべて連続型に置き換え
る
⇒大規模統計で活用する確率論は連続型
と観念すべき
⇒統計的推論は連続型をベースに行う
8
確率の用語(4)
• 試行:結果が偶然に支配される実験
• 根本事象:試行の結果
• 標本空間(Ω):すべての根本事象を集
めた集合
• 事象:標本空間の任意の部分集合
• 全事象:標本空間も事象の1つ
• 空事象:事象が一つも含まれない集合
サイコロを投げる例で考える
9
確率の公理
•
•
•
•
•
任意の事象(E)が起こる確率:P(E)=p
任意の事象(E)が起こる確率は0以上1以
下:0≦P(E) ≦1
全事象が起きる確率は1である
:P(Ω)=1
共通の根本事象を含まない2つの事象Aと
Bについてどちらかが起こる確率はP(A∪
B) =P(A)+P(B):加法定理
2つの事象AとBについてどちらかが起こる
確率はP(A∪ B) =P(A)+P(B)- P(A∩ B)
10
確率の用語(5)
コイン投げで考える
(1)試行:コインを1回投げる
根本事象:表または裏
標本空間:表、裏:2
(2)試行:コインを3回投げる
根本事象:表表表、表表裏、表裏表、裏表
表、表裏裏、裏表裏、裏裏表、裏裏裏
標本空間:上記の数:2×2×2
事象:例えば表が2回でる
(3)試行:コインを10回投げる場合の標本
空間の数は?
11
確率変数(1)
・コインを1回投げ、根本事象:表または裏
では、コインを1億回投げる時に対応でき
ない
・日本人1億2千万人、年間100万人死
亡する
・表=1、裏=0または死亡=1、生存=0
とする
・コインを100回投げ、表が60回出る
・日本人の年間死亡者数
・明日の日経平均株価
12
確率変数(2)
・表=1、裏=0または死亡=1、生存=0
というように根本事象を数値で表す
・試行:コインを100回投げる:
根本事象:1,1,1,1,1,1,1,1,0,0・・・(100個)
2の100乗
事象:表がX回出る
全事象: 0≦X ≦100の101個の数値
・確率変数:事象を数値で表したもの
13
確率関数(1)
・確率の表現
P(X=x i )  pi
・コインを100回投げ表が50回出る
P(X=50)  q
・全事象: 0≦X ≦100
100
 P(X=x )  1
i
i 0
P(X) は確率の公理を満たさなくてはな
らない
14
確率関数(2)
・関数の表現
y  f ( x)
xが定まれば、計算式によりyが一意に定
まる
・確率関数
P(X=x)  f ( x)
・確率のモデル化:ある事象の確率変数が
定まるとその事象が発生する確率を求め
ることができる
15
等確率の世界(1)
等確率:すべての根本事象が同じ確率で起
こると仮定
根本事象の数×根本事象の起こる確率=1
𝟏
根本事象の起こる確率=
根本事象の数
このクラスからランダムに1人を選ぶ
あなたが選ばれる確率は?
等確率の前提で最も重要なのは根本事象
の数を数えること
16
等確率の世界(2)
P(E)=事象Eの起こる確率=
事象Eに含まれる根本事象の数
根本事象の数
P(E)についても確率の公理を満たす
例題)サイコロを2回投げて出た目の数の和
が10になる確率を求めよ。なお、骰子の目
の出方は等確率とする
事象Eの数:46、55、64の3つ
根本事象の数:6×6=36
確率:1/12=3÷36
17
等確率の世界(3)
等確率:すべての根本事象が同じ確率で起
こると仮定
骰子の目、コイン投げ
このクラスからランダムに1人を選ぶ
先験的確率:根本事象が起こる確率をあら
かじめ仮定すること
本当に等確率?
経験的確率:試行実験のなかで個々の事象
が起きた割合を確率とする:死亡率etc…
18
骰子の罠
骰子は最初の乱数
発生装置
正確な立方体であ
ることが条件
距骨:牛の後ろ足の踝。
骰子のもととなる古代エ
ジプトの遺跡で副葬品と
して見られる
実社会には、正確
な骰子やコインは
まれ
19
経験調査
試行実験のなかで個々の事象が起きた結
果をもとに率を定める
統計的推論、仮説検定:統計学の発達
商学、経済学の世界での成果
死亡率、事故の発生率の調査
⇒近代保険業の誕生
散布度、平均からの乖離の調査・分析
⇒ポートフォリオ理論、オプション価格理論
⇒金融工学の誕生
20
条件付き確率(1)
P(B/A):条件付き確率:事象Aが起きたという
条件のもとで事象Bが起きる確率
例1)コインを2回投げる。1回目表という条件
下で2回目が表となる確率は?(等確率を仮
定)
1回目表という条件下でのすべての事象は
表表、表裏の2つ、このうち2回目が表となる
事象は1つ。従って確率は1/2
21
条件付き確率(2)
例2)壺のなかに赤玉3個、黒玉2個が入って
いる。1回目に取り出した球が赤の場合次に
黒が出る確率
赤を取り出した後壺の中には赤玉2黒玉2な
ので、1回目に赤を取るという条件下でのす
べての事象は赤赤、赤赤、赤黒、赤黒の4つ、
このうち2回目が黒となる事象は2つ。従って
確率は1/2
22
条件付き確率(3)
𝐴∩𝐵に含まれる根本事象の数
P(B/A)=
Aに含まれる根本事象の数
P(𝐴∩𝐵)
=
P(𝐴)
P(𝐴 ∩ 𝐵 )=
P(𝐴 )=
𝐴∩𝐵に含まれる根本事象の数
すべての根本事象の数
𝐴に含まれる根本事象の数
すべての根本事象の数
P(𝐴 ∩ 𝐵 )= P(B/A) P(𝐴 ):乗法定理
23
事象の独立(1)
P(B/A)= P(𝐵 )
P(A/B)= P(𝐴 )
P(𝐴 ∩ 𝐵 )=P(A) P(𝐵 )
のいずれかが成り立つこと
事象Aは事象Bに影響しない。事象Bは事象A
の起こる確率に影響しない
例1:独立、例2:従属
24
事象の独立(2)
コインを2回投げる。1回目表という条件下で2回
目が表となる確率は1/2
コイン2回、100回投げ:無理なく独立の前提が見
込める
日本人1億2千万人、年間100万人死亡する
表=1、裏=0または死亡=1、生存=0とする
・コインを100回投げ、表が60回出る
・日本人の年間死亡者数
・明日の日経平均株価
25
事象の独立(3)
統計処理を行ううえで、独立性の前提は極
めて重要!!
多くの統計手法、確率モデルは事象の独立
を前提としている
26
博打の落とし穴
丁半の目は半々、確率1/2
骰子の目は1/6 骰子の目は直前の結果
に影響されない独立事象
でたら目の語源
博打での勝ち運に乗って儲ける
負けが込んでる。そろそろ逆目がでるころ
どちらが真実?
27
独立性への疑問(1)
死亡率、事故の発生率:各個人の死亡、個
々の事故の発生は独立と仮定して保険制
度が成立
⇒パンデミック、大災害はその前提を崩し、
保険会社を破綻させる
パンデミック:16~19世紀のペストの大流行
はヨーロッパの人口を1/3に。。
スペイン風邪は全世界で1千万人を超える
死者
28
独立性への疑問(2)
大型旅客機は同時に墜落しない:Sep.11で
は4機同時に墜落
株価モデル、オプション価格モデル
行動は過去の価格に影響される
⇉モデルエラーの発生
経済は理論通りの動きをしない
行動ファイナンスの発達
29
独立性への疑問(3)
ほとんどの統計学の本は、コイン投げサイ
コロ投げから理論が展開される
多くのモデルで独立性は暗黙の前提
現実社会に独立な事象は、ほとんど存在し
ない:特に経済事象は。。
従属事象を独立としてモデルに入れたら正
しい結果は得られない!
ゴミを入れた結果はゴミ
30
ベルヌーイ試行(1)
結果が2種類しかない試行
コイン投げ、死亡、事故、成功・失敗
実世界にベルヌーイ試行は非常に多い
根本事象:成功=1、失敗=0
P(成功)=P(X=1)=p
P(失敗)=P(X=0)=1-p=q
p+q=1
x 1 x
P( X  x )  p q
31
ベルヌーイ試行(2)
実世界の多くの現象をベルヌーイ試行に当
てはめることにより、単純化する
骰子投げ:根本事象は1~6までの6つ
1,2を成功、3~6を失敗とする
死亡率:死亡:1、生存:0
人口100万人の都市で年間1000人が死亡
死亡の発生は独立と仮定。100万回のベル
ヌーイ試行を足し合わせる
死亡率p:0.001=1000/100万?:こんな単純
ではないが。。。
32
ベルヌーイ試行(3)
ブラウン運動:空間上の微小粒子(原子レベ
ル)の移動
2次元空間上、微小時間における右への移
動:1、左への移動:-1
⇒微小時間を積み重ねることで粒子の移動
法則を説明(移動事象は独立と仮定)
破産確率、信用モデル、オプションの価格モ
デルもブラウン運動を応用しているものがあ
る
33
二項公式
p  q 1
( p  q )  p  2 pq  q  1
2
2
2
( p  q )  p  3 p q  3 pq  q  1
3
3
2
2
3
( p  q )  f ( p, q, n)  1
n
二項公式は確率の公理を満たす
関数はパスカルの三角形を使い、組合せと
p,qをもとに展開できる
34
二項分布
x n x
P( X  x )  n Cx p q
確率事象n回の試行でx回成功する
根本事象の数:2のn乗
成功、失敗の確率:p、q
N回の事象は独立であるという全体が必要
確率関数X=xの確率は、n,x,p,qで表現できる
⇒確率を数式で表現することにより、パラ
メーター(母数という、この場合p)が定まると
確率が求まる
35
Question?
お疲れ様でした
36