一部から全体を知る-母集団と標本 統計的推定 :一部分を

一部から全体を知る-母集団と標本
統計的推定 :一部分を調査し、集団全体の特性を把握する方法。
標本(サンプル) :集団の一部分
母集団 :もとの集団全体
抽出されたひとまとまり = 標本(サンプル)
標本(サンプル)が複数あるとき
標本(サンプル)数(ここでは=2)
標本(サンプル)に含まれる個体数
=標本(サンプル)サイズ
一部から全体を知る-母集団と標本
標本統計量
母集団
標本(サンプル)
母集団サイズ N
標本サイズ
n
母平均
m
標本平均
x
母分散
V=σ2 標本分散
母標準偏差
σ
標本標準偏差u
母比率
P
標本比率
U=u2
p
一部から全体を知る-標本平均の性質
A市の中学校2年生の身長
全数調査(N=42000)
階級値
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
計
度数
84
210
336
462
672
966
1302
1764
2310
3024
3654
4116
4284
4032
3570
2982
2310
1806
1428
1008
714
420
336
168
31
42000
相対度数(%)
サンプル数40の標本調査から
得られた標本平均の分布
n=15の標本
調査を40回
行ってみる。
標本平均は
40個得られる。
標本平均の
分布を作成。
階級値
158
159
160
161
162
163
164
計
度数
1
2
4
23
6
3
1
40
標本平均の平均E(x)(これを
標本平均の期待値という):
cm
標本平均の標準偏差 D(x):
cm
中心極限定理
100%
母平均m:
cm
cm
母標準偏差σ:
相対度数(%)
E(x) = m
D( x ) =
σ
n
一部から全体を知る-標本平均の性質
標本平均の性質(まとめ)
母集団が正規分布をしているか、標本サイズnが十分に大きい値のと
き、標本平均xの分布は次の性質をもつ。
①標本抽出を多数繰り返すとき、得られる標本平均xの期待値E(x)は
母平均mに等しい。 E(x) = m
②標本平均xの標準偏差D(x)は、母標準偏差σの1/√nに等しい。
D( x ) =
σ
σ
n
σ
n
を標準誤差という。
③標本平均は、平均m、標準偏差
の
n
正規分布に従う。
m−
標本平均
の分布
2σ
n
m−
σ
n
m
m+
σ
n
m+
2σ
n
一部から全体を知る-統計的推定
金沢大学の男子生徒数は5000人です。標本調査によって体重の平均
値を推定してみます。
サンプルサイズn=100、平均値x=64.1kg、標準偏差u=5.2kg。
男子学生全体の平均体重を64.1kgとみなしてよいか? →
。
区間推定法: 標本統計量の値に幅を持たせ、母集団の統計量を推
定する方法。
信頼区間: 「m1kg~m2kgの間にある」。m1を下限値、m2を上限値。
二つにはさまれた区間を信頼区間。
精度: 信頼区間を2で割った値。
信頼度: 推定結果がどの程度信頼できるかを確率で表したもの。
例 「信頼度95%」:同じ推定を100回行ったとしたら5か間違う(=母
集団の統計量が信頼区間から外れる)可能性がある。
一部から全体を知る-Z推定
標本平均の分布
期待値(平均): m
標準偏差: σ / n
m
x
標準正規分布
x を基準化すると、
x − 期待値 x − m
=
Z=
標準偏差 σ / n
0
Z
一部から全体を知る-Z推定
標準正規分布
Zが-1.96から1.96をとる確率は95%。
式で表現すると、
− 1.96 < Z = ( x − m) /
σ
< 1.96
n
σ
σ
< m < x + 1.96
x − 1.96
n
n
-1.96
0
1.96
母標準偏差が既知なら、標本平均から、母集団の平均の幅を推測できる!
母集団の標準偏差が未知でも、サンプルサイズが十分に大きければ
(n>100)標本標準偏差uは母標準偏差σとほぼ一致する。
つまり・・・標本平均と標本標準偏差から、母集団の平均の幅を推測できる!
標準正規分布表
一部から全体を知る-Z推定
Z推定のまとめ
m1 = x − Z (α / 2)
下限値:
上限値:
m2 = x + Z (α / 2)
σ
n
σ
n
信頼度
定数
100(1-α)
Z(α/2)
100(1-0.01)=99%
Z(0.01/2) = Z(0.005) = 2.58
100(1-0.05)=95%
Z(0.05/2) = Z(0.025) = 1.96
αは有意水準という。信頼度と意味は同じ。
Z(α/2)は標準正規分布上で上側確率(中心
0から遠い側の確率)がα/2となる横軸の値。
α/2
α/2
3
2
Z(α/2)
1
0
1
2
3
Z(α/2)