第12回(7月15日)

統計学
第12回
西山
5, 6, 7, 12頁に授業中の表示内容への追加・修正あり
【3章の結論】<ルートNの法則>
集めるデータの特徴は、平均がμ、標準偏差がσ
N個のサンプルをとると
合計値
正規分布
期待値  N  
標準偏差  N  
平均値
期待値  
標準偏差 

N
N:データ数、 μ:母集団の平均値、 σ:母集団の散らばり
【3章の結論】分散には二通りあり
言葉の定義どおりだと
1
2
S 
N
 X
N
i 1
 X
2
i
母集団の分散を知りたいなら
N
1
2
2
X i  X 
ˆ 

N  1 i 1
不偏分散
バイアス修正値
母平均は標本平均に、ばらつきは標準誤差に
全部そろっていれば
平均値は決まる
9個のサンプル
100
200
100
200
袋の重さ
違いがあれば
平均値
必ず誤差が出る
正規分布
3
1
9個のサンプル
100
200
袋の重さ
100
200
平均値
【例題再び】確率90%で推定
ある高校の1年生からランダムに5名を選ん
で100メートル走の記録をとると、
12.32、15.28、14.19、13.72、13.26
だった。学年全体の平均はいくら位か範囲を
示して答えなさい。信頼係数は90%。
←授業中は定義通りの標準偏差Sを表
示していました
信頼係数を90%に落とすと
信頼係数
0.90  P 1.645  Z  1.645




X 


 P  1.645 
 1.645 
2



n


1.10
1.10 

 P13.75  1.645 
   13.75  1.645 

5
5 

サンプル平均
標準誤差
0.49
点推定と区間推定の関係
100メートル走の記録
最大誤差をどこまで見積もるか
2

 標準誤差
サンプル平均
1.645

 1.10
  13.75  

1
5


0
 (=0.49)
幅をつけない推定法を点推定といいます
標準誤差を求める式を、
前のページに合わせて
修正しています
【例題】身長の学年平均
ある高校の1年生からランダムに5人を選んで身長を測
定すると以下のようであった:
192、 155、 161、 180、 166 (cm)
学年全体の平均身長を推定しなさい。信頼係数は95%
としなさい。
【解答】
母平均(μ)の推定
サンプル平均
標準誤差
170.8cm
15
 6.7
5
170.8  2  6.7
T値について補足します
• T値≒標準値です。
• ゆえに、T値は±2以内と思って基本的にOKです
(確率95%範囲)
• サンプル数が少ない時はT分布の数値表で95%
範囲を確かめる方が厳密です。
平均と分散の標本分布
母集団は、μ=170、σ2=102、サンプル数は5個
標本分散の分布
標本平均の分布
700
600
500
400
300
200
100
0
最大値
最小値
平均値
分散
歪み度
尖り度
25
-5
0
75
-1
00
12
515
0
17
520
0
22
525
0
27
530
0
32
535
0
37
540
0
42
545
0
47
550
0
<=
33
7.
89
カイ二乗分布の形
3.8
9-
18
3.
46
データの分散の値
18
18
0.4
6-
18
0.
02
17
7.0
2-
18
7.
59
17
3.5
9-
17
3.
15
17
0.1
5-
17
0.
72
16
6.7
2-
17
6.
28
16
3.2
8-
16
3.
85
16
9.
15
9.8
5-
15
1-
6.4
15
15
2.9
8-
15
6.
41
0
頻度
900
800
700
600
500
400
300
200
100
0
187.33
152.9773
169.9806
20.43845
0.007936
0.042042
最大値
最小値
平均値
分散
歪み度
尖り度
477.6252
0.448268
79.85362
3114.514
1.367639
2.805332
不偏分散は
100を中心に
分布します
ステューデントのT分布の立役者
T
X 
ˆ
2
n
Gosset, W. S. Fisher, R.A.
母集団のσ2に近ければ
大したことではない
データ数が10個未満
では必要
1906年にペンネームStudentでT分布の存在を発見しました
T値のシグマ区間
90%圏
これは自由度(n-1)
95%圏
サンプル数が10個未満
T分布表から95%範囲を確かめよ
教科書巻末の
数値表5を参照
サンプル数が20個以上なら
2シグマの法則を使う。標準値で±2以内!
解答② ‐T分布表で厳密に
自由度=5-1=4
母平均(μ)は
サンプル平均
170.8cm
サンプル誤差
15
 6.7
5
170.8  2.78  6.7
クイズ
ある作業を行うための所要時間は作業員により異なる。
いま無作為に10人を選んで所要時間を調べたところ、
以下の結果が得られた(単位:分)
44.6, 43.3, 37.2, 40.6, 27.4,
40.7, 45.6, 39.5, 39.1, 42.7
作業員全体の平均所要時間は何分くらいか?95%信頼区間を求めな
さい。
ヒント
サンプル10人の平均値に関する標準誤差
母平均=サンプルの平均±<何倍とるか>×標準誤差