統計学 第12回 西山 5, 6, 7, 12頁に授業中の表示内容への追加・修正あり 【3章の結論】<ルートNの法則> 集めるデータの特徴は、平均がμ、標準偏差がσ N個のサンプルをとると 合計値 正規分布 期待値 N 標準偏差 N 平均値 期待値 標準偏差 N N:データ数、 μ:母集団の平均値、 σ:母集団の散らばり 【3章の結論】分散には二通りあり 言葉の定義どおりだと 1 2 S N X N i 1 X 2 i 母集団の分散を知りたいなら N 1 2 2 X i X ˆ N 1 i 1 不偏分散 バイアス修正値 母平均は標本平均に、ばらつきは標準誤差に 全部そろっていれば 平均値は決まる 9個のサンプル 100 200 100 200 袋の重さ 違いがあれば 平均値 必ず誤差が出る 正規分布 3 1 9個のサンプル 100 200 袋の重さ 100 200 平均値 【例題再び】確率90%で推定 ある高校の1年生からランダムに5名を選ん で100メートル走の記録をとると、 12.32、15.28、14.19、13.72、13.26 だった。学年全体の平均はいくら位か範囲を 示して答えなさい。信頼係数は90%。 ←授業中は定義通りの標準偏差Sを表 示していました 信頼係数を90%に落とすと 信頼係数 0.90 P 1.645 Z 1.645 X P 1.645 1.645 2 n 1.10 1.10 P13.75 1.645 13.75 1.645 5 5 サンプル平均 標準誤差 0.49 点推定と区間推定の関係 100メートル走の記録 最大誤差をどこまで見積もるか 2 標準誤差 サンプル平均 1.645 1.10 13.75 1 5 0 (=0.49) 幅をつけない推定法を点推定といいます 標準誤差を求める式を、 前のページに合わせて 修正しています 【例題】身長の学年平均 ある高校の1年生からランダムに5人を選んで身長を測 定すると以下のようであった: 192、 155、 161、 180、 166 (cm) 学年全体の平均身長を推定しなさい。信頼係数は95% としなさい。 【解答】 母平均(μ)の推定 サンプル平均 標準誤差 170.8cm 15 6.7 5 170.8 2 6.7 T値について補足します • T値≒標準値です。 • ゆえに、T値は±2以内と思って基本的にOKです (確率95%範囲) • サンプル数が少ない時はT分布の数値表で95% 範囲を確かめる方が厳密です。 平均と分散の標本分布 母集団は、μ=170、σ2=102、サンプル数は5個 標本分散の分布 標本平均の分布 700 600 500 400 300 200 100 0 最大値 最小値 平均値 分散 歪み度 尖り度 25 -5 0 75 -1 00 12 515 0 17 520 0 22 525 0 27 530 0 32 535 0 37 540 0 42 545 0 47 550 0 <= 33 7. 89 カイ二乗分布の形 3.8 9- 18 3. 46 データの分散の値 18 18 0.4 6- 18 0. 02 17 7.0 2- 18 7. 59 17 3.5 9- 17 3. 15 17 0.1 5- 17 0. 72 16 6.7 2- 17 6. 28 16 3.2 8- 16 3. 85 16 9. 15 9.8 5- 15 1- 6.4 15 15 2.9 8- 15 6. 41 0 頻度 900 800 700 600 500 400 300 200 100 0 187.33 152.9773 169.9806 20.43845 0.007936 0.042042 最大値 最小値 平均値 分散 歪み度 尖り度 477.6252 0.448268 79.85362 3114.514 1.367639 2.805332 不偏分散は 100を中心に 分布します ステューデントのT分布の立役者 T X ˆ 2 n Gosset, W. S. Fisher, R.A. 母集団のσ2に近ければ 大したことではない データ数が10個未満 では必要 1906年にペンネームStudentでT分布の存在を発見しました T値のシグマ区間 90%圏 これは自由度(n-1) 95%圏 サンプル数が10個未満 T分布表から95%範囲を確かめよ 教科書巻末の 数値表5を参照 サンプル数が20個以上なら 2シグマの法則を使う。標準値で±2以内! 解答② ‐T分布表で厳密に 自由度=5-1=4 母平均(μ)は サンプル平均 170.8cm サンプル誤差 15 6.7 5 170.8 2.78 6.7 クイズ ある作業を行うための所要時間は作業員により異なる。 いま無作為に10人を選んで所要時間を調べたところ、 以下の結果が得られた(単位:分) 44.6, 43.3, 37.2, 40.6, 27.4, 40.7, 45.6, 39.5, 39.1, 42.7 作業員全体の平均所要時間は何分くらいか?95%信頼区間を求めな さい。 ヒント サンプル10人の平均値に関する標準誤差 母平均=サンプルの平均±<何倍とるか>×標準誤差
© Copyright 2024 Paperzz