数理統計学 西山 現在の目標 正規分布のポイント 標準値の意味と使い方 数値表の使い方 1シグマ、2シグマ、3シグマの使い方 教科書: 第2章の頁76、82,83~86、 及び巻末の「数値表1」 <補足>標準値は統計分析の定番ツール ある試験の得点分布をみると、平均値が300、標準偏 差が30だった。 A君は得点350だった 平均値を引いてから、標準偏差で割った値にしなさい。 標準値は1.7 別の試験では平均が500点、標準偏差が40点だった。 B君は得点555点だった A君とB君はどちらが好成績だったか? 正規分布は常用ツール 面積が割合(= 確率)です。全 体は面積1です N(130、400) 血圧150以上の 人は全体の6分 の1位だと示さ れています X 正規分布の利用法①―標準値 1. 標準値にする. 2. 数値表を使う. 標準値をZとか、S.S.といいますが・・・ Xの値- Xの平均値 X E X 標準値= = Xの標準偏差 SDX 平均=130、標準偏差=20の場合 平均 N(130、400) 標準値が1を超える 平均と同じなら 標準軸から分布を 人は全体の何%い (130-130)÷20 みると平均0、標準 るだろうか? だから標準値は0 偏差1になります 分散 血圧150の標準値 150 − 130 =1 20 X 正規分布の利用法②―数値表 教科書の258頁 標準正規分布 N(0,1) 標準値が1.0以上に なる確率。 これが求める確率 正規分布-理論的な確率分布の一つ 平均=0、標準偏差=1の場合 𝑓 𝑥 = 1 2𝜋 𝑥2 − 𝑒 2 【参考】前ページ作成の方法 統計ソフト<R>入力例 > hist(rnorm(100),prob=T,main="正規分布と100個のデータ") > curve(dnorm(x,mean=0,sd=1),add=T) 正規分布-理論的な確率分布の一つ 平均(𝜇)と標準偏差(𝜎)の二つが<母数> 【参考】前ページ作成の方法 統計ソフト<R>入力例 > par(mfcol=c(2,2)) > hist(rnorm(100,mean=130,sd=20),prob=T,xlim=c(50,200),main="N(130,20^2)") > curve(dnorm(x,mean=130,sd=20),add=T) > hist(rnorm(100,mean=130,sd=10),prob=T,xlim=c(50,200),main="N(130,10^2)") > curve(dnorm(x,mean=130,sd=10),add=T) > curve(dnorm(x,mean=170,sd=10),xlim=c(130,210)) > curve(dnorm(x,mean=170,sd=15),xlim=c(130,210),lty=2) クイズ 0.日本人の成人男性の身長はN(168,100)に従っ て分布しているとします。168センチ以上の人の 割合はいくら位だろうか。 平均値±標準偏差以内の範囲に含まれる割合は確 率P(158 ≦ X ≦ 178)から分かる。この範囲を1 シグマ区間と呼ぶ。 【解答】 標準値にしてから数値表 身長の分布は平均168、標準偏差10と仮定。故に、 158−168 158の標準値は𝑍 = = −1 10 178−168 178の標準値は𝑍 = =1 10 したがって求める確率は、標準正規分布の中で 𝑃 −1 ≤ 𝑍 ≤ 1 = 1 − 2 × 0.16 = 0.68 正規分布では 1シグマ区間に全体の68%が含まれる クイズ 身長分布はN(168,100)の正規分布が当てはまって いる。身長の2シグマ区間はどんな範囲か?2シグマ 区間に全体の何%程度が含まれるか。 (注)2シグマ区間とは標準値が-2から+2までの区 間のこと。 クイズ 身長分布はN(168,100)の正規分布が当てはまって いる。身長の3シグマ区間はどんな範囲か?3シグマ 区間に全体の何%程度が含まれるか。 (注)3シグマ区間とは標準値が-3から+3までの区 間のこと。 【参考】統計ソフトRで正規分布の確率を確かめる 数値表=右側確率、 R=左側確率 > pnorm(1.0) ← 標準値が1.0以下の面積 [1] 0.8413447 > pnorm(-1.0) ← 標準値が-1.0まで [1] 0.1586553 > 1-2*pnorm(-1.0) ← 標準値が±1以内 [1] 0.6826895 > 1-2*pnorm(-2.0) [1] 0.9544997 > 1-2*pnorm(-3.0) ← 標準値が±3以内 [1] 0.9973002 正規分布の確率法則 1シグマの法則 標準値で-1から+1までの範囲 「平均圏」、「普通の範囲」と解釈できる 概ね3分の2、68%が含まれる 2シグマの法則 標準値で-2から+2まで 95%圏と解釈できる-厳密には95.45% 3シグマの法則 最大限、最小限の目安として使われる 3シグマの中に入る確率は99.7%、「ほぼ100%」になる。 練習問題 1. 標準値が-1.5から+1.5までにおさまる確率は? 2. 標準値が2.21以上になる確率は? 3. 日本の成人男子の身長には、µ=170、σ=12セン チの正規分布が当てはまっている。180センチ以上 の人は全体の何%程度いると推測できるか?190 センチ以上の人はどうか? 4. ある試験を400名が受験したところ、平均点が65点 、標準偏差が15点となり、全体の得点分布には正 規分布がよく当てはまっていた。A君は80点だった が、得点順位が何位くらいだったか推測できるか。 指数分布 期待値と標準偏差が一致する右下がり型 ある会社の受付で、1回電話がかかった後 、次にかかってくるまでの待ち時間を測って みた。データ数は30個。単位:分。 > mean(x); sd(x) [1] 15.46632 [1] 18.60807 𝑓 𝑥 = 0.067𝑒 −0.067𝑥 1 = 0.067 15
© Copyright 2024 Paperzz