2015年度 統計分析/統計基礎理論 演習課題6

2015 年度 統計分析/統計基礎理論 演習課題6
問題1
講義の際に用いた日本の高3女子高生のデータ(平均 157.4cm、標準偏差 5.5cm)
および米国女性のデータ(平均 164cm、標準偏差 7cm)を考える。
(1) 日本女性で身長が 150cm 以上、165cm 以下である比率(確率)を求めよ。
(2) 米国女性で身長が 160cm 以上、170cm 以下である比率(確率)を求めよ。
(3) 日本女性、米国女性のそれぞれの身長の1シグマ区間(範囲)を求め、そ
の比率(確率)を求めよ
(4) 日本女性、米国女性のそれぞれの全体の比率が 95 %となる身長の範囲を
求めよ。
解答
(1) 日本の高3女子高生の身長データを X とすると、平均が 157.4cm、標準
偏差が 5.5cm なので、
(
)
X ∼ N 157.4, 5.52
したがって、
Z=
X − 157.4
X − 157.4
√
=
∼ N (0, 1)
5.5
5.52
であるので、身長が 150cm 以上、165cm 以下である確率は、標準正規分布表より
)
(
150 − 157.4
X − 157.4
165 − 157.5
≤
≤
P (150 ≤ X ≤ 165) = P
5.5
5.5
5.5
= P (−1.36 ≤ Z ≤ 1.38) = P (Z ≤ 1.38) − P (−1.36 ≤ Z)
= P (Z ≤ 1.38) − {1 − P (Z ≤ 1.36)}
= 0.9162 − 1 + 0.9131 = 0.8293
(2) 米国の高3女子高生の身長データを Y とすると、平均が 164cm、標準偏
差が 7cm なので、
(
)
Y ∼ N 164, 72
したがって、
Z=
Y − 164
Y − 164
√
=
∼ N (0, 1)
7
72
1
であるので、身長が 160cm 以上、170cm 以下である確率は、標準正規分布表より
(
)
160 − 164
Y − 164
170 − 164
P (160 ≤ Y ≤ 170) = P
≤
≤
7
7
7
= P (−0.57 ≤ Z ≤ 0.86) = P (Z ≤ 0.86) − P (−0.57 ≤ Z)
= P (Z ≤ 0.86) − {1 − P (Z ≤ 0.57)}
= 0.8051 − 1 + 0.7157 = 0.5208
(3) 1シグマ区間は身長の平均 ± 標準偏差分となるので、
日本女子は 157.4 ± 5.5 なので、151.9cm から 162.9cm
米国女子は 164 ± 7 なので、157cm から 171cm
また、身長は正規分布に従っているので、Z ∼ N (0, 1)
したがって、標準正規分布表から1シグマの確率を求めると
P (−1.00 ≤ Z ≤ 1.00) = P (Z ≤ 1.00) − P (−1.00 ≤ Z)
= P (Z ≤ 1.00) − {1 − P (Z ≤ 1.00)}
= 0.8413 − 1 + 0.8413 = 0.6826
(4) 全体の比率が 95%となるのは、標準正規分布表より P (−1.96 ≤ Z ≤ 1.96)
のときなので、
日本の高3女子高生の身長データを X とすると、平均が 157.4cm、標準偏差が
5.5cm なので、
−1.96 ≤ Z ≤ 1.96
X − 157.4
√
≤ 1.96
5.52
157.4 − 10.78 ≤ X ≤ 157.4 + 10.78
−1.96 ≤
146.62 ≤ X ≤ 168.18
米国の高3女子高生の身長データを Y とすると、平均が 164cm、標準偏差が 7cm
なので、
−1.96 ≤ Z ≤ 1.96
Y − 164
√
≤ 1.96
72
164 − 13.72 ≤ X ≤ 164 + 13.72
−1.96 ≤
150.28 ≤ X ≤ 177.72
2
問題2
ある公務員の採用試験が行われ、採用人員が 100 名のところ 1500 名の受験者が
ありました。試験は筆記と面接を合わせて 600 点満点であり、採点の結果、平均
点が 365 点、標準偏差が 50 点で、得点は正規分布に従っている。
(1) 400 点以上得点した受験者数は、およそ何名いるでしょうか。
(2) 合格最低点は、およそ何点でしょうか。
解答
(1) 採用試験の得点を X とすると、平均が 365 点、標準偏差が 50 点で正規分
布に従っているので、
(
)
X ∼ N 365, 502
したがって、
Z=
X − 365
X − 365
√
=
∼ N (0, 1)
50
502
であるので、400 点以上得点した確率は、標準正規分布表より
P (400 ≤ X)
)
(
400 − 365
X − 365
≤
= P
50
50
= P (0.7 ≤ Z) = 1 − P (Z ≤ 0.7)
= 1 − 0.7580 = 0.2420
以上から、400 点以上得点した受験者は上位 0.2420 であるので、受験者総数が
1500 人なので、
1500 × 0.2420 = 363(人)
となる。
(2)
1500 人の受験者で合格者は 100 人なので、100 位の人は
100
= 0.0667
1500
に位置している。標準正規分布表で 0.0667 となる点の値は 1.51 となる。
したがって、平均が 365、標準偏差が 50 なので、求める得点は、
365 + 50 × 1.51 = 440.5
以上から、試験の点数なので小数点以下を四捨五入すると、合格点はおよそ 441 点
と考えられる。
3
問題3
1000 人に数学と英語の試験を行いました。数学は平均 45 点、標準偏差 6 点、英
語は平均 65 点、標準偏差 8 点の正規分布に従っていました。このとき、50 位の人
の合計点はおよそ何点だと考えられるか答えなさい。
解答
数学の点数を変量 X 、英語の点数を変量 Y とすると、
X ∼ N (45, 62 ) Y ∼ N (65, 82 )
となる。このとき数学と英語の合計点を表す変量 X + Y は、正規分布の再生性
より
X + Y ∼ N (45 + 65, 62 + 82 ) = (110, 102 )
1000 人の受験者で 50 位の人は上位 5%に位置している。標準正規分布表で 5%と
なる点の値は 1.645 となる。
したがって、平均が 110、標準偏差が 10 なので、求める得点は、
110 + 10 × 1.645 = 126.45
以上から、試験の点数なので小数点以下を四捨五入すると、50 位の人の合計点は
およそ 126 点と考えられる。
4
問題4
大学生の A 君は、出発時に友達から 10 万円を借りていましたが、現在手元には、
1000 ドル残っています。現在の為替レートは1ドル 105 円なので、そのまま円に
換算すると友達にお金を返すことは可能です。しかし、A 君は為替レートの変動
を利用してお金を増やすことを考えました。為替レートが平均 105 円、分散 16 の
正規分布に従っていると仮定します。なお、問題を簡単にするため手数料、利息
はないものとします。
(1) A 君が友達へお金を返却出来なくなる可能性はどの程度ですか?
(2) 為替の変動によって1万円以上の利益を上げる可能性はどの程度ですか?
解答
(1) 為替レートの値を X とし、これが N (105, 16) に従っていると仮定されて
いる。友達から借りたお金は 10 万円なので、1000 ドルを換金したときに 10 万円
未満になる為替レートの範囲を考えると、X < 100 となるので、求める確率は、
(
P (X < 100) = P
)
X − 105
100 − 105
<
= P (Z < −1.25)
4
4
X − 105
とおけば、Z ∼ N (0, 1) なので、標準正規分布表より
4
P (Z < −1.25) = 1 − P (Z < 1.25) = 1 − 0.8944 = 0.1056
ここで、Z =
以上から、友達へお金を返せなくなる確率は 10.56%となる。
(2) 1万円以上の利益を得るためには、友達から 10 万円を借りているので、1000
ドルを換金したときに、11 万円以上になる為替レートの範囲を考えると、110 ≤ X
となるので、求める確率は、
P (110 ≤ X) = P
(
)
X − 105
110 − 105
≤
= P (1.25 ≤ Z) = 1 − P (Z < 1.25)
4
4
X − 105
とおけば、Z ∼ N (0, 1) なので、標準正規分布表より
4
P (1.25 ≤ Z) = 1 − P (Z < 1.25) = 1 − 0.8944 = 0.1056
ここで、Z =
以上から、1万円以上の利益を得る確率は 10.56%となる。
5
問題5
N市の勤労者1世帯当り純金融資産残高(金融資産残高−金融負債残高)は、過
去の調査から平均 480 万円、標準偏差 320 万円の正規分布に従うことが分かって
いる。
(1) 64 世帯を無作為抽出したとき、その標本平均が 450 万円以上 500 万以下の
確率を求めよ。
(2) 標本平均が 520 万円以上になる確率が 5 %を超えないためには、標本の大
きさは少なくともいくら必要か求めよ。
解答
(1)
標本平均を X̄ とすると、母集団の標準偏差が 320、標本数が 64 なので、
(
3202
X̄ ∼ N 480,
64
したがって、
)
X̄ − 480
X̄ − 480
Z=√
=
∼ N (0, 1)
40
3202 /64
であるので標準正規分布表より
)
(
X̄ − 480
450 − 480
500 − 480
≤
≤
P (450 ≤ X̄ ≤ 500) = P
40
40
40
= P (−0.75 ≤ Z ≤ 0.5) = P (Z ≤ 0.5) − P (−0.75 ≤ Z)
= {1 − P (Z > 0.5)} − P (0.75 ≤ Z)
= 1 − 0.3085 − 0.2296 = 0.4619
(2)
標本数を n とすると、標本の分散に標本数が関係するので、

P (X̄ ≥ 520) = P

520 − 480 

√
3202 /n
≤ 0.05
となる n を求めれば良い。
標準正規分布表より、P (Z ≥ 1.6449) = 0.05 であるので、
520 − 480
√
≥ 1.6449 ⇒ 40
1
1√
√ ≥ 1.6449 ⇒ √ ≥ 1.6449 ⇒ n ≥ 1.6449
320/ n
8/ n
8
3202 /n
√
⇒ n ≥ 1.6449 × 8 なので n = 173.1645
以上から、必要な標本の大きさ n = 174
6
問題6
あるホテルのエレベーターの重量制限は 300kg であり、制限を超えるとブザーが
なる。また、男性の体重は正規分布 N (60, 82)、女性の体重は正規分布 N (50, 62) で
表されるとする。このとき、
(1)男性3名と女性2名がエレベーターに乗るとき
の体重の合計が従う分布、
(2))X sin N (60, 82)、Y sin N (50, 62) とする。3X +2Y
の分布、とすると(1)と(2)の分布と異なる。両者の違いを説明せよ。
解答
式が異なることから分布は異なることは示されているが、なぜ異なる式となる
のかを簡単に説明する。
(1)の分布は、男性3名は、同じ分布(N (60, 82))に従うが、全て異なる人
である。つまり体重の思い人も入れば、体重の軽い人もありうる。そのため、3
人集まった場合に、体重の変動を打ち消し合うことが想定される。そのため分散
は和で示される。
(2)の分布は、3X と、同じ分布(N (60, 82))に従う変数 X を 3 倍している。
つまり、散らばりの度合いが3倍されているので、分散は2乗で求められること
になる。
7
問題7
あるメーカーでは、自動旋盤を利用して針を製造している。振動、気温、旋盤
の損耗などの様々な要因から、この旋盤で製造される針の長さは、平均 1.012cm、
標準偏差 0.018cm の正規分布に従う。顧客は、長さが 1.00 ± 0.02cm の針のみ購入
予定である。
(1) この顧客の要求する水準を満たす針は何%か。
(2) 製造する針の平均を変更できるとすると、納品率を最も上げるためには、
いくつに変更すれば良いか。その理由を説明せよ。
(3) 平均は変更出来ない(=1.012cm)が、標準偏差を減少できるとする。製品
の 90 %、95 %、99 %を顧客を顧客に購入してもらうための標準偏差の最大
値を求めよ。
(4) 標準偏差を(x/1,000)cm 削減するためには 15, 000x2 円必要とすると、
(3)
の場合に必要となるコストを計算せよ。
(5) (2)で解答した値に平均を調整するとする。この場合、製品を 90%、95%、
99%を購入してもらうためには標準偏差はどれぐらい減少しなければならな
いか求めよ。
(6) 平均を調整するのに 80,000 円の費用がかるとすると、(5)の場合に必要
となるコストを計算し、(4)と比較することで、最も適切な平均と標準偏
差を決定せよ。
解答
省略
8