平均 - FC2

基礎統計
2015 年 4 月 17 日
例1:A クラスの採点方針:全員 75 点
ttp://mcobaya.web.fc2.com/kisotokei/index_ut.htm
B クラスの採点方針:50%は 85 点、50%は 65 点
石井俊全『まずはこの一冊から
どちらも平均点は 75 点でも、B クラスにはリスクがある。
第一章
意味がわかる統計学』ベレ出版
相対度数分布グラフ
変量(調査、計測した資料の値)この講義では、サンプルサイズを N
とし、
x1 , , x N
N を資料の個数(サンプルサイズ)、n を階級の数とすると
1) 原データから平均を計算する方法
階級:データ分類する区間「0点以上10点未満」等
x
サイズ:資料に含まれるデータの個数(資料の個数)
階級値:階級の範囲の中央(平均, 代表)値。これで階級内の値を代
表させる。この講義では、階級の数を n とし、
x1, , xn
ヒストグラム 相対度数分布グラフの書き方
x1    x N
N
2)度数分布表から平均を計算する方法:
n を階級の数、 i 番目の階級の度数 fi、階級の代表値を
対度数 g1

f
f1
, , g n  n
N
N
と定義すると
x
xi とし、相
f1 x1    f n xn
N
は
ルール 1:各階級の柱の底辺の長さは階級幅に比例させる。(一つの
グラフに異なる階級幅が混在するときに重要)
x  x1
f
f1
   xn n
N
N
ルール 2:相対度数分布グラフの柱(長方形)の面積は相対度数(全
体の度数に対する比率)に比例させる。(最重要)したがって、相対
度数が同じで、階級幅が c(2)倍なら高さを 1/c(半分)とする。(方
とも書ける。よく見ると g1

f
f1
, , g n  n
N
N
x  x1g n    xn g n
眼紙の1マスあたりの相対度数を決め、共通にしておくとよい。)
と平均が相対度数と階級値で表現できた。
おまけ:階級の数決定にはスタージェスの公式
同様にして、分散=偏差の二乗の平均
が便利な目安(N=64 なら log2N=6 なので k=7)
は相対度数なので、
s2 
階級の幅を c, 相対度数=fi/N のとき、高さ=fi/(cN)とする。
( x1  x ) 2    ( xN  x ) 2
f
f
は相対度数 g1  1 , , g n  n
N
N
N
と階級の代表値 x1, , xn を使い
第 2 節(p.26) 平均、分散・標準偏差
s 2  ( x1  x ) 2
f
f1
   ( xn  x ) 2 n  ( x1  x ) 2 g1    ( xn  x ) 2 g n
N
N
平均=変量の総和÷資料の個数
データの変換と平均、平均
偏差=変量の平均からの差
例 2-1:X が次のような分布をしていた。
分散=偏差の二乗の総和÷資料の個数(サンプルサイズ)
注意:不偏分散(サンプルサイズから1を引いた数が分母の分散)を使
うこともある。N がある程度大きいときは分散とほとんど差がない。
標準偏差=√分散。分散を「分布の中心からの距離の二乗」の平均的値
と考えれば、標準偏差は分布の中心からの距離の平均的値とほぼみな
せる(誤差はあるが)だから、標準偏差がわかれば、ばらつきの大きさ
はほぼ検討がつく。
分散も標準偏差もバラツキの尺度。 x1 , , xn が N 回の計測値なら
計測の精度を表し、投資の収益率ならば投資のリスク(不確実性)を
値
-2
-1
0
1
2
相対度数
0.1
0.2
0.4
0.2
0.1
平均=0
分散=0.1×(-2)2+0.2×(-1)2+0.4×02+0.2×12+0.1×22
=0.4+0.2+0.2+0.4=1.2
標準偏差≒1.1
例 2-2 W=X+2 が次のような分布をしていた。
値
0
1
2
3
4
相対度数
0.1
0.2
0.4
0.2
0.1
示す。ハイリスク・ハイリターンというときのリスク。(日常用語の
平均=2
リスクは下がるときだけだが、金融でのリスクはバラツキの大きさを
分散=0.1×(0-2)2+0.2×(1-2)2+0.4×(2-2)2+0.2×(3-
指す)だから金融用語では「下振れリスク」という妙な表現が存在。
2)2+0.1×(4-2)2
むしろ波瀾万丈度の尺度
=0.4+0.2+0.2+0.4=1.2
標準偏差≒1.1
換をうけ、90×0.5+20=____となる。「
例 2-3 Y が次のような分布をしていた。
い。
」といってよ
値
-20
-10
0
10
20
2)知能指数は平均が100、標準偏差を15(もしくは16)。
相対度数
0.1
0.2
0.4
0.2
0.1
練習問題:某大学の期末試験において 3 つのクラスで次のよ
平均=0
うな点数分布を得た。相互に比較しやすいように相対度数分
分散=0.1×(-20) +0.2×(-10) +0.4×0 +0.2×10 +0.1×20
2
2
2
2
2
布グラフを描け。小さな正方形の面積を 0.1 とせよ。
=40+20+20+40=120..X の分散の 100=10 倍
A 組(点数)
度数
相対度数
標準偏差≒11
10 以上 20 未満
20
0.2
20 以上 30 未満
40
0.4
30 以上 50 以下
40
0.4
合計
100
1
B 組(点数)
度数
相対度数
10 以上 20 未満
20
0.2
20 以上 30 未満
40
0.4
30 以上 40 未満
20
0.2
40 以上 50 以下
20
0.2
合計
100
2
X の標準偏差の 10 倍
より直感的
分散と標準偏差の使い分け
Y の標準偏差は「中心からの平均距離だから1ぐらいかな」
絶対値の平均でないのは、絶対値は数学的に扱いにくいことと、偏
差の自乗の平均で定義したほうが、性質がよいため(詳細は省略)
教科書
p.49 もとの資料の平均を
資料の平均を
x
2
,分散を s とし、変換後の
x  、分散 s 2 をとする。
ア)もとの資料の変量に一律に a を加えると、
x  x  a, s 2  s 2 と平均は a 増加するが、分散は変わらず。
(位置がかわるだけなので、バラツキは不変)
イ)もとの資料の変量を一律に b 倍すると、 x  bx ,
s 2  b 2 s 2
2
と平均は b 倍になり、分散 b 倍、標準偏差は b 倍。
A
偏差値:
すべての得点に同じ数を加えたり、かけたりして、平均_
_、標準偏差__ になるように変換したもの。
例:あるクラスの期末試験の得点分布は、平均点60、標準偏差 20
であった
( x1
 80, x2  40 )
考え方1。まず標準偏差を揃えよう。素点に 0.5 を一律にかけると、
平均は 0.5 倍、分散は 0.25 倍、標準偏差は 0.5 倍になるので、
( x1
 40, x2  20 )
0
10
20
30
40
50
10
20
30
40
50
A
変換後の得点の標準偏差は 10(成功)。ここで平均は半分の30点
なので、20をくわえれば、( x1
 60, x2  40 )分散は不変であ
り、平均だけが20増加する。
練習問題3 平均50点、標準偏差10の模擬試験で、60点の A 君
と、平均点60点、標準偏差20の模擬試験で90点の B 君ではどち
らが成績上位に位置するか。
0
考え方:B 君のうけた模擬試験を平均得点50点、標準偏差10に変
換してみよう。すべての得点に0.5をかけ、20を加えると平均が
50、標準偏差10に変換される。これは A 君の受けた試験と同一の
平均と標準偏差。一律に得点が変換されるのだから、B 君の得点も変