平均 - FC2

基礎統計
2015 年 4 月 17 日
例１：A クラスの採点方針：全員 75 点
ttp://mcobaya.web.fc2.com/kisotokei/index_ut.htm
B クラスの採点方針：50%は 85 点、50%は 65 点
石井俊全『まずはこの一冊から
どちらも平均点は 75 点でも、B クラスにはリスクがある。
第一章
意味がわかる統計学』ベレ出版
相対度数分布グラフ
変量（調査、計測した資料の値）この講義では、サンプルサイズを N
とし、
x1 , , x N
N を資料の個数（サンプルサイズ）、n を階級の数とすると
1) 原データから平均を計算する方法
階級：データ分類する区間「０点以上１０点未満」等
x
サイズ：資料に含まれるデータの個数（資料の個数）
階級値：階級の範囲の中央（平均, 代表）値。これで階級内の値を代
表させる。この講義では、階級の数を n とし、
x1, , xn
ヒストグラム相対度数分布グラフの書き方
x1    x N
N
2)度数分布表から平均を計算する方法：
n を階級の数、 i 番目の階級の度数 fi、階級の代表値を
対度数 g1

f
f1
, , g n  n
N
N
と定義すると
x
xi とし、相
f1 x1    f n xn
N
は
ルール 1：各階級の柱の底辺の長さは階級幅に比例させる。（一つの
グラフに異なる階級幅が混在するときに重要）
x  x1
f
f1
   xn n
N
N
ルール 2：相対度数分布グラフの柱（長方形）の面積は相対度数(全
体の度数に対する比率）に比例させる。（最重要）したがって、相対
度数が同じで、階級幅が c(2)倍なら高さを 1/c(半分)とする。（方
とも書ける。よく見ると g1

f
f1
, , g n  n
N
N
x  x1g n    xn g n
眼紙の１マスあたりの相対度数を決め、共通にしておくとよい。）
と平均が相対度数と階級値で表現できた。
おまけ：階級の数決定にはスタージェスの公式
同様にして、分散=偏差の二乗の平均
が便利な目安(N=64 なら log2N=6 なので k=7)
は相対度数なので、
s2 
階級の幅を c, 相対度数=fi/N のとき、高さ=fi/(cN)とする。
( x1  x ) 2    ( xN  x ) 2
f
f
は相対度数 g1  1 , , g n  n
N
N
N
と階級の代表値 x1, , xn を使い
第 2 節(p.26) 平均、分散・標準偏差
s 2  ( x1  x ) 2
f
f1
   ( xn  x ) 2 n  ( x1  x ) 2 g1    ( xn  x ) 2 g n
N
N
平均＝変量の総和÷資料の個数
データの変換と平均、平均
偏差=変量の平均からの差
例 2-1：X が次のような分布をしていた。
分散=偏差の二乗の総和÷資料の個数(サンプルサイズ)
注意：不偏分散(サンプルサイズから１を引いた数が分母の分散)を使
うこともある。N がある程度大きいときは分散とほとんど差がない。
標準偏差=√分散。分散を「分布の中心からの距離の二乗」の平均的値
と考えれば、標準偏差は分布の中心からの距離の平均的値とほぼみな
せる(誤差はあるが)だから、標準偏差がわかれば、ばらつきの大きさ
はほぼ検討がつく。
分散も標準偏差もバラツキの尺度。 x1 , , xn が N 回の計測値なら
計測の精度を表し、投資の収益率ならば投資のリスク（不確実性）を
値
-2
-1
0
1
2
相対度数
0.1
0.2
0.4
0.2
0.1
平均＝０
分散=0.1×(-2)2+0.2×(-1)2+0.4×02+0.2×12+0.1×22
=0.4+0.2+0.2+0.4=1.2
標準偏差≒1.1
例 2-2 W=X+2 が次のような分布をしていた。
値
0
1
2
3
4
相対度数
0.1
0.2
0.4
0.2
0.1
示す。ハイリスク・ハイリターンというときのリスク。（日常用語の
平均＝2
リスクは下がるときだけだが、金融でのリスクはバラツキの大きさを
分散=0.1×(0-2)2+0.2×(1-2)2+0.4×(2-2)2+0.2×(3-
指す）だから金融用語では「下振れリスク」という妙な表現が存在。
2)2+0.1×(4-2)2
むしろ波瀾万丈度の尺度
=0.4+0.2+0.2+0.4=1.2
標準偏差≒1.1
換をうけ、90×0.5＋20=____となる。「
例 2-3 Y が次のような分布をしていた。
い。
」といってよ
値
-20
-10
0
10
20
2)知能指数は平均が１００、標準偏差を１５（もしくは１６）。
相対度数
0.1
0.2
0.4
0.2
0.1
練習問題：某大学の期末試験において 3 つのクラスで次のよ
平均＝０
うな点数分布を得た。相互に比較しやすいように相対度数分
分散=0.1×(-20) +0.2×(-10) +0.4×0 +0.2×10 +0.1×20
2
2
2
2
2
布グラフを描け。小さな正方形の面積を 0.1 とせよ。
=40+20+20+40=120..X の分散の 100=10 倍
A 組（点数）
度数
相対度数
標準偏差≒11
10 以上 20 未満
20
0.2
20 以上 30 未満
40
0.4
30 以上 50 以下
40
0.4
合計
100
1
B 組（点数）
度数
相対度数
10 以上 20 未満
20
0.2
20 以上 30 未満
40
0.4
30 以上 40 未満
20
0.2
40 以上 50 以下
20
0.2
合計
100
2
X の標準偏差の 10 倍
より直感的
分散と標準偏差の使い分け
Y の標準偏差は「中心からの平均距離だから１ぐらいかな」
絶対値の平均でないのは、絶対値は数学的に扱いにくいことと、偏
差の自乗の平均で定義したほうが、性質がよいため（詳細は省略）
教科書
p.49 もとの資料の平均を
資料の平均を
x
2
,分散を s とし、変換後の
x  、分散 s 2 をとする。
ア)もとの資料の変量に一律に a を加えると、
x  x  a, s 2  s 2 と平均は a 増加するが、分散は変わらず。
（位置がかわるだけなので、バラツキは不変）
イ)もとの資料の変量を一律に b 倍すると、 x  bx ,
s 2  b 2 s 2
2
と平均は b 倍になり、分散 b 倍、標準偏差は b 倍。
A
偏差値：
すべての得点に同じ数を加えたり、かけたりして、平均＿
＿、標準偏差＿＿になるように変換したもの。
例：あるクラスの期末試験の得点分布は、平均点６０、標準偏差 20
であった
（ x1
 80, x2  40 ）
考え方１。まず標準偏差を揃えよう。素点に 0.5 を一律にかけると、
平均は 0.5 倍、分散は 0.25 倍、標準偏差は 0.5 倍になるので、
（ x1
 40, x2  20 ）
0
10
20
30
40
50
10
20
30
40
50
A
変換後の得点の標準偏差は 10（成功）。ここで平均は半分の３０点
なので、２０をくわえれば、（ x1
 60, x2  40 ）分散は不変であ
り、平均だけが２０増加する。
練習問題３平均５０点、標準偏差１０の模擬試験で、６０点の A 君
と、平均点６０点、標準偏差２０の模擬試験で９０点の B 君ではどち
らが成績上位に位置するか。
0
考え方：B 君のうけた模擬試験を平均得点５０点、標準偏差１０に変
換してみよう。すべての得点に０．５をかけ、２０を加えると平均が
５０、標準偏差１０に変換される。これは A 君の受けた試験と同一の
平均と標準偏差。一律に得点が変換されるのだから、B 君の得点も変

Download Report