単純集計 1変数:量的データ(1)

単純集計 1変数:量的データ(1)
„
要約統計量
その変数全体または一部を数量的に要約する。
分布している
代表値
„
散布度
分散
標準偏差
人
50
35
40
33
28
30
16
20
ばらつきが大きい
10
何%?
19
5
2
1
最小
このあたりが真ん中
範囲
80
0万
90
0万
以
上
〜
〜
80
0万
70
0万
〜
70
0万
70
0万
〜
60
0万
〜
〜
〜
50
0万
50
0万
40
0万
40
0万
30
0万
30
0万
20
0万
60
0万
0
〜
最大・最小
四分位
パーセンタイル
60
20
0万
順序統計量
65
70
10
0万
„
つぶがそろっている
80
〜
平均値
中央値
最頻値
82
10
0万
„
90
最大
単純集計 1変数:量的データ(2):
„
代表値
算術平均
データの総和をデータ数で割ったもの
A組=(30+40+50+50+50+50+60+70)÷8=50
B組=(10+20+40+40+50+60+60+80+90)÷9=50
1
x=
n
„
n
∑x
i
i =1
A組 {30 40 50 50 50 50 60 70}
B組 {10 20 40 40 50 60 60 80 90}
中央値
データを大きさの順に並べたとき,ちょうど中央に位置する値
„
最頻値
10
最も個数の多いデータ値
20
●
30
●
40
●
●
●
●
50
●
60
●
70
80
90
単純集計 1変数:量的データ(3):
„
順序統計量
最大・最小
文字通り,最大値と最小値
„
四分位
A組 {30 40 50 50 50 50 60 70}
データの個数をちょうど四分の一ずつに分けるデータ値
„
„
„
„
1/4・・・第1四分位数
2/4・・・第2四分位数=中央値
3/4・・・第3四分位数
8×0.25=2(個) → 40
8×0.50=4(個) → 50
8×0.75=6(個) → 50
パーセンタイル
そのデータ値よりも小さな値が全体のα%あるとき,その
データ値のことをαパーセンタイルと呼ぶ。
単純集計 1変数:量的データ(4):
分散
A組 {30 40 50 50 50 50 60 70}
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
偏 差
-20-10 0 0 0 0 10 20
↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓
偏差平方 400 100 0 0 0 0 100 400
総 和
平 均
÷8
10
●
60
●
70
80
90
●
50
●
●
60
70
●
80
●
90
1000
125
↓ ↓ ↓ ↓ ↓ ↓
偏 差
-40-30-10-10 0 10
↓ ↓ ↓ ↓ ↓ ↓
偏差平方1600 900 100 100 0 100
÷9
●
40
125
小
●
10
B組 {10 20 40 40 50 60 60 80 90}
総 和
平 均
●
30
20
●
●
●
●
50
5400
600
↓ ↓ ↓
10 30 40
↓ ↓ ↓
100 900 1600
大
●
20
30
●
●
40
600
分散
平均からのズレの2乗の平均
1
s =
n
2
n
∑ (x − x)
i
i =1
2
単純集計 1変数:量的データ(5):
„
標準偏差
標準偏差
分散の平方根
10
s=
1
n
n
∑
( xi − x ) 2
小
20
●
30
●
40
●
●
●
●
50
●
60
●
50
●
●
60
●
70
80
90
70
●
80
●
90
125
i =1
11.18
●
10
大
●
20
30
●
●
40
600
24.49