基礎統計 2015 年 4 月 17 日 例1:A クラスの採点方針:全員 75 点 ttp://mcobaya.web.fc2.com/kisotokei/index_ut.htm B クラスの採点方針:50%は 85 点、50%は 65 点 石井俊全『まずはこの一冊から どちらも平均点は 75 点でも、B クラスにはリスクがある。 第一章 意味がわかる統計学』ベレ出版 相対度数分布グラフ 変量(調査、計測した資料の値)この講義では、サンプルサイズを N とし、 x1 , , x N N を資料の個数(サンプルサイズ)、n を階級の数とすると 1) 原データから平均を計算する方法 階級:データ分類する区間「0点以上10点未満」等 x サイズ:資料に含まれるデータの個数(資料の個数) 階級値:階級の範囲の中央(平均, 代表)値。これで階級内の値を代 表させる。この講義では、階級の数を n とし、 x1, , xn ヒストグラム 相対度数分布グラフの書き方 x1 x N N 2)度数分布表から平均を計算する方法: n を階級の数、 i 番目の階級の度数 fi、階級の代表値を 対度数 g1 f f1 , , g n n N N と定義すると x xi とし、相 f1 x1 f n xn N は ルール 1:各階級の柱の底辺の長さは階級幅に比例させる。(一つの グラフに異なる階級幅が混在するときに重要) x x1 f f1 xn n N N ルール 2:相対度数分布グラフの柱(長方形)の面積は相対度数(全 体の度数に対する比率)に比例させる。(最重要)したがって、相対 度数が同じで、階級幅が c(2)倍なら高さを 1/c(半分)とする。(方 とも書ける。よく見ると g1 f f1 , , g n n N N x x1g n xn g n 眼紙の1マスあたりの相対度数を決め、共通にしておくとよい。) と平均が相対度数と階級値で表現できた。 おまけ:階級の数決定にはスタージェスの公式 同様にして、分散=偏差の二乗の平均 が便利な目安(N=64 なら log2N=6 なので k=7) は相対度数なので、 s2 階級の幅を c, 相対度数=fi/N のとき、高さ=fi/(cN)とする。 ( x1 x ) 2 ( xN x ) 2 f f は相対度数 g1 1 , , g n n N N N と階級の代表値 x1, , xn を使い 第 2 節(p.26) 平均、分散・標準偏差 s 2 ( x1 x ) 2 f f1 ( xn x ) 2 n ( x1 x ) 2 g1 ( xn x ) 2 g n N N 平均=変量の総和÷資料の個数 データの変換と平均、平均 偏差=変量の平均からの差 例 2-1:X が次のような分布をしていた。 分散=偏差の二乗の総和÷資料の個数(サンプルサイズ) 注意:不偏分散(サンプルサイズから1を引いた数が分母の分散)を使 うこともある。N がある程度大きいときは分散とほとんど差がない。 標準偏差=√分散。分散を「分布の中心からの距離の二乗」の平均的値 と考えれば、標準偏差は分布の中心からの距離の平均的値とほぼみな せる(誤差はあるが)だから、標準偏差がわかれば、ばらつきの大きさ はほぼ検討がつく。 分散も標準偏差もバラツキの尺度。 x1 , , xn が N 回の計測値なら 計測の精度を表し、投資の収益率ならば投資のリスク(不確実性)を 値 -2 -1 0 1 2 相対度数 0.1 0.2 0.4 0.2 0.1 平均=0 分散=0.1×(-2)2+0.2×(-1)2+0.4×02+0.2×12+0.1×22 =0.4+0.2+0.2+0.4=1.2 標準偏差≒1.1 例 2-2 W=X+2 が次のような分布をしていた。 値 0 1 2 3 4 相対度数 0.1 0.2 0.4 0.2 0.1 示す。ハイリスク・ハイリターンというときのリスク。(日常用語の 平均=2 リスクは下がるときだけだが、金融でのリスクはバラツキの大きさを 分散=0.1×(0-2)2+0.2×(1-2)2+0.4×(2-2)2+0.2×(3- 指す)だから金融用語では「下振れリスク」という妙な表現が存在。 2)2+0.1×(4-2)2 むしろ波瀾万丈度の尺度 =0.4+0.2+0.2+0.4=1.2 標準偏差≒1.1 換をうけ、90×0.5+20=____となる。「 例 2-3 Y が次のような分布をしていた。 い。 」といってよ 値 -20 -10 0 10 20 2)知能指数は平均が100、標準偏差を15(もしくは16)。 相対度数 0.1 0.2 0.4 0.2 0.1 練習問題:某大学の期末試験において 3 つのクラスで次のよ 平均=0 うな点数分布を得た。相互に比較しやすいように相対度数分 分散=0.1×(-20) +0.2×(-10) +0.4×0 +0.2×10 +0.1×20 2 2 2 2 2 布グラフを描け。小さな正方形の面積を 0.1 とせよ。 =40+20+20+40=120..X の分散の 100=10 倍 A 組(点数) 度数 相対度数 標準偏差≒11 10 以上 20 未満 20 0.2 20 以上 30 未満 40 0.4 30 以上 50 以下 40 0.4 合計 100 1 B 組(点数) 度数 相対度数 10 以上 20 未満 20 0.2 20 以上 30 未満 40 0.4 30 以上 40 未満 20 0.2 40 以上 50 以下 20 0.2 合計 100 2 X の標準偏差の 10 倍 より直感的 分散と標準偏差の使い分け Y の標準偏差は「中心からの平均距離だから1ぐらいかな」 絶対値の平均でないのは、絶対値は数学的に扱いにくいことと、偏 差の自乗の平均で定義したほうが、性質がよいため(詳細は省略) 教科書 p.49 もとの資料の平均を 資料の平均を x 2 ,分散を s とし、変換後の x 、分散 s 2 をとする。 ア)もとの資料の変量に一律に a を加えると、 x x a, s 2 s 2 と平均は a 増加するが、分散は変わらず。 (位置がかわるだけなので、バラツキは不変) イ)もとの資料の変量を一律に b 倍すると、 x bx , s 2 b 2 s 2 2 と平均は b 倍になり、分散 b 倍、標準偏差は b 倍。 A 偏差値: すべての得点に同じ数を加えたり、かけたりして、平均_ _、標準偏差__ になるように変換したもの。 例:あるクラスの期末試験の得点分布は、平均点60、標準偏差 20 であった ( x1 80, x2 40 ) 考え方1。まず標準偏差を揃えよう。素点に 0.5 を一律にかけると、 平均は 0.5 倍、分散は 0.25 倍、標準偏差は 0.5 倍になるので、 ( x1 40, x2 20 ) 0 10 20 30 40 50 10 20 30 40 50 A 変換後の得点の標準偏差は 10(成功)。ここで平均は半分の30点 なので、20をくわえれば、( x1 60, x2 40 )分散は不変であ り、平均だけが20増加する。 練習問題3 平均50点、標準偏差10の模擬試験で、60点の A 君 と、平均点60点、標準偏差20の模擬試験で90点の B 君ではどち らが成績上位に位置するか。 0 考え方:B 君のうけた模擬試験を平均得点50点、標準偏差10に変 換してみよう。すべての得点に0.5をかけ、20を加えると平均が 50、標準偏差10に変換される。これは A 君の受けた試験と同一の 平均と標準偏差。一律に得点が変換されるのだから、B 君の得点も変
© Copyright 2024 Paperzz