添付資料 - TOKYO TECH OCW

講義にて配布した資料の抜粋・縮小版です
平成22年度 統計工学
平成22年度 統計工学
構造模型によるデータ構造の理解
•
一元配置データ
平成22年度
統計工学 講義資料(11)
A1
A2
x11
x21
x12
x22



Aa
xa1
xa 2
一元配置データが無作為に抽出・収集された場合
全部で
1つのデータを取るたびに因子Aの水準を設定し直す
 x1r
 x2 r
データ構造
X ij   i +  ij  i  1,  , a , j  1,  , r 

xij
ar 回のデータ収集の無作為化
–
–
X ij   i +  j  xar
A1の j 番目の値における誤差と A2の j 番目の誤差には
何ら共通性がないことに注意!
要因効果抽出のための分解

~統計的推論:分散分析Ⅱ~
1   2    a
a
構造模型
X ij     i   ij
 i     i
制約:  1   2    a  0
 i についてはこの制約により a  1 個のデータで決定される
ことから,自由度が a  1 となる
•
「Aの水準間で平均値がすべて等しい」という命題は・・・
a
  
i 1
平成22年度 統計工学
平成22年度 統計工学
二元配置分散分析の考え方
【二元配置データ
二元配置データ】
】
•
因子:特性値に影響を及ぼす要因
•
–
要因1:因子A(水準数 a)
–
要因2:因子B(水準数 b)
A1
A

繰り返し数:r
xijk ・・・水準 AiBj における k 番目の観測値
0
(C) Sadami SUZUKI
B1
x111

x11r
B




Bb
x1b1

x1br



(繰り返しのある)
特性値:収集するデータ(観測値)
2
(C) Sadami SUZUKI
二元配置分散分析 ( Two-way ANOVA )
•
i
Aa
xa11

xa1r



バラツキの分解
• (全体の平均からのバラツキ)=
(因子Aのバラツキ)+(因子Bのバラツキ)
+(因子Aと因子Bの組合せによるバラツキ)
+(残りのバラツキ)
xab1

xabr
因子Aのバラツキ
・・・因子Aの水準間の違い;因子Aの主効果
因子Bのバラツキ
・・・因子Bの水準間の違い;因子Bの主効果
因子の組合せによるバラツキ
・・・因子Aと因子Bの組合せによる違い;交互作用
・・・ある水準の組み合わせ(AiBj)の中で
残りのバラツキ
個々のデータがどれほどバラついているか
– 残差,誤差,個人差
(C) Sadami SUZUKI
(C) Sadami SUZUKI
平成22年度 統計工学
平成22年度 統計工学
二元配置データにおけるバラツキの分解
•
二元配置データにおけるバラツキの分解
•
2因子を組合わせて考えると・・・
繰り返しのある二元配置データ
B1 
二因子を組み合せ因子とした場合
Bb
 x11r
A1 B1 x111 x111  x1b1
A1 B2 x121  x12 r

A1   


Aa Bb xab1  xabr

x11r  x1br
(総平方和)= (因子Aの主効果平方和)+(因子Bの主効果平方和)
+(因子Aと因子Bの交互作用平方和)
+(残差平方和)
a
b
r
S T      xijk  x 
2
i 1 j 1 k 1
a
b
a
b
a
b
r
 br
b   xi  x   ar   x j  x   r    xij  xi  x j  x       xijk  xij 
i 1
2
j 1
2
2
i 1 j 1
2
i 1 j 1 k 1
Se

  
xa11  xab1

 Aa 
平方和分解
一元配置データと同様の構造に
帰着させることが可能
S T  S A  S B  S A B  S e
ST
S A B
S AB
SB
xa1r  xabr
SA
(C) Sadami SUZUKI
(C) Sadami SUZUKI
1
講義にて配布した資料の抜粋・縮小版です
平成22年度 統計工学
平成22年度 統計工学
二元配置分散分析(Two-way ANOVA)
二元配置分散分析(Two-way ANOVA)
Step3:検定に用いる統計量の選択とその分布に関する検討
•
Step3:検定に用いる統計量の選択とその分布に関する検討
SA
Se
考察の対象:残差平方和と比較した各平方和の大きさ・・・
SB
Se
【因子Aの主効果】
S A B
Se
【因子Bの主効果】
•
–
FA 
T  abr
b 1
–
総平方和の自由度:総サンプル数-1・・・
総平方和の自由度
–
因子Aの主効果平方和の自由度:(因子A水準数)-1・・・
因子Aの主効果平方和の自由度
–
因子Bの主効果平方和の自由度:(因子B水準数)-1・・・  B
因子Bの主効果平方和の自由度
–
因子Aと因子Bの交互作用平方和の自由度・・・
因子Aと因子Bの交互作用平方和の自由度
–
残差平方和の自由度・・・
残差平方和の自由度
–
A  a 1
FB 
 A B   A   B  ( a  1)(b  1)
–
F A B 
2
 全データ数 
i
i
平成22年度 統計工学
平成22年度 統計工学
  A での値の和 
 A でのデータ数 
i
  B での値の和 
 B でのデータ数 
a

i 1

b


  CT
r
j 1 k 1

a
•
ijk
2
r
    x
i 1 k 1
ar
ijk


  CT
全部で
a

 x1br
x11r 
b

i 1 j 1
ij
α に着目して
複数の因子を取り上げた際の要因効果についての整理
【 (例)2つの2水準因子の場合 】
b
【 行平均 】

j 1
b
  
2
b
A1 11 12
A2  21  22

  j 
i 1
ij
単一効果
a
・・・他の因子をある水準に固定したときの効果
–
固定した他の因子の条件に依存した効果
• 因子AのB1での単一効果
 21 - 11
 ij     i   j   ij
• 因子AのB2での単一効果
 22 - 12
a
b
 0,    j   0, 
j 1
B1 B2
a
【 列平均 】
ij
2つ以上の要因を同時に取り上げた場合・・・
それぞれの要因効果は単一効果という形のみでは評価不能
 i  1, , a, j  1, , b, k  1,, r 
それぞれの主効果および交互作用なしという命題は・・・
i
となる確率
FA B  V A B / Ve
平成22年度 統計工学
 x12 r
A1 B2 x121 a
e  ab ( r  1)
FB  V B / Ve
平成22年度 統計工学
X ijk     i   j   ij   ijk
i 1
T  abr  1
 A B  ( a  1)(b  1)
F比(F値)
FA  V A / Ve
(C) Sadami SUZUKI
構造模型
•
ST
B  b  1
平均平方(不偏分散)
VA  S A / A
VB  S B /  B
V A  B  S A  B /  A B
Ve  S e /  e
(C) Sadami SUZUKI
•
 i  
ab
 xabr
xa1r A1 B1 x111  x11r
自由度
abr 回のデータ収集の無作為化
 ij   ij   i     j  

A  a 1
α
 i  i  
 j   j  
xa11  xab1
SA
SB
S A B
Se
有意水準 で主効果・交互作用の検定を行う
X ijk   ij +  ijk
【 総平均 】
平方和
A
B
A B
e
F*  Fnm ( )
データ構造
Bb
要因
T
二元配置データが無作為に抽出・収集された場合
二元配置データ

 

 xabr
Aa Bb xab1 分散分析表の活用
2
br
j 1


  CT
•
S e  S T  S AB
–

Aa   CT 
ijk
S A B  S AB  S A  S B
i 1 j 1 k 1
構造模型によるデータ構造の理解
j
r
k 1
  x
j
r
    xijk 2  CT
  
 CT 
2
r
i
SB 

b
i 1 j 1
b

自由度 (a-1)(b1)(b-1),
1), ab
ab((r-1) の F 分布に従う
(C) Sadami SUZUKI
j
2
 x1b1
x111 S A B /  A B
S e / e
(C) Sadami SUZUKI
    x
 CT 
2
SA 
S T    個々の値   CT
A1  
j
2
2

a
  A B での値の和 
 A B でのデータ数 
2
S AB 
2.総平方和の計算
B1 自由度 b-1, ab
ab((r-1) の F 分布に従う
Step4:検定量を用いて仮説が正しいか否かを判定する
3.各平方和の計算
  個々の値 
b
S B / B
S e / e
二元配置分散分析(Two-way ANOVA)
1.修正項の計算
a
自由度 a-1, ab
ab((r-1) の F 分布に従う
因子Aと因子Bの交互作用
e  T   A   B   A B  ab ( r  1)
 a b r

    xijk 
i 1 j 1 k 1


abr
S A / A
S e / e
因子Bの主効果
 b 1
実際に各平方和を計算するときは,次のようにすると便利である
CT 
因子Aの主効果
【因子Aと因子Bの
交互作用】
平方和計算の実際
•
検定量:各主効果,交互作用の平方和と残差平方和をそれぞれの自由度で割った値(平均平方)の比(F比)
2
i 1 j 1
  
ij
2
0
(C) Sadami SUZUKI
主効果
・・・単一効果の他の因子の条件(水準)間での平均
• 因子Aの主効果
交互作用
  21  11     22  12     21   22    11  12 
2
2
・・・単一効果の他の因子の条件(水準)間での違い
• 因子AとBの交互作用
 
21
 11     22  12     21  12    11   22 
(C) Sadami SUZUKI
2