t 検定,1 元配置分散分析,2 元配置分散分析の関連と使い分けについて

t 検定,1 元配置分散分析,2 元配置分散分析の関連と使い分けについて
ここでは,上記のように,t 検定(t-test),1 元配置分散分析(one-way analysis of
variance;one-way ANOVA)1,2 元配置分散分析(two-way ANOVA)の関連とその使い
分けについて解説する.説明の関係上,いずれも対応のない場合に限る.
1.基本的な区別
t 検定,1 元配置分散分析,2 元配置分散分析の基本的な区別は,表 1 の通りである2.す
なわち,2 群の母平均値の差の検定には t 検定を用い,3 群以上の平均値の差の検定には分
散分析法を用いる3.
なお,平均値の差の検定の詳細については,統計学の文献を参照のこと.
表 1.従属変数の種類等と検定法の選択
従属変数
対象とな
独立変数
の種類
る統計量
の数
条件数4
対応の有
用いられる検定方法
無
1
2
無
対応のない t 検定
有
対応のある t 検定
対応のない 1 要因分散
間隔尺度
平均値
1
2 以上
無
分析(各条件のデータ
数が等しい)
比率尺度
2
いずれも 2 い ず れ も
以上
無
ともに対応のない 2 要
因分散分析(各条件の
データ数が等しい)
2.分散分析法で平均値の差が検定できる仕組み
t 検定,分散分析ともに,各群の間に平均値の差はないという帰無仮説を立てて検定を行
う点は,共通している.しかし,t 検定では,次の式
t=
X1 - X 2
2
s1 + s 2
n -1
2
1 「1 元配置」は,
「一元配置」と書いても同じ.また,
「1 要因」としても同様.つまり,表 1 にあるよう
に,
「1 元配置」=「1 要因」は,いずれも,独立変数の数が 1 つであることを示す.
2 看護学研究方法論Ⅱの小笠原担当の統計学の資料も参照のこと.
3 ここでいう「2 群」
「3 群」は,当初から「2 群」
「3 群」の群分けがあることを意味する.元来 3 群ある
ところから 2 群を取り出して,t 検定を行うのも,後述(2.
)の理由から許されない.
4 この「条件数」を分散分析では,
「水準」とよぶ.
1
ただし,X1 , X 2 はそれぞれの平均を,s 1 , s 2 は同じく標準偏差を,また,n は例数を示す.
これは,2 群とも例数が同じ場合に,t を求める式を示したものである.
のように,直接,両者の平均を比較しているのに対し,分散分析では,平均そのものを直
接比較するのではなく,分散を比較して,平均値に差があるかどうかの検定を実施する.
ここでは,なぜこのように,分散を比較することで平均値の差が検定できるかという仕組
み(原理)を説明する.
表 2 に示した仮想データで説明する.データ 1 は水準間で平均差が小さい実験データ,
データ 2 は平均差が大きい実験データである.
表 2 各水準の平均と標準偏差
データ 1
データ 2
水
被験者
平
均
標準偏差
準
水
準
1
2
3
1
2
3
7
8
6
3
7
5
5
6
7
4
9
4
7
6
5
4
6
6
7
7
6
2
5
6
9
4
3
5
6
8
7.0
6.2
5.4
3.6
6.6
5.8
1.4
1.5
1.5
1.1
1.5
1.5
被験者
平
均
標準偏差
(注)標準偏差は不偏分散の正平方根
データの説明
2 つのデータについて,水準ごとに測定値のヒストグラムを描いたものが,図 1(次ペー
ジ)である.通常は,標本のレベルでは水準ごとに分散の大きさは異なるが,母集団レベ
ルでは各水準の分散(群内分散,級内分散)は等しいと仮定する(等分散の仮定)……図 1
も,等分散を仮定した,理論的分布が描いてある.
2
3
被験者が受けた実験効果は,水準内で等しいとみなすので,実験効果の相対的な大きさ
を各水準の平均で表すことが可能→各水準の平均を実験効果とみなし(正確には,水準の
平均=全体平均+実験効果),実験効果のヒストグラム(図 2;前ページ)を描いた……な
めらかな曲線は描けないが,そのイメージは図 2 に付した曲線である.この分散を群間分
散(級間分散)という.水準間の実験効果が異なるほど,平均の違いが大きくなり,それ
に応じて群間分散も大きくなる.
群間分散と群内分散とを比べる……分散分析法の論理
データ 1 では,群間分散の方が大きいものの,きわめて大きいほどではない.
これに対し,データ 2 の方は,群内分散に比べ,群間分散がかなり大きい.
測定値の変動を,群内分散と群間分散とに分け,群内分散に対する群間分散の比(F 比と
呼ぶ)がとりわけ大きければ,水準間の平均差も大きい,i.e.水準間の実験効果の現れ方が
異なるのではないかと考える
*これを実際に計算し,まとめたものが,次ページの表 3 である
表 3 計算の結果
群間分散
F比
群内分散
データ 1
3.200
2.167
1.477
データ 2
12.067
1.933
6.241
3.t 検定と分散分析の使い分けが必要な理由
3 群以上の間で平均値の差の検定を行う場合には,表 1 に示したように,t 検定は使って
はならない.その理由は,多数の群間で t 検定を反復すると,1回の検定で犯す小さな誤り
が,累積して大きな誤りを起こす可能性が生じるからである5.
例:a,b,c の 3 群の間で平均値の差を検定する
これを t 検定で調べるとすると,a 対 b,b 対 c,c 対 a の 3 回検定を行うことになる.
5%の有意水準で検定すると,仮説が正しくないのに正しいとする第 1 種の過誤を犯す
可能性が,1-(1-0.05)3=0.142625 となり,全体として甘い検定(危険率 14%で検
定)をしたことになる.同じことを 10 組でやれば,約 0.40 となり(危険率 40%),ほ
とんど意味をなさないことになる.
以上のような理由から,3 群以上の間での平均値の差の検定は分散分析を使用する.
5
推測統計学における,第 1 種の過誤と第 2 種の過誤(Type Ⅰ error and Type Ⅱ error)がそれである.
これらについては,この資料の最後に補足を示す.
4
4.t 検定と分散分析の関係
t 検定は,Student の t 分布(t-distribution)を用い,また,分散分析は F 分布
(F-distribution)を用いて検定を行う6.F 分布において,分子の自由度が 1 の場合には,
t2=F という関係が成立することが知られている(ただし,t は両側分布,F は片側分布で
あり,かつ,F 分布の分母の自由度は t 分布のそれに等しい場合).したがって,2 群の平
均値の差の検定を行う際には,t 検定によっても,分散分析によっても同じ結論が得られる
ことになる.
これを次の例で確認する:
騒音の大きさが計算作業の成績に及ぼす効果を検討する.低騒音・高騒音の 2 条件を
設定し,8 名ずつの被験者をランダムに抽出し,それぞれの条件に割り当てて実験を行
った結果を表 4 に示した.両群間で有意差が認められるかどうか確かめる
表 4 計算作業の成績
実験条件
低騒音
高騒音
78
76
70
72
66
60
76
72
78
70
76
72
88
84
76
70
均
76.0
72.0
標準偏差
6.00
6.24
被験者
平
1)両群間の分散の差の検定
t 検定は,両群の母分散が等しいか否かで,具体的に適用する方法が異なるので,事前に
F 検定を実施して確かめる.
F=
6.24 2
= 1.08
6.00 2
F 値が上記のように,1.08 となり,5%水準の対応する自由度の臨界値 4.99 より小さい
ので,両群間で分散が等しいという帰無仮説を棄却することはできない.したがって,低
騒音群と高騒音群との間に,分散の差はない(分散は等質である)とみなす.
6
F 分布は,分散分析以外に,t 検定を行う際に,2 群の分散に差がないことを確かめる F 検定にも用いら
れる.
5
2)t 検定の実施
分散の等しい 2 群の間の母平均値の差の検定による.両群の例数が等しいので,次の式
で t を求める:
t=
X1 - X 2
2
s1 + s 2
n -1
2
=
76.0 - 72.0
6.00 2 + 6.24 2
8 -1
= 1.22
この t 値は,対応する自由度=14 の t 分布の両側確率 5%の臨界値(2.14)より小さいの
で,両群の平均値が等しいという帰無仮説は棄却できない.
3)分散分析による確認
要因は騒音の高低条件の 1 つであり,要因の水準は高・低の 2 つであるので,1 元配置分
散分析を用いる.分散分析では,
SST=SSA+SSWC
ただし,SST は全体の変動,SSA は実験要因による変動(条件
間の変動),SSWC は誤差の変動(条件内の変動)
であるので,順次これらの数値を求める.
SS T = åå (y ij - y ) = 664
m
n
2
j=1 i =1
*全体の平方和(全体の平均と個々のデータの差)をそれぞれ 2 乗して,加算する)
→これを全体の例数で割れば,全体の分散となる
m
SS A = å n (y n - y ) = 64
2
j=1
*実験要因による平方和
(条件ごとの平均と個々のデータの差をそれぞれ 2 乗して,
加算し,条件数を乗ずる)
m
SS WC = å n j s j = 42.86
2
j=1
*誤差部分の平方和(水準数に,条件ごとの標準偏差を 2 乗したものを乗じ,それ
らを加算したもの)
表 4 のデータを 1 元配置分散分析で検定した結果をまとめた「分散分析表」は,表 5 の
通りである.自由度が 1,14 の場合の上側確率 5%の F の値は,4.60 であるので,この場
合やはり,帰無仮説は棄却できない.
6
表 5 分散分析表
SS
変動因
条件差
df
MS
64
1
64.00
42.86
誤
差
600
14
全
体
664
15
F
1.49
4)t 検定と分散分析の比較
上記 1)~3)により,
t2=1.222≒1.49=F
という関係が成り立っている.ただし,四捨五入など,計算誤差により数値は完全に一致
しているわけではない.
したがって,t 検定を行っても,分散分析を行っても結論は同じになる.
5.分散分析表の見方
ここでは,分散分析表(分散分析の結果は,以下の例のように表としてまとめて示すこ
とが多い.これを分散分析表という)の見方,分散分析表に示された数値の意味や,その
求め方,また,分散分析に関連する主効果,交互作用効果,単純効果,多重比較(事後検
定)などについても説明する.データは,p.10 に示した表 8 のものを用いる.
1)1 要因分散分析の場合
表 6 完全無作為 1 要因分散分析表の例
変動要因
自由度
優越属性
2
平方和
平均平方
F
p
24.84
12.42
4.03
.025
3.09
残
差
42
129.60
全
体
44
154.44
平均平方(優越属性……独立変数,残差……誤差とも)=平方和÷自由度
優越属性の平均平方=優越属性の平方和÷優越属性の自由度=24.84÷2=12.42
残差(誤差)の平均平方=残差の平方和÷残差の自由度=129.60÷42=3.09
F 値=優越属性の平均平方÷残差の平均平方=12.42÷3.09≒4.03
臨界値との比較……F 分布の表で,相当する分子の自由度(df1)と分母の自由度(df2)
を探し,そのクロスする部分に示された数値が,その自由度での臨界値
7
その臨界値と得られた F 値とを比較し,F 値の方が大きければ独立変数の効果が有意で
あると判断できる
表 6 にある,df1=2,df2=42 では,F=6.03 が臨界値
得られた F 値=4.03 であるので,この例では有意差は認められない
2)2 要因分散分析の場合
表 7 完全無作為 2 要因分散分析表の例
変動要因
自由度
優越属性
2
相手の態度
属性×態度
平方和
平均平方
F
p
24.84
12.42
9.64
.001
2
62.98
31.49
24.43
.001
4
20.22
5.06
3.92
.010
1.29
残
差
36
46.40
全
体
44
154.44
平均平方の求め方は,1 要因の場合と同様
F 値の求め方も,基本的には 1 要因の場合と同様
主効果(main effect)……優越属性,相手の態度など,それぞれの要因ごとの効果が有意
と認められた場合,その要因の主効果があるという
交互作用効果(interaction effect)……優越属性と,相手の態度の要因を組み合わせた場合
には,それぞれの主効果を単純に加算しただけでは説明できない,組合せ独自の効果が認
められたとみなし,これを交互作用効果があるという.表 10 のデータをプロットすると,
図 3 のようになる.図 3 のように,各条件の平均値をプロットして,図示した場合に,平
行にならず,一方の要因(例えば,相手の態度)の効果のあり方,すなわち水準間の平均
値差が,他方の要因(優越属性)の水準によって異なるとき,「2 つの要因の間には,交互
作用がある」という■もし,プロットを結んだ線がすべて並行になれば,
「2 つの要因の間
には,交互作用はない」となる
単純効果(simple effect)……交互作用の検定の結果,「優越属性」の効果のあり方が「相
手の態度」が友好的か,敵対的か,ふつうかによって有意に異なることが明らかになった
ら,次には,「相手の態度」が友好的な場合には「優越属性」の効果はどうなっているか,
敵対的な場合はどうか,というように場合分けした問がでてくる.このような,ある要因
(例えば「相手の態度」)の各水準における,別の要因(たとえば「優越属性」)の効果の
ことを単純効果という
8
7
友好的
ふつう
敵対的
6
妬
み
感5
情
の4
評
定3
値
の2
平
均
1
0
容 姿
学 歴
優越属性
豊かさ
図3 妬み感情の評定値に及ぼす優越属性と態度の影響
3)事後の検定(post hoc test)または多重比較(multiple comparison)
3 群以上の群の間に有意な平均値差が得られたら,次には,どの群とどの群の間に有意差
があるのか,すべての群の間に有意差があるのか,ということを検討する.このように,
全体として有意な結果が得られた場合に,どの水準とどの水準との間に有意差があるか調
べる検定を事後の検定,または,多重比較という.当然,t 検定を使うことはできないので,
そのための特別な検定法が多数開発されている.
各種の多重比較の具体的な方法については,ここでは割愛するので,統計学の文献を参
照すること.
6.1 元配置分散分析と 2 元配置分散分析の比較
ここでは,1 元配置分散分析法と,2 元配置分散分析法とを比較するため,表 8 に示した
ような「妬み感情の測定データ」を例として考える.独立変数は,優越属性と,相手の態
度の 2 種類(2 要因)であり,従属変数は,妬み感情の評定値である.したがって,この場
合に平均値の差の検定を行うときには,2 元配置分散分析を用いる必要があり,1 元配置分
散分析を用いるのは誤りであるが,ここでは説明のため,あえて 1 元配置分散分析の結果
も示した.
優越属性の各条件における妬み感情の測定値の平均値を求めた結果を表 9 に示してある
9
(1 元配置分散分析では,これら 3 つの優越属性の間で有意差が認められるかどうかの検定
を行う).また,表 10 には,優越属性と相手の態度の組み合わせごとの妬み感情の測定値
の平均を示した(2 元配置分散分析で検定を行う場合に用いる)
.
表 11 には,完全無作為 1 要因分散分析表(completely randomized one-way ANOVA)
を,また,表 12 には,完全無作為 2 要因分散分析表(completely randomized two-way
ANOVA)を示した.両者を比較すると,全体の平方和及びその自由度(表 11 と 12 の a)
と,優越属性の平方和と自由度は,2 つめの要因である「相手の態度」を加えても,加えな
くても同じ値になっている(表 11 と 12 の b)
.
表8
表 9 優越属性の各条件における妬み感情の測定値の平均と標準偏差
優越属性
平均
標準偏差
容
姿
3.87
1.96
学
歴
2.07
0.85
豊かさ
2.73
2.02
全
2.89
1.85
体
10
表 10 優越属性と相手の態度の組み合わせごとの妬み感情の測定値の平均と標準偏差(括
弧内)
優越属性
容
学
姿
歴
豊かさ
全
体
相手の態度
友好的
敵対的
ふつう
2.40
6.00
3.20
(1.02)
(1.419)
(1.17)
1.80
2.40
2.00
(0.40)
(1.02)
(0.89)
1.20
5.20
1.80
(0.98)
(1.17)
(0.75)
1.80
4.53
2.33
全体
3.87
2.07
2.73
2.89
表 11 完全無作為 1 要因分散分析表の例
変動要因
自由度
優越属性
2
平方和
平均平方
F
p
24.84
12.42
4.03
.025
3.09
平均平方
F
p
残
差
42
129.60
全
体
44
154.44
b
表 12 完全無作為 2 要因分散分析表の例
変動要因
a優越属性
自由度
c
平方和
2
24.84
12.42
9.64
.001
相手の態度
2
62.98
31.49
24.43
.001
属性×態度
4
20.22
5.06
3.92
.010
1.29
残
差
36
46.40
全
体
44
154.44
その結果,1 要因の場合(表 9-4)の残差の平方和は,2 要因の場合(表 9-5)の 2 つ
めの要因の主効果,交互作用及び残差の 3 つの平方和の和に等しくなる(表 11 と 12 の c)
.
つまり,要因 A のみのときの残差の平方和を SSe1 とし,要因 B も加えて 2 要因としたと
きの残差平方和を SSe2 とすると,次の関係が成り立つ:
SSe1=SSB + SSAB + SSe2
このように,2 要因にしたときの残差の平方和(SSe2)は,付加した 2 つめの要因の主効
果(SSB)及び 2 つの要因間の交互作用効果(SSAB)が大きい程度に応じて,1 要因の場合
の残差の平方和(SSe1)より小さくなる……残差平方和が小さくなることは,セル内の分散
11
が小さくなる……セルごとの平均の標準誤差(standard error)7が小さくなり,その結果,
要因の水準ごとの平均(セル平均をさらに平均したもの)の標準誤差も小さくなり,要因
の効果を検定するときの検定力8が高くなる
F 値の大きさは,残差の平方和が小さくなることにより,この小さい残差の平方和を分母
に含む F 値が大きくなるので,有意になりやすくなる.
ただし,自由度も,前ページの式に対応する関係があるため,2 要因の場合の残差の自由
度は 1 要因の場合に比べ小さくなるので,F 統計量の分母である残差の平均平方
MS e =
SS e
N - ab
が必ず小さくなるとは限らない.しかし,多くの場合,自由度の減少の割合よりも平方和
の減少の割合の方が大きくなるので,このことはほぼ成り立つと考えてよい.ここでの例
においても F 統計量の値は,1 要因のときの 4.03 に対して 2 要因のときは 9.64 と大きな値
になっている.
7
standard error.標本統計量の標準偏差をいう.ここでは,平均が問題となっているので,平均の分布
の標準偏差になる.
8 power.標本において有意な結果が得られる確率を検定力という.あるいは,母集団において平均値差
があるときに,標本平均を用いて検定した場合に,それを正しく検出できる確率.後者の場合,検出力と
もいう.検定力は,母集団における相関係数の大きさや,平均値差の大きさによると同時に,どのくらい
の標本を調べるか(サンプル・サイズ)にもよる,一種の関数値である.詳細は,南風原(2002)などを
参照.
12
7.第 1 種の過誤と第 2 種の過誤(Type Ⅰ error and Type Ⅱ error)
第 1 種の過誤(Type Ⅰ error )……帰無仮説棄却における過誤
帰無仮説の棄却にあたっては,事実を正確に反映する可能性(適切な棄却)と,しない
可能性(不適切な棄却)とがある
帰無仮説の不適切な棄却を第 1 種の過誤という……実際には,群間の差が偶然の変動に
よるのに,棄却した場合
第 2 種の過誤(Type Ⅱ error)……帰無仮説採択における過誤
帰無仮説の採択にあたっても,事実を正確に反映する可能性(適切な採択)と,しない
可能性(不適切な採択)とがある
帰無仮説の不適切な採択を第 2 種の過誤という……実際には,群間の差は偶然以外の要
因(独立変数など)による変動でありながら,採択した場合
表 13 第 1 種の過誤と第 2 種の過誤
実際の状態
偶然が原因
棄却の失敗
原因は偶然でない
第 2 種の過誤
適切な採択
帰無仮説に関する判断
(不適切な採択)
第 1 種の過誤
棄却
(不適切な棄却)
適切な棄却
8.参考文献
1.森敏昭・吉田寿夫(編)
(1990)
:心理学のためのデータ解析テクニカルブック,北大路
書房.
2.南風原朝和(2002):心理統計学の基礎―統合的理解のために―.有斐閣アルマ(有斐
閣)
.
3.吉田寿夫(1998):本当にわかりやすいすごく大切なことが書いてあるごく初歩の統計
の本,北大路書房.
4.芝祐順・渡辺洋・石塚智一(編)(1984):統計用語辞典.新曜社.
5.繁桝算男・柳井晴夫・森敏昭(1999):Q&A で知る統計データ解析―Dos and Don’ts
―.サイエンス社.
6.後藤宗理・大野木裕明・中澤潤(2000)
:心理学マニュアル 要因計画法.北大路書房.
*ここでの解説は,主に,文献 1 と 2 によった.一部の資料は,5 から使用した.
平成 17 年 12 月 5 日改訂
13