分散分析 解説

■分散分析
●分散分析(analysis of variance)とは
分散分析とは,測定値全体の分散を,いくつかの要因効果に対応する分散と,その残りの誤差分散と
に分けて検定を行う手法である.「検定・推定」は,一つの母集団または二つの母集団に関する計量値
と計数値の検定・推定であるが,分散分析は三つ以上の母集団について考えてみるものである.
データには元々ばらつき(誤差)があるが、分散分析では、意味のない変動(誤差変動)と意味のあ
る変動(要因によって変化した部分)の分散を分け、その分散比を求めることで、要因による変動が誤
差に比べて十分に大きければ要因による変動があると判定する方法である。
分散分析とは,その名前の通り,特性値(データ)のばらつきを分散で表わし,その分散をいろいろ
な要因ごとに分解してみて,誤差の分散に比べて,とくに大きな影響を与えている要因がどれであるか
を調べる方法である.
① 要因が変わることにより,特性値に影響があるかどうかを統計的に判断したい.
② ①の結果から,要因の変化によって特性値値に影響があることが確認されれば,要因をどの水準
に設定すべきかについて知りたい.
このような背景で統計的判断をしたい場合,分散分析を行うことにより有効な情報が得られる.
分散分析では、データ毎の平均値の違いを「バラツキ」とみなし、そのバラツキの大きさがデータの
誤差のバラツキより十分に大きいかどうかを判断することで、データの平均値に違いがあるかどうかを
検定することができる。このとき、バラツキの指標として分散を利用し、バラツキの違いを F 検定(右
片側検定)によって判断する。
特性値のばらつきを要因の水準間によるばらつきとその他のばらつきに分けることによって,要因の
水準間に違いがあるかどうかを調べるのが分散分析である.
分散分析は,新製品を企画・設計したり,工程の改善を行ったりするために,きわめて有効な手法で
ある.
分散分析により,次のような情報が得られる.
(1)要因効果の検定
無数に存在する原因のうち,ある特定の原因(必ずしも 1 つとは限らない)が,
特性値に対して無視できない程度の大きな影響を及ぼしているかどうかを確かめる.
(2)要因効果の推定
その原因の影響がどの程度のものであるかを知る.
(3)誤差の推定
その特定の原因を取り除く諸原因,すなわち,小さな影響しか与えていないと考えているものが,
全体としてどの程度の影響を及ぼしているかを知る.
-1-
●分散分析の種類と適用
分散分析法には,さまざまな方法がある.ここでは因子の数による分類を示す。
この方法は,実験の計画に際して取り上げる因子の数によって分類するものである。
(1) 一元配置法(一元配置分散分析):取り上げた因子の数が1つの場合
(2) 二元配置法(二元配置分散分析):取り上げた因子の数が2つの場合
(3) 三元配置法(三元配置分散分析):取り上げた因子の数が3つの場合
三元配置法以上のものを多元配置法と総称する場合が多い。
同じ条件で実験が繰り返されたものを「繰返しのある二元配置法」「繰返しのある多元配置法」とい
うが、この場合は、因子間の交互作用の有無を検討することができる。
★代表的な分散分析 イメージ図
-2-
★一元配置法
“一元配置法”とは,実験に因子を1つだけ取り上げ,その因子の水準において複数回の繰返しを行
う計画である.従って、この計画を適用する場面としては、
① 多くの要因効果の中で、特性値に対し,とくに大きな影響を与えていると思われる1因子の効果
を調べたいとき
② 要因分析がある程度進んで、残った要因の中で、最も大きな因子についての影響を調べたいとき
などである。
一元配置法では,因子の水準数,各水準ごとの繰返し数に制限はなく、任意に選択できるが、一般的
には3~5水準,繰返し数は3~10にとられる。
一元配置法では、因子の各水準ごとの繰返し数は異なってもよいが、一定にする方が解析しやすい。
★繰り返しのない二元配置法
“二元配置法”とは,2 つの因子を取り上げ,因子 A を l 水準,因子を m 水準とり,両因子の各水準
のすべての組合せ条件において実験を行うものである.各組合せ条件においてそれぞれ 1 回ずつ実験を
行う計画は「繰返しのない二元配置法」といい,各組合せ条件において複数回の繰返しを行う計画を「繰
返しのある二元配置法」という.
繰返しのない二元配置法は,2 因子交互作用が誤差と交絡し,その効果の検出ができない.したがっ
て,2 因子交互作用が考えられないか,過去の経験などで無視できるという場合のみに用いる.
★繰り返しのある二元配置法
因子を 2 つ取り上げ,両因子の各水準のすべての組合せ条件で,複数回の繰返しを行う実験を繰返し
のある“二元配置法”といい,繰返しのない実験に比べて以下の利点がある.
① 交互作用の効果を求めることができる.
② 誤差項と交互作用を分離できる.
③ 繰返しのデータから,誤差の等分散性のチェックができる.
2 因子交互作用が無視できないと考えられる場合には,繰返しのある二元配置法を用いなければなら
ない.
-3-
★主効果と交互作用
実験によって得られたデータには,取り上げた因子の単独の影響(主効果),実験の場の影響(誤差)のほ
かに,因子と因子の組合せの影響が現われる場合がある.
因子 A と B の主効果のみが独立に加わる場合には,因子 A の水準が異なっても因子 B の効果は変化
しない.しかし,因子 A の水準が異なると因子 B の効果が変化するとき,因子 A と B との間には交互
作用があるといい,このような因子の組合せによる影響を“交互作用効果”(A×B)と呼ぶ.
下図に、交互作用のない場合と交互作用のある場合のデータのグラフを示す.
繰返しのない二元配置法では,総平方和は主効果の平方和と誤差平方和に分解されるだけで,交互作
用が存在していても,その効果は誤差と交絡し分離できない.したがって,交互作用の有無を検出する
には,繰返しのある二元配置法を計画し, 総平方和を,因子 A の平方和,因子 B の平方和,交互作用
A×B の平方和および誤差平方和に分解する必要がある.
グラフを見ることによって,主効果,交互作用効果の有無を推察することもできる.
まず,主効果があるとは,各因子の水準間で差があるということであり,グラフでは,
(Al 水準の平均値)と(A2 水準の平均値)とに差がある
(B1 水準の平均値)と(B2 水準の平均値)とに差がある
場合になる.
一方,交互作用があるとは,A(B)の効果が,B(A)の水準によって異なるということであり,たとえば,
Bl 水準では Al 水準のほうが小さい値なのに,B2 水準では A2 水準のほうが小さくなるなどの現象が現わ
れる.グラフでは,層別した 2 本の直線が平行でない状態を示すことになる.
-4-
●分散分析の手順
分散分析は、次の手順で行われる。
手順 1 仮説を立てる
帰無仮説 H0:因子の水準間による特性値の差はない
対立仮説 H1:因子の水準間による特性値の差がある
手順 2 検定統計量の計算
各因子の平方和,自由度,分散と誤差との分散比を計算する.
手順 3 分散分析表の作成と判定
分散分析表により、検定統計量と帰無仮説の棄却域を比較して、予め設定した有意水準に対し
て有意であるかどうかを判断し、因子の特性値への影響度を判定する。
●分散分析表
Excel 分散分析ツールでは、例えば、繰り返しのある二元配置分散分析では、その解析結果として、
次のような「分散分析表」が出力される。
変動要因
標本
列
交互作用
繰り返し誤差
変動
39.58333
226
11.75
42
自由度
2
3
6
12
合計
319.3333
23
分散
19.79167
75.33333
1.958333
3.5
観測された分散比
5.654761905
21.52380952
0.55952381
P-値
0.01861603
4.04196E-05
0.754625524
F 境界値
3.885294
3.490295
2.99612
「分散分析表」に関して、一般図書の解説資料では、次のような表現で解説されている。
要因
因子 A
因子 B
交互作用
A×B
誤差 E
合計
平方和 S
SA
SB
自由度 φ
φA
φB
平均平方 V
VA=SA/φA
VB=SB/φB
分散比 F0
F0(A)=VA/VE
F0(B)=VB/VE
有意確率 P
Pr(F≧F0(A))
Pr(F≧F0(B))
棄却域境界値
F(φA,φE;α)
F(φB,φE;α)
SA×B
φA×B
VA×B=SA×B/φA×B
F0(A×B)=VB/VE
Pr(F≧F0(A×B))
F(φA×B,φE;α)
SE
ST
φE
φT
VE=SE/φE
●分散分析結果の判定方法
観測された分散比(検定統計量 F0)と F 境界値(棄却域)を比較して、次のように判定する。
1) 観測された分散比(検定統計量 F0) ≧ F 境界値 であれば、
有意水準 α で、有意と判定し、A の効果があるとみなす。
**有意水準α=1%であれば、「高度に有意である」
*有意水準α=5%であれば、「有意である」
2) 観測された分散比(検定統計量 F0) < F 境界値 であれば、
有意水準 α で、有意でなく、A の効果があるとはいえない。
3) P-値(有意確率)は観測された分散比(検定統計量 F0)が有意となる最小の確率である。
**P-値≦0.01 であれば、有意水準α=1%で高度に有意である。
*0.01<P-値≦0.05 であれば、有意水準α=5%で有意である。
P-値>0.05 であれば、有意とはいえない。
-5-
●Excel 分析ツールによる分散分析
例題による使い方の解説
Excel 分散分析ツールによる解析事例を以下に示す。
→
分散分析1:一元配置
例題と解説 参照
→
分散分析2:繰り返しのない二元配置 例題と解説 参照
→
分散分析3:繰り返しのある二元配置(交互作用なし)
例題と解説 参照
→ 分散分析3:繰り返しのある二元配置(交互作用あり)
例題と解説 参照
以上
-6-