経時測定データの分散分析

応用統計学
Vol. 33, No. 3 (2004), 257–277
研究論文
経時測定データの分散分析
大塚製薬株式会社
滝 沢
京 子
大阪大学 基礎工学研究科
白 旗
慎 吾
高槻高校
小 笹
清 司
要 旨 経時測定データの特徴は対象を時間順に繰り返し測定することであり,必
然的に観測値間に相関が生じる.つまり各対象の複数個の測定値間には相関がある
と考えられるため,通常の独立性を仮定した手法を用いることは適切ではない.実
際,医薬分野における臨床試験に関しては,倫理的な問題やメーカーのコストの問
題などから同一対象から繰り返し観測値をとるなどして必要最小限の試験規模に抑
える必要がある.したがって,経時測定データの解析法の開発は応用上きわめて重
要である.本論文では,一定の期間において,複数の対象についての複数の項目を
測定する場合の多変量経時測定データに対する解析法を考える.また,解析の目的
は母集団であり各個体の把握ではない点から,個体に関連した部分を変量とする変
量モデルを想定し,群効果,相効果,項目の効果,そして相関の有無等を検定する
分散分析法,およびそのパラメータの推定法を与える.
1.
序
一般に,データ解析では観測値間の相関の有無が解析の困難さを左右することが多い.経時測
定データの特徴は,対象を時間順に繰り返し測定することであるため,必然的に相関が生じ,そ
の解析は困難である.特に,医学・生物学における実験・観測データに関しては,その規模を必
要最小限に抑える必要があり,同一対象から繰り返し観測値をとることが多い.したがって経時
測定データの解析法の開発は応用上きわめて重要である.
経時測定データ解析では,各対象の複数個の測定値間には相関があるために通常の独立性を仮定
した手法を用いることは適切ではない.一般には,探索的解析(Tukey (1977), Mosteller and Tukey
(1977))として,グラフィックスや平滑化によりデータの動向を把握し,応答についてモデル化を
行い,平均構造についての推測を行う.このとき同一対象内の観測値には相関があることに注意
し,相関構造のモデル化も必要である.また,誤差の共分散構造に特定の仮定をおかずに多変量解
,ある種の仮定の下での
析法を応用する方法(Hand and Taylor (1987), Crowder and Hand (1990))
一変量分散分析法(Rouanet and Lepine (1970), O’Brien and Kaiser (1985), Anderson (1991)),任
意の共分散構造の下での回帰モデルによる解析(Dempster, Laird and Rubin (1977)),非線形モデ
ルによる解析(Crowder and Tredger (1981), Crowder (1983))など多くの解析法が提案されている.
本論文では,複数の対象に関して一定の期間で複数の項目を測定する場合を想定する.また,
257
経時測定データの分散分析
解析の目的は母集団であり,各個体の把握ではない点から,個体に関連した部分を変量とする変
量モデルを想定する.このようなモデルで我々は群効果,相効果,相関の有無等を検定する分散
分析法,およびパラメータの推定法を考える.変量モデルは直感的にもっともらしく,かつ分散
分析法の構成が可能であることから,有力な解析法であろう.
本論文では,以上の経時測定データの特徴を考慮に入れ,多変量経時測定データに対する解析
法を与える.
2.
モデルと記号の定義
a 個の個体(individual)の c 個の項目(item)もしくは変量を b 個の時点(occasion)にわたって測
定したデータを考える.個体はランダムに選ばれ,個体それぞれについて興味はなく,個体の属
する群の間,測定された時点の属する相の間や項目間の違いに興味があるとする.
経時測定データには前述したようないくつかの解析方法があるが,このようなデータの解析に
は分散分析が適当であろう.Yi jk を第 i 番目の個体,第 j 番目の測定時期,第 k 番目の項目のデー
タとし,次の構造を仮定する.
Yi jk = µi jk + Zi jk + ei jk ; i = 1, · · · , a, j = 1, · · · , b, k = 1, · · · , c.
(1)
Yi jk は個体,すなわち i が異なれば独立と仮定する.µ–項は期待値の項を表し未知定数,Z–項は
ランダム効果を表し確率変数,e–項は誤差項を表し確率変数である.E(Zi jk ) = E(ei jk ) = 0, Z–項
と e–項は互いに独立と仮定する.また,Var(ei jk ) = σ2 , すなわち誤差分散は一定と仮定する.ま
た,Z–項および誤差については,すべて正規分布に従うとする.我々はこのモデルにいろいろな
構造,すなわち群間で個体の期待値の構造に差がない,時期の相間で期待値の構造に差がない,等
の仮説を考え,その分析のための分散分析表を導く.
まず群,相を考慮した多項目の最も複雑な場合の分散分析表を与え,その特別な場合について
考えることで,より簡単なモデルの場合の分散分析表を与える.個体は G 個の群(group)に分割
され g 番目の群は ag 個の個体から成るとし,時点は P 個の相(phase)に分割され p 番目の相には
b p 時点あるものとする.したがって
G
ag = a,
g=1
P
bp = b
p=1
である.また測定値の総個数を N = abc とおく.以後 g 番目の群に属する個体の番号の集合を
Gg = {a1 + · · · + ag−1 + 1, · · · , a1 + · · · + ag } と表す.同様に p 番目の相に属する個体の番号の集合
を P p = {b1 + · · · + b p−1 + 1, · · · , b1 + · · · + b p } と表す.観測値 {Yi jk },期待値項 {µi jk },変量効果項
{Zi jk } のそれぞれに関して,和をとった添え字の所は · に置き換えた記号を用いる.右肩に (g) や
(p), (g, p) があれば対応する群や相内の和である.また上に横線を引けば,全体,対応する群,相
での平均の意味である.例えば
Yi j· = ck=1 Yi jk ,
Y·(g)
i∈Gg Yi jk ,
jk =
(g,p)
Y··k = i∈Gg j∈P p Yi jk ,
Y···(g,p) = i∈Gg j∈P p ck=1 Yi jk ,
258
Ȳi j· = 1c ck=1 Yi jk ,
1 (g)
Ȳ·(g)
jk = ag Y· jk ,
(g,p)
Ȳ··k
=
Ȳ···(g,p) =
(g,p)
1
ag b p Y··k ,
1
(g,p)
ag b p c Y···
応用統計学 Vol. 33, No. 3 (2004)
等であり,µ–項,Z–項および以後定義されるそれらを分解した各項でも同様である.
2.1. 期待値の項のモデル
期待値の項 {µi jk } に関しては
µi jk = µ̄(g,p)
··k , i ∈ G g , j ∈ P p
(2)
(g,p)
と仮定する.すなわち同じ群,相に含まれる観測値は同じ期待値となり,µ̄··k
は第 g 群,第 p 相
での共通の期待値である.さらに
µi jk = µ + αIi + αO j + α Mk + βi j + γik + δ jk + ηi jk
(3)
と表す.αIi , αO j , α Mk , βi j , γik , δ jk , ηi jk はそれぞれ個体効果,時点効果,項目効果,個体 × 時点交
互作用効果,個体 × 項目交互作用効果,時点 × 項目交互作用効果,個体 × 時点 × 項目交互作用効
果を表す.仮定 (2) よりすべての i, j, k (i ∈ Gg , j ∈ P p ) に対して
(p)
αIi = ᾱ(g)
I· , αO j = ᾱO· ,
γik = γ̄·k(g) , δ jk = δ̄(p)
·k ,
βi j = β̄(g,p)
,
··
(g,p)
ηi jk = η̄··k
となる.さらに次の制約をおく.すべての i, j, k に対して
αI· = 0,
βi· = 0,
δ j· = 0,
αO· = 0, α M· = 0,
γ·k = 0, γi· = 0,
η· jk = 0, ηi·k = 0,
β· j = 0,
δ·k = 0,
ηi j· = 0.
2.2. 変量効果のモデル
変量効果については
Zi jk = Ui + Vi j + Wik
(4)
と表せると仮定する.Ui , Vi j , Wik はそれぞれ個体の変動,個体 × 時点交互作用の変動,個体 × 項
目交互作用の変動を表し,各項は互いに独立と仮定する.個体はランダムに選ばれているが,時
点と項目はランダムと想定しないので添え字に i を含まない項は考えない.これらはすべて期待
値は 0 とし,分散を
Var(Ui ) = σ2U , Var(Vi j ) = σ2V , Var(Wik ) = σ2W
とおく.
2.3. 全体のモデル
2.1, 2.2 より全体のモデルは次のようになる.i ∈ Gg , j ∈ P p に対し,
(p)
(g,p)
(g,p)
Yi jk = µ + ᾱ(g)
+ γ̄·k(g) + δ̄(p)
I· + ᾱO· + α Mk + β̄··
·k + η̄··k + U i + Vi j + Wik + ei jk .
またその間の相関構造は以下のようになる.
259
(5)
経時測定データの分散分析
Var(Yi jk )
Cov(Yi jk , Yi jk )
Cov(Yi jk , Yi j k )
Cov(Yi jk , Yi j k )
Cov(Yi jk , Yi j k )
=
=
=
=
=
σ2U + σ2V + σ2W + σ2 ,
σ2U + σ2V ,
σ2U + σ2W ,
σ2U ,
0,
k k ,
j j ,
j j , k k ,
i i .
なお,これらの分散,共分散の値は測定時点に無関係なので,近い測定時点間の相関が高いデー
タへの適用には限界があるかもしれない.
3.
帰無仮説
本稿では以下の帰無仮説を考える.なお以下の g, p, k は g = 1, · · · , G, p = 1, · · · , P, k = 1, · · · , c
すべてに渡る.
HαI
HαO
HαM
Hβ
Hγ
Hδ
Hη
HUVW
HU
HV
HW
:
:
:
:
:
:
:
:
:
:
:
ᾱ(g)
,
I· = 0,(群効果に差がない)
ᾱ(p)
=
0,
(相効果に差がない)
,
O·
α Mk = 0,(項目効果に差がない),
β̄(g,p)
= 0,(群 × 相交互作用効果がない),
··
γ̄·k(g) = 0,(群 × 項目交互作用効果がない),
δ̄(p)
,
·k = 0,(相 × 項目交互作用効果がない)
(g,p)
η̄··k = 0,(群 × 相 × 項目交互作用効果がない),
σ2U = σ2V = σ2W = 0,(ばらつきは誤差項のみに由来する),
σ2U = 0,(個体間にばらつきがない),
σ2V = 0,(個体 × 相交互作用効果にばらつきがない),
σ2W = 0,(個体 × 項目交互作用効果にばらつきがない).
これらの帰無仮説を検定するための分散分析表を作る.
4.
平方和の分解
全変動を分解しよう.
Yi jk − Ȳ··· = (Ȳi·· − Ȳ··· ) + (Ȳ· j· − Ȳ··· ) + (Ȳ··k − Ȳ··· )
+ (Ȳi j· − Ȳi·· − Ȳ· j· + Ȳ··· )
+ (Ȳi·k − Ȳi·· − Ȳ··k + Ȳ··· )
+ (Ȳ· jk − Ȳ· j· − Ȳ··k + Ȳ··· )
+ (Yi jk − Ȳi j· − Ȳi·k − Ȳ· jk + Ȳi·· + Ȳ· j· + Ȳ··k − Ȳ··· )
の両辺の 2 乗和をとる.左辺は
ST =
b c
a (Yi jk − Ȳ··· )2
i=1 j=1 k=1
260
応用統計学 Vol. 33, No. 3 (2004)
であり,右辺については次式が導かれる.
b c
a (Ȳi·· − Ȳ··· )2 +
i=1 j=1 k=1
+
b c
a (Ȳ· j· − Ȳ··· )2 +
b c
a i=1 j=1 k=1
(Ȳ··k − Ȳ··· )2
i=1 j=1 k=1
b c
a (Ȳi j· − Ȳi·· − Ȳ· j· + Ȳ··· )2
i=1 j=1 k=1
+
b c
a (Ȳi·k − Ȳi·· − Ȳ··k + Ȳ··· )2
i=1 j=1 k=1
+
b c
a (Ȳ· jk − Ȳ· j· − Ȳ··k + Ȳ··· )2
i=1 j=1 k=1
+
b c
a (Yi jk − Ȳi j· − Ȳi·k − Ȳ· jk + Ȳi·· + Ȳ· j· + Ȳ··k − Ȳ··· )2
(6)
i=1 j=1 k=1
≡ S I + S O + S M + S IO + S I M + S OM + S IOM .
(7)
ここで (7) の第 1 項から第 7 項それぞれは,(6) の第 1 項から第 7 項に対応しており,以降の分
解についても同様とする.また,S T は全変動,S I は個体間変動,S O は時点間変動,S M は項目
間変動,S IO は個体 × 時点交互作用,S I M は個体 × 項目交互作用,S OM は時点 × 項目交互作用,
S IOM は個体 × 時点 × 項目交互作用を測っている.
S I と S O については次の分解が成立する.
SI =
b c
a (Ȳ···(g) − Ȳ··· )2 +
i=1 j=1 k=1
SO
b c
a (Ȳi·· − Ȳ···(g) )2
i=1 j=1 k=1
≡ S G + S IG ,
b c
b c
a a =
(Ȳ···(p) − Ȳ··· )2 +
(Ȳ· j· − Ȳ···(p) )2
i=1 j=1 k=1
i=1 j=1 k=1
≡ S P + S OP .
ここで S G は群間変動,S IG は群内変動,S P は相間変動,S OP は相内変動である.ただし,
に
ついては表記の簡略さのために上記のような記載とした.例えば S G について,群 g での値を i
G について加えているが,これは,
g=1
i∈Gg
の意味であり,S G =
G
g=1
ag bc(Ȳ···(g) − Ȳ··· )2 である.
以後も同様であり,実際の計算式については表 1–表 3 で与える.
S IO については次の 2 種類の分解が成立する.ただし実際の検定ではどちらかのみで十分で
ある.
S IO =
b c
a (g)
2
(Ȳ·(g)
j· − Ȳ··· − Ȳ· j· + Ȳ··· )
i=1 j=1 k=1
+
b c
a (g) 2
(Ȳi j· − Ȳi·· − Ȳ·(g)
j· + Ȳ··· )
i=1 j=1 k=1
≡ S GO + S IG O ,
261
経時測定データの分散分析
S IO =
b c
a (Ȳi··(p) − Ȳi·· − Ȳ···(p) + Ȳ··· )2
i=1 j=1 k=1
b c
a +
(Ȳi j· − Ȳi··(p) − Ȳ· j· + Ȳ···(p) )2
i=1 j=1 k=1
≡ S IP + S IOP .
ここで,S GO は群間 × 時点交互作用,S IG O は群内 × 時点交互作用,S IP は個体 × 相交互作用,S IOP
は個体 × 相内交互作用である.S IO = S IP + S IOP の分解は本稿では使用しない.
S GO と S IG O については次の分解が成立する.
S GO =
b c
a (Ȳ···(g,p) − Ȳ···(g) − Ȳ···(p) + Ȳ··· )2
i=1 j=1 k=1
+
b c
a (g,p)
(Ȳ·(g)
− Ȳ· j· + Ȳ···(p) )2
j· − Ȳ···
i=1 j=1 k=1
S IG O
≡ S GP + S GOP ,
b c
a =
(Ȳi··(p) − Ȳi·· − Ȳ···(g,p) + Ȳ···(g) )2
i=1 j=1 k=1
+
b c
a (g,p) 2
(Ȳi j· − Ȳi··(p) − Ȳ·(g)
j· + Ȳ··· )
i=1 j=1 k=1
≡ S IG P + S IG OP .
ここで,S GP は群間 × 相交互作用,S GOP は群間 × 相内交互作用,S IG P は群内 × 相内交互作用,
S GOP は群間 × 相内交互作用である.S IP と S IOP も同様にして
S IP = S IG P + S GP ,
S IOP = S GOP + S IG OP
の分解ができる.
S I M と S OM については次の分解が成立する.
S IM =
b c
a (g)
(Ȳ··k
− Ȳ···(g) − Ȳ··k + Ȳ··· )2
i=1 j=1 k=1
+
b c
a (g)
(Ȳi·k − Ȳi·· − Ȳ··k
+ Ȳ···(g) )2
i=1 j=1 k=1
S OM
≡ S GM + S IG M ,
b c
a (p)
=
(Ȳ··k
− Ȳ···(p) − Ȳ··k + Ȳ··· )2
i=1 j=1 k=1
+
b c
a (p)
(Ȳ· jk − Ȳ· j· − Ȳ··k
+ Ȳ···(p) )2
i=1 j=1 k=1
≡ S PM + S OP M .
262
応用統計学 Vol. 33, No. 3 (2004)
ここで S GM は群間 × 項目交互作用,S IG M は群内 × 項目交互作用,S PM は相間 × 項目交互作用,
S OP M は相内 × 項目交互作用である.
S IOM については次の 2 種類の分解が成立する.実際の検定ではどちらかの分解のみを使用する.
S IOM =
b c
a (g)
(g)
(g)
2
(Ȳ·(g)
jk − Ȳ· j· − Ȳ··k − Ȳ· jk + Ȳ··· + Ȳ· j· + Ȳ··k − Ȳ··· )
i=1 j=1 k=1
+
b c
a (g)
(g)
(g) 2
(Yi jk − Ȳi j· − Ȳi·k − Ȳ·(g)
jk + Ȳi·· + Ȳ· j· + Ȳ··k − Ȳ··· )
i=1 j=1 k=1
≡ S GOM + S IG OM
b c
a (p)
(p)
=
(Ȳi·k
− Ȳi··(p) − Ȳi·k − Ȳ··k
+ Ȳi·· + Ȳ···(p) + Ȳ··k − Ȳ··· )2
i=1 j=1 k=1
+
b c
a (p)
(p)
(Yi jk − Ȳi j· − Ȳi·k
− Ȳ· jk + Ȳi··(p) + Ȳ· j· + Ȳ··k
− Ȳ···(p) )2
i=1 j=1 k=1
≡ S IPM + S IOP M .
ここで S GOM は群間 × 時点 × 項目交互作用,S IG OM は群内 × 時点 × 項目交互作用,S IPM は個体 × 相
間 × 項目交互作用,S IOP M は個体 × 相内 × 項目交互作用である.本稿では S IOM = S IPM + S IOP M
を用いる.
S GOM と S IG OM については次の分解が成立する.
S GOM =
b c
a (g,p)
(g)
(p)
(Ȳ··k
− Ȳ···(g,p) − Ȳ··k
− Ȳ··k
+ Ȳ···(g) + Ȳ···(p) + Ȳ··k − Ȳ··· )2
i=1 j=1 k=1
+
b c
a (g)
(g,p)
(p)
(Ȳ·(g)
+ Ȳ· j· + Ȳ···(g,p) + Ȳ··k
− Ȳ···(p) )2
jk − Ȳ· j· − Ȳ· jk − Ȳ··k
i=1 j=1 k=1
S IG OM
≡ S GPM + S GOP M ,
b c
a (p)
(g,p)
(g)
=
(Ȳi·k
− Ȳi··(p) − Ȳi·k − Ȳ··k
+ Ȳi·· + Ȳ···(g,p) + Ȳ··k
− Ȳ···(g) )2
i=1 j=1 k=1
+
b c
a (p)
(g,p)
(g) 2
(Yi jk − Ȳi j· − Ȳi·k
+ Ȳ··k
+ Ȳi··(p) − Ȳ···(g,p) − Ȳ·(g)
jk + Ȳ· j· )
i=1 j=1 k=1
≡ S IG PM + S IG OP M .
ここで,S GPM は群間 × 相間 × 項目交互作用,S GOP M は群間 × 相内 × 項目交互作用,S IG PM は群
内 × 相間 × 項目交互作用,S IG OP M は群内 × 相内 × 項目交互作用である.S IPM と S IOP M にも
S IPM = S GPM + S IG PM ,
S IOP M = S GOP M + S IG OP M
の分解ができる.
以上の平方和の計算結果を,数値計算に便利なようにまとめると表 1–表 3 を得る.ただし表
では
ST =
b c
a i=1 j=1 k=1
263
Yi2jk −
1 2
Y
N ···
経時測定データの分散分析
表 1.
SI
SG
S IG
SO
SP
主効果の分解
計算式
a
2
2
i=1 Yi·· /(bc) − Y··· /N
G
(g) 2
2
g=1 {Y··· } /(ag bc) − Y··· /N
SI − SG
b
2
2
j=1 Y· j· /(ac) − Y··· /N
P
(p) 2
2
{Y
}
/(ab
c)
p − Y··· /N
p=1 ···
S OP
SO − SP
c
2
2
k=1 Y··k /(ab) − Y··· /N
表 2.
2 因子交互作用の分解
SM
計算式
a b
2
2
i=1
j=1 Yi j· /c − Y··· /N − S I − S O
G b
(g) 2
2
j=1 {Y· j· } /(ag c) − Y··· /N − S G − S O
g=1
G P
(g,p) 2
2
g=1 p=1 {Y··· } /(ag b p c) − Y··· /N − S G − S P
S IO
S GO
S GP
S GOP
S GO − S GP
S IO − S GO
S IG P
S IG OP
S IP − S GP
S IO − S IP − S GO + S GP
a c
2
2
i=1 k=1 Yi·k /b − Y··· /N − S I − S M
G
c
(g) 2
2
g=1 k=1 {Y··k } /(ag b) − Y··· /N − S G − S M
S IG O
S IM
S GM
S IM − S GM
b c
2
2
j=1 k=1 Y· jk /a − Y··· /N − S O − S M
P c
(p) 2
2
p=1 k=1 {Y··k } /(ab p ) − Y··· /N − S P − S M
S IG M
S OM
S PM
S OM − S PM
S OP M
表 3.
3 因子交互作用の分解
計算式
S T − S I − S O − S M − S IO − S IM − S OM
G b c
(g) 2
2
j=1 k=1 {Y· jk } /ag − Y··· /N
g=1
S IOM
S GOM
S GPM
−S GO − S GM − S OM − S G − S O − S M
G P c
(g) 2
2
g=1 p=1 k=1 {Y·pk } /(ag b p ) − Y··· /N
−S GP − S GM − S PM − S G − S P − S M
S GOP M
S GOM − S GPM
S IOM − S GOM
S IG PM
S IPM − S GPM
S IG OP M
S IOM − S IPM − S GOM + S GPM
S IG OM
は省略している.表 1 は主効果,表 2 は 2 因子交互作用,表 3 は 3 因子交互作用である.
簡単だが面倒な計算の後,各平方和の期待値は以下で与えられる.
E(S T ) = DT + (a − 1)bcσ2U + (ab − 1)cσ2V + b(ac − 1)σ2W + (N − 1)σ2
= E(S I ) + E(S O ) + E(S M ) + E(S IO ) + E(S I M ) + E(S OM ) + E(S IOM ),
E(S I ) = DG + (a − 1)bcσ2U + (a − 1)cσ2V + (a − 1)bσ2W + (a − 1)σ2
= E(S G ) + E(S IG ),
264
応用統計学 Vol. 33, No. 3 (2004)
E(S G ) = DG + (G − 1)bcσ2U + (G − 1)cσ2V + (G − 1)bσ2W + (G − 1)σ2 ,
E(S IG ) = (a − G)bcσ2U + (a − G)cσ2V + (a − G)bσ2W + (a − G)σ2 ,
E(S O ) = DP + (b − 1)cσ2V + (b − 1)σ2
= E(S P ) + E(S OP ),
E(S P ) = DP + (P − 1)cσ2V + (P − 1)σ2 ,
E(S OP ) = (b − P)cσ2V + (b − P)σ2 ,
E(S M ) = D M + b(c − 1)σ2W + (c − 1)σ2 ,
E(S IO ) = DGP + (a − 1)(b − 1)cσ2V + (a − 1)(b − 1)σ2
= E(S GO ) + E(S IG O ),
E(S GO ) = DGP + (G − 1)(b − 1)cσ2V + (G − 1)(b − 1)σ2
= E(S GP ) + E(S GOP ),
E(S GP ) = DGP + (G − 1)(P − 1)cσ2V + (G − 1)(P − 1)σ2 ,
E(S GOP ) = (G − 1)(b − P)cσ2V + (G − 1)(b − P)σ2 ,
E(S IG O ) = (a − G)(b − 1)cσ2V + (a − G)(b − 1)σ2
= E(S IG P ) + E(S IG OP ),
E(S IG P ) = (a − G)(P − 1)cσ2V + (a − G)(P − 1)σ2 ,
E(S IG OP ) = (a − G)(b − P)cσ2V + (a − G)(b − P)σ2 ,
E(S I M ) = DGM + (a − 1)b(c − 1)σ2W + (a − 1)(c − 1)σ2
= E(S GM ) + E(S IG M ),
E(S GM ) = DGM + (G − 1)b(c − 1)σ2W + (G − 1)(c − 1)σ2 ,
E(S IG M ) = (a − G)b(c − 1)σ2W + (a − G)(c − 1)σ2 ,
E(S OM ) = DPM + (b − 1)(c − 1)σ2
= E(S PM ) + E(S OP M ),
E(S PM ) = DPM + (P − 1)(c − 1)σ2 ,
E(S OP M ) = (b − P)(c − 1)σ2 ,
E(S IOM ) = DGPM + (a − 1)(b − 1)(c − 1)σ2
= E(S GOM ) + E(S IG OM ),
E(S GOM ) = DGPM + (G − 1)(b − 1)(c − 1)σ2
= E(S GPM ) + E(S GOP M ),
E(S GPM ) = DGPM + (G − 1)(P − 1)(c − 1)σ2 ,
E(S GOP M ) = (G − 1)(b − P)(c − 1)σ2 ,
E(S IG OM ) = (a − G)(b − 1)(c − 1)σ2
= E(S IG PM ) + E(S IG OP M ),
265
経時測定データの分散分析
E(S IG PM ) = (a − G)(P − 1)(c − 1)σ2 ,
E(S IG OP M ) = (a − G)(b − P)(c − 1)σ2 .
ここで,DT , DG , DP , D M , DGP , DGM , DPM , DGPM は以下で与えられる.
DT =
b c
a (µi jk − µ̄··· )2 =
P c
G {µ(g,p) }2
··k
g=1 p=1 k=1
i=1 j=1 k=1
ag b p
− Nµ2
= DG + DP + D M + DGP + DGM + DPM + DGPM ,
b c
a G
2
2
DG =
(µ̄(g)
ag {ᾱ(g)
··· − µ̄··· ) = bc
I· } ,
DP =
DM =
i=1 j=1 k=1
g=1
b c
a P
2
(µ̄(p)
··· − µ̄··· ) = ac
i=1 j=1 k=1
p=1
b c
a c
(µ̄··k − µ̄··· )2 = ab
i=1 j=1 k=1
DGP =
b c
a 2
b p {ᾱ(p)
O· } ,
α2Mk ,
k=1
(p)
2
(µ̄(g,p)
− µ̄(g)
···
··· − µ̄··· + µ̄··· )
i=1 j=1 k=1
=
P
G g=1 p=1
DGM =
ag b p c {β̄(g,p)
}2 ,
··
b c
a (g)
2
(µ̄(g)
··k − µ̄··· − µ̄··k + µ̄··· )
i=1 j=1 k=1
=
c
G g=1 k=1
DPM =
ag b {γ̄·k(g) }2 ,
b c
a (p)
2
(µ̄(p)
··k − µ̄··· − µ̄··k + µ̄··· )
i=1 j=1 k=1
=
c
P 2
ab p {δ̄(p)
·k } ,
p=1 k=1
DGPM =
b c
a (p)
(g,p)
(g)
(p)
2
(µ̄(g,p)
− µ̄(g)
··k − µ̄···
··k − µ̄··k + µ̄··· + µ̄··· + µ̄··k − µ̄··· )
i=1 j=1 k=1
=
P c
G g=1 p=1 k=1
2
{η̄(g,p)
··k }
DG , DP , D M はそれぞれ群間,相間,項目間の効果の違いを表し,DGP , DGM , DPM , DGPM はそれぞ
れ群間 × 相間,群間 × 項目,相間 × 項目,群間 × 相間 × 項目交互作用の効果の違いを測っている.
5.
分散分析
4 節の D–項の形から,帰無仮説 HαI , HαO , HαM , Hβ , Hγ , Hδ , Hη はそれぞれ,DG = 0, DP = 0,
266
応用統計学 Vol. 33, No. 3 (2004)
D M = 0, DGP = 0, DGM = 0, DPM = 0, DGPM = 0 に対応する.
4 節で得られた平方和の分解を検討することにより,検定統計量(表 4)および分散分析表(表 5)
が構成できる.例えば S P は HαO の下では
SP =
b c
a 2
(V̄··(p) − V̄·· + ē(p)
··· − ē··· )
i=1 j=1 k=1
となり,Hunynh and Feldt
(1970)よりこれは自由度 P − 1 のカイ 2 乗分布の cσ2V + σ2 倍に従い,
HαO が成立しなければ自由度 P−1 の非心カイ 2 乗分布の cσ2V +σ2 倍に従う.したがって,HαO の
検定のための F–統計量を構成するには,S P の相手としてカイ 2 乗分布に従う確率変数の cσ2V + σ2
倍となる項すべてを選べばよい.したがって,各平方和の平均を参考に S OP + S GOP + S IG O を考
えて F–統計量を構成する.FαO および分散分析表における検定統計量はそのように構成されて
いる.
表 4,表 5 において,各 2 乗和をその自由度で割った平均を E で表している.S 1 , E1 は
S 1 = S OP M + S GOP M + S IG OM , E1 = S 1 /d1
であり,その自由度は d1 = (a(b − 1) − G(P − 1))(c − 1), E1 は σ2 の不偏推定量である.また S 2 , E2
は
S 2 = S OP + S GOP + S IG O , E2 = S 2 /d2
であり,その自由度は d2 = a(b − 1) − G(P − 1) である.FV は F–統計量の分子,分母とも複数の
変動要因を渡るので表 5 には現れていない.
表 4.
6.
検定統計量
帰無仮説
検定統計量
自由度対
HαI
HαO
FαI = EG /E IG
FαO = E P /E2
(G − 1, a − G)
(P − 1, d2 )
HαM
Hβ
FαM = E M /E IG M
Fβ = EGP /E2
(c − 1, (a − G)(c − 1))
((G − 1)(P − 1), d2 )
Hγ
Fγ = EGM /E IG M
((G − 1)(c − 1), (a − G)(c − 1))
Hδ
Hη
Fδ = E PM /E1
Fδ = EGPM /E1
((P − 1)(c − 1), d1 )
((G − 1)(P − 1)(c − 1), d1 )
HUVW
HV
FUVW = E IG /E1
FV = E2 /E1
(a − G, d1 )
(d2 , d1 )
HW
FW = E IG M /E1
((a − G)(c − 1), d1 )
点推定量
(g)
(p)
(g)
(p)
(g,p)
ここでは µ, ᾱI· , ᾱO· , α Mk , β̄(g,p)
, γ̄·k , δ̄·k , η̄··k , σ2U , σ2V , σ2W , σ2 の点推定量を与える.平均を構
··
成する各項の推定量は全平均および分解された平方和の各項を検討して得られる.例えば µ に関
しては全平均を考えればよく
267
経時測定データの分散分析
表 5. 分散分析表(* は E1 ,** は E2 に対応する)
変動要因
2 乗和
自由度
平均
SI
a−1
EI
群間
SG
G−1
EG
FαI
群内
S IG
a−G
E IG
FUVW
時点
SO
b−1
EO
相間
SP
S OP
P−1
b−P
EP
E OP
FαO
**
FαM
個体
相内
F–比
項目
SM
c−1
EM
個体 × 時点
S IO
S GO
(a − 1)(b − 1)
(G − 1)(b − 1)
E IO
EGO
群間 × 相内
S GP
S GOP
(G − 1)(P − 1)
(G − 1)(b − P)
EGP
EGOP
Fβ
**
群内 × 時点
S IG O
(a − G)(b − 1)
E IG O
**
群内 × 相間
S IG P
S IG OP
(a − G)(P − 1)
(a − G)(b − P)
E IG P
E IG OP
群間 × 項目
S IM
S GM
(a − 1)(c − 1)
(G − 1)(c − 1)
E IM
EGM
Fγ
群内 × 項目
S IG M
(a − G)(c − 1)
E IG M
FW
時点 × 項目
S OM
(b − 1)(c − 1)
EOM
相間 × 項目
S PM
S OP M
(P − 1)(c − 1)
(b − P)(c − 1)
E PM
E OP M
S IOM
S GOM
(a − 1)(b − 1)(c − 1)
(G − 1)(b − 1)(c − 1)
E IOM
EGOM
群間 × 相内 × 項目
S GPM
S GOP M
(G − 1)(P − 1)(c − 1)
(G − 1)(b − P)(c − 1)
EGPM
EGOP M
Fη
*
群内 × 時点 × 項目
S IG OM
(a − G)(b − 1)(c − 1)
E IG OM
*
群間 × 時点
群間 × 相間
群内 × 相内
個体 × 項目
相内 × 項目
個体 × 時点 × 項目
群間 × 時点 × 項目
群間 × 相間 × 項目
群内 × 相間 × 項目
S IG PM
群内 × 相内 × 項目 S IG OP M
全変動
Fδ
*
(a − G)(P − 1)(c − 1) E IG PM
(a − G)(b − P)(c − 1) E IG OP M
N −1
ST
µ̂ = Ȳ··· = µ + Ū· + V̄·· + W̄·· + ē···
なので
⎛
⎞
⎜⎜⎜ σ2U σ2V σ2W
σ2 ⎟⎟⎟
⎜
⎟⎠
+
+
+
µ̂ = Ȳ··· ∼ N ⎝µ,
a
ab
ac
abc
が得られる.平方和の検討からさらに以下が得られる.
(g)
ᾱˆ I· = Ȳ···(g) − Ȳ···
1
1
1
1
1
1
1
1 2
2
2
−
−
−
∼ N ᾱ(g)
,
−
+
+
+
σ
σ
σ
σ2 ,
I·
ag a U
ag b ab V
ag c ac W
ag bc abc
(p)
ᾱˆ O· = Ȳ···(p) − Ȳ···
1
1
1
1
2
−
∼ N ᾱ(p)
,
−
+
σ
σ2 ,
O·
ab p ab V
ab p c abc
α̂ Mk = Ȳ··k − Ȳ···
1
1
1
1
2
−
−
∼ N α Mk ,
σ +
σ2 ,
a ac W
ab abc
268
応用統計学 Vol. 33, No. 3 (2004)
(g,p)
β̄ˆ ·· = Ȳ···(g,p) − Ȳ···(g) − Ȳ···(p) + Ȳ···
1
1
1 1
1 2
1 1
1 1 2
σ
∼ N β̄(g,p)
,
−
−
+
−
−
,
σ
··
ag a b p b V
ag a b p b c
(g)
(g)
− Ȳ···(g) − Ȳ··k + Ȳ···
γ̄ˆ ·k = Ȳ··k
1
1
1
1 1
1 2
1 2
(g)
∼ N γ̄·k ,
−
−
1−
σ +
1−
σ ,
ag a
c W
ag a b
c
(p)
(p)
δ̄ˆ ·k = Ȳ··k
− Ȳ···(p) − Ȳ··k + Ȳ···
1
1 2
(p) 1 1
∼ N δ̄·k ,
−
1−
σ ,
a bp b
c
(g,p)
(g,p)
(g)
− Ȳ···(g,p) − Ȳ··k
− Ȳ (p) + Ȳ···(g) + Ȳ···(p) + Ȳ··k − Ȳ···
η̄ˆ ··k = Ȳ··k
··k 1
1 1
1
1 2
∼ N η̄(g,p)
,
−
−
1
−
σ .
··k
ag a b p b
c
また分散成分の推定は, 各平方和の平均を検討すると
S OP M + S GOP M + S IG OM
S1
,
=
d1
(a(b − 1) − G(P − 1))(c − 1)
E2 − σ̂2 S 2 − (a(b − 1) − G(P − 1))σ̂2
=
,
c
(a(b − 1) − G(P − 1))c
E IG M − σ̂2 S IG M − (a − G)(c − 1)σ̂2
=
,
b
(a − G)b(c − 1)
E IG − cσ̂2V − bσ̂2W − σ̂2
bc
S IG − (a − G)cσ̂2V − (a − G)bσ̂2W − (a − G)σ̂2
(a − G)bc
σ̂2 = E1 =
σ̂2V =
σ̂2W =
σ̂2U =
=
が得られる.
7.
特殊な場合
この節では前節で導いた分散分析表の特殊な場合をあげる.
7.1. c = 1 つまり 1 項目データの場合
c = 1 の場合は前節の分散分析表の中で S I M = S OM = S IOM = 0 と見なせる.また添え字に k
のついたパラメータや確率変数は無視される.さらに,Vi j は ei jk と分離不可能なので σ2V = 0 と
する.したがってモデルは
(p)
(g,p)
Yi j = µ + ᾱ(g)
+ U i + ei j
I· + ᾱO· + β̄··
であり,考える帰無仮説は HαI , HαO , Hβ , HU (HU : σ2U = 0) である.このとき各平方和の平均を参
考に表 6 の分散分析法を得る.省略された平方和以外での分散分析表 5 との違いは HU のみであ
るが,これは c = 1 の場合 S 1 = 0 となるが σ2V = 0 であるため E1 が E2 と代替え可能であったか
らである.
269
経時測定データの分散分析
表 6. 分散分析表(c = 1)(** は E2 に対応する)
変動要因
2 乗和
自由度
平均
SI
a−1
EI
群間
SG
G−1
EG
FαI = EG /E IG
群内
S IG
a−G
E IG
FU = E IG /E2
時点
SO
b−1
EO
相間
SP
S OP
P−1
b−P
EP
E OP
個体
相内
F–比
FαO = E P /E2
**
個体 × 時点
S IO
(a − 1)(b − 1)
E IO
群間 × 時点
S GO
(G − 1)(b − 1)
EGO
群間 × 相間
S GP
S GOP
(G − 1)(P − 1)
(G − 1)(b − P)
EGP
EGOP
Fβ = EGP /E2
**
S IG O
S IG P
(a − G)(b − 1)
(a − G)(P − 1)
E IG O
E IG P
**
群内 × 相間
群内 × 相内
S IG OP
(a − G)(b − P) E IG OP
群間 × 相内
群内 × 時点
全変動
ST
N−1
7.2. c = 1, P = b つまり 1 項目でかつ各時点ごとに相になっているデータの場合
分散分析表(表 6)がより簡単になり
S O = S P , S GO = S GP , S IG O = S IG P ,
S OP = S GOP = S IG OP = 0
となる.考えるモデルは
( j)
(g)
Yi j = µ + ᾱ(g)
I· + ᾱO· + β̄· j + U i + ei j
であり,考える帰無仮説は HαI , HαO , Hβ , HU (HU : σ2U = 0) である.このとき各平方和の平均を参
考に表 7 の分散分析法を得る.省略された平方和以外での分散分析表 6 との違いは HαI , HU , Hβ
であるが,P = b の場合 S 2 = S IG O となるためである.このような個体の属する群と時点につい
(1994)に示されている.
ての一部の分散分析(FαI , Fβ )は Diggle, Liang and Zeger
表 7.
変動要因
分散分析表(c = 1, P = b)
2 乗和
自由度
平均
SI
a−1
EI
群間
SG
G−1
EG
FαI = EG /E IG
群内
S IG
a−G
E IG
FU = E IG /E IG O
時点
SO
b−1
EO
FαO = EO /E IG O
E IO
個体
個体 × 時点
S IO
(a − 1)(b − 1)
群間 × 時点
S GO
S IG O
(G − 1)(b − 1) EGO
(a − G)(b − 1) E IG O
群内 × 時点
全変動
ST
ab − 1
270
F–比
Fβ = EGO /E IG O
応用統計学 Vol. 33, No. 3 (2004)
8.
数
値 例
用いるデータは, 奈良医科大学眼科学教室から提供されたもので,40 人の児童の小学校から中
学校の 9 年間の球面度数を測定したものである.球面度数とは近視の度数であり,この値がマイ
ナスなのは凸レンズでよい視力が出たということである.近視が強くなるとこの数値が −1 から
−2, −3 となり,絶対値が大きくなる.−3 ぐらいまでが軽い近視,−9 より強いと強い近視といえ,
−6 を超えると眼鏡では見えづらくコンタクトレンズが必要となる.また,遠視はプラスとなる.
(児童数),時点数は 9
(小学 1 年生から中学 3 年生まで),水準数は 2
(右目,左目)で
個体数は 40
ある.個体を男子,女子の 2 つのグループに分け,時点を小学生の低学年(1 年生∼4 年生),高
学年(5 年生,6 年生),中学生の 3 つのフェイズに分ける.
8.1. 分散分析
2 節のモデルにおいて a = 40, b = 9, c = 2, G = 2, P = 3 として分散分析表(表 8)を示す.
男女間,分類したフェーズ間,左右の目の間の効果に差がないという帰無仮説のもとでの F 検
表 8. 球面度数データに対する分散分析による計算結果
変動要因
二乗和
自由度
平均
個体
1230.88
39
31.56
群間
群内
4.57
1226.31
1
38
4.57
32.27
時点
237.40
8
29.67
相間
215.07
2
107.54
相内
22.33
6
3.72
項目
0.05
1
0.05
298.82
312
0.96
群間×相間
1.01
0.21
8
2
0.13
0.10
群間×相内
0.81
6
0.13
297.81
232.94
304
76
0.98
3.07
群内×相内
64.87
228
0.28
個体×項目
100.22
39
2.57
群間×項目
0.94
99.28
1
38
相間×項目
0.51
0.04
相内×項目
F–比
P値
FαI = 0.142
0.709
FUVW = 211.495 0.000
FαO = 105.613
0.000
FαM = 0.018
0.895
Fβ = 6.673
0.903
0.94
2.61
Fγ = 0.359
FW = 17.122
0.897
0.000
8
2
0.06
0.02
Fδ = 0.140
0.869
0.47
6
0.08
個体×時点×項目
48.09
312
0.15
群間×時点×項目
2.38
0.34
8
2
0.30
0.17
Fη = 1.116
0.329
群内×時点×項目
2.04
45.71
6
304
0.34
0.15
群内×相間×項目
29.10
76
0.42
群内×相内×項目
16.61
228
0.07
全変動
195.96
719
個体×時点
群間×時点
群内×時点
群内×相間
群内×項目
時点×項目
群間×相間×項目
群間×相内×項目
271
経時測定データの分散分析
定の結果は,
HαI : FαI = F1,38 = 0.142 (p = 0.709)
HαO : FαO = F2,316 = 105.613 (p < 0.0001)
HαM : FαM = F1,38 = 0.018 (p = 0.895)
となり,男女間,左右の目の間に有意な差があるという根拠はないが,分類したフェイズ間には
有意な差が認められた.またそれらの交互作用に関しては,
Hβ : Fβ = F2,316 = 6.673 (p = 0.903)
Hγ : Fγ = F1,38 = 0.359 (p = 0.897)
Hδ : Fδ = F2,316 = 0.140 (p = 0.869)
Hη : Fη = F8,316 = 1.116 (p = 0.329)
となりいずれの交互作用も有意とならない.
一方,分散に関しては
HUVW : FUVW = F38,316 = 211.495 (p < 0.0001)
HV : FV = F316,316 = 6.673 (p < 0.0001)
HW : FW = F38,316 = 17.122 (p < 0.0001)
となりいずれも高度に有意である.
以上のことから,平均値は学年のフェイズにのみ影響を受けるものの,個人差が極めて大きく,
また個人ごとに学年フェイズ,左右の目との交互作用効果のばらつきが大きいと考えられる.
以上の結果から有意となった因子だけを含めたモデルを再構築すると,
Yi jk = µ + ᾱOp + Ui + Vi j + Wik + ei jk , i ∈ Gg , j ∈ P p
(8)
となる.また第 4 章で示した D–項は,分散分析により HαO : DP = 0 のみ棄却されたことから,
再構築したモデルの平方和の期待値は以下で与えられる.
E(S T ) = DT + (a − 1)bcσ2U + (ab − 1)cσ2V + b(ac − 1)σ2W + (N − 1)σ2
E(S I ) = (a − 1)bcσ2U + (a − 1)cσ2V + (a − 1)bσ2W + (a − 1)σ2 ,
E(S P ) = DP + (P − 1)cσ2V + (P − 1)σ2 ,
E(S OP ) = (b − P)cσ2V + (b − P)σ2 ,
E(S M ) = b(c − 1)σ2W + (c − 1)σ2 ,
E(S IO ) = (a − 1)(b − 1)cσ2V + (a − 1)(b − 1)σ2
E(S I M ) = (a − 1)b(c − 1)σ2W + (a − 1)(c − 1)σ2 ,
E(S OM ) = (b − 1)(c − 1)σ2 ,
272
応用統計学 Vol. 33, No. 3 (2004)
E(S IOM ) = (a − 1)(b − 1)(c − 1)σ2
検定のための表(表 9)と分散分析表(表 10)を再構成する.表 9 と表 10 において E1 , E2 , E3 は
それぞれ
E1 = S 1 /d1 , S 1 = S OM + S IOM , d1 = a(b − 1)(c − 1),
E2 = S 2 /d2 , S 2 = S OP + S IO , d2 = a(b − 1) − (P − 1),
E3 = S 3 /d3 , S 3 = S M + S I M , d3 = a(c − 1).
である.FV と FW は F–統計量の分子,分母とも複数の変動要因を渡るので表 10 には現れてい
ない.
表 9.
表 10.
検定統計量
帰無仮説
検定統計量
自由度対
HαO
FαO = E P /E2
(P − 1, d2 )
HUVW
HV
FUVW = E I /E1
FV = E2 /E1
(a − 1, d1 )
(d2 , d1 )
HW
FW = E3 /E1
(d3 , d1 )
分散分析表(* は E1 ,** は E2 ,*** は E3 に対応する)
変動要因
2 乗和
自由度
平均
F–比
個体
SI
a−1
EI
FUVW
時点
相間
SO
SP
b−1
P−1
EO
EP
FαO
相内
S OP
b−P
E OP
**
項目
SM
c−1
EM
***
個体 × 時点
S IO
(a − 1)(b − 1)
E IO
**
個体 × 項目
S IM
(a − 1)(c − 1)
E IM
***
(b − 1)(c − 1)
EOM
*
(a − 1)(b − 1)(c − 1) E IOM
*
時点 × 項目
S OM
個体 × 時点 × 項目
S IOM
全変動
N−1
ST
再構築したモデルにおいて a = 40, b = 9, c = 2, G = 2, P = 3 として分散分析表(表 11)を示す.
分類したフェーズ間の効果に差がないという帰無仮説のもとでの F 検定の結果は,
HαO : FαO = F2,318 = 106.479 (p < 0.0001)
となり明らかに有意となった.一方,分散に関しては
HUVW : FUVW = F39,320 = 207.805 (p < 0.0001),
HV : FV = F318,320 = 6.650 (p < 0.0001),
HW : FW = F40,320 = 16.504 (p < 0.0001),
となり高度に有意となった.ただし FV と FW は複数の項をわたるので表には現れていない.
273
経時測定データの分散分析
表 11. 球面度数データに対する分散分析による計算結果
変動要因
二乗和
自由度
平均
個体
1230.88
39
31.56
時点
相間
237.40
215.07
8
2
29.67
107.54
相内
22.33
6
3.72
項目
0.05
1
0.05
個体×時点
298.82
312
0.96
個体×項目
100.22
39
2.57
時点×項目
0.51
8
0.06
個体×時点×項目
48.09
312
0.15
全変動
195.96
719
F比
FαO = 106.479
8.2. 点推定値
2
2
2
2
µ, ᾱ(p)
O· , σU , σV , σW , σ について点推定量を与える.
第 6 節より,期待値項の推定量は,
µ̂ = Ȳ··· = µ + Ū· + V̄·· + W̄·· + ē··· ⎛
⎞
⎜⎜⎜ σ2U σ2V σ2W
σ2 ⎟⎟⎟
⎟⎠ ,
∼ N ⎜⎝µ,
+
+
+
a
ab
ac
abc
(p)
ᾱˆ O· = Ȳ···(p) − Ȳ···
1
1
1
1
2
−
∼ N ᾱ(p)
,
−
+
σ
σ2
O·
ab p ab V
ab p c abc
で得られる.また,分散成分の推定は
S1
S OM + S IOM
,
=
d1
a(b − 1)(c − 1)
E2 − σ̂2 S 2 − (a(b − 1) − (P − 1))σ̂2
=
,
c
(a(b − 1) − (P − 1))c
E3 − σ̂2 S 3 − a(c − 1)σ̂2
=
,
b
ab(c − 1)
E I − cσ̂2V − bσ̂2W − σ̂2
bc
S I − (a − 1)cσ̂2V − (a − 1)bσ̂2W − (a − 1)σ̂2
(a − 1)bc
σ̂2 = E1 =
σ̂2V =
σ̂2W =
σ̂2U =
=
で得られる.以上より,各推定量は,
µ̂ = −0.32,
(1)
ᾱˆ O·
(2)
ᾱˆ O·
(3)
ᾱˆ O·
= 0.57,
= −0.14,
= −0.67.
274
P値
FUVW = 207.805 0.000
0.000
応用統計学 Vol. 33, No. 3 (2004)
σ̂2 = 0.152,
σ̂2V = 0.429,
σ̂2W = 0.262,
σ̂2U = 1.566.
となった.
8.3. 数値結果の考察
小学校から中学校までの 9 年間における 40 人の児童の球面度数のデータについて,球面度数
が近視の度数を表す指標であることから,児童の近視の度数に関係する可能性のある因子による
変量モデルを想定し,分散分析を行い,さらにそのパラメータの推定を行った.
分散分析と点推定の結果より,児童の球面度数は,性別,左右の眼による影響はなく,時点を
小学生の低学年,高学年,中学生と 3 つに分けた学年フェイズの影響があり,さらに学年フェイ
ズが進むにつれて平均的に球面度数が 0.25, −0.46, −0.99 となり近視の度数が増すことがわかっ
た.ただし σ̂2U が 1.566 であり,測定開始時の個人差は大きく,平均の意味では個体 × 相の交互
作用,個体 × 項目の交互作用はないが,HV , HW が棄却されたことから,個体 × 相の交互作用の
ばらつき,個体 × 項目の交互作用のばらつきが認められた.かつ σ̂2V が 0.429, σ̂2W が 0.262 であ
り,それらはどちらも誤差分散 σ̂2 の 0.152 よりも大きい.つまり,個人差はあるものの平均的
には学年が進むにつれ近視の度数が進むといえる.
9.
ま
と め
本論文では,解析の目的を母集団の把握とし,各個体はその母集団からランダムに選ばれたと見
なした.そして個体に関連する部分を変量とした変量モデルを構築し,分散分析法,各パラメー
タの推定法の提案を行った.個体(individual)を群(group)に,時点(occasion)を相(phase)に分割
し,変量モデルの期待値の項については群,相,項目(item)の 3 因子を扱った.また変量効果と
して,各個体に対して,全時点及び全項目にわたって共通な因子,時点ごとに影響を与える因子,
項目ごとに影響を与える因子を導入した.そして主効果,2 因子の交互作用の効果,3 因子の交
互作用の効果が無いという仮説を検定するための分散分析を行い,変量効果の因子については個
体差がないという仮説検定を与え,さらに各未知パラメータに対する点推定量を求めた.ただし,
本論文で提案した変量モデルにおける相関構造,つまり分散,共分散の値は測定時点によらない.
したがって,測定時点が近いと相関が高いが,離れると相関が低くなるようなデータへの適用に
は限界があり,解析するデータの特性により適用可能かどうかを判断する必要がある.今後の課
題としては,より適用範囲の広いモデルの開発が必要であろう.
謝 辞
本稿の改訂にあたって,査読者の方々には大変有益なご意見を頂きました.ここに記し
て感謝の意を表します.
275
経時測定データの分散分析
参 考
文 献
Anderson, A.J.B. (1991): Repeated measures : groups × occasions designs. In New Developments in Statistics for Psychology
and the Social Science. The British Psychological Society and Routledge, London.
Crowder, M.J. (1983): A growth curve analysis for EDP curves. Appl. Statist. 32, 15–18.
Crowder, M.J. and Hand, D.J. (1990): Analysis of Repeated Measures. Chapman and Hall, London.
Crowder, M.J. and Treder, J.A. (1981): The use of exponentially damped polynomials for biological recovery data. Appl.
Statist. 30, 147–152.
Dempster, A.P., Laird, N.M. and Rubin, D.B. (1977): Maximum likelihood from incomplete data via the EM algorithm (with
Discussion). J. Roy. Statist. Soc. Ser. B39, 1–38.
Diggle, P.J., Liang, K.L. and Zeger, S.L. (1994): Analysis of Longitudinal Data, Oxford Statistical Science Series.
Mosteller, F. and Tukey, J.W. (1977): Data Analysis and Regression, Addison-Wesley, Reading, Mass.
Hand, D.J. and Taylor, C.C. (1987): Multivariate Analysis of Variance and Repeated Measures, Chapman and Hall, London.
Hunynh, H. and Feldt, L.S. (1970): Conditions under which mean square rations in repeated measures designs have exact
F-distributions. J. Amer. Statist. Assoc. 65, 1582–1589.
O’Brien, R.G. and Kaiser, M.K. (1985): The MANOVA approach for analyzing repeated measures designs: An extensive
primer. Psychological Bulletin 97, 316–333.
Tukey, J.W. (1977): Exploratory Data Analysis, Addison-Wesley, Reading, Mass.
Rouanet, H. and Lepine, D. (1970): Comparison between treatments in a repeated-measurement design: ANOVA and Multivariate methods. The British Journal of Mathematical and Statistical Psychology 23, 147–163.
(2004 年 2 月 16 日受付
8 月 11 日最終修正 8 月 16 日採択)
著者連絡先:滝沢京子
〒 540–0021 大阪府大阪市中央区大手通 3 丁目 2 番 27 号
大塚製薬株式会社
TEL: 06–6944–4198(直通)
E-mail: [email protected]
276
Japanese J. Appl. Statist. 33 (3) (2004), 257–277
Analysis of Variance Method for Longitudinal Data
Kyoko Takizawa1,∗ , Shingo Shirahata2 and Seiji Ozasa3
1
Otsuka Pharmaceutical Co., Ltd., 3–2–27, Otedori Chuo-ku, Osaka, 540–0021, Japan
2
Graduate School of Engineering Science, Osaka University,
1–3, Machikaneyama-cho, Toyonaka, Osaka, 560–8531, Japan
3
Takatsuki High School, 2–5, Sawaragi-cho, Takatsuki, Osaka, 569–8505, Japan
Abstract
Because a particular feature of longitudinal data is the repeated measurement of subjects over
time, it inevitably produces correlation among observations. Therefore, it is not appropriate to use
procedures developed under an assumption of independence. In the conduct of actual pharmaceutical clinical trials, due to problems of ethics, cost to the maker, etc. it is necessary to limit the scale
of the pilot study by, for example, collecting repeated observations on the same subjects. Therefore,
procedures for longitudinal data analysis are important in practice. In this paper, we consider a
method of analysis for multivariate longitudinal measurements on multiple subjects in a fixed time
period. We treat the individuals as random effects, as the purpose of the analysis is not to make
inference about each individual per se but rather the population. For such a model, we give the analysis of variance and describe the parameter-estimation method to examine whether there are effects
of group, phase and item.
Key words: analysis of variable table, mixed model, random model, repeated measurement, testing
hypothesis
∗
Corresponding author
E-mail addresses: [email protected],
[email protected].
Received February 16, 2004; Received in final form August 11, 2004; Accepted August 16, 2004.
277