ケースクロスオーバーデザインでアウトカムが再発イベントの場合の解析

ケースクロスオーバーデザインでアウトカムが再発イベントの場合の解析
慶應義塾大学医学部
衛生学公衆衛生学
竹内文乃
[email protected]
概要
近年、特に大気汚染を曝露として、その急性影響の評価を目指す環境疫学領域において、
ケース・クロスオーバーデザインによる解析を行う事例が増加している。ケース・クロス
オーバーデザインは、疫学研究で古典的に用いられてきたケース・コントロール研究に単
を発するケース(疾患発症者)のみを対象とする研究デザインであるが、ケース・コント
ロール研究で困難が伴うとされるコントロール(疾患非発症者)の選択の問題や、ケース
とコントロールで過去の曝露状況の思い出し精度が異なるという想起バイアスの問題が緩
和された非常に有用な研究デザインである。
ケース・クロスオーバーデザイン提案当初は、1 回しか起こらない疾患発症・イベントが
想定されていたが、さまざまな疾患に適用されるにつれて、頻繁に繰り返すイベントをど
のように評価するか、コントロール期間の取り方や個人内相関の考慮が課題となるように
なってきた。本研究では再発イベントを想定したケース・クロスオーバーデザインに対し
て複数の解析手法をレビューし、大気汚染(黄砂飛来有無)と喘息発作の有無という単純
な状況でシミュレーションを実施した。
解析手法としては①複数回起こっているイベントを 1 回に限定する手法、②複数回のイ
ベントをプールする手法、③個人をクラスターとみなし、クラスター単位で条件付ロジス
ティックモデルを当てはめる手法、④クラスター単位でリサンプリングを行う手法、⑤リ
サンプリングに基づいて推定方程式を解く手法を比較検討した。推定値のバラツキが最も
大きいのは①で最も小さいのは③となったが、③は個人ごとのイベント繰り返し数が増え
るにつれて計算負荷が高くなり、計算に時間がかかることがわかった。④と⑤は漸近的に
は一致することが知られており、実際比較検討した 5 つの手法の中でも推定値のバラツキ
に関して中間的な性質を持った。また、②は③に次ぐ推定値のバラツキの小ささを示し、
リーズナブルな手法であることが示唆された。
1.ケース・クロスオーバーデザインとは
ケース・クロスオーバーデザイン(case-crossover design)は、曝露(リスク因子)が疾患
発症に与える影響を定量することを目的とした観察研究の研究デザインの一つである。
ケース・クロスオーバーデザインでは、古典的なケース・コントロールデザインのように
ケース(疾患発症者)とコントロール(疾患非発症者)を比較するのではなく、研究対象
の疾患を発症したケースのみを対象者とし、ケースが経時的に経験する曝露と非曝露を比
較することで曝露の疾患発症リスクを評価する[Maclure 1991]。したがって、曝露の健康影
響が蓄積性を持つ場合、慢性影響を持つ場合には適さず、曝露‐非曝露の曝露状況が個人
内で短期間に変化し、なおかつ急性影響を持つ曝露の評価に適している。具体的には、携
帯電話の利用(曝露)と交通事故(疾患)[Redelmeier 1997]や、過度の運動(曝露)と急
性心筋梗塞発作(疾患)[Mittleman 1993]や大気汚染(曝露)とぜんそく発作(疾患)[Lin
2003]、薬剤投与(曝露)と急性副作用(疾患)といった薬剤疫学領域[Donnan 2001]にお
けるリスク評価に利用されてきた。
ケース・クロスオーバーデザインの最大の利点は、同一個人内で曝露‐非曝露の比較を
するため、マッチングを行うことなしに背景情報の揃ったケースとコントロールを得るこ
とができ、交絡因子の影響を取り除ける点であるが、交絡因子も曝露同様短時間で変化す
る場合には必ずしも取り除けるとは限らない[Greenland 1996]。また、曝露に関して対象
者自身の思い出しによる情報やインタビューを利用して評価する場合には、ケース・コン
トロールデザイン同様に想起バイアス等の情報バイアスが入る可能性がある。ただ、ケー
ス・コントロールの実施上、常に問題となるコントロールの選択(疾患を発症していない
対象者からは同意を得づらいという実施上の問題から、ケースが発生した集団から適切に
サンプリングできているかという選択バイアスの問題まで)が不要というメリットは非常
に大きい。ただ、個人単位でケースとコントロールのマッチングを行った状態になるため、
個人レベルの共変量の疾患発症への影響は考慮できない。これに関しては、従来のケース・
コントロール研究ケースとコントロールのマッチングに用いたマッチング因子のリスクを
評価できないのと同じことである。
ケース・クロスオーバーデザインを実施する際には、対象者に対してケースに影響をし
たと考えられる曝露を評価するケース期間(case period)を設定し、ケースとコントロールを
1:3 でマッチングする場合などであれば、交絡因子となりうる共変量が経時変化しないと考
えられる期間内に 3 時点コントロール期間(control period)を設定する。ケース期間は、例
えば交通事故と携帯電話利用の例であれば、事故直前の携帯電話利用を曝露と考えたいの
で「事故直前」がケース期間となり、喘息発作と大気汚染の例で喘息発作から 3 日以内の
大気汚染濃度を曝露と考えたい場合であれば、発作前 3 日間がケース期間となる。
ケース・クロスオーバーデザインから得られたデータの解析では、マッチングを行った
ケース・コントロール研究同様 Mantel-Haenszel 法および条件つきロジスティック回帰モ
デルを利用するのが一般的である[Maclure]。
2.再発イベントの考慮
ケース・クロスオーバーデザイン提案当初の事例では、疾患の頻繁な再発は想定してい
なかったが、当該デザインがさまざまな領
域に拡大するにつれて、疾患が頻繁に再発し、コントロール期間中にも下図のように疾患
(イベント)を複数回発症しているような状況が見られるようになってきた。具体的には、
喘息発作[Levy 2001]や高齢者の転倒[Neutel 2002]、性感染症[Warner 2005]等のイベント
が考えられる。
疾患発症が頻繁に再発する場合には、対象者内でイベント間の相関を考慮する必要があ
ると考えられるため、通常の解析を拡張する必要がある。また、簡便に取り扱う場合には
ケースとするイベントを初発の疾患発症に限定するなど、複数回疾患発症のうちの1回の
疾患発症に限定した解析することも考えられる[Luo 2008]が、情報量および検出力、効率の
観点からは複数回のイベント発症があればすべてのイベントを利用したい。
本研究では再発イベントを対象としたケース・クロスオーバーデザインの研究データに
対して、再発イベントを単純にプールする場合、クラスターデータとして扱う場合等、
解析上の対処方法を複数比較検討し、今後の実データへの適用可能性を探ることを目的と
する。
3.再発イベントを考慮したケース・クロスオーバーデザイン研究の解析
今回は、複数の小学校の喘息と診断された小学生を対象に、春先の黄砂飛来時期数ヶ月
に渡って喘息日誌を毎日記入してもらい、喘息発作をケースとし、黄砂飛来日を曝露とし
たケース・クロスオーバーデザインで研究を実施することを考える。
簡単のため、今回はケース期間を喘息発症日当日1日とし、コントロール期間も同様に研
究対象期間内から1日をサンプリングして1:1でマッチングを実施する。
-Notationi=1,…,n:研究期間中に少なくとも 1 回喘息発作を発症した研究対象者
t∈{τ 1 ,..,τ T }:研究期間。Tは喘息日誌をつけた平日の登校日。
j:個人ごとのイベントを起こした回数。j=1,…,m i (≧1)
t ij :ケース期間。イベントをいつ起こしたか。
個人ごとにイベントが起きた日はt i1 ,..,t imi と書ける。
s ij :コントロール期間。
X 1ij :ケース期間(t ij )の対象者iごとの共変量。黄砂飛来の有無や体育やクラブ活動の有無、
気象条件など
X 0ij :コントロール期間(s ij )の対象者iごとの共変量。
O ij:対象者iのj番目のイベントで作成される 1:1 のマッチドセット。O ij ={ t ij , X 1ij , s ij , X 0ij }
対象者 i の時点 t での対数オッズは以下のようになる。
log
pit
= λi + βX it
1 − pit
X it は、時間依存性共変量を表し、λ i は時間非依存性のベースライン共変量を表す。
3-1.複数回の疾患発症を1回に限定する解析
対象者ごと複数回起こしている喘息発作を、何らかのルールに則って1回に限定し(例
えば研究期間中の初発イベントに限定するなど)
、それ以外の発作を解析から除外する場合、
1人につき1マッチドセットO ij が得られるため、通常のケース・クロスオーバー解析同様
の条件つきロジスティック回帰分析でβを推定する。
曝露状況の条件付尤度のスコア関数は以下のようになり、スコア関数=0 を解いてベータの
条件付最尤推定量を求めることになる。
1

X li1 exp(βX li1 ) 
∑
S1 (β ) = ∑  X 1i1 − l = 01

(
)
X
exp
β
i =1 

∑
li
1
l =0

n
ここで l は疾患発症の有無を表す。この推定結果は、妥当なものではあるだろうが、あとに
続く再発イベントを無視したことによる効率の損失が起こっているとかんがえられる。
3-2.複数回の疾患発症をプールする解析
条件付ロジスティック回帰モデルで置かれていた仮定のひとつに、個人ごとの時間依存
性共変量X it とベースライン(時間非依存性)共変量λ i を与えたもとでは個々の疾患発症は
独立というものがある。上記仮定が成り立つとすると、対象者全員分のマッチドセット{O ij ;
i=1,…,n, j=1,…,m i }は、条件付きで独立に同一の分布(iid)をすると考えられる。この場合、
条件付尤度のスコア関数は以下のように変わる。
1

X lij exp(βX lij )
∑
l =0
X
−


∑∑
1ij
1
(
)
exp
β
X
i =1 j =1 

∑
lij
l =0

mi
n
3-3.クラスターデータとしての解析
Navidi らによって提案された、個人をクラスターとみなして解析する手法は、Maclure
らによる提案時点のケース・クロスオーバーデザインがケース・コントロールサンプリン
グに基づいているのに対し、コホートサンプリングに基づいているため、研究期間中の全
時点でコントロールの情報が収集できていることが求められる[Navidi 1998]。一方、要件
を満たせばクラスター(個人)レベルに対して条件付ロジスティック回帰を当てはめるこ
とができるため、クラスターレベル(同一個人内)で複数回疾患を発症している場合でも
条件付ロジスティック回帰による推定が可能となる。
個人iのm i 個のケース期間およびコントロール期間における共変量のマッチドセットを
E i ={X 1ij , X 0ij ; j=1,…,m i }とすると、このE i はクラスター単位のマッチドセットと考えられる。
ケース期間の共変量の値は{X 1ij =x 1ij ; j=1,…,m i }で、S i をE i の中のサイズm i のサブセット、
∑
n
Si
∏
i =1
をサブセットの合計とすると、条件付尤度は以下のように表される。
exp( β ∑ j =i 1 X 1ij )
m
∑
Si
exp( β ∑l∈S X l )
i
また、この場合のスコア関数は以下のようになる。
 mi
∑Si {(∑l∈Si X l ) exp(β ∑l∈Si X l )}) 

−
X
∑
∑ 1ij

i =1  j =1
∑Si exp(β ∑l∈Si X l )

n
このようにクラスター単位での解析をする場合も、条件付 iid の仮定は3-2同様必要と
なる。3-2のプールする解析との違いは、個人単位ではなく疾患発症を単位として条件
付尤度を構成しているか(3-2)
、クラスター(個人)単位で尤度を構成しているか(3
-3)である。クラスター内のイベント数が増えると計算負荷が高くなる点が短所となる。
3-4.対象者内ペアリサンプリング法による解析
Hoffman らの提案によるクラスターデータに対するクラスター内リサンプリング法では、
観測データは各クラスターからランダムに復元抽出される。リサンプリングの結果として
得られるサブサンプルは、独立なデータとみなすことができるため、既存の手法での解析
が可能となる[Hoffman 2001]。リサンプリングを何度も繰り返せば、パラメータ推定値は
1回ずつの推定値の平均として得ることも可能である。特に、クラスターごとにケースと
コントロールをペアでサンプリングすることで、クラスターデータを複数の1:1のケース
とコントロールのペアデータに変換し、マッチングしたケース・コントロール研究データ
に対する解析を繰り返し実施することで解析が可能になる[Reiger 2002]。この手法をとる
最大の長所は、クラスター内条件付独立の仮定が不要となる点である。
当該手法をケース・クロスオーバーデザインに当てはめると、ケース期間とコントロー
ル期間をマッチングしたマッチドセットに基づくリサンプリングを実施することになる。
具体的には、対象者ごとに1つのマッチドセットO ij をランダムにサンプリングし、n個(n
人分)の独立なケースとコントロールのペアのデータを得た上で、条件付ロジスティック
ˆ (q ) を算出する。上記
回帰を実施し、パラメータ推定値 βˆ ( q ) と分散共分散行列の推定値Σ
リサンプリングのプロセスをQ回繰り返し、最終的なパラメータ推定値を以下のように得る
(Within-Cluster Resampling: WCR)[Hoffman 2001]。
βˆ
WCR
1 Q ˆ
= ∑ β (q)
Q q =1
(
)(
)

1 Q ˆ
1 Q ˆ
ˆ
=
−
q
(
)
Σ
Σ
β (q ) − βˆWCR βˆ (q ) − βˆWCR '

∑
∑
WCR
Q q =1
 Q q =1

これを、複数回の疾患発症に一般化したものを Within-Subject Pairwise Resampling
(WSPR) と呼ぶが、このリサンプリング法を拡張する限りにおいては対象者内の複数回の
疾患発症同士の相関構造の特定は不要である。
3-5.重みつき推定方程式による解析
WSPR 法を発展させる形で、 βˆ (q ) を以下のスコア方程式イコール 0 の解として得る、
重みつき推定方程式(Weighted Estimating Equation; WEE)が提案された[Williamson
2003]。
1
X lij exp(βX lij )

∑
S(q ) (β ) = ∑∑  X 1ij − l = 01
 I (i, j ) ∈ rq
(
)
X
exp
β
i =1 j =1 

∑
lij
l =0


n
mi
[
]
ここで、r qはq回目のサンプリングの(i,j)セットのことであり、Iは指示変数を表す。
再発イベントを想定したケース・クロスオーバーデザインの場合、リサンプリング分布
は、離散一様分布であり、離散値の取る確率は、個人i内では 1/m i となる。したがって、指
示変数 I [(i, j ) ∈ rq ] は 1/m i に置き換えることができるため、ケース・クロスオーバーデザイ
ンにおけるWEEは以下のようになる。
n
1
SWEE (β ) = ∑
i =1 mi
1

X lij exp(βX lij )
∑
l =0
X
−


∑
1ij
1
(
)
exp
β
X
j =1 

∑
lij
l =0

mi
4.シミュレーションとその結果
本研究では、喘息発作発症を想定したデータセットを作成し、3節で取り上げた各解析
手法の性能を確認する。対象者は 200 人の喘息既往のある小学生で、研究期間中に 400 回
の喘息発作が確認されたものとする。発作回数は 1 回から 15 回まで分布し(Median は 1
回)、平均は 2 回もしくは 2.5 回と設定した。曝露に関しては発作当日の黄砂飛来の有無(研
究期間中 20 日観測)とした。
また、研究期間中の時点は T=1,…,100 の 100 時点あるものとして、1つの手法ごと 1000
回のデータセットを作成し、リサンプリング法では Q=1000 とした。
データはロジットモデルlogit(p it )=λ i +βX it のもとで発生させ、個人ごとのベースラインリ
スクλ i はlogged beta分布(a=1, b=100)に従うものとした。また、X it は確率 1/5 のベルヌ
ーイ分布に従うものとした。
以下に、個人の平均発作回数ごとに 1000 回の平均として求められた回帰係数の推定値
(Est)と標準偏差(SD)および推定値の標準誤差(SE)を示す。
m i =2.056
m i =2.521
手法
Est
SD
SE
Est
SD
SE
初回イベント
1.008
0.398
0.408
1.029
0.402
0.411
イベントプール
1.003
0.327
0.316
1.018
0.341
0.313
クラスター
1.003
0.306
0.307
1.016
0.315
0.298
WSPR
1.007
0.351
0.376
1.025
0.378
0.361
WEE
1.004
0.338
0.364
1.020
0.362
0.357
結果、初回イベントに限定した解析を行った結果がもっとも推定値のバラツキが大きく、
クラスターとして扱った場合がもっともバラツキが小さい結果となった。ただ、計算時間
については、個人ごとの平均発作回数が増えるほど長くかかる傾向にあった[Luo 2007]。
クラスターデータとして解析する手法の次にバラツキが小さいのは、イベントをプールし
て解析する手法で、WSPR および WEE による解析はその間に収まる結果となった。
5.考察と今後の適用可能性
ここ数年、特に大気汚染を曝露とする急性影響の評価を目指す環境疫学領域において、
ケース・クロスオーバーデザインによる解析を行う事例が顕著に増加している。その際の
疾患発症は、死亡のような 1 回しか起こらないハードなエンドポイントから喘息発作や救
急車の呼び出し回数まで多岐に渡る。当該領域へのケース・クロスオーバーデザイン導入
当初は、同じデータを使ってケース・クロスオーバーデザインとして解析をするか一般化
加法モデル等を用いた時系列データ解析をするかの比較等が行われてきたが[Ueda 2009]、
ケース・クロスオーバーデザインがさまざまなエンドポイントに適用されるにつれて、繰
り返し発症するイベントをどのように評価するか、コントロール期間の取り方や個人内相
関の考慮が課題となるようになってきた。本研究では再発イベントを対象としたケース・
クロスオーバーデザインに対して既に提案された複数の解析手法をレビューし、大気汚染
(黄砂飛来有無)と喘息発作の有無というシンプルな状況でシミュレーションを実施した。
今後は大気汚染が連続量の場合、コントロール期間の設定が困難な場合(通常、喘息発作
をイベントとする場合は、異なる週の同一曜日をコントロール期間とすることが多いため、
その日に毎週発作が起きているとコントロール期間の設定が困難になる)等、より現実的
にニーズがある場面に状況設定を拡大して評価検討を進めていきたい。
【参考文献】
Donnan
PT,
Wang
J.
The
case-crossover
and
casetime-control
designs
in
pharmacoepidemiology. Pharmacoepidemiol Drug Saf. 2001;10(3):259-62.
Greenland S. Confounding and exposure trends in case-crossover and case-time-control
designs. Epidemiology. 1996;7:231-9.
Hoffman EB, Sen PK, Weinberg CR. Within-cluster resampling. Biometrika.
2001;88:1121-34.
Levy D, Lumley T, Sheppard L, Kaufman J, Checkoway H. Reference selection in
case-crossover analysis of acute health effects of air pollution. Epidemiology.
2001;12(2):186-92.
Lin M, Chen Y, Burnett RT, Villeneuve PJ, Krewski D. Effect of short-term exposure to
gaseous
pollution
on
asthma
hospitalization
in
children:
a
bi-directional
case-crossover analysis. J Epidemiol Community Health. 2003;57(1):50-5.
Luo X, Sorock GS. Analysis of recurrent event data under the case-crossover design
with applications to elderly falls. Stat Med. 2008;27(15):2890-901.
Maclure M. The case-crossover design: a method for studying transient effects on the
risk of acute events. Am J Epidemiol. 1991;133:144-53.
Mittleman MA, Maclure M, Tofler GH, Sherwood JB, Goldberg RJ, Muller JE.
Triggering of acute myocardial infarction by heavy physical exertion. Protection
against triggering by regular exertion. Determinants of Myocardial Infarction Onset
Study Investigators. N Engl J Med. 1993;329(23):1677-83.
Navidi W. Bidirectional case-crossover design for exposures with time trends.
Biometrics. 1998;54:596-605.
Neutel CI, Perry S, Maxwell C. Medication use and risk of falls. Pharmacoepidemiol
Drug Saf. 2002;11(2):97-104.
Redelmeier D, Tibshirani R. Association between cellular-telephone calls and motor
vehicle collisions. N Engl J Med. 1997;336:453-8.
Reiger RH, Weinberg CR. Analysis of clustered binary outcomes using within-cluster
paired resampling. Biometrics 2002;58:332-41.
Ueda K, Nitta H, Ono M, Takeuchi A. Estimating mortality effects of fine particulate
matter in Japan: A comparison of time-series and case-crossover analysis. J Air Waste
Manage Assoc. 2009;59(10):1212-8.
Warner L, Macaluso M, Austin HD, Kleinbaum DK, Artz L, Fleenor ME, Brill I,
Newman DR, Hook EW. Application of the case-crossover design to reduce
unmeasured confounding in studies of condom effectiveness. Am J Epidemiol.
2005;161(8):765-73.
Williamson JM, Datta S, Satten GA. Marginal analysis of clustered data when cluster
size is informative. Biometrics. 2003;59:36-42.