疫 学 研 究 に お け る 生 物 統 計 手 法

日本統計学会誌
第22巻 ,第 3号
493頁 ∼513頁
(増 刊号),1993年
疫 学 研 究 に お け る 生 物 統 計 手 法
佐
藤
俊
哉
*
Biostatistical Methods in Epidemiologic Research : A Review
Tosiya Sato*
This paper reviews biostatstical inethods in epiderniologic studies for causal inference
between a risk factor and a disease.
After a brief introduction into lneasures of exposure
effect which are of interest in epiderniologic research,classical epiderniologic designs,グ
cohort and case‐ control studies, for effect estimation are illustrated.
.θ .
Recent develop‐
ments in biostatistics and epidenliology allow to propose new study designs,such as nestё d
case‐ control, case‐ cohort,
and two‐ stage case‐ control studies.
inference in epidenlionlogic observational studies are discussed.
Some aspects of causal
Other important topics,
Inisclassincation errors,ecological bias,and longitudinal studies,are brieny reviewed.
リス ク要因 と疾病発生 との因果関係 を調 べ るための疫学研究 で用 い る生物統計手法 に関す る
レビュー を行 う。疫学研究 で興味 のある, リスク要因 へ の曝露 の効果 の指標 を導入 した後 ,曝
露効果 を推定 す るための古典 的な研究 デザイ ンで ある,コ ホー ト研究 ,ケ ース・ コン トロール
研究 とそ こで用 い る生 物統計手法 を解説す る。最近で は,生 物統計学 の発展 に ともなって,コ
ホー ト研究 ,ケ ース・ コン トロール研究 に代 わ る新 しい研究 デザイ ンがい くつか提案 されて い
るが,新 しい デザイ ンの うち代表的 なネステ ッ ド・ ケース・ コン トロール研究 ,ケ ース 0コ ホ
ー ト研究 , 2段 階 ケース・ コン トロール研究 の紹介 を行 う。 また,疫 学的観察研究 か ら因果推
論 を行 うための最近 の研究成果 につ いて も報告す る。 その他 の重 要 な話題 で ある,誤 分類 の影
響 ,Ecological bias,経 時観察研究 ,に ついて も簡単 で はあ るが文献紹介 を行 う。
1.
:ま
じ め に
疫学 とは「特定 の集団内の健康 に関連 した状態 または事象の分布や決定要因 に関す る研究 で
あ り,健 康問題 を コ ン トロールす るためにその研究結果 を応用す る (Last[46])」 研究領域 で
ある.疫 学研究 は具体的 には,循 環器疾患 に影響 を与 える要因 は何 か ?,が んを予 防す る生活
習慣 は ?,現 在難病 を患 ってい る人 はどの くらいい るか ?,な どの具体的 な公衆衛生上 の問題
に対 し回答 を与 えるための応用科学 で あ り,非 常 に広 い範囲 を対象 としてい る
疫学 は歴史的 に コンラな どの急性感染症 の流行 を記述 し,原 因 を明 らかにし,流 行 を防 ぐ学
.
問 として誕生 した.疫 病学,流 行病学 とい う疫学 の別名 が この ことを物語 ってい る.現 在 で も
予防接種 の有効性評価 や AIDSの ように,感 染症 の疫学 は重要 な分野 である.し か し,成 人病
と呼 ばれ る慢性非感染症 の増加 に ともなって,疫 学 の重 点 は,が ん,循 環器疾患,な どの原因
と予防を研究す る こ とに移 りつつ ある。 1950年 代 か ら 60年 代 にか けて行 われた喫煙 と肺 がん
に関す る多数 の疫学研究 は,こ の慢性疾患 の疫学 の確 立 に貢献 した (Breslow and Day[8],p.
9).現 在 では喫煙 が肺 がんの非常 に強 い原因 の一 つで ある ことを疑 う人 はい ないで あろうが
,
論文受付 :1992年 2月
*統 計数理研究所 ,〒
106
改訂受付 :1993年 3月 受理 :1993年 3月
東京都港 区南麻布 4-6-7
494
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
当時 は喫煙 と肺 がんの因果関係 の判定 をめ ぐって いわ ゆる「喫煙 と肺 がん論争」 が起 こった
著明 な統計学者 で ある R.A.Fisher,J.BerkSOn,Ho J.Eysenckら は,喫 煙 と肺 がんの因果
関係 を立証す るためには疫学的観察研究 だけで は不十分 で ある と述 べ た (一 般 に信 じられてい
.
るように彼 らは喫煙 と肺 が んの因果関係 を否定 してい るわ けで はない)が ,こ の論争 は,観 察
研究 に もとづいて どのよ うに因果推論 を行 うか, とい う現在最 も重 要 な話題 に直接結 びついて
い る。
「喫煙 と肺 がん論争」に興味 のある読者 は,最 近 の議論 (VandenbrOucke[96],Greenland
[27],Stolley[87],Eysenck[16])お よびそれ らの論文 に引用 されてい る文献 を参照 してほし
い.
_
確 かに疫学的観察研究 だ けで因果関係 を証明す る ことは不十分 で あるか もしれない.因 果関
係 を科学的 に判断す るためには要因 のラ ンダム化 が不可欠 で ある.例 えばラ ンダム化臨床試験
は,新 薬 や新治療法 の効果 を科学的 に判定 するための手段 として,現 在 では広 く承認 されてい
る (広 津 [39]).し か し,疫 学研究 では,一 般 に健康 に悪影響 を与 える要因, リス ク要 因,を
研究 の対象 としてい るので, リスク要因 を対象者 にラ ンダムに与 える ことは倫理的 に許 されな
い.し たがって,疫 学的観察研究 は多 くの場合 リスク要因 と疾病発生 の因果関係 を調 べ る唯一
の研究方法 で ある。 さらに疫学研究 で は直接 ヒ トを研究 の対象 としてい る,と い う利点 が存在
す る.動 物実験 か ら得 られた結果 を ヒ トヘ外挿 す るためにはた くさんの障害 が ある し,「 健康問
題 を コン トロァルす る」とい う疫学研究 の最終 目的 か らは人間集団 の観察 に頼 らざるを得 ない
.
このような点 か ら,疫 学研究 は「 自然 の実験」 とも呼 ばれてい る
本論文 で は,非 常 に広 い範囲 の疫学研究 の中で も「ある要因 に曝露 され る ことが疾病発生の
原因 であるか どうか, とい う因果関係 に関す る研究」 に限定 して,そ の中で用 い られてい る生
.
物統計手法 の レビュー を行 う.曝 露 一疾病間 の関係 を調 べ るためには,疾 病発生 の状況 をどの
ようにとらえるか,ま た疾病発生 に曝露 が与 える効果の大 きさをどうやって量 るかが大 きな問
題 とな り,ま ず最初 に 2節 では疫学研究 で用 い る疾病発 生の指標 ,曝 露 の効果 の指標 について
述 べ る.続 いて 3節 , 4節 では曝露 の効果 を推定す るための古典的な コホー ト研究,ケ ース・
コン トロール研究 とい う 2つ の代表的 な研究 デザイ ンについて まとめを行 う。5節 で はコホー
ト研究 やケース・ コ ン トロール研究 の利点 を ミックス した新 しい疫学研究 のデザイ ンについて
簡単 な紹介 を行 い, 6節 で因果推論 に関す る最近 の話題 を紹介 す る
その他 の重要 な話題 につ いて も 7節 で簡単 に触 れるが,本 論文 だけで「疫学研究 における生
物統計手法」 を全 てカバ ーす る ことは不可能 で ある.そ こで,基 本的 な教科書 お よび関連 した
話題 の レビュー論文 を紹介 し,読 者 の (と い うよ りも,こ の レビュー の)助 け としたい.急 性
.
感染症 (あ るい はもっ と以前 )か ら始 まる疫学の歴史 について は丸 井 [60]が よ くま とまって
い て読 みやす い.疫 学 の教科書 として は,入 門的 な もの として Kelsey et al.[42],Walker
[102],多 少専門的な ものに Kleinbaum et al.[43],Rothman[76]が ある.ま た,Breslow
and Dayの 教科書 [7, 8]は たいへ ん高度 な内容 を含 んで い るが,ど ち らも第 1章 はそれぞ
れケース・ コン トロール研究 ,コ ホー ト研究 のたいへ んいい (や さしい)紹 介 となってい る
.
疫学研究 における生物統計手法 の最近 の発展 をまとめた ものには,Breslow[5],Gail[19]
が ある.Breslow[5]は 5節 で紹介す る新 しい研究 デザイ ンと本論文 で は触 れ られなか ったグ
ラフ ィック表示 を強調 した レビュー を行 つてい る.Gail[19]は ロジステ ィック回帰 ,Cox回
帰 にもとづ くモ デ リングの立場 か ら 1980年 代 の生物統計手法 の発展 の レビュー を行 つてい る
.
Gailの レビュー は 851の 論文 をテーマ別 に分類 した文献集 に もなってい るので,興 味 の ある読
者 の参考 になるだ ろう
.
疫学研究 にお ける生 物統計手法
2.疫 学研究で興味の ある指標
2.1.疾 病発生の指標
疾病発生状況 を とらえる考 え方 には 2通 りある.あ る時点 において,特 定個人 が研究対象 と
してい る疾病 にかかってい る こ とを有病 (prevalence)と い う.集 団検診や ス クリーニ ングで発
見 された疾病 は検診時 での有病状況であるし,剖 検 (死 後 に原死因や付随 した疾病 の確認 のた
めに解剖す ること)で 確診 された疾病 は死亡時の有病状況である.一 方,研究対象 としてい る
疾病 に現在 かかってい ない人で,将 来 その疾病 にかか る可能性のある (at risk)人 を追跡 して
新 たに疾病 にかか った場合 ,そ れ を疾病発生 (incidence)と い う.(例 えば子宮 がんの発生 を調
べ たい場合 ,男 性 は当然 として,子 宮摘出を行 った女性 も新 たに子宮がんにかか る可能性 はな
いので,子 宮がんの「at
risk」
とはな らない.)
疾病 の有病数 を正確 に把握す る ことは,例 えば医療費補助 を行 う場合 の コス ト計算 のよ うに
公衆衛生行 政 の観点 か ら重 要な問題 で ある (Walker[lo2]).し か し, リスク要因へ の曝露 と
疾病発生 との因果関係 を調 べ る場合 には, 1)有 病状況 は疾病 の致命率 (疾 病 にかかった者 が
死亡す る割合 )や 治癒する割合 な ど治療技術 の進歩 に大 きく影響 を受 ける, 2)疾 病発生 を把
握す るとい うことは疾病発生前後 の状況 も観察 で きることにほかならない, とい った理 由か ら
有病 よ りも疾病発生 を用 い る こ とが好 まれ る (Rothman[76],pp.33-34).あ る 1時 点 の有病
状況 とリスク要因の同時分布 を調 べ る断面研究 (crOss― sectional studies)で は, 3節 で述 べ る
コホー ト研究 と同様 の手法 を用 いて,有 病割合 とリスク要因 との関係 を調 べ る場合 が ある.た
だ し,断 面研究 の主たる目的 は同時分布の把握 とい う実態調査であ り,有 病割合 とリスク要因
との関係 は仮説 ス クリーニ ングを目的 とした あ くまで も 2次 的な ものである
.
あ る集 団 にお ける疾 病発生状 況 につい て も,2通 りの とらえ方 が あ る (Elandt‐ Johnson
[15]).一 つ は疾病発生割合 (incidence prOportionま たは cumulat市 e incidence rate)で あ
り,研 究開始時 に将来疾病 にかか る可能性 のある対象者 の集団が一定期間中 に疾病 を発す る割
合 の期待値 で ある.以 下 では「将来疾病 にかか る可能性 のある対象者 の集団 (populatiOn at
risk)」 を「 リス ク集団」 と呼 ぶ ことにす る.疾 病発生割合 は少 な くとも転入 あるい は登録 に関
して閉 じた集団でなければ定義す ることはで きない.も う一つ は,疾 病発生率 (incidence rate)
で あ り, リス ク集団 の観察人 一時間 1単 位 当 た りの期 待疾病発生 数 で ある.疾 病発生割合 は無
次元数であるが,疾 病発生率 は時間 の逆数 の次元 を持 つ。 したがって疾病発生率 の逆数 は平均
生存 時間 として解釈 で きるので,生 存時間解析 と直接結 びつ ける ことが で きる。疾病発生率 は
転入 に関 して閉 じた集団で も,転 入,転 出 な どを許 す開 い た集団 (ダ イナ ミックコホー ト)で
も定義可能 で ある
.
2.2.曝 露の効果 の指標
簡単 のため リス ク要因へ の曝露 を受 けたグルー プ と受 けて いない グルー プ間 で疾病発生状況
を比較す る ことを考 えよう.曝 露 グループの疾病発生割合 を IPl,非 曝露 グループの疾病発生割
合 を IP。 とする。曝露 によ り疾病 の発生 が どの程度増加す るか を定量 的 に計 る指標 としては,2
グルー プの疾病発生割合 の単純 な対比 で ある,疾 病発生割合 の差 IPD=IPl― IP。 と疾病発生割
合 の比 IPR=IP1/1POが 用 い られ る (Greeniand[26]).疾 病発生割合 の差 は曝露 による疾病発
生割合 の絶対的な変化であ り,「 曝露 を受 ける ことで疾病発生 が何 %増 えるか」を表す.ま た疾
病発生割合 の比 は曝露 による疾病発生割合 の相対 的 な変化 であ り,「 曝露 を受 ける ことで疾病発
生が何倍 になるか」 を表す.疾 病発生割合 は閉 じた リスク集団で しか定義 で きないので,疾 病
発生割合 の差 や比 も閉 じた リス ク集団 での曝露効果 の指標 で ある.例 えば, リス ク要因 へ の曝
露 が胎児 に与 える影響 を調 べ る場合や急性 中毒 のよ うに,一 定 の期間 の間 に疾病 を発生するか
496
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
どうか (出 産 時 に生 存 して い るか どうか,短 時 間 に 中毒 を起 こす か どうか )が 重要 な場 合 に有
効 な効 果 の指標 とな る.
一 方慢性疾 患 の疫 学研 究 の よ うに観察期 間 が 長 期 にわ た る場 合 ,対 象者 の登 録 に は長 い時 間
がかか り,ま た対 象者 の死亡 ,転 出 な どの観察 打 ち切 りが 問 題 に な つて くる.こ の よ うに転 入 ,
転 出,死 亡 な どを許 す開 い た集 団 を長期 間観 察 す る必 要 が あ る場合 に は,疾 病発 生割合 は定義
で きな い ので曝露 グ ルー プ と非 曝露 グ ルー プ間 の疾病発 生 率 を比較 す る.曝 露 グルー プの疾病
発 生率 を 訳 1,非 曝露 グ ルー プの疾病 発 生 率 を ″ 0と す る と,疾 病発 生 割合 と同様 に,疾 病 発 生
率 の差 ∬D=駅 1-IROと 疾病発 生率 の比 IR=′ 1/1ROを 曝露 の効果 の指標 として用 い る。慢
性疾 患 の疫学 で はある期間内 に疾病 を発生す るか どうか よりも,疾 病 が発生す るまでの時間が
どの くらいか に興味 が あ るので,疾 病発生率 と生存解析 との関係 か ら JRDや 拓Rが 適切 な効
果 の指標 となる
次節以降 で は,さ まざまな疫学研究 のデザイ ンか ら疾病発 生割合 の差 IPD,疾 病発 生割合 の
比 IPR,疾 病発生率 の差 ∬D,疾 病発生率 の比 豚R,を 推定 す る方法 を述 べ る。
.
3.コ ホ ー ト研 究
説明 を簡単 にす るため リス ク要因 へ の曝露状況 は曝露 を受 けたか (E=1),受 けなかったか
(E=0),疾 病 に関 して も疾病 を発生 したか (D=1),し なかったか (D=0),に それぞれ 2分 類 さ
れた場合 を考 える。2節 で述 べ た疾病発生割合 や疾病発 生率 を推定す るための自然 な研究 デザ
イ ンは,曝 露 を受 けた リス ク集団 と曝露 を受 けなかった リスク集団 を一定期間追跡 して,研 究
コ
対象 としてい る疾病 を発生 した数 を数 え上 げる ことである.こ のような研究デザイ ンは ホー
へ
ト研究 (cohort studies,ま たは前向 き研究 prOspective studies)と 呼 ばれ, リスク要因 の曝
い
露 か ら疾病発 生 まで,時 間 の流れ と因果関係 を調 べ る順序 が一致 していて,実 験 に最 も近 自
然 な研究 デザイ ンで ある.コ ホー トとはラテ ン語 で古代 ローマ の軍隊 の一分隊 を指すが (Last
[46]),疫 学研究 で は「特定 の集団」 とい う意味 で用 い る
.
3.1 単純 な解析
曝露 グループ,非 曝露 グループの研究開始 時 の リスク集団 の総数 を М ,M,観 察期間内 の期
待疾病発生数をA,Bで 表そう.す ると,疾 病発生割合は曝露グループでIPl=4/Nl,非 曝露グ
ル ー プ で IPO=B/NOと な る 。 コ ホ ー ト研 究 で は IPl,IPOと も に 推 定 す る こ とが で き る の で ,疾
病発生割合 の差 〃り=IPl― IPOも ,疾 病発生割合 の比 IPR=IP1/1POも 簡単 に推定できる.6節
で詳 しく述べ る「交絡 (confounding)」 が無視 できる場合,グ ループ グ(′ =1:曝 露 グループ
グ
=0:非 曝露 グループ)の 疾病発生数は独立 に 2項 分布 Bi(」PJ,М )に 従 うと考 えてよいことか
ら(Robins[65]),〃 り および IPRに 関する仮説検定や信頼区間 を求めることができる.我 々
が知 りたい「曝露 により疾病発生は増加 しない」 とい う帰無仮説 は「IPD=0」 または「IPR=
2検 などを用
定
1」
とい う仮説 と同値であり,こ の帰無仮説 の検定 には Fisherの 正確 な ρ値,χ
は log IPR
場合
Wald信
(IPRの
には
頼区間
いる (Rothman[76]).IPDや IPRの 信頼区間
い
に対 して)が よく用い られるが,efncient scoreに もとづ く信頼区間 も提案 されて る (Gart
,
and Nam[21,22]).
同 じ対 象集 団 に対 し,曝 露 グル ー プ の メ ンバ ー全員 の「 at risk」 の状 態 で観 察 で きた時 間 の
ルー プ,
合計 を 必 ,同 様 に非曝露 グル ー プの「at risk」 の合計観 察 時 間 を 14と しよ う.曝 露 グ
非曝露グループの疾病発生率は′1=A//1,訳 o=3/Zoで あり,コ ホート研究では疾病発生割
合 と同様に疾病発生率の差 拓D=″ 1-fRO,疾病発生率の比 漸R=′ 1/1POも 推定することが
で きる.交 絡 が 無視 で きる場合 に は,グ ルー プ グの疾病 発 生数 は独 立 に期待値 Z′ グのポア ソ
ン分布 に従 う と考 えて よい ので (Breslow and Day[8],pp.131-135),「 曝露 に よ り疾病発生
疫学研究における生物統計手法
497
は増加 しない」とい う帰無仮 説検定 のための Fisher― p値 や χ2検 定 ,ま た ∬り ,拓 Rの 信頼 区
間 を求 める ことが で きる.拓 Dお よび IRに 関す る推測 は (″ 1,IP。 について も),登 録 につ
いて閉 じた コホー トだけで はな く,転 入,転 出 な どの人 口動態 を全て許 したダイナ ミック コホ
ー トで も行 うことがで きる
.
3.2.層 別 解 析
疫学的観察研究 で は実験研究 と異 な り,曝 露 ―疾病間の因果関係 に影響 を与 えるか も知れな
い他 の要因 を全 て コ ン トロール して観察 を行 う ことは不可能 で ある.曝 露状況 と関連 してい る
疾病 の リス ク要 因が存在す る場合 ,そ の要因 を無視 して曝露 一疾病間 の解析 を行 う と,効 果 の
推定 にはバ イアスが入 る (6節 参照).例 えば,曝 露 グループ に年齢 の高 い者 が集中 してい ると
,
曝露 が死亡 を増 や さな くとも見か け上非曝露 グループ よ りも死亡割合が高 くなるだろう.こ の
ような現象 は「交絡」 として疫学 で は古 くか ら知 られて い るが,バ イアスのない効果 の推定 を
行 うには交絡要因 で層別解析 を実施 した り,モ デル を用 いて交絡要因 の調整 をする必要がある
層別解析 は簡単 な交絡要因調整 の方法 で あ り,コ ホー トデー タを交絡要因 の レベル に応 じて
.
,
それぞれの層 の中で は交絡 が無視 で きるよ うな層 に分 ける.各 層 ごとには曝露グルー プ と非曝
露グルー プ間で偏 りのない比較 がで きるようになるが,も し全 ての層 で疾病発生割合 の差 〃り
や比 〃ア が一定 の値 で あれば共通 な IPD,IPRの 推定値 を求 める こ とが正 当化 され る
共通 IPD,IPRの 推定方法 には最尤推定法,重 み付 き最小 2乗 法,Mantel‐ Haenszelの 方法
な どが あ る (Rothman[76]).層 別化 の方法 が「層 の数 は数個 で,各 層 に十分 な大 きさの標本
.
場合, どの推定法 か らも共通な IPD,IPRの 一致推定量 が導 かれ
しか も最尤推定量 ,重 み付 き最小 2乗 推定量 は漸近有効 となる.Mantel‐ Haenszel推 定量 は
large‐ strataで の効率 はしば しば最尤推定量 に上
Lべ てず いぶん落 ちるものの,「 各層 の標本数 は
数 が ある
(large‐ strata)」
,
,
少 ないが,層 の数 がた くさんある (sparse― data)」 場合 で も共通 IPD,IPRの 一致推定量 で あ
る.例 えば,曝 露 を受 けた個人 に対 し交絡要因 と考 えられ る変数 (年 齢 ,喫 煙歴,な ど)を マ
ッチ させて曝露 を受 けて いないコン トロール を数名選 ぶ デザイ ンは,マ ッチをとった一組 を 1
つ の層 とした sparse― dataの 典型例 で ある.[Sparse_dataと 小標本 を混 同 してはな らない.マ
ッチ したデザイ ンは sparse‐ dataで はあって も,全 体 の標 本数 は十分大 きい]最 尤推定量,重 み
付 き最小 2乗 推定 量 は sparse‐ dataの も とで は もはや 一 致性 を持 た な い (Greenland and
Robins[34]).共 通 IPD,IPRの Mantel‐ Haenszel推 定量 には large‐ strata,sparse‐ data両 方
で用 い る ことので きる信頼 区間 の方法 が提案 されてい る (Greenland and Robins[34];Sato
[81]).
疾病発生率 を問題 にしてい る場合 も疾病発生割合 と同様 に交絡 に対処す る必 要 が ある.層 別
解析 で交絡 を調整す る場合,各 層 で疾病発生率 の差 や比 IPD,漸獣 が一定 で あれ ば最尤推定
法,重 み付 き最小 2乗 法,Mantel‐ Haenszelの 方法 か ら共通 fRD,拓 訳 の推定値 を求める こと
がで きる.た だ し,共 通 JRD,共 通 JRの 重 み付 き最小 2乗 推定量 は large‐ strataで は一致推
定量 であるが,sparse‐ dataで は一致推定量 で はない.共 通 IRの 最尤推定量 は large‐ strata,
sparse‐ dataと もに一致推定量 であるが,共 通 拓Dの 最尤推定量 は sparse‐ dataで 一 致推定量
とはな らない (Sato[83]).一 方,共 通 ムリ ,IPの Mantel― Haenszel推 定量 は large‐ strata,
sparse‐ dataと もに一致推定量であ り,ど ち らの場 合 に も用 い る こ とがで きる信頼 区間 の方法
が与 えられてい る (Breslow and Day[8];Greenland and Robins[34];Sato[82]).
もし各層 で効果 の指標 が一定 とは仮定 で きない場合,効 果 の方向が層 によってまち まちで あ
れば もはや単一 の値 に要約する こ とはで きない (質 的 な交互作用).し か し,交 互作用 は存在す
るが効果 の方向 は全 ての層 で同方向である場合 (量 的な交互作用,ま たは効果 の修飾 )に は
交絡 の影響 をとり除 いて全体的な効果 を示す意義 が あ り,そ のための方法 が SMR(standard_
,
498
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号)1993
ized morbidity/mortality ratiO)な どに代表 される「標準化 (standardization)」
方である (Miettinen[57];Greenland[23,29])。
3。
3
とい う考 え
疾病発生 リス クの モデル化
層別解析 による交絡要 因 の調整 は簡便 で はあるが,調 整すべ き交絡要因 が全て 2値 変数 で あ
つた として も,10変 数 の交絡要因 を調整 す ると 1024の 層 がで きて しまう.交 絡要因 で マ ッチを
とったデザ イ ン以外で は,多 くの層 で標本 がゼ ロ とな り,も はや現実的な交絡 の対処方法で は
ない.多 くの交絡要因 を同時 に調整す る必要 が ある場合 ,連 続量 の交絡変数 を扱 う場 合 ,な ど
にはモ デル を用 い た交絡の調整が不可欠である.疫 学研究 で用 い る代表的 なモデル としては
,
個人 レベル の疾病発生 リスク (疾 病発生確率 )を モ デル化 した絶対 リス クモ デル (additive risk
model),
P(D=11E,Z)=微
十&E十 豫Z,
相対 リス クモ デル (relative risk model),
log P(D=11E,Z)=鉄 十β£ +豫Z,
が ある (Wacholder[98]).こ こで,P(D=11E,Z)は 曝露 Eと 交絡要 因 の組 Zを 持 つ個人 が疾
病 を発生する確率 ,Eは 曝露 を受 けた とき 1,受 けなかった とき 0で ある.こ れ らは曝露 と交
絡要因 との間 に交互作用がない場合 のモ デルで,一 般 には交互作用項 ,例 えば DEZ,を 含 めて
モ デル化 を行 う.曝 露 の効果 を表すパ ラメー タは,絶 対 リス クモ デル の もとで は疾病発生 リス
ク差
,
&=P(D=11E=1,Z)一 P(D=11E=0,Z),
相対 リス クモ デル の もとで は疾病発生 リスク比
,
αXの =
で あるが,こ れ らは集団 レベル の疾病発生割 合 の差 〃り ,疾 病発生割合 の比 IPRと 同 じものを
推定 して い る (Greenland[26]).
疾病発生 リスクには 0≦ P(D=11E,Z)≦ 1と い う制約があるが,絶対 リスクモ デル,相 対 リス
クモ デル はこの制約 を常 に満 たす とは限 らない.疾 病発生 リス クその ものや対数疾病発生 リス
クをモ デル化す る代わ りに対数疾病発生オ ッズを
,
10g互
E十 んZ,
ギ手乳弄曇暴髪軋下=銑 +β ι
とモ デル化す ることで,カ テ ゴ リカル デー タ解析 で最 も用 い られて い るロジス ティックモ デル
を得 る.ロ ジステ ィックモ デル で は,0≦ P(D=11E,Z)≦ 1の 制約 を自動的 に満 たすが,交 絡要
因 で調整 した効果 の指標
,
∝ ズの
=
は疾病発生オッズ比であり,疫 学的 に簡単な解釈はできない.し かし,研 究対象 としている疾
病 の発生が曝露グループ,非 曝露グループともに非常 にまれである場合,1-P(D=11E=1,Z),
1-P(D=11E=0,Z)と もにほぼ 1で あるから,exp(&)≒ exp(3)と なって近似的 に疾病発生
疫学研究における生物統計手法
499
リスク比 として解釈 で きる (Cornield[12]).
疾病発生が まれでない場合 には,ロ ジステ ィックモ デル 自体 に疫学的 な解釈 を行 うことはで
きないが,ロ ジステ ィックモ デルが正 しければ (デ ータに対 して当 てはまりが いい場合 )層 別
解析 と同様 にロジステ ィックモ デル を用 いて,標 準化 した疾病発生割合 の差 や比 を求 めること
がで きる (Greenland[29];Greenland and Holland[32]).モ デルが正 しい とき,こ のよう
な標準化 は層別解析 でのノ ンパ ラメ トリックな標準化 よりも精度 の いい推定値 を与 える
疾病発生率 を用 い る場合 も,多 くの交絡要因 を同時に調整 したい場合 や連続量 の交絡変数 を
調整す る場合,個 人 の疾病発生 率 をモ デル化す る必要が生 じる.時 刻 tに お ける個人 レベル の
.
疾病発生率 γ(′ IE,Z)に ,時 間 に関係 した部分 と曝露効果な ど時間 に関係 しない部分 との乗法
モ デル を仮 定 した
,
log γ(′ IE,Z)=log α(′ )十 βcE+7cZ,
が生存時間解析 で用 い られ る Cox回 帰 [13]で あるe COX回 帰 は E=0,Z=0の ときの疾病発
生率 α(′ )(ベ ース ライ ンの疾病発生率 )に はノ ンパ ラメ トリックに特別 な仮定 を置 かず,曝 露
効果 な どにはパ ラメ トリックな仮定 を置 い たセ ミパ ラメ トリックモ デルで あるが,推 定 には部
分尤度 (partial likelihood)│こ もとづいた複雑 な計 算 を必要 とす る.こ のほか放射線被曝 や職
業曝露 のモ デル化 で は疾病発生率 に加法 モ デル を仮定 した過乗Jリ ス ク (exess risk)モ デル を用
い る場 合 もある.共 変量 データが個人 レベルで はな く,(E,Z)が カテ ゴ リ化 された集団 レベル
で得 られて い る ときに は,疾 病 発 生率 の モ デ ル化 に はポア ソ ン回帰 を用 い る こ とが で きる
(Breslow and Day[8]).
3.4 コホ ー ト研 究の例
おそら く最 も有名 な コホー ト研究 の例 は,1948年 か ら Boston郊 外 の住宅地 Framinghamで
約 4500名 の 自人 を対象 に実施 された Framingham Heart Studyで あ ろう (NHLBI[61]).
Framingham Studyで は冠状動脈性疾患発生 の リス ク要因 を探索す る ことを目的 に,研 究開始
時 に冠状動脈性疾患 を発症 して い ない対象者 の喫煙 歴,血 圧 ,血 清 コンステ ロール レベル な ど
を測定 した.引 き続 いたフォロー ア ップの結果,研 究開始時 に血圧及 び コンス テ ロールレベ ル
の高 い人 は冠状動脈性疾患 を発生 しやす い ことが分 かった.し たが って,血 圧 や コンステ ロー
ル レベルが高 い ことは,そ れ まで考 えられていた ように疾病 の結果 ではな く冠状動脈性疾患 の
病因 の一部 で ある ことが判明 した.疫 学的,医 学的 な知見 だけで はな く,Framingham研 究 で
は リス ク要因 の解析 方法 として ロ ジステ ィ ックモ デ ルが 用 い られた こ とで も有名 で あ る
Framingham研 究 は,現 在 で は全米 4ヶ 所 で黒人 を対象 に含 めた 16,000人 の成人 を追跡 して
.
い る,動 脈硬化症 の リス ク要因 を探 るための Atherosclerosis Risk in Communities Study
(ARIC[92])に 受 け継 がれてい る。
我 が 国 の大規模 コホー ト研究 の例 としては「 コホー ト研究 による発 がん要因 の評価 に関す る
研究班 (文 部省 がん特別研究総括班 内研究班 ,班 長青木國雄 )」 が挙 げられ る.こ の コホー ト研
究 は複数 のがんの リス ク要 因 を探 索す る目的 で,10万 人 の対象者 を 10年 以上追跡す る ことを
目標 に 1988年 か ら研究 を開始 してい る.そ の中で は血 清 の凍結保存 を行 うな ど,5節 で述 べ る
新 しい研究 デザイ ンに対応 で きるように配慮 されてい る
本節 で はコホー ト研究 を観察研究 として紹介 したが,曝 露 をラ ンダムに割 り付 ける ことが可
.
能 な場合 ,例 えばラ ンダム化臨床試験 ,も コホー ト研究 の一部 として考 える ことがで きる.ラ
ンダム化臨床試験 に関 しての統計手法 や問題点 は広津 [39]の レビュー を参照 してほしい.ラ
ンダム化臨床試験 は比較的 コン トロール可能 な臨床 の場 で治療 を目的 として行 われ るが,地 域
集団 な ど実際 に公衆衛生対 策 を行 う現場 で疾病 の予 防法 をラ ンダムに割 り付 けて比較 を行 う
,
500
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
介入研究 (intervention trials)も 広 い意味 での コホー ト研究 で あ り,そ のデザイ ン,解 析方法
な どは本節 の内容 を用 い る ことがで きる
.
コホー ト研究 は集団 を前向 きに追跡 してい るので, 1つ の曝露 につ いて広範 な健康影響 (複
数 の疾病 )を 調 べ る ことがで きる,疾 病発 生前 の生体 の生理 的・ 生化学的情報 が得 られ る (疾
病 の 自然史 を調 べ られ る),く り返 し測定 がで きる,な どの利点が ある.ま た,曝 露,非 曝露別
に対象者 をサ ンプルで きるので,曝 露 が まれな場 合 (職 業曝露 のように集団中の一部 だけが曝
露 を受 けてい るような状況 )で も有効 なデザイ ンで ある.一 方,対 象 としてい る疾病 が まれで
ある場合 には,大 規模 な コホー トを長期間追跡 しなけれ ば十分 な疾病発 生が観察 で きない ので
,
時間 とコス トがかか る とい う欠点 を持 って い る (Breslow and Day[8]).
4.ケ ース・ コン トロ…ル研 究
コホー ト研究 で は曝露 グループ と非曝露 グループ を一定期間追跡 して疾病発生状況 を調 べ た
が,同 じコホー トについて観察期間 が終了 した時点 で,観 察期間中 に疾病 を発生 した コホー ト
メンバ ーか らのラ ンダムサ ンプル (ケ ースグループ)と 観察終 了時 に疾病 を発生 してい ない メ
ンバ ーか らのラ ンダムサ ンプル
(コ
ン トロール グループ)に ついて過去の曝露状況 を上ヒ
較す る
ことを考 えてみ よう. これが古典的 なケース・ コン トロール研究 (caes‐ control studies,ま た
は後 ろ向 き研究 retrOspective studies)の デザイ ンであるが,通 常 はケース ◆コン トロール研
究 の背景 に現実 の コホー トを設定す る ことは難 しい.し たがって,ケ ース・ コン トロール研究
base population"は 何 か
ではまず収集可能 なケースが あ り,そ のケースが発生す るような “
を考察す る ことによ り適切 な コン トロール グループ を見 い だす必要がある (Rothman[76];
Wacholder et al.[99-101]).す でに疾病 を発 生 して い るケースが利用 で きるため,ケ ース・
,
コン トロール研究 は「 まれな疾病」 に対 して有効 な研究 デザイ ンで ある
.
4.1 単純な解析
ケース・ コン トロール研究 で は疾病発生割合 を推定す る ことはで きないので,外 部 か らの補
助情報 がない限 り疾病発生割合 の差 や比 を推定す る ことはで きない.推 定可能 なのは曝露オ ッ
ズ上ヒ
,
%泄部繰零瑞
OEE=辞 型
,
であ り,こ の曝露オ ッズ比 は観察打 ち切 りが曝露 とも疾病発生 とも独立 に起 こるときコホー ト
研究 か ら得 られ る疾病発生 オ ッズ比
,
"pギ 路推響覇鵠謝
=偽
,
=冷
に一致す る (Cordeld[12];Greenland and Thomas[36]).し たがって対象 としてい る疾病
の発生 が まれであれば,3.3節 に示 したように,曝 露 オ ッズ比 OREを 疾病発生割合 の比 IPRの
良 い近似 として用 い ることがで きる.ケ ース・ コン トロール研究 は「 まれな疾病」 に対 して有
効 な研 究 デザイ ンで あるので,「 まれな疾病」 の もとでの ORE≒ IPRの 関係 は疫学的 な曝露の
効果 の解釈 に重 要 で ある
ケース とコ ン トロールの曝露割合 の差 の検定
.
,
JfO:P(E=11D=1)=P(E=11D=0),
は「 ORE=1」 の検定 と同値 であ り ORE=α も の関係 か ら,曝 露グループ と非曝露 グルー プの
疫学研究 における生物統計手法
501
疾病 発 生 割 合 の差 の検 定「 P(D=11E=1)=P(D=11E=0)」 とも同値 とな る.0も の推定 に は
ケー ス とコ ン トロール の曝露者数 が それ ぞれ 独 立 な 2項 分布 に したが う と仮 定 した場 合 の最尤
法 ,合 計 曝露者 数 を固定 した非 心超 幾何 分布 に も とづ く条 件 付 き最 尤 法 な どを用 い る (Gart
[20];Walter and C∞ k[103]).ま た,OREの 信頼 区間 は Wald信 頼 区間 の他 ,emcient score
にもとづいた Cornieldの 方法,ブ 巨い超幾何分布にもとづいた正確な方法を用いて求めること
が で きる (Breslow and Day[7]).
4.2.層 別 解 析
コホー ト研 究 と同様 に,交 絡 が 存在 す る場 合 に はケ ー ス・ コン トロール研 究 で も交 絡 を無視
した解析 は曝 露効 果 の推定 にバ イア スが 入 る。 交絡 の調整 に は,層 別 解析 ,モ デ ル を用 い た調
整 ,の 2通 りの方法 が 存在 す る.層 別 解析 の考 え方 は コホー ト研 究 の場合 と全 く同 じで あ り,
交絡要因のレベルに応じて交絡が無視できるような層に分ける.全 ての層でオッズ比の値がほ
ぼ一定 であれば,共 通 なオ ッズ比 の推定値 を,最 尤法,条 件付 き最尤法,重 み付 き最小 2乗 法
Mantel‐ Haenszelの 方法 か らそれぞれ求 める ことがで きる.ケ ース・ コン トロール研究 で も層
,
別 の方法 には,層 の数 は数個 で各層 の標本数 は十分大 きい large‐ strata,ケ ース 1例 に対 し交絡
要因 をマ ッチ させた コン トロール を 1な い し数例選択 す る sparse‐ dataが 存在 する.最 尤法,条
件付 き最尤法,重 み付 き最小 2乗 法 による共通 オ ッズ比 の推定量 は large― strataで 一致性 を持
ち しか も漸近有効 である。しか し,最 尤推定量 と重み付 き最 小 2乗 推定量 は sparse― dataで は一
致性 を持 たな い (Breslow[4])。 条件付 き最尤推定 量 と Mantel― Haenszel推 定量 は large‐
strataで も sparse― dataで も共通 オ ッズ比 の一 致推定量 で あ る.特 に Mantel‐ Haenszel推 定量
は計 算 が簡単 で,large¨ strata,sparse‐ dataと もにパ ラメー タの広 い範囲で漸近相対効率 が 90
%以 上 となる ことか ら:「 全 ての層 で曝露 の効果 はない」とい う帰無仮説 の Mantel‐ Haenszel検
定 とともに疫学研究 で最 も良 く使用 されてい る統計手法 となって い る (Mantel and Haenszel
[54];Gart[20];BresloW and Day[7];Rothman[76]).
共通 オ ッズ比 の信頼 区間 として は,large― strataで 利用 で きる Cornfleldの 方法 を拡張 した も
の (Gart[20]),large_strata,sparse‐ dataの 両方 で用 い る ことがで きる Mantel‐ Haenszelの
較的計算 が簡単 で,中 程度
方法 に もとづいた信頼 区間 (Robins,et al.[68];Sato[82])力 汁ヒ
にもとづ いた正確 な信頼 区
の
積
で
は
い
超幾何分布
い
ブ巨
の標本数 で も性質 の よ 方法 である.最 近
間 を高速 に計算す るアルゴ リズムが提案 され,統 計 パ ッケージにも組 み込 まれてい る (Mehta
et al.[55];Vollset et al.[97];Takagi[89];Mehta and Walsh[56]).正 確 な信頼 区間 も
large‐ strata,sparse‐ data,ど ち らで も用 い る ことがで きる.共 通 オ ッズ比 を求めるための前提
で あ る「各 層 のオ ッズ比 が 共通 で あ るか どうか」 を調 べ るための予備検定 として,有 名 な
Breslow― Day検 定 を初 め とした「オ ッズ比 の均一性検定」が提案 されてい る (Breslow and Day
[7];Liang and Self[48];Tarone[91];Yanagawa and Fui五 [106]).た だし,均 一性検定
は一般 に検出力 が低 い ことに注意 して使用 しなければな らない (Greenland[24];Jones et al.
[41]).各 層 でオ ッズ比 が共通 であると仮定 で きない場合 には,標 準化 したオ ッズ比 を曝露効果
の指標 として用 い る こともで きる (Miettinen[57]).
4。
3. ロジステ ィックモデル
調整すべ き交絡要因 の数が多 い場合 ,ま たは連続的な交絡変数 を調整す る場合 にはモ デル を
用 いた調整 を行わなけれ ばな らない.疾 病発 生オ ッズ比 と曝露オ ッズ上ヒが等 しい ことか ら
,
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
∝Xの =
=ギ
壬
垂
夢
曇
袈
曇
誰
尋
告
キ
霧
10畢罪
f甥 講
務
審
菱
,
が成立 し,コ ホー ト研究 での ロジステ ィックモ デル とほぼ同 じモ デル
,
10g T曇
讐鶴饗昇テ曇可
=α彦十&E十 んZ,
がケース・ コ ン トロール研究 か らも得 られ る.&の 推定 はケース・ コン トロール デー タが あた
か もコホー ト研究 か ら得 られたかの よ うに扱 う ことで実行 で きる (Mantel[53]).
マ ッチ ングを行 ったケース・ コン トロール デー タの解析 には,条 件付 きロジステ ィックモ デ
ル を用 いて &を 推定 する必要 が ある (Breslow and Day[7]).条 件付 きロジステ ィックモ デ
ル は計算量 が多 いため,Mantel‐ Haenszelの 方法 を拡張 した推定方程式 を用 い るロジステ ィッ
クパ ラメー タの推定方法 が提案 されてい る (Liang[47]).そ の一 方 で,条 件付 きロジステ ィッ
クモ デルで仮説検定 を行 うための コ ンピュー タ・ イ ンテ ンシブな正確 な方法 も提案 され,漸 近
的な検定方法 との比較 がなされてい る (Hirii[38]).
4.4 ケ ース・ コン トロール研 究の例
ケース・コン トロール研究 の有名 な例 として,diethylstilbestrol(DES)と 腟 がん との関連 を
紹介 しよう.思 春期 の女児 に非常 にまれな腟 がんが同一の病院 で 8例 続 けて発生 し,腟 がんの
ケース 1例 に対 し出生 日の近 い コン トロール を 4例 マ ッチ させたケース・ コン トロール研究 が
実施 された (Herbst et al.[37]).対 象者 の初経年齢 ,既 往歴 ,母 親 の喫煙 歴,妊 娠時の X線
被曝 な どさまざまな要 因が比較 されたが, どれ も有意 で はなか った.唯 一有意 な関連 が見 られ
たのは,妊 娠初期 のエ ス トロジ ェン (DES)投 与 であ り,マ ッチ した 8組 中 7組 はケースの母
親 が妊娠中 に DESを 投与 されてお リコン トローノ
ンの母親 は全て DES投 与 な し,残 りの 1組 は
ケース,コ ン トロールの母親 ともに DES投 与 はなかった.こ のデー タか らオ ッズ比 の推定値 と
上側信頼限界 は無限大 で あるが,正 確 な下側 97.5%信 頼限界 は 7.5で あ り(Mehta and walsh
[56]),強 い関連 が観察 された
このようにケース・ コン トロール研究 は,コ ホー ト研究 に上ヒベ時間 もコス トもかか らない
.
,
まれな疾病 に適 してい る,対 象 としてい る疾病 の原因 と考 えられる要因 を複数調 べ る こ とがで
きる, とい う利点 が ある.そ の反面 ,ケ ース・ コ ン トロール研究 で は曝露 と交絡要因 に関す る
情報 を過去 にさかのぼって調 べ なければな らない ので情報 が不 正確 にな りがちで ある.コ ホー
ト研究 と異 な り,ま れな曝露が原 因 であるような疾病 には大量 のケース とコン トロール を必要
として有効 なデザイ ンとはな らない.ま た,ケ ース は過去 に原因 として思 い当たる ことをよ く
記憶 してい るが,疾 病 を発生 してい ない コン トロール は同 じ曝露 を受 けていて も記憶 していな
い,と い う思 い出 しバ イアスな どコホー ト研究 で は起 こ らない さまざまなバ イアスが入 りがち
である (Kelsey et al.[42]),と い う欠点 が ある
.
5.新 しい研 究デザイ ン
3節 , 4節 で述 べ た コホー ト研究 とケース・ コン トロール研究 の長所 ,短 所 は相 互 に補完的
である (Mantel[53]).こ のため コホー ト研究 を実施 しなが らケー ス・ コ ン トロール研究 を行
う とい うコホー ト内 ケース・ コ ン トロール研究 の手法 が提案 されてい る。 ケース・ コ ン トロー
503
疫学研究における生物統計手法
ル研究 で問題 となる曝露情報 に関す る不正確 さは対象者 を前向 きにフォロー ア ップ して い る こ
とで 回避 で きるし,詳 細 な情報収集 は全 コホー トの一部 につ いてのみで いいので曝露効果 の推
定効率 をあ まり落 とさず にコホー ト研究 で問題 となるコス トを減少 させ る ことがで きる.本 節
で は最近 になって提案 された研究 デザイ ンで ある,ネ ス テ ッ ド・ ケース・ コン トロール研究
(nested case‐ control studies),ケ
ース・ コホー ト研究
(case― cohort
studies), 2段 階 ケース・
コン トロール研究 (two stage case‐ control studies),を 紹介す る
5。 1.ネ ステ ッ ド
・ ケ ース・ コン トロール研 究
。
ネステ ッ ド ケース 0コ ン トロール (シ ンセ ティック 0ケ ース・ コン トロール とも呼 ばれ る)
で は対象者 が疾病 を発生 しケース となった時点 で コン トロール を選択する.最 も一般的 な コン
.
トロール選択 の方法 は「ケー スが発生 した時点の リスク集団か ら 1人 またはそ.れ 以上の コン ト
ロール をラ ンダムに選択す る」時点 マ ッチ ングである (Liddell et al.[50];Miettinen[58]).
曝露 や交絡要因 に関す る情報 はケース と選 ばれた コン トロールにつ いてのみ収集 すれ ばよいの
で,コ ス トの節約 が期待 で きる.こ のデザイ ン は,閉 じた コホー ト,ダ イナ ミックコホー トど
ちらで も用 い る ことがで きる.ケ ース発生時点 で コン トロール をマ ッチさせてデー タを収集す
るため,デ ー タの解析 には 4節 で述 べ たマ ッチ ングを考慮 した解析 である Mantel‐ Haenszelの
方法 や条件付 きロ ジステ ィックモ デル,を 用 いてオ ッズ比 を推定 し信頼 区間 を求めれば よい
.
このデザ イ ンか ら得 られ るオ ッズ比 は正確 に疾病発 生率 の比 漸Rを 推定 してお り,古 典的 な
ケース・ コン トロール研究 と異 なってオ ッズ比 の解釈 に「 まれな疾病の仮定」 を必要 としない
とい う利点 が ある (Liddell et al.[50];Greenland and Thomas[36]).
コン トロール の選択 には,将 来疾病 を発生す る対象者 やケース本人 もコン トロール として選
ばれ る可能性 の あ る ことに注意 しなければな らない.ケ ースが 自分 自身 の コン トロール として
選 ばれ るか もしれない, とい う ことは一見奇妙 に感 じるが生存時 間解析 の観点 か ら正当化す る
ことがで きる.コ ホー ト研究 で曝露 グループ と非曝露 グループに対 し生存時間解析 ,Cox回 帰
を実施す る と想定 しよう.た だ し,疾 病発生 の直前 の リス ク集団 (生 存時間解析 では「 リスク
セ ッ ト」 と呼 ばれ る)全 体 についての部分尤度 は大変 な計 算 となるので, リス ク集団か らのラ
ンダムサ ンプル をとり,そ のサ ンプルについてだ け部分尤度 を計 算 す る ことに しよう。Cox回
帰 の部分尤度 と条件付 きロジステ ィックモ デル の条件付 き尤度 は等 しいので,こ れ はネステ ッ
ド・ ケース・ コン トロール デザイ ンにほかな らない (Thomas[93];Prentice[63]).し たが
って,時 点 マ ッチ ングを行 って もリス ク集団全体 か らのラ ンダムサ ンプルで はな く,例 えば
観察期間 を通 じて疾病発生 がなかった者 (古 典的 なケース 。コン トロール研究 での コ ン トロー
,
ル の候補 )の みか ら コン トロー ル を選択 す る と,疾 病発 生率 の比 の推定 にバ イア スが 入 る
(Lubin and Gail[51]).
「ケースが発生 した時点 の リスク集団か ら 1人 またはそれ以上 の コ ン トロール をラ ンダム に
選択す る」方法 は,一 度 コン トロール として選 ばれた人 が別 の時点 で コン トロール として選 ば
れ る可能性 が何度 で もある (リ ス ク集団を全部用 いた生存時間解析 で は疾病発生 や打 ち切 りが
起 こるまで,全 ての時点 で コン トロール として選 ばれてい る ことになる).こ の ことか らコン ト
ロール選択 のオプシ ョンとして「一度 コン トロール として選 ばれた人 は,そ れ以降 はコン トロ
ールに選 ばない (た だ し,ケ ースにはな り得 る)」 ,「 一度 コン トロール として選 ばれた人 は,そ
れ以 降 は疾病発 生や打 ち切 りが起 こるまで常 に コ ン トロール として用 い る」 な どが提案 され
IRRの 推定効率 を上 げる ことが期待 されたが,複 雑 な コン トロールの選択 を行 って もそれほど
の効率 の増加 は見 られない ようである (Robins et al.[69,72];Prentice[63];Langholz and
Thomas[45]).ま た,ネ ステ ッド0ケ ース・ コ ン トロール研究 で は交絡要因 な どに関 す る詳細
な情報 はケース とコン トロールについて しか収集 してい ないが,曝 露 と疾病発生 に関 して はコ
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
ホー ト全体 のデータが利用 で きる場合 がある.こ のような場合,コ ホー ト全体 のポアソン回帰
の尤度 とケース とコン トロールの条件付 き尤度 が直交す る ことか ら,コ ホー ト全体 の情報 を加
えて疾病発生率 の比 を精度良 く推定す る方法が提案 されて い る (Thomas et al.[94]).
5.2. ケ ース・ コホ ー ト研 究
ネステ ッド・ ケース・ コン トロール研究 で はケースにマ ッチさせて コン トロール を選択す る
ため, 1つ の曝露 と 2つ の疾病 との関係 を調 べ たい場合 ,コ ン トロール グルー プ も 2つ 必要 と
なる.コ ホー ト研究 で は曝露 が複数 の疾病 に影響す るか どうか を調 べ る こ とがで きたが,コ ホ
ー ト研究 の枠 のなかでケース・ コン トロール研究 を実施 してい るのだか ら,複 数 の疾病 との関
連 を調 べ る場合 で も 1つ の コ ン トロール グルー プですむはずで ある.ケ ニ ス・ コホー ト研究 は
このよ うな考 え方か ら提案 されたデザ イ ンで,コ ン トロール グループ (サ ブ コホー トと呼 ぶ)
は観察開始時 の リス ク集団 (全 コホー トメ ンバ ー)か らあ らか じめラ ンダムに選択す る (Kupper
et al.[44];Miettinen[59];Prentice[62]).ケ ース グループ としては全 てのケース を用 いて
も,全 ケースか らのラ ンダムサ ンプル を用 いて もよい.ケ ース・ コホー ト研究 で も,曝 露 と交
絡要因 に関す る詳細 な情報 はケース と全 コホー トの一部 で あるサ ブ コホー トについてのみ集 め
ればよいので,コ ホー ト研究 に比 べ て コス トの節約 が期待 で きる
ケース・ コホー トデー タでは,閉 じた コホー トで観察打 ち切 りが曝露 とも疾病発生 とも独立
.
な場合,サ ブ コホー トか らコホー ト全体 の曝露割合 P(E)を 推定 で きる.し たがって,曝 露オ ッ
ズ上ヒは
,
"が
=IPP,
=f路 諜謂野梶半
と正 確 に疾病発生割合 の比 に一 致 し,こ れ に は「 まれ な疾 病 の仮 定 」を必 要 としな い.OR」 の
最尤推定量 とその近 似 的 な分 散 は closed‐ formで 与 え られ て い る (Sato[85]).ま た層別解析
で 交絡 要因 を調整 す る場 合 ,各 層 に共通 な αけ は large‐ strataで は最 尤 法 や重 み付 き最 小 2
乗 法 ,large‐ strata,sparse‐ data両 方 で禾U用 で きる Mantel‐ Haenszelの 方法 か ら推定 で きる し,
効 果 の修飾 が あ る場 合 には標 準 化 した疾病 発 生 割 合 の上ヒを推 定 す る こ とが で きる (Greenland
[25];Sato[84])。
これ らの方 法 は競 合危 険 (competing risk)に よる観察 の打 ち切 り (研 究
対 象 で はな い疾病 の発生 や死 亡 に よ リリス ク集 団 か ら除 かれ る こ と)が 効 果 の推定 に あ ま り影
響 を与 えな い場 合 の 推 定 方 法 で あ るが ,競 合 危 険 の 影 響 を補 正 す る方 法 も提 案 され て い る
(Flanders et al.[17]).
ネ ス テ ッ ド 0ケ ー ス・ コ ン トロール研 究 と同様 に生 存 時 間解析 の考 え方 か ら,ケ ー ス とケ ー
スが 発 生 した時点 のサ ブ コ ホー ト中 の リス ク集 団 とを上ヒ較 す る ことで疾病発生率 の比 を推定 す
る こ とが で きる.こ の場合 に も「 まれ な疾病 の仮 定」 は必 要 とせ ず に疾病発生率 の比 を推定 で
きるが ,推 定 方法 は複雑 で あ り現 在 の ところ統計 パ ッケー ジに は組 み込 まれ て い な い (Prentice
[62]).
5.3。
2段 階 ケ … ス・ コン トロール 研 究
2段 階 ケ ース 0コ ン トロール研究 は,第 1段 階 で対 象者全体 に対 し曝 露 と疾病 に関 して ス ク
リー ニ ング を行 い,第 2段 階 で その対 象者 の一 部 につ い て交絡 要因 な どの詳細 な情報 を収集 す
る研 究 デザ イ ンで あ る.ネ ス テ ッ ド・ ケー ス 0コ ン トロール研 究 や ケー ス・ コ ホー ト研 究 も,
最初 に全 コホー トメ ンバ ー に関す る曝露情 報 を収 集 して疾病 発 生 を フ ォ ロー ア ップ し,曝 露 や
交絡 要 因 な どに関 す る詳細 な情 報 は全 コ ホー トの一 部 か らしか収集 して い な い ので ,広 い意 味
で は 2段 階 デザ イ ン と考 える こ とが で きる (Flanders and Greenland[18];Zhao and Lipsitz
[107]).典 型 的 な 2段 階 ケー ス・ コ ン トロール研 究 は,第 1段 階 で「 曝露 を受 けた ケ ー ス」,「 曝
疫学研究 にお ける生物統計手法
505
露 を受 けた非 ケー ス」,「 曝露 を受 けて いない ケー ス」,「 曝露 を受 けてい ない非 ケース」 をス ク
リーニ ング的に同定す る。続 いて第 2段 階 で は「曝露 を受 けたケース」 にウ ェー トを置 いて数
多 くサ ンプル し詳細 な情報 を得 る ことで,曝 露 も疾病 の発 生 もともにまれである場合 に有効 な
デザイ ンとす る ことがで きる (Miettinen[59];White[104]).コ ホー ト研究 は「曝露 が まれ
である場合」,ケ ース 0コ ン トロール研究 は「疾病発 生 が まれである場合」に有効 なデザイ ンで
それぞれ逆 の場合 には不適切 であったが, 2段 階 ケース・ コン トロール研究 は この欠点 を解消
,
したデザイ ンで あ る
第 2段 階 のサ ンプ リングが古典 的 なケース・ コン トロール研究 のようになされ た場合 ,ロ ジ
ステ ィックモ デル による曝露効果 (オ ッズ比 )の 推定 が可能 である。 ロジステ ィックパ ラメー タ
の推測 に関 しては最尤法 (Breslow and Cain[6])が 提案 されてお り,通 常 の ロジステ イック
.
モ デル に第 2段 階 での対象者 のサ ンプル割合 を定数項 (olset)と して加 える ことで,既 存 の統
計 パ ッケージを使 つてバ イアスのない推定値 ,分 散共分散行 列 を得 る ことがで きる.こ のほか
に も pseudo‐ likelihoodに もとづ く方法 (Flanders and Greenland[18]),推 定方程 式 にもと
提案 されてお り,第 2段 階 のデー タをネステ ッド・ ケ
づ く方法 (Zhao and Lipsitz[107])ヵ ゞ
ース・ コン トロールの ように時点 マ ッチ ングを行 ってサ ンプル した場合 ,pseudo‐ likelihoodに
もとづ く推定法 はポアソン回帰 や Cox回 帰 モ デル のパ ラメー タ (疾 病発生率 の比 )推 定 に容易
に拡張 で きる
ネステ ッ ド 0ケ ース 0コ ン トロール,ケ ース・ コホー ト,第 2段 階 ケース・ コン トロール と
い ったデザイ ンは,コ ホー トのメ ンバ ー に関す る曝露情報 ,交 絡要因 に関す る情報 がすでにデ
ー タベ ースに登録 されてい る場 合 ,簡 単 に実施 す る ことがで きる.ま た,血 中の微量成分 の測
定 が必要 な場合 ,特 に測 定 の コス トが高 ければ,血 液 (ま たは血清)を 凍結保存 じ選 ばれたケ
.
ース とコン トロール についてのみ解凍 して測定 を行 えばよい ので,コ ホー ト全体 を測定す る場
合 に比 べ てかな りの コス トを節約 で きるだ ろう (Prentice[62];BresloW and Day[8]).実
際 に,16,000人 のフォロー ア ップを実施 してい る ARIC[92]で はコス トを考慮 して解析 には
ネステ ッド・ ケー ス・ コン トロールデザイ ンを用 い てい るし,デ ンマー クの病院外来登録 を用
いて女性 を対象 に仕事 のス トンス と妊娠 へ の影響 を調 べ たケース 0コ ホー ト研究 も実施 されて
い る (Brandt and Nielsen[2]).
6.疫 学研究 における因果推論
疫学研究 の多 くが「ある要 因 に曝露 され る ことが疾病発生の原因であるか どうか, とい う因
果関係 に関す る研究」 であるため,因 果関係 の判定 をめ ぐって古 くか らさまざまな議論 がなさ
れてい る。本節 で は最初 に疫学研究 における因果関係 の考 え方 についての非統計的 な議論 を簡
べ
単 に述 べ,つ いで因果関係 に関す るモ デル とその適用例 として交絡 の定義 について述 る
.
6.1.疫 学 と因果 推論
因果関係 についての疫学的 な議論 は誤解 されてい る部分 が 多 い.そ の代表的 な ものが「因果
関係判定 のための条件」として紹介 されて い る様 々な判断基準 である.例 えば Surgeon General
9条 件
の 5条 件 (Uo S.Department of Health,Education and Welfare[95]),Hillの
(Rothman[76]),Evansの 12条 件 (Last[46])な どが有名 である.「 これ らの判定条件 を満
た してい るので因果関係 が証明 された」 と結論す る論文 を見 か けるが,明 らかに観察研究 か ら
因果関係 を証明す る ことはで きない.仮 説的 な因果関係 を示唆す る結果 をた くさん集 めれば
研究者 が仮説的 な因果関係 を真実である と信 じる度合 い は増すか もしれない.し か し因果推論
,
で重 要 な ことは,個 人 が仮説 を信 じるか どうかで はな く,仮 説 が真実 であるか どうかである
因果関係 を証明す る ことはで きないが, もし仮説的 な因果関係 か ら演繹的 に導 かれ る予演Iを
.
506
日本 統 計 学 会 誌
第 22巻
第 3号
(増 刊号)1993
否定 す る よ うな観 察 が 行 われれ ば,仮 説 が 誤 って い る こ とを示 す こ とがで きる.因 果 関係 の仮
説 に対 して批判 的 な反証 (refutatiOn)を 繰 り返 し試 み る こ とに よって,そ れで も否定 しきれ な
い仮 説 は真 実 で あ る可能性 が 高 い (corroborable)と 考 える Popperの 立場 か ら科学 的 な疫 学研
究 を行 お う とい う試 みが な され て い る (Buck[9];Maclure[52])。 しか し,疫 学 は科学 の一
分野 で あ る と同時 に公衆衛 生活 動 を伴 う実践 的 な学 問 で あ る。 したが って,因 果 関係 を証 明 す
る こ とはで きな くとも,公 衆衛 生 対策 を とるた めの十分 な証拠 が集 まった時点 で迅速 な対 応 を
す る必 要 が あ る.「 因果 関係判 定 のための条件 」として紹介 され て い る判 断基準 は,決 して「 そ
れ を満 たせ ば因果 関係 が あ る と判 断 して よい条件 」 で はな く,正 し くは「 その一 部 で も満 たせ
ば公 衆衛生対 策 を考 えな けれ ばな らな い条件 」 で あ る.実 践 科 学 としての疫学 の立 場 か らは,
観察研 究 で は因果 関係 を証 明 で きな い こ とを理 由 に公衆衛 生対 策 が 遅 れ るよ うな こ とが あ って
はな らな い (Susser[88]).
Popperianの 主張 す る科 学 として の疫 学 と実践 家 の立 場 か らの公 衆衛 生 としての疫学 との 間
の因果推論 につ い ての議論 は Rothman[77]を 参 照 して ほ しい.
6。 2。
Counterfactualモ デ ル
これ まで の節 と同様 に曝露 E,疾 病 Dの 発 生 ともにあ り,な し
(1,0)に 2分 類 され て い る
としよ う.さ らに,曝 露 は人 為 的 に操作 可能 な もの とす る (性 ,年 齢 な ど操作可能 で な い もの は
個人 の特性 で あ り曝露 とは考 えな い ).因 果 関係 を考 え るモ デ ル として次 の ような決定論 的 な モ
デル を考 え よ う.あ る個人 iに つ い て 曝露状 況 Eに 応 じて疾病 を発 生 す るか どうか を,
D(グ ,E)=1:曝 露状 況 が Eの とき疾 病 を発 生 す る,
=0:曝 露状 況 が Eの とき疾病 を発 生 しな い
,
で表 す .決 定論 的 に は,個 人 グにつ い て a)曝 露 を受 けた か 受 けな いか にかかわ らず疾病 を発
生 す る,b)曝 露 を受 けた ときは疾病 を発生 す るが ,曝 露 を受 けな い ときは疾病 を発 生 しな い,
C)曝 露 を受 けた とき疾病 を発生 しな いが ,曝 露 を受 けな い ときは疾病 を発生 す る,d)曝
露
を受 けたか受 けな いか にか かわ らず疾病 を発 生 しな い,の 4つ の状 態 が 存在 す る (た だ し,我 々
は個人 ′が a一 dの どの状 態 で あ るか を知 らな い).個 人 レベ ル の 因果 関係 は,
D(グ ,E=1)一 D(グ ,E=0),
で表 す ことが で き,個 人 グに限 って は この値 が 0な らば曝露 の効 果 な し, 1な らば因果 的 な効
果 あ り,-1な らば予 防的 な効 果 あ り,と 判 断 で きる.
集 団 レベ ル の 因果推論 に関 して は,集 団 内 の D(′ ,E)の 割 合 の差 で あ る因果 リス ク差 (causal
risk difference),
CRD=P[D(′ ,E=1)=1]一
P[D(グ ,E=0)=1],
を用 い る こ とが で きる.因 果 リス ク差 は「 集 団全体 が 曝露 を受 けた場 合 の疾病発 生 割合 と,同
じ集 団全体 が 曝露 を受 けなか った場 合 の疾病発生割合 の差 」 で あ る.因 果 リス ク差 を因果 パ ラ
メー タ として考 え る こ とは,ラ ンダ ム化 臨床 試験 で正 当化 され る.一 方 ,観 察研 究 で は集 団全
体 に つ い て で は な く曝 露 グ ル ー プ に 限 つ た,曝 露 グ ル ー プ の 因 果 リス ク差 (causal risk
difference in the exposed),
CRDE=P[D(グ ,E=1)=11E=1]一
P[D(グ ,E=0)=11E=1],
つ ま り「曝露 グ ルー プの疾病 発生割 合 と,曝 露 グ ルー プが もし曝 露 を受 けて い なか った ら観察
され たで あ ろう疾病発 生 割 合 の差 」 を曝露効 果 の指標 として 用 い る.
507
疫学研究における生物統計手法
明 らか に,CRDの 場 合 ,E=1の 個 人 で は E=0の ときの疾病発生状況 ,E=0の 個人 で は E
=1の ときの疾 病発 生 状 況 を観 察 す る ことはで きな い.ま た CRDEで は曝露 グルー プが 曝露 を
受けなかった場合の疾病発生割合 P[D(グ ,E=0)=lE=1]を 観察することはできない.こ のモ
デル は観察 で きない仮想的 な状況 に もとづ いて い るので counterfactualモ デル と呼 ばれ,い く
つか の異 なった観点 か ら提案 されてい る.し か し,counterfactualモ デル の基本的な考 え方 は
ラ ンダム化 と関連 して Fisher, Neymanに までさかのぼることがで きる (Rubin[78, 79];
Copas[11];Holland[40]).も し曝露 の割 り付 けが ラ ンダムに行われ ていれば,我 々 は CRD
や
CRDEの バ イアスの ない推定値 を得 る ことが で きる
.
6.3.交 絡の定義
3節 ,4節 で は定義 ぬ きで交絡 を導入 したが,こ こで は counterfactualモ デル を使 って交絡
を定義 しよう.交 絡 の定義 として一般的に用 い られて きたのは「 (因 果連鎖 の中間 にない)あ る
要因 で調整 した場合 と調整 しな い場合で効果 の指標 の大 きさが変わるな らば交絡あ り」 とす る
効果 の指標 の変化 に もとづ く定義 (change in estimate criterion)で ある.こ の定義 で は効果
の指標 として疾病発生割合の差 を用 い るか,疾 病発生割合 の比 を用 い るか,あ るい はオ ッズ比
を用 い るかで,あ る要因 が交絡要因であるか どうかの判断が変 わ ってしまう とい う欠点がある
.
Counterfactualモ デルで は同一個人 で E=1と E=0の 疾病発生 が観察 で きることを要求 し
てい るが,現 実 の世界 で はどち らかの結果 しか観察 で きない.我 々 は曝露 グルー プが曝露 を受
けなかった場合 の疾病発生割合 P[D(グ ,E=0)=11E=1]の 代 わ りに非曝露 グループ の疾病発
生割合 P[D(ノ ,E=0)=11E=0]を 観察 し,疾 病発生割合 の差
,
IPD=P[D(′ ,E=1)=11E=1]― P[D(ノ ,E=0)=11E=0],
によ り曝露の効 果 を推定す る.曝 露 グルー プの理想の コ ン トロール グループで ある「曝露グル
ープが曝露 を受 けなかった場合」 と現実 の コ ン トロール グループで ある「非曝露 グループ」 の
疾病発生割合が異 なる場合 ,〃 り は曝露 の効果 としてバ イアスの入 った ものになって しまう
したが って
.
,
P[D(グ ,E=0)=11E=1]≠ P[D(ブ ,E=0)=11E=0],
で ある場合「交絡 あ り」 と定義す る と,効 果 の指標 によらない と定義 とな り「 コ ン トロール グ
ループの十分性 に もとづ く定義 (adequacy of the control group criteriOn)」
と呼 ばれる
(Greenland and Robins[35];Wickramaratne and Holford[105]).こ
の定義 は観察不可能
な量 を含 んでいるが,経 験的 に導 かれた交絡要因の必要条件 (Rothman[76]),観 察 されたデ
ー タだけか ら交絡 がない ことは示せない,な ど交絡 の性質 を演繹的 に導 くことがで きる
.
Counterfactualモ デル はラ ンダム化 の概念 と密接 に結 びついてお り (Rubin[80];Green‐
land[28]),ラ ンダム化臨床試験で Fisherの 正確 な 沙値 を用 い ることの正 当性 ,時 間 に依存 じ
た共変量や,曝 露 の結果 で あ り疾病 の前駆症状であるような中間変数 の取 り扱 いな どに応用 さ
れてい る (Greenland[31];Robins[64,66]).ま た,決 定論的 な疾病発生 モ デル だけで はな
く,確 率的 な疾病発生 モ デルや生存時間解析 な どにも拡張 され,観 察研究 で推定可能 な因果 パ
ラメー タに関す る議論 もなされてい る (Robins and Greenland[70];Robins[67]).ラ ンダ
ム化 の仮定 にもとづか ないでバ イアスのない因果 パ ラメータの推定 を行 うための方法 もい くつ
か提案 されてい る.例 えば prOpensity scoreを 用 い る方法で は, 2節 や 3節 で述 べ た回帰 モ デ
ル のよ うに疾病発生 リスクを曝露変数 と交絡変数で直接 モ デル化す る代 わ りに,交 絡変数 が与
えられた ときの曝露 の期待値 E(E=11Z)で ある prOpensity scOreを デー タか ら推定す る.こ
の propensity scoreが 等 しいサブグループ内 で は曝露 はランダムに割 り付 け られて い る とみ
第 22巻
日本 統 計 学 会 誌
第 3号 (増 刊号 )1993
なせ るので,曝 露効果 のバ イアスのない推定 が可能 となる (Rosenbaum and Rubin[73]).回
帰 モ デル と propensity scoreを 組 み合わせて,よ り効率 の高 い効果 の推定 を行 う試み もなされ
てい る (Robins et al.[71]).
7。
その他 の話題
本節 で は,こ れ までの話題 に付随 した話題 で はあるが,な おかつ疫学研究 で重 要 な問題 で あ
る「曝露効果推定 に与 える誤分類 (misclassincation)ぁ るい は measurement errorの 影響」
「Ecological bias」 ,「 経時観察研究 (longitudinal studies)」 について簡単 な文献紹介 を行 う
,
.
7.1 誤分類 ,measurement errorの 影響
現実 の研究 で は曝露変数 ,交 絡変数,疾 病分類 な どを全て完全 に測定す る ことは不可能 であ
り,測 定 には誤分類 ない し誤差 を伴 う.誤 分類 や measurement errorが 存在す ると,も はや曝
露効果 を正 し く推定す る ことはで きない.例 えば もっ とも単純 な,曝 露変数 の誤分類 が疾病 の
誤分類 には影響 しない「独立 」 な誤分類 で,か つ本 当 に曝露 を受 けた人 が本 当 に曝露 を受 けな
か っ た 人 よ り も疾 病 の 誤 分 類 が 起 こ りや す い (ま た は,そ の 逆)と い う こ とが な い
「nonditterential」 な誤 分 類 を考 えて み よ う.曝 露 と疾 病 が 2値 変 数 で あ っ て,独 立 で
nonditterentialな 誤分類 が起 きてい る場 合 ,効 果 の指標 は必ず 「効果がない」 とい う方向 に薄
め られて しまう.た だ し, 2つ 以上 の変数 や 2値 以上 のカテ ゴ リを含 む変数 になる と独立 で
nondiferentialな 誤分類 であって もその影響 は単純 で はな く,特 別 な条件下 で は効果 が強 くな
る方 向 にバ イアスがかか る ことが起 こ りうる (Dosemeci et al.[14])。 Measurement errorに
関 して も,曝 露変数 の nondiferential measurement errorは 線形回帰 モ デル の場合 と同様 にロ
ジステ ィックモ デル,Cox回 帰 な どで「効果 がない」 とい う方向 にバ イアスがかかった効果 の
推定 を与 える.Byar and Gail[10]に は measurement errorに 関す るシンポジウムの記録 が
収 め られてお り,バ イアスの方向や大 きさ,digerentialな 誤分類 ,measurement error,対 象
者 の一 部 に対 し正 確 な測定 また は繰 り返 し測定 を実施 す る ことでバ イ ア ス を補 正 す る方法
(validatiOn substudies)な どが議論 されてい る
.
7.2. Ecological bias
疾病 が流行 してい るか どうか調 べ るためには,疾 病 の時間的,地 域的 な集積性 (disease clus‐
tering)を チ ェ ックする必要 が ある (Tango[90];Rothenberg et al.[75]は 地域 集積性 に関
す るシンポジウムの記録 ).例 えば疾病 の地域 集積性 が観察 された とき,果 た して疾病 の発生 に
その地域 の特性 (気 温 ,降 水量 な ど)や 固有 の生活習慣 な どが 関係 してい るのか どうか, とい
う疑間が起 きて くる.そ の際,コ ス トのか かるコホー ト研究 やケース・ コン トロール研究 な ど
の個人 レベル の疫学研究 を計画す る前 に,地 域別 の疾病発生 率 と各地域 の特性 を表す変数 との
較す る,と い った ecological studiesが 要因 のスクリーニ
相関 を調 べ る,地 図 にプ ロ ッ トして上ヒ
ング として よ く行 われ る.パ ー ソナル コン ピュー タ,特 にグラフィックツール の発達 に ともな
って,ecological studiesは 簡単 に実施す る ことがで きるようになった.し か し,地 域単位 での
関連 を見 る ecological studiesで は個人 レベル の疫学研究 とは異 なったバ イアスが入 る ことが
分 かって きた.Ecological studiesで は,効 果 の修飾 が ある と効果 の推定 にバ イアスが入 って し
まう,2値 の曝露 に nondifferentialな 誤分類 が ある と効果 を強める方向 にバ イアスがかか る
とい った個人 レベル の疫学研究 で は起 こらない ecological biasが 存在す る (Greenland and
,
Morgenstern[33];Brenner et al.[3]).し たがつて,ecological studiesの 結果 の解釈 には
十分 な注意 を払 わなければな らない (Rosenbaum and Rubin[74];Greenland[30]).
経時観察研 究
コホー ト研究 のメ リッ トとして, くり返 し測定 がで きる ことを挙 げたが, くり返 し測 定す る
7.3◆
509
疫学研究における生物統計手法
変数 が曝露変数 (曝 露 が 1時 点 で はな く生活 習慣 な ど長期 にわたる場合や コホー トに登録 され
てか ら曝露 を受 ける可能性 が ある場 合 ),交 絡変数 で ある場合 には時間 に依存 した共変量 (time
dependent∞ variates)と して Cox回 帰 な どのモ デル に とり込 む こ とがで きる.ま た曝露 と疾
病 の中間変数 につ いては counterfactualモ デル を用 いた解析方法 が提案 されて い る.こ れ まで
の例 で は疾病発生 は非可逆的な事象 と考 えてい たが,ぜ ん息発作 のように くり返 しのある事象
や疾病発生 の surrogate measureと して中間変数 を用 い る場合 ,結 果変数 もくり返 し測定 で き
る場合 が ある。疾病発 生 (ま たはその surrogate)に 関 してデー タを くり返 し測定す る研究 を経
時観察研究 と呼 び,疾 病発生 が個人内で は独立 ではないので特別 な扱 い を必要 とする.Selwyn
[86]に は経時観察研究 か らのデー タ解 析 に関す る シンポジ ウム の記録 がお さめ られてお り
,
Liang‐ Zegerタ
イ プの推定方程式 (Liang et al.[49])を 初 め とする最近の研究成果 が報告 さ
れて い る.ま た Ashby et al.[1]に は継続調査 だけでな く,cluster sampling, familial
correlationと い った,相 関 の あるデー タ解析全般 に関す る文献 が まとめられてい る
.
8.終
わ りに
本論文 で は疫学研究 で用 い られ る生物統計手法 の レビュー を行 った.今 後 の方向 として第 1
に挙 げ られ るの は,従 来 の コホー ト研究 9ケ ース・ コン トロール研究 の長所 を取 り入れた,よ
り効率の高 い研究 デザイ ン (5節 )を 現実 の大規模 コホー ト研究 に応用す る ことで あろう.理
論的 にはいかに優 れた研究 デザイ ンで あって も,実 際 の疫学研究 でその実施可能性 をチ ェ ック
し,有 効 で ある ことを示 さなければ価値 がない.こ の点 に関 しては新 しいデザイ ンを用 いた疫
学研究 がい くつか動 き出 してい るので,改 良すべ き点 な どが次第 に明 らかになる と考 えてい る
第 2に は,疫 学的観察研究 か ら因果推論 を どのように行 うか,ま たそれ をサポー トす る統計手
法 として どのよ うな ものがあるか を整理 し,や はり実際 の研究 に活 か して い くことが挙 げられ
.
る.こ ち らはまだ理論的な枠組 み (counterfactualモ デル)が 明 らかになった段階 で あ り,も
う少 し問題 の整理 に時間がかか るか もしれない
.
少 し技術的な問題 としては,疾 病発生割合 の差 や比 ,疾 病発生 率 の差 に関す る回帰 モ デル の
開発 が,特 に sparse一 dataに ついて,望 まれ る。 ロジステ ィックモ デル,Cox回 帰 とい った疫
学研究 で比較的 よ く使われ るモ デル に関 して は,重 要 な交絡要因 を見落 として しまった場合 の
影響 ,measurement errorの 影響,個 人差 の導入 (変 量効果 モ デル)な ど,よ り現実 のデー タ
構造 を反映 した展開がなされている.し か し,疾 病発生割合 の差 や比 ,疾 病発生率 の差 で は回
帰 モ デル 自体 の研究 がほ とん どなされてい ない.一 方で,仮 定 したモデルが現実 のデー タ と合
わない (model misspecincation)場 合 の影響 な ども研究 されてい るが,ロ ジステ ィックモ デル
や Cox回 帰 に代わ るモ デル として疾病発生割合 の差 や比 ,疾 病発 生率 の差 をモ デル化す ること
は自然なので,こ れ らの回帰 モ デル に もとづいたパ ラメータの推定方法 の開発 が必要である
.
理論 的な研究成果 が応用 に,し か も健康 とい う我 々に とって最 も重要な問題 の解決 に直接結
びつ くところが,疫 学 ―生物統計学 のすば らしさだ と筆者 は信 じてい る
.
謝辞 :本 論文 を読 んで有益 な コメ ン トをいただいた本田純久先生 ,柳 本武美先生 ,山 本精 一郎
先生,レ フェ リーの方々 に深 く感謝 します
なお この研究 の一部 は,統 計数理研究所共同研 究 (4-共 研 -74)の 補助 を受 けた
.
.
参 考 文 献
[1]Ashby,M,Neuhaus,」 .M.,Hauck,W.W.,Bacchetti.P.,Heibron,D.C.,Jewell,N.P。 ,Segal,M.R.,
and Fusaro,R.E.(1992).
An annotated bibliography of rnethods for analysing correlated categori‐
510
日本 統 計 学 会 誌
第 3号 (増 刊号 )1993
第 22巻
cal data,Stα ″sEcs′ πMcttc′ π。 11,67-99.
[2] Brandt,L.P.A.and Nielsen,C.V.(1992).Job stress and adverse outcome of pregnancy:A causal
πわ′
π ηメ9Zttα ′グ Eク ′
グι
link or recall biasP 4π ι
ο
3135,302-311.
“
H.,and Greenland,S.(1992).Effects of nondifferential
[3] Brenner,H.,Savitz,D.A.,Jockel,K.‐
exposure misclassincation in ecologic studies,■
%ι π
%メ 9%″α′げ 助
idttZθ
“
[4]Breslow,N.E.(1981).Odds ratio estimators when the data
are sparse,3Jθ
:り,135,85-95.
πι
れ れ 68,73-84.
[5] Breslow,N.E.(1991).Statistical design and analysis of epiderniologic studies:Sollne directions
θθ
力
″SにCS, レbム 8(C.R.Rao and R.Chakraborty,eds.),EIsevier
of current research,Haη グみ
Science Publishers,125-144.
`/S″
[6] Breslow,N.E.and Cain,K.C.(1988).Logistic regression for two‐
stage case‐ control data,
β′
θttι れ れ 75,11-20.
ι∠πα″sお
πCα π γR“ ωκれ レb′ ―■ ηら
[7]Breslow,N.E.and Day,N.E.(1980).S′ α麻″ ′Zι ttθ ゐ ′
‐
Cο η′ J
び C“ ι
“
[8]Breslow,N.E.and
αη″ 4π α″sas″ r
“
“
University Press.
―I
γRω ″κれ 乃 ′
′
π
z%θ
ι
Zθ
ttο
ゐ
α
ι
6α
麻″
Day,N.E.(1987).S″
Sttα う
ι
s,Oxford
ttι
Dぉ なη
cθ
ヵθ″ S″磁es,Oxford University Press.
[9]Buck,C.(1975).Popperゝ philosophy for epidemiologists,レ ″%α ″οηαιル %″ α′グ
グι
πグ
θι
ο
Eρ ′
駒り
4, 159-168.
[10]Byar,D.P.and Gail,Ⅳ I.H.,eds.(1989).IntrOduction to workshop on errors‐
in‐
variables,October
′
θ
夕
zの 8,1027-1029.
7-9,1987,S惚 ″sιtcs′ π M2ググ
[11]Copas,J.B。 (1973).Randomization models for the matched and unmatched 2× 2 tables,3グ θπι加 ‐
れ,60,467-476.
π″α′げ 厖ι
[12]Cornfield,J.(1951).A method of estimating comparative rates from clinical data,力
γ」
ι
磁s″放ル.11,1269-1275.
Nα″θηα′Cα ηε
πttα ′グ 厖θRのα′
[13]Cox,D.R。 (1972).Regrcssion models and life tables(with discussion).ス フ
S a 49,1-39.
売れ 助 万θ
S滋 麻″ ′助 θ
“
[14] DoseFneCi,M.,Wacholder,S.,and Lubin,J.H.(1990).Does nondifferential lnisclassiflcation of
exposure always bias a true effect towards the null value?4η
′
%グ θ
lo型,132,
αι
ι
π6α ηJbπ ttα ′6/Eン う
ι
746-748.
[15]Elandt― 」ohnSOn,R.C.(1975).Deflnition of rates:Some remarks on their use and misuse,4π ι件
グθ
Zあ 109,102,267-271.
′ π力 πttα ′グ 助 ′
“
q邸ら133,429-433.
πあι
グθ
Were we really wrongP 42ι 万 π力 %物 α′グ Eク ′
[16]Eysenck,H.J.(1991)。
“
[17] Flanders,W.D.,DerSimonian,R.,and Rhodes,P.(1990).Estimation of risk ratios in case‐ base
′
%ら 9,423-435.
η Meグ″
θ
ε
s ′
studies with competing risks,Sれ ″s′ ″
[18] Flanders,W.D.and Greenland,S.(1991).Analytic methods for two‐
other stratined designs,Sれ ガsttcs′ ηMcttc′ η010,739-747.
stage case‐ control studies and
[19]Gail,M.H.(1991).A bibliography and comments on the use of statistical models in epidemiology
s′ η Mo磁c′ π。 10,1819-1885.
in the 1980s,S滋 ″s″ ε
[20] Gart,J.J.(1971).The comparison of proportions:A review of signincance tests,conidence
intervals,and adiustments for stratincation,Rι
-169.
υ
ル
"(プ
α′f2s″ ″た 39,148
あ%α ′S″ ″s″ ε
滋ιlπ ttη zα ′
[21]Gart,J.J.and Nam,J。 (1988).Appro対 mate interval estimation of the ratio of binomial parame‐
ι
"cs,estimation
44,323-338.of the di“ erence in binomial
mate
intewal
[22]Gart,J.J.and Nam,J.(1990).Appro対
ηas,46,637-643.
′
parameters:Correction for skewness and extension to multiple tables,3o,7多 ι
ters:A review and corrections for skewness, B'0,,3ι
[23]
Greenland, S.(1982). Interpretation and estimation of summary ratios under heterogeneity,
′
%Mcttc′ 夕
z夕 ,1,217-227.
“
[24] Greenland,S.(1983). Tests for interaction in epidenliologic studies: A review and a study of
power,S協 ″sttcs J%Moグ グ
απa 2,243-251.
s,′
Stα″
[25]Greenland,S.(1986).Adiustment Of risk ratios in case‐
η Zθ ttθ 物05,579-584.
designs).S″ 庵ガ ′
base studies(hybrid epidemiologic
“
[26] Greenland, S.(1987). Interpretation and choice of effect measures in epidemiologic analysis,
4解 θttε απメ,π ttα ιげ 助 ′
グθ
πあ′
ο
みら125,761-768.
πわ│り,132,585
グθ
[27]Greenland,S.(1990).Rel“ Those who were wrong",4π ιガ πル πηα′グ ル ′
“
疫学研究 における生物統計手法
-586.
グθ
πあlog,1,421-429.
[28]Greenland,S.(1990).Randolnization,statistics,and causal inference,ε ング
[29]Greenland,S.(1991).Estimating standardized parameters from generalized linear models,S滋 病‐
Ecs′ηMcttcグ πθ
.10,1069-1074.
[30] Greenland,(1991).Divergent biases in ecologic and individual‐ level studies,Sta庵 厖cs物 ル グ′
物の
θ
11, 1209-1223.
`ι
[31] Greenland,S.(1991).On the 10gical iustinCation of conditional tests for two‐ by‐ two cOntingency
tables. 7物 θノ
4η zι πθ
απ S滋 ′
なガaα π,45,248-251.
[32] Greenland,S.and HoHand,P.(1991). Estilnating standardized risk differences fronl odds ratio,
I〕 ″
カウε
θπι
s 47,319-322.
[33] Greenland,S.and Morgenstern,H.(1989). Ecological bias,confounding,and effect mOdincation,
レ ル勧αttπ α′ヵ π″α′げ 五ング
グθ
πあι
O邸 ら18,269-274.
[34]Greenland,S.and Robins,J.M.(1985).Estimation of a common erect parameter from sparse
follow‐ up
data.Bう o%ι ′
えcs,41,55-68.
[35] Greenland, S. and Robins,J. M.(1986).
Identiflability, exchangeability, and epiderniologic con‐
founding. Iη 姥解α″θ%α ′メθ
πttα ′グ 五ン;α鍬 ′
θ亀ッし15,413-419.
[36]Greenland,S.and Thomas,D.C.(1982).On the need for the rare disease assumption in case―
control studies,4π ι
ηωηメ9%物α′げ εン 御
=ο
′
ο
3116,547-553.
'α
[37]Herbst,A.L.,Ulfelder,H.,and Poskanzer,D.C.(1971).Adenocarcinoma
of the vagina:Associa‐
tion of maternal stilbestrol therapy with tumor appearance in young women,ハ
物 Eη gι α%ノ プ
bπ ηZα ′
げ Mcatcグ ηの 284,878-881.
[38]Hirii,K.F.(1991).A comparison of exact,mid‐ p,and score tests for matched case‐
control studies,
Bうoη zι ′
πε
島 47,487-496.
[39]広 津千尋 (1993).臨 床試験 の統計学的側面 ,本 号所収
.
πttα ′グ 厖θ五%ι π η
[40]Holland,Po W.(1986).Statistics and causal inference(with discussion),力
“
S滋 ″s″ ′Assθ ε
″″θ%,81,945-970.
“
[41] Jones,M.P.,0'Gorman,T.W.,Lemke,J.H.,and WOolson,R.F。 (1989).A Monte Carlo investiga‐
tion of homogeneity tests of the odds ratio under various sample size conflgurations,B=oη zι ′
πι
s,45,
171-181.
[42]Kelsey,J.L.,Thompson,W.D.,and Evans,A.S.(1986).Zθ
ttθ 法
′
%0あ ιんじ′わ%α ′I砂 ′
グι
πあloo.
Oxford University Press.
αι
協あ;むcR“
[43]Kleinbaum,D.G.,Kupper,L.L.,and Morgenstern,H.(1982).I矛 ′
Nostrand Reinhold.
[44]Kupper,L.L。 ,McMichael,A.J"and Spirtas,R。
“
κれ
Van
(1975).A hybrid epidemiologic study design
useful in estimating relat市 e risk,ヵ πttα ′グ 滋ι4π θ
π π S滋 濃〕
″ε
α′五ssθ θ
滋″θπ.70,524-528.
[45]Langholz,B.and Thomas,D.C.(1991).Ettciency of cohort “
sampling designsi Some surprising
results,3′ θ
,23ι ;五CS,47,1563-1571.
[46]Last,」 .M.,ed。 (1988).4』 %ε ″ο%α η グ
πわlo9 (2nd Ed.).Oxford University Press.
αθ
Eρ ′
[47] Liang,K.‐ Y.(1987).Extended Mantel‐ Haenszel estimating procedure for multivariate logistic
regression mOdels,Bうo2ι ′
πε
s 43,289-299.
[48]Liang,K.‐ Y.and Self,S.G.(1985).Tests for homogeneity of odds ratio when the data are sparse,
3′θ
πι
れ れ 72,353-358.
[49] Liang,K.‐ Y.,Zeger,S.L.,and Qaqish,B。
(1992). Multivariate regression analysis for categorical
・ 励θRの αJ S滋 麻″θ
data(with discussiOn),ユ フ
zη zα ′″
α′Sθ ″θ
れ 膨 万 鳥 54,3-40.
“
Methods
for cOhort analysis:
[50]Liddell,F.D.K.,McDonald,J.C.,and Thomas,D.C.(1977)。
Appraisal by application to asbestos mining,メ
r
%η Zα ′″
ο
ttθ
Rの α′S滋 ″s′ ′
6α ′Sθ ε
″机
64,140,
Sθ 万
469-490.
[51]Lubin,」 .H.and Gail,M.H.(1984).Biased selection of controls for case‐ control analysis of cohort
studies,3o夕 ηθ
力
屹θ
島 40163-75.
[52]Maclure,M.(1985).Popperian refutation in epidemiology,4π θπ π ヵ %解 αノげ
121, 343-350.
“
[53] Mantel,N。 (1973).Synthetic retrospective studies and related topics,Bι
Jつ ′
グθ
π′
θι
り
ttιs,29,479-486.
o%ι ι
[54]Mantel,N.and Haenszel,W。 (1959).Statistical aspects of the analysis of data from retrospective
,
512
日本 統 計 学 会 誌
第 22巻
第 3号 (増 刊号 )1993
γttη s″励た 22,719-748.
“
(1985).Computing
an exact confldence interval for the
[55]Mehta,C.R.,Patel,N.R.,and Gray,R。
π πS″ ″S″ ωJ Assθ αα‐
%,7α J a/滋 ι4協 ι
common odds ratio in severa1 2× 2 contingency tables,メ ο
“
″θπ,80,969-973.
studies of disease,力 %″ α′ゲ 厖ι助 励 πα′αzπ
[56]Mehta,C.R.and Walsh,S.J.(1992).Comparison of exact,mid‐ p,and Mantel‐ Haenszel conndence
intervals for the common odds ratio across severa1 2× 2 contingency tables, Thι 4,%ι π6α π
S協″sttdaπ ,46,146-150.
グθ
πあ10g,96,
[57]Miettinen,0.S.(1972).Components of the crude risk ratio,4π ιη πル πttα ιグ 五ング
“
168-172.
[58]Miettinen,0.S.(1976).Estimabillity and estimation in case―
グθ
πあ′
o3ら 103,226-253.
助′
π πル π″α′グ
referent studies,4π ι
“
[59] Miettinen,0.S.(1982).Design options in epidemiologic research:An update,Scα ηttη αυ″η
π滋′H"′ ′
れ 8(Supplement l),7-14.
ル π″α′グ 助 ″ αηグ E"υ ′ ηπι
(豊 川裕 之編 ),メ デカル フ レン ド社 ,7-104.
%あ JagJ“ ′
グι
[61]National Heart,Lung,and Blood lnstitute(1987).1%ι F確 ″れg′物π S滋 の 「 απ ψ′
“
,疫 学
[60]丸 井英二 (1991).疫 学 の歴史
r"γdう0彼雰 ι
′
ttγ グ
sι
ら Uo S.Department of Health and Human Services(NIH Publication
″
“
“
no.87-2703).
S滋 の
[62] Prentice,R.L.(1986). A case‐ cohort design for epidellniologic cohort studies and disease preven‐
tion trials,Bjο ,22ι 山
,73,1-11.
[63]Prentice,R.L。 (1986).On the design of synthetic case‐
control studies,Btoπ α力ε
s 42,301-310.
[64]Robins,J.M.(1987).A graphical approach to the identincatiOn and estimation of causal parame‐
θDお ぉι
s,40(Supple‐
ters in mortality studies with sustained exposure periods,ル π77Zα ′げ Cλ ηη′
`て
ment 2),139S-161S.
′
π07,773-785.
s″ 〃ι
グ′
θ
[65]Robins,J.M.(1988).Conidence intervals for causal parameters,S滋 麻″ε
[66] Robins,J.M.(1989).The control of confounding by interinediate variables,Stα
Иι
″stics′ π」
ググ
ε
れら
8, 679-691.
Estimation of the time‐ dependent accelerated failure time model in the
(1992)。
presence of confounding factors,3o夕 ηι
力%れ,79,321-334.
[67]Robins,J.M。
[68]Robins,J.M.,Breslow,N.E。 ,and Greenland,S.(1986).Estimators of the Mantel‐
variance consistent in both sparse data and large―
strata lirniting models,」
Bグ
Haenszel
屹ι
θ,7zθ 力
s,42,311-323.
[69]Robins,」 .M.,Gail,M.H.,and Lubin,J.H.(1986).More on“ Biased selection of controls for
case‐ control
屹ι
力
s, 42,292-299.
analysis of cohort studies",Blo,η ι
[70] Robins,J.M.and Greenland,S.(1989). The prObability of causation under a stochastic lnodel for
ι
″6s,45,1125-1138.
individual risk,」 BJθ πι
[71]Robins,J.M.,A/1ark,S.D.,and Newey,W.K.(1992).Estimating exposure effё
cts by modelling the
aθ ′
力ι
expectation of exposure conditional on confounders,3o夕 ν
s 48,479-495。
[72] Robins,」 .lⅦ .,Prentice,R.L.,and Blevins,D。 (1989).Designs for synthetic case‐ control studies in
洗
屹a島 45, 1103-1116.
open cohorts,Bto夕 ηθ
[73] Rosenbaum,P.R.and Rubin,D.B。
(1983).The central role of the propensity score in observa‐
ηゐら 70,41-55.
θ
′
tional studies for causal effects,B;o銘 ι
[74]Rosenbaum,P.R.and Rubin,D.B.(1984).Dificulties with regression analyses of age‐
rates, Bjο
723ι
attusted
力唸cs, 40, 437-443.
[75] Rothenberg,R.B.,Steinberg,K.K.,and Thacker,S.B.(1990).IntrOduction:The public health
importance of clusters:A note from the Centers for Disease Control,4物
ルπあ:鯉,132,Supplement,S3-S5.
助グ
%あ ι
グθ
[76]Rothman,K.J.(1986).Mθ ル物 の グ
σ Little,Brown and Company.
`凱 Epidemiology Resources lnc.
[77] Rothman,K.J.,ed.(1988).Cα z影 ′Iη ″ππε
ら
η π メOπ ttα ′ げ
ι
“
ノ
[78] Rubin,D.B。 (1978).Bayesian inference for causal effects:The role of randomization,4π ηαお こ
S″ 法″6s6,34-58.
[79] Rubin,D.B.(1990)。 Neyman(1923)and causalinference in experirnents and observational studies,
πθ
S協′
お降cα′Sθ ′
ι
夕
,5,472-480.
[80] Rubin,D.B.(1991).Practical implications of modes of statistical inference for causal effects and
the critical role of the assignment mechanisln,3o2θ 力7a島 47, 1213-1234.
513
疫学研究 にお ける生物統計手法
[81]Sato,T。 (1990).Conidence limits for the common odds ratio based on the asymptotic distribution
ηθ
力
屹a5 46,71-80.
of the Mantel‐ IIaenszel estimator,Bjθ 夕
[82]Sato,T。 (1990).Confldence intervals for effect parameters common in cancer epidemiology,
Eπ υ
′
π滋′正厖α′
ι
乃Jを 7り ,ι θ
御ππθ
″υ(,87,95-101.
[83]Sato,T.(1992).On inconsistency of the common rate di“ erence estimators from sparse follow‐ up
ttα ″
data,4π παお グ 滋θ五珍s″放彪 グ S滋 ′
お″ ′ル物厖ι
ε
s,44,529-535.
“
麻″θ
s物
[84]Sato,T.(1992).Estimation of a common risk ratio in stratined case_cOhort studies,S滋
爵石θ
ノ′
θ
′
π¢
, 11, 1599-1605.
[85]Sato,T。 (1992).Ma対 mum likelihood estimation of the risk ratio in case‐ cohort studies,
3′ο
夕
πθ
7zε s 48, 1215-1221.
′
s′ πMettc′ η011,1797.
溶″ι
[87]Stolley,P.D。 (1991).When genius errs:R.A.Fisher and the lung cancer controversy,五 %ι π η
“
Jθ 笏わ′
力 π″α′グ 亜沙′
Qり 133,416-425.
[86]Selwyn,M.R.(1992).Introduction to Symposium,S滋
[88]Susser,M.(1991)。
What is a cause and how do we know one?A grammar for pragmatic
epidemiology,■ %ι π πメ,%物 α′び 助 ′
πあ│り,133,635-648.
グθ
“
[89]Takagi,H.(1991).Approximate and exact methods for computing the conndence limits for the
common odds ratio in a series of 2×
2 tables,βπ′
ル″η αF
ttι
ttε 助 ″θ
β′
θttι ι
″ グ ル αη.12,57-65.
π640,15-26.
[90]TangO,T.(1984).The detection of disease clustering,B′ θπι′
れ力
Oπ θ
[91]TarOne,R.E.(1985).On homOgeneity tests based on emcient scores,3′
072,91-95.
[92]The ARIC Investigators.(1989).The atherosclerosis risk in communities(ARIC)study:Design
π πル %物 α′び の Jグ θ
and obiect市 eS,4π θ
πわ10鰐,129,687-702.
“
[93]Thomas,D.C.(1981).General
relat市 e risk functions for suⅣ 市al time and matched case‐ control
ttcs,37,673-686.
analysis,3θ %θ ι
[94]Thomas,D.C,Blettner,M.,and Day,N.E。
(1992).Use of external rates in nested case‐ control
studies with application to the international radiation study of cervical cancer patients,Bio2ι πε
島
48, 781-794.
[95]U.S.Department of Health,Education and Welfare。
′
(1964).Sπ θ力Jttg απグ Zaα ′
れ Public Health
Service Publication No.1103.
ルπあι
[96]VandenbrOucke,J.P.(1989).Those who were wrong,4π ι万″%ヵ %″ α′げ 助 グ
ο
3り 130,3
-5.
[97]Vollset,s.E.,Hirii,K.F.and Elashoff,Ro M.(1991).Fast computation of exact conndence limits
for the common odds ratio in a series of 2× 2 tables,ユ ,π ttα ′〆 物θ4π θ
ガ ηSια麻″θ
αJ Assο ε
″″θη′
“
86,404-409.
[98]Wacholder,S.(1985).Bionomial regression in GLIⅣ
4解 ι″θ
α%メ ,π ππα′げ Eレ グ
πあ;り,123,174-184.
グθ
I:Estimating risk ratios and risk differences,
[99]Wach01der,S.,McLaughlin,J.K.,Silverman,D.T.,and Mandel,J.S.(1992).Selection of controls
in case‐ control studies,I.Principles,4%ι ガ πメθ
%″ α′げ Eン グ
αι
解わ;り,135,1019-1028.
“
[100] Wacholder,S.,Silveman,D.T。 ,McLaughlin,J.K.,and Mandel,J.S.(1992). Selection of controls
in case‐ control studies,H.Types of contrOls,■ πι
万 ηュ)π ttα ιグ Eク ′
グθ
解あ:Og,135,1029-1041.
“ Mandel,J.S.(1992). Selection of controls
Wacholder,S.,Silverrnan,D.T。 ,McLaughlin,J.K。 ,and
[101]
in case‐ control
[102]
[103]
;d魏わι
o即,135,1042-1050.
studies,III.Design optiOns,4π θ
ガ π」θ
%″α′グ
“
Walker,A.M.(1991).0お θ7zり ″οπαηグI″ ″πε
a Epidemiology
=ン
Resources lnc.
Walter,S.D.and Cook,R.J.(1991). A comparison of several point estilnators of the odds ratio
in a single 2× 2 contingency table,B=o%ι 力
んε
s,47,795-811.
[tO+] White, J. E. (1982). A two
[tOS]
[106]
stage design for the study of the relationship between arare exposure
and a rare disease, American tournal of Epidemiolog, 1L5,119-128.
Wickramaratne, P. J. and Holford, T. R. (1987). Counfounding in epidemiologic studies : The
adequacy of control group as a measure of confounding, Biometrics. 43,751-765.
Yanagawa, T. and Fujii, Y. (1990). Homogeneity test with a generalized Mantel-Haenszel
estimator f.or L ZXK contingency tables, Journal of the American Statistical Association, 85,744748.
[107]
Zhao, L. P. and Lipsitz, S. (1992)
11.769-782.
.
Designs and analysis of two-stage studies
,
Statistics
in Medicine.