疫学用語の基礎知識

1
疫学用語の基礎知識
目次
疫学
記述疫学
分析疫学
横断研究と生態学的研究
症例対照研究
コホート研究
介入研究
無作為割付
二重盲検法
システマティック・レビュー
偶然誤差 系統誤差
選択バイアス
情報バイアス
交絡バイアス 交絡因子
因果関係
有病率と罹患率
相対危険
寄与危険と寄与危険割合
オッズ比
母集団と標本
検定
推定
回帰分析
生存分析
相関係数
多変量解析
過誤
倫理指針
個人情報等の保護
2
インフォームド・コンセント
疾病登録
2015 年(平成 27 年)12 月
日本疫学会広報委員会監修
3
疫学
疫学とは、「明確に規定された人間集団の中で出現する健康関連のいろいろな事象の頻度と分
布およびそれらに影響を与える要因を明らかにして、健康関連の諸問題に対する有効な対策樹
立に役立てるための科学」と定義される。疫学は健康に関連するさまざまな事象の頻度や分布
を観察することを目的にするため、対象は一人の人間ではなく集団であるが、集団の特徴(集
団の定義、年齢、学年、性別)やどの時点を調査対象とするかを明確に規定した上で事象の頻
度や分布を調べる必要がある。また、事象に影響すると結論付けられた要因を除外、軽減する
対策を講じ、除外後の効果を公衆衛生的に考えるのは疫学の社会的意義である。
歴史上の事例では 1854 年、ロンドンにおけるコレラ伝播様式の解明や、1950~60 年代、イギ
リスでの追跡調査による喫煙と肺がんの因果関係の解明などへの貢献が挙げられる。
「佐々木 敏:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p.1-7, 2010, 南江
堂」より許諾を得て抜粋し転載.
4
記述疫学
人間集団における疾病の疫学特性(発症頻度、分布、関連情報)を人、場所、時間別に詳しく
正確に観察し、記述する研究である。研究結果に基づき、発生要因の仮説設定が行われる。
1.人(だれ)
項目例)性、年齢、人種、遺伝、家族歴など
調査例)人口規模別乳がん年齢調整死亡率
図1
2.場所(どこで)
項目例)国際比較、国内では地方別、県別市町村別
南北差、都市・農村差
調査例)OECD 諸国における脳血管疾患死亡率の国別比較
図2
5
3.時(いつ)
項目例)年次変化、趨勢(長期)変化、周期変動、季節変動
調査例)結腸がん死亡率の年次推移
図3
「阪本尚正・岡本和士:はじめて学ぶやさしい疫学
(日本疫学会監修), 改訂第 2 版, p41-48, 2010,
南江堂」より許諾を得て抜粋し転載.
6
分析疫学
記述疫学などから得られた、関連があると疑われた要因(仮説要因)と疾病との統計学的関連
を確かめ、要因の因果性を推定する方法である。仮説の検証を主な目的とする。記述疫学で明
確にした4つの W(When, Where, Who, What)をもとに、Why を追究する。
分析疫学の種類
症例対照研究:疾病の原因を過去にさかのぼって調べる方法
コホート研究:将来に向かって問題とする疾病の発生を観察する方法
横断研究:疾病と要因の保有状況を同時に調べる方法
生態学的研究:疾病と関連要因を地域または集団単位で検討する方法
「岡本和士:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p49-52, 2010, 南江
堂」より許諾を得て抜粋し転載.
7
横断研究と生態学的研究
横断研究はある集団のある一時点での疾病(健康障害)の有無と要因の保有状況を同時に調査
し、関連を明らかにする方法。要因と疾病の関連を評価するため、罹患率でなく有病率が用い
られる。
横断研究の例
生態学的研究は分析対象を個人でなく、地域または集団単位(国、県、市町村)とし、異なる
地域や国の間での要因と疾病の関連を検討する方法。
「岡本和士:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p53-56, 2010, 南江
堂」より許諾を得て抜粋し転載.
8
症例対照研究
疾病の原因を過去にさかのぼって探そうとする研究。目的とする疾病(健康障害)の患者集団
とその疾病に罹患したことのない人の集団を選び、仮説が設定された要因に曝露されたものの
割合を両群比較する。疾病の頻度が低く、症例が母集団の全患者を代表し、対照が母集団を代
表する場合はオッズ比(相対危険の近似値)から因果関係の推定が可能。
症 例 対 照 研 究 の 結 果 は 四 分 表 ( 2 × 2 表 ) で ま と め ら れ る 。
症例対照研究の例
肥満と心筋梗塞の発症に関する症例対照研究
[ Washio M et al: Past history of obesity (overweight by WHO criteria) is associated with
an increased risk of nonfatal acute myocardial infarction, a case-control study in Japan.
Circ J 68:41-46,2004 ]
【要約】
この研究は、過去と現在の肥満(BMI≧25.0kg/m2)と心筋梗塞のリスクの関係を明らかにす
ることを目的とした。福岡都市圏の 22 病院に 1996 年 9 月~1998 年 9 月に入院した 40~79
歳の急性心筋梗塞患者で、過去に心筋梗塞の既往のない 660 名から生活暦(飲酒、喫煙など)
、
既往歴(高血圧、糖尿病、高脂血症など)
、身長、体重、10 年前の体重などの情報を収集。同
9
時に、性、年齢、居住区域をマッチさせた対照群 1,271 名からも同様の情報を得た。症例対照
研究の結果、10 年前の肥満は心筋梗塞のリスクを上昇させたが(オッズ比 1.72)
、現在の肥満
はリスクを上昇させなかった(オッズ比 1.01)
。
(本研究では、入院する前に死亡した症例、重症のため質問票による調査が不可能であった症
例は除外。そのため、現在の肥満が危険因子とならなかった可能性は完全に否定できない)
「鷲尾昌一:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p57-65, 2010, 南江
堂」より許諾を得て抜粋し転載.
10
コホート研究
調査時点で、仮説として考えられる要因を持つ集団(曝露群)と持たない集団(非曝露群)を
追跡し、両群の疾病の罹患率または死亡率を比較する方法である。また、どのような要因を持
つ者が、どのような疾病に罹患しやすいかを究明し、かつ因果関係の推定を行うことを目的と
している。
たとえば、大量喫煙者(曝露群)と非喫煙者(非曝露群)、各々10 万人について 10 年間追跡
調査を行い、肺がんと冠動脈性心疾患に関する死亡率を得たとする。そこで、疫学の要因分析
で重要な指標である相対危険を算出することにより、肺がんが喫煙との関連が強いということ
が判明したり、公衆衛生対策で重要な指標である寄与危険を算出することにより、集団に対す
る禁煙の効果が最も期待されるのは、冠動脈性心疾患であることが推測されたりする。仮想の
例を下に示す。
表1
「阪本尚正・岡本和士:はじめて学ぶやさしい疫学
(日本疫学会監修), 改訂第 2 版, p66-70, 2010,
南江堂」より許諾を得て抜粋し転載.
11
介入研究
分析疫学によって疾病との因果関係の推理がなされた要因(危険因子/予防因子)について、
これを慎重に除去/適用するなどの介入をして集団を一定期間観察し、疾病の増減を実験的に
確かめる研究方法である。要因に対する介入(予防プログラムや治療法)が、疾病の予防や予
後改善に有効であるか否かを確認する。分析疫学では研究者は対象者を観察するだけであるが、
介入研究では研究者自身が積極的に介入を行う。
たとえば、高コレステロール血症が冠動脈性心疾患の危険因子であることが明らかになった場
合、血中の総コレステロールを下げるための食事指導(介入)をすることによって、冠動脈性
心疾患の罹患率が低下するかを確認する必要がある。罹患率が低下した場合、食事指導(介入)
が、冠動脈性心疾患の予防に有効であると考えられる。
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p71-80, 2010, 南江
堂」より許諾を得て抜粋し転載.
12
無作為割り付け
研究者は定められたプロトコルに従って、研究参加者を無作為に 2 群に分け、そのうちの 1 群
には要因の適用(または除去)を行い(介入群)、他の群には行わない(対照群)という分け
方のことである。どちらの群に入るかを参加者の希望や他の危険因子などで恣意的に決めると
介入群と対照群の間に偏りが生じて正しい効果判定ができなくなる。
たとえば、脂質異常症患者を対象として、薬物治療による虚血性心疾患の予防効果の判定を目
的とする介入研究を行う場合、参加者本人または研究者によって薬物治療群(介入群)と非薬
物治療群(対照群)を決めると薬物治療群(介入群)に重症脂質異常症患者の割合が多くなる
といったことが起こり、薬物治療の効果を正しく判定することが不可能となる。
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p71-80, 2010, 南江
堂」より許諾を得て抜粋し転載.
13
二重盲検法
研究参加者が、自分がどちらの群に入ったかを知ってしまうと、それが参加者の判断、行動、
心理などに影響を与え、その結果、観察結果にも影響を与えるおそれがある。これを防ぐため
に、参加者がどちらの群に入ったのかわからないようにすることを盲検法といい、結果を観察
する研究者自身にもわからないようにすることを二重盲検法という。
たとえば、薬物投与を行う介入研究であれば対照群に偽薬(placebo)を与えて、参加者(患
者)がどちらの群に入ったかわからないようし、また、研究者(医者)もどちらが投与される
のかわからないようにする。ただし、食事指導や禁煙プログラムのように、介入群と対照群で
歴然とした違いがある場合には不可能である。
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p71-80, 2010, 南江
堂」より許諾を得て抜粋し転載.
14
システマティック・レビューとメタ解析
システマティック・レビューとは、明確に作られたクエスチョンに対し、系統的で明示的な方
法を用いて、適切な研究を同定、選択、評価を行なうことで作成するレビューを言う。一般的
には介入の有効性をクエスチョンとすることが多いが、リスク因子、診断検査の正確性など他
のテーマに関してもシステマティック・レビューは実施し得る。メタ解析とは、過去に行われ
た複数の臨床試験の結果を、統計学の手法を用いて統合して、全体としてどのような傾向が見
られるかを解析する研究方法である。
たとえば、心房細動患者への A 薬投与による脳卒中の一次予防効果を明らかにするために介入
研究が実施されたとする。システマティック・レビューによって A 薬投与の効果を明確にする
ためには、過去に行われた複数の独立した研究成果をできるだけ系統的、網羅的に収集するよ
うに配慮し、研究の質についても吟味しなければならない。また、メタ解析を行う場合は、統
合の可否を十分に検討したうえで、適切な統計モデルを用いて解析を行わなければならない。
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p71-80, 2010, 南江
堂」より許諾を得て抜粋し転載.
15
偶然誤差と系統誤差
実際に収集された調査結果と真実との間にある差を誤差という。誤差は、理想的な状況でも偶
然におこるものと、データの収集方法が適切でないため系統的におこる一定の方向性をもつも
のに分けられ、前者を偶然誤差、後者を系統誤差という。
例えば、高齢者を対象として血圧に対する調査を行うとする。たまたま測定を行う日、普段よ
りも高い血圧値を示す人が多かった場合、この誤差は偶然誤差である。一方、対象とする集団
のうち、毎日一定量運動をしている者や、血圧の測定に協力的な者のみを対象とすれば、結果
として健康への意識が高い人が抽出されることとなる。また、壊れた血圧計で測定を行い続け
れば、正しい結果をえることは出来ず、結果に一定した偏りが生じる。このような誤差は系統
誤差である。
???(参考)「疫学-医学的研究と実践のサイエンス-」訳:木原正博???
16
選択バイアス
研究の対象者を決める時点で生じるバイアスを選択バイアスという。選択バイアスは、研究を
行う場所、対象者を集める方法、研究参加後の脱落など、様々な場面で生じうる。
例えば、高齢者を対象に健康に関する調査を行うとする。対象者の募集を病院で行うかクリニ
ックで行うかによって、対象者の疾患や重症度が異なるため、同じ高齢者でも対象集団の特性
が異なる。また、対象者を集める際、インターネットでの公募などの方法を用いると、インタ
ーネットが使用可能かつ健康への関心が高い者のみを対象とすることとなる。さらに、健康へ
の関心が薄い者の脱落が多い場合、結果的に対象とした高齢者は健康への関心が高い者となる。
このように、対象者を決める時点で生じうる偏りを選択バイアスという。
選択バイアスが生じると、曝露群と非曝露群に差がないにもかかわらず差があるという結果に
なったり、逆に差があるにもかかわらず差がないという結果になったりする可能性があり、適
切な比較が困難になるという点で問題となる。
17
情報バイアス
曝露やアウトカムを測定する際、情報の取り違いや測定方法が不十分であるために一方向に偏
って測定結果がでてしまうことを情報バイアスという。
情報バイアスには、様々な種類がある。妊娠中の薬剤 A の投与と子供のアレルギーB の関連を
例にそのいくつかを説明する。
思い出しバイアス
過去の事象に対する思い出しやすさの違いにより生じる。アレルギーB をもつ子供をもつ母親
の方が、過去の服薬歴(妊娠中薬剤 A を飲んだか否か)に対する記憶が鮮明であることが予測
され、A の投与割合が異なる結果となる。
質問者バイアス
質問者が行う情報の引き出し方によって生じる。面接によって妊娠中の薬剤 A の服薬の有無を
研究参加者に尋ねる場合、質問者が A について思い出すよう何度も繰り返し尋ねたり、A を服
用した(または服用しなかった)ように回答を誘導したりすることで、A の服薬割合が事実と
異なる結果となる。
18
交絡バイアス・交絡因子
交絡バイアスは、要因とアウトカムの双方に関連し、片方の集団に偏って存在する交絡因子の
存在によって生じる。交絡因子は、2 つの集団のアウトカムを比較する際に、1)アウトカム
に影響を与える、2)要因と関連がある、3)要因とアウトカムの中間因子でない、という 3 つ
の条件を満たす。
コーヒーの飲用と心筋梗塞の関連をみる際、喫煙が交絡因子となった研究を例にとる。調査の
結果、コーヒーを飲用していた集団は、飲用していない集団よりも心筋梗塞の発生が多くみら
れたとする。しかし、コーヒーの飲用が心筋梗塞を発生させる要因となったわけではなく、喫
煙者にコーヒーの飲用が多くみられたために、あたかもコーヒーの飲用と心筋梗塞が関連して
いるかのようにみえたという例である(喫煙と心筋梗塞に関連があることは自明とする)。こ
のとき、交絡因子である喫煙は、1)心筋梗塞に影響を与え、2)コーヒーの飲用集団に喫煙者
の割合が高く、3)コーヒーの飲用と心筋梗塞の中間因子ではないという条件を満たす。
19
因果関係
「原因とそれによって生じる結果との関係」
(広辞苑、第 6 版)を因果関係という。要因とア
ウトカムの間において、関連はみられるが要因が結果を導く関係(真の因果関係)になってい
ないこともあるため、その判断には注意が必要である。
「緑茶をよく飲む人には長生きしている人が多い」という例を考える。これについて「長生き
の秘訣は緑茶である」という因果関係を判断するためには、確認すべきいくつかの点がある。

長生きするという結果が、緑茶を飲むという要因の後におこること(関連の時間性)

緑茶の飲水と長生きの関連を示した研究デザインの異なる複数の研究で結果が一致する
場合、偶然誤差やバイアスの可能性が少なくなる(関連の一致性)

緑茶の飲水と長生きの関連が強いほど、相対危険やオッズ比が 1 より離れ、偶然誤差やバ
イアスの可能性が少なくなる(関連の強さ)

緑茶をたまに飲む人より、よく飲む人の方が長生きする場合、因果関係を示す積極的な証
拠になる(量-反応関係)

緑茶の成分が長生きを助長するという実験データや動物実験などと一致すれば、因果関係
がさらに強くなる(生物学的妥当性)
20
有病率と罹患率
有病率は、ある一時点において、疾病を有している人の割合である。
集団の特定の時点での健康問題の大きさをはかり、その対策を立てるなど、行政面で有用な指
標である。
有病率 =
集団のある一時点における疾病を有する者の数
集団の調査対象全員の数
罹患率は、一定期間にどれだけの疾病(健康障害)者が発生したかを示す指標であり、発生率
の一種である。
罹患率が上がるときには、なにかその裏に隠された原因(発生要因)がある場合が多い。した
がって、罹患率は疾病と発生要因との因果関係を探る場合に有用な指標である。
*1
罹患率 =
一定の観察期間内に新発生した患者数
∗1
∗2
危険曝露人口 一人一人の観察期間の総和(人- 年 )
危険曝露人口:疾病に罹りうる危険性を持った集団
例)子宮がんの場合は女性、はしかの場合ははしかの既往歴がない者
*2
人-年法:追跡期間中に対象者が転出、死亡、拒否などで観察集団から脱落したり
することで追跡バイアスが生じる。そのため、罹患率の分母には、観察された対象者と各
対象者についての観察期間を同時に考慮に入れで、人-年が用いられる。
罹患率と有病率との間には、平均有病期間がほぼ一定であるとき、以下の関係が成り立つ。
有病率 = 罹患率 × 平均有病期間(平均有病期間がほぼ一定である場合)
「小橋 元:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p13-24, 2010, 南江
堂」より許諾を得て抜粋し転載.
21
相対危険
相対危険(relative risk, risk ratio, RR)は、危険因子に曝露した群の罹患リスク(危険)の、
曝露していない群の罹患リスクに対する比で示される(図 1)
。リスク比ともいう。すなわち、
「危険因子に曝露した場合、それに曝露しなかった場合に比べて何倍疾病に罹りやすくなるか
(疾病罹患と危険因子曝露との関連の強さ)
」を示す。疫学の要因分析で重要な指標である。
表 1
要
因
罹
あ
り
計
患
な
し
曝露群
A
B
A+B
非曝露群
C
D
C+D
相対危険 =
危険因子曝露群の罹患リスク
危険因子非曝露群の罹患リスク
=
𝐴𝐴
𝐴𝐴 + 𝐵𝐵
𝐶𝐶
𝐶𝐶 + 𝐷𝐷
例)表 2 より、喫煙(要因)と肺がん(罹患)の調査結果から相対危険度を算出する。( )
内は実数。
表 2
要
罹
因
(喫 煙)
あ
り
患(肺がん)
な
計
し
曝露群
A(80)
B(40)
A+B(120)
非曝露群
C(20)
D(120)
C+D(140)
相対危険 =
危険因子曝露群の罹患リスク
危険因子非曝露群の罹患リスク
=
𝐴𝐴
𝐴𝐴 + 𝐵𝐵
𝐶𝐶
𝐶𝐶 + 𝐷𝐷
=
𝐴𝐴(𝐶𝐶 + 𝐷𝐷) 80 × 140
=
= 4.67
𝐶𝐶(𝐴𝐴 + 𝐵𝐵) 20 × 120
架空の数字ではあるが、これは喫煙する群が非喫煙群に比べ肺がんになるリスクが 4.67 倍で
22
あることを示す。
「小橋 元:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p13-24, 2010, 南江
堂」より許諾を得て抜粋し転載.
23
寄与危険と寄与危険割合
寄与危険(attributable risk, AR)は、危険因子曝露群の罹患リスクと非曝露群の罹患リスク
との差で示される(表 1)
。リスク差ともいう。すなわち、「危険因子の曝露によって罹患リス
クがどれだけ増えたか」
「危険因子に曝露されなければ罹患リスクがどれだけ減少するか(危
険因子が集団に与える影響の大きさ)
」を示す。公衆衛生対策で重要な指標であり、もしその
要因が除去されたらどれだけ疾病を予防できるかを意味している。
表 2
要
因
罹
あ
り
計
患
な
し
曝露群
A
B
A+B
非曝露群
C
D
C+D
寄与危険 = 危険因子曝露群の罹患リスク − 危険因子非曝露群の罹患リスク
=
𝐴𝐴
𝐴𝐴 + 𝐵𝐵
−
𝐶𝐶
𝐶𝐶 + 𝐷𝐷
寄与危険割合(percent attributable risk, PAR)は、寄与危険が曝露群の罹患リスクに占める
割合を示す。すなわち、
「危険因子曝露群のなかで発症(罹患)したもののうち、真に曝露が
影響して罹患(発症)した者は何%であるか」を示す。
寄与危険割合
=
危険因子曝露群の罹患リスク − 危険因子非曝露群の罹患リスク
危険因子曝露群の罹患リスク
𝐴𝐴
𝐴𝐴
+
𝐵𝐵
=
𝐶𝐶
− 𝐶𝐶 + 𝐷𝐷
𝐴𝐴
𝐴𝐴 + 𝐵𝐵
× 100
例)表 2 より、喫煙(要因)と肺がん(罹患)の調査結果から寄与危険と寄与危険割合を算出
する。
表 2
要
罹
因
(喫 煙)
あ
患(肺がん)
り
な
計
し
曝露群
A(80)
B(40)
A+B(120)
非曝露群
C(20)
D(120)
C+D(140)
寄与危険 = 危険因子曝露群の罹患リスク − 危険因子非曝露群の罹患リスク =
=
80
20
−
= 0.52
120 140
𝐴𝐴
𝐶𝐶
−
𝐴𝐴 + 𝐵𝐵
𝐶𝐶 + 𝐷𝐷
24
この例から考えると、喫煙者を禁煙させることによって、100 名のうち 52 名は肺がんを予防
できると考えられるほか、
寄与危険割合 =
𝐴𝐴
𝐴𝐴
+
𝐵𝐵
=
危険因子曝露群の罹患リスク − 危険因子非曝露群の罹患リスク
危険因子曝露群の罹患リスク
𝐶𝐶
20
80
− 𝐶𝐶 + 𝐷𝐷
− 140
120
× 100 =
× 100 = 78.6
𝐴𝐴
80
𝐴𝐴 + 𝐵𝐵
120
× 100
この例では、喫煙者で肺がんの者のうち 78.6%が喫煙によって肺がんになったと考えられる。
「小橋 元:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p13-24, 2010, 南
江堂」より許諾を得て抜粋し転載.
25
オッズ比
オッズとは、
「見込み」のことで、ある事象が起きる確率 p の、その事象が起きない確率(1 − p)
に対する比を意味する。オッズ比とは二つのオッズの比のことであり、コホート研究での累積
罹患率(罹患率)のオッズ比と、症例対照研究での曝露率のオッズ比がある。
前者は曝露群と非曝露群それぞれの罹患/非罹患オッズの比であり、後者は罹患率と非罹患率
それぞれの曝露/非曝露オッズの比である。それぞれ以下のような「たすきがけ」の式で求め
られる。
オッズ比�コホート研究: 罹患�非罹患 オッズ比� =
オッズ比�症例対照研究: 曝露�非曝露 オッズ比� =
𝐴𝐴
𝐵𝐵
𝐶𝐶
𝐷𝐷
𝑎𝑎
𝑏𝑏
𝑐𝑐
𝑑𝑑
=
𝐴𝐴 × 𝐷𝐷
𝐵𝐵 × 𝐶𝐶
=
𝑎𝑎 × 𝑑𝑑
𝑏𝑏 × 𝑐𝑐
(A〜D、a〜d は表 1 と図 1 に対応)
表 3
要
因
罹
あ
計
患
り
な
し
曝露群
A
B
A+B
非曝露群
C
D
C+D
図1
症例対照研究の場合、相対危険と寄与危険を直接計算することはできないが、①患者群・対象
群が母集団を代表していること、②疾病の発症率が低いこと、などが成り立つとき、オッズ比
により相対危険の近似式として用いる。
「小橋 元:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p13-24, 2010, 南江
堂」より許諾を得て抜粋し転載.
26
生存分析
イベントが起こるまでの時間とイベントの関係に焦点を当てる分析である。イベントが起こる
までの時間の例として、死亡までの時間、疾病の再発や回復までの時間などがある。
生存分析では、累積生存率(累積死亡率、累積罹患率などを含む)を推定するために、
Kaplan-Meier 法を用いる。二つの累積生存率曲線の差の検定には、Logrank 検定、一般化
Wilcoxon 検定を用いる。Cox の比例ハザードモデルを用いれば、交絡変数の影響を除いたう
えで相対危険の推定と検定を行うことができる。
生存分析を行うイベントの例としては、患者が死亡するまでの時間、臨床試験の被験者が副作
用を発現するまでの時間などがある。このとき、対象者が治療を中止したり、転院、脱落する
ことがある。このような場合を打ち切りといい、生存分析では打ち切りを考慮して解析するこ
とができる。
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p89-100, 2010, 南江
堂」より許諾を得て抜粋し転載.
27
相関係数
二種類の測定値(連続型変数または順序尺度)の直線的な関連の強さを表す指標。通常は記号
r で表し、r は−1 〜 +1 の範囲の値をとる。r が 1 に近づくほど正相関の関係が強くなり、r
が−1 に近づくほど負相関の関係が強くなる。一般に、r の値は表 2 のように解釈されている。
図 3 のように、右上がりの関係を正相関、右下がりの関係を負相関という。
例えば、身長と体重の二種類の測定値や、地域別の塩分摂取量と平均血圧などの二種類の測定
値などで相関係数を計算することが想定される。
図 1
表 1
│r│
関連の程度
0.8 〜 1.0
強い
0.5 〜 0.8
中程度
0.2 〜 0.5
弱い
0 〜 0.2
無視できる程度
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p89-100, 2010, 南江
堂」より許諾を得て抜粋し転載.
28
母集団と標本
母集団とは研究対象としている個体の全体集合であり, 標本とは母集団から選び出された調査
可能な集団を指す. 疫学的により正確な調査を行うには標本は母集団の性質を忠実に反映し,
母集団を代表した集団でなければならない.
(例)
ある病院において患者満足度を調査する場合, 研究に同意して回答してくれた患者が必ずしも
その病院で治療をうけた患者全員を代表していないことがある. すなわち, 回答をしてくれた
患者は, 回答を拒否した患者に比べ若く, 軽症で, しかも性格的に頼みやすいなど偏った傾向
にある可能性があるためである. こういった偏りを減らすため, 母集団から標本を抽出する際
は, 研究者の主観や恣意性が介入しない無作為抽出が最も好ましいとされる.
「岡本和士:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p25-32, 2010, 南江
堂」より許諾を得て抜粋し転載.
29
検定
検定とは, 観察や実験の結果(差がある, なしなど)が, 偶然によるものなのか, そうとは考え
にくいのかを統計学的な確率論に基づいて判断することである. なお, 検定の結果は必ずしも
臨床的な重要性を保証するものではない.
(例)
“母集団の収縮期血圧の平均は 120mmHg である”という仮説が正しいと仮定する. この仮説
のもとで, “母集団から抽出された 100 人の標本平均が 140mmHg 以上である”という事象が
観測される確率を計算する. その確率が十分に小さければ(一般的には 5%や 1%未満), “母
集団の収縮期血圧の平均は 120mmHg である”という仮説が正しいとは考えにくいので, 仮説
を棄却する. つまり, “母集団の収縮期血圧の平均は 120mmHg であるとはいえない”と判断
する事ができる. この論法を“仮説の検定”という. また, 母集団から標本を抽出する際や, 血
圧の測定方法などに誤りがあったり, 研究自体にバイアスが存在したりする場合は検定結果の
妥当性は低下する.
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p89-100, 2010, 南江
堂」より許諾を得て抜粋し転載.
30
推定
疫学における推定とは, 標本抽出によって得られた標本集団を解析した結果から, 母集団の性
質(真の値)を推定することである. 推定には母集団の性質を一つの数字で推定する点推定値
と, その偶然のバラつきを見るため, 幅を持たせて推定する区間推定(信頼区間)とがある. 特
に関連性や効果を推定する際に得られた点推定値を別の言葉で「効果量 effect size」と呼ぶ.
(例)
標本集団の血圧の平均値が 135mmHg, 95%信頼区間が 128−142mmHg であった場合, 母集団
の血圧の平均値は 135mmHg(点推定値)であり, 仮に母集団に血圧測定を 100 回行った場合,
95 回はその平均値は 128mmHg から 142mmHg の値(区間推定値)を取ると解釈する. この
時, 95%信頼区間を母集団の 95%が 128mmHg から 142mmHg の値を取る解釈するのは誤り
である.
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p89-100, 2010, 南江
堂」より許諾を得て抜粋し転載.
31
回帰分析
回帰分析とは観察や実験の結果得られた測定値に相関(関連性の強さ)がある場合, 一つの測
定値 Y(従属変数, 目的変数)を別の測定値 X, X1, X2, XX(独立変数, 説明変数)から予測す
る式(回帰式)を作成し関係性を説明することである.
(例)
収縮期血圧と年齢に相関が見られる場合に,
Y を収縮期血圧とし, X を年齢として回帰式(回帰直線)を作成する. ‥式 1
Y=βX +α…式 1 (βを回帰係数, αを切片と呼ぶ)
βは年齢が1歳上がるごとに収縮期血圧が変化すると予想される平均的な変化量を意味しβ
(関連の強さ)が 0.5 の場合, 1 歳年をとるごとに収縮期血圧が 0.5mmHg 上がり, 10 歳年をと
ると 5.0mmHg 上がることを意味する.
回帰分析の例としては他に, アウトカム(回帰式での Y 値)が連続変数を取る場合に用いられ
る線形回帰分析, アウトカムが2値変数の場合に用いられるロジスティック回帰分析, アウト
カムがイベント発生までの時間の場合に用いられる Cox 回帰分析などがある.
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p89-100, 2010, 南江
堂」より許諾を得て抜粋し転載.
32
多変量解析
疫学における多変量解析とは, 複数の変数からある値との関係性を説明する場合や, 交絡因子
を調整する解析方法として用いられるものである.
なお, 多変量解析は調査事後の交絡調整方法であるため, 測定した変数のみを式に組み込んで
おり, 未測定の変数は交絡調整できない.
(例)
例えば, 肺がん検診で肺がんの有無と受診者に関する多数の背景(性別, 年齢, 職業, 所得, 喫
煙歴など)との関係を調査する場合, 受診者の背景と肺がんの有無を説明するため, ロジステ
ィック回帰分析を行う.
また, 多変量解析は, 検討する変数が多くなればなるほど説明の精度が上がるというわけでは
なく, 解析に投入されるすべての変数の分布(年齢のバラつきが極端に偏っていないかなど)
の検討や, 解析するにあたり多数の前提条件が存在するため, 説明したい因子を十分に説明す
ることは必ずしも容易ではない.
「佐々木 敏:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p83-88, 2010, 南
江堂」より許諾を得て抜粋し転載.
33
過誤(エラー)
過誤(エラー)とは, 検定が誤った確率(P 値)に基づいて行われたことによる誤判断をいい,
主に以下の二種類がある.
第一種の過誤(αエラー)
:
本当は検定仮説が正しいのに, 誤りであると判断する.
第二種の過誤(βエラー)
:
本当は検定仮説が誤りなのに, 誤りであると判断しない.
なお, 一般に標本データ数が多くなると, 第二種の過誤は生じにくくなる(検出力が上がる).
(例)
例えば, P=0.01 で有意差有りと判断した場合, その判断が誤りである確率は 1%
である. 一方通常の検定では第2種の過誤は考慮していないので, 有意差なしと判断した場合
にその判断が誤りである確率は不明である. したがって, 有意差なし=「差がないことが証明さ
れた」とかんがえるのは誤りで, 「差があるとはいえない」と解釈するべきである.
表1
「横山徹爾:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p89-100, 2010, 南江
堂」より許諾を得て抜粋し転載.
34
倫理指針
倫理指針は、人を対象とする医学系研究に携わる全ての関係者が遵守すべき事項を定めること
により、人間の尊厳及び人権が守られ、研究の適正な推進が図られるようにすることを目的と
している 1。さらに全ての関係者が基本方針としてこの指針を遵守すべきこととして以下を掲
げている 1。
① 社会的及び学術的な意義を有する研究の実施
② 研究分野の特性に応じた科学的合理性の確保
③ 研究対象者への負担並びに予測されるリスク及び利益の総合的評価
④ 独立かつ公正な立場に立った倫理審査委員会による審査
⑤ 事前の十分な説明及び研究対象者の自由意思による同意
⑥ 社会的に弱い立場にある者への特別な配慮
⑦ 個人情報等の保護
⑧ 研究の質及び透明性の確保
日本疫学会の「疫学研究を実施するにあたっての倫理宣言」では、疫学研究が備えておくべき
倫理的条件として、1) 真理の追究を目的とした研究であること、2) 対象者の人権を尊重した
研究であること、3) 目的を達成するために最も適切な方法を用いた研究であること、4) 社会
規範に反しない研究であること、5) 常に社会に開かれた研究であること、の 5 つをあげてい
る。
1. 文部科学省、厚生労働省:人を対象とする医学系研究に関する倫理指針. 平成 26 年 12 月
22 日
「鷲尾昌一:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p101-110, 2010, 南
江堂」より許諾を得て抜粋し転載.
35
個人情報等の保護
個人情報とは、生存する個人に関する情報であって、当該情報に含まれる氏名、生年月日その
他の記述等により特定の個人を識別することができるものをいい、他の情報と容易に照合
することができ、それにより特定の個人を識別することができることとなるものを含む。個人
情報等とは、個人情報に加えて、個人に関する情報であって、死者について特定の個人を識別
することができる情報を含めたものをいう 1。
疫学研究を行う上で、研究者は個人情報等の保護に努めなければいけない。そのためには、1)
研究計画に沿って、明確な目的のもと情報収集をし、不必要な情報は収集しない、2) 個人情
報等にアクセスできる人数を制限、施錠したキャビネットに個人情報を保管する等の徹底した
情報管理を行う、3) 不要となった個人データを消去することが必要である。
しかし個人情報等の保護は調査方法によっては調査の回収率に影響を与える。ある病院外来患
者の内視鏡検査への満足度に関する質問紙調査の回収率を郵送、電話、ネットの 3 種類の方法
で比較を行った。結果、ネットによる回収率が 34%と郵送や電話によるそれの約 1/2 であった。
2。
1. 文部科学省、厚生労働省:人を対象とする医学系研究に関する倫理指針. 平成 26 年 12 月
22 日
2. Gavin C.Harewood, Maurits J Wiersema, Miet C. de Groen. Utility of Web-Based
Assessment of Patient Satisfaction With Endoscopy. Am J Gastroenterol. 2003 ; 98(5) :
1016-21.
「鷲尾昌一:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p101-110, 2010, 南
江堂」より許諾を得て抜粋し転載.
36
インフォームド · コンセント
研究参加者は、研究内容に関して十分な説明を受けて十分に理解して納得した後に、完全な自
由意思によって自発的に研究に参加することを承諾した者とする、このようにして得られた同
意のことを、インフォームド · コンセントという。
参加者に説明すべき事項としては、目的、方法、手順、便益とリスク、結果の不確実
性の程度などである。より具体的な内容は「人を対象とする医学系研究に関する倫理指針(平
成 26 年 12 月 22 日、文部科学省・厚生労働省)
」に示されている。
介入研究では、ある要因の適用や除去あるいは治療法が目的とする疾病予防や予後改善に役立
ちと予想されるが確実ではない段階、つまり効果が十分にわからない状態において研究に参加
することになるため、文書によるインフオームド · コンセントが基本的に必須である。
(新た
に実施する)疫学研究では、研究目的による被験者への侵襲がない場合、例えば検診データの
研究利用について、検診会場に集まった人たち全体に口頭で説明したり、検診会場に検診デー
タを疫学研究に利用する旨の文書を掲示してインフォームド · コンセントを得ることも可能
であるが、拒否の機会を保障しなければならない。
「鷲尾昌一:はじめて学ぶやさしい疫学(日本疫学会監修), 改訂第 2 版, p101-110, 2010, 南
江堂」より許諾を得て抜粋し転載.
37
疾病登録
ある疾病が発生した場合、それを診察した医師から衛生関係当局や自治体への患者の届出に基
づいて、登録が行われる。代表的なものに全国がん登録、脳卒中登録がある。
「がん登録等の推進に関する法律」に基づく「全国がん登録」では、居住地域にかかわらず全
国どこの医療機関で診断を受けても、がんと診断された人のデータは都道府県に設置された
「がん登録室」を通じて集められ、国のデータベースで一元管理される。分析された罹患率・
進行度・生存率などのデータは、国のがん対策や都道府県の地域医療計画に生かされるほか、
がん検診が効果的に実施されているかどうかを知る手がかりとなったり、医師と患者が治療方
針を考える上で重要な情報になる。
http://ganjoho.jp/reg_stat/index.html「がん登録・統計」より引用(アクセス日 2015 年 12 月
3 日)