資料 - 臨床研究センター

医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
2016年度 医学統計セミナー
医学統計セミナー ベーシックコース
⽣存時間・臨床検査データの解析
下川 敏雄
和歌⼭県⽴医科⼤学 臨床研究センター
■ ベーシック・コース
 基礎統計学 (6⽉15⽇・住⾦棟5F ⼤研修室)
 量的データの解析 (7⽉27⽇・住⾦棟5F ⼤研修室)
 質的データの解析 (8⽉24⽇・住⾦棟5F ⼤研修室)
 共変量調整を伴う解析 (11⽉2⽇・病院棟4F 臨床講堂1)
 ⽣存時間・臨床検査データの解析(11⽉16⽇・住⾦棟5F ⼤研修室)
■ アドバンス・コース
 多群・経時データの解析と多重⽐較
(11⽉30⽇・病院棟4F 臨床講堂1)
 臨床試験における症例数設定とガイドライン
(12⽉28⽇・住⾦棟5F ⼤研修室)
 アンケート調査データの解析 (2⽉1⽇・病院棟4F 臨床講堂1)
 統計的因果推論と傾向スコア (2⽉22⽇・住⾦棟5F ⼤研修室)
 メタアナリシス (3⽉22⽇・病院棟4F 臨床講堂1)
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
本講義の概要
• ⽣存時間解析
• ⽣存時間曲線の推定︓Kaplan‐Meier曲線
• ⽣存時間曲線の⽐較
• 最近の話題︓競合リスク
• 臨床検査データの解析
• 質的アウトカムに対する評価
• 量的・順序アウトカムに対する評価
⽣存時間解析
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
⽣存時間データの特徴
⽣存時間解析において重要な関数
生存時間研究では,殆どの場合,中途打ち切り観測値や欠測値といった不完全デー
タを含んでいる.
ハザード
関数
1990
1985
死亡
死亡
死亡
死亡
中途打ち切り
脱落
死亡
死亡
中途打ち切り
調査打ち切り
研究開始
被験者が時点Aまで⽣存している
ときに,時点Aで死亡する確率.
つまり,死亡リスクを意味する.
研究終結
それぞれの関数
は相互関係がある
⽣存時間
関数
研究期間
生存時間
被験者が時点Aまで⽣存する確率
確率密度
関数
被験者が時点Aで死亡
する確率
生存時間データは,個体の死亡(あるいは故障)までの時間を観測して得られる.
観測される生存時間は生存時間(確率変数)Tの実現値tであるか,あるいは中途打
ち切りが生じたときには,その中途打ち切り(打ち切りともいう)(censoring)時点の
値である.
確率密度関数,確率密度関数,生存時間関数は相互関係があり,どれか
1個が決まれば,すべてが決定できる.
本報告でとり扱う右側中途打ち切りとは,個体の登録時点はわかるものの,追跡
期間中に死亡(event)が起こらなかっとことを表す.
ログランク検定ではハザードを評価しているのに,⽣存時間曲線を描写してグラフ
を描写している.これは,3種類の関数は相互関係があるため.
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
ハザード関数と⽣存時間関数の関係
⽣存時間曲線の推定︓Kaplan‐Meier法
(a) 増加
(a) の状況
登録時点では死亡(あるいはイベン
ト)のリスクは低いものの時間経過
とともに増⼤することを意味する.
(b)⼀定
⽣存確率S(t)
(c)減少
時間t
(b) の状況
全時間上でハザード(すなわちリス
ク)が⼀定であることを意味する.
1.0
⽣存率
ハザード関数h(t)
⽣存率が50%(0.5)での⽣存期間(例では286⽇)を中央
⽣存時間(MST)という.
⽣存期間がT年での⽣存率をT年⽣存率(MST)とい
う.例⽰では1年⽣存率が38%(0.38)である.
0.5
0.38
(c) の状況
時間t
登録時点では死亡(あるいはイベン
ト)のリスクは⾼いものの時間経過
とともに減少することを意味する.
⼀般に,進⾏がんに対して⾒られ
る.
0.0
286⽇ 365⽇(1yr.)
⽣存期間
ここで注意点は,365⽇のところで,矩形の上側を⾒るのか下側を⾒るのかと
いう点である.Kaplan‐Meier曲線の矩形は上側ではなく下側での⽣存率を⾒な
ければならない.
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
Kaplan‐Meier曲線の解釈上の留意点
⽣存曲線の⽐較において重要な指標︓ハザード⽐
MSTに信頼がおけない状況
⽣存率
⽣存率
■ 中途打ち切りを表すヒゲには意味がある
MSTに信頼がおける状況
MST前にヒゲが殆どないた
め,今後あまり変化しない
MST前にヒゲがたくさんある
ため,今後の追跡調査のなかで
変化する可能性がある
ハザード(危険度) λ(t)とは「時間tまで患者が⽣存しているという条件のもとで,時間t
で死亡する確率」を表す.つまり,時間tでの死亡リスクである.
ハザード⽐(相対危険度)とはハザードの⽐である.例えば,既存薬のハザードに対す
る新薬のハザードでのハザード⽐は
ハザード⽐ HR(t)=
0.5
0.5
新薬でのハザード λ1 (t)
既存薬でのハザード λ0 (t)
死亡リスク
5年⽣存率 = 12.3%
中途打ち切り例を削除した後の
Kaplan‐Meier曲線は「死亡された
患者のなかで5年間は⽣存した割
合」となり本来の評価になって
いない!!
もとのKaplan‐Meier曲線
5年⽣存率 = 88.5%
⽣存期間
ハザード⽐
⼩
1.0
⼩
時間
ハザード⽐が⽣存時間に依ら
ず⼀定.これは,新薬のほう
が死亡リスクが低い.この状
況が⼀般的に想定される(⽐例
ハザード性の仮定).
⽣存期間
ハザード⽐
時間
ハザード⽐が⽣存時間ととも
に上昇,これは,新薬での死
亡リスクが⽣存時間の短い患
者では低いものの,その有効
性は⻑期⽣存症例になるにつ
れて薄れる.
ハザード⽐
⽣存率
削除後のKaplan‐Meier曲線
1.0
新薬
better
⽣存率
■ 中途打ち切り例を削除してはならない
⼤
⼤
ハザード⽐
MST ⽣存期間
ハザード⽐
⽣存期間
MST
既存薬
better
⼤
1.0
⼩
時間
ハザード⽐が⽣存時間ととも
に下降,これは,新薬での死
亡リスクが⽣存時間の短い患
者では既存薬と⼤差がないも
のの,その有効性は⻑期⽣存
症例になるにつれて強くなる.
医学統計セミナー ベーシックコース 第5回⽬
ログランク検定とは何をしているか︖
ログランク検定における仮定︓⽐例ハザード性
1.0
医学統計セミナー ベーシックコース 第5回⽬
ある時点tjにおける死亡・⽣存に対するク
ロス集計表
死亡
⽣存
合計
処理1
d1 j
n1 j  d1 j
n1 j
処理2
d2 j
n2 j  d 2 j
n2 j
合計
dj
nj  d j
nj
0.6
0.4
0.2
0.0
⽣存率
0.8
O j  (d1 j  E(d1 j ))
⽣存時間
0
5
10
15
20
25
30
O1
O2
処理1
d11
n11-d11
処理2
d21
n21-d21
d1J
n1J-d1J
d2J
35
n2J-d2J
OJ
もし,処理1と処理2で死亡数が同じであれ
ば(つまり処理効果がなければ),■の期待
度数は,カイ2乗検定と同じ理屈から
E(d1 j ) 
d j n1 j
nj
である.期待度数からの乖離
上記の2×2クロス集計表の■部分をすべ
ての時点において計算し,その総和をと
る O1  O2    OJ ことで構成されたのが,
ログランク検定である.
○ ⽐例ハザード性
ハザード関数h(t)
治療効果
対照
処理
時間t
時間tに関係なく治療効果の差が
⼀致である.
ハザード⽐
× ⽐例ハザード性
ハザード関数h(t)
対照
処理
時間t
時間tに関係なく治療効果の差が
⼀致でない.
⽐例ハザード性の仮定は,ログランク検定だけでなく⽐例ハザードモデル
においてもおかれている.
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
もうひとつの検定⽅法︓⼀般化Wilcoxon検定
⼩児急性⽩⾎病データ
(Freireich et al., 1963)
1.0
ログランク検定 (d1 j  E(d1 j ))
6MP
投与群
対照群
0.6
0.8
⼀般化Wilcoxon検定
Sˆ (t j )  (d1 j  E(d1 j ))
10
15
20
25
30
35
10
22
10+
23
4
11
5
12
1.0
+は中途打ち切り,単位は⽉
0.8
諸種の検定におけるP値
ログランク検定 p<0.0001
Gehanの⼀般化Wilcoxon検定 p=0.0002
0.6
6MP群
Peto‐Petoの⼀般化Wilcoxon検定 p=0.0002
対照群
0.4
5
6
6
6
6+
7
9+
11+ 13 16 17+ 19+ 20+
25+ 32+ 32+ 34+ 35+
1
1
2
2
3
4
5
8
8
8
8
11
12 15 17 22 23
いずれの検定法でも6MP群と対照
群のあいだで有意であることがわ
かる.
0.2
0
⽣存時間
⼀般化Wlcoxon検定では,ログランク
検定に対して,⽣存率による重み付け
を⾏っている(⽣存率の推定がKaplan‐
Meier法の場合にはPeto‐Petoの⼀般化
Wilcoxon 検 定 , Prentice 法 の 場 合 に は
Prenticeの⼀般化Wilcoxon検定と呼ばれ
る).
⽣存率
0.0
0.2
0.4
⽣存率
2標本の⽐較の例⽰(1)
0.0
時間tが⼩さい場合には,Sˆ (t j ) が1に近い(重みが⼤きい)ことから,⼀般化Wilcoxon
検定では,早期の2群間の差に敏感である.
0
5
10
15
20
25
30
35
⽣存時間(⽉)
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
⼿法による違い(⼤橋・浜⽥,1995)
34
309
392
88
351
429+
137
358
451
280
369
291
370
299+
375
300+
382
群A
群A
群B
1.0
+は中途打ち切り,単位は⽇
0.8
諸種の検定におけるP値
ログランク検定 p=0.0183
Gehanの⼀般化Wilcoxon検定 p=0.0995
Peto‐Petoの⼀般化Wilcoxon検定 p=0.1342
0.2
0.4
0.6
低グレイド群
⾼グレイド群
0.0
⽣存率
199
369
1119+
(c) 生存曲線が交差
(a) 後期で生存率の差が顕著 (b) 前期で生存率の差が顕著
生存率
⾼グレイド群
421+
生存率
卵巣がん患者のグレイド毎での病気進⾏期間(Fleming et al., 1980)
28
89
175
195
309
377+
393+
低グレイド群 447+
462
709+
744+
770+ 1106+ 1206+
生存率
2標本の⽐較の例⽰(2)
0
200
400
600
800
⽣存時間(⽇)
1000
1200
⽐例性は満たされていないと指摘されてい
るデータではあったものの,ログランク検
定のみに有意差が認められた.初期の⽣存
時間で差が認められなかったことが寄与し
ていると考えられる.
群B
生存時間
群B
生存時間
群A
生存時間
(a)の状況では,ログランク検定のほうが一般化Wilcoxon検定よりも検出力が強い.
(b)の状況では,一般化Wilcoxon検定のほうがログランク検定よりも検出力が高い.
(c)の状況では,いずれの方法も検出力が低い.
検出力とは,治療効果があるときに「有意である」と正しく判断できる確率を意味する.
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
最近の調査研究で⽤いられる⽅法︓競合リスク
競合リスクでは⽣存率ではなく発⽣率を評価する
競合リスクの例⽰︓⾼齢者の胃がん患者に対する抗癌剤の評価
累積発⽣関数(CIF; Cumulative Incident Function)
原因jによるイベントが時間tまでに発現する確率(Kalbfleisch & Prentice, 1980)
エンドポイント︓全⽣存期間
時間t
追跡不能
中途打ち切り
胃がん患者
Follow up
時間
イベントが発⽣する確率(CIF)
任意の原因j
癌による死亡
CIF
イベント
その他のイベント
競合リスクイベント
⾼齢者のがん患者では,がんによる死亡よりも前に,その他の要因(例えば,
循環器疾患)による死亡が起きる可能性が⾼い.このとき,全⽣存期間は抗
癌剤の有効性を⼗分に反映しない結果となり得る.
医学統計セミナー ベーシックコース 第5回⽬
時間
通常の⽣存時間解析では,
⽣存率︓任意の⽣存期間までに,⽣存(イベントがない)している割合
を評価するが,競合リスクの場合にはイベントにラベリングが⾏われているので.
累積発現率︓任意の⽣存期間までに,任意のイベントが発現する割合
を評価する.
医学統計セミナー ベーシックコース 第5回⽬
カテゴリカルデータ(定性テスト)の評価
疾病の有無
有
無
陽性
真陽性(TP)
偽陽性(FP)
陰性
偽陰性(FN)
真陰性(TN)
臨床検査データの解析
検査結果
感度
特異度
疾患の有無には有病率が関係する
■ 真陽性(TP)︓疾患有の被験者を陽性と正しく診断すること.
■ 偽陰性(FP)︓疾患有の被験者を陰性と誤って診断すること.
■ 真陰性(TN)︓疾患無の被験者を陰性と正しく診断すること.
■ 偽陽性(FP)︓疾患無の被験者を陽性と誤って診断すること.
感度(Sensitivity)
感度 = TP/(TP+FN) ︓疾患有の被験者を陽性と正しく判断する確率
特異度(Specificity)
特異度 = TN/(TN+FP)︓疾患無の被験者を陰性と正しく判断する確率
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
感度・特異度の留意点
陽性的中率(陽性予測値)・陰性的中率(陰性予測値)
疾病の有無
感度(Sensitivity)
特異度(Specificity)
特異度 = TN/(TN+FP)︓疾患無の被験者を陰性と正しく判断する確率
利点︓当該疾患の有病率(prevalence)に影響されず診断性能を評価できる.
注意点︓「感度 ≠ 疾患の確率」であることに注意する.
感度
臨床的有⽤性
検査
結果
感度 = TP/(TP+FN) ︓疾患有の被験者を陽性と正しく判断する確率
有
無
陽性
真陽性(TP)
偽陽性(FP)
陰性
偽陰性(FN)
真陰性(TN)
陽性的中率
陰性的中率
疾患の有無には有病率が関係する
陽性的中率(positive predictive value)
陽性的中率 = TP/(TP+FP)︓陽性の被験者のなかで疾患有の確率
陰性的中率(Specificity)
陰性的中率 = TN/(TN+FN)︓陰性の被験者のなかで疾患無の確率
陽性
疾患患者
陽性
感度は,結果がわかっている状
況のなかで評価している.
疾患患者
陽性と診断されたときに,本当
に疾患だった確率が重要になる.
利点︓臨床的有⽤性は陽性的中率で評価できる.
陽性
疾患患者
注意点︓これらの指標は,有病率の影響を受ける.
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
感度・特異度と陽性的中率・陰性的中率の関係
診断精度の評価尺度︓尤度⽐
疾病の有無
感度・特異度と陽性的中率・陰性的中率の関係は,Bayesの定理を⽤いて計算できる.
有病率 × 感度
(有病率 × 感度) + (1‐有病率)×(1‐特異度)
この数式からも陽性的中率では有病率が問題になることがわかる.
余談
Bayesの定理とは,Thomas Bayesによって発⾒された
定理である.このBayesの定理を⽤いる統計学のことを
Bayes統計学という.
その利点は,データ以外の知識・経験などの様々な
情報を事前情報として,未治療の推測のために活⽤で
きる.また,新たなデータを得たときには,これを事
前情報(事前分布)として取り込むことができる.
Thomas Bayes(1702‐1761)
Bayesの定理そのものは,300年近くまえに発⾒されたも
のだが,近年Bayes統計学が脚光を浴び,医学・薬学分野
にも広く応⽤されている.
検査
結果
陽性的中率 =
有
無
陽性
感度(TPR)
1-特異度(FPR)
陰性
1-感度(FNR)
特異度(TNR)
陽性尤度⽐(likelihood ratio of a positive result)
陽性尤度⽐ = TPR/FPR = 感度/(1-特異度)
「疾患有が疾患無よりも何倍陽性になりやすいか」を表す指標
疾患有を陽性と診断した場合と疾患無を陽性と診断した場合の⽐で表されており,
⼤きいほど確定診断に優れるといえる(⼀般に尤度⽐といった場合には陽性尤度
⽐を表す.)
陰性尤度⽐(likelihood ratio of a negative result)
陽性尤度⽐ = FNR/TNR = (1-感度)/(特異度)
「疾患有が疾患無よりも何倍陰性になりやすいか」を表す指標
疾患有を陰性と診断した場合と疾患無を陰性と診断した場合の⽐で表される指標
である(あまり⽤いられない).
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
例⽰︓疑似データ(新⾕, 2016)
例⽰
有
無
陽性
24 (TP)
19 (FP)
43 (TP+FP)
陰性
16 (FN)
941 (FP)
957 (FN+FP)
合計
40 (TP+FN)
疾病の有無
合計
960 (FP+FP)
検査
結果
検査
結果
疾病の有無
無
陽性
24 (TP)
19 (FP)
43 (TP+FP)
陰性
16 (FN)
941 (FP)
957 (FN+FP)
40 (TP+FN)
960 (FP+FP)
1,000
合計
1,000
合計
有
TPR = 0.60,TNR = 0.98
感度(Sensitivity)
感度(TPR) = TP/(TP+FN) = 24/40 = 0.60
陽性尤度⽐(likelihood ratio of a positive result)
特異度(Specificity)
陽性尤度⽐ = TPR/FPR = 0.60/(1-0.98) = 30.32
特異度(TNR) = TN/(TN+FP) = 941/960 = 0.98
陰性尤度⽐(likelihood ratio of a negative result)
陽性的中率(positive predictive value)
陰性尤度⽐ = FNR/TNR = (1-0.60)/0.98 = 0.41
陽性的中率 = TP/(TP+FP) = 24/43 = 0.56
陰性的中率(Specificity)
陰性的中率 = TN/(TN+FN) = 941/957 = 0.98
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
量的データ・順序データの評価︓ROC曲線
量的データ・順序データの評価︓ROC曲線
偽陽性(FP)
真陰性(TN)
ROC曲線
特異度
1-特異度(FPR)
良好
真陽性
疾患群において,カットオ
フ値(u)以上となる.
偽陽性
疾患群において,カットオ
フ値(u)未満となる.
不良
真陰性
疾患群
⾮疾患群において,カット
オフ値(u)以上となる.
感度(TPR)
非疾患
偽陰性(FN)
判定
疾患
真陽性(TP)
曲線化⾯積AUC
ROC曲線の曲線以下の⾯積である(■
の⾯積).複数の検査を⽐較したり,
診断能を数値化するのに⽤いられる.
偽陰性
⾮疾患群において,カット
オフ値(u)未満となる.
カットオフ値uを⼩さいほうから⼤
きいほうに動かしたときの,
(1‐特異度,感度)
をプロットしたものがROC曲線であ
る.
ROC曲線は,45度の直線に対して扇
型の形状を⽰す.座標(0,1)[●で表
された場所]に近くなるほど良好な
診断であるといえる.
感度
非疾患群
カットオフ値(u)
1-特異度
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
事例︓卵巣癌データ(Pepe,2003)
事例に対するROC曲線
卵巣癌の有無を識別するために,卵巣癌患者30名および健常者23名の遺伝子データ
が観測されている(Pepe, 2003).本解析の目標は,任意の遺伝子が卵巣癌の発現に
寄与しているか否かを評価することにある.
10
健常者
8
6
頭部外傷症データ(Zhou, et al.,2002)
頭部外傷症の重篤度を識別するために,CK‐BB(クレアチン・キナーゼBB)
が有効か否かを判定している.ここに,重篤度は,重度および⾮重度の2
値とする.Zhou et al.(2002)は,CK‐BBが成⼈での重篤度の判定だけでなく,
未成⼈においても利⽤可能であるか否かを検討している.
4
重症群
2
0
400
600
800
1000
1200
1400
1600
1800
2000
2200
8
卵巣癌患者
6
4
2
0
400
600
800
1000
1200
1400
1600
1800
2000
2200
140
1087
230
183
1256
700
16
800
253
740
126
153
283
90
303
193
76
1370
543
913
230
463
60
509
576
671
80
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
JMPによる実⾏
ROC曲線の結果
⾮重症群
490
156
356
350
323
1560
120
216
443
523
76
303
353
206
136
286
281
23
200
146
220
96
100
60
17
27
126
100
253
70
40
6
46
ROC曲線に接する45度の直線であり,
最適カットオフ値を⽰す指標の⼀つ
JMPの⼿順
最適カットオフ値にはROCテーブルのなか
に*印がついている.
STEP.1 「分析」→「2変数の関係」ボタンを押す.
STEP.2 「Y,⽬的変数」にグループ「X,説明変数」に観測
値を選択する.
(ロジスティック当てはめ)のウィンドーが表⽰される.
感度‐(1‐特異度)が最⼤になる地点
STEP.3 「▼」からROC曲線を選択する.
ROC曲線の曲線下⾯積
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
ROC曲線の⽐較︓対応がある場合とない場合
ROC曲線の⽐較の諸型
任意の臨床データ
頭部外傷症データ
未成年
■ ⽐較1︓ROC曲線の同⼀性
QQプロット
成年
H 0 : a1  a2 かつ b1  b2 バイオマーカA
バイオマーカB
CK-BB
←比較→
←比較→
対応がある場合
対応がない場合
同⼀ではない
■ ⽐較2︓任意の(1-特定度)
での感度の⽐較
■ ⽐較3︓曲線下⾯積の⽐較
A1
H 0 : Se1 (c)  Se2 (c)
医学統計セミナー ベーシックコース 第5回⽬
医学統計セミナー ベーシックコース 第5回⽬
JMPによる対応のあるデータでのROC曲線のAUCの⽐較
結果
A2
H 0 : A1  A2
ROC曲線のAUCを⽐較するには,JMPの外部スクリプトを利⽤する必要がある.外
部スクリプトは,臨床研究センターで管理しているため,要望がある場合は,連
絡をお願いします.
JMPの⼿順
STEP.1 データファイルを読み込む
STEP.2 「ファイル」→「対応のあるROC曲線の⽐較」を選択し,「開く」の横の▼を押
して実⾏を選ぶ.
疾患の有無を表す変数
検査値(2個以上)
ROC曲線の曲線下⾯積及び95%CI
ROC曲線の曲線下⾯積の検定
ROC曲線の曲線下⾯積の差の95%CI
医学統計セミナー ベーシックコース 第5回⽬
ご清聴ありがとうございました