ベキ正規時間依存型ROC曲線の開発

ベキ正規時間依存型 ROC 曲線の開発
山梨大学 下川敏雄
興和 (株) 丸尾和司
NPO 法人 医学統計研究会 後藤昌司
1. 序
生存時間研究では,治療効果 (生存期間) とともに,背景因子,あるいはバイオマーカといった因子がと
られ,それらの因子に基づく当該治療の適応患者が評価される.このとき,連続量でとられる因子は,中
央値などの基準により 2 値化されることが多い.しかしながら,2 値化が予後因子の評価に与える影響は少
なくない.本報告では,連続量で与えられる因子と生存期間の関連性の強さをグラフィカルに評価できる
方法として,時間依存型 ROC 曲線をとり上げる.時間依存型 ROC 曲線では,ROC 曲線の陽性/陰性の代
わりに,時間 t におけるイベントの有無を用いる.時間依存型 ROC 曲線は,時間 t のとり扱いの形式によ
り,2 種類の感度 (累積感度,発現感度) および特異度 (動的特異度,発現特異度) の組み合わせに基づいて
構成される.本報告では, 累積-動的 (C/D)ROC 曲線に焦点を当てる.C/D-ROC 曲線の既存の方法とし
て,Hergerty et al.(2000) は 2 変量 k 近傍法 (Akritas, 1994) に基づく方法を提案している.ただし,この方
法では,カーネル関数の平滑化パラメータが C/D-ROC 曲線の形状が大きく寄与する.そのため,本報告
では,生存期間およびバイオマーカーの同時分布に 2 変量ベキ正規分布を想定し,そのもとで,C/D-ROC
曲線を構成する.
2. 時間依存型 ROC 曲線
いま,T を生存時間,X 変数を背景因子,バイオマーカなどに基づくスコア変数とする.任意の時間 t に
おいて,スコアに対する X のカットオフ値 c での累積感度 sensC (c, t) および,動的特異度 specD (c, t) は,
C
sens (c, t) = Pr(X > c|T ≤ t) = Pr(Xi > c|D(t) = 1),
D
spec (c, t) = Pr(X ≤ c|T > t) = Pr(X ≤ c|D(t) = 0)
(1)
で与えられる.すなわち,累積感度とは,任意の時間 t までにイベントが生じた患者がカットオフ値 c よりも
大きなスコアをもつ条件付き確率,そして,動的特異度とは,任意の時間 t までにイベントが生じなかった患
者がカットオフ値 c よりも小さなスコアをもつ条件付き確率として定義される.このとき,C/D-ROC 曲線
は,任意の時間 t のもとで,カットオフ値 ci (i = 1, . . .) を動的に動かしながら (1 − specD (ci , t), sensC (ci , t))
をプロットする.
累積-動的 (C/D)ROC 曲線に対して,Heargerty et al.(2000) は,Kaplan-Meier 曲線および 2 変量経験累
積分布関数に基づく方法を提案しており,Fan et al.(2002) は,Cox 比例ハザード・モデルに基づく方法を
提案している.前者は,通常 ROC 曲線における経験 ROC 曲線の時間依存型 ROC 曲線への直接的な拡張
であり,後者は,Pepe(2003) の一般化線形モデルに基づく方法の拡張である.
3. 2 変量ベキ正規分布
いま,生存期間 t およびスコア x が 2 変量ベキ正規分布に従うとする.このとき,2 変量ベキ正規の同時
確率密度関数は
f (t, x) =
tλt −1 xλx −1
exp
√
2πσt σx 1 − ρ2 A(λ, µ, Σ)
[
1
1 − ρ2
{(
t(λt ) − µt
σt
)2
(
−2
t(λt ) − µt
σt
)(
x(λx ) − µx
σx
)
(
+
x(λx ) − µx
σx
)2 }]
である (濱崎・後藤,2002;Goto & Hamasaki, 2002).ここに,µ, σ, λ, ρ は,それぞれ,位置パラメータ,尺
度パラメータ,形状パラメータである.また,t(λt ) および x(λx ) は,λt ,λx でのベキ変換 (Box & Cox, 1964)
後の観測値を表す.さらに,A(λ, µ, Σ) は,確率比例定数項と呼ばれ,1 − A(λ, µ, Σ) が 2 変量ベキ変換
後に想定される同時片側打ち切り正規分布での打ち切り確率の大きさを表す.
4. ベキ正規時間依存型 ROC 曲線
ベキ正規 C/D-ROC 曲線では,3 節で略説した 2 変量正規分布を生存時間およびスコアの同時分布に想
D
定する.A(λ, µ, Σ) = 1 するとき,累積感度 sensC
PD (c, t) および,動的特異度 specPD (c, t) は,式 (1) より
{
C
=
D
=
sensPD (c, t)
(
Φ
{
specPD (c, t)
(
Φ
t(λt )−µt
σt
)
c(λx )−µx
σx
(
)}
(
)
/
t(λt )−µt c(λx )−µx
t(λt )−µt
,
Φ
σt
σx
σt
) (
)} {
(
)}
/
t(λt )−µt c(λx )−µx
t(λt )−µt
Φ
,
1−Φ
σt
σx
σt
Φ
で与えられる.ここに,Φ(·) は標準正規分布の累積分布関数であり,Φ(·, ·) は 2 変量標準正規分布の累積
分布関数である.
5. 結び
本報告では,生存時間およびスコアの同時分布に 2 変量正規分布を想定したもとで,累積/動的 ROC 曲
線を構成する方法,すなわち,ベキ正規 C/D-ROC 曲線を提案した.発表では,ベキ正規 C/D-ROC 曲線
の変法である,予測性曲線 (Huang et al.,2007) を構成するとともに,事例検討を通して,その有用性を検
討する.