「閉じた検定手順の臨床応用:多重比 較・多重エンドポイントから

第6回久留米大学バイオ統計学フォーラム
「閉じた検定手順の臨床応用:多重比
較・多重エンドポイントからアダプティブ
デザインまで」
久留米大学バイオ統計センター
森川 敏彦
2007.9.29
於九州大学百年記念講堂
1
はじめに
„
„
昨年末の日本計量生物学会主催計量生物セミ
ナーで、臨床試験における多重性の問題につい
て議論し、種々のアプローチについて紹介した。
本日は閉じた検定手順に的を絞り、この手法を
紹介するが、上記セミナーで触れることができな
かった用量‐反応及び繰り返し測定データへの
適用や、最近の成果(階層性のある仮説群に対
するgatekeepingアプローチ、適応型デザインに
おける応用)についても触れることにした。
2
平ったく
言えば
„
„
多重性の問題
沢山(複数回)検定を行うことにより言いすぎが
生じる(第一種の過誤αがインフレを起こす)こと
(信頼区間では多くの信頼区間を作ることにより
信頼度が低下すること)
第一種の過誤(率):統計的検定において帰無仮説を誤
って棄却する確率(検定の枠組みから、これは小さい値
に抑える必要がある;通常両側α=5%)
3
帰無仮説が正しい場合の棄却確率
(第一種の過誤α=5%と決めたとする)
5%
5%
検定3回目
検定1回目
5%
検定2回目
4
多重性の問題
„
検定の論理は
帰無仮説の下では生じにくい事象の発現により
帰無仮説を棄却(否定)
すること
„
⇒帰無仮説の下で 頻繁に 生じることをもって、
帰無仮説の否定はできない。
帰無仮説は通常「治療が無効」とか「治療間に差がない」
という仮説になり、それを検定結果で統計的に否定する
ことにより治療の有効性や対照に対する優越性の証明
がなされることになる。
5
多重性の問題
„
検定の多重性の問題は、検定全体として言い過
ぎがないようにしなければならない。
„
多重性の問題は「仮説の検証」の根幹にかかわ
る重要な問題
6
ICH 統計ガイドラインにおける記述
„
5.6有意水準と信頼水準の調整
‰
可能な場合には多重性を回避又は軽減すべき
„
„
„
‰
‰
重要な変数の指定(変数の絞り込み)
多重比較で重要な比較を選択(比較の限定)
繰り返し測定でAUCのような要約指標を使用
なお残る多重性のすべての側面について治験実
施計画書で明記
調整は常に考慮すべき
ICH(International Conference on Harmonization):新薬承認審査の科学的基盤に関する
国際調和を図るための国際会議(このことによっていい薬を早く世界の患者に届けることが
可能となることを目指し、1990年に発足;日米欧3極の規制当局と製薬業界の代表6パー
ティで構成)
7
ICH 統計ガイドラインにおける記述
5.6 有意水準と信頼水準の調整
„
„
多重性
‰ ①多重エンドポイント(多項目比較)
‰ ②多重比較(多群比較)
‰ ③繰り返し測定(多時点比較)
‰ ④中間解析(試験の途中での多数回比較)
多重性が存在する場合、第一種の過誤の調整
が必要
8
①多重エンドポイント
„
プロトコールに扱い方を書く
‰ 合成変数composite variableあるいは複合エンドポ
イントcomposite endpointの使用
ADAS-cog合計点(認知症)、ACR20(リウマチ)、
心血管系の疾患における総死亡・心血管系の死亡
‰
エンドポイントを統計的に総合化
O’Brienの方法
‰
エンドポイントを重要度に従い順序付ける
‰
Bonferroniの方法あるいはその変法(修正
Bonferroni法;Holm法、Hochberg法、・・・)
再抽出法resampling method (Westfall&Young,
‰
階層手順hierarchical procedure
アレルギー性鼻炎:①鼻閉⇒②鼻汁⇒③くしゃみ
1993)
9
②多群比較における多重比較
„
„
最も古くから方法論が検討された多重性の問題
同時比較simultaneous comparisons
‰
‰
Tukey法、Dunnett法、Bonferroni法(、Scheffe法)
Tukey法、Dunnett法は任意の対比の比較にも利用でき
ることが知られている(但しその場合は信頼幅は広くな
る)
10
Tukey法:任意の2群間の比較
A
B
C
Dunnett法:特定の対照群との比較
A
C
B
11
Bonferroni法
„
„
比較全体の有意水準をα、比較の数をK⇒
比較毎の有意水準をα/K
α=5%、K=5なら、各比較の有意水準は
5%/ 5=1%
„
このようにして検定を行なえば比較全体とし
ての有意水準はα以下になることが、
Bonferroniの不等式により証明される。
„
しかしこれは一般に非常に厳しい基準
⇒種々の改良法
12
古典的な多重比較のディレンマ
„
多重性の調整をしない
‰
‰
„
統計的言い過ぎ(第一種の過誤αの増大)
⇒科学的な証拠立てとはならない
多重性の調整をする(古典的多重比較)
‰
‰
有意になりにくい(第二種の過誤βの増大)
⇒結論が出しにくい
言い過ぎを抑え、かつ検出力も高くするにはど
うすればよいか?
13
改善された方法
„
逐次法sequential procedure
‰
閉手順closed testing procedure
„ 修正Bonferroni法(Holm法など)
„ 逐次型Dunnett法、Tukey-Welsh法
„ Williamsの検定(用量反応;Biometrics,
1971,1972)
‰
Protected LSD、Newman-Keuls法、
Duncan法などよく知られた古典的な方法
のいくつかは第一種の過誤を制御せず第
一種の過誤の増大を招くので使用すべき
ではない(3群比較の場合は例外)。
14
逐次法:閉手順Closed Testing Procedures
(CTP) Marcus, Peritz and Gabriel(1976)
„
„
„
„
„
„
„
強い意味で第一種の過誤率を制御するための逐次検定アプローチ
対応する一段階法(同時比較法)の検出力を改善する。
現在提案されている有力な方法の多くは閉手順に従った方法
Bauer(1991):多重比較、多重エンドポイント、繰り返し検定への応用
Connel(1994):用量‐反応効果を検定する問題
Koch&Gansky(1996),Chi(1998):臨床試験でのCTP(多重エンドポイ
ントやサブグループ解析含む)
Morikawa,Terao&Iwasaki(1996):多重比較における修正Bonferroni
法と呼ばれる一群のCTPの性能比較
15
閉手順:仮説が2つの場合
Dunnett型の
検定では
厳しい基準⇒
Dunnettの基準
H1 ∩H2
:多重性の調整
緩い基準⇒
単一の検定
の基準
H1
A=C
敗者復活!
A=C
and
B=C
H2
B=C
16
閉手順:仮説が3つの場合
完全帰無仮説
H1 ∩H2 ∩H3
最も厳しい基準
部分帰無仮説
厳しい基準
H1 ∩H2
H1 ∩H3
H2 ∩H3
H1
H2
H3
基本仮説
最も緩い基準
17
閉手順の例
„
„
„
„
Williamsの検定:用量反応
修正Bonferroni法(Holm法、Hochberg法など)
逐次型Dunnett法:対照群との比較
階層手法Hierarchical Method
‰ 比較を予め順序付け、その順序で検定を行い、有意になった場
合にのみ、次の段階に進む。
„
‰
‰
„
例:アレルギー性鼻炎の3症状(鼻閉、鼻汁、くしゃみ)に対して薬の
薬理作用を考慮した順序付けを行なう。
俗に閉手順と呼ばれているのはこの手法
このアプローチを仮説群に拡張したのがgatekeeping法
任意の多変量検定あるいは包括検定(global test)の閉手順化
‰ ひとつの例は多重エンドポイントにおける
O’Brienの検定の閉手順化
Lehmacher et al(1991)
18
閉手順:Holm法
各段階で各仮説をBonferroni法で検定
p値の小さい順に
p(1)≦p(2)≦p(3)、対
応する仮説をH(1),
H(2),H(3)とする。
H(1) ∩H(2)
H(1) ∩H(2) ∩H(3)
p(1) <α/3?
p(2) <α/2?
H(1) ∩H(3)
H(2) ∩H(3)
p(3) <α?
H(1)
H(2)
H(3)
19
逐次Dunnett法(多重比較)
各仮説を順番にDunnett法で検定
3処理群対対照群
の比較⇒比較の
数は3つ: T1 vs C,
T2 vs C, T3 vs C
H(1) ∩H(2) ∩H(3)
H(1) ∩H(2)
H(1) ∩H(3)
H(1)
H(2)
P値の小さい順に
対応する仮説を
H(1) ,H(2),H(3)と
する。
H(2) ∩H(3)
H(3)
20
閉手順:逐次Tukey法
3処理群の比較⇒
比較の数は3つ:
T1 vs T2, T2 vs T3,
T1 vs T3
T1 vs T2
完全帰無仮説
H1 ∩H2 ∩H3
最も厳しい基準
H1 ∩H2
H1 ∩H3
H2 ∩H3
H1
H2
H3
T2 vs T3
T1 vs T3
21
階層法Hierarchical Method
各仮説を重要度の順番に検定
鼻閉
項目の重要度の
順に対応する仮
説をH(1) ,H(2),H
(3)とし、この順に
検定していく。
H(1) ∩H(2)
H(1) ∩H(2) ∩H(3)
H(1)のみを検定
H(2)のみを検定
鼻汁
H(1) ∩H(3)
H(2) ∩H(3)
H(3) を
検定
くしゃみ
H(1)
H(2)
H(3)
22
用量‐反応
用量反応試験で単調な用量反応を仮定し、
プラセボ、低用量、中 用量、高用量の平均を
µ P ≤ µ L ≤ µ M ≤ µ H とする。
H1 : µP = µL
H 2 : µP = µM ( = µL )
H 3 : µP = µH ( = µL = µM )
から
H1 I H 2 = H 2 ,H1 I H 3 = H 3 ,H 2 I H3 = H 3 ,
H1 I H 2 I H3 = H3
ゆえに階層手順によりH 3、H 2、H 1の順に検定して
いけばよい。
23
用量‐反応及び繰り返し測定
Williamsの検定は、まさにこのような階層手順による
検定となっている。
t検定を用いて、プラ セボと実用量との比較を高用量から
順に行っていく手順も このアプローチになる。
効果の有無の確認及び効果発現時間の同定のための
繰り返し測定によるプラセボ対照試験では、後ろの時点
から順に検定していく。効果持続時間の場合は逆方向
24
粗p値(生p値)と調整p値
帰無仮説の族{ H 1 , H 2 ,..., H m }に対応し、m個の有意性検定
個別p値:個別の帰無仮説に対応するp値( 粗p値、生p値)
p1 , p2 ,..., pm
全体帰無仮説( global null hypothesis ):H 1 , H 2 ,..., H mの積仮説
H G = H 1 ∩ H 2 ∩ ... ∩ H m
調整p値 : ~
p1 , ~
p2 ,..., ~
pm
~
p ≤ αのときにH を棄却
i
i
H Gに対する調整p値 : ~
pH G = min{ ~
p1 , ~
p2 ,..., ~
pm }
つまり~
p ≤ αのときにH を棄却
HG
G
25
Bonferroni法と調整p値
Bonferroni法
pi ≤ α / mのときにH i を棄却
⇔
~
pi = mpi ≤ αのときにH i を棄却
~
p : 調整p値
i
Bonferroni法での検定全体としての調整p値は
~
p = min ~
p = m ⋅ min p
i
i
つまり~
p ≤ αのときに全体仮説が棄却される。
26
重み付きBonferroni法と調整p値
重み付きBonferroni法
pi ≤ α i = wiαのときにH iを棄却
m
m
i =1
i =1
但し∑ wi = 1, wi ≥ 0 ,あるいは∑ α i = α ,α i ≥ 0
⇔
~
pi = pi / wi ≤ αのときにH iを棄却
~
p : 調整p値
i
重み付きBonferroni法での検定全体としての調整p値は
~
pG = min ~
pi = min{ pi / wi }
~
p ≤ αのときに全体仮説が棄却される。
G
27
修整Bonferroni法
閉手順の枠組みに沿って古典的Bonferroni法を改善
m
m個の仮説の積仮説H = Ii =1 H ( i )
但しH ( i )はi番目に小さなp値p( i )に対応する仮説
◆Holm法
Bonferroni基準の使用:あるkについてp ( k ) ≤ α / mならHを棄却
調整p値:~
p = m⋅p
(k )
(k )
◆Hochberg法
Hochberg基準の使用:あるkについてp ( k ) ≤ α /( m − k + 1 )ならHを棄却
調整p値:~
p = ( m − k + 1 )⋅ p
(k )
(k )
◆Hommel法
Simes基準の使用:あるkについてp ( k ) ≤ kα / mならHを棄却
調整p値:~
p = ( m / k )⋅ p
(k )
(k )
α / m ≤ α /( m − k + 1 ) ≤ kα / m
⇒ これらの中ではHommel法が一番検出力が高い( Morikawa , et al .( 1996 ))
ただし、Hochberg法とHommel法は常にαを制御することが
完全に保証されていない。
28
Holm法とHochberg法
森川(2005, 2007)
STEP DOWN
Holm法
有意
NS
H(1)のみ棄却
p(1)
p(2)
p(3)
p(4)
p(5)
有意水準α/5
α/4
α/3
α/2
α
p値
STEP UP
Hochberg法
H(1),H(2),H(3),H(4)を棄却
例:p=0.001, 0.013, 0.015,0.022, 0.08,
α=0.05
29
修整Bonferroni法の検出力
Bonferroni ≤ Holm ≤ Hochberg ≤ ( Hommel < Rom )
Holm ≤ Shaffer
Morikawa , et al .( 1996 )
Commelli( 2003 )
Dmitrienko , et al .( 2005 )
Rom法 : Hochberg法をSidak基準を用いて改良したもの
Shaffer法:Holm法を仮説間の構造を利用して改良したもの
30
例:用量探索高血圧試験
Dmitrienko et al.(2005)
µ p − µ L , µ p − µ M , µ p − µ H がそれぞれ正の場合に、
各用量のDBP(拡張期血圧)の改善を示す。
したがって以下の帰無仮説を検定することを考える。
H L = { µ p − µ L ≤ δ }, H M = { µ p − µ M ≤ δ }, H H = { µ p − µ H ≤ δ }
ここにδ ( > 0 )はプラセボに対し臨床的に意味のある差
処理平均は2標本t検定により検定されるものとする。
31
3つの仮説HL,HM,HHに対する閉手順
„
HL,HM,HHに対する積仮説の生成
„
HLM = {HL∩HM}, HLH = {HL∩HH } ,
HMH = {HM∩HH }, HLMH = {HL∩HM ∩HH }
HLMH
HLM
HLH
HMH
HL
HM
HH
A
B
仮説の包含関係(AがBを含む)
32
3つの仮説HL,HM,HHに対する閉手順
„
„
元の仮説を含む積仮説
元の仮説
元の仮説を含む仮説
HL
HL, HLM, HLH, HLMH
HM
HM, HLM, HMH, HLMH
HH
HH, HLH, HMH, HLMH
閉手順
元の仮説を含む積仮説すべてについて水準αの検定を
行い、すべてについて有意となったときに元の仮説を棄
却する。
33
Decision Matrix アルゴリズム
„
„
„
Holm法のような単純な逐次法になる閉手順は
殆どない
一般の閉手順を実施するのは大変(枝分かれ)
Decision Matrix アルゴリズム:一般の閉手順を
実施するアルゴリズム
Dmitrienko, Offen and Westfall (2003)
34
Holm法に対するDecision Matrix
Dmitrienko et al.(2005)
積仮説に含まれる仮説
積仮説
調整P値
HL
HM
HH
HLMH
PLMH=3min(PL, PM, PH)
PLMH
PLMH
PLMH
HLM
PLM =2min(PL, PM)
PLM
PLM
0
HLH
PLH =2min(PL, PH)
PLH
0
PLH
HL
PL
PL
0
0
HMH
PMH =2min(PM, PH)
0
PMH
PMH
HM
PM
0
PM
0
HH
PH
0
0
PH
HH
PH
0
0
PH
各基本仮説に対する調整p値:たとえば
~
p L = max{ p LMH , pLM , p LH , pL }
35
階層法に対するDecision Matrix
用量反応の単調性を仮定
積仮説に含まれる仮説
積仮説
調整P値
HL
HM
HH
HLMH
PLMH=PH
PH
PH
PH
HLM
PLM =PM
PM
PM
0
HLH
PLH =PH
PH
0
PH
HL
PL
PL
0
0
HMH
PMH =PH
0
PH
PH
HM
PM
0
PM
0
HH
PH
0
0
PH
~
~
~
各基本仮説に対する調整p値: pL = max{ pH , pM , pL }, pM = max{ pH , pM }, pH = pH
36
Gatekeeping Strategies
門番戦略
仮説群1
仮説群2
仮説群3
37
直列型門番serial gatekeeping
Dmitrienko et al.(2005)
仮説群
仮説1
仮説2
仮説3
すべての仮説が棄却されてはじ
めてこの仮説群のゲートが開く
38
並列型門番parallel gatekeeping
Dmitrienko et al.(2005)
仮説群
仮説1
仮説2
仮説3
いずれかの仮説が棄却されれば
この仮説群のゲートが開く
39
階層的に順序付けられたエンドポイント
階層法Hierarchical Method(再掲)
各仮説を重要度の順番に検定
項目の重要度の
順に対応する仮
説をH(1) ,H(2),H
(3)とし、この順に
検定していく。
H(1) ∩H(2)
鼻閉
H(1) ∩H(2) ∩H(3)
H(1)のみを検定
H(2)のみを検定
鼻汁
H(1) ∩H(3)
H(2) ∩H(3)
H(3) を
検定
くしゃみ
H(1)
H(2)
H(3)
40
Holm法とHochberg法:仮説が2つの場
合に棄却される仮説
H(1)
H(2)
Holm法
Hochberg法
p(1) ≦ α/2 p(2) ≦α/2 H(1), H(2)
H(1), H(2)
p(1) ≦ α/2 p(2) ≦ α
H(1), H(2)
H(1), H(2)
p(1) ≦ α/2 p(2) >α
H(1)
H(1)
p(1) ≦ α
p(2) ≦ α
p(1) ≦ α
p(2) >α
H(1), H(2)
41
2個の主要エンドポイントと
1個の副次エンドポイント①
直列型gatekeeping
H2
H1
AND
①H1,H2につ
いて
Hochberg/Hol
m法で検定
IF
H1,H2のいず
れも有意
H3
THEN
②H3の検定
Dmitrienko et al(2003)
42
2個の主要エンドポイントと
1個の副次エンドポイント②
並列型gatekeeping
H2
H1
①H1,H2の検定にはH3
を含めてHochberg法で
検定
IF
OR
H1,H2のいずれもp<α
OR
いずれかp<α/2
H3
THEN
②H3の検定
Dmitrienko et al(2003)
43
一般の直列型gatekeeping
F1 : gatekeeper仮説群
F2 : F1が条件を満足し
F1
F2
gateが開いたときに検定される仮説群
①H i ∈ F1をF1内での閉手順で検定
②すべてのH i ∈ F1が棄却されたとき、
H j ∈ F2 をF2内での閉手順で検定
この手順は強い意味でFWERを制御する。
つまり真の帰無仮説がなんであっても、
検定全体の第一種の過誤率を名目水準αに保つ。
44
一般の並列型gatekeeping
例:F1 = { H 1 , H 2 }, F2 = { H 3 }
H 1 , H 2のいずれかが棄却されればH 3は検定される。
Hに対する対立仮説をHで表すことにしたとき、
H 3 = ( H 1 ∩ H 2 ) ∪ H 3を考えるとH 3 = ( H 1 ∪ H 2 ) ∩ H 3
*
*
*
3
したがってH 3の代わりに制約付きの仮説H を考え
*
3
{ H 1 , H 2 , H }に関する閉手順を作り上げれば、並列型
gatekeepingに対する水準αの検定手順が作れる。
45
一般の並列型gatekeeping
H 1 ∩ H 3 = H 1 ∩ ( H 2 ∪ H 3 ), H 2 ∩ H 3 = H 2 ∩ ( H 1 ∪ H 3 ),
*
*
H1 ∩ H 2 ∩ H 3 = H1 ∩ H 2
*
積仮説についてBonferroni基準を用いるものとする。
p1 ≤ α / 2なら、H 1は棄却される。このときp3 ≤ α / 2なら
H 3も棄却される。
同様にp2 ≤ α / 2なら、H 2は棄却される。
このときp3 ≤ α / 2ならH 3も棄却される。
p1 ≤ α / 2かつp2 ≤ αなら、H 1 , H 2は棄却され ,
このときp3 ≤ α / 2ならH 3も棄却される。
p1 ≤ α / 2かつp2 ≤ α / 2なら、H 1 , H 2は棄却され ,
このときp3 ≤ αならH 3も棄却される。
46
多重エンドポイントと多重処理
2個のエンドポイント、3群比較
直列型gatekeeping
治癒で
TがPに
優る?
H2
H1
Hochberg
/Holm
AND
治癒でRが
Pに優る?
無再発治
癒でTがR
に優る?
H3
無再発
治癒で
TがPに
優る?
十二指腸潰瘍
H4
47
高用量、低用量と標準薬の比較
非劣性及び優越性①
直列型gatekeeping
高用量
H0H1
H0H2
①非劣性
H,Lについて
Hochberg(or Holm)
法で検定
IF
AND
いずれも有意
THEN
低用量
H0L1
非劣性
H0L2
優越性
②優越性
H,Lについて
Hochberg(or Holm)
48
法で検定
高用量、低用量と標準薬の比較
非劣性及び優越性②
並列型gatekeepingの変
形
高用量
H0H1
H0H2
OR
低用量
H0L1
非劣性
H0L2
優越性
①H1の検定
H1,L1,L2につ
いてHochberg
法で検定
IF
全てp<α
OR
H1のみp<α/2
THEN
② H2の検定
Lについても同
様
49
高用量、低用量と標準薬の比較
用量反応の単調性仮定
非劣性及び優越性③
直列型gatekeeping
高用量
H0H1
①H1の検定
H0H2
IF p<α
THEN
②L1,H2の検定
Hochberg法
IF いずれもP<α
低用量
H0L1
非劣性
H0L2
THEN
③L2の検定
優越性
(森川)
50
うつ試験
Dmitrienko et al.(2005)
„
„
„
„
うつ病の患者での試験
主要エンドポイント:17項目のハミルトンうつ尺度
(HAMD17スコア)のベースラインからの改善
重要な副次エンドポイント:HAMD17スコアに基
づく反応率と緩解率(追加クレームの対象)
★主要評価項目は、それを通過しないと副次評
価項目のクレームがとれないので、gatekeeper
の役目
51
うつ試験での帰無仮説族
Dmitrienko et al.(2005)
H11:HAMD17に
おける平均的な改善
H21:HAMD17の反応
H22:HAMD17の緩解
52
Bonferroni 型Gatekeeping法
上位仮説を検定:有意⇒下位仮説を
うつ改善
Bonferroni調整
項目の重要度の順
に対応する仮説を
H11 ,{H21,H22}とし、
この順に検定する。
H11 ∩H21 ∩H22
H11のみを検定
H21∩H22を検定
H11 ∩H21
H11 ∩H22
H21 ∩H22
H22 を検
定
緩解率
H11
H21 を検
定
H21
反応率
H22
53
ARDSでの仮説族
Dmitrienko et al.(2005)
並列門番:OR
H12:28日死亡率
H21:ICU不要の日数
H22:QOL
H11:酸素吸入なし
の日数
54
直列Bonferroni 型Gatekeeping法
上位仮説を検定:いずれも有意⇒下位仮説
w11 w12
重み
をBonferroni調整
項目の重要度の順
H11 ∩H12 ∩H2
に対応する仮説を
{H11 ,H12 }⇒H2とし、
この順に検定する。 H11を検定
w11
w12
H11 ∩H12
SBP
H11 ∩H2
H11 ∩H12を検定
H12を検定
H12 ∩H2
1
H2
H12
H11
1
1
1
1
DBP
H2 を検
定
EF
55
並列Bonferroni 型Gatekeeping法
上位仮説を検定:いずれか有意⇒下位仮
w11
w12
重み
説をBonferroni調整
項目の重要度の順
H11 ∩H12 ∩H2
に対応する仮説を
{H11 ,H12 }⇒H2とし、 H ∩H を
11
2
この順に検定する。 Bonferroni調整
H11 ∩H12
w11
SBP
H11 ∩H2
H12 ∩H2を
Bonferroni調整
H12 ∩H2
DBP
w12
w12
w11
w11
H11 ∩H12を
Bonferroni調整
0
H11
w12
0
完全帰無仮説を棄却⇒H11,H12のいずれか
棄却⇒並列gatekeeper(緑、黄のいずれか)
w2
H2 を
検定
w2
H2
H12
1
EF
56
適応型デザイン(Adaptive Design)
„
試験の途中で中間解析の結果などの情報を用
いてデザインを変更
‰
‰
‰
„
„
症例数
処理群
仮説
Ⅱ・Ⅲ相試験
用量選択⇒選択用量の有効性の証明
全過程を通しての第一種の過誤率の制御
57
Bauer-Köhne法
Bauer-Köhne(1994)
第一ステージ
第二ステージ
H0を棄却
停止
P1 ≤ α 1
α 1 < P1 ≤ α 0
P1
P1 > α 0
Fisherの積基準
H0を受容
停止
P2 ≤ cα / P1
H0を棄却
停止
P2
P2 > cα / P1
H0を受容
停止
1
但しcα = exp{ − χ 42 ,1−α }
2
58
Bauer and Kieser (1999)
„
Bauer and Köhne(1996)のアプローチを多重仮
説の場合に拡張(閉手順とADを結合)
„
閉手順の各積仮説のαをステージ順に消費
用量反応試験での有効用量の同定
„
‰
‰
„
„
用量反応の単調性が仮定できない場合
用量反応の単調性が仮定できる場合
多重エンドポイントの場合
優越性・非劣性のような仮説のスイッチング
59
2用量の場合(用量反応)
L , Hの2用量とプラセボと の比較
H1 : µL = µP , H1 : µL > µP
H 2 : µH = µP , H 2 : µH > µP
対応するp値:第一ステージp1( i ),第二ステージp2( i ),iは仮説番号
上位仮説
H 12 = H 1 ∩ H 2 : µ L = µ P
r
H 12 = H 1 ∪ H 2 : µ L > µ P
and
or
µH = µP
µH > µP
対応するp値:第一ステージp1( 12 ),第二ステージp2( 12 )
60
Bauer-Kieser法: Bauer-Köhne法の拡
張
上位仮説H12の検定
第一ステージ
P1( 12 ) > α0
P1( 12)
P1( 12) ≤α1
H12を棄却
第二ステージ
H12を受容
停止
P2( 12 ) > cα / P1( 12 ) H12を受容
停止
α 1 < P1( 12 ) ≤ α 0
P2( 12)
P2( 12 ) ≤ cα / P1( 12 ) 下位仮説の検定へ
下位仮説の検定へ
1
但しcα = exp{ − χ 42 ,1−α }
2
61
Bauer-Kieser法: Bauer-Köhne法の拡
張
下位仮説Hiの検定(i=1,2)
第一ステージ
第二ステージ
Hiを受容
P2( i ) > cα / P1( i )
P1( i ) > α 0
P1(i )
α 1 < P1( i ) ≤ α 0
P2( i )
P2( i ) ≤ cα / P1( i )
P1( i ) ≤ α 1
Hiを棄却
Hiを受容
停止
Hiを棄却
停止
1
但しcα = exp{ − χ 42 ,1−α }
2
62
Shih, Quan and Li(2004)
優越性と非劣性の両方を狙う2段階デザイン
„
第一段階:各群n1例、第二段階:各群n2例
‰
‰
‰
„
„
但し第二段階の例数n2は、第二段階で優越性を狙うか、
非劣性を狙うかによって変わる(前者n2S 、後者n2E )
優越性を狙える見込みあり⇒優越性を狙う
非劣性を狙える見込みあり⇒非劣性を狙う
第一段階、第二段階とも優越性検定、非劣性検定のい
ずれも試みる
両群とも既知の共通分散をもつ正規分布に従うと仮定
Morikawa and Yoshida( 1995 )の手順のAD化
優越性 ⇒ 非劣性(上昇手順)
, 非劣性 ⇒ 優越性(下降手順)
のいずれの手順も第一種の過誤率を制御
63
結論
„
„
„
様々な多重性の問題が臨床試験で生じ、これらに対する不
適切な対応は第一種の過誤を増大させ、統計的妥当性を
失うと同時に、有効でない治療を誤って有効と結論するリス
クを増大させるので、これらに適切に対処しなければならな
い。
多重性は主として①多重エンドポイント、②多重比較、③経
時比較、④中間解析のような場面で現れ、それぞれ臨床的
な適切性を考慮しながら統計的妥当性(αの制御とβの最
小化)を追求しなければならない。それが臨床統計家の重
要な役割のひとつである。
統計的方法論としてはまだまだ発展途上にあり、今後も方
法論を発展させていかなければならない。特に閉じた検定
手順(閉手順)は有用な方法であり注目すべきである。 64
若干の参考文献
„
„
„
„
Bauer, P. and Kieser, M., Combining different phases in
the development of medical treatment within a single trial,
Stat. Med., 18, 1833-1848 (1999)
Bauer,P. and Köhne, K., Evaluation of experiments with
adaptive interim analysis, Biometrics, 50,1029-1041 (1994)
Commelli, M., Multiple Endpoints, in Encyclopedia in
Biopharmaceutical Statistics, Ed. By Chow, Wiley (2003)
Dmitrienko, A., Offen, W. and Westfall, P.H, Gatekeeping
strategies for clinical trials that do not require all
primary effects to be significant, Statistics in Medicine,
„
22:2387–2400 (2003)
Dmitrienko, A., Molenberghs, G., Chuang-Stein, C. and
Offen, W., Analysis of Statistical Analysis of Clinical Trials
Using SAS, SAS Institute (2005)
65
若干の参考文献
„
„
„
„
„
„
Morikawa, T., Terao, A. and Iwasaki, M., Power Evaluation of
Various Modified Bonferroni Procedures by a Monte Carlo Study, J.
Biopharmaceutical Statistics, 6, 343-349(1996)
Morikawa, T.and Yoshida, M., A useful testing strategy in phase III
trials: Combined test of superiority and test of equivalence, J.
Biopharmaceutical Statistics, 5, 297-306 (1995)
Shih, J. S., Quan H. and Li, G., Two Stage Adaptive Strategy for
Superiority and Noninferiority Hypotheses in Active Controlled
Clinical Trials, Statistics in Medicine 23, 2781–2798 (2004)
永田靖、吉田道弘、統計的多重比較法の基礎、サイエンティスト社
(1998)
森川敏彦、27章:多重性、丹後・上坂編「臨床試験ハンドブック」、朝倉書
店 (2005)
森川敏彦、臨床試験における多重性問題への統計的接近法、計量生物
学 (2007, to appear)
66