第6回久留米大学バイオ統計学フォーラム 「閉じた検定手順の臨床応用:多重比 較・多重エンドポイントからアダプティブ デザインまで」 久留米大学バイオ統計センター 森川 敏彦 2007.9.29 於九州大学百年記念講堂 1 はじめに 昨年末の日本計量生物学会主催計量生物セミ ナーで、臨床試験における多重性の問題につい て議論し、種々のアプローチについて紹介した。 本日は閉じた検定手順に的を絞り、この手法を 紹介するが、上記セミナーで触れることができな かった用量‐反応及び繰り返し測定データへの 適用や、最近の成果(階層性のある仮説群に対 するgatekeepingアプローチ、適応型デザインに おける応用)についても触れることにした。 2 平ったく 言えば 多重性の問題 沢山(複数回)検定を行うことにより言いすぎが 生じる(第一種の過誤αがインフレを起こす)こと (信頼区間では多くの信頼区間を作ることにより 信頼度が低下すること) 第一種の過誤(率):統計的検定において帰無仮説を誤 って棄却する確率(検定の枠組みから、これは小さい値 に抑える必要がある;通常両側α=5%) 3 帰無仮説が正しい場合の棄却確率 (第一種の過誤α=5%と決めたとする) 5% 5% 検定3回目 検定1回目 5% 検定2回目 4 多重性の問題 検定の論理は 帰無仮説の下では生じにくい事象の発現により 帰無仮説を棄却(否定) すること ⇒帰無仮説の下で 頻繁に 生じることをもって、 帰無仮説の否定はできない。 帰無仮説は通常「治療が無効」とか「治療間に差がない」 という仮説になり、それを検定結果で統計的に否定する ことにより治療の有効性や対照に対する優越性の証明 がなされることになる。 5 多重性の問題 検定の多重性の問題は、検定全体として言い過 ぎがないようにしなければならない。 多重性の問題は「仮説の検証」の根幹にかかわ る重要な問題 6 ICH 統計ガイドラインにおける記述 5.6有意水準と信頼水準の調整 可能な場合には多重性を回避又は軽減すべき 重要な変数の指定(変数の絞り込み) 多重比較で重要な比較を選択(比較の限定) 繰り返し測定でAUCのような要約指標を使用 なお残る多重性のすべての側面について治験実 施計画書で明記 調整は常に考慮すべき ICH(International Conference on Harmonization):新薬承認審査の科学的基盤に関する 国際調和を図るための国際会議(このことによっていい薬を早く世界の患者に届けることが 可能となることを目指し、1990年に発足;日米欧3極の規制当局と製薬業界の代表6パー ティで構成) 7 ICH 統計ガイドラインにおける記述 5.6 有意水準と信頼水準の調整 多重性 ①多重エンドポイント(多項目比較) ②多重比較(多群比較) ③繰り返し測定(多時点比較) ④中間解析(試験の途中での多数回比較) 多重性が存在する場合、第一種の過誤の調整 が必要 8 ①多重エンドポイント プロトコールに扱い方を書く 合成変数composite variableあるいは複合エンドポ イントcomposite endpointの使用 ADAS-cog合計点(認知症)、ACR20(リウマチ)、 心血管系の疾患における総死亡・心血管系の死亡 エンドポイントを統計的に総合化 O’Brienの方法 エンドポイントを重要度に従い順序付ける Bonferroniの方法あるいはその変法(修正 Bonferroni法;Holm法、Hochberg法、・・・) 再抽出法resampling method (Westfall&Young, 階層手順hierarchical procedure アレルギー性鼻炎:①鼻閉⇒②鼻汁⇒③くしゃみ 1993) 9 ②多群比較における多重比較 最も古くから方法論が検討された多重性の問題 同時比較simultaneous comparisons Tukey法、Dunnett法、Bonferroni法(、Scheffe法) Tukey法、Dunnett法は任意の対比の比較にも利用でき ることが知られている(但しその場合は信頼幅は広くな る) 10 Tukey法:任意の2群間の比較 A B C Dunnett法:特定の対照群との比較 A C B 11 Bonferroni法 比較全体の有意水準をα、比較の数をK⇒ 比較毎の有意水準をα/K α=5%、K=5なら、各比較の有意水準は 5%/ 5=1% このようにして検定を行なえば比較全体とし ての有意水準はα以下になることが、 Bonferroniの不等式により証明される。 しかしこれは一般に非常に厳しい基準 ⇒種々の改良法 12 古典的な多重比較のディレンマ 多重性の調整をしない 統計的言い過ぎ(第一種の過誤αの増大) ⇒科学的な証拠立てとはならない 多重性の調整をする(古典的多重比較) 有意になりにくい(第二種の過誤βの増大) ⇒結論が出しにくい 言い過ぎを抑え、かつ検出力も高くするにはど うすればよいか? 13 改善された方法 逐次法sequential procedure 閉手順closed testing procedure 修正Bonferroni法(Holm法など) 逐次型Dunnett法、Tukey-Welsh法 Williamsの検定(用量反応;Biometrics, 1971,1972) Protected LSD、Newman-Keuls法、 Duncan法などよく知られた古典的な方法 のいくつかは第一種の過誤を制御せず第 一種の過誤の増大を招くので使用すべき ではない(3群比較の場合は例外)。 14 逐次法:閉手順Closed Testing Procedures (CTP) Marcus, Peritz and Gabriel(1976) 強い意味で第一種の過誤率を制御するための逐次検定アプローチ 対応する一段階法(同時比較法)の検出力を改善する。 現在提案されている有力な方法の多くは閉手順に従った方法 Bauer(1991):多重比較、多重エンドポイント、繰り返し検定への応用 Connel(1994):用量‐反応効果を検定する問題 Koch&Gansky(1996),Chi(1998):臨床試験でのCTP(多重エンドポイ ントやサブグループ解析含む) Morikawa,Terao&Iwasaki(1996):多重比較における修正Bonferroni 法と呼ばれる一群のCTPの性能比較 15 閉手順:仮説が2つの場合 Dunnett型の 検定では 厳しい基準⇒ Dunnettの基準 H1 ∩H2 :多重性の調整 緩い基準⇒ 単一の検定 の基準 H1 A=C 敗者復活! A=C and B=C H2 B=C 16 閉手順:仮説が3つの場合 完全帰無仮説 H1 ∩H2 ∩H3 最も厳しい基準 部分帰無仮説 厳しい基準 H1 ∩H2 H1 ∩H3 H2 ∩H3 H1 H2 H3 基本仮説 最も緩い基準 17 閉手順の例 Williamsの検定:用量反応 修正Bonferroni法(Holm法、Hochberg法など) 逐次型Dunnett法:対照群との比較 階層手法Hierarchical Method 比較を予め順序付け、その順序で検定を行い、有意になった場 合にのみ、次の段階に進む。 例:アレルギー性鼻炎の3症状(鼻閉、鼻汁、くしゃみ)に対して薬の 薬理作用を考慮した順序付けを行なう。 俗に閉手順と呼ばれているのはこの手法 このアプローチを仮説群に拡張したのがgatekeeping法 任意の多変量検定あるいは包括検定(global test)の閉手順化 ひとつの例は多重エンドポイントにおける O’Brienの検定の閉手順化 Lehmacher et al(1991) 18 閉手順:Holm法 各段階で各仮説をBonferroni法で検定 p値の小さい順に p(1)≦p(2)≦p(3)、対 応する仮説をH(1), H(2),H(3)とする。 H(1) ∩H(2) H(1) ∩H(2) ∩H(3) p(1) <α/3? p(2) <α/2? H(1) ∩H(3) H(2) ∩H(3) p(3) <α? H(1) H(2) H(3) 19 逐次Dunnett法(多重比較) 各仮説を順番にDunnett法で検定 3処理群対対照群 の比較⇒比較の 数は3つ: T1 vs C, T2 vs C, T3 vs C H(1) ∩H(2) ∩H(3) H(1) ∩H(2) H(1) ∩H(3) H(1) H(2) P値の小さい順に 対応する仮説を H(1) ,H(2),H(3)と する。 H(2) ∩H(3) H(3) 20 閉手順:逐次Tukey法 3処理群の比較⇒ 比較の数は3つ: T1 vs T2, T2 vs T3, T1 vs T3 T1 vs T2 完全帰無仮説 H1 ∩H2 ∩H3 最も厳しい基準 H1 ∩H2 H1 ∩H3 H2 ∩H3 H1 H2 H3 T2 vs T3 T1 vs T3 21 階層法Hierarchical Method 各仮説を重要度の順番に検定 鼻閉 項目の重要度の 順に対応する仮 説をH(1) ,H(2),H (3)とし、この順に 検定していく。 H(1) ∩H(2) H(1) ∩H(2) ∩H(3) H(1)のみを検定 H(2)のみを検定 鼻汁 H(1) ∩H(3) H(2) ∩H(3) H(3) を 検定 くしゃみ H(1) H(2) H(3) 22 用量‐反応 用量反応試験で単調な用量反応を仮定し、 プラセボ、低用量、中 用量、高用量の平均を µ P ≤ µ L ≤ µ M ≤ µ H とする。 H1 : µP = µL H 2 : µP = µM ( = µL ) H 3 : µP = µH ( = µL = µM ) から H1 I H 2 = H 2 ,H1 I H 3 = H 3 ,H 2 I H3 = H 3 , H1 I H 2 I H3 = H3 ゆえに階層手順によりH 3、H 2、H 1の順に検定して いけばよい。 23 用量‐反応及び繰り返し測定 Williamsの検定は、まさにこのような階層手順による 検定となっている。 t検定を用いて、プラ セボと実用量との比較を高用量から 順に行っていく手順も このアプローチになる。 効果の有無の確認及び効果発現時間の同定のための 繰り返し測定によるプラセボ対照試験では、後ろの時点 から順に検定していく。効果持続時間の場合は逆方向 24 粗p値(生p値)と調整p値 帰無仮説の族{ H 1 , H 2 ,..., H m }に対応し、m個の有意性検定 個別p値:個別の帰無仮説に対応するp値( 粗p値、生p値) p1 , p2 ,..., pm 全体帰無仮説( global null hypothesis ):H 1 , H 2 ,..., H mの積仮説 H G = H 1 ∩ H 2 ∩ ... ∩ H m 調整p値 : ~ p1 , ~ p2 ,..., ~ pm ~ p ≤ αのときにH を棄却 i i H Gに対する調整p値 : ~ pH G = min{ ~ p1 , ~ p2 ,..., ~ pm } つまり~ p ≤ αのときにH を棄却 HG G 25 Bonferroni法と調整p値 Bonferroni法 pi ≤ α / mのときにH i を棄却 ⇔ ~ pi = mpi ≤ αのときにH i を棄却 ~ p : 調整p値 i Bonferroni法での検定全体としての調整p値は ~ p = min ~ p = m ⋅ min p i i つまり~ p ≤ αのときに全体仮説が棄却される。 26 重み付きBonferroni法と調整p値 重み付きBonferroni法 pi ≤ α i = wiαのときにH iを棄却 m m i =1 i =1 但し∑ wi = 1, wi ≥ 0 ,あるいは∑ α i = α ,α i ≥ 0 ⇔ ~ pi = pi / wi ≤ αのときにH iを棄却 ~ p : 調整p値 i 重み付きBonferroni法での検定全体としての調整p値は ~ pG = min ~ pi = min{ pi / wi } ~ p ≤ αのときに全体仮説が棄却される。 G 27 修整Bonferroni法 閉手順の枠組みに沿って古典的Bonferroni法を改善 m m個の仮説の積仮説H = Ii =1 H ( i ) 但しH ( i )はi番目に小さなp値p( i )に対応する仮説 ◆Holm法 Bonferroni基準の使用:あるkについてp ( k ) ≤ α / mならHを棄却 調整p値:~ p = m⋅p (k ) (k ) ◆Hochberg法 Hochberg基準の使用:あるkについてp ( k ) ≤ α /( m − k + 1 )ならHを棄却 調整p値:~ p = ( m − k + 1 )⋅ p (k ) (k ) ◆Hommel法 Simes基準の使用:あるkについてp ( k ) ≤ kα / mならHを棄却 調整p値:~ p = ( m / k )⋅ p (k ) (k ) α / m ≤ α /( m − k + 1 ) ≤ kα / m ⇒ これらの中ではHommel法が一番検出力が高い( Morikawa , et al .( 1996 )) ただし、Hochberg法とHommel法は常にαを制御することが 完全に保証されていない。 28 Holm法とHochberg法 森川(2005, 2007) STEP DOWN Holm法 有意 NS H(1)のみ棄却 p(1) p(2) p(3) p(4) p(5) 有意水準α/5 α/4 α/3 α/2 α p値 STEP UP Hochberg法 H(1),H(2),H(3),H(4)を棄却 例:p=0.001, 0.013, 0.015,0.022, 0.08, α=0.05 29 修整Bonferroni法の検出力 Bonferroni ≤ Holm ≤ Hochberg ≤ ( Hommel < Rom ) Holm ≤ Shaffer Morikawa , et al .( 1996 ) Commelli( 2003 ) Dmitrienko , et al .( 2005 ) Rom法 : Hochberg法をSidak基準を用いて改良したもの Shaffer法:Holm法を仮説間の構造を利用して改良したもの 30 例:用量探索高血圧試験 Dmitrienko et al.(2005) µ p − µ L , µ p − µ M , µ p − µ H がそれぞれ正の場合に、 各用量のDBP(拡張期血圧)の改善を示す。 したがって以下の帰無仮説を検定することを考える。 H L = { µ p − µ L ≤ δ }, H M = { µ p − µ M ≤ δ }, H H = { µ p − µ H ≤ δ } ここにδ ( > 0 )はプラセボに対し臨床的に意味のある差 処理平均は2標本t検定により検定されるものとする。 31 3つの仮説HL,HM,HHに対する閉手順 HL,HM,HHに対する積仮説の生成 HLM = {HL∩HM}, HLH = {HL∩HH } , HMH = {HM∩HH }, HLMH = {HL∩HM ∩HH } HLMH HLM HLH HMH HL HM HH A B 仮説の包含関係(AがBを含む) 32 3つの仮説HL,HM,HHに対する閉手順 元の仮説を含む積仮説 元の仮説 元の仮説を含む仮説 HL HL, HLM, HLH, HLMH HM HM, HLM, HMH, HLMH HH HH, HLH, HMH, HLMH 閉手順 元の仮説を含む積仮説すべてについて水準αの検定を 行い、すべてについて有意となったときに元の仮説を棄 却する。 33 Decision Matrix アルゴリズム Holm法のような単純な逐次法になる閉手順は 殆どない 一般の閉手順を実施するのは大変(枝分かれ) Decision Matrix アルゴリズム:一般の閉手順を 実施するアルゴリズム Dmitrienko, Offen and Westfall (2003) 34 Holm法に対するDecision Matrix Dmitrienko et al.(2005) 積仮説に含まれる仮説 積仮説 調整P値 HL HM HH HLMH PLMH=3min(PL, PM, PH) PLMH PLMH PLMH HLM PLM =2min(PL, PM) PLM PLM 0 HLH PLH =2min(PL, PH) PLH 0 PLH HL PL PL 0 0 HMH PMH =2min(PM, PH) 0 PMH PMH HM PM 0 PM 0 HH PH 0 0 PH HH PH 0 0 PH 各基本仮説に対する調整p値:たとえば ~ p L = max{ p LMH , pLM , p LH , pL } 35 階層法に対するDecision Matrix 用量反応の単調性を仮定 積仮説に含まれる仮説 積仮説 調整P値 HL HM HH HLMH PLMH=PH PH PH PH HLM PLM =PM PM PM 0 HLH PLH =PH PH 0 PH HL PL PL 0 0 HMH PMH =PH 0 PH PH HM PM 0 PM 0 HH PH 0 0 PH ~ ~ ~ 各基本仮説に対する調整p値: pL = max{ pH , pM , pL }, pM = max{ pH , pM }, pH = pH 36 Gatekeeping Strategies 門番戦略 仮説群1 仮説群2 仮説群3 37 直列型門番serial gatekeeping Dmitrienko et al.(2005) 仮説群 仮説1 仮説2 仮説3 すべての仮説が棄却されてはじ めてこの仮説群のゲートが開く 38 並列型門番parallel gatekeeping Dmitrienko et al.(2005) 仮説群 仮説1 仮説2 仮説3 いずれかの仮説が棄却されれば この仮説群のゲートが開く 39 階層的に順序付けられたエンドポイント 階層法Hierarchical Method(再掲) 各仮説を重要度の順番に検定 項目の重要度の 順に対応する仮 説をH(1) ,H(2),H (3)とし、この順に 検定していく。 H(1) ∩H(2) 鼻閉 H(1) ∩H(2) ∩H(3) H(1)のみを検定 H(2)のみを検定 鼻汁 H(1) ∩H(3) H(2) ∩H(3) H(3) を 検定 くしゃみ H(1) H(2) H(3) 40 Holm法とHochberg法:仮説が2つの場 合に棄却される仮説 H(1) H(2) Holm法 Hochberg法 p(1) ≦ α/2 p(2) ≦α/2 H(1), H(2) H(1), H(2) p(1) ≦ α/2 p(2) ≦ α H(1), H(2) H(1), H(2) p(1) ≦ α/2 p(2) >α H(1) H(1) p(1) ≦ α p(2) ≦ α p(1) ≦ α p(2) >α H(1), H(2) 41 2個の主要エンドポイントと 1個の副次エンドポイント① 直列型gatekeeping H2 H1 AND ①H1,H2につ いて Hochberg/Hol m法で検定 IF H1,H2のいず れも有意 H3 THEN ②H3の検定 Dmitrienko et al(2003) 42 2個の主要エンドポイントと 1個の副次エンドポイント② 並列型gatekeeping H2 H1 ①H1,H2の検定にはH3 を含めてHochberg法で 検定 IF OR H1,H2のいずれもp<α OR いずれかp<α/2 H3 THEN ②H3の検定 Dmitrienko et al(2003) 43 一般の直列型gatekeeping F1 : gatekeeper仮説群 F2 : F1が条件を満足し F1 F2 gateが開いたときに検定される仮説群 ①H i ∈ F1をF1内での閉手順で検定 ②すべてのH i ∈ F1が棄却されたとき、 H j ∈ F2 をF2内での閉手順で検定 この手順は強い意味でFWERを制御する。 つまり真の帰無仮説がなんであっても、 検定全体の第一種の過誤率を名目水準αに保つ。 44 一般の並列型gatekeeping 例:F1 = { H 1 , H 2 }, F2 = { H 3 } H 1 , H 2のいずれかが棄却されればH 3は検定される。 Hに対する対立仮説をHで表すことにしたとき、 H 3 = ( H 1 ∩ H 2 ) ∪ H 3を考えるとH 3 = ( H 1 ∪ H 2 ) ∩ H 3 * * * 3 したがってH 3の代わりに制約付きの仮説H を考え * 3 { H 1 , H 2 , H }に関する閉手順を作り上げれば、並列型 gatekeepingに対する水準αの検定手順が作れる。 45 一般の並列型gatekeeping H 1 ∩ H 3 = H 1 ∩ ( H 2 ∪ H 3 ), H 2 ∩ H 3 = H 2 ∩ ( H 1 ∪ H 3 ), * * H1 ∩ H 2 ∩ H 3 = H1 ∩ H 2 * 積仮説についてBonferroni基準を用いるものとする。 p1 ≤ α / 2なら、H 1は棄却される。このときp3 ≤ α / 2なら H 3も棄却される。 同様にp2 ≤ α / 2なら、H 2は棄却される。 このときp3 ≤ α / 2ならH 3も棄却される。 p1 ≤ α / 2かつp2 ≤ αなら、H 1 , H 2は棄却され , このときp3 ≤ α / 2ならH 3も棄却される。 p1 ≤ α / 2かつp2 ≤ α / 2なら、H 1 , H 2は棄却され , このときp3 ≤ αならH 3も棄却される。 46 多重エンドポイントと多重処理 2個のエンドポイント、3群比較 直列型gatekeeping 治癒で TがPに 優る? H2 H1 Hochberg /Holm AND 治癒でRが Pに優る? 無再発治 癒でTがR に優る? H3 無再発 治癒で TがPに 優る? 十二指腸潰瘍 H4 47 高用量、低用量と標準薬の比較 非劣性及び優越性① 直列型gatekeeping 高用量 H0H1 H0H2 ①非劣性 H,Lについて Hochberg(or Holm) 法で検定 IF AND いずれも有意 THEN 低用量 H0L1 非劣性 H0L2 優越性 ②優越性 H,Lについて Hochberg(or Holm) 48 法で検定 高用量、低用量と標準薬の比較 非劣性及び優越性② 並列型gatekeepingの変 形 高用量 H0H1 H0H2 OR 低用量 H0L1 非劣性 H0L2 優越性 ①H1の検定 H1,L1,L2につ いてHochberg 法で検定 IF 全てp<α OR H1のみp<α/2 THEN ② H2の検定 Lについても同 様 49 高用量、低用量と標準薬の比較 用量反応の単調性仮定 非劣性及び優越性③ 直列型gatekeeping 高用量 H0H1 ①H1の検定 H0H2 IF p<α THEN ②L1,H2の検定 Hochberg法 IF いずれもP<α 低用量 H0L1 非劣性 H0L2 THEN ③L2の検定 優越性 (森川) 50 うつ試験 Dmitrienko et al.(2005) うつ病の患者での試験 主要エンドポイント:17項目のハミルトンうつ尺度 (HAMD17スコア)のベースラインからの改善 重要な副次エンドポイント:HAMD17スコアに基 づく反応率と緩解率(追加クレームの対象) ★主要評価項目は、それを通過しないと副次評 価項目のクレームがとれないので、gatekeeper の役目 51 うつ試験での帰無仮説族 Dmitrienko et al.(2005) H11:HAMD17に おける平均的な改善 H21:HAMD17の反応 H22:HAMD17の緩解 52 Bonferroni 型Gatekeeping法 上位仮説を検定:有意⇒下位仮説を うつ改善 Bonferroni調整 項目の重要度の順 に対応する仮説を H11 ,{H21,H22}とし、 この順に検定する。 H11 ∩H21 ∩H22 H11のみを検定 H21∩H22を検定 H11 ∩H21 H11 ∩H22 H21 ∩H22 H22 を検 定 緩解率 H11 H21 を検 定 H21 反応率 H22 53 ARDSでの仮説族 Dmitrienko et al.(2005) 並列門番:OR H12:28日死亡率 H21:ICU不要の日数 H22:QOL H11:酸素吸入なし の日数 54 直列Bonferroni 型Gatekeeping法 上位仮説を検定:いずれも有意⇒下位仮説 w11 w12 重み をBonferroni調整 項目の重要度の順 H11 ∩H12 ∩H2 に対応する仮説を {H11 ,H12 }⇒H2とし、 この順に検定する。 H11を検定 w11 w12 H11 ∩H12 SBP H11 ∩H2 H11 ∩H12を検定 H12を検定 H12 ∩H2 1 H2 H12 H11 1 1 1 1 DBP H2 を検 定 EF 55 並列Bonferroni 型Gatekeeping法 上位仮説を検定:いずれか有意⇒下位仮 w11 w12 重み 説をBonferroni調整 項目の重要度の順 H11 ∩H12 ∩H2 に対応する仮説を {H11 ,H12 }⇒H2とし、 H ∩H を 11 2 この順に検定する。 Bonferroni調整 H11 ∩H12 w11 SBP H11 ∩H2 H12 ∩H2を Bonferroni調整 H12 ∩H2 DBP w12 w12 w11 w11 H11 ∩H12を Bonferroni調整 0 H11 w12 0 完全帰無仮説を棄却⇒H11,H12のいずれか 棄却⇒並列gatekeeper(緑、黄のいずれか) w2 H2 を 検定 w2 H2 H12 1 EF 56 適応型デザイン(Adaptive Design) 試験の途中で中間解析の結果などの情報を用 いてデザインを変更 症例数 処理群 仮説 Ⅱ・Ⅲ相試験 用量選択⇒選択用量の有効性の証明 全過程を通しての第一種の過誤率の制御 57 Bauer-Köhne法 Bauer-Köhne(1994) 第一ステージ 第二ステージ H0を棄却 停止 P1 ≤ α 1 α 1 < P1 ≤ α 0 P1 P1 > α 0 Fisherの積基準 H0を受容 停止 P2 ≤ cα / P1 H0を棄却 停止 P2 P2 > cα / P1 H0を受容 停止 1 但しcα = exp{ − χ 42 ,1−α } 2 58 Bauer and Kieser (1999) Bauer and Köhne(1996)のアプローチを多重仮 説の場合に拡張(閉手順とADを結合) 閉手順の各積仮説のαをステージ順に消費 用量反応試験での有効用量の同定 用量反応の単調性が仮定できない場合 用量反応の単調性が仮定できる場合 多重エンドポイントの場合 優越性・非劣性のような仮説のスイッチング 59 2用量の場合(用量反応) L , Hの2用量とプラセボと の比較 H1 : µL = µP , H1 : µL > µP H 2 : µH = µP , H 2 : µH > µP 対応するp値:第一ステージp1( i ),第二ステージp2( i ),iは仮説番号 上位仮説 H 12 = H 1 ∩ H 2 : µ L = µ P r H 12 = H 1 ∪ H 2 : µ L > µ P and or µH = µP µH > µP 対応するp値:第一ステージp1( 12 ),第二ステージp2( 12 ) 60 Bauer-Kieser法: Bauer-Köhne法の拡 張 上位仮説H12の検定 第一ステージ P1( 12 ) > α0 P1( 12) P1( 12) ≤α1 H12を棄却 第二ステージ H12を受容 停止 P2( 12 ) > cα / P1( 12 ) H12を受容 停止 α 1 < P1( 12 ) ≤ α 0 P2( 12) P2( 12 ) ≤ cα / P1( 12 ) 下位仮説の検定へ 下位仮説の検定へ 1 但しcα = exp{ − χ 42 ,1−α } 2 61 Bauer-Kieser法: Bauer-Köhne法の拡 張 下位仮説Hiの検定(i=1,2) 第一ステージ 第二ステージ Hiを受容 P2( i ) > cα / P1( i ) P1( i ) > α 0 P1(i ) α 1 < P1( i ) ≤ α 0 P2( i ) P2( i ) ≤ cα / P1( i ) P1( i ) ≤ α 1 Hiを棄却 Hiを受容 停止 Hiを棄却 停止 1 但しcα = exp{ − χ 42 ,1−α } 2 62 Shih, Quan and Li(2004) 優越性と非劣性の両方を狙う2段階デザイン 第一段階:各群n1例、第二段階:各群n2例 但し第二段階の例数n2は、第二段階で優越性を狙うか、 非劣性を狙うかによって変わる(前者n2S 、後者n2E ) 優越性を狙える見込みあり⇒優越性を狙う 非劣性を狙える見込みあり⇒非劣性を狙う 第一段階、第二段階とも優越性検定、非劣性検定のい ずれも試みる 両群とも既知の共通分散をもつ正規分布に従うと仮定 Morikawa and Yoshida( 1995 )の手順のAD化 優越性 ⇒ 非劣性(上昇手順) , 非劣性 ⇒ 優越性(下降手順) のいずれの手順も第一種の過誤率を制御 63 結論 様々な多重性の問題が臨床試験で生じ、これらに対する不 適切な対応は第一種の過誤を増大させ、統計的妥当性を 失うと同時に、有効でない治療を誤って有効と結論するリス クを増大させるので、これらに適切に対処しなければならな い。 多重性は主として①多重エンドポイント、②多重比較、③経 時比較、④中間解析のような場面で現れ、それぞれ臨床的 な適切性を考慮しながら統計的妥当性(αの制御とβの最 小化)を追求しなければならない。それが臨床統計家の重 要な役割のひとつである。 統計的方法論としてはまだまだ発展途上にあり、今後も方 法論を発展させていかなければならない。特に閉じた検定 手順(閉手順)は有用な方法であり注目すべきである。 64 若干の参考文献 Bauer, P. and Kieser, M., Combining different phases in the development of medical treatment within a single trial, Stat. Med., 18, 1833-1848 (1999) Bauer,P. and Köhne, K., Evaluation of experiments with adaptive interim analysis, Biometrics, 50,1029-1041 (1994) Commelli, M., Multiple Endpoints, in Encyclopedia in Biopharmaceutical Statistics, Ed. By Chow, Wiley (2003) Dmitrienko, A., Offen, W. and Westfall, P.H, Gatekeeping strategies for clinical trials that do not require all primary effects to be significant, Statistics in Medicine, 22:2387–2400 (2003) Dmitrienko, A., Molenberghs, G., Chuang-Stein, C. and Offen, W., Analysis of Statistical Analysis of Clinical Trials Using SAS, SAS Institute (2005) 65 若干の参考文献 Morikawa, T., Terao, A. and Iwasaki, M., Power Evaluation of Various Modified Bonferroni Procedures by a Monte Carlo Study, J. Biopharmaceutical Statistics, 6, 343-349(1996) Morikawa, T.and Yoshida, M., A useful testing strategy in phase III trials: Combined test of superiority and test of equivalence, J. Biopharmaceutical Statistics, 5, 297-306 (1995) Shih, J. S., Quan H. and Li, G., Two Stage Adaptive Strategy for Superiority and Noninferiority Hypotheses in Active Controlled Clinical Trials, Statistics in Medicine 23, 2781–2798 (2004) 永田靖、吉田道弘、統計的多重比較法の基礎、サイエンティスト社 (1998) 森川敏彦、27章:多重性、丹後・上坂編「臨床試験ハンドブック」、朝倉書 店 (2005) 森川敏彦、臨床試験における多重性問題への統計的接近法、計量生物 学 (2007, to appear) 66
© Copyright 2024 Paperzz