2014年3月18日 慈恵ICU勉強会 大枝萌子 斎藤慎二郎

2014年3月18日 慈恵ICU勉強会 大枝萌子 斎藤慎二郎
背景
l 臨床医は治療の決定に研究結果を用いる際、Subgroup解析の
結果に基づいて患者個々にあった治療を選択する必要がある l 一見説得力のあるSubgroup effectであっても多くは嘘を含んで
いるため、信頼できるsubgroup effectを区別するためには指針
が必要である l 本文献では5つの基準を示す Case Scinario
あなたは地域の外傷センターで働く医師です。 受傷後3時間に到着した患者の治療にトラネキサム酸の使用を検討しています。 【このトピックに関する情報】 Design:RCT single-­‐blind Se@ng:40か国274施設
PaEents: 受傷後8時間以内の外傷患者20211人
IntervenEons: トラネキサム酸 vs. プラセボ Outcome: 28日死亡率
あなたなら受傷後3時間以上の患者にトラネキサム酸を投与しますか?
Subgroup解析の挑戦
Subgroup解析の危険性
ISIS-­‐2 (Second InternaEonal Study of Infarct Survival) CollaboraEve Group. Randomised trial of intravenous streptokinase, oral aspirin, both, or neither among 17,187 cases of suspected acutemyocardial infarcEon: ISIS-­‐2. Lancet. 1988;2(8607):349-­‐360
PaEents:急性心筋梗塞患者 アスピリン、ストレプトキナーゼ、併用、プラセボ Primary Outcome: 血管死亡率 .
Result: 双子座と天秤座の患者はアスピリンが無効
統計学的に有意(P=0.003)だけれども、明らかに間違った結果
Subgroup解析の信頼性を調査した文献 407個(2007年発行)のRCTの調査、207個の
Subgroup解析 Credibility of claims of subgroup effects in randomised controlled trials : systemaEc review. BMJ.2012;344.doi:10.1136/bmj.e155
64個がPrimary outcomeでSubgroup effectを主張 ほとんどのSubgroup解析は信頼性が低い
.
相対的なSubgroup effectに意味がある
45歳 女性 心臓病、糖尿病なし 喫煙歴なし TC 200mg/dl, HDL 40mg/dl, BP 130/85mmHg →今後10年間のMACE:1.4% →スタチンの使用で絶対リスク:0.4%減少 65歳 男性 心臓病、糖尿病なし 喫煙歴有 TC 250mg/dl, HDL 30mg/dl, BP160/95mmHg →今後10年間のMACE:38% →スタチンの使用で絶対リスク:10%減少 MACE:心血管イベント
Primary prevenEon of cardiovascular diseases with staEn therapy : a meta-­‐analysis of randomized controlled trials.
Arch Intern Med.2006;166(21):2307-­‐2313.
スタチンによる治療は両Subgroupで同じ、相対リスク(RR)30%減少 絶対的な効果は大きなばらつきがあるが、相対的な効果は各リスクグループ
で近似する
Subgroup解析で評価すべきなのは、相対的な効果(risk raEo, odds raEo, hazard raEo) Subgroupの決定は研究の初めに
Intensive insulin therapy in the medical ICU. N Engl J Med. 2006;354(5):449-­‐461.
PaEents: 内科ICU患者(n=1200) Design: RCT, 血糖管理 標準群(180mg/dl以下) vs. 厳格群(80-­‐110mg/dl) Outcome: 入院死亡率 Results: 有意差なし(40% vs. 37.3%、P=0.33) ICU滞在日数でSubgroup解析:ICU滞在≧3日(n=767, 52.5% vs. 43%、P=0.009) → 厳格群で入院死亡率が減少? ICU退室の決定が両群で異なっている(
厳格群は低血糖で
ICU滞在が長い) → 最初に達成したランダム化が失われている → Subgroupにおいて、偽の治療効果
RCTのSubgroup解析では、ランダム化の時に定義された変数に焦点
を当てるべき Subgroup Claimは元の研究と同程度しか信
用できない
盲検化に失敗している、もしくは半分の患者が脱落している
ようなRCT では、バイアスのリスクが非常に高い → Subgroup解析の結果も元の研究と同様、信頼性が低い
Subgroup effectは真実か偽かではない
Subgroup effectは不確実なもの 「真実」から「偽」まで連続としてとらえ、偽について推定する 結論は「おそらく真実」もしくは「おそらく偽」といった推定でし
かない Subgroup解析を解釈するための Guideline
①Subgroupの違いは偶然ではないか?
2つの別々の研究の分析結果 棒線は95%信頼区間 どちらも「偶然が治療群とコントロール群の違いを説明できる」という
仮説の検定 Group1 「できる」 (信頼区間が1.0と重なっている) Group2 「できない」(信頼区間が1.0と重なっていない) →治療はGroup2に有効だが、Group1に有効でない? 両群の点推定が同じ → 治療効果は両群で類似しているはず 両群の95%信頼区間の幅の差 → サンプルサイズ、イベントの数(Group 2>1)を反映しているだけ •  適切な統計的検定を行い、 帰無仮説「治療効果は2つのSubgroupで同等である」 を棄却する必要 •  同一の点推定の2群では、適切な交互試験を行うと P>0.99 となるはず •  適切な交互試験を行い、全体的な試験結果に注目すべき 交互試験の有用性
A comparison of outcomes with angiotensinconverEng—enzyme inhibitors and diureEcs for hypertension in the elderly. N Engl J Med. 2003;348(7):583-­‐592.
PaEents: 降圧治療を受ける高齢者 利尿薬 vs. ACE阻害薬 Design: 前向き非盲検RCT Outcome: Cardiovascular events or deaths Results: ACE阻害薬群 男性 RR 17%減少(95%CI 0.71-­‐0.97、p=0.02) 女性 RR 0%減少(95%CI 0.83-­‐1.21、p=0.98) → 特に高齢男性ではACE阻害薬が有効? Subgroup effectの交互試験 男女を直接比較 結果:p=0.15 → Subgroup解析の結果、統計学的に治療効果の性差があるように思われたが 交互試験の結果、治療効果に性差は影響がなかった 一方・・・
PaEents: 脛骨骨折患者 SPRINT InvesEgators. Study to prospecEvely evaluate reamed intramedually nails in paEents with Ebial fractures (S.P.R.I.N.T.): study raEonale and design. BMC Musculoskelet Disord. 2008;9:91.
髄内釘(nail) Reamed vs. Non-­‐reamed Design: RCT double-­‐blind Se@ng: 多施設 Primary Outcome: 再手術率 Results: Reamed群 閉鎖骨折(RR 0.67 95%CI 0.47-­‐0.76) 開放骨折(RR 1.27 95%CI 0.91-­‐1.78) 再手術率は閉鎖骨折で減少、開放骨折で上昇? 交互試験 帰無仮説「閉鎖、開放骨折で治療効果は同じ」 結果:P=0.01 → “偶然、治療効果が同じ”確率はわずか1% → 閉鎖、開放骨折で治療効果が違う 偶然でSubgroupの違いを説明できそうにないとき、 Subgroup effectかもしれない
•  Subgroup effectが定性的か定量的かに関しても調べることが大切 •  交互試験でSubgroup間の違いが有意でなくても、違いがないとは言い切れない (研究参加者数が不十分なとき) •  逆に、有意であっても真実ではない可能性もある Subgroup effectを解釈する際に、 可能性のある影響について考えなくてはならない
②Subgroupの違いは他の試験でも一貫して
いるか?
•  単一の試験で示された仮説は、他の試験でもそれが
示されている場合、信頼度が上がる → Discussionの項目をよく探す •  自分の研究を支持する研究結果を参照する傾向にあ
るので、体系的な検索の記述があれば信頼性が高い ③-­‐1 仮説が研究前に立てられているか?
Design: 二重盲検RCT、4群(アスピリン、スルフィンピ The Canadian CooperaEve Study Group. ラゾン、併用、プラセボ) A randomized trial of aspirin and Se@ng:単施設 PaEent: 過去3か月にTIAを起こした患者585人 Outcome: 12か月までのTIA、脳梗塞の発症、死亡率 Results:アスピリンは発症率を19%減少(P<0.05) Subgroup解析: アスピリンは男性では発症率を48%減少
(P<0.005)、女性では42%上昇(P=0.35) 他の研究でも、同様の結論が得られていたため、 女性より男性により効果がある、と結論
sulfinpyrazone in threatened stroke. N Engl J Med. 1978;299(2): 53-­‐59.
BMJ. 1994;308(6921):81-­‐106.
•  その後発行された、前述の研究を含む、抗血
小板薬の予防効果についての145個のRCT
のMeta-­‐analysis •  血栓症ハイリスク患者(29個のRCT) Vascular eventの割合を男女に分けて検討 → 抗血小板薬投与で女性も同様の割合
でリスク減少 前述の研究では、研究前から性別の比較をするようにデザインされていなかった 研究前に立てられた仮説でない場合、疑問をもつべき
③-­‐2 仮説は少数か?
Platelet-­‐acEvaEng factor receptor antagonist BN 52021 in the treatment of severe sepsis : a randomized, double-­‐blind, placebo-­‐
controlled, mulEcenter clinical trial. Crit Care Med. 1994;22(11):1720-­‐1728.
Design: RCT、double-­‐blind、phase Ⅲ Se@ng: フランスの21施設 PaEents: 抗生剤投与されている敗血症患者 262人 血小板活性化因子アンタゴニスト vs.
プラセボ Outcome:28日死亡率 Results:血小板活性化因子アンタゴニスト42%、プラセボ51%(P=0.17) Subgroup解析:最大の治療効果が得られるSubgroupを特定するため、15の仮説を立て解析
GNR 110人 33% vs. 57%(P=0.01) 交互試験P=0.03 しかし第3相第2試験(GNRのみを集めた試験) では、有効性は示されなかった
仮説数が多いと推定の強度が低下する •  分子医学の時代には、複数の仮説を検定する研究が増加してい
る (ex.)遺伝子変異体、数百万種類の試験 P<10-­‐8で統計的に有意 •  こういった多重比較の文献では、真実はとても少ない ③-­‐3 仮説の方向性は正しいか?
Design:RCT、double-­‐blind、mulEcenter Vasopressin versus norepinephrine infusion in paEents with sepEc shock. N Engl J Med. 2008;358(9):877-­‐887.
PaEents: 敗血症ショックの患者778人 ノルアドレナリン vs. バソプレシン Outcome: 28日死亡率 Results: 39.3% vs. 35.4%(P=0.96) バソプレシンとノルアドレナリンで治療効果に違いはない Subgroup解析: 敗血症の重症度で分類(軽症 NE 5-­‐14μg/min、重症 NE≧15μg/min) 重症患者でノルアドレナリンよりバソプレシンが有効と予想 軽症 35.7% vs. 26.5%(RR 0.74、P=0.05) 重症 42.5% vs. 44.0%(RR 1.04、P=0.76) → 「バソプレシンは重症患者では効果が弱い?」 Subgroupの交互試験 P=0.10 結果が予想した仮説の方向と違う場合、信頼性は低い
④Subgroup effectに生物学的根拠があるか?
生物学的根拠となる3つのソース
•  異なる集団(動物実験も含む)の研究 •  似たような介入を行っているSubgroupの違いの観察 •  関連研究の中間結果 The Canadian CooperaEve Study Group. A randomized trial of aspirin and sulfinpyrazone in threatened stroke. N Engl J Med. 1978;299(2): 53-­‐59.
Design: 二重盲検RCT 4群 アスピリン、スルフィンピラゾン、併用、プラセボ Se@ng:単施設 PaEent: 過去3か月にTIAを起こした患者585人 Outcome: 12か月までのTIA、脳梗塞の発症、死亡率 Results:アスピリンは発症率を19%減少(P<0.05) Subgroup解析:アスピリンは男性では発症率を48%減少(P<0.005) 女性では42%上昇(P=0.35) 他の研究でも、同様の結論が得られていたため、女性より男性により効果がある、と結論
現在の理解と矛盾 、生物学的根拠がないSubgroup effectは疑わしい ⑤Within-­‐ vs Between-­‐Trial Comparisons
Design: ビタミンD内服に関するRCTのMeta-­‐analysis 高用量研究(700-­‐800IU/d)5つ Fracture prevenEon with vitamin D supplementaEon: ameta-­‐analysis of randomized controlled trials. JAMA. 2005;293(18):2257-­‐2264.
低用量研究(400IU/d)2つ Outcome: 非脊椎骨折の相対リスク(RR) Results:高用量 RR 0.77、95%CI 0.68-­‐0.87 低用量 RR 1.15、95%CI 0.88-­‐1.50 Conclusions: ビタミンD高用量内服で骨折のリスク減少 低用量
高用量
•  低用量研究の患者は日光を
浴びていた •  高用量研究の患者はカルシ
ウムのサプリを飲んでいた •  フォローアップ期間が異なっ
ていた 研究間の比較なので、 用量に関しての議論は難しい
Subgroupの違いの原因となるもの
研究間の比較
研究内の比較
システマティックレビューの多くは研究「間」に限定
例外は、個々の患者データの解析 信頼度が高い Case Senarioの解説
•  単一の試験 → 研究「内」の比較を反映 •  フィブリンの溶解は主に3時間以内 → 生物学的根拠あり •  研究前に仮説を立てることは難しかった •  “損傷からの時間”の仮説 → 少数、方向性も正しい •  交互試験でP<0.001 → 偶然による確率は非常に低い •  原因別死亡率 → データの2次的な分析に過ぎない 完全に安全とは言い切れないが、外傷後3時間以上経過した患者にトラネキサ
ム酸を投与しないというSubgroup effectを信頼する 結論
•  このユーザーズガイドはSubgroup解析の評価をするときの助けになる •  少数で正しい方向性を持ったSubgroup仮説が、一貫性のある研究内での
比較に基づいて、小さいP(<0.01)を示すとき、信頼性があるといえる •  この基準を用いて、臨床の意思決定をしましょう