Current Evidence and Future Perspectives on

Review
Current Evidence and Future Perspectives on the Effective
Practice of Patient-Centered Laboratory Medicine
Mike J. Hallworth1,*, Paul L. Epner2, Christoph Ebert3, Corinne R. Fantz4, Sherry A. Faye5, Trefor N.
Higgins6, Eric S. Kilpatrick7, Wenzhe Li8, S.V. Rana9 and Florent Vanstapel10
on behalf of the IFCC Task Force on the Impact of Laboratory Medicine on Clinical Management and
Outcomes
Author Affiliations
1
Department of Clinical Biochemistry, Royal Shrewsbury Hospital, Shrewsbury, Shropshire, UK;
Paul Epner LLC, Evanston, IL;
3
Roche Diagnostics GmbH, Penzberg, Germany;
4
Labsource LLC, Atlanta, GA;
5
Beckman Coulter Eurocenter SA, Nyon, Switzerland;
6
DynaLIFE Dx, Edmonton, Alberta, Canada;
7
Department of Clinical Biochemistry, Hull Royal Infirmary, Hull, UK;
8
NMS Labs, Willow Grove, PA;
9
Department of Gastroenterology, PGIMER, Chandigarh, India;
10
University Hospitals Leuven-Gasthuisberg, Leuven, Belgium
2
* Address correspondence to this author at: 17 Fairlawn Ave., Meole Brace, Shrewsbury SY3 9QQ, UK.
E-mail [email protected].
Clinical Chemistry 2015;61:589-599
患者を中心とした臨床検査医学の有効な実施に関する現状と将来
展望
概要
背景:臨床検査医学が、患者の予後や全体的な健康管理プロセスに貢献しているという系統的な証
拠を見つけることは難しい。臨床検査医学の価値を理解すること、つまりそれがどのように決定さ
れ、どのような要因が影響を与えるかということを理解することは、臨床検査というサービスが確
実に最良に提供され利用されるために重要である。
内容:このレビューでは、健康管理に対して臨床検査医学がどのようにインパクトがあるのか、実
際の証拠を紹介し、それを理解するために必要なギャップを示した。また現在、臨床検査医学を利
用するにあたって何が欠乏しているのかを識別し、潜在的な解決策を示し、患者のケアを支援する
ために臨床検査医学を最良に使用するため将来のビジョンを示した。
1
要約:臨床検査医学の価値を最大限にするために、5 つの課題がある: (a)既存および新規の検査の
利用方法を改善すること;(b)臨床検査情報ループという考え方である『brain-to-brain cycle』(brain
to brain loop)の全てのポイントにおいて、患者の予後を最適化することに焦点を当てた臨床検査専
門家の新しい役割を定義すること; (c)バイオマーカーの臨床検査への有効性、または臨床検査以外
のプロセスへの有効性に関する患者中心の前向き研究に対する、標準化されたプロトコルを開発す
ること;(d)一般に有効性が認められた特定状況下における、既存と新規の分析項目を評価するこ
と; (e)投稿された論文に対して、認知された定義と有効性の評価とそのチェックリストを使用する
こと。私たちが臨床検査医学の価値を実証して強化し、無意味なデータ中で失われたと思われた価
値のある情報を守ることが、これらの課題を進歩させるために不可欠である。このためには臨床検
査医と効果的な連携作業が必要であり、検査室の成果の最初の判定は患者の予後や病歴を受け入れ
ることである。
臨床検査室は、患者に対する臨床診断や患者管理を支援する価値あるサービスを提供する。しかし、
臨床検査医学が患者の健康管理の全過程に対し、特異的な貢献を行うという系統的な証拠を見つけ
るのは難しい。臨床検査医学の価値、およびそれに影響を及ぼす様々な要因についての理解するこ
とは、患者の健康管理を改善するためのサービスが最良に提供利用され、技術的・費用的・人的リ
ソースの浪費や、不適切な配分や抑制を防ぐために非常に重要である。
臨床検査医学の価値を促進する多くの記事が、「70% claim」として知られるものを利用している。
「Laboratory medicine influences 70% of clinical decisions(臨床上の決定において、臨床検査の影響度
は 70%である)」という見出しや、これの模式図がこのことを示すのに最も一般的である。残念な
ことに、この説は論文として発表されていない研究および事例観察に基づいたものであるため、現
在客観的に確認することができない(1)。さらにどんなに正確であっても、一つの「見出し」だけで
は、健康管理の質に対する臨床検査医学の貢献についての詳細な理解への助けにならない。
臨床検査医学の付加価値には、より特異的で根拠に基づく指標が必要である。この付加価値には、
良く設計された臨床研究と共に加えられた(あるいは縮小された)というような、価値のメカニズ
ムのより深い理解が必要である。患者の健康管理に対する臨床検査医学の影響を確認するための有
効な証拠を評価し、かつ臨床検査医学が貢献した証拠を見出すことができる、新しい後向きおよび
前向き研究の設計を開発するために、「the Impact of Laboratory Medicine on Clinical Management and
Outcomes(患者の管理および予後への臨床検査医学のインパクト)」という IFCC 特別対策本部が
2012 年に設立された。本レビューでは既存の証拠を要約し、私たちの現在の理解とのギャップを示
す予定である。さらに現在の臨床検査の利用方法について、何がかけているのかを識別すること、
患者の健康管理をサポートするために、臨床検査医学が最良に使用されうる将来のビジョンを提示
すること、患者の安全や予後の改善を改善することなどを通し、潜在的な解決策を示す。
臨床検査医学の定義および目的
臨床検査医学は、検査室や患者管理のポイントから「組織、体液あるいは他の体内物質の試料が人
の外部で検査される医学の分野」として定義される(モスビュ医学辞典)。臨床化学、毒物学、血
液学、免疫学、微生物学(血清学とウイルス学を含む)、解剖病理学、細胞学、分子病理学および
細胞遺伝学などの、伝統的な学問分野を含んでいる。グローバルな体外診断薬市場は、2012 年に
492 億ドルと評価され、2012-2017 年で 7%成長すると考えられている(2)。これは、恐らく世界で年
間、100-150 億テストに相当する(著者の評価による)。
2
臨床検査医学は、関係するデータを提供することにより、患者と臨床医の間の情報のやり取りを相
互サポートし、個々の患者について最適の治療のために最も適切な決定を下す手助けをする。ガン
ビーノ(3)またランドバーク(4)は、この相互作用を完全な臨床検査プロセス(TTP)11 または「brainto-brain loop」として定義した。
臨床検査医学の価値
患者管理の全過程から、検査というプロセスの価値を分離することは難しいが、臨床検査医学の価
値は、臨床的にあるいは経済的に定義することができる。臨床検査の検査値は、健康に関連する予
後の改善に関わり、経済的価値としては医療費の効率的あるいは有効的運用に結び付けられる(5)。
前者は個々の国々や保険制度に特有のものではなく、患者に依存する。後者は、臨床検査が実施さ
れることになっている特定の条件や、利用可能な診断ツールの範囲およびコストに依存する。した
がって、経済的価値の分析を各国や制度間で移行することは難しい。臨床的に効果がないプロセス
に対して費用効果はないため、私たちは最も広い意味での臨床検査医学の価値に注目する。
私たちは、検査プロセスの純粋な価値は、その伝えられた結果が利点をもたらすのか、害(検査に
よる不適切な影響)を縮小するのかを定義することで評価することを提案する。このモデルでは、
純粋な検査プロセスの価値は、利点を増加させるか、害を縮小することにより最大限となる。
この利点は、患者の健康に関する客観的データの提供に由来するものである。たとえば、無症候性
の疾病の発見のためのスクリーニング検査、リスクの階層化、患者状態からの特定診断、適切な治
療の選択およびモニタリング、有害となる治療成績の早期発見、予後の評価 などである(図 1).
図1
患者の治療過程中の臨床検査の利用方法
既存の有効的証拠
臨床検査医学の価値を、包括的に調査する全ての研究を提示することは本論文では行わない。代わ
りに私たちは、臨床検査医学がもたらす利益を実証する例を示す(表 1)。これら利益があるという詳
細な証拠は、米国の国家的な報告で見つけることができる(13).
ベッドサイド検査 (POINT-OF-CARE
TESTING)
ベッドサイド検査(POCT)は、ユニークな特徴を持つ専門的な位置づけとなる。「患者に最も近い
場所で、問題に対して臨床的、技術的に早急に回答を出す」ことは、中央検査室での臨床検査と比
較し、より迅速な治療方針の決定やアクションに結びつく(14)。これは様々な条件、症候、設定条
3
件下で実証された(15-18)。これらのユニークな利点について、後述に議論するユニークな関係性が
伴う。
表1
臨床検査医学に価値があるという既存の証拠の例
4
費用対効果
費用対効果については、今回の調査での優先事項ではないが、このレビューにて簡潔に議論するこ
とは適当だろう。臨床検査医学の費用対効果は、様々な条件下で研究された[ヘルナンデスら(19)や
ファングら (20)による調査]。
ファングら(20)は、Tufts Medical Center での臨床検査を含む研究用の費用対効果分析レジストリを調
査した。 2008 年までの合計 141 の費用対効用研究が実施され、それらには別々の 433 個の増分原価
有効性比率(ICER)を含まれる。ICER は (C1- C2)/(E1- E2)と定義される。C1 と E1 は、介在中または
治療中の集団におけるコスト(C)と効果(E)を示し、C2 と E2 は対照群中のコスト(C)と効果(E)を示す。
臨床検査の正確性については、研究の 63%で明白に報告されたが、臨床検査の安全性あるいは危険
については 10%のみの言及であり、治療内容と無関係な臨床検査の潜在的な価値や有害さは 7%だ
けの言及だった。個々の ICER の 14 パーセント未満でコストが削減された結果で生じる収益であり、
古典的な「ウィンウィン」の状況だった。収益は、生存年数と QOL(Quality of Life)の両方を考慮し
た質調整生存年(QALYs)の点から表現され、与えることができた健康の質の効用値に、その利益を
得るために必要であった介在年数をかける(1 年間の完全な健康=1 QALY とする)。43%強についてが、
一般的に考えられている QALY 当たり 50000 ドルという閾値より低い費用効用と評価された。この
レビューでは、費用効用を調査する方法を標準化することを推奨し、QALYs を得るという観点で、
金額に十分見合う価値が増加したと言われる臨床検査医学の多くのエリアを明らかにすると結論を
出した。しかしながら、より多くのポジティブな情報を提供できたであろう適切な検査が実施され
なかったことにより、治療の遅延や、間違った診断結果についてかかるコストのことは考慮されて
いなかった。最も重要なことは、臨床検査室でのすべて検査は、典型的には全国医療費の 3%~5%
だけであり、検査室の経費を縮小するという利点は、その下流に対してのみ影響を与えていること
である(21)。
有害事象が起こる潜在的なメカニズム
5
多くの利点にもかかわらず、臨床検査室や臨床検査結果が不適当に使用されることで、患者のケア
がより貧弱化する場合があることは、すでに認識されているだろう。有害な事象が起こる源として、
誤診、不必要な治療、臨床的に些細なことなのに「疾病」として認識され、追加の診断の手続きか
ら起こる不適当な医学的介入、正確な診断からの適切な治療を受けることを失敗する、というよう
な事項を含んでいる(22, 23)。
アスティオンら(24)は、検査プロセスにおけるエラーが患者を不利益にする場合があり、臨床検査
医学の有効性を縮小する一番の有害事象として認識した。 彼らは臨床検査の品質改良のイニシアチ
ブを優先とした、有効性を改善するための分類体系を開発した。最近、エプナーら(23)は検査プロ
セスが診断のエラー(すべて個々の患者のケアに密接にかかわり、検査における実際の有効性を縮
小するようなエラー)に結びつく可能性がある 5 つの方法について記述した (表 2)。診断のエラー
だけではなく、全面的な患者に対する有害事象が考慮される場合、検査プロセスでは 6 番目の原因
を加えることもできるだろう(14)。
表 2 臨床検査と関係する診断エラーの原因の分類 a
臨床検査の結果が不正確である場合(原因 5)にはまだ努力が必要だが、それは現在ではエラーとして
は非常に頻繁でない原因である(25)。原因 1–4 に関連した診断エラーを縮小させるためには、現在
の臨床検査の状況の改善として、患者を中心としたアプローチに第一に焦点をたてるべきであり
(26)、その詳細は後述した。
POCT の専門的ケースを前述し、より速い意思決定の利益について記述した。しかしながら、潜在
的な有害事象の 5 つの原因が、この POCT の場合にも存在し、その発生頻度は著しい。技術的性能
の低さ、使用する低いレベルの人員のトレーニング、異なる QC プロトコル、少ない時間での検査、
関連したエラー検出システムの低さなどの問題があり、POCT の価値について新しいアプローチが
要求される(14)。
臨床検査医学の現在の状況
6
過去 30 年にわたる臨床検査医学研究で強調されたのは、臨床検査室でのパフォーマンスの改善に集
中していた。臨床検査室間の測定結果が異なることによって引き起こされた、明らかな有害事象に
対応して、測定方法と測定結果の標準化およびハーモナイゼーションが進歩した[例えば脂質、ヘモ
グロビン A1c(Hb A1c)、テストステロン、クレアチニン( 27)] 。臨床検査結果のハーモナイゼーショ
ンのための国際コンソーシアム(ICHCLR)www.harmonization.net は、検査結果のハーモナイゼーショ
ンを達成するためのグローバルな活動を優先的に行うために組織化され、測定結果の解釈の一貫性
を保証するための基準範囲の標準化など、検査室内のプロセスの最適化を行うことを手助けした。
この仕事は、熟練した検査や外部品質保証からのデータによって一部分成り立った。内部精度管理
の改良は、検査室の内部プロセス、またプラットフォームの統合および資金の効率的運用を実行す
るための、より広範囲なオートメーション化への改善を支援した。さらに検査室は、臨床医と検査
室の相互干渉について多くの改善が必要であり、適切な検査項目を要求するための一貫した特有の
サポートが要求され、臨床医からの受付システムのコンピューター化も必要だった。そこで臨床医
に、いつどのように検査結果が届け出られるかを含め、さらなる結果報告の一貫性の必要が強調さ
れた(28)。特に医療費を管理し、患者の安全性を増強し、より大きな透明性を伝えることが必要と
なり、これらの変更は現在の健康管理にまつわるマクロの環境影響によりもたらされた。
臨床検査の測定結果に対する研究
前述の仕事はとても有用であり検査室の効率を改善したが、しかしながらそれは測定結果が患者の
予後を改善するかどうかという臨床的な効果への問題の疑問に取り組んでいなかった。臨床検査医
学における『成果』とは、健康またはコストの点から医学的介入の結果として定義された(29)。任
意のヘルスケア・システムの主な結果の測定方法として、the Institute of Medicine の 2001 年のレポー
ト“Crossing the Quality Chasm” —STEEEP(安全性、計画性、有効性、公正さ、効率および患者中
心)(30) がある。
成果の研究は、検査の臨床的妥当性や予後の精度に関する研究とは別に記述されるだろう。予後の
正確さについての研究は「この検査の成果は何の結果に由来しているか?」についての質問となる
が、成果の研究での質問は「この検査をしなかった場合よりもした方が、利益が大きいか?」とい
う質問となる。測定結果ただそれだけでは個々の患者の健康や福祉には寄与しない。測定結果が利
益をもたらすためには、臨床医、他の医療専門家あるいは患者などの誰かが、その結果が役に立つ
ものなのか有効なのかを判断しなければならない。臨床検査医学の価値は、健康管理の方法の一貫
して定義されたものの中で常に考慮されるだろう。新しい検査項目やバイオマーカーが単独で考慮
された場合、診断的価値はあるかもしれないが、患者の全体的な精密診断の中で考慮された場合に
は重要ではないかもしれない。これらの検査は、異なる検査項目が根本的に同じ病態のプロセスを
測定していて、同様の診断情報を提供する場合生じる場合がある(31)。たとえば、心筋梗塞の早期
発見での心臓型脂肪酸結合蛋白質(FABP)などである。
より速い、より正確な診断や治療法の選択の改善、誤診や病状の悪化の防止、病院における患者の
流れ、患者の満足度や生活の質の改善などの観点では、臨床検査医学によって改善されたと考えら
れている (32) 。これらの研究は通常、臨床における意思決定およびその結果の管理における臨床検
査戦略の効果に焦点をおいているが、ホウィットやマカフリー(33)は、情緒的、社会・行動学的な
他の患者の予後の内容について有用な要約を行い、リーら(34)は、臨床検査にどのような価値があ
るのかを、医学的に、計画性の観点(よりよい決定を患者が行えること)や、心理的な観点(臨床結果
からの情報がどのように患者の自己の感覚に影響するか)を示した。
7
臨床検査がもたらす、真の成果を見いだす研究をすることは難しい。これは測定された検査値が、
多くの他に存在する変動要因に影響を受け、検査を行うこと以上の多くのステップが含まれるため
だろう。例えば、臨床医の測定結果による診断は一貫しない場合があり、有効な治療を行えないか
もしれない。成果に関する研究が成功するためには、一般的には希望される予後にリンクした検査
結果に対する標準化と整合生が必要である。その場合でも、特定の検査結果によって治療が開始さ
れても、患者集団が変わるとその有効性は減少するかもしれない。これまでの集団に基づく臨床検
査の結果研究では、データ収集方法および報告方法の標準化が不足しており、適切なデータ分析に
ついての整合性の不足、標本集団の規模が小さい、患者背景情報が不完全または全くない、データ
の収集コストが高いなどの他の問題があった。
私たちは何を行うべきか
私たちは、患者予後に対する臨床検査の影響について、適切な評価を行うための研究が必要であり、
それには人員、プロセスおよび関連する技術の最適な利用を改善することに結びつく研究が必要で
ある。臨床検査医学の価値に関する 2009 年のリューイン・グループ報告書(7)では、臨床検査とは、
測定のための試料が適切に受け付けられ、適時に結果が正確に返却され、検査結果が適切に解釈さ
れて、更なる診断を決定するための影響を与えなければならないものである。
2 つの基本的な問題点がここにある。特定の臨床検査と特定の結果の間の繋がりを明白に実証する
ためには、第一に検査プロセスで正しい段階の正しい患者集団に用いられ、検査が速やかに実施さ
れ、結果が適切に返却され、最適な時間枠の中で患者の適切な処置が行われることを必要とする。
次に、臨床検査と検査がもたらす結果の間の繋がりを評価するための研究デザインは、厳格に定義
され適切に実行される必要がある。さらに、ホーソン効果によってもたらされる効果は、研究結果
からは除外されなければならない。特定の状況によってその研究が実行されなくなった場合、良い
効果が持続されなくなる場合があり、研究後を観察することは不可欠である。
適切な利用の保証
私たちは、前述の 5 つの臨床検査と関係する誤謬診断の原因モデルで、適切な臨床検査の利用を保
証することを考慮している(表 2)。
原因 1-3 を引き起こす場合、臨床検査の適切な依頼とその解釈に関係がある。検査パターンを指定
するというオーダーの改良は、よりよい患者のケアや、より有効な診断のプロセスを実行できるよ
うになるにちがいない。患者のケアをより深く考えたというよりは、むしろ経済的な理由で単独で
臨床検査利用が先導される場合は、効果がないかあるいは短期的にのみ経済的収益となる。費用を
管理する者は、不経済で無関係な余分な臨床検査に資金を提供したくないことは明らかである。し
かし、迅速で有効な診断や治療を支援する際には、臨床検査が重要な役割を果たすことを認識する
に違いない。焦点となるのは、1 つのテスト当たりのコストではなく、特定の結果についてのコス
トなのである。
最近ヒックナーらは、臨床検査をオーダーし、その結果を解釈する際のプライマリーケアの臨床医
が直面した問題について記述した(35)。適切なオーダーができるかどうかは、効果的な臨床医の教
育と支援に依存するものであり、また検査室は治療方針を決定するための鍵となる役割がある。臨
床検査のインターフェース手順[それらが CPOE(医者からの受注をコンピューターで受け付ける
もの)なのか手動の申請書なのかどうか]の定義では、特定の条件下では正しい測定項目のオーダ
8
ーを簡便にし、不適当な条件下のオーダーを難しいものとしている (36)。解決策として、特定の条
件下および個々の問題に基づいたオーダーの標準的なプロトコルを考案することを含んでいる。そ
の中で臨床医は、対応できる問題かどうかを確認し、臨床検査室は臨床所見と一次検査の結果に基
づいてその後の検査戦略を定めて、結果の解釈を提供する(37, 38)。臨床検査の適切な使用は、与え
られた条件下での疾病のプレテストでの可能性に決定的に依存するものであり、そのプレテストで
の可能性が非常に高いか非常に低い場合は、両方とも検査利用が貧弱であることに由来するだろう。
検査結果を改善する際に未活用検査(原因 2)の改善に取り組むことは、過度の検査を減らすこと
と同じくらい重要である。最近の 15 年間の不適当な臨床検査に関するメタ分析では、多くの臨床検
査が未活用である同時に、十分に検討されていない場合がある、と結論づけた (39)。42 の横断的な
臨床検査研究の分析では、過度の利用は全体平均で 20.6%(95%信頼区間は 16.2%~24.9%)だった。
しかし、検査結果の利用不足は全体平均で 2 倍 (44.8%; 95%信頼区間は 33.8%~55.8%)だった。特
定の臨床症状に対する「適切な検査」をオーダーすることを強調することは、「明白な」診断に結
びつく。しかし診断の主要な目的として重要なのは、明白なものを確認することではなく、予期し
ないものを逃さないことである(40)。米国医療過誤クレームの分析(41)では、医療過誤の 55%が診断
に抜けがあったことに関係があり、正確な診断を行うための正しい検査をオーダーすることに失敗
していたことに起因していた。
結果の誤解あるいは誤用(原因 3)は、検査の性能の限界(感度、特異度、妨害物質に対する性能感)や、
適切な臨床背景の中で結果の解釈のために、必要で重要な情報の不足に起因する場合がある。1998
年にブラックが述べた放射線医学における情報背景の中で、より小さな異常を検知する能力は、ど
のような病気の罹患率も明白に増加させる傾向があります(42)。より感度の高い臨床検査法は、明
白に病気や疾患がまだそれほど進んでいない状態でも検知をする。それはそれ自体で悪いものでは
ないが、より重大な病気が存在する場合、いつ診断を行うか、いつ治療を開始するかの伝統的なア
プローチを妨げる場合がある(23, 43)。たとえば、前立腺特異抗原(PSA)検査は、患者の一生の間、
検査結果がほとんどあるいは全く意味を持たないだろう緩慢進行性の前立腺癌の診断となるかもし
れない。PSA 検査で陽性となったすべての患者へ治療を介在させる場合、個々の前立腺癌の悪性度
は不確かであり、過剰治療や有害事象に結びつくことがあった。これは PSA の臨床検査の価値その
ものに対する議論でないが、適切な利用の重要性を強調する出来事である。
臨床検査の専門家は、技術が可能な限り最も正確で感度が高い検査を提供したいと自然に考えるが、
しかし彼らは、診断や処置、モニタリングなどを決定することに関与する検査結果を、その関連性
を決定する臨床医と連携することも必要である。これは予測値や、結果が変化する重要性などの要
因について、意味のあるコミュニケーションを必要とすることを含んでいる。トロポニン測定の感
度を増加させる利点や問題などが、その適例である(44) 。
結果を適切に解釈することは、米国ではコレステロール標準化プログラムのような品質管理によっ
てサポートすることができる (45)。この脂質の標準化プログラムの改良により、治療のより有効な
目標を設定することが出来、1980 年以降心臓病関連死の減少が見られた。非常に控えめな仮定(コレ
ステロールに関連した死亡率の改善のうち 0.5%だけが標準化プログラムに起因したとして、生涯一
人当たり 50000 ドルの節約されたと仮定)を使用した場合、著者はこの脂質の標準化の総コスト利益
を 3 億 3800 万ドルと、プログラム・コスト(2007 年の 270 万ドル)よりはるかに大きく見積もった。
それほど控えめでない仮定の場合、明白に因果関係を確立することができないが、利益は数十億ド
ルに達すると思われる。
9
The World Alliance for Patient Safety(患者の安全性のための世界連合)(46)は、不十分な検査フォ
ローアップ(原因 4)は、不完全な患者ケアのプロセスの主な1つの原因であると認識された。キャレ
ンら(47)によると、入院患者の検査の安全性の確保が不十分であることから引き起こされると判断
された。これらに関する調査研究の数は限られており、研究方法論の間における違いのために十分
な比較ができなかったが、癌診断や骨盤内炎症性疾患を引き起こすクラミジア感染症の診断などの
検査が加わっていなかったことが、回避可能だった患者死に結びついたという強い証拠がある(47)。
1 つの典型的な研究では、6 か月間にリクエストされていた緊急の生化学結果の 29%は、電子的にア
クセスされていなかった(48)。
正しいタイミングにおいて、正しい人に適切な結果が適切に伝えられること、そして重大ではない
異常なことが不適切に伝えられたために引き起こされる「大量のシステム警告に対する疲れ」を回
避することは、患者予後に大きな影響を及ぼすと示された(49)。コストとヘール(28)は、重大な結果
の通知の実行方法についてグローバルにレビューし、このエリアでの報告についての標準化の改善
を推奨した。
不正確な結果(原因 5)の問題は、過去 40 年にわたってラボ内の多くで考慮をされ、一般に検査の分
析的な特異性や性能の限界は、少なくとも臨床検査の専門家の中ではよく理解されてきたが、検査
結果を使用する立場の者の中では必ずしもそうではなかった。前述のように、ICHCLR を通し、残
りの問題点の改善が進められている。しかしながら、TTP の他の側面には注意が不十分であり、特
に検査結果の正確さに深刻な影響を与える分析前の因子には、注意が不十分である。共通の例とし
て、溶血(横たわった状態での採血や、緊急処置中での採血において発生する)や、血液培養の汚染
の発生である。これらの要因の影響は、主に患者に対して不適当な入院(50)や検査を繰り返す必要
によって、治療が遅れるというような意味を持つ。 検査前、そして検査後のプロセスの効率の改善
は、臨床検査医学の一部であり、臨床の専門家に託すことができないことである。それには検査の
専門家と、検査サービス利用者の間の密接な共同作業を必要とする。
よりよい評価の設計
前述のように、診断的検査の査読済み論文における臨床的有用性を立証する証拠は、検査の分析的、
技術的性能と疾病状態との関係を扱う大多数の報告書においても、共にわずかだった。検査と患者
または集団的な結果を関連づける、確認された治療について強調されているものはほとんどなかっ
た。調査された検査の評価は、選択性に関しての診断の正確さ(51)と、ROC カーブのような潜在的
にまぎらわしい技術を広範囲に利用している集団に関する感度の報告に焦点があてられていた。ス
テイクホルダー(治療を行う者、費用を担う者、および政策決定者のような者)は、恐らく驚かなか
っただろうが、これらの研究の価値を受け入れることに抵抗するだろう。しかし、一般的には患者
全体の結果についての利益の証拠を提供している研究は、好意的に受けとられるだろう(52, 53) 。
感度および特異性の2方性に分けられる研究の弱点は、よく理解されている。感度や特異性はしば
しば、ゴールドスタンダードな標準測定法ではない測定法との比較や、有病率や疾病とされる範囲
が設定されることによって重いバイアスがかけられる(54)。健常人対象者群と比較した疾患群は、
統計的有意性を証明することに繋がるかもしれないが、通常は健常と疾患の線引きは無く、特定の
病気を持った患者と他の患者が、他の異なる病気を持っている場合などの通常の臨床現場を反映し
ているものではない。
10
根拠に基づいた医療の法則が常に有効、あるいは一貫性があるということが必ずしも無いと認識さ
れるようになったのは、つい最近である(55)。心筋トロポニン、ナトリウム利尿ペプチド、プロカ
ルシトニン、便中カルプロテクチンのような新しい検査項目は、検査をすることにより診断が改善
するという強健な証拠により導入されたが、現在行われている「型通りの」検査はこのような同じ
検討をあまり経ていない。そこでは 2 度の機会が逃されており、その 2 度とは、それらを有効に(例
えば、急性腎障害を予測するため血清クレアチニン値)使用することにより、既存の検査項目の価値
を高めることと、また何も役に立たないかもしくは有害となりうる時代遅れの検査項目を新しい証
拠を用いて除くことに対してである。
証拠を作成することで最も困難な部分は、正しい研究を行うための質問を設定することである(56)。
この質問は、PICO フレームワーク(集団、干渉、比較、結果)を使用することで、考慮された臨床シ
ナリオに沿って調査の効果に衝撃を与える変数を強調することができる方法を生み出すことができ
るだろう。影響を与えるいくつかの変数が記述された(56)。
一度、介在内容と結果の間のリンクが厳格に定義されたならば、様々な評価方法を使用することが
できるだろう[臨床化学および臨床検査医学のテスト評価ワーキンググループのヨーロッパ連合が推
薦している内容を参照(57)]。ホウィットら(58)は臨床的有用性を評価し、かつ診断の精度を臨床的
有用性にどのようにリンクすることができるかをさらに示すためのシナリオの中で、どのように相
対的な無作為対象化試験(RCT)を使用することができるかを説明した。 同じグループのムーンズら
(31)は、新しい診断検査項目の付加価値の量を計る有用な方法の概要を作成した。 マレットら(59)
も診断検査の精度評価に関する研究を進め、さらに異なる手法を強調した。
臨床研究の RCT に対して通常強調されるのは、臨床検査の価値を示すために行ったことに対してで
あり、それは介在した決定内容や検査結果が出た後の検査結果と、最終的な予後の間における管理
や環境因子に効果的な変数、コストや時間(年どころか数十年間)における RCT を使用した結果のイ
ンパクトを評価することの必要性である。これらの理由で、リューインのグループの 2010 年の
「Laboratory Medicine and Comparative Effectiveness Research (60)」の報告で、RCT が臨床検
査医学における相対的な有効性の研究において、デフォルト「不履行」で設定されるべきではない
と述べた。 しかしながらロードら(61)の検査評価を行うためのデザインの中で、有効な評価に必要
となる証拠のタイプを識別するために、RCT デザインの法則を使用することを推奨した。トリカリ
ノスら(62)は、臨床検査の価値を評価するためのツールとして、しばしば薬とワクチンの保険償還
を通知する判断に使用される分析シミュレーション・モデルを使用して調査した。
STARD(診断の精度の報告のためのスタンダード)のイニシアチブ報告(63)は、診断の精度に関する
研究で報告されている、質を向上させるためのチェックリストを提供しており、CONSORT(治験報
告の固定化のためのスタンダード)ステートメント(64)では、結果に対する介入の影響を研究する
RCT デザインの有用なガイドである。 臨床検査のユーティリティを評価する研究設計の必要条件は、
最近の AHRQ(Agency for Healthcare Research and Quality)出版に詳細に述べられており(65)、ま
た QUADAS-2(診断研究の改訂された品質評価)チェックリスト (66)では、診断の調査の主要な研究
の品質評価用の総括的なツールを提供する。 新規のあるいは既存臨床検査項目の治療効果判定方法
の臨床的インパクトの違いについて決定する非常に有効なチェックリストが、最近フェランテ・
ジ・ルッファーノらによって公表された(67)。医学研究所は、さらに患者予後に取り組む系統的な
調査のための基準を公表した(68)。私たちは、ジャーナルへの投稿およびレフェリー・プロセスの
レベルにそのようなチェックリストがより広く使用され、投稿された論文の一部となったり、補足
的な資料として利用されたりするように勧めている。それによって、研究自体やそれを審査するプ
ロセスの質を改善し、メタ分析が既存の研究を収集する能力を増強するだろう。
11
EQUATOR(Enhancing the Quality and Transparency of Health Research)のグループ(69)は、医学研究の透
明性と正確性を促進するための推薦カタログを作った。 これに応じて、the European Group on
Tumor Markers は、新しい腫瘍マーカーの評価に関する提案を公表した(70)。これには 4 つのアプロ
ーチ過程(米国食品医薬品局他によって新薬の評価に使用されたプロセスに似ている)について記述
した(表 3).
表 3 European Group on Tumor Marker による腫瘍マーカー評価の 4 段階のアプローチ
a
私たちは、強く臨床検査医学以外の他のエリアにも、このアプローチの拡張を勧める。バイオマー
カー研究を報告する時、これらの用語 (phase 1 研究=特性記述、phase 2 研究=感度、特異性、およ
び定義された集団の中での予測値、phase 3 研究=患者での結果での研究、phase 4 研究=承認後の拡
大確認) の採用は、非常に有効だろう。このような研究は検討開始前に登録して、完成して公表さ
れるべきものである。なぜなら検査の精度研究において、失敗や選択的な公表の報道が科学の他の
領域と同じくらい一般的であることが示されたからである。
定義された状況での特定のテストの結果の価値に加えて、私たちはさらに臨床検査医学の適切な使
用の全体として、価値のよりよい評価を必要とする。CDC が後援する臨床検査医学ベストプラクテ
ィス・イニシアチブは、健康管理の質の結果の改善に関連した有効な慣習の識別のために、ほとん
どエラーは生じない TTP の分析前もしくは分析後の条件に着目した方法について記述した(72)。
TTP の分析前もしくは分析後の条件に着目すると、そのような研究は決定を支援するアルゴリズム
や解釈コメントの価値の利用(73)、また TTP の全体的効率を改善する他の慣習などの協議されたル
ールを用いて、患者予後に対する影響の評価を含むべきである(38)。しかしながら 検査室での慣習
を変えることはよく言及されるが、患者予後の潜在的な影響のためにさらに調査される必要がある。
よい例はキルパトリックらの最近の仕事であり(74)、英国での Hb A1c 測定の結果報告で使用される
モル・ユニット当たりのミリモルという単位への変更は、全体的な糖尿病のコントロールの測定に
対して、患者の予後に有害にならないとされた。
12
患者を中心とした臨床検査医学のビジョン
21 世紀の医学は、適時に適切な患者に適切な検査結果を提供することを促進するフレキシブルな情
報リソースが求められており、それは前後の状況に特異的に解釈されることをともなって正しい場
所でタイムリーな方法で提供され、適切に同意されたガイダンスにリンクして実行されるべきであ
る。
これを達成するために、5 つの課題がある:
1. 既存および新規の検査の利用を改善すること。これは患者の示す苦情に基づいて、最適の検
査方法の決定を要求する;適切な検査を支援するために必要なものの開発、注文/要求; 適
切なサンプル収集、輸送および保管;検査結果を送信するための有効な戦略; 重大な結果
を通知するための臨床的に適切なトリガーについての整合性(28); また結果が適切に適用さ
れることを保証するために、協議されたサービスおよびコメントなどである。どのように有
効にそれらを適用することができるかに着目した、厳密に試験され公表される検査戦略上の
ガイドラインが作成されるべきである(75)
2. 診断の『brain-to-brain cycle』(brain to brain loop)の全てのポイントにおいて、患者の予後
を最適化することに焦点を当て、またこれらの役割の有効性および全面的な診断のプロセス
を監督するという臨床検査の専門家への新しい役割を定義すること。
3. バイオマーカーの臨床的有用性や、分析以外のプロセスの有効性に関して、患者中心的な前
向き研究における標準化されたプロトコルを開発すること(57, 58)。
4. 実施後の監査を含む上述したモデルを使用しての効果の測定について、一般的に容認された
特定の状況での既存項目や新規項目の評価基準を作ること (57, 70)。これは、検査プロセル
における分析前や分析後のコンポーネントの影響や、すべての適切な臨床の結果への検査プ
ロセスの全面的な影響を考慮しなければならない。
5. 有効性評価について、整合性のある定義や検証や論文のチェックリストの使用が公に提出さ
れること [参照 (23, 67)]。
アクションの呼び掛け
私たちが臨床検査医学の価値を実証し、高めてゆくことや無意味なデータの悪影響から価値のある
情報が損害されることを防ぐことは、上にリストされた課題の具体的進展が不可欠である。これら
の課題を解決しようとする臨床検査医学の専門家は、数字を産出するサービスよりは、患者のケア
の改善や、臨床の専門としての臨床検査医学の発展に主要な役割を果たすだろう。それには臨床医
との有効な共同作業や、患者の測定結果とこれまでの患者背景を、検査室の主要な有効性の基準と
認めることが必要である。政府や権限が与えられた機関は、資金を適切にこの結果研究に提供しな
ければならない。また生体外試料の臨床検査ルーチン産業は、適切な臨床研究を共同で促進し、調
整を行う重要な役割を持つ。しかしながらそれらには、臨床検査医学コミュニティーからのリーダ
ーリップやパートナーシップが要求されることを伝えなければならない。現在、全ての国の臨床検
査の専門家に必要なのは、臨床検査室以外から見ること、効率的で費用効果がよい方法を用いて、
臨床結果と患者の背景を最適化しようとする多くの専門にわたるチームとの効果的つながりを作り
上げることが求められている (76)。
(訳者:柳田 小百合)
13
Acknowledgments
The authors are grateful to P. Gillery and members of the IFCC Scientific Division for helpful comments on
the draft manuscript.
Footnotes
11
Nonstandard abbreviations:
TTP,
total testing process;
POCT,
point-of-care testing;
ICER,
incremental cost-effectiveness ratio;
QALY,
quality-adjusted life year;
Hb A1c,
hemoglobin A1c;
ICHCLR,
International Consortium for Harmonization of Clinical Laboratory Results;
RCT,
randomized controlled trial;
PSA,
prostate-specific antigen.
Author Contributions: All authors confirmed they have contributed to the intellectual content of this
paper and have met the following 3 requirements: (a) significant contributions to the conception and
design, acquisition of data, or analysis and interpretation of data; (b) drafting or revising the article for
intellectual content; and (c) final approval of the published article.
Authors' Disclosures or Potential Conflicts of Interest: Upon manuscript submission, all authors
completed the author disclosure form. Disclosures and/or potential conflicts of interest:
Employment or Leadership: M.J. Hallworth, IFCC; P.L. Epner, Clinical Laboratory Management
Association, and Society to Improve Diagnosis in Medicine; C. Ebert, Roche Diagnostics GmbH; C.R.
Fantz, AACC; T.N. Higgins, DynaLIFEDx.
Consultant or Advisory Role: P.L. Epner, Silicon BioDevices, Integrated Project Management
Company, Inc., Research Triangle International, Inc., Battelle, Glenwood Capital Management, Abbott
Laboratories, and De Gruyter (DIAGNOSIS, Associate Editor); T.N. Higgins, Becton Dickinson.
Stock Ownership: P.L. Epner, Abbott Laboratories (stock options) and Silicon BioDevices.
Honoraria: P.L. Epner, Orchard Software, G2 Intelligence, and Saudi Arabia Quality Council; T.N.
Higgins, Bio Rad.
14
Research Funding: None declared.
Expert Testimony: None declared.
Patents: None declared.
Other Remuneration: M.J. Hallworth, AACC, IFCC, ACB, and Cogara Conferences; P.L. Epner,
ASCLS chapters, CLMA chapters, Association of Pathology Informatics, Virginia Commonwealth
University, CDC, IFCC, and Society to Improve Diagnosis in Medicine; C.R. Fantz, IFCC travel for
committee meeting.
Received for publication September 11, 2014.
Accepted for publication December 5, 2014.
© 2014 American Association for Clinical Chemistry
References
1. Hallworth MJ. The 70% claim: what is the evidence base? Ann Clin Biochem 2011;48:487–8.
2. Research and Markets. In vitro diagnostics (IVD) market, techniques and applications. Dublin:
Research and Markets;2013. http:
//www.researchandmarkets.com/publication/pfdniq/in_vitro_diagnostic_ivd_market_technique (Accessed
September 2014).
3. Gambino SR. Met and unmet needs of the automated clinical laboratory. Trans N Y Acad Sci 1970;
32(7 Series II):816–20.
4. Lundberg GD. Acting on significant laboratory results. JAMA 1981;245:1762–3.
5. Drummond MF, Sculpher MJ, Torrance GW, O'Brien BJ, Stoddart GL. Methods for the economic
evaluation of health care programmes. 3rd ed. Oxford; Oxford Medical Publications: 2005.
6. The Lewin Group. The value of laboratory screening and diagnostic tests for prevention and health care
improvement. http://www.lewin.com/publications/publication/403/ (Accessed September 2014).
7. Mandel JS, Church TR, Ederer F, Bond JH. Colorectal cancer mortality: effectiveness of biennial
screening for fecal occult blood. J Natl Cancer Inst 1999;91:434–7.
8. National hospital ambulatory medical care survey: 2010 Emergency department summary 表 s. http:
//www.cdc.gov/nchs/data/ahcd/nhamcs_emergency/2010_ed_web_表 s.pdf (Accessed September 2014).
9. Kellum JA, Lameire N. Diagnosis, evaluation, and management of acute kidney injury: a KDIGO
summary (Part 1). Crit Care 2013;17:204.
15
10. Urban TJ, Goldstein DB. Pharmacogenetics at 50: genomic personalization comes of age. Sci Transl
Med 2014;6:220ps1.
11. McGlynn EA, Asch SM, Adams J, Keesey J, Hicks J, DeCristofaro A, et al. The quality of health care
delivered to adults in the United States. N Engl J Med 2003;348:2635–45.
12. The Lewin Group. The value of diagnostics: innovation, adoption and diffusion into health care.
http://www.lewin.com/publications/Publication/237/ (Accessed September 2014).
13. The Lewin Group. Laboratory medicine: a national status report. http:
//www.lewin.com/publications/publication/343/ (Accessed September 2014).
14. Epner PL. Achieving the promise of point-of-care testing. Point Care 2014;13:112–3.
15. Bingisser R, Cairns C, Christ M, Hausfater P, Lindahl B, Mair J, et al. Cardiac troponin: a critical
review of the case for point-of-care testing in the ED. Am J Emerg Med 2012;30:1639–49.
16. Heneghan P, Alonso-Coello J, Garcia-Alaamino JM, Perera R, Meats E, Glasziou P. Self-monitoring of
oral anticoagulants: a systematic review and meta-analysis. Lancet 2006;367:404–11.
17. Jang JY, Shin SD, Lee EJ, Park CB, Song KJ, Singer AJ. Use of a comprehensive metabolic panel
point-of-care test to reduce length of stay in the emergency department: a randomised controlled trial.
Ann Emerg Med 2013;61:145–51.
18. Lee-Lewandrowski E, Lewandrowski K. Perspectives on cost and outcomes for POCT. Clin Lab Med
2009;29:479–89.
19. Hernandez JS. Cost-effectiveness of laboratory testing. Arch Pathol Lab Med 2003;127:440–5.
20. Fang CH, Otero HJ, Greenberg D, Neumann PJ. Cost-utility analyses of laboratory tests: a
systematic review. Value Health 2011;14:1010–8.
21. Levinson DR. Comparing lab test payment rates: Medicare could achieve substantial savings. US
Department of Health and Human Services, Office of the Inspector General 2013;OEI-07–11-00010.
22. Moynihan R, Doust J, Henry D. Preventing overdiagnosis: how to stop harming the healthy. BMJ
2012;344:e3502.
23. Epner PL, Gans JE, Graber ML. When diagnostic testing leads to harm: a new outcomes-based
approach for laboratory medicine. BMJ Qual Saf 2013;22(Suppl 2):ii6–10.
24. Astion M, Shojania KG, Hamill TR, Kim S, Ng VL. Classifying laboratory incident reports to identify
problems that jeopardize patient safety. Am J Clin Pathol 2003;120:18–26.
25. Plebani M. Detection and prevention of errors in laboratory medicine. Ann Clin Biochem 2010;47:
101–10.
16
26. Plebani M. Laboratory-associated and diagnostic errors: a neglected link. Diagnosis 2014;1:89–
94.
27. Miller WG, Myers GL, Gantzer ML, Kahn SE, Schonbrunner R, Thienpont LM, et al. Roadmap for
harmonization of clinical laboratory measurement procedures. Clin Chem 2011;57:1108–17.
28. Kost GJ, Hale KN. Global trends in critical values practices and their harmonization. Clin Chem Lab
Med 2011;49:167–76.
29. Bissell MG. Laboratory-related measures of patient outcomes: an introduction. Washington;
AACC Press: 2000. p 194.
30. Institute of Medicine. Crossing the Quality Chasm: a new health system for the 21st century.
Washington (DC): National Academy Press: 2001.
31. Moons KGM, de Groot JAH, Linnet K, Reitsma JBR, Bossuyt PMM. Quantifying the added value of a
diagnostic test or marker. Clin Chem 2012;58:1408–17.
32. Anonychuk A, Beastall G, Shorter F, Kloss-Wolf R, Neumann P. A framework for assessing the value
of laboratory diagnostics. Health Manage Forum 2012;25:S4–11.
33. Bossuyt PM, McCaffrey K. Additional patient outcomes and pathways in evaluations of testing. Med
Decis Making 2009;29:E30–8.
34. Lee DW, Neumann PJ, Rizzo JA. Understanding the medical and nonmedical value of diagnostic
testing. Value Health 2010;13:310–4.
35. Hickner J, Thompson PJ, Wilkinson T, Epner P, Sheehan M, Pollock AM, et al. Primary care
physicians' challenges in ordering clinical laboratory tests and interpreting results. J Am Board Fam Med
2014;27:268–74.
36. Epner P, Astion M. Focusing on test ordering practices to cut diagnostic errors. Clin Lab News
2012;38(7);17–18.
37. Plebani M. Interpretative commenting: a tool for improving the laboratory/clinician interface. Clin
Chim Acta 2009;404:46–51.
38. Laposata M. Errors in clinical laboratory test selection and result interpretation: commonly
unrecognised mistakes as a cause of poor patient outcome. Diagnosis 2014;1:85–7.
39. Zhi M, Ding EL, Theisen-Toupal J, Whelan J, Arnaout R. The landscape of inappropriate laboratory
testing: A 15-year meta-analysis. PLoS ONE 2013;8:e78962.
40. Groopman J. How doctors think. New York; Houghton Mifflin: 2007.
17
41. Gandhi TK, Kachalia A, Thomas EJ, Puopolo AL, Yoon C, Brennan TA, et al. Missed and delayed
diagnoses in the ambulatory setting: a study of closed malpractice claims. Ann Intern Med 2006;145:
488–96.
42. Black WC. Advances in radiology and the real versus apparent effects of early diagnosis. Eur J Radiol
1998;27:116–22.
43. McGregor MJ, Martin D. Testing 1,2,3: is overtesting undermining patient and system health? Can
Fam Physician 2012;58:1191–8.
44. Wu AHB, Bolger AF, Hollander JE. Growing pains with the use of high-sensitivity cardiac troponin
assays. J Am Coll Cardiol 2013;62:1250–1.
45. Hoerger TJ, Wittenborn JS, Young W. A cost-benefit analysis of lipid standardization in the United
States. Prev Chronic Dis 2011;8:A136.
46. World Alliance for Patient Safety. Summary of the evidence on patient safety: implications for
research. Geneva; World Health Organization: 2008.
47. Callen J, Georgiou A, Li J, Westbrook JI. The safety implications of missed test results for hospitalised
patients: a systematic review. BMJ Qual Saf 2011;20:194–9.
48. Kilpatrick ES, Holding S. Use of computer terminals on wards to access emergency test results: a
retrospective audit. BMJ 2001;322:1101–3.
49. Singh H, Spitzmueller C, Petersen N, Sawhney MK, Sittig DF. Information overload and missed test
results in electronic health record-based settings. JAMA Intern Med 2013;173:702–4.
50. Turner HE, Peake RWA, Allison JJ. The impact of centrifugation in primary care on
pseudohypokalaemia: a retrospective evaluation. Ann Clin Biochem 2013;50:371–3.
51. O'Kane MJ. The evidence base for laboratory medicine: more work needed. Ann Clin Biochem
2013;50:293–5.
52. Bruns DE, Boyd JC. Assessing the impact of biomarkers on patient outcome: an obligatory step.
Scand J Clin Lab Invest 2010;70(Suppl 242):85–9.
53. Neumann PL, Tunis SR. Medicare and medical technology: the growing demand for relevant
outcomes. N Engl J Med 2010;362:377–9.
54. Whiting P, Rutjes AW, Reitsma JB, Glas AS, Bossuyt PM, Kleijnen J. Sources of variation and bias in
studies of diagnostic accuracy: a systematic review. Ann Intern Med 2004;140:189–202.
55. Price CP. Evidence-based laboratory medicine: is it working in practice? Clin Biochem Rev 2012;
33:13–9.
18
56. Price CP, Christenson RH. Ask the right question: a critical step for practicing evidence-based
laboratory medicine. Ann Clin Biochem 2013;50:306–14.
57. Horvath AR, Lord SJ, St John A, Sandberg S, Cobbaert C, Lorenz S, et al. From biomarkers to
medical tests: the changing landscape of test evaluation. Clin Chim Acta 2014;427:49–57.
58. Bossuyt PM, Reitsma JB, Linnet K, Moons KG. Beyond diagnostic accuracy: the clinical utility of
diagnostic tests. Clin Chem 2012;58:1636–43.
59. Mallett S, Halligan S, Thompson M, Collins GS, Altman DG. Interpreting diagnostic accuracy studies
for patient care. BMJ 2012;344:e3999.
60. Lewin Group. Laboratory medicine and comparative effectiveness research. http:
//www.lewin.com/publications/publication/402/ (Accessed September 2014).
61. Lord SJ, Irwig I, Bossuyt PM. Using the principles of randomized controlled trial design to guide test
evaluation. Med Decis Making 2009;29:E1–12.
62. Trikalinos TA, Siebert U, Lau J. Decision-analytic modeling to evaluate benefits and harms of medical
tests: uses and limitations. Med Decis Making 2009;29:E22–29.
63. Bossuyt PM, Reitsma JB, Bruns DE, Garsonis CA, Glasziou PP, Irwig LM, et al. Towards complete
and accurate reporting of studies of diagnostic accuracy: the STARD initiative. Clin Chem 2003;49:
1–6.
64. Schultz KF, Altman DG, Moher D; CONSORT Group. CONSORT 2010 statement: updated
guidelines for reporting parallel group randomised trials. BMC Medicine 2010;8:18.
65. Agency for Healthcare Research and Quality. Methods guide for medical test reviews. Publication No.
12-EC017. Rockville; Agency for Healthcare Research and Quality: 2012. http:
//effectivehealthcare.ahrq.gov/search-for-guides-reviews-andreports/?pageaction=displayproduct&productid=558 (Accessed September 2014).
66. Whiting P, Rutjes AW, Westwood ME, Mallett S, Deeks JJ, Reitsma JB, et al. QUADAS-2: a revised
tool for the quality assessment of diagnostic accuracy studies. Ann Intern Med 2011;155:529–36.
67. Ferrante di Ruffano L, Hyde CJ, McCaffery KJ, Bossuyt PMM, Deeks JJ. Assessing the value of
diagnostic tests: a framework for designing and evaluating trials. BMJ 2012;344:e686.
68. Institute of Medicine of the National Academies. Finding what works in health care: standards for
systematic reviews. http://iom.edu/Reports/2011/Finding-What-Works-in-Health-Care-Standards-forSystematic-Reviews.aspx (Accessed September 2014).
69. Simera I, Altman DG. Writing a research article that is “fit for purpose”: EQUATOR Network and
reporting guidelines. Evid Based Med 2009;14:132–4.
19
70. Soletormos G, Duffy MJ, Hayes DF, Sturgeon CM, Barak V, Bossuyt PM, et al. Design of tumor
biomarker-monitoring trials: a proposal by the European Group on Tumor Markers. Clin Chem 2013;
59:52–9.
71. Korevaar DA, Ochodo EA, Bossuyt PMM, Hooft L. Publication and reporting of test accuracy studies
registered in ClinicalTrials.gov. Clin Chem 2014;60:651–9.
72. Christenson RH, Snyder SR, Shaw CS, Derzon JH, Black RS, Mass D, et al. Laboratory medicine best
practices: systematic evidence review and evaluation methods for quality improvement. Clin Chem
2011;57:816–25.
73. Kilpatrick ES, Freedman DB; National Clinical Biochemistry Audit Group. A national survey of
interpretative reporting in the UK. Ann Clin Biochem 2011;48:317–20.
74. Kilpatrick ES, Rigby AS, Atkin SL, Barth JH. Glycemic control in the 12 months following a change
to SI hemoglobin A1c reporting units. Clin Chem 2013;59:1457–60.
75. Misra S, Barth JH. Guidelines are written, but are they followed? Ann Clin Biochem 2013;50:400–
2.
76. Beastall GH. Adding value to laboratory medicine: a professional responsibility. Clin Chem Lab
Med 2013;51:221–7.
20