Clinical Chemistry

Clinical Chemistry
Q&A
フォマティクス:臨床検査技師が知っておき、準備をする必要がある事項
1
2
3
4
5
GregoryJ.Tsongalis,Moderator ,*,ElizabethChao,Expert ,JillM.Hagenkord,Expert ,TinaHambuch,Expert andJasonH.Moore,Expert
多種多様なアプリケーションをカバーする、新しい分子診断法技術を臨床検査室に導入することが記録的
なペースで進み、この分野の革命的な変化につながりました。例えば、マイクロアレイは通常、発達上の
遅れと自閉症と関連した体質異常のための最初のテストとして臨床検査室で使われています。加えて、分
析ごとに何百万ものプローブを使用するマイクロアレイは、大規模な遺伝子タイピングや、特定の臨床ア
ルゴリズムに関連した遺伝子発現プロファイリングに使われています。次世代または超並列配列(NGS)
は、目標とされたすべての遺伝子、エキソームとゲノム配列のための臨床検査室のルーチンにもなってい
ます。これらの分析法によって発生するデータの量は、前例がなく、データセットの適当な記憶装置や分
析、発掘のためのバイオ情報科学についての洗練された知識を必要とします。臨床検査室がバイオインフ
ォマティクスに関する経験をもち、多くの結果を扱っているものの、これらのタスクのために使われるシ
ステムは、オーミクス研究からのデータを取り扱うには不十分です。こ の Q&Aにおいて、オーミクス研
究のためにバイオインフォマティクスを日常的に使用する学界と工業界からの数人の主要な専門家が、バ
イオインフォマ ティクスの重要性と、臨床研究者がこれらの研究を実施する上で、彼らの研究所で生じる
データ量の増加とデータの複雑さを、どのようにして対処しているかを議論するために招待されました。
バイオインフォマティクスと生物統計学はかなり違いがあるにもかかわらず、互換的に使用され
ています。これらの用語を定義し、バイオインフォマティクスが臨床検査室にどのような影響を与え
るか示すことはできますか?
Elizabeth Chao:生物統計学は、生物学に統計を適用したものです。大きな集団を
の臨床研究を設計するため、統計分析を用いることに重点を置いています。生物
統計学は統計的推定を介し有意な結果を強調するため、ノイズから信号を区別し
ます。一方、バイオインフォマティクスは生物学、コンピューター科学、応用数
学、統計学を 1 つの領域に一体化した現代の学際的科学です。バイオインフォマ
ティクスの主な目的は、生物学的プロセスを研究するためのプログラムを開発
し、利用することです。
1
Clinical Chemistry
Q&A
バイオインフォマティクスと生物統計学の両方は、それらの違いにもかかわらず、膨大なデータセットの
解析に必要不可欠です。臨床検査室では、バイオインフォマティクスはハイスループット機器と、ゲノム
データセットの入力するために必須です。
Jill M. Hagenkord:私の意見ではバイオインフォマティクスは、膨大で複雑な生
物学的データセットを研究するために計算ツールを利用することです。バイオ
インフォマティクスは非常に学際的であり、生物学、化学、数学、コンピュー
ターサイエンス、統計の要素を含んでいます。 例えば、数百万の重複した断片
読み取りから、エキソームの DNA配列決定のためのアルゴリズムや、タンパク
機能が変異している DNA配列の生物学的インパクトの予測があります。
私はバイオインフォマティクスを臨床試験の統計アプリケーションとして考えます-例えば、試験の十分
なパワーはどのくらいか、どのくらい結果の統計学的有意がどのくらいかを示すためです。
私たちは“超並列”な検査方法が、ますます研究所から臨床検査室へ移行していくのを見ています。サイ
トジェノミクスアレイは、マイクロアレイの上で掛け合わされた分解された DNAから、コンピューター
の中で基本的に染色体を再構築するもので、すでに多くの遺伝性疾患の第一選択の試験であり、癌への適
用が増加しています。NGS は全ゲノム-生殖細胞系列、癌、微生物の全て、または一部の配列決定に使わ
れ始めています。実質的には、近い将来に NGSアッセイの影響を受けない病気はありません。臨床ゲノ
ムアッセイの計画、検証、実行、解明は病理の範囲であり、各ステップは多くのバイオインフォマティク
スを必要とします。NGSからのデータ全ては-私たちは基本的にベースをバイトに変換し、コンピュータ
ーの中で再度、ベースとして視覚化しています。静的データと比較すると、このデジタル情報は臨床検査
技師が各患者に関する臨床上の質問について文章で説明する際に使用する、追加アルゴリズムまたはデー
タベースとすぐに連結します。責任がある病理医や研究者が、各アルゴリズムの背景にある前提や外部デ
ータベースの相対的強度や限界を理解することが重要です。各研究室が 1人以上のバイオインフォマティ
シャンを雇う必要があるでしょう。
2
Clinical Chemistry
Q&A
Tina Hambuch:バイオインフォマティクスは生物学的データセットの処理過程
であり、ロジスティックだけでなく、分析プロセスも網羅しています。生物統
計学は特に、統計ツールの利用を介して、パターン/傾向の特異的タイプを特
定することに焦点を当てた分析過程のサブセットです。データの範囲が大きく
なるにつれ、バイオインフォマティクスはより重要になります。判断する人と
研究室間実績の両方の点において、臨床検査科学はより標準化し、定量的にも
なります。しかしいくつかの臨床検査室は、強度なバイオインフォマティクス構成を持っていますが、こ
れは短期間での重大な挑戦であり、バイオインフォマティクスの誤用の危険性があるでしょう。例えば、
遺伝的変異の様々なタイプを検出するために様々なプログラムが利用されており、その性能は変化し得ま
す;そのため、どのようにデータが分析されるか、そしてその解析に使われている様々なツールの前提や、
最適化を理解することは適切なアプリケーションに重要です。
Jason H. Moore:生物統計学は、生物学的および生物医学的問題に答えることを目標とし、推定や仮説検定
を実行するために数学を用いた正式な分野です。点推定は平均や分散または他の回帰直線の傾きのような
評価などの基準母集団パラメータの正確な推定に焦点を当てています。仮説検定は 1 つ以上のパラメータ
に関する帰無仮説検定から、推論の正式なプロセスに焦点を当てています。生物統計学の基本的な概念と
方法を理解することは、臨床検査技師や他の全ての生体医学にとって重要です。
バイオインフォマティクスは、複雑な生物医学問題に取り組むために、生物統計学とコンピューターサイ
エンスを結びつける比較的新しい領域です。バイオインフォマティクスは、DNA配列データの保存、管
理、分析の必要性が生じ、1970 年代に始まりました。インターネットと手頃なコンピューターの普及によ
り、1990年代に軌道に乗りました。バイオインフォマティクスの多くは、DNA配列決定や質量分析のよ
うな技術から得た高次元のデータ分析のための新たなデータベースと、計算アルゴリズムの開発、評価、
応用に焦点を当てています。コンピューターサイエンスや機械学習、可視化などの学問分野の下位区分へ
の焦点は、生物統計学とバイオインフォマティクスを区別して設定したものである。しかし良いバイオイ
ンフォマティクスは、正当な生物統計的方法を分析的戦略に統合することができます。生物統計学とバイ
オインフォマティクスの両方は、臨床検査室のセッティングのために重要です。例えばバイオインフォマ
ティクスは、研究や臨床のデータベース生データの統合による生データを保存するために必要とされます
が、臨床 DNAサンプルの配列決定は品質管理のために正式な生物統計学的方法を必要とするでしょう。
臨床検査室ではマイクロアレイと NGS 技術は、大量のデータを作成することが知られている診断ツー
ルの典型です。データ分析、保管、検索のためのオプションは何ですか?
3
Clinical Chemistry
Q&A
Elizabeth Chao:臨床検査室は膨大な量のデータを読みとって送信するために、内部の ITコンピュータイン
フラを保管しています。販売会社は検査室特有のニーズに対する高性能 コンピューティングおよびストレ
ージソリーションを幅広く提供することができます。
Jill M. Hagenkord:サイトジェノミックマイクロアレイは、ギガバイト近いデータを作成し、全ゲノム配列
決定はテラバイト近いデータを作成します。しかし、私たちが今まで生データに戻る必要があることは稀
であり、私の意見では処理されたデータを保管するのに十分です。全ヒトゲノムの処理されたデータは数
ギガバイトだけであり、それは最終的には保管するのに妥当となります。加えて、母なる自然はすでにゲ
ノムを保管するのに最も安価な方法を考え出しました-それは DNAと呼ばれています。そのため、臨床
サンプルのために処理したデータファイルを保管することは、生データの保管や、稀に DNAを処理する
よりも実際に安いので、そうすることが必用です。それは、私たちが臨床検査室で使っているものとは別
のモデルだが、それは、臨床サンプルのデータを保持するための要件の精神を維持しています。
別の考慮事項は、”クラウド”に(生もしくは、手を加えた)ゲノムデータを保存することであり、必要で
あれば、レポートを作成するためにリモートでアクセスすることです。最終報告書は、患者の医療記録に
なりますが、ゲノムデータは、1996年の医療保険の携行性と責任に関する法律に準拠したデータベースに
存在します。もし、コストを最小限にしたいのであれば、あなたの臨床用冷凍庫に DNAを保存し、低温
貯蔵庫の加工したデータをクラウドに入れるべきです。
Tina Hambuch:多くの利用可能なオプションがあり、その課題はこれらのどれが最も適切であるかを特定
することです。これは、どのように特定の検査室がデータを使用するかまたは、どのような質問が求めら
れるかに依存します。いわば、BAM(バイナリアライメント/マップ)もしくは、VCF(バリアントコー
ル形式)などの特定の形式に付随する標準化により、これらのことが大幅に改善します。データの保存の
ために、私たちは、アイシロン(EMC)を、また、データの解析のためにサングリッドエンジン(コンピ
ュータークラスター)を使用します。いくつかの市販のソフトウェアパッケージが利用可能になっていま
すが、私たちは、独自のプログラムやスクリプトを使用します。
Jason M. Moore:DNA配列分析のために最も広く使用されているツールのふたつは、ギャラクシーを CLC
ゲノミクスワークベンチです。ギャラクシーは、無料のウェブベースのソフトウェアパッケージであり、
DNA配列操作や QC、アライメント、変異検出、統計分析などの多くの解析ツールを含んでいます。それ
はすぐに、DNA配列分析のための主要な教材となりました。CLC ゲノミクスは、市販のソフトウェアパ
ッケージであり、 はるかに直感的なグラフィックユーザーインターフェースと同等の機能を持っています。
高価ではあるものの、CLC ゲノミクスワークベンチは、バイオインフォマティクスを重視しない人にとっ
ても非常に使用しやすいものです。
4
Clinical Chemistry
Q&A
“クラウド”とは何ですか?このデータ保管オプションは財政的制約、HIPAA、他の規制問題のある検
査室に適していますか?
Elizabeth Chao: クラウドによって、データと処理能力に簡単にアクセスし分配することができます。それ
は地理的に制限されておらず、そのサービスをいつでも利用することができます。さらに、それは企業ニ
ーズに応じて保管と処理能力を拡張することを目的とした、費用効率が高いビジネスソリューションです。
プライベートおよび公共のクラウドネットワーク機能を比較すると、この考えはさらに広がります。主な
違いは、データの送信と処理をするホストインフラです。公共インフラは通信するためワールドワイドウ
ェブを用いており、情報技術の観点から本質的にリスクがあります。一方、データ保護の責任がある社内
の情報技術サポートチームは、プライベートインフラをサポートしています。後者は厳格な情報セキュリ
ティプログラムの導入が必用です。
Jill M. Hagenkord:クラウドを概念化する簡単な方法は、Yahooメールや Gメールを考えることです。これ
らは、リモートソフトウェアを用いているリモートサーバー上で実行される、ウェブベースの電子メール
サービスです。 エンドユーザーとして、ハードウェアやソフトウェアのどちらも、インストールや維持す
る必要はありません。エンドユーザーは“共有ユーザー”モデルによって提供されるスケールメリットを
享受している間に、クラウドによって、エンドユーザーは必要な帯域幅だけを利用します(支払います)。
ソフトウェア、IT、セキュリティ、データセンター専門家がクラウド技術の管理をするので、病院の検査
室の場合、エンドユーザーは患者のゲノム情報を用いることに焦点を当てることができます。HIPAA規制
はクラウドコンピューティングに興味深い障害物を導入しますが、それらを克服できないわけではありま
せん。例えば、HIPAAのコンプライアンスを維持するために、データはアメリカから離れるべきではあり
ません;それは、クラウドがいつでも与えられるところで、常にエンドユーザーに対し明白ではありませ
ん。これはオーミクスを基にした検査が頭上にある、昨日のコンプライアンスポリシーを設定する多くの
方法のうちの 1つです。準拠した臨床ゲノムファクトリーを操作するためのコンテキストで、’88年の
CLIAの解釈をしてみてください!しかし、クラウドソリューション実行する際、活用することができる
多くのオプションがあります。バーチャルプライベートクラウド、暗号化、アクセス制御などのサービス
は、HIPAAや他の規制準拠ソリューションを構築するために活用することができます。現在、それらの要
件を満たし、クラウド上で稼働している多くのサービスがあります。
ゲノミクスとクラウドコンピューティングは、成長し、支持され続け、ゲノム医学の将来の展望の一部と
なるでしょう。私たちがゲノム検査のためにより適切になるかもしれないことをポリシー立案者に教育す
るとともに、検査室の専門家として私たちは現在の規制ポリシーを理解し、私たちのオーミクスソリュー
ションがガイドラインに忠実であるということを確認する必要があります。
5
Clinical Chemistry
Q&A
Tina Hambuch:私たちはこれを探索していますが、HIPAAの周りには重大な懸念があります。作られた情
報の最終的な有用性について、探索と最適化は可能であろうと考えますが、短期的には、データセキュリ
ティとそれらを適切に共有する機能に関する多くの重要な課題があります。
Jason H. Moore:クラウドコンピューティングは、インターネットを介して提供されるデータ保管と分析サ
ービスです 。公共またはプライベートの機関が、高性能コンピューティングとデータ保管ハードウェアへ
のアクセスを地理的にインターネットに分散しているユーザーへ売ります。このモデルの利点は、コンピ
ューティングリソースを自分自身で維持する必要がなく、使ったサービスの分だけ支払うことです。臨床
検査室では、必要とされる全てのデータ保管のためにクラウドを用いることを意味するかもしれません。
あなたが保管したいデータのギガバイトおよび時間の長さによって支払うでしょう。ハードウェアの障害
によるデータ損失から守るバックアップのある安価なデータ保管を得ます。もちろん施設を離れたデータ
は、プライバシーやセキュリティ基準を満たしていないかもしれないという欠点があります。一旦、デー
タが他の人のサーバー上にあると、あなたはもはやその保護を制御できません。臨床検査室の多くは現時
点で、そのようなリスクを取ることを望んでいません。
2012 年 3 月、医学研究所(IOM)は高複雑度検査やそれに続く分析(トランスレーショナルオーミク
スの進化)によるデータセットの検証に関する報告を公表しました。バイオインフォマティクス分析の再
現性についてどう考え、臨床検査室は報告中に記載されている問題を回避することができると思います
か?
Elizabeth Chao: バイオインフォマティクス分析の再現性は、ゲノミクスの臨床への急速な導入とともに迫
りくる問題です。IOMとアメリカンカレッジオブメディカルジェネティクス(ACMG)の両方が、これら
の実施に対処することをとても早く選択したことは心強く感じます。ACMAはポリシーステートメント出
し、全エキソンと全遺伝子配列に対する明確なガイドラインに取り組んでいます。
この分野のリーダーと 早期導入者として、私たちの会社は信頼性と再現性に対する内部基準に期待してお
り、それは現在の IOM 報告よりも厳格です。そうは言っても、私たちはこれらの裁定基準が将来的に、
より標準化することを確かになることを喜んでいるでしょう。この段階に到達するために必要な投資は見
落とされるべきではなく、より価値のあるものです。
Jill M. Hagenkord:異なる種類で、他よりも透過的なオーミクス分析があります。発現パターンはエンドユ
ーザーにとって非常に不明瞭で、一定の結果を得るために、変数はしっかり制御されなければなりません。
さらに、これらのタイプのアッセイは、慎重な臨床的妥当性と有用性に関する研究だけでなく、技術的な
6
Clinical Chemistry
Q&A
検証も必要です。他のタイプのオーミクスアッセイは、より使いやすい出力を有しています。例えば、カ
リオグラムを作成するサイトジェノミクスアレイは、慢性リンパ性白血病を有する患者の腫瘍細胞から
DNAの染色体 13q14の検出を示します。破壊された DNAをコンピューター内のカリオグラムに変換する
複雑なアルゴリズムがありますが、データは使いやすく(染色体)、慢性リンパ性白血病の腫瘍生物学に
関する私たちの理解と一致し、少しのサニティーチェックを提供します。この方法で用いられたサイトジ
ェノミックアレイは、確率された臨床的意義、技術的検証かつ/または研究が十分になされている診断率の
変化を検出するための単なる代替手段です。
臨床病理医や研究者は臨床利用のための検証試験のために、数年の訓練を受けます。私たちはこの点にお
いて、とても高い基準をそれぞれに持っています。バイオインフォマティクスは将来的には、研究室が開
発した検査の設計、検証、実施、解釈の一部となるでしょう。ゲノムテストを実施している臨床検査室は、
その過程に密接に含まれている臨床バイオインフォマティクスと、研究検査担当者や医療ディレクターと
の密接でコンスタントな意思疎通を有する必要があります。アルゴリズムと出力は検証され、検査室が開
発したテストの一部として制御されたバージョンである必要があります。
Tina Hambuch:再現性は、データの精度にとって重要であり、私たちはバイオインフォマティックソフト
ウェアの技術的検証の再現性を評価します。これは達成することは可能ですが、仮定することはできませ
ん。
Jason H. Moore:臨床検査室は測定誤差を避けるために非常に慎重に設計されています。患者のケアは臨床
データの信頼性や精度に依存するため、それを確認するために多くの安全対策、抑制と均衡が設定されて
います 。オーミクスデータは DNA配列決定のような、ハイスループット技術の性質のため本質的に信頼
性が低いです。さらに大規模なオーミクスデータは、有用な情報を作成するために多くの処理期間を必要
とします。有用な情報は様々なバイオインフォマティクスアプリケーションや、バイオインフォマティク
ス解析方法を介して知識に変換されます。品質管理から最終的な分析と解釈までの分析パイプラインの各
ステップにおいて、意図しないエラーが生じる可能性があります。例えば、多くの機械学習方法には、そ
れぞれが結果に大きく影響する多数のセッティングがあります。結果が正しくないおよび/または、それに
続き複製が可能でないようなセッティングを誤って設定し、誤って報告しやすいです。
バイオインフォマティクス、特にコンピューターサイエンスの分野に公表された結果を作成するために、
特定のデータセットと一緒に使われるソフトウェアと正確なセッティングを提供する動きがあります。誰
でもデータとソフトウェアダウンロードし、簡単に見知を再現することが可能であるべきです。データや
方法論の共有文化の変化は遅いですが、もし私たちが公表された結果を信じるのであれば必要です。これ
7
Clinical Chemistry
Q&A
は、何故、臨床検査技師がバイオインフォマティクスと生物統計学の両方の実用的な知識を持つことが重
要であるかの、もう 1つのよい理由です。
もしバイオインフォマティクスについて、あなた自身を教育することができるたった 1 つのリソース
を持っていたら、それは何ですか?また、何故ですか?
Elizabeth Chao: バイオインフォマティクスの分野は、現在の教育リソースよりも速く進化します。そのた
め、データ分析のための新たな方法に言及しているその分野の研究者やリーダーが、主な教育リソースに
なっています。これは、地域や国家の会議に出席し、様々な大学の講演者を結びつけるだけでなく、この
分野の専門家との個人的な関係を持つことにより、直接変わります。
Jill M. Hagenkord: それは難しい質問です。彼らが 1 つのリソースによって、臨床ゲノミクスのために知る
必要があることを学ぶことができると思いません。しかし、最も良い学び方は実行することであると思い
ます。専門学会は興味を持っている会員に対し、実践的なワークショップを実施し、研修生は定期的に症
例検討会で公に入手できるゲノム例を提示すべきです。もしあなたの施設がまだゲノムアッセイを提供し
ていない場合、多くのゲノム企業やソフトウェアベンダーは、教育目的のために公的に利用可能なデータ
セットを持っています。私は、データ表現に関するアルゴリズムや、明らかな矛盾に関する疑問を明らか
にすることを手助けてくれる、とても多くの賢いバイオインフォマティシャンの近くに自分自身の身を置
くことができ、幸運でした。臨床検査技師は教育を受け、バイオインフォマティシャンと繋がるために努
力をする必要があります-そして医師やバイオインフォマティシャンがお互いに意思疎通をする方法を学
ぶ間に、患者となってユーモアの感覚を維持する必要があります。医師やバイオインフォマティシャンと
意思疎通することが、どれほどむずかしいかを示す無数の面白い話があります。
Tina Hambuch: 本当に 1つの良いリソースはありません-その分野は恐らく、変化に幅があり、タイミン
グでもあります。1つの本やウェブサイトによって行われる、総合的な訓練を必要とすることは複雑でも
あります。また、リソースと計算インフラはこの分野を学ぶために必要です。
Jason H. Moore: R統計プログラミングソフトウェアパッケージは、バイオインフォマティクスの学習にと
って理想的な焦点です。Rはオープンソースで、自由に利用可能であり、Linux、Mac、 Windows で実行さ
れます。Rの利点は主なバイオインフォマティクス分析ソフトウェアパッケージにすぐになることです。
無料ということも理由ですが、拡張可能であることも理由です。多くのバイオインフォマティクスは、誰
でもダウンロードし、すぐに使うことが出来る R内のパッケージとして、新たな方法を出しています。バ
イオコンダクターと呼ばれるパッケージに、大規模なオンラインドキュメンテーションとバイオインフォ
8
Clinical Chemistry
Q&A
マティクスツールのコレクションがあります。Rの最初の学習曲線は少しシャープです。しかし投資した
時間は、Rの理解へのドアを開く価値があります。R は今や、バイオインフォマティクスや生物統計学か
ら、あなたが得たいと思うものに対するパッケージを含んでいます。
(訳者:間下 有子)
Footnotes
6
Nonstandardabbreviations:
NGS,
nextgenerationsequencing;
HIPAA,
HealthInsurancePortabilityandAccountabilityActof1996;
IOM,
InstituteofMedicine;
ACMG,
AmericanCollegeofMedicalGenetics.
AuthorContributions:Allauthorsconfirmedtheyhavecontributedtotheintellectualcontentofthispaperandhavemetthefollowing3requirements:(a)significantcontributionstotheconceptionanddesign,acquisitionofdata,or
analysisandinterpretationofdata;(b)draftingorrevisingthearticleforintellectualcontent;and(c)finalapprovalofthepublishedarticle.
Authors'DisclosuresorPotentialConflictsofInterest:Uponmanuscriptsubmission,allauthorscompletedtheauthordisclosureform.Disclosuresand/orpotentialconflictsofinterest:
EmploymentorLeadership:E.Chao,AmbryGenetics;J.M.Hagenkord,InVitaeCorporation;T.Hambuch,Illumina.
ConsultantorAdvisoryRole:Nonedeclared.
StockOwnership:T.Hambuch,Illumina.
Honoraria:Nonedeclared.
ResearchFunding:Nonedeclared.
ExpertTestimony:Nonedeclared.
Patents:Nonedeclared.ReceivedforpublicationMay1,2013.
9
Clinical Chemistry
Q&A
AcceptedforpublicationMay9,2013.
©2013TheAmericanAssociationforClinicalChemistry
10