PhiXを使用してRun Qualityを改善する

PhiXを使用してRun Qualityを改善する
渡辺 真子
テクニカルアプリケーションサイエンティスト
© 2012 Illumina, Inc. All rights reserved.
Illumina, illuminaDx, BaseSpace, BeadArray, BeadXpress, cBot, CSPro, DASL, DesignStudio, Eco, GAIIx, Genetic Energy, Genome Analyzer, GenomeStudio, GoldenGate, HiScan, HiSeq, Infinium,
iSelect, MiSeq, Nextera, Sentrix, SeqMonitor, Solexa, TruSeq, VeraCode, the pumpkin orange color, and the Genetic Energy streaming bases design are trademarks or registered trademarks of
Illumina, Inc. All other brands and names contained herein are the property of their respective owners.
このウェビナーからは…
PhiX とは何か、イルミナが提供するPhiX はどのよう
なものか。
シーケンスの多様性とバランスを定義し、データのク
オリティーとどのように関連しているか。
低い%と高い%でのPhiX添加 (spike-in) の違いと
PhiX コントロールレーンの指定について。
塩基の多様性が低く、塩基のバランスがとれていない
サンプルについて、ランのクオリティーを改善するた
めに、PhiX をいかに利用できるか。
理解できるようになります。
2
PhiXとは?
3
PhiX DNA はランのコントロールとして使用
PhiX はバクテリオファージ。
– スモールゲノム → すぐにアライメントやエラーレートの評価ができる。
– 多様性がありランダムな配列 → 約 45% GC と 55% ATを含む。
– 明確な定義 → リファレンスゲノムがしっかりと注釈付けされている。
イルミナのPhiX コントロールライブラリーはすぐに使用できる。
– アダプターをライゲートして提供。
– 濃度は10nM (目的の濃度に希釈して使用) 。
PhiX ライブラリーは以下を提供するもの。
–
–
–
–
4
QCに使用。
クラスター形成のポジティブコントロール。
シーケンスとアライメントのコントロール。
Cross-talk またはmatrix 算出、 phasing・prephasing のコントロール。
(装置のキャリブレーション)
イルミナ PhiXライブラリー
v3 PhiX (FC-110-3001)
– インデックスなし ( “undetermined” フォルダーにリードが保存)
– 約420 bp (インサートは300 bp)
5
なぜバランスのあるランダムな
ゲノムが必要か?
6
シーケンスの多様性の定義
塩基バランスのとれていないサンプル:
GC またはAT-含量の高い配列, Methyl-seq, ChIP-seq.
多様性の低いライブラリー: 同じ配列のライブラリー
(例えば、PCR amplicons, restriction enzyme libraries, initial cycle indexing).
7
装置のキャリブレーション
Template generation: フローセル上のクラスター
の位置のマッピング。
– 2つの隣接したクラスターを区別するためにランダ
ムな配列が必要。
Matrix calculations: 各塩基からの蛍光強度の算出。
マトリックスは残りのサイクルで補正した蛍光強度
を生成するために使用される。
– 4種類の塩基が必要
Phasing/prephasing:
– Phasing はクラスターにある分子が遅れて反応すると
きに起こる。
– Prephasing はクラスターにある分子が進んで反応す
るときに起こる。
これらの算出のために、最初の12 サイクルで、
バランスがありランダムな塩基組成が必要。
以上の値は、ラン全体のクオリティーに寄与する。
8
ランのクオリティーを
改善するために
PhiXをどのように
利用できるか?
9
PhiXを使用する主な3つの方法*
低い%の添加
高い%の添加
コントロールレーンの指定
*De novo assembly またはPhiX の近縁種のシーケンスを
行う場合は、添加に関して注意して下さい。
10
低いパーセンテージでの添加, PhiX 1% 添加
塩基バランスのとれたゲノムを使用し、レーン内に
コントロールが必要な場合に利用。
アライメントのコントロールとしての役割。
– Real time analysis (RTA) ソフトウェアが、PhiX シー
ケンス25サイクル以降にリファレンスゲノムへのアラ
イメントを開始し、エラーレートを算出する。
ランのクオリティー、流路系等をモニターするのに
役立つ。
数値化のコントロール
– 1%PhiXを添加すると、1%のクラスターがPhiX とし
て検出される。
この濃度では、塩基の多様性が低く、バランスとれ
ていないサンプルへの対応はできません。
11
高いパーセンテージでの添加 *
塩基組成に偏りがあるサンプルや多様性の低いサン
プルのランのクオリティーの改善に役立つ。
– e.g. GC-rich または PCR amplicons.
高い % のPhiX 添加 で多様性が増すことは、
phasing/prephasing と matrix の補正に役立つ。
物理的にクラスターを分離するために、クラスター
密度を下げ、PhiX の添加と組み合わせる。*
– template generationに役立つ。
*添加%やクラスター密度を下げることは経験的に決定。
12
PhiX 添加によるエラーレートとアライメント
Align Lanes
デフォルトで、Real Time Analysis
(RTA) でアライメントするよう全て
のレーンが選択されている。サンプ
ルにPhiX を添加していないレーンの
チェックボックスをはずすと、RTA
はアライメントやエラーレートの計
算をそのレーンでしないことになる。
13
PhiX 添加によるエラーレートとアライメント
14
高いパーセントでのPhiX添加によるランのクオリティーの改善
イルミナでは、正確にベースコールされる確率を算出しており、データのクオ
リティー値として示しています。この値はQ scoreと呼ばれる。
Q30 とは;
– ベールコールのエラーの確率が1/1,000
– ベースコールの正確性= 99.9%
15
PhiXを用いたランのクオリティーの改善
塩基の多様性の低いサンプル、低いQ scores
塩基の多様性が低いサンプルに、高い%のPhiX 添加し、クラスター密度を下
げたもの。ランのクオリティーが改善。
16
PhiX コントロールレーンの指定
(HiSeq または GA のみ)
塩基の多様性が低く、偏りのあるライブラリーをロードしたフローセルに使用。
全レーンにわたり、指定したPhiXコントロールレーンからmatrixとphasingの
計算を適用。
塩基の多様性が低いサンプルのQ scores を大きく改善。
指定したPhiXレーンは、オーバーロードしたレーンの補正はしません。
– 推奨クラスター密度より高い。
– パスフィルターを通った割合が低い。
17
HCS でのPhiX コントロールレーンの指定
Control Lane
設定する場合は、ドロップダウンリ
ストからコントロールライブラリー
を含むフローセルのレーンを選択。
設定しない場合はNone を選択。
18
HCS でのPhiX コントロールレーンの指定
19
PhiX: FAQs
多様性の低いサンプルに対して、PhiX を1%添加しランのクオリティーを改善
できますか?
– いいえ。 1%添加はレーン内のコントロールとして使用しますが、ランのクオリ
ティーを改善する役割はありません。高い%の添加により塩基の多様性を増やし、
ランのクオリティーを改善します。
PhiX レーンが良好な場合、何か他に悪いところがあるように見えるのは?
– サンプル調製またはライブラリーの問題に起因する可能性があります。
どのようにして、使用中の装置がランを通して適切に動作をしているか確認で
きますか?
– もしレーン毎にPhiX を添加していれば、装置のパフォーマンスをレーン毎に評価す
ることができます。
1% PhiXを添加したにもかかわらず、PhiXが全リードの多くを占めるのは何を
意味するのでしょうか?
– サンプルの定量に問題があります。
PhiX の添加とPhiX コントロールレーンの指定を組み合わせた場合、何か利点
がありますか?
– もちろんあります。コントロールレーンの指定と添加は2つの異なる目的がありま
す。実験のニーズに合わせて組み合わせられます。
20
まとめ
PhiX は、ゲノムのサイズが小さく、多様性があり、良く定義されているため、
良いコントロールとして機能します。
コントロールレーンの指定;
– 塩基バランスのとれたサンプルまたはランダムな配列をもつサンプルがないとき。
– Phasing /pre-phasing の値をフローセル全体に提供するため。
高いパーセントでの添加;
– 塩基に偏りがあるサンプル(例 GC-rich)や多様性が低いサンプル(例 PCR amplicons)
で使用。
– クラスターを分離するために、クラスター密度を下げる。
低いパーセントでの添加;
– 塩基の多様性が低く、偏りのあるサンプルの補正には使用できません
– アライメントのコントロールやレーン毎のサンプルのQCとして使用。
適切にPhiX を使用することで、利用できるデータとそうではないデータの
違いを示すことができます。
21
参考情報
PhiX TechNote:
– http://www.illumina.com/documents/product
s/technotes/technote_phixcontrolv3.pdf
Illumina homepage
– http://www.illumina.com/
Sequencing Support
– http://support.illumina.com/sequencing.ilmn
22
ご清聴ありがとうございました。
ご質問は[email protected]でも承ります。
23