GenomeStudioTM データ解析ソフトウェア

ILLUMINA® SYSTEMS AND SOFTWARE
GenomeStudio
TM
データ解析ソフトウェア
イルミナは幅広い遺伝解析アッセイをサポートするための包括的なデータ解析ツールを開発し
ました。このソフトウェアで、イルミナの3つのプラットフォームから得られるデータの視覚
化および解析が行えます。
はじめに
イルミナは革新的で強力な遺伝解析
アッセイを幅広く開発しご提供して
います。また実験に必要な製品だけ
でなくデータ解析の必要性も重視
Figure1:全てのイルミナプラットフォームから得られるゲノムデータの統合解析がで
きるGenomeStudioソフトウェア
Genome Analyzer
iScan System
BeadXpress Reader
し、GenomeStudioソフトウェアを開
発いたしました。イルミナの3つのプ
ラットフォームである次世代シーケ
ンサーGenome Analyzer、BeadArray™
製品を読み取るiScan™ システム、そ
シーケンス
データ
してVeraCode® テクノロジーを採用
BeadArray
データ
VeraCode
データ
したBeadXpress ® リーダーは、この
GenomeStudioソフトウェアをゲノム
データの共通の一次解析ツールとし
て使用します。GenomeStudioソフト
GenomeStudioソフトウェアの特長
• 幅広いツール:Genome Analyzer、
iScanシステム、BeadArrayリーダ
ーから得られるデータを解析
• 統合解析:同じプロジェクト内で複
数アッセイからのデータを統合化
• 洗練されたプラットフォーム:幅広
いアプリケーションに対応した高性
能アルゴリズムおよび統計計算
• オープンアーキテクチャー:2次、3
次解析のためにプラグインおよび
APIを用いたデータエクスポート
DS
RS
RS
ChIP
シーケ
ンス解
析
(Figure.1)。
CS
ノ
ジェ
のモジュールをご提供しています
タン
パク
質解
析
グ
ン
リ
イ
ァ
び フ
よ ロ
お プ
現 A
発 N
R
子 ロ
伝 ク
グ
遺 イ
ピン
マ
タイ
ンごとに適した解析を可能にする7つ
析
解
A ンス
N
D ーケ
シ
RN
シ A
ー
ケ
ン
ス
解
析
できるように統一したフレームワー
クを構成し、さらにアプリケーショ
リング
DNAメチル化プロファイ
ウェアでは、共通の解析タスクが
GT
PT
GX
M
GenomeStudioソフトウェアはイルミナプラットフォーム(上)から得られるデータ解析をサポー
トする、複数のモジュール(下)から構成されています。異なるモジュールからのデータも一つの
プロジェクトに統合することができます(矢印部分)。
ILLUMINA® SYSTEMS AND SOFTWARE
統合されたフレームワーク
データの視覚化
コントロールダッシュボード
GenomeStudioソフトウェアはイル
ゲノムワイドに大まかな傾向を知り
イルミナのアレイを用いたアッセイ
ミナアッセイを用いたデータのため
たい場合は、IGV (Illumina Genome
(InfiniumおよびGoldenGate® ジェ
に、優れた視覚化と直感的な解析を
Viewer)を使います。また、シーケン
ノタイピング、メチル化プロファイ
可能にしました。GenomeStudioソ
スあるいはアレイデータを用いた染
リング、Direct
フトウェアは、複数のアッセイに対
色体や領域ごとの傾向はICB (Illumina
クロRNA発現プロファイリング)
応したモジュールから構成されてい
Chromosome Browser)により表示す
にはサンプル依存性および非依存性
Hyb、DASL®、マイ
る統合プラットフォームです。共通
ることができます。ICBを使い、構造
の内部コントロールを有しており、
のフレームワークではコントロール
変異や遺伝子発現レベル、タンパク
データのクォリティを確認すること
のための直感的なユーザーインター
結合部位、プロモーター領域のCpG
ができます。これらのコントロール
フェースとデータ視覚化機能、そし
メチル化などを同定できます。シー
はGenomeStudioソフトウェアのコ
て各モジュールから得られるデータ
ケンスデータを用いた高解像な解析
ントロールダッシュボードにて表示
解析結果の表示を行います。イルミ
にはISV (Illumiina Sequence Viewer)
されます。
ナアッセイから産出される大量の
を使って1塩基レベルまで拡大
データを理解するには、様々な角度
し、S N P や C p G 座 位 、 ス プ ラ イ ス
からの解析と、全ゲノム網羅的から
ジャンクション、cSNPなどを正確に
の視点と領域に特化する詳細な情報
同 定 す る こ と が で き ま す 。 サンプ
の統合が必要です。GenomeStudio
ル、マーカー、そして異なるアッセイ
フレームワークではゲノムワイドな
間における傾向を見つけために、
データを高解像度に効率よく解析で
GenomeStudioソフトウェアは様々
きるように結果を表示することがで
な視覚的なプロットとツールを提供
きます。
しています(Table 1)。折れ線グラフ、
プロジェクトの作成
GenomeStudioソフトウェアは新規
プロジェクトの作成が容易にでき、
直感的なウィザードを使って入力す
るデータの場所を指定することがで
きます。プロジェクトを作成する
と、各実験タイプに関連する全ての
データを表示させ、視覚化することが
できます。Infinium® LIMS、サンプル
トラッキングおよびロボットによ
る自動化コントロールをお使いの
場合は、Infiniumジェノタイピング
アッセイ用のプロジェクト管理と
これらのサンプルトラッキングを
GenomeStudioソフトウェアで統合
することが可能です。こうしたシス
テムと指定されたイルミナワークフ
ローにより、さらなる高スループッ
トが実現されるのです。
アプリケーションに特化した解析モ
ジュール
GenomeStudioモジュールは、幅
広いイルミナアッセイおよびアプリ
ケーションに対応しています。ソフ
トウェアにモジュールを組み込むこ
とでアッセイに対応した強力な解析
を行い、また必要であればモジュー
ヒストグラム、散布図、円グラフ、
頻度プロット、ヒートマップなどか
TABLE 1: 視覚化される解析結果
らこうした視覚化データを選択する
全体像の可視化
ことができ、遺伝子、タンパク発現
IGV (Illumina Genome Viewer)
レベルやメチル化レベルを同定する
ICB (Illumina Chromosome Browser)
ための異なる実験条件から得られた
ISV (Illumina Sequencing Viewer)
サンプルを容易に比較することがで
GRAPHS
きます。
視覚的なツールを用いて大まかな傾
樹状図およびクラスター解析
ヒートマップ
散布図
向や特定領域を見つけた後は、個々
ヒストグラム
のデータポイントを観察することが
折れ線グラフ
必須です。GenomeStudioソフトウェ
箱型図
アではSNPジェノタイプ、スプライ
頻度プロット
スジャンクション、遺伝子あるいは
円グラフ
エクソン発現レベル、CpG座位メチ
表
ル化状態、タンパク結合部位の状態
サンプル表
の各ポイントを理解するために表で
シーケンスあるいはレーン表
データを確認することができます。
SNP表
これらの表は並べ替えを行うことが
でき、データを非表示、再表示する
ことも可能です。また、下流解析の
ために表のデータをエクスポートす
ることもできます。
アリル表
プローブ表
遺伝子、エクソン、ジャンクション表
その他アッセイ結果表
ILLUMINA® SYSTEMS AND SOFTWARE
ルごとにアプリケーションの更新を
行うことができます。GenomeStudio
モジュールはDNAシーケンス、クロ
FIGURE 2: アラインされたリードからのSNP同定。DNAシーケンスモジュールにて
表示
マチン免疫沈降シーケンス(ChIPSeq)、mRNAシーケンスといったシー
ケンスデータに対応したものから、マ
イクロアレイから得られるジェノタイ
ピング、遺伝子発現、メチル化、免疫
タンパクアッセイなど、多様なイルミ
ナのアプリケーションをサポートして
います。
DNAシーケンスモジュール(DS)
Genome AnalyzerとPipelineソフトウェ
アから得られたDNAシーケンスデー
タを解析し、SNPや染色体ブレイク
ポイント領域の探索および同定を行
います。視覚化ツールではゲノムに
マップされたコンセンサスなリード
を表示し、文字色を変えてSNPを表
示します(Figure 2)。新規に発見し
たSNPは、カスタムのiSelect® ジェ
ノタイピングアレイデザインに反映
させることができます。
ChIPシーケンスモジュール(CS)
イルミナGenome Analyzerを用
いた 全 ゲ ノ ム ク ロ マ チ ン 免 疫 沈 降
シーケンスから得られたデータを元
に、GenomeStudio ChIPシーケンスモ
ジュールで網羅的なDNA関連タンパ
ク結合部位マップを表示することが
できます。異なる実験グループ間の
結合レベルは、表あるいはICVで塩基
配列、領域、ピークの比較できます。
RNAシーケンスモジュール(RS)
Genome AnalyzerおよびPipelineソフ
トウェアから得られるmRNAシーケ
ンスのデータはGenomeStudio RNA
シーケンスモジュールで視覚化し、発
現レベルと多型探索を行います。この
モジュールでは、Genome Analyzer
Pipelineソフトウェアからのデータを
集め、デジタル遺伝子発現プロファ
イリングとしてある特定エクソン、遺
シーケンスリードをアライン(黄色と紫のブロック)
し、ICBにてリファレンスゲノムに重ね
ます。同定されたSNPは赤文字で表示され、SNPデータ記録されます。リファレンスゲノ
ムにアラインされたリードに、SNPコールされた位置を示す定規と共に、同定された2つ
のSNPが表示されています。
伝子、スプライスジャンクション内に
リティは内部コントロールおよび
マップするリードの頻度をカウント
QC機能により迅速に確認できま
します。データはGenomeStudioソ
す。各SNPはGenoPlotで表示し、必
フトウェアで表あるいはプロットと
要であれば修正することも可能です
して視覚化されます(Figure 3)。IGV
(Figure 4)。ジェノタイプ統計およ
では、既知のシーケンスおよびスプ
び結果のサマリーは自動的にリポー
ライスジャンクションにアラインす
トされ、下流解析のための他の解析
ることでトランスクリプトームにお
ソフトウェアにエクスポートするこ
けるコンセンサスリードを表示しま
とができます。
す。cSNPやスプライス多型は、ICB
構造多型の解析は、ジェノタイピン
により1塩基解像度での確認および
グ用のマーカーと強度のみを使うプ
同定が可能です。
ジェノタイピングモジュール(GT)
BeadArrayリーダー、iScanシステ
ム、あるいはBeadXpressリーダーか
らのGoldenGateおよびInfiniumジェ
ノタイピングアッセイを用いたデー
タは、GenomeStudioジェノタイピン
グモジュールで解析します。生デー
タ補正やクラスタリング、ジェノタ
イプコールなどの一次解析はジェノ
タイピングモジュールのアルゴリズ
ムを用いて行われます。データクォ
ローブを使い、ヘテロ接合性の消失
(LOH)やコピー数異常多型(CNV)
の計算をおこなうアルゴリズムを用
いて同定します。同定された構造多
型はブックマーク(自動ブックマー
ク機能を利用)することができ、ICB
やIGVを用いて染色体全体にわたって
観察することができます。またIGV
で、CNV 値やlog R比、Bアリル頻度
および複数のサンプルのブックマー
クを表示するデータプロットも作成
することができます。
ILLUMINA® SYSTEMS AND SOFTWARE
タンパク解析モジュール(PT)
FIGURE 3: RNAシーケンスアリル表
VeraCodeビーズを用いたカルボキシ
ル基のデータはBeadXpressリーダー
で読み取りを行い、タンパク解析モ
ジュールを用いて解析します。標準
曲線あるいはサンプル間のタンパ ク
発現差から検体の濃度を決定するこ
とができます。mRNAの発現レベル
と比較することも場合によっては可
能です。折れ線グラフ、ヒストグラム、
樹状図、頻度プロット、円グラフ、箱型
プロット、ヒートマップ、散布図 、
表、遺伝子クラスター樹状図などに
より、結果を表示します。
複数のアプリケーションを支える
統合解析
複雑な遺伝多型解析を行うために、
フローセルから得られる1億3000万リード以上のシーケンス情報はRNAシーケンス
(左)のシー
ケンス表によりリアルタイムに視覚化することができます。cSNPとコールされた塩基はアリル
表(右)にて個々に確認できます。
研究者のみなさまはイルミナの多様
なアッセイおよびプラットフォーム
をお使いいただくことができま
す。GenomeStudioソフトウェアは
遺伝子発現モジュール(GX)
メチル化モジュール(M)
BeadArrayリーダー、iScanシステ
BeadArrayリーダー、iScanシステ
ム、BeadXpressリーダーから得られる
ム、BeadXpressリーダーで得られる
Hyb、DASL、全ゲノムDASL、
マイクロアレイDNAメチル化データ
マイクロRNAプロファイリングの
は、メチル化モジュールで解析しま
Direct
データは遺伝子発現モジュールを用
す。このモジュールはメチル化の度
いて解析します。このモジュールで
合い(β値)を計算し、実験グルー
は連続性のあるデータから遺伝子レ
プ間のメチル化レベルを解析しま
ベルの統計解析ツールを用いて意味
す。CpGアイランドのメチル化状態
のある結果を導きます。発現差解析
はIGVおよびICBを使い、ゲノム全域
には折れ線グラフやヒストグラム、
にわたって視覚化されます。1塩基
樹状図、箱型プロット、ヒートマッ
の解像度をもつ結果は折れ線グラ
プ、散布図、頻度プロット、円グラ
フ、散布図、頻度プロット、円グラ
フ、表、遺伝子クラスター樹状図など
フ、ヒストグラム、樹状図、箱型プ
の様々なツールを使い視覚化します。
ロット、ヒートマップなどを用いて
また、GenomeStudioソフトウェアに
表示します。またメチル化データは
はサンプルやグループ、グループセッ
GenomeStudioプロジェクト内で遺伝
ト、そして関連プロジェクト解析など
子発現プロファイリングデータと統
系統的にまとめられるシンプルなデー
合することができ、メチル化サイト
タ管理ツールがあります。
(β値)と遺伝子発現差(p値)の相
関を解析することができます。
強力な統合解析をサポートし、最小
限のデータ調整により作成したプロ
ジェクト内で様々なアッセイタイプ
FIGURE 4: ジェノタイピングモジュ
ールGENOPLOT
GenomeStudioジェノタイピングモジュー
ルで表示するGenoPlotです。データはジ
ェノタイピングコールに基づき、色づけさ
れています(赤はAA、緑はAB、青はBB)。
あるSNPにおけるジェノタイプは、標準ク
ラスターの位置と相対的して、シグナル強度
(Norm R, Y軸)あるいはアリル頻度(Norm
Theta、X軸)を元にサンプル(データポイン
ト)
ごとにコールされます。
ILLUMINA® SYSTEMS AND SOFTWARE
ムを使います。ジェノタイプコー
FIGURE 5: 遺伝子発現モジュール ヒートマップ
ル、CNV同定、シーケンスリード
のアライメント、エクソンおよび
スプライスジャンクションのカウ
ント、SNPコールなどのツールは
GenCall、GenTrain、cnvPartition、
ELAND、CASAVAといったアルゴリ
ズムを用いて解析します。
GenCall
BeadCh ipからの2色シグナル強度
から得られるマーカーのジェノタ
イプコールは、標準的なジェノタ
イプクラスターを比較することで
行われます。Infinium BeadChipアッ
セイからの数十万におよぶコール
は、GenomeStudioソフトウェア上
でGenCallアルゴリズムを用いて迅速
遺伝子発現モジュールのヒートマップを使うことで大きなデータセットの視覚化および解
析を簡易化します。このヒートマップ樹状図はターゲットIDと発現差値から構成されてい
ます。
から得られたデータをまとめること
洗練されたアルゴリズム
ができます。例えば、メチル化およ
GenomeStudioソフトウェアは、
び遺伝子発現アッセイのデータは
イルミナのアッセイ全てを解析す
GenomeStudio遺伝子発現モジュー
る分子生物学インフォマティクス
ルプロジェクトの表でまとめて統計
プラットフォームです。一次解析は
処理を表示させ、統合したグラフを
GenomeStudioソフトウェアあるい
作成できます。
は上流のGenome Analyzer Pipeline
ソフトウェアの複数のアルゴリズ
かつ再現性よく視覚化されます。必
要であれば、クラスターの位置同定
もGenTrainアルゴリズムを用いて行
うことができます。
cnvPartition
cnvPartitionはイルミナBeadChip
ジェノタイピングアレイデータ(シ
グナル強度およびジェノタイプコー
ル)からコピー数の変化領域を同定
し、信頼値とともにコピー数を計算
します。CNV領域におけるコピー数
TABLE 2: GenomeStudioシステム最低仕様
パラメーター
CPU速度
プロセッサー
メモリー
シーケンスデータ
マイクロアレイデータ
マイクロアレイ
およびシーケンスデータ
Intel Pentium 2.0 GHz 以上
Intel Celeron Duo 以上
Intel Celeron Duo 以上
32-bit or 64-bit
64-bit*
64-bit
2 GB 以上
4 GB 以上
4 GB 以上
ハードドライブ
250 GB 以上
100 GB 以上
250 GB 以上
モニター表示
1,280 × 1,024
1,280 × 1,024
1,280 × 1,024
オペレーティング
システム
Windows XP SP2 あるいは Vista
Windows XP SP2 あるいは Vista
Windows XP SP2 あるいは Vista
Specific OS
Requirements
Microsoft .NET Framework 3.5
Microsoft .NET Framework 3.5
Microsoft .NET Framework 3.5
1 GbE 以上
1 GbE 以上
1 GbE 以上
ネットワーク
*GX および Mのデータ解析は32-bitシステムで解析可能です。
ILLUMINA® SYSTEMS AND SOFTWARE
の値はGenomeStudioソフトウェア
まとめ
REFERENCES
内でブックマークとして記録され、
GenomeStudioソフトウェアはイル
(1)
http://www.illumina.com/illuminaconnect
(2)
http://www.illumina.com/productguide
全ゲノムにわたる染色体変異領域を
ミナアッセイのデータ解析のために
視覚化することができます。
ELAND and CASAVA
Genome Analyzer Pipelineソフトウェ
アからの出力データはGenomeStudio
モジュールで視覚化できます。シ ン
グルあるいはペアエンド法による
シーケンスリードのゲノムへのアライ
メントはELANDを使って行います。
CASAVAソフトウェアはリードをゲノ
ムにアライメントした後に、SNPアリ
ルコール、エクソン、遺伝子、スプラ
イスジャンクションのカウントなどの
解析を行うために使います。
オープンアーキテクチャー
GenomeStudioソフトウェアは柔軟
なオープンアーキテクチャーを提
供しており、下流解析に使うその
他のデータ解析ツールへのシンプ
ルな統合を可能にしています。API
(Application Programming Interface)
により、GenomeStudioソフトウェア
が解析ワークフローのコアとなるよう
に設計されています。GenomeStudio
ソフトウェアは各モジュールのAPI
を提供しており、研究者がプラグ
インを使ってGenomeStudioソフ
トウェアからデータをエクスポー
トし、下流解析ツールにつなげる
ことが可能となっています。ま
た、illumina・Connectというその他
のデータ解析ツールとのパートナー
シッププログラムでは、このオープ
ンアーキテクチャーを最大限に生か
せるよう、ソフトウェア関連会社と
オープンソースコミュニティと協力
しています。このプログラムにより
様々なillumina・Connectパートナー
と複数のカスタムリポートおよびプ
ラグインが生まれています。1.
開発され、多様性および統合性に富
むプラットフォームを提供していま
す。シーケンス、ジェノタイピン
グ、遺伝子発現などの実験を行って
いる研究者のみなさまは、この強力
なソフトウェアをお使いいただけま
す。アッセイに対応したモジュール
から得られる一次解析データの視覚
化は、全ゲノム多型の詳細かつ高レ
ベルな表示を可能にしました。ま
た、統合解析は異なるモジュールか
ら得られるデータをひとつのプロジ
ェクトとして取りまとめることがで
きます。
ILLUMINA® SYSTEMS AND SOFTWARE
製品情報
各システムには、アプリケーション
に対応したGenomeStudioモジュー
ルが付属しています。追加ライセン
スは別途ご購入いただくことが可能
です。2.
製品名
GenomeStudio シーケンスセット
(DS, RS, CS モジュール)
ライセンス数
カタログ番号
1
SW-820-1001
5
SW-820-5001
エンタープライズ
SW-820-2001
1
SW-600-1001
5
SW-600-5001
1
SW-500-1001
5
SW-500-5001
1
SW-700-1001
5
SW-700-5001
1
SW-810-1001
5
SW-810-5001
エンタープライズ
SW-810-2001
1
SW-100-1001
5
SW-100-5001
1
SW-200-1001
5
SW-200-5001
1
SW-300-1001
5
SW-300-5001
5
SW-400-6001
1
SW-810-1001
5
SW-810-5001
エンタープライズ
SW-810-2001
GenomeStudio DNAシーケンスモジュール
GenomeStudio ChIPシーケンスモジュール
GenomeStudio RNAシーケンスモジュール
GenomeStudio マイクロアレイセット
(GT, GX, M モジュール含む)
GenomeStudio ジェノタイピングモジュール
GenomeStudio 遺伝子発現モジュール
GenomeStudio メチル化モジュール
GenomeStudio タンパク解析モジュール
GenomeStudio Software 統合システムセット(全てのモジュール)
ILLUMINA® SYSTEMS AND SOFTWARE
イルミナ株式会社
103-0025
〒108-0014
東京都港区芝
5-36-7 三田ベルジュビル
22階 5F
東京都中央区日本橋茅場町
2-13-13 共同ビル
代理店
Tel
(03) 4578-2800 Fax
Tel (03)4578-2800
Fax (03)4578-2810
(03)4578-2810
www.illuminakk.co.jp
www.illuminakk.co.jp
本製品の使用目的は研究に限定されます。
© 2009 Illumina, Inc. All rights reserved.
Illumina、Solexa、Making Sense Out of Life、Oligator、Sentrix、GoldenGate、DASL、BeadArray、Array of Arrays、Infinium、BeadXpress、VeraCode、IntelliHyb、iSelect、CSPro、
iScan、GenomeStudio は Illumina の登録商標または商標です。本書に記載されたその他の商標および名称の所有権はそれぞれの所有者に帰属します。
Pub. No. 970-2008-J022 08MAY09