遺伝子の機能アノテーション

遺伝子の機能アノテーション
• 遺伝子ごとにホモロジー検索,モチーフ検索
• 比較ゲノムに基づくアプローチ
– 双方向ベストヒット
– 生物種間で保存されている領域を探索
• ゲノム上で近い双方向ベストヒット
– ロゼッタストーン
– 系統プロファイル
• その他
– 発現情報を利用:トランスクリプトーム
– タンパク質相互作用の情報を利用:プロテオーム
– 構造予測
単純なホモロジー検索では
• オーソログ遺伝子とパラログ遺伝子の区別が難しい
場合がある.
• データベース中に間違ってアノテートされた遺伝子
がある場合があり,それにヒットしてしまう.
• 非常によく保存された短いモチーフにヒットしてし
まい,全体的に似ている遺伝子が取れない場合があ
る.
• 機能未知遺伝子とホモロジーがあっても,うれしく
ない.
オーソログとパラログ
• オーソログ(Ortholog)
– 種分岐の際に同じ遺伝子だったもの
– 通常同じ機能を持つ
• パラログ(Paralog)
– 遺伝子重複によってできた類似遺伝子
– 通常異なる機能を持つ
• ゼノログ(Xenolog)
– 水平移動によって得られた類似遺伝子
パラログ遺伝子の例
• ATP Binding Cassetteトランスポーター
– 各基質ごとに遺伝子のセットを持っている
Substrates
Substrate binding proteins
Permeases
Inner membrane
ATP binding proteins
双方向ベストヒット (BBH)
ゲノムA
ゲノムB
Glutamine transporter
双方向ベストヒット
ゲノムAから見るとベストヒット
ゲノム上で並んだ BBH
• Pair of close bidirectional best hits
– Overbeek et al., Proc. Natl. Acad. Sci. USA, 96:2896 (1999)
close
ゲノムA
Glutamine
ゲノムB
ロゼッタストーン
• Marcotte, et al., Science 285:751 (1999)
• 他の生物種でフュージョンしている2つの遺
伝子は相互作用している可能性が高い
系統プロファイル
•
Pellegrini et al., Proc. Natl. Acad. Sci. USA, 96:4285 (1999)
•
オーソログ遺伝子のパターンを分類
E.coli
S.cerevisiae
B.subtilis
H.influenzae
!"#$
%
&
%
!"#'
%
%
&
!"#(
&
%
%
!"#)
!"#*
!"#+
同じパターンを持つ遺伝子は
%
&
進化的・機能的に関連がある
&
&
%
%
%
%
&
微生物ゲノム比較解析システム@基礎生物学研究所
http://mbgd.genome.ad.jp/
MBGDで作成された系統プロファイル
光合成細菌らん藻だけで
保存されている遺伝子:355
全生物種で保存されている
遺伝子:42
比較ゲノム用のデータベース
• COG: Clusters of Orthologous Groups
– http://www.ncbi.nlm.nih.gov/COG/
• MBGD: Microbial Genome Database
– http://mbgd.genome.ad.jp/
• PEDANT: Protein, Extraction, Description and Analysis
Tool
– http://pedant.gsf.de/
• SSDB: Sequence Similarity Database
– http://www.genome.jp/kegg/genes.html
SSDB
• Gene/Protein Universe
– アミノ酸配列の類似
性を全対全で計算し
た結果をデータベー
ス化
• Smith-Waterman search
• 120以上の生物種
SSDB 隣接行列表現
各クラスターにオーソログIDを割り当てる
ゲノム比較解析
クラミジアゲノムの比較
http://www.genome.jp/kegg/catalog/org_list.html から ctr を選択し
Genome map をクリックするとゲノム比較ツールへ飛ぶ
ゲノム比較によるクラスター
抽出