X線溶液散乱法によるタンパク質の立体構造解析

2009.6.23
X線溶液散乱法によるタンパク質の立体構造解析
東京薬科大学生命科学部
小島正樹
タンパク質のかたちとくすり
EGF受容体と
ゲフィチニブ(イレッサ)�
アルツハイマー病の原因物質である
アミロイド線維�
HIVプロテアーゼと
阻害剤インジナビル
リゾチームとN-アセチルグルコサミン
(細菌の細胞壁構成物質)�
本日の話題
• 
• 
• 
• 
• 
• 
• 
X線溶液散乱法(SAXS)の概要
SAXSデータからタンパク質の立体構造を決める
NMRとSAXSの構造情報の違い
SAXSモデルの精度を上げる(トレース問題)
WAXSデータと二次構造との相関
SAXS法の創薬への応用
SAXS法の食品化学への応用
タンパク質の立体構造決定法
•  X線結晶構造解析
結晶化が必要
•  NMR(核磁気共鳴)分光法
分子量の上限
安定同位体標識が必要
シグナルの帰属が必要
X線溶液散乱
(X線小角散乱;SAXS)
•  対象が溶液であることを除いて結晶解析と同一の測
定原理に基づく
•  実測できる散乱角が小さいため,分子の全体的な構
造やその変化を反映(低分解能)
•  溶液中における分子の位置や配向のランダム性によ
り,構造情報の多くが相殺されてしまう(低情報量)
•  測定が比較的迅速かつ簡便
•  測定条件の自由な設定が可能
変性タンパクやアミロイド線維の構造解析
SAXSの光学系と散乱データ
Sample in
cuvette
2θ
X-ray
camera length
CCD-based
detector
(1 − 2 m)
h =4πsinθ/λ
(2θ:散乱角,λ:X線の波長)
I(h): hにおける散乱強度
I (h)
1
0.5
0
0
0.1
h ( A-1)
0.2
0.3
放射光実験施設(つくば)
SAXSデータからタンパク質に関する
どのような情報が得られるか?
•  タンパク質分子の全体的構造およびその変化
例.分子の形や大きさ
サブユニットの解離,会合
アロステリックな構造変化
変性やフォールディング
結晶構造との差異
•  溶液中における低分解能の立体構造
ab initioモデリング
SAXSデータの解析1‐Guinierプロット(lnI(h) vs. h2)
10
1.4 mg/ml
ln I(h)
8
6
4
Rg:慣性半径
I(0) :原点散乱強度
I(0) ∝ ∑c M2
解離により減少、会合により増加
2
0
Rg h < 1.3 において
I (h) =I(0) exp(-Rg2h2/3)
が成り立つ
→RgおよびI(0)が求まる
0
0.0005
0.001
0.0015
2
-2
h (A )
0.002
→分子の大きさや解離・会合状態がわかる
SAXSデータの解析2‐Kratkyプロット(I(h)h2 vs. h)
3
I(h) h
2
1.4 mg/ml
2
球状 (folded):
Peak at h=√3/Rg
コイル状 (unfolded):
単調に増加
Rg = 50.3 Å
1
0
0
0.05
0.1 -1
h (A )
0.15
0.2
→タンパク質の変性やフォールディングの解析に利用
ex. モルテングロビュール状態の同定
SAXSデータの解析3‐p(r)関数(I(h)のフーリエ変換)
0.7 mg/ml
4
p (r)
分子内の原子間距離の分布
2
Dmax=141Å
0
0
50
r (A)
100
150
→Dmax (分子の最大長)と慣性半径(Guinierプロットとは独
立)がわかる
SAXSデータの解析4ー結晶構造との差異
例)GroESに存在する穴は,溶液中ではより大きくなる
Timchenko et al., FEBS Lett. 471 (2000)
結晶構造から散乱強度を計算
↓
実測SAXSデータと比較
↓
モデルを修正
酸性プロテアーゼのpH変性の解析
Biochemistry 39, 1364 (2000)
Biochem. Biophys. Res. Commun. 301, 745 (2003)
パーキンソン病とα-synucleinの凝集・線維化
最近、中間体が毒性の正体であると考えられ始めた
例)アルツハイマー病 Berman et al., Nat. Neurosci. 11, 547 (2008)
→中間体の詳細な立体構造の解明が必要
α-synucleinの線維化の解析
Biochem. Biophys. Res. Commun 355, 398 (2007)
Biochem. Biophys. Res. Commun 369, 910 (2008)
SAXS、CD、電顕を併用
→時系列データをSVD(特異値分解)法により解析
1.  反応開始後19時間までは線維は形成されない
2. 反応開始後120時間までには、計5種類の分子種が存在
3. 反応開始後18時間までは2状態のみ(NとI)
2状態遷移として解析したところ、
3-1. Nは単量体、I は7量体
3-2. Nは完全なランダムコイルではない
3-3. 半減期5.6 hで遷移
→中間体の結晶構造解析を準備中
→家族性パーキンソン病に見出された変異体の線維化解析
SAXSにおける最近の発展
•  装置や検出器の改良により,良質かつ広角領域
の散乱データが測定可能になった
Hirai et al., Biochemistry 43, 9036 (2004)
•  ab initioモデリング法の開発により,SAXSデー
タのみから低分解能の立体構造を構築できるよ
うになった
SAXSデータからタンパク質の立体構造が
どこまで決められるか?
ab initioモデリング法を用いてビーズ・モデルの構造を
求めるのであれば,現在既に可能.
FKBP
NMR
(PDB code 1IX5)
SAXS→ab initioモデリング
ab initio モデリング(DAMMIN)
h
log(I(h))
log(I(h))
log(I(h))
Svergun et al., Biophys. J. 76, 2879 (1999)
h
h
分子をビーズ(小球)の集合で近似する.
ビーズの数や位置をランダムに変えながら,実測散乱曲線を満たすモデルを求める
ab initio モデリング(GASBOR)
h
log(I(h))
log(I(h))
log(I(h))
Svergun et al., Biophys. J. 80, 2946 (2001)
h
h
分子をビーズ(小球)の集合で近似する.
各ビーズは仮想残基の役割を果すため,ビーズの総数は不変で,かつ少なくとも
1つのビーズから3.8A以内の位置に動かす
SAXS(溶液中)と結晶の構造比較
F1-ATPaseの例
ab initioモデルはDAMMINにより計算
結晶構造は主鎖のみ表示
(side view)
(upper view)
低情報量にも関わらず,何故SAXSデータか
ら立体構造がうまく復元できるのか?
SAXSデータは,通常考えられているよりも多くの構造
情報を含んでいるらしい.
タンパク質の立体構造は,従来考えられるよりも少ない
情報によって規定されているのではないか?
タンパク質の立体構造決定
アミノ酸配列(N個の原子)
立体構造を規定する情報
フォールディング理論
実験データ(少数の情報)
↑SAXS?
立体構造を記述する情報
(3N個)
実験データ
(結晶構造解析,NMR)
立体構造決定のアルゴリズム
Intensity
1
0.5
0
0
0.1
h ( A-1)
0.2
0.3
このタンパク質は、溶液中と結晶中とで立体構造が異なる
→実測データに合うように、モデル構造を修正する
どの向きに動かすかが重要!(恣意性を排除)
←拘束条件付き分子動力学法
拘束条件付き分子動力学法
モデルから計算した散乱曲線と,実測SAXSデータとのずれ
を拘束条件として,実測データを満たす立体構造を求める.
SAXSの拘束エネルギー
拘束エネルギー
温度
各原子に「拘束力」を及ぼすこ
とにより,モデル構造を実測
データを満たす方向に動かし
ていく
初期構造
目的構造
SAXS_MDプログラム
SAXSデータを拘束条件とする J. Appl. Cryst. 37, 103 (2004)
cf. 結晶回折データを拘束条件とする→X-PLOR、CNS
NMRデータを拘束条件とする→DYANA、CNS
SaxsMDViewによる拘束力場の可視化
J. Synchrotron. Rad. 15, 535 (2008)
原子を球で,各原子に働く拘束力を赤い線で表す.
この向きに各原子を動かすと,SAXSパターンが実測データに近付いて行く.
SAXS_MDによる構造最適化(300K, 1000 steps)
拘束エネルギーとR-factorの経時変化
white; crystal
(initial)
cyan; calculated with SAXS constraints
(final)
RMS error between both
structures
= 2.84 Å
二次構造は変らず、分子全体が若干膨らんだ構造
タンパク質の立体構造を決定するには、どの種の情報が
どの程度必要か?
立体構造の本質的な部分は、一般に考えられるよりも少ない情報でほぼ決
まってしまう(らしい)
アミノ酸配列(N個の原子)
立体構造を規定する情報
立体構造を記述する情報(3N個)
現在の構造解析法
NMRとSAXS(X線溶液散乱)を組合わせた構造解析により、「立体構
造を規定する情報」の正体を明らかにする
NMRとSAXSがもたらす構造情報の違い
SAXS
NMR
localな距離情報
蛋白質分子�
globalな構造情報
NMR法による蛋白質の立体構造決定
NMRデータ(NOE,二面角)
RNase T1 (1YII)
距離情報(原子間距離)�
初期構造
(ランダムコイル)
拘束条件付き
分子動力学法
立体構造
Biol. Chem. 384, 1173 (2003)
計算方法
SAXSデータ�
NMRの距離情報�
編集(一部抽出,削除)�
SAXS_MD (ver.2.0)�
SAXSの拘束エネルギー�
NMRの拘束エネルギー�
EMBOSS (ver.2.0)�
拘束条件付き�
分子動力学法�
初期構造を変えて複数回実行�
立体構造�
複数個の構造の重ね合せで表示�
構造間のRMSD計算�
SAXS構造情報の加算性・冗長性
距離情報
アンサンブル内�
の�
RMSD平均(Å)�
Rgの平均(Å)�
NMR�
NMR + SAXS�
2.12�
1.96�
11.9�
11.9�
→ SAXSの情報を加えると,アンサンブル内での重なりが良く なる�
NMR距離情報の冗長性
距離情報
NMR距離情報の30%を�
ランダムに削除
NMR距離情報の40%を�
ランダムに削除
元のNMR構造�
との�
RMSD(Å)�
1.90�
2.71�
Rgの平均(Å)�
12.0�
12.0�
→ NMR構造情報の一部を意図的に削除しても、元の
構造と顕著な違いなし(NMR情報の冗長性)�
NMR距離情報の冗長性
距離情報
元のNMR構造�
との�
RMSD(Å)�
Rgの平均(Å)�
NMR距離情報の50%を�
ランダムに削除
NMR距離情報の60%を�
ランダムに削除
2.48�
3.21�
12.1�
12.3�
NMR構造情報の60%を削除すると,構造上明らかに有意な差が
現れた→SAXSデータにより相補されるか検討�
NMRとSAXSの構造情報の相補性
距離情報
平均構造の比較�
NMR情報の60%をランダムに削除 +
NMR情報を60%削除したもの(緑)と�
SAXS情報
上記にSAXSを加えたもの(橙)�
RMSD(Å)�
3.07�
1.16�
Rgの平均(Å)�
12.2�
-�
→失われたNMR構造情報を、SAXSが相補するかどうか確認�
NMRとSAXSの構造情報の相補性
距離情報
平均構造の比較�
100%NMR情報 (青)と�
40%NMR情報+SAXS情報(橙)�
RMSD(Å)�
2.05�
平均構造の比較�
100%NMR情報+SAXS情報(赤)と�
40%NMR情報+SAXS情報(橙)�
1.98�
→SAXS情報を追加しても構造は元に戻らなかった.�
→特定のNMR構造情報を削除して再度解析�
二次構造情報とSAXS構造情報の相補性
距離情報
NMR距離情報から二次構造に�
関するもの(50%)を削除
左記にSAXS構造情報を追加
アンサンブル内�
のRMSD平均(Å)�
7.94�
9.56�
Rg平均(Å)�
12.4�
12.5�
→SAXS構造情報は,二次構造情報を相補しなかった.�
三次構造情報とSAXS構造情報の相補性
距離情報
NMR距離情報から三次構造に�
関するもの(85%)を削除
左記にSAXS構造情報を追加
アンサンブル内�
RMSD平均(Å)�
8.27�
6.42�
Rg平均(Å)�
13.0�
13.0�
三次構造情報とSAXS構造情報の相補性
距離情報
平均構造の比較�
元のNMR構造(青)と�
三次構造情報削除+SAXS情報
(橙)�
平均構造の比較�
三次構造情報削除(緑)と�
三次構造情報削除+SAXS情報(橙)�
RMSD(Å)�
4.02�
3.62�
→SAXS情報を加えると構造が大きく回復する�
→SAXS構造情報は,三次構造情報をある程度相補する�
NMRとSAXS情報の加算性,冗長性,相補性
NMR
三次構造
SAXS
二次構造
構造決定に本質的な情報
コンパクト性
二次構造 + 分子全体の大きさ・形状 → 立体構造 ?
SAXSによる拘束力の場
(stereo view)
全体が協調的に働く
NMRによる拘束力の場
(stereo view)
局所的に非常に大きな力が働く
構造に僅かな歪みがあると、これを是正する
→ローカルな構造を正確に決定する際に不可欠
二次構造 + 分子全体の大きさ・形状 → 立体構造 ?
+ local geometry
NMR
三次構造
SAXS
二次構造
構造決定に本質的な情報
コンパクト性
+ local geometry
SAXSの構造精度を上げる
ビーズモデルのトレース
ab initioモデルにおける各ビーズを一次構造上のアミノ
酸残基に対応付ける
ビーズを「頂点」,近接ビーズ間を「辺」で結んで「グラフ」を作成
全ての頂点をちょうど1回だけ通る経路を見つける問題
Hamilton路探索問題
(グラフ理論)
TraceBeadsプログラム
ビーズモデル
近接ビーズの判定基準
Cαモデル;3.9 A
重心モデル;隣接ビーズの最大値
ビーズを「頂点」,近接ビーズ間を「辺」とする「グラフ」を作成(MakeEdge)
全ての頂点をちょうど1回だけ通る経路を探索(Hamilton-path)
最初に既知の立体構造データベースより、異なったフォールドを有するタン
パク質を70種類選んで解析
Fold
Superfamily
Families
Globin-like
Globin-like
Globins
Globin-like
Globin-like
Globins
OB-fold
Staphylococcal nuclease
Staphylococcal nuclease
Trypsin-like serine proteases
Trypsin-like serine proteases
Eukaryotic proteases
Flavodoxin-like
Flavoproteins
Flavodoxin-related
TIM beta/alpha-barrel
Ribulose-phoshate binding barrel
Tryptophan biosynthesis enzymes
Lysozyme-like
Lysozyme-like
C-type lysozyme
RNase A-like
RNase A-like
Ribonuclease A-like
Toxins' membrane translocation
domains
Colicin
Colicin
Proton glutamate symport protein
Proton glutamate symport protein
Proton glutamate symport protein
Knottins (small inhibitors, toxins,
lectins)
Plant lectins/antimicrobial peptides
Hevein-like agglutinin (lectin)
domain
RING/U-box
RING/U-box
RING finger domain, C3HC4
Parallel coiled-coil
Triple coiled coil domain of C-type
lectins
Triple coiled coil domain of C-type
lectins
Synuclein
Synuclein
Synuclein
Ribosome and ribosomal
fragments
Ribosome and ribosomal fragments
Ribosome complexes
タンパク質は「ひも」か「凝縮ガス」か?
本来は「ひも(直鎖状)」分子
天然構造の分子は「凝縮ガス」としても近似できる
結晶構造からCα原子の座標のみ取り出して
ビーズモデルを作成
→ビーズ間の距離情報だけから、元の共有
結合を再構築できるか?
→種々のフォールディングパターンを持つ70
個のタンパク質全てにおいて正しく再現
→天然構造では共有結合(トポロジー)情報
がなくても、立体構造を正しく規定できる
SAXSデータから計算した実際のビーズモデルでトレース
PDB
立体構造データベース
CRYSOL:原子座標より散乱曲線を計算
SAXS
data
GASBOR:ab initioモデリング(各ビーズは仮想アミノ酸残基)
ビーズモデル
TraceBeads
トレースモ
デル
→全長のトレースは不可能
最長トレース鎖を本来の主鎖と比較
ab initioモデルのビーズ・トレース
RIBONUCLEASE A
(PDB code: 7RSA, AA: 124(beads), SCOP classification: α+β)
Top is “Path” (Green: proper path, Red: trace path). Bottom is only trace path.
A B C A B C Nakagawa et al., (in preparation)
WAXSデータと二次構造との相関
WAXS(広角散乱)データから,二次構造に関して
どのような情報が取り出せるか?
タンパク質二次構造の一般的な解析法
CD(円偏光二色性)
IR(赤外線)分光
アミノ酸配列からの予測
WAXSをこれらのツールと同じレベルで用いることはできないか?
SAXSとWAXSの違い
分子�
散乱曲線�
Intensity
SAXS
分子全体の大きさや形状
WAXS
h (A-1)
局所的な形状
最近,異なるフォールドの幾つかのタンパク質において,h = 3 A-1
までのWAXSデータが測定された Hirai et al., Biochemistry 9, 202 (2004)
実測されたタンパク質 (いずれも結晶構造は既知)
SCOP分類
hemoglobin (1HDA)
myoglobin (1WLA)
ββ α-chymotrypsin (4CHA)
staphylococcal nuclease (1STN)
α/β phoshoribosyl anthranilate isomerase (1NSJ) flavodoxins (1AG9)
α+β lysozyme (6LYZ)
ribonuclease A (7RSA)
αα
原子座標からWAXSパターンの計算
Debyeの式�
; 原子 i の散乱因子�
; 原子 i と j の距離�
溶媒の影響は考慮しない
のデータに関して,結晶構造からの計算値と実験値は
よく対応する. Hirai et al., J. Synchrotron Rad., 9,202 (2002)
二次構造(ヘリックス)に関する加算性の確認
加算性が成り立たないと二次構造含量の解析は不可能
Helix 1
WAXS of helix 1
sum
Helix 2
WAXS helix 2
Same or not?
Helices 1 and 2
WAXS of helices 1 and 2
→加算性があると考えられる�
以下ヘリックスの座標のみ注目し,ヘリックス固有のWAXSパターンを
抽出する
Analysis of WAXS profile of
helices
ヘリックス(77個)の
原子座標�
分�類�
Debyeの式�
WAXSパターン�
相関はないか ?
分�類�
ヘリックスのWAXSパターンの分類
(主鎖原子のみ考慮して計算)
形状に基づき4クラスに分類
Class A: ピークなし
Class B: 肩(変曲点)
Class C: ピーク(低)
Class D: ピーク(高)
ピークは(存在する場合は)1個
で複数のピークは現れなかった
h
各ヘリックスの構造を,radius(らせん半
径),pitch(ピッチ),cycle(巻き数)3つのパラメータ
で表す
Pitch
Radius
Cycle
Standard radius; 2.3 A, pitch; 5.4 A
ヘリックスの構造とWAXSパターンとの相関
赤色の円柱は,radius = 2.30±0.06Å, pitch = 5.72 ±0.17Åの領域
(Paulingによるモデルとほぼ同じ構造)�
ピークの高いもの�
ピークの低いもの�
ピークがないもの�
側鎖の影響の考慮
側鎖まで考慮すると,複数のピーク(multiple peak)をもつWAXS
パターンが出て来る.
→主鎖のみの場合と同様に,ピークの数や形状に基づ
き,WAXSパターンを分類
Multiple peak
A
Class M1
Class M2
B
WAXSパターン�
Single peak
A
No peak
A
Class S1
Class N1
WAXSパターンに対する側鎖の影響
主鎖のみ考慮したときのWAXSパターンのクラス(A D)と,
側鎖まで考慮したときのWAXSパターンのクラス(M1 M6,S1
S5,N1)との相関を解析
1. ClassD(高いピーク)に側鎖をつけるとmultiple peakになりやすい
2. ClassB(肩),C(低いピーク)に側鎖をつけるとsingle peakになりや
すい�
側鎖の配列による影響→殆どない
側鎖の種類による影響→?
β構造,ターンに関しても同様の解析を行う
膜タンパク質の立体構造解析(計画中)
膜タンパク質
本質的に膜上で働くことが機能発現にとって重要
←膜上での立体構造とダイナミクスを明らかにする必
要がある
SAXSを用いて、膜上における膜タンパク質の立体構造(特に四次
構造)とその変化を解析する
EGFR(EGF受容体)
細胞膜に存在し,細胞外ドメイン(EGF結合ドメイン)と,
細胞内ドメイン(チロシンキナーゼドメイン),および膜
貫通領域から成る.
EGFが細胞外ドメインに結合すると,膜上で二量体を形
成し,細胞外ドメインが活性化する.
細胞の増殖・分化に関するシグナル伝達において鍵とな
るタンパク質
多くのがん細胞において,EGFRの変異が見出されてい
る.
←gefitinibはEGFRのチロシンキナーゼを標的とする
EGFRの細胞外ドメインの結晶構造
EGFとの二量体複合体
EGFの結合により,EGFRがコ
ンフォメーション変化を起こし,
二量体を形成できるようになる
EGFRの細胞内ドメインの結晶構造
gefitinibとの複合体
活性化ループのコンフォメーション
が酵素活性に重要
gefitinibはATPと競合してEGFRに
結合
EGFR全長構造決定の試み
EGFRを埋め込んだリポソームを作製
してSAXSを測定
EGFR
リポソーム
各ドメインの結晶構造を利用して,全長
の立体構造を決定
膜構成成分もSAXSに寄与してしまう
コントラスト変調法
Stuhrmann et al., Z. Phys. Chemie 72, 177 (1970)
リポタンパク質の構造解析にも適用
溶媒の電子密度を膜構成成分を同じにするこ
とにより,膜構成成分を「見えなく」する(コント
ラスト・マッチング)
EGFの有無による構造変化
ストップトフロー法による時分割測定
原点散乱強度から分子量算出→二量体形成の判断
各種変異体の解析により,臨床的に見出された変異が
EGFとの結合
二量体形成
チロシンキナーゼ活性化
のどの段階に影響するのか調べる.もしいずれでもなくドメイン内の微
小な構造変化に帰着できるときは,各ドメインを直接結晶解析する
がん化、薬剤耐性に関与するアミノ酸変異がEGFRに与える影響を構
造レベルで分析、予測
食品化学から見たSAXSの特徴
•  分子の凝集に敏感
→アミロイド線維の形成過程に適用例あり
•  変性状態をランダムコイル(Gauss鎖)として積極
的に観測可能
•  本来は単分散系を対象とするが,多分散系にも
適用可能
特異値分解(Singular Value Decomposition)法による成分分析
コントラスト変調法による特定成分の標識
特異値分解(SVD)
•  ある反応過程に現れる独立分子種の数を数学的に見
積もる方法
左の過程がN,I,Uの3
状態から成ることはSVD
より得られる.
•  SVDでは独立成分の数だけでなく,各成分固有のス
ペクトル(SAXSパターン)が抽出可能.
SAXS法
多次元NMR法
pH変性 Biochemistry 39, 1364 (2000)
熱変性
四次構造形成 Biochemistry 44,15304 (2005)
Biol. Chem. 385, 1157 (2004)
フォールディング J. Mol. Biol. 372,747 (2007)
CD法
アミロイド線維化 Biochem. Biophys. Res. Commun. 355, 398 (2007)
食品化学分野へのSAXSの適用(の可能性)
•  相転移過程への適用
→ゲル・ゾル転移等
•  「そのまま」測定
←SAXS測定の迅速性,簡易性
測定条件が自由に設定可能
(溶液である必要はない)
東京薬科大学生命科学部
森本康幹
中川隆司
上吉原智晃
柳 茂
東京薬科大学薬学部
下高原櫻子
明星大学理学部
田代 充
関西医科大学物理学教室
木原 裕
獨協医科大学情報センター
木村一元
岩手医科大学薬学部
中西真弓
柏木幸子
二井將光
毛塚雄一郎
野中孝昌