Raffinamento delle fasi e del modello atomico

Raffinamento delle fasi e del modello atomico
dati sperimentali: I(hkl)
fasi iniziali: α(hkl)
MIR, MAD, MR
dati NCS
mappa di densità elettronica iniziale
maschera iniziale
miglioramento delle fasi (averaging, solvent flattening)
mappa migliorata
maschera migliorata
Nuova maschera
(ri)costruzione del modello
modello migliorato
raffinamento vincolato
nuovo modello
nuova NCS
nuova mappa
controllo qualità del modello
modello finale
1
Density Modification
interpretazione di ρ(x,y,z)
Problema: densità elettronica di qualità insufficiente
- ambiguità nel tracciare la catena aminoacidica
- discontinuità nella mappa di densità elettronica
Errori nel modello non facilmente rimovibili nel successivo raffinamento
cristallografico
- Solvent flattening
- Non Crystallographic Symmetry Averaging
2
Solvent flattening
Assunzioni:
zona proteica = alta densità elettronica (localizzabile)
zona solvente = bassa densità elettronica
si costruisce una maschera attorno alla zona proteica
- si pone ρ(x,y,z) = costante (piccola) all’esterno della maschera
- calcolo nuove fasi
- calcolo nuova densità elettronica
3
Solvent flattening
prima
solvent
flattening
dopo
solvent
flattening
4
Non Crystallographic Symmetry (NCS) Averaging
Prerequisiti:
Assunzione:
-  2 o più molecole proteiche nell’u.a.
-  operatori di NCS noti
ρ(x,y,z) di molecole legate da NCS è identica
- maschera attorno alla ρ(x,y,z) di una molecola
- applicazione degli ‘n’ operatori NCS
- media delle ‘n’ ρ(x,y,z) e calcolo nuove fasi
- Segnale/Rumore aumenta di n1/2
- calcolo nuova densità elettronica
prima NCS av.
dopo NCS av.
5
Risoluzione sperimentale
{ max }


 1
ρ( x ) =
F(h )exp −2πi( hx )
∑
V h = { min}
[
]
€
6
Raffinamento e validazione
- costruzione modello atomico nella densità elettronica
- raffinamento cristallografico
(verifica accordo fra modello e dati sperimentali)
- validazione del modello
- sottomissione del modello al PDB
Problema:
basso rapporto osservazioni/parametri: parametri per ciascun atomo = (xj, yj, zj, Bj);
Bj ∝ <uj2>
(Per esempio: parametri = (12000 atomi x 4 parametri= 48000)
osservazioni = Ihkl (osservazioni a 2.1 Å = 138000 → o/p=2.9)
ambiguità nell’interpretazione della densità elettronica
Soluzione:
-  aumentare il numero delle osservazioni: alta risoluzione dei dati (< 1.5 Å)
- utilizzare informazioni addizionali: stereochimica strutturale nota (geometrical restrains)
7
Stereochimica
Per ogni amminoacido (circa 8 atomi) occorre determinare come minimo 6 parametri:
-  gli angoli φ, ψ'
-  2 angoli per definire la posizione della catena laterale: χ1, χ2'
- due B factor: uno per la catena principale e l’altro per la catena laterale
Dunque, riprendendo l’esempio di prima 12000/8 x 4 = 6000 parametri
osservazioni = 138000 → o/p=23
Conclusione: grazie ai vincoli stereochimici abbiamo circa 20 osservazioni
sperimentali per ogni parametro
8
B factor
B = 8π 2 u 2
u2
€
€
Incertezza
sulle
coordinate
B
€
B=10
B=20
Scattering power:
# B &
exp%− 2 (
$ 2d '
Lo scattering ad alta risoluzione è dominato
da atomi con B piccolo! €
d=risoluzione sperimentale
9
Costruzione del modello atomico
- catena principale (scheletro Cα)
-  catene laterali
- molecole solvente
Raffinamento strutturale vincolato
processo iterativo di correzione del modello volto a minimizzare una funzione di
energia generalizzata: C = R +k’U
∑
R =
Fobs (h) – k Fcal (h)
accordo con i dati sperimentali
h
∑
Fobs (h)
h
accordo con i parametri stereochimici
€
2
2
cal
obs
cal
−12
−6
U = ∑ B j (b obs
j − b j ) + ∑ T j (τ j − τ j ) + ∑ Φ j (q + cos(nφ j − δ )) + ∑ ( Ai, j ri, j − Bi, j ri, j )
j
lunghezza legami
€
j
j
angoli di legame
i, j
angoli di torsione
Van der Waals
10
Validazione modello
∑
Esame del modello finale raffinato:
R =
-  accordo fra modello e dati sperimentali (R-factor)
Fobs (h) – k Fcal (h)
h
∑
Fobs (h)
h
- Free R-factor (per evitare l’overfitting dei dati)
-  stereochimica delle strutture macromolecolari
PDB
€
-  contatti/interazioni fra residui vicini spazialmente
CRYST1
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
.
.
.
ATOM
ATOM
ATOM
END
39.550
1
2
3
4
5
6
7
8
9
10
11
12
13
2166
2167
2168
74.570
CB SER
OG SER
C
SER
O
SER
N
SER
CA SER
N
THR
CA THR
CB THR
OG1 THR
CG2 THR
C
THR
O
THR
HOH WAT
HOH WAT
HOH WAT
66.560
1
1
1
1
1
1
2
2
2
2
2
2
2
401
402
403
90.00 99.94 90.00 P 1
30.854 -6.329 36.118
31.600 -7.531 36.190
30.991 -3.833 36.183
30.868 -2.883 36.961
31.848 -5.217 38.114
31.668 -5.130 36.630
30.605 -3.796 34.906
29.920 -2.658 34.286
30.734 -2.067 33.086
31.045 -3.101 32.139
32.020 -1.403 33.566
28.542 -3.116 33.777
27.815 -2.341 33.141
21 1
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
41.46
44.54
40.24
40.08
39.55
40.83
39.92
38.97
39.67
38.83
38.83
38.40
38.79
6
8
6
8
7
6
7
6
6
8
6
6
8
20.048
-9.403
3.928
1.00 31.45
1.00 44.09
1.00 21.48
8
8
8
3.400
0.553
-6.370
49.038
32.633
32.724
4
11
12
http://www.pdb.org
Protein Data Bank
3 metodi principali:
100547 Structures (2014)
- X-ray crystallography (~ 88.6%)
- (NMR) (~ 10.4%)
- Electron microscopy (0.8%)
1400 different folds
13