Raffinamento delle fasi e del modello atomico dati sperimentali: I(hkl) fasi iniziali: α(hkl) MIR, MAD, MR dati NCS mappa di densità elettronica iniziale maschera iniziale miglioramento delle fasi (averaging, solvent flattening) mappa migliorata maschera migliorata Nuova maschera (ri)costruzione del modello modello migliorato raffinamento vincolato nuovo modello nuova NCS nuova mappa controllo qualità del modello modello finale 1 Density Modification interpretazione di ρ(x,y,z) Problema: densità elettronica di qualità insufficiente - ambiguità nel tracciare la catena aminoacidica - discontinuità nella mappa di densità elettronica Errori nel modello non facilmente rimovibili nel successivo raffinamento cristallografico - Solvent flattening - Non Crystallographic Symmetry Averaging 2 Solvent flattening Assunzioni: zona proteica = alta densità elettronica (localizzabile) zona solvente = bassa densità elettronica si costruisce una maschera attorno alla zona proteica - si pone ρ(x,y,z) = costante (piccola) all’esterno della maschera - calcolo nuove fasi - calcolo nuova densità elettronica 3 Solvent flattening prima solvent flattening dopo solvent flattening 4 Non Crystallographic Symmetry (NCS) Averaging Prerequisiti: Assunzione: - 2 o più molecole proteiche nell’u.a. - operatori di NCS noti ρ(x,y,z) di molecole legate da NCS è identica - maschera attorno alla ρ(x,y,z) di una molecola - applicazione degli ‘n’ operatori NCS - media delle ‘n’ ρ(x,y,z) e calcolo nuove fasi - Segnale/Rumore aumenta di n1/2 - calcolo nuova densità elettronica prima NCS av. dopo NCS av. 5 Risoluzione sperimentale { max } 1 ρ( x ) = F(h )exp −2πi( hx ) ∑ V h = { min} [ ] € 6 Raffinamento e validazione - costruzione modello atomico nella densità elettronica - raffinamento cristallografico (verifica accordo fra modello e dati sperimentali) - validazione del modello - sottomissione del modello al PDB Problema: basso rapporto osservazioni/parametri: parametri per ciascun atomo = (xj, yj, zj, Bj); Bj ∝ <uj2> (Per esempio: parametri = (12000 atomi x 4 parametri= 48000) osservazioni = Ihkl (osservazioni a 2.1 Å = 138000 → o/p=2.9) ambiguità nell’interpretazione della densità elettronica Soluzione: - aumentare il numero delle osservazioni: alta risoluzione dei dati (< 1.5 Å) - utilizzare informazioni addizionali: stereochimica strutturale nota (geometrical restrains) 7 Stereochimica Per ogni amminoacido (circa 8 atomi) occorre determinare come minimo 6 parametri: - gli angoli φ, ψ' - 2 angoli per definire la posizione della catena laterale: χ1, χ2' - due B factor: uno per la catena principale e l’altro per la catena laterale Dunque, riprendendo l’esempio di prima 12000/8 x 4 = 6000 parametri osservazioni = 138000 → o/p=23 Conclusione: grazie ai vincoli stereochimici abbiamo circa 20 osservazioni sperimentali per ogni parametro 8 B factor B = 8π 2 u 2 u2 € € Incertezza sulle coordinate B € B=10 B=20 Scattering power: # B & exp%− 2 ( $ 2d ' Lo scattering ad alta risoluzione è dominato da atomi con B piccolo! € d=risoluzione sperimentale 9 Costruzione del modello atomico - catena principale (scheletro Cα) - catene laterali - molecole solvente Raffinamento strutturale vincolato processo iterativo di correzione del modello volto a minimizzare una funzione di energia generalizzata: C = R +k’U ∑ R = Fobs (h) – k Fcal (h) accordo con i dati sperimentali h ∑ Fobs (h) h accordo con i parametri stereochimici € 2 2 cal obs cal −12 −6 U = ∑ B j (b obs j − b j ) + ∑ T j (τ j − τ j ) + ∑ Φ j (q + cos(nφ j − δ )) + ∑ ( Ai, j ri, j − Bi, j ri, j ) j lunghezza legami € j j angoli di legame i, j angoli di torsione Van der Waals 10 Validazione modello ∑ Esame del modello finale raffinato: R = - accordo fra modello e dati sperimentali (R-factor) Fobs (h) – k Fcal (h) h ∑ Fobs (h) h - Free R-factor (per evitare l’overfitting dei dati) - stereochimica delle strutture macromolecolari PDB € - contatti/interazioni fra residui vicini spazialmente CRYST1 ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM . . . ATOM ATOM ATOM END 39.550 1 2 3 4 5 6 7 8 9 10 11 12 13 2166 2167 2168 74.570 CB SER OG SER C SER O SER N SER CA SER N THR CA THR CB THR OG1 THR CG2 THR C THR O THR HOH WAT HOH WAT HOH WAT 66.560 1 1 1 1 1 1 2 2 2 2 2 2 2 401 402 403 90.00 99.94 90.00 P 1 30.854 -6.329 36.118 31.600 -7.531 36.190 30.991 -3.833 36.183 30.868 -2.883 36.961 31.848 -5.217 38.114 31.668 -5.130 36.630 30.605 -3.796 34.906 29.920 -2.658 34.286 30.734 -2.067 33.086 31.045 -3.101 32.139 32.020 -1.403 33.566 28.542 -3.116 33.777 27.815 -2.341 33.141 21 1 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 41.46 44.54 40.24 40.08 39.55 40.83 39.92 38.97 39.67 38.83 38.83 38.40 38.79 6 8 6 8 7 6 7 6 6 8 6 6 8 20.048 -9.403 3.928 1.00 31.45 1.00 44.09 1.00 21.48 8 8 8 3.400 0.553 -6.370 49.038 32.633 32.724 4 11 12 http://www.pdb.org Protein Data Bank 3 metodi principali: 100547 Structures (2014) - X-ray crystallography (~ 88.6%) - (NMR) (~ 10.4%) - Electron microscopy (0.8%) 1400 different folds 13
© Copyright 2024 Paperzz