PLASTICITA’ DEL GENOMA EUCARIOTICO 1.1 INTRODUZIONE Il genoma umano si puo’ distinguere, in base alla sua cinetica di riassociazione, in DNA a singola copia e ripetuto (Britten e Khone 1968). Il DNA a singola copia rappresenta circa il 10 % del genoma umano ed in esso si localizza la maggior parte dei geni e degli elementi regolatori, come i promotori e i repressori. Il DNA ripetuto puo’ essere distinto in due categorie in relazione al livello di ripetitivita’, in base cioe’ al numero di copie che lo costituiscono. Si distinguono, per tale caratteristica, il DNA altamente ripetuto e quello mediamente ripetuto. Il DNA altamente ripetuto, in gran parte inattivo dal punto di vista trascrizionale, ha due tipi principali di organizzazione: - DNA ripetuto in tandem. In relazione alle dimensioni medie del blocco di unita’ ripetute si distingue ulteriormente in: DNA satellite (principalmente localizzato al centromero), DNA minisatellite e DNA microsatellite; - DNA ripetitivo intersperso. Le unita’ sono disperse in piu’ punti del genoma umano. Le LINE (long interspersed nuclear elements) ed le SINE (short interspersed nuclear elements) fanno parte di questo gruppo. Appartengono al DNA mediamente ripetuto le famiglie multigeniche, come i geni per l’rRNA, HLA e per le immunoglobuline. 1.2 I DUPLICONI Dai dati del sequenziamento del genoma umano, al gruppo delle sequenze ripetute si e’ aggiunta un’altra classe. Sono stati recentemente individuati segmenti genomici duplicati delle dimensioni, approssimativamente, di 2-200 kb che condividono un alto grado di similarita’ 8 tra loro denominati dupliconi o duplicazioni segmentali (Eichler et al., 1996). Le regioni subtelomeriche e pericentromeriche dei cromosomi dei primati sono particolarmente arricchite di dupliconi. (fig. 1) (Hattori et al. 2000). Fig. 1 Localizzazione dei dupliconi (indicati dai segmenti rossi) lungo i cromosomi umani riportati a sinistra. I dupliconi possono contenere sia geni che pseudogeni tronchi non processati e sembrano mantenere l’organizzazione tipica delle regioni codificanti. Questa loro peculiare caratteristica rende particolarmente difficile sia la loro identificazione all’interno della “sequenza completa del genoma umano” che la loro caratterizzazione, anche utilizzando algoritmi specifici per le regioni duplicate (Bailey et al. 2001, Eichler E. 2001). Le duplicazioni segmentali si distinguono in intra- ed intercromosomiche. Le intracromosomiche, anche dette ripetizioni a basso numero di copie (low copy repeats, LCRs o repeat regions, REPs) furono inizialmente identificate come regioni instabili del genoma umano, associate con le sindromi da microdelezione e microduplicazione. In generale, i segmenti paraloghi di tale classe sono localizzati su un singolo braccio cromosomico, sono distanziati tra loro da meno di 10 Mb e si localizzano preferenzialmente nelle regioni eucromatiche prossimali. Nel cromosoma 22, piu’ del 90% delle duplicazioni cromosoma-specifiche si trovano nelle prime 10 Mb del braccio 9 lungo su un totale di 350 Mb. I dupliconi intracromosomici possono arrivare a condividere fino al 99% di similarita’ di sequenza. In molti casi il grado di divergenza puo’ essere simile ai livelli di variazione allelica (meno di un nucleotide ogni kb). La classe delle duplicazioni intercromosomiche o transcromosomiche e’ localizzata su cromosomi non omologhi, con prevalenza nelle regioni pericentromeriche e subtelomeriche. In particolare, detti dupliconi sono stati identificati nei punti di giunzione del DNA alfa-satellite, definendo dal punto di vista molecolare il dominio di transizione tra il DNA centromerico e quello a singola copia. Per spiegare l’elevata complessita’ strutturale delle duplicazioni intercromosomiche e’ stato ipotizzato un modello a due step (Eichler et al., 1996; Horvath et al., 2000; Riethman et al, 2001). Inizialmente (primo step) la trasposizione duplicativa avrebbe portato la copia presente nel locus ancestrale in posizione pericentromerica e successivamente (secondo step) ripetuti scambi e duplicazioni subite dalle regioni pericentromeriche non omologhe avrebbe portato alla creazione di grossi blocchi di paralogia (fig. 2). Tale modello e’ avvalorato dall’analisi filogenetica e comparativa di alcuni di quelli che si ritengono i loci ancestrali. Molte delle duplicazioni iniziali (primo step) si realizzarono dopo la separazione dell’orango dalla linea degli ominoidi (10-15 mya) (Eichler et al., 1997; Trask et al., 1998; Horvath et al., 2000). Il successivo step sarebbe avvenuto invece, durante la separazione dell’uomo dalle grandi scimmie africane (Goodman M. 1999). Fig. 2 Modello a due step per spiegare l’accumulo delle duplicazioni pericentromeriche originate da cromosomi non-omologhi. 10 La localizzazione preferenzialmente pericentromerica potrebbe essere dovuta a due motivi: 1. le regioni pericentromeriche sono regioni del genoma capaci di “accettare” segmenti duplicati senza effetti gravi sull’organismo. In alcuni casi, un frammento genico duplicato in esse, essendo vicino all'eterocromatina centromerica, potrebbe diventare trascrizionalmente inattivo (Jackson et al., 1999) ed in tal modo non portare ad alcun sbilancio dose; 2. la presenza di sequenze ricombinogene nelle regioni pericentromeriche potrebbero mediare l’integrazione dei segmenti duplicati. Tale ipotesi e’ basata sull’inusuale presenza di sequenze simili a minisatelliti (polipirimidine e polipurine) in molti breakpoints di duplicazioni che giocherebbero il ruolo di segnali della ricombinazione (Horvath et al., 2000; Guy et al., 2000; Eichler et al., 1996-1997). Da studi filogenetici di queste sequenze ripetute intersperse (PIR, Pericentromeric Interspersed Repeat) e’ possibile datare gli stessi eventi duplicativi (Eichler et al., 1999). Tutte le caratteristiche suddette fanno dei dupliconi degli elementi genomici estremamente interessanti da studiare, la cui caratterizzazione va ad aumentare i dati, gia’ numerosi, sulla plasticita’ del genoma dei primati. 11 1.3 L’INSTABILITA’ GENETICA MEDIATA DAI DUPLICONI 1.3.1 DUPLICONI E MALATTIE Le duplicazioni pericentromeriche sono un elemento di variabilita’ strutturale del genoma umano. La maggior parte dei punti di rottura delle traslocazioni cromosomiche studiate nei tumori solidi mappano nel DNA pericentromerico (Padilla-Nash et al., 2001) ed alcune inversioni pericentriche del cromosoma 9, molto diffuse nella popolazione umana, sembrano mediate da elementi duplicati mappanti in 9p12 e 9q13 (Kaiser et al., 1984; Park et al., 1998). Il motivo di questa alta plasticita’ sarebbe dovuto alla notevole abbondanza dei dupliconi presenti in esse. L'alta similarita’ di sequenza tra i segmenti duplicati di DNA permetterebbe l’appaiamento non corretto durante la meiosi, portando a crossing-over diseguale e riarrangiamenti cromosomici, attraverso ricombinazione omologa tra cromosomi omologhi o tra cromatidi fratelli. Il risultato finale di questi scambi puo’ essere una delezione, duplicazione o inversione in relazione all’orientamento dei segmenti ripetuti (fig. 3). Fig. 3 Riarrangiamenti genomici risultanti dalla ricombinazione tra dupliconi. a) Ricombinazione intercromosomica tra elementi ripetuti diretti comporta delezione e/o duplicazione; b) ricombinazione intracromosomica tra repeat diretti porta a delelzione; c) ricombinazione intracromosomica tra elementi invertiti ha come risultato un’inversione. Gli elementi ripetuti sono indicati da frecce gialle. Figura adattata da Lupski (1998). 12 Le duplicazioni segmentali possono avere diversa organizzazione. Possono essere molto semplici come CMT1A-REP (24 kb) che, presente in due copie distanziate di circa 1.5Mb, media la duplicazione o la delezione della regione cromosomica 17p11.2, associate rispettivamente con la distrofia Charcot-Marie-Tooth e la paralisi ereditaria da contatto (Hereditary Neuropathy with Pressure Palsies, HNPP); o possono contenere una complessa organizzazione di piu’ moduli duplicati come quelli localizzati nella regione pericentromerica del cromosoma 22 (25-120 kb) e nella regione cromosomica 15q11-13 (13-40 kb). Tali duplicazioni indipendentemente dalla loro complessita’ possono mediare riarrangiamenti cromosomici come le inversioni, le traslocazioni e la formazione di piccoli cromosomi marker sovrannumerari (fig. 4). Fig. 4 Ideogrammi dei cromosomi 15 e 22 e di alcuni casi di delelzioni e invdup. Nei riquadri i cromosomi in bandeggio Giemsa e le patologie a cui sono associati. 13 Anche delezioni e duplicazioni interstiziali, ritenute responsabili dell’insorgenza di alcune sindromi, deriverebbero da errori causati dalle duplicazioni segmentali, durante il cross-over (tabella 1). Sindrome DiGeorge Velocardiofacciale Cat-eye Williams Prader-Willi Angelman Charcot-marie Tooth HNPP Smith-Magenis Regione citogenetica 22q11 22q11.2 pros. 22q11 7q11.23 15q11-15q13 15q11-15q13 17p11.2 17p11.2 17p11.2 Riarrangiamento (dimensione in Mb) microdelezione (3) microdelezione (3) duplicazione SMC microdelezione (1.5) microdelelzione (4) microdelelzione (4) microdelelzione (1.5) dup. interstiziale (1.5) microdelezione (5) Tabella 1 Esempi di instabilita’ pericentromerica nel genoma umano (pros., prossimale; SMC, micromosoma; dup., duplicazione) Anche le famiglie geniche, come quella per i recettori olfattori (OR) essendo dei dupliconi possono mediare riarrangiamenti. Recentemente e’ stato proposto un modello secondo il quale cluster OR in cromosomi non omologhi potrebbero appaiarsi e ricombinare dando origine a cromosomi traslocati. L’appaiamento non canonico sarebbe dovuto alla presenza di inversione in eterozigosi. In questo caso il cromosoma non potendosi appaiare con il suo omologo invertito, si appaia e ricombina con il non omologo con cui condivide alta percentuale di similarita’ per la presenza del cluster genico degli OR (Giglio et al., 2002). Sulla base dei dati attuali tre regioni pericentromeriche mostrano una piu’ spiccata attitudine nell’acquisire segmenti paraloghi. Queste sono le regioni citogenetiche 22q11.2, 15q11.21 e 16p11. Alcuni geni, infatti, come il trasportatore della creatina ERY-1 e alcuni loci dei geni per la neurofibromatosi, presentano copie multiple duplicate in 15q11.2 e 16p11 (Buiting et al. 1992; Kehrer-Sawatzki et al. 1997). Inoltre le stesse regioni sono state riportate come hot spot per delezioni e duplicazioni interstiziali (Buiting et al. 1992: Halford et al. 1993; Morris and Thacker 1993; Mears et al. 1994; Amos-landgraf et al. 1997; Huang and Miao 1997). Tutti questi dati 14 dimostrano che l’instabilita’ e la plasticita’ di alcune regioni del genoma umano sono strettamente correlate alla loro organizzazione molecolare. 1.3.2 I DUPLICONI E L’EVOLUZIONE Per spiegare l’esistenza dei grandi segmenti genomici duplicati si e’ ipotizzato che i genomi eucariotici ancestrali siano più volte andati incontro ad eventi di poliploidizzazione (Ohno 1970). Due eventi di tetraploidizzazione sarebbero intervenuti nell’evoluzione dei mammiferi (Lundin 1993). Questi eventi sono pero’ rari e si adattano poco ad interpretare l’origine delle regioni paraloghe, recentemente individuate nell’ambito dei genomi di primati. Meglio si adattano, per tali duplicazioni, eventi di trasposizione duplicativa e di ricombinazione mediati da un appaiamento non corretto (endoduplicazione) (Eichler E. 2001). Una delle due copie del gene duplicato, non essendo sottoposta a pressione selettiva, tende ad accumulare mutazioni e cio’ puo’ portare ad un nuovo pattern di espressione o alla perdita della funzione genica, lasciando comunque una copia a svolgere la sua funzione originaria (Ohno 1970). Numerosi sono i geni che esistono in copie multiple nel genoma umano. Esempi ne sono i geni Hox (Krumlauf 1994), i geni dei recettori delle cellule T (Hood et al., 1985) e i geni per le globine (Orkin et al., 1984). Un tale meccanismo avrebbe portato il genoma dei vertebrati a divenire piu’ complesso. A differenza di queste duplicazioni (ancestrali), i segmenti duplicati nelle regioni pericentromeriche sembra si siano evoluti piu’ recentemente (Horvath et al., 2000; Regnier et al., 1997; Zimonjic et al., 1997). E’ stato stimato da analisi in silico che circa il 5% del genoma umano sia composto di duplicazioni segmentali datate a circa 12 milioni di anni fa nell’evoluzione della nostra specie (Eichler et al., 2000). L’abbondanza delle duplicazioni segmentali, il loro ruolo centrale nell’emergenza di nuovi geni con nuove funzione e la loro associazione con l’instabilita’ cromosomica, hanno importanti implicazioni per l’organizzazione del genoma dei primati e la loro evoluzione. Fondamentalmente la presenza di 15 un tale elevato numero di duplicazioni segmentali nel genoma umano ha due importanti implicazioni, ad oggi sottostimate: - mutazione dinamica - domain accretion 1.3.2.1 Mutazione dinamica Le duplicazioni segmentali incrementano la probabilita’ di riarrangiamenti cromosomici, inducendo cosi’ un processo dinamico, un meccanismo analogo a quello descritto per l’evoluzione dei satelliti, in cui un evento iniziale incrementa la probabilita’ di un evento mutazionale secondario. Il motivo di tale incremento e’ dovuto alla presenza di grossi blocchi di sequenza molto simili, a volte identici, che in quanto tali possono appaiarsi inducendo eventi di ricombinazione non omologa. La pressione selettiva, a seguito di tali eventi, giocherebbe un ruolo cruciale e, se non si verifica alcuna selezione a sfavore, questo incrementa i cicli di duplicazione segmentale. Manifestazione di un tale dinamismo sono i numerosi casi di disordini genomici descritti nella sezione precedente, ma anche i numerosi casi di polimorfismi strutturali generati dalle duplicazioni genomiche (delezioni di poche kb ed inversioni) presenti nella popolazione. Tali riarrangiamenti sono in equilibrio di Hardy-Weinberg almeno in uno specifico gruppo etnico (Sprenger et al., 2000) e in genere coinvolgono regioni eucromatiche ricche di geni (Sprenger et al., 2000; Giglio et al., 2001). Dal punto di vista evolutivo, tale fluidita’ strutturale potrebbe fornire un meccanismo per la costruzione di barriere di speciazione. La omozigosi per un dato riarrangiamento, divenuta frequente nella popolazione, potrebbe generare una barriera genetica, portando quindi ad una speciazione simpatrica. 1.3.2.2 Domain accretion Il processo della duplicazione segmentale e’ un meccanismo di mescolamento (shuffling) genetico, in quanto piccoli tratti (1-100 kb) di materiale genomico vengono spostati da un sito genomico all’altro. Come gia’ 16 detto i segmenti duplicati spesso contengono sequenze di DNA con struttura esoni-introni (fig. 5) e la giustapposizione di diversi segmenti genomici puo’ originare potenziali geni di fusione a partire da geni non correlati (fig. 6). Recentemente diversi trascritti chimerici costituiti da geni endogeni e frammenti di duplicazioni segmentali sono stati descritti nel genoma umano (Footz et al., 2001; Kipersztok et al., 1995; Kennerson et al., 1998; Courseaux et al., 2001; Inoue et al., 2001). In generale, le duplicazioni segmentali potrebbero fornire un veicolo evolutivo per formare nuovi domini proteici. In altre parole, nelle regioni pericentromeriche e subtelomeriche vengono prodotti nuovi moduli proteici grazie al dinamismo molecolare che contraddistingue queste regioni. Tra tutti questi l’eventuale chimera che conferisce un vantaggio selettivo all’individuo sara’ fissata come “nuovo” gene (evoluzione adattativa). Un tale sistema di diversificazione puo’ contribuire a spiegare la diversita’ dei multidomini proteici tipica dei vertebrati. 17 Fig. 5 Struttura a mosaico di alcune duplicazioni segmentali. (a) Struttura e localizzazione di un gruppo di duplicazioni specifiche del cromosoma 16 (LCR16). In due dei tre casi mostrati le duplicazioni sono composte di segmenti piu’ piccoli; (b) Gradi di similarita’ tra duplicazioni pericentromeriche transcromosomiche. I grossi blocchi duplicati sono composti da segmenti piu’ piccoli originati dal mescolamento di geni provenienti d loci ancestrali (4q24, Xq28 e 2p12). Figura tratta da Eichler 2001 TIG. Fig. 6 Duplicazioni segmentali e trascritti di fusione. Esempi di quattro trascritti di fusione ottenuti dallo shuffling mediato da dupliconi. In alto sono riportati i nomi dei geni interessati e i box con gli stessi colori indicano la stessa provenienza genomica riportata in basso. 18 1.3.3 L’EVOLUZIONE DEI DUPLICONI MEDIANTE ANALISI DELLE SEQUENZE FIANCHEGGIANTI Un ulteriore dato dell’evoluzione del genoma si e’ avuto dall’analisi delle sequenze fiancheggianti le giunzioni di duplicazioni (Borden et al. 1990; Eichler et al. 1996, 1997). Tale studio ha messo in evidenza l’esistenza di una specifica classe di sequenze ripetute intersperse (CAAAAG o CAGGG) localizzate vicino ai siti di integrazione nelle regioni pericentromeriche. L’esistenza di queste sequenze nei siti di giunzione, potrebbe indicare un possibile ruolo funzionale nel mediare il processo di trasferimento di materiale genetico intercromosomico (Eichler et al. 1996, 1997). Questi stretch, infatti, definiscono i boundary di diverse duplicazioni, apparentemente indipendenti, trovate ad nelle regioni 10q11, 14q32, 17q11 e Xq28. Tali elementi ripetuti si localizzano quasi esclusivamente nelle regioni pericentromeriche dei cromosomi di primati, nelle stesse posizioni dei piu’ comuni dupliconi intercromosomici (10q11, 15p11, 16p11 e 22q11). L’analisi comparativa della localizzazione di tali stretch ha dimostrato che questi sono da ritenersi presenti in posizione pericentromerica prima della divergenza delle scimmie del vecchio mondo dalla linea degli ominoidi (circa 35 mya), mentre le duplicazioni intercromosomiche associate con questi, come i loci del trasportatore della creatina ed NF1, sembrano aver subito il processo di duplicazione piu’ recentemente (10-25 mya) (Eichler et al., 1996; Regnier et al., 1997). E’ interessante notare come stretch di polipurine e/o polipirimidine siano state descritte recentemente anche in regioni subtelomeriche (Rouquier et al. 1998; Trask et al. 1998). Questo dato mette ulteriormente in relazione le regioni pericentromeriche con le subtelomeriche e questo contribuisce a spiegare l’accumulo di segmenti duplicati in queste particolari regioni del genoma umano. “Alla luce di tutto cio’, le regioni pericentromeriche potrebbero essere intese come un laboratorio di invenzioni evolutive, un assemblaggio di pezzi di cromosomici che e’ continuamente espanso, riarrangiato e purificato (mediante selezione NdT)” (Evan Eichler 1999). 19 1.4 I DUPLICONI DEL CROMOSOMA 15 Il braccio lungo del cromosoma 15 e’ implicato in un numero piuttosto elevato di riarrangiamenti citogenetici come delezioni (Khan and Wood 1999; Verma et al., 1996), duplicazioni (Cook et al., 1997; Schinzel et al., 1994), inversioni (Webb 1995) e traslocazioni (Bettelheim et al., 1998; Jewett et al., 1998). Come precedentemente detto (cfr §1.3.1), la presenza di duplicazioni segmentali nella regione 15q11 fornisce la base molecolare per spiegare l’insorgenza delle delezioni della sindrome di Prader-Willi. Oltre tali elementi sono stati recentemente scoperti nuovi dupliconi localizzati lungo tutto il cromosoma che potrebbero essere responsabili della maggior parte dei riarrangiamenti in cui il cromosoma 15 e’ coinvolto (Pujana et al., 2001). Un sequenza ripetuta a basso numero di copie (LCR15) di 13-22 kb, infatti, e’ presente nelle regioni 15q26.1, 15q24 e 15q11-13 (rispettivamente denominate LCR15-1, LCR15-2 e LCR15-3). Inoltre, un’altra serie di LCR e’ stata localizzata piu’ recentemente anche in 15q21-22 e 15q25 (Pujana et al., 2001). Questi dupliconi sono sia intra che intercromosomici. Oltre che sul cromosoma 15, infatti, sono state trovate copie ad alta similarita’ in posizione 6q, 7p e 12p. Tale similarita’ potrebbe essere il risultato di uno o piu’ scambi intercromosomici. Dati recenti hanno messo in relazione le LCR15 con alcune duplicazioni trovate sul cromosoma 15, definite DUP25, di 10 Mb (Fig. 7). Fig. 7 Dup25 in esperimenti di FISH. t216-1 sonda cosmidica per la duplicazione della regione 15q26, c251-3 sonda cosmidica per a duplicazione della regione 15q24. 20 Esistono diverse forme di DUP25: telomerica, centromerica diretta ed indiretta (fig. 8). Studi condotti su pazienti affetti da disturbi del comportamento (crisi di panico, agorafobia e fobia sociale) hanno messo in evidenza un’alta correlazione tra duplicazione e manifestazione del disturbo. L’insorgenza della duplicazione sarebbe un fattore di suscettibilita’ e non l’elemento scatenante la patologia. I disturbi suddetti, infatti, rientrano nell’ampio gruppo delle patologie multifattoriali. L’analisi dettagliata della regione duplicata ha messo in evidenza la presenza di una delle due LCR15 (LCR15-1, LCR15-2) affiancanti il frammento duplicato (Gratacos et al., 2001). Anche in questo caso quindi, i dupliconi giocano un ruolo nell’instabilita’ genomica. Fig. 8 Esempi di organizzazione di DUP25, t216-1 sonda cosmidica telomerica e c251-3 cosmide centromerico al punto di duplicazione . A) DUP25 a disposizione centromerica diretta in eterozigosi, B) DUP25 a disposizione centromerica indiretta in omozigosi. 21 IL CENTROMERO Il centromero è una struttura presente in tutte le cellule eucariotiche: esso rappresenta il sito su cui si assembla il cinetocore, che consente l’esatto appaiamento e la segregazione dei cromosomi durante la divisione cellulare. Citologicamente il centromero si evidenzia come una costrizione (costrizione primaria) la cui posizione è costante per ogni cromosoma (cromosoma monocentrico). In contrapposizione, vi sono numerosi organismi, tra i quali il nematode Caenorhabditis elegans, i vermi del gruppo Parascaris, alcune piante monocotiledoni e vari insetti, che non presentano un centromero localizzato, per cui le fibre del fuso si attaccano per tutta la lunghezza del cromosoma, il quale perciò e’ definito olocentrico. Di recente è stata messa in evidenza la formazione di nuovi centromeri, denominati neocentromeri, che si attivano su cromosomi che hanno il loro centromero regolare deleto o inattivato (Choo, 1997). 2.1 STRUTTURA MOLECOLARE DEL CENTROMERO La struttura molecolare del centromero e’ molto varia in termini di organizzazione di sequenza e grandezza al variare degli organismi considerati. I centromeri, infatti, non presentano sequenze consensus conservate nell’evoluzione e la loro estensione varia notevolmente. La struttura più semplice è rappresentata dal centromero di Saccharomyces cerevisiae, costituita da una sequenza unica di 125 bp ricca in A/T. I centromeri umani possono estendersi da poche centinaia di kb a varie Mb. Essi sono costituiti da sequenze altamente ripetute di DNA α-satellite di 171 bp. Una struttura simile si ritrova in D. melanogaster il cui centromero, di circa 400 kb, è costituito da una sequenza di DNA satellite ricca in A/T. La differente struttura primaria del centromero nei vari organismi indica che non vi è conservazione filogenetica delle sequenze, nonostante questa struttura svolga una funzione così universale. Rappresenta quindi una 22 eccezione detta “paradosso CEN-DNA” (Choo, 1997). Questo ha portato a proporre il ruolo di meccanismi epigenetici (Steiner and Clarke, 1994; Choo 1997; Sullivan, 2001), benchè le caratteristiche di tali meccanismi non siano chiare. Al contrario le proteine centromeriche e la loro organizzazione attorno al centromero, formando il cinetocore sono estremamente conservate (Choo, 1997). 2.2 CENTROMERIZZAZIONE: meccanismi molecolari Il meccanismo di formazione di un centromero (centromerizzazione) e’ tutt’oggi piuttosto oscuro, ma molti sono i dati che si stanno accumulando a favore del coinvolgimento di determinanti epigenetici per la sua genesi. Molti sono i meccanismi cellulari conosciuti che alterano la dinamica (stato di condensazione e modificazioni) della cromatina e che come tali si ritengono coinvolti nel processo di centromerizzazione. Tra questi il legame di proteine specifiche (CENP-A, CENP-C e PARP) indurrebbe i cambiamenti conformazionali (Protein Marking) e le modificazioni chimiche come la metilazione, l’acetilazione, la fosforilazione, la poli-ADP ribosilazione e l’ubiquitinazione rimodellerebbero la cromatina o le proteine istoniche e non, associate ad essa Nonostante le sequenze di DNA dei centromeri dei cromosomi eucariotici siano altamente divergenti, le proteine che legano il DNA centromerico mostrano una elevata omologia in una vastissima gamma di specie. Tra queste proteine, quelle di maggior interesse sono le proteine CENPA, CENP-B, e CENP-C [queste hanno un’elevata attivita’ di legame al DNA e sembrano essere le proteine responsabili del marking proteico (Choo 1997; Craig 1998; Sugata 2000), CENP-E, CENP-G e CENP-H e le proteine non istoniche localizzate nelle regioni pericentriche dei cromosomi (fig. 9). 23 Fig. 9 Organizzazione molecolare del centromero normale. La proteina CENP-A, H3 histone-like, e’ molto conservata tra tutti i mammiferi (Buchwitz et al., 1999), e si lega in modo specifico alla cromatina, sostituendosi all’istone H3 nell’assemblaggio del core nucleosomale a livello centromerico (Choo 2001). Esperimenti di gene knockout in topo (Cenpa suppression) hanno dimostrato una errata segregazione dei cromosomi e un fenotipo letale, evidenziando il ruolo essenziale di CENP-A nella funzione centromerica. Sembra che questa proteina sia indispensabile per il mantenimento della struttura centromerica superspiralizzata e per il legame specifico della CENP-C al cinetocore (Howman et al., 2000). La proteina CENP-B, si lega direttamente ad un 17mero, definito CENP-B box, che fa parte della sequenza alfoide umana e del satellite minore di topo (Choo 1997). Questa proteina si localizza sia a livello dei centromeri attivi che inattivi nei cromosomi pseudo-dicentrici e –multicentrici, indicando che questa proteina non e’ indispensabile per il funzionamento del centromero attivo. CENP-C è una proteina centromerica essenziale per la mitosi. Infatti in cellule microiniettate con anti-CENP-C si osserva l’inibizione nel proseguimento del ciclo mitotico. Tale proteina sembra inoltre giocare un ruolo cruciale come controllo del ciclo cellulare in fase G1 (Knehr et al., 1996), ed ha altissima affinita’ e proprieta’ di legame al DNA (Yang et al., 1996). 24 CENP-E, infine, è una molecola motrice importante per il movimento dei cromosomi. Sia CENP-C che CENP-E sono associate con il centromero attivo e non a quello inattivo dei cromosomi dicentrici (Choo 2001). Altre proteine, oltre quelle su menzionate, si localizzano nelle regioni pericentriche e giocano un ruolo cruciale nel processo di centromerizzazione (Choo 1997; Karpen e Allshire 1997; Aagaard et al., 1999). Tra queste la TOPOII (DNA Topoisomerasi II che e’ coinvolta nel processo di condensazione cromosomica e disgiunzione dei cromatidi fratelli), HMG-1 (proteina del gruppo ad alta mobilita’-I che e’ coinvolta nel corretto assemblaggio dei nucleosomi), HP-1 (proteina eterocromatica-I che e’ coinvolta nella represisone trascrizionale) e PARP [Poli(ADP- ribosio)polimerasi], coinvolta nel processo di ADP-ribosilazione. Quest’ultima sembra essere particolarmente importante per la genesi di un centromero attivo, e’ stata localizzata (studi di immunofluorescenza) a livello dei centromeri normali e dei neocentromeri umani, ma non livello dei centromeri inattivi dei cromosomi dicentrici (Earle et al., 2000). Non e’ chiaro quali siano le condizioni che favoriscano la formazione di un neocentromero, (in che modo un sito venga scelto per la formazione di un neocentromero,) ma e’ ormai chiaro che esistono, lungo i cromosomi, dei siti caldi di neocentromerizzazione. I blocchi eterocromatici formati da DNA satellite hanno sicuramente competenza centromerica, e si ipotizza che negli hot spot di neocentromerizzazione possano entrare in gioco delle proprieta’ eterocromatina-simili, anche se ancora non e’ noto quali queste possano essere. 25 2.3 IL NEOCENTROMERO Il neocentromero è un centromero ectopico che si attiva occasionalmente in regioni non centromeriche. La prima caratterizzazione convincente di un neocentromero umano risale al 1993 (Voullaire et al., 19992001). Successivamente tale neocentromero e’ stato completamente sequenziato (du Sart et al., 1997). Da allora sono stati descritti neocentromeri sia in Drosophila che nell’uomo (49 casi mappati in 16 cromosomi differenti; Figura 14). Fig. 10 Distribuzione neocentromeri nel genoma umano Più della metà dei cromosomi umani contengono almeno un sito dal quale si e’ originato un neocentromero. In particolari regioni cromosomiche i neocentromeri appaiono disposti addirittura in cluster (3q distale, 8p, 9p, 13q, 15q e Yq) il che fa supporre l’esistenza di “hotspots” di neocentromerizzazione. 26 2.4 HOTSPOT DI NEOCENTROMERIZZAZIONE Nell’ambito del genoma degli eucarioti superiori sembra esserci un ordine gerarchico per l’attivazione di un centromero funzionale, basato sulle caratteristiche molecolari del DNA coinvolto nel processo: 1) Il DNA ripetuto. Studi per individuare la funzione di questo tipo di DNA sono stati condotti utilizzando il DNA α-satellite. Il DNA α-satellite, caratteristico dell’eterocromatina centromerica dei primati, consiste in monomeri ripetuti in tandem, ognuno dei quali e' lungo approssimativamente 171bp. Blocchi di alfa satellite, costituiti da monomeri di alfoidi, possono estendersi per diversi milioni di paia di basi nella regione centromerica di ogni cromosoma. Questo DNA rappresenta il sito di elezione per la creazione di un centromero funzionale nei primati. L’evidenza è fornita da esperimenti di trasfezione utilizzando DNA α-sat umano in cellule di mammifero in coltura, che genera con alta frequenza centromeri nei siti di integrazione. Questa asserzione sembra però contraddetta dal ritrovamento in cromosomi dicentrici umani provvisti di DNA αsatellite, sia al centromero attivo che in quello inattivo. Quindi, la presenza di α-satellite non sarebbe di per sé sufficiente a conferire funzionalità centromerica. 2) L’eterocromatina noncentromerica, costituita da sequenze ripetute intersperse, è costituzionalmente centromerocompetente, dal momento che a bassa frequenza può formare neocentromeri funzionali in presenza (in cis) di DNA centromerico αsatellite. Questi blocchi eterocromatici, infatti, potrebbero costituire un punto di ancoraggio per i microtubuli durante il processo mitotico e meiotco. (Platero et al., 1999). 3) Il DNA eucromatico può formare neocentromeri, sebbene ciò avvenga ad una frequenza molto bassa; esso, infatti, non 27 mostra alcuna tendenza alla formazione di un centromero su cromosomi già contenenti un centromero funzionale. L’isolamento del DNA di un neocentromero funzionale si attua con il metodo di immunoprecipitazione della cromatina, utilizzando anticorpi antiCENPA e anti-CENPC centromero-specifici. Sebbene la maggior parte dei neocentromeri si formino in regioni eucromatiche, è stato osservato che in essi ci sono proteine costantemente associate al centromero normale. Sembrerebbe quindi che queste regioni genomiche siano dotate di proprietà intrinseche tali da renderle siti preferenziali per la neocentromerizzazione al quale si aggiungerebbe anche lo stato di condensazione della cromatina, lo stato eterocromatico, infatti, facilita la localizzazione della proteina CENP-A, sia in Drosophila che nell’uomo (Henikoff et al., 2001-2002). 2.5 ORGANIZZAZIONE DEL CENTROMERO E NEOCENTROMERO UMANO Il centromero umano è costituito essenzialmente di DNA α-satellite, ma la sua grandezza funzionale minima può essere ridotta a poche centinaia di kb, come nel cromosoma Y umano. La regione che lega la CENP-A è ancor più ridotta, circa 50-100 kb ed e’ sufficiente per conferire una normale attività centromerica. Per quanto riguarda il neocentromero, costituito da sequenze eucromatiche di varia natura, studi su due differenti cromosomi e minicromosomi, indicano che la sua grandezza minima è di circa 600-700 kb; l’estensione della regione che lega CENP-A è di 400 kb circa (Lo et al., 2001a, 2001b). Il tempo di replicazione delle sequenze nei centromeri umani avviene nel periodo intermedio-tardivo della fase S ed avviene contemporaneamente sia per le regioni centromeriche che pericentromeriche. Nel caso dei neocentromeri la regione interna che si estende per circa 450 kb acquisisce un tempo di replicazione di un centromero normale, mentre le regioni fiancheggianti mostrano un tempo di replicazione piu’ precoce, nella parte centrale della fase S (fig. 11) (Lo et al., 2001a). 28 Fig. 11 Organizzazione del centromero e del neocentromero umani 2.6 ATTIVAZIONE DI UN CENTROMERO LATENTE: MECCANISMI L’insorgenza di un neocentromero in un cromosoma centrico e la fissazione della nuova forma cromosomica, sono legate alla inattivazione del centromero preesistente (Choo, 1997). La mancata inattivazione provocherebbe la formazione di un dicentrico, destinato a perdersi nel corso di alcune divisioni mitotiche, con conseguente aneuploidia e svantaggio selettivo per il clone cellulare che ne deriva. Nel corso degli studi effettuati, sono state avanzate diverse ipotesi per spiegare l’origine di un neocentromero funzionale in un sito cromosomico fino a quel momento non centromerico. Una delle prime ipotesi fatte comporterebbe un cambiamento di sequenza nel punto di formazione del neocentromero come ad esempio la trasposizione di sequenze ripetute in tandem da un centromero preesistente. La seconda ipotesi chiama in causa, invece, un meccanismo epigenetico (cfr §2.2) che attiverebbe sequenze noncentromeriche o sequenze centromeriche latenti. Un evento epigenetico agisce conferendo a segmenti di DNA caratteristiche strutturali diverse ed ereditabili; alcune sequenze, dunque, sarebbero soggette a modificazioni chimiche self-replicating come la 29 metilazione, la poliribosilazione, acetilazione/deacetilazione, fosforilazione, ubiquitinazione (Choo, 2000). 2.7 NEOCENTROMERI E DISORDINI CLINICI 2.7.1 CROMOSOMI SOVRANNUMERARI E IMPLICAZIONI IN CAMPO CLINICO I piccoli cromosomi sovrannumerari (SMC), anche detti cromosomi marker, sono frammenti cromosomici acentrici che normalmente verrebbero persi ma che, grazie all’attivazione di un neocentromero ectopico, acquistano una stabilità mitotica. Gli individui portatori di questi SMC posseggono quindi 46 cromosomi normali e un cromosoma extra che genera una parziale tri- o tetrasomia per la regione duplicata. Di solito questi marker sono di non facile identificazione con le normali tecniche citogenetiche di bandeggio. I cromosomi marker sovrannumerari si riscontrano mediamente con una frequenza di uno ogni 2500 nati e con un rischio di provocare un fenotipo dismorfico del 13% circa. La grande maggioranza degli SMC comprendono regioni centromeriche classiche contenenti unicamente materiale eterocromatico, e per questo motivo non compromettono l’espressione del fenotipo normale. In contrapposizione a questi, gli SMC dotati di un neocentromero funzionale possono derivare da una qualsiasi regione del genoma (interna al braccio del cromosoma o da regioni telomeriche); questi SMC neocentrici posseggono una quantità di sequenze eucromatiche potenzialmente esprimibili nettamente maggiore rispetto agli SMC alfa-centromerici, con un rischio associato di fenotipo dismorfico più elevato. Nel corso del processo di neocentromerizzazione probabilmente si ha un concomitante rimodellamento della cromatina, con inattivazione di geni attigui al neocentromero, risultante in un fenotipo meno grave rispetto all’aneuploidia per la regione coinvolta (Levy et al., 2000). Pertanto nel caso di piccoli SMC neocentrici, i geni inattivati potrebbero rappresentare una porzione consistente del cromosoma marker, generando un fenotipo alterato di 30 modesta gravità non rapportabile all’aneuploidia generata per quella regione in casi di traslocazione sbilanciata. 2.7.2 ALCUNI ESEMPI DI CROMOSOMI MARKER Choo (1997) offre una panoramica dei cromosomi marker piu’ frequentemente riscontrati e del tipo di riarrangiamento che li ha prodotti. Il meccanismo più comune per la formazione di un cromosoma marker analfoide (cioe’ privo di DNA alfoide) è la duplicazione invertita de novo di una porzione distale del cromosoma originario. In relazione al punto in cui si attiva il neocentromero questi possono essere acrocentrici o metacentrici. I due SMC riportati in letteratura del cromosoma 15 fanno parte di quest’ultimo gruppo (fig. 12), in questo caso i neocentromeri si sarebbero formati al punto di rottura (o nelle sue vicinanze) della duplicazione invertita, rispettivamente in 15q23 e 15q24 (Blennow et al., 1994). Fig. 12 Marker neocentromerici del cromosoma 15 Meccanismi alternativi a questo sono la genesi mediante rottura e riunione (fig. 13) ed in tal caso sull’SMC sono presenti le sequenze telomeriche, come nel caso dei marker M3-a (Maraschio et al., 1996) e M10-a (Voullaire et al., 1999) oppure la delezione interstiziale. In quest’ultimo caso il 31 microcromosoma non presenta sequenze telomeriche e si richiude ad anello (fig. 14). Fig. 13 Marker neocentromerici dei cromosomi 3 e 10 32 Fig. 14 Marker neocentromerici dei cromosomi 2 e 10 33 2.7.3 NEOCENTROMERO IN 10q25.2: UNICO CASO DI CARATTERIZZAZIONE MOLECOLARE. Il neocentromero in 10q25.2 attualmente costituisce l’unico esempio di neocentromero caratterizzato a livello citogenetico e molecolare (Voullaire et al., 1993; du Sart et al., 1997). Il cromosoma marker (fig. 15), designato come mardel(10) (marker deletion), è prodotto dalla rottura del cromosoma 10 in due punti, uno per ciascun braccio, con conseguente fusione dei frammenti distali del braccio p e del braccio q; il reciproco è costituito da un frammento centrico che forma un cromosoma ad anello, denominato rdel(10). Il cromosoma marker è stato rinvenuto in un ragazzo con modesto ritardo mentale. Fig. 15 Formazione del marker neocentromerico analfoide del cromosoma 10 (mardel(10)) 34 Il mardel(10) acquista attività neocentromerica in una regione corrispondente alla banda citogenetica q25.2 del cromosoma 10 normale, dove forma una costrizione primaria distinta che risulta negativa alla colorazione del C-banding, che evidenzia preferenzialmente l’eterocromatina centromerica. Sebbene il neocentromero sia privo di DNA α-satellite esso è stabile al 100% durante la segregazione mitotica, sia nel paziente sia in coltura cellulare allestita con fibroblasti. Il dominio in 10q25.2 che lega le proteine centromeriche è stato ristretto ad una regione genomica di 80 kb, che risulta quindi direttamente implicata nell’istituzione della nuova funzione. Analisi dettagliate hanno rivelato che la regione di 80 kb del neocentromero (NC-DNA) ha un’organizzazione complessiva simile a quella che si osserva nella regione corrispondente del cromosoma 10 normale (HC-DNA) di un individuo geneticamente non imparentato al paziente. Nel confronto delle sequenze NCDNA e HC-DNA non sono state osservate delezioni, né inserzioni, né riarrangiamenti strutturali, ma soltanto singole sostituzioni di base con una frequenza massima di 4.6 per 1000 pb, un valore comunque più alto rispetto alla stima media di 1/1000 pb per i polimorfismi tra due individui non consanguinei. Per verificare se le sostituzioni osservate fossero coinvolte nella genesi della neocentromerizzazione, il DNA del padre del paziente (PnC-DNA), proveniente dal cromosoma 10 morfologicamente normale dal quale discende l’NC-DNA, è stato clonato e sequenziato. Dal confronto diretto delle sequenze dell’NC-DNA e del PnC-DNA è risultata una uguaglianza del 100% nella sequenza primaria, con la conseguente esclusione di una possibilità di una mutazione de novo nella regione di 80 kb responsabile della formazione del neocentromero in 10q25.2. Il risultato ha inoltre suggerito che le differenze tra NC-DNA e HC-DNA siano solo polimorfismi di singoli nucleotidi (SNPs) e cio’ supporta l’ipotesi del coinvolgimento di fattori epigenetici come responsabili dell’attivazione del neocentromero (Barry et al., 2000). Nel contesto di queste 80 kb è stata rinvenuta una regione di particolare interesse, denominata AT28, costituita da uno stretch di circa 600 pb caratterizzata dalla ripetizione in tandem di un monomero di 28 pb ricco in 35 A+T (80%). Dal confronto della sequenza del repeat AT28 con una regione di 54 pb particolarmente conservata della sequenza consensus di 171 pb del DNA α-satellite dei primati non è emersa alcuna somiglianza. Diversamente si ottenuto confrontando la struttura della sequenza anziche’ la composizione in basi (Koch, 2000). Esiste infatti, una sorprendente somiglianza tra l’organizzazione della sequenza nucleotidica neocentromerica e quella dell’alfa satellite centromerico. Per questo motivo si pensa che le strutture secondarie, che la sequenza nucleotidica puo’ formare, siano il fattore di riconoscimento per la funzione centromerica. A conferma di ciò, infatti, si è osservato che le proteine centromeriche HMGI (alpha proteina) e la topoisomerasi II si legano preferenzialmente a strutture secondarie a forcina o ad H. Il riscontro delle medesime caratteristiche strutturali nella sequenza consensus del centromero di Saccharomyces cerevisiae è una ulteriore conferma della possibile implicazione di queste nella funzionalità centromerica. 2.7.4 I CROMOSOMI MARKER DEL CROMOSOMA 15 Il cromosoma 15 e’ il cromosoma piu’ frequentemente coinvolto nella formazione di cromosomi marker, fra i nati vivi. Di tutti gli SMC finora riportati circa il 57% sono inv dup(15), cioe’ cromosomi speculari del tipo pter-cen-q13-cen-pter, che contengono due regioni centromeriche (delle quali soltanto una attiva). Tuttavia anche altre regioni del cromosoma 15 sono rappresentate tra gli SMC analfoidi: sono stati identificati dei breakpoint in 15q23, 15q24, 15q25 e 15q26, risultanti in tetrasomie di varia estensione. Blennow et al. (1994) hanno riportato il caso clinico di due pazienti che possiedono un SMC metacentrico analfoide privo di bandeggio C, costituito come in figura 16. Il neocentromero e’ localizzato al punto di rottura, o in prossimita’, della duplicazione invertita, rispettivamente in 15q23 e 15q24: Inv dup(15)(qter-q23::q23-qter) e Inv dup(15)(qter-q24::q24-qter). I due pazienti mostrano fenotipo simile e peculiare (facies dismorfica, ritardo mentale). Inoltre entrambi sono un mosaico per l’SMC (presente nel 70-80% dei linfoblasti). 36 Rowe et al. (2000) hanno riportato il caso di una paziente con tetrasomia per il 15q distale, una bambina di 10 anni con ritardo mentale, autismo e anomalie facciali minori. L’SMC ereditato dalla madre come ottenuto dai dati su sts polimorfici e riscontrato nel 50% dei linfociti e’ del tipo inv dup(15)(qter-q25::q25-qter) e negativo al bandeggio C (fig. 17). La stabilita’ mitotica di questo SMC analfoide avvalora l’ipotesi dell’attivazione di un neocentromero in 15q25. Fig. 16 Ideogramma del cromosoma 15 (a sinistra) e dei due cromosomi marker metacentrici (a destra). A) Inv dup(15)(qter-q23::q23-qter); B) Inv dup(15)(qter-q24::q24-qter). Fig. 17 A) Ideogramma del cromosoma 15 e del cromosoma marker sovrannumerario (dup(15)(qter-q25::q25-qter)); B) Metafase in bandeggio C, la freccia indica la costrizione primaria analfoide del cromosoma marker 37 2.7.5 NEOCENTROMERI: PERCHE’? Il genoma possiede una serie di siti che, per il tipo di organizzazione strutturale, per la capacita’ a legare determinate proteine, o per i tempi di replicazione caratteristici sembrano predisposti, in determinate circostanze, alla manifestazione di una competenza centromerica. Da questo punto di vista costituirebbero dei centromeri latenti presenti lungo il cromosoma gia’ provvisto di un centromero funzionale (Choo 2001). Il loro significato biologico non è chiaro. A livello di popolazione, l’attivazione di centromeri latenti che permettono la segregazione autonoma di frammenti cromosomici acentrici potrebbe costituire un importante mezzo per l’evoluzione del cariotipo (Dutrillaux, 1979). Questo meccanismo offrirebbe una spiegazione al progressivo aumento del numero di cromosomi rilevato nel corso dell’evoluzione di un gruppo di scimmie del vecchio mondo, le Cercopithecidae (Dutrillaux, 1979). 38 2.8 NEOCENTROMERI NELL’EVOLUZIONE 2.8.1 RIPOSIZIONAMENTO DEL CENTROMERO NELL’EVOLUZIONE Studi comparativi di posizionamento del centromero nel corso dell’evoluzione dei primati suggeriscono che l’insorgenza di neocentromeri possa costituire una importante forza trainante per l’evoluzione dei cromosomi (Ventura et al., 2001; Wong e Choo, 2001). Il riposizionamento del centromero eucariotico è uno dei problemi che il nostro laboratorio sta affrontando gia’ da alcuni anni. Studi di diversi autori (Archidiacono et al., 1995; Archidiacono et al., 1998; Jackson et al., 1999) hanno dimostrato che molti domini centromerici e pericentromerici, su differenti regioni cromosomiche umane, mostrano una elevata plasticità evolutiva rispetto alle regioni eucromatiche, che sembrano evolutivamente stabili. Diversi risultati sperimentali indicano che il centromero abbia capacita’ di “spostarsi” (riposizionamento centromerico). Questo sarebbe un meccanismo attraverso il quale un cariotipo o una cromosoma puo’ evolvere (Band et al., 2000). Dati a favore di tale fenomeno sono riportati per l’evoluzione del cromosoma X per i lemuri, un gruppo di proscimmie del Madagascar (Ventura et al., 2001) e per l’evoluzione del cromosoma IX nei primati (Montefalcone et al., 1999). Il meccanismo attraverso il quale tale riposizionamento si realizza e’ tuttora oscuro e sono state formulate varie ipotesi come la trasposizione da siti centromerici o meccanismi piu’ complessi di attivazione/inattivazione. Esperimenti di microdissezione delle sequenze centromeriche del cromosoma X dell’Eulemur macaco macaco e del Lemur catta e l’ibridazione incrociata reciproca (cross-FISH) non hanno permesso di distinguere tra i due meccanismi come sistemi di riposizionamento (Ventura et al., 2001). 39
© Copyright 2024 Paperzz