Νεώτερες τεχνικές γενετικού και μοριακού ελέγχου Ελευθερία Χατζημιχαήλ, MD, PhD Αιματολόγος Αιματολογική Κλινική, ΠΓΝ Ιωαννίνων the basics… of the basics Human genome • 3 δισεκατομμύρια βάσεις(3 Gb) • 20,000 γονίδια που κωδικοποιούν για πρωτεΐνες (the human 'exome’),περίπου το 1% του γονιδιώματος • + ?junk DNA DNA είναι οργανωμένο σε σχηματισμούς που ονομάζονται χρωμοσώματα. Η χρωματίνη και οι σχετιζόμενες πρωτεΐνες συμμετέχουν στη λειτουργία του DNA Nature 7:233, 2007 The central dogma Γονίδια είναι οι περιοχές του DNA που κωδικοποιούν για πρωτεΐνες. Οι περιοχές που κωδικοποιούν για πρωτεΐνες καθορίζονται από την παρουσία εξονίων, τα οποία αποτελούνται από κωδικόνια, δηλ. τριπλέτες νουκλεοτιδίων που αντιστοιχούν σε αμινοξέα ή που τερματίζουν τη μετάφραση. Οι περιοχές μεταξύ των εξονίων που δεν κωδικοποιούν για πρωτεΐνες ονομάζονται ιντρόνια. Με το μάτισμα (splicing) τα ιντρόνια απομακρύνονται. Alternative splicing: ένα γονίδιο, πολλαπλά μετάγραφα, πολλαπλές πρωτεΐνες Cancer is a genetic disease • Χρωμοσωμικές ανωμαλίες • αριθμητικές, δομικές • μεταλλάξεις Διαταραχή έκφρασης γονιδίων 27-Sep-13 mutations • By effect on structure Small-scale mutations Point mutations • By effect on function • Loss-of-function mutations • Gain-of-function mutations • Silent mutations • Missense mutations • Nonsense mutations Insertions Deletions Large-scale mutations • By impact on protein sequence • Frameshift mutation • Nonsense mutation Amplifications (or gene duplications) • Missense mutations or nonsynonymous mutations Deletions • Neutral mutation Chromosomal translocations • Silent mutations Chromosomal inversions Loss of heterozygosity Examples of mutations (by impact on protein sequence) Panel A shows the normal sequence of DNA from one exon and the protein product it encodes. Panel B shows a silent mutation, Panel C a conservative missense mutation (serine and threonine have very similar structures), Panel D a nonconservative missense mutation (serine and proline have very different structures), Panel E a nonsense mutation, and Panel F a frame-shift mutation. In Panel F, the insertion of a single G throws off the reading frame, so that all amino acids downstream are changed radically. N Engl J Med 2002; 347:1512-1520 November 7, 2002 the basics… in MDS Myelodysplastic syndromes When genetics meets epigenetics: mutations in epigenetic modifiers • • • • hypermethylation of promoter-associated CpG islands response to DNMTi no correlation between abnormal epigenetic profiles and response to DNMTi therapy ?initiating mechanism in MDS downstream consequences of other pathogenic mechanisms missense mutations and are rarely cooccurring prognosis in MDS • Cytogenetics, marrow blast percentage, cytopenias • Hb (transfusion dependence), neutrophil count, platelet count IPSS (-R) • age, performance status, serum ferritin, and lactate dehydrogenase levels • Mutations – 70% -- most common TET2 (20%) the basics… of the techniques FISH What is FISH? • μια τεχνική που χρησιμοποιείται για να ανίχνευση την παρουσία ή την απουσία και την περιοχή μια συγκεκριμένης γονιδιακής αλληλουχίας • μπορεί να «οπτικοποιήσει» συγκεκριμένες κυτταρογενετικές ανωμαλίες (αριθμητικές χρωμοσωμικές ανωμαλίες, απαλείψεις, ενισχύσεις, μεταθέσεις) Κάθε ιχνηθέτης σημασμένος με φθοριόχρωμα μετά τον υβριδισμό θα εμφανίζεται ως φωτεινή κουκίδα Διπλοειδείς πυρήνες θα έχουν δύο φωτεινά σήματα Εάν υπάρχει διπλασιασμός της υπό μελέτης περιοχής θα υπάρχουν περισσότερα σήματα Εάν υπάρχει απώλεια της υπό μελέτη περιοχής θα έχει ως αποτέλεσμα μία ή καμία κουκίδα Principles of FISH a centromeric probe for chromosome 12, labelled with a green fluorochrome, is used in conjunction with probes specific for 13q14 (red label) and 13q34 (blue label). microarrays…not so micro! Microarrays - μικροσυστοιχίες Μεμβράνη ή γυάλινη επιφάνεια που περιέχει ιχνηθέτες που αντιστοιχούν σε γενωμικές περιοχές ενδιαφέροντος, (arranged in a regular, matrixlike pattern) Η ένταση του σήματος από κάθε σημείο εξαρτάται από την ποσότητα του στόχου που υβριδίζεται με τον ιχνηθέτη που βρίσκεται στην επιφάνεια Microarrays - μικροσυστοιχίες Applications 1) identification of a targeted sequence (gene, gene mutation, transcript of interest); and 2) determination of the expression level, i.e. abundance of the targeted sequence (RNA to be queried is first reversetranscribed into cDNA which is then allowed to hybridize with the microarray probes). The process of measuring gene expression via cDNA is called expression analysis or expression profiling (GEP) Comparative genomic hybridization (CGH) ©2007 Signature Genomic Laboratories, LLC Expensive Inability to detect several Mutational Events Haematological malignancies NEED More SNPs Definition of SNPs • At specific sites some people may have (for instance) a G, while others might have an A these sites are called single nucleotide polymorphisms, or SNPs. A SNP is defined as a DNA sequence variation at one specific position in the genome that occurs in at least 1% of the human population a mutation is a change of the nucleotide sequence of the genome of an organism • Each of the two bases that can occur at the SNP is called an allele. • By convention, the most common allele at each SNP is called A and the less common SNP is called B. Since there are two copies of each chromosome (except for X and Y in males), there are three possible pairs of alleles for each SNP: AA, AB, and BB. • For each SNP, an individual’s genotype is the specific combination of alleles that it possesses SNP array design ο σχεδιασμός του SNP chip είναι παρόμοιος με τις μικροσυστοιχίες έκφρασης (expression arrays) • ολιγονουκλεοτιδικές αλληλουχίες στην επιφάνεια (25 bp)= probes • Το δείγμα DNA ενισχύεται, ένας ιχνηθέτης προσδένεται και υβριδίζεται στην μικροσυστοιχία • Η μικροσυστοιχία σκανάρεται για να εκτιμήσει την ποσότητα του δείγματος που έχει προσδεθεί στα ολιγονουκλεοτίδια • Για τα SNPs, υπάρχει ζεύγος probe: ένας για κάθε αλλήλιο SNP arrays 5 εκατομμύρια SNPs έχουν αναγνωρισθεί στο ανθρώπινο γονιδίωμα Σήμερα σε microarray platforms 300,000 to 500,000 SNPs μπορούν να ανιχνευθούν ταυτόχρονα • ανίχνευση ελλείψεων, ενισχύσεων • virtual karyotype using software to determine the copy number of each SNP on the array (since the signal is quantitative) and then align the SNPs in chromosomal order • ανίχνευση loss of heterozygosity (LOH) με τη σύγκριση με patient’s germline DNA • Loss of heterozygosity σημαίνει απώλεια ενός αλληλίου σε μια συγκεκριμένη περιοχή (ή περιοχές); Σχετίζεται με την ογκογένεση όταν η απώλεια αφορά σε κάποιο ογκοκατασταλτικό γονίδιο (συνήθως το άλλο αλλήλιο μεταλλαγμένο) SNP arrays και CGH μπορούν να ανιχνεύσουν LOH αλλά… η SNP array analysis είναι η μοναδική τεχνική που ανιχνεύει CNLOH ή UPD Copy neutral LOH • During the establishment of the neoplastic clone, a segment of one chromosome is lost and replaced by the same region of its homologous chromosome, resulting in segmental LOH. • CNLOH can involve a whole chromosome (also known as UPD) or only a segment of a chromosome (partial UPD) • CNLOH represents an important mechanism by which point mutations or other microlesions can be established in a homozygous state detectable by SNP array analysis. • in cancer homozygosity for a mutation in one allele of a tumor suppressor gene or oncogene, together with loss of the wild-type allele • the presence of a segment of CNLOH in a neoplastic clone could have a role in molecular pathogenesis or could be unrelated to pathogenesis • this passenger-versus-driver issue can be partially addressed by analyzing a large patient cohort and using statistical approaches • matched normal genomic DNA essential! SNP arrays and pitfalls SNP array (250K) in MDS επικεντρωμένη σε CNLOH, ανίχνευσε τη διαταραχή στο 46% των 119 ασθενών. • δεν υπήρχαν paired DNA samples • σε συγκριτική μελέτη 13 περιπτώσεων με paired samples 12 από αυτές τις CNLOH περιοχές ανιχνεύθηκαν και στο normal DNA (=όχι κλωνική επίκτητη διαταραχή) Prevalence and prognostic significance of allelic imbalance by single-nucleotide polymorphism analysis in low-risk myelodysplastic syndromes. Blood. 2007;110(9):3365-3373. The promise… sequencing Sanger sequencing (chain termination) • • • DNA has to be denatured into single strands using heat. a primer is annealed to one of the template strands. This primer is specifically constructed so that its 3' end is located next to the DNA sequence of interest. once the primer is attached to the DNA, the solution is divided into four tubes labeled "G", "A", "T" and "C" Dideoxynucleotides are essentially the same as nucleotides except they contain a hydrogen group on the 3’ carbon instead of a hydroxyl group (OH) http://www.youtube.com/watch?v=6ldtdWjDwes Sanger sequencing (chain termination) Sanger sequencing (chain termination) Sanger sequencing (chain termination) a phosphodiester bond cannot form between the dideoxynucleotide and the next incoming nucleotide, and thus the DNA chain is terminated Dideoxynucleotides are essentially the same as nucleotides except they contain a hydrogen group on the 3’ carbon instead of a hydroxyl group (OH) http://www.youtube.com/watch?v=6ldtdWjDwes Sanger sequencing we no longer use radiolabelling, but fluorescent labeling instead. By using a different fluorescent label for each ddNTP (say green for ddGTP, cyan for ddCTP etc) we can run all of the reactions in just one tube and run the mishmash in a capillary (a really skinny gel) which is automatically read by a computer to tell you what bases were added in what order. This produces what’s called a chromatogram, which looks like this: What’s next? next generation sequencing Sequencing workflow Blood Cancer Journal (2013) 3, e127; doi:10.1038/bcj.2013.26 Preparation of DNA libraries for WGS paired-end sequencing ~100bp are sequenced from each end of ~400-bp DNA fragments • single nucleotide variants (SNV), insertions and deletions and copy-number changes can be identified • low-input quantities of DNA (<1 μg) for generating the libraries mate-pair sequencing much larger DNA fragments than paired-end sequencing with fragments ranging in length from 1 to 10 kb longer distance between the read pairs enables improved detection of structural rearrangements Very low coverage of the genome is enough for studies focused on the detection of structural abnormalities, thus reducing costs and complexity of the analysis. On the other hand, if the genome is covered in enough depth (>30X mean coverage), mate-pair sequencing can be used for the simultaneous detection of mutations, copy-number changes and structural abnormalities. disadvantage: a large quantity of DNA is required for the library preparation, thus limiting its use in a significant number of tumors Whole exome sequencing (WES) • χρήσιμο για τη μελέτη των εξωνιών (coding genome) • η μέθοδος βασίζεται σε ένα αρχικό στάδιο ενίσχυσης των εξωνίων και στη συνέχεια ακολουθεί sequencing • Remember: the exome represents only 1.4% of the genome Ιδανικά θα πρέπει να μελετηθεί ταυτόχρονα και DNA αναφοράς (nontumoral, reference DNA sample) π.χ. δέρμα Εάν δεν υπάρχει χρησιμοποιούνται δημόσια διαθέσιμες βάσεις δεδομένων όπως dbSNP, HapMap και 1000 genomes για να διακρίνουμε φυσιολογικές γενετικές παραλλαγές από επίκτητες μεταλλάξεις The choice between exome or genome ultimately depends on cost and the need for non-coding data for clinical assessment Blood Cancer Journal (2013) 3, e127; doi:10.1038/bcj.2013.26 RNA sequencing (RNAseq) • Σημαντικά πλεονεκτήματα έναντι gene expression arrays • Ανίχνευση υβριδικών μεταγράφων και προέρχονται από εναλλάκτικό μάτισμα ισομορφών που • Βασικό: χαρακτηρισμός του transcriptome χωρίς προηγούμενη γνώση - οι μικροσυστοιχίες βασίζονται στη χρήση γνωστών αλληλουχιών που χρησιμοποιούνται ως markers • ανίχνευση miRNAs και άλλων non coding RNAs https://cm.jefferson.edu/learn/laboratory_technologies.html types of sequencing Chromatin immunoprecipitation (ChIP)sequencing • Αναγνωρίζει τις θέσεις πρόσδεσης στο DNA για μια συγκεκριμένη πρωτεϊνη που μας ενδιαφέρει, π.χ. ιστόνες και μεταγραφικοί παράγοντες • Χρησιμοποιείται αντίσωμα έναντι της πρωτεΐνης και ακολουθεί ανοσοκαθήλωση του συμπλέγματος – απομακρύνονται στη συνέχεια τα κομμάτια του DNA και ακολουθεί sequencing • Συμπληρωματικό του γονοτύπου και της ανάλυσης έκφρασης https://cm.jefferson.edu/learn/laboratory_technologies.html Τι είναι καλύτερο? • Εξαρτάται από το τί θέλουμε να μελετήσουμε... • WGS τα συμπεριλαμβάνει όλα αλλά έχει περιορισμούς: κόστος, data storage και intensive computational analysis • WES πιο καθιερωμένο για ανάλυση κωδικοποιούμενων περιοχών με χαμηλό κόστος – ωστόσο αποκλείει από την ανάλυση το 98% του γονιδιώματος • Encyclopedia of DNA Elements Project: >80% of the genome is biochemically active Συμπερασματικά... Data generation is just a small facet of the much bigger challenge associated with data analysis team, train, triumph ευχαριστώ θερμά Ίδρυμα Ελληνικής Αιματολογικής Εταιρείας Computational Medicine, Jefferson Medical College, TJU Prof Isidore Rigoutsos Prof Evangelos Briasoulis
© Copyright 2024 Paperzz