Νεώτερες τεχνικές γενετικού και μοριακού ελέγχου

Νεώτερες τεχνικές γενετικού και μοριακού ελέγχου
Ελευθερία Χατζημιχαήλ, MD, PhD
Αιματολόγος
Αιματολογική Κλινική, ΠΓΝ Ιωαννίνων
the basics… of the basics
Human genome
•
3 δισεκατομμύρια βάσεις(3 Gb)
•
20,000 γονίδια που κωδικοποιούν
για πρωτεΐνες (the human 'exome’),περίπου το 1% του γονιδιώματος
•
+ ?junk DNA
DNA είναι οργανωμένο σε σχηματισμούς που ονομάζονται χρωμοσώματα.
Η χρωματίνη και οι σχετιζόμενες πρωτεΐνες συμμετέχουν στη λειτουργία του
DNA
Nature 7:233, 2007
The central dogma
Γονίδια είναι οι περιοχές του DNA που
κωδικοποιούν για πρωτεΐνες.
Οι περιοχές που κωδικοποιούν για πρωτεΐνες
καθορίζονται από την παρουσία εξονίων, τα
οποία αποτελούνται από κωδικόνια, δηλ.
τριπλέτες νουκλεοτιδίων που αντιστοιχούν σε
αμινοξέα ή που τερματίζουν τη μετάφραση.
Οι περιοχές μεταξύ των εξονίων που δεν
κωδικοποιούν για πρωτεΐνες ονομάζονται
ιντρόνια. Με το μάτισμα (splicing) τα ιντρόνια
απομακρύνονται.
Alternative splicing: ένα γονίδιο, πολλαπλά
μετάγραφα, πολλαπλές πρωτεΐνες
Cancer is a genetic disease
• Χρωμοσωμικές ανωμαλίες
• αριθμητικές, δομικές
• μεταλλάξεις
Διαταραχή έκφρασης γονιδίων
27-Sep-13
mutations
• By effect on structure
Small-scale mutations
Point mutations
• By effect on function
• Loss-of-function mutations
• Gain-of-function mutations
• Silent mutations
• Missense mutations
• Nonsense mutations
Insertions
Deletions
Large-scale mutations
• By impact on protein sequence
• Frameshift mutation
• Nonsense mutation
Amplifications (or gene duplications)
• Missense mutations or nonsynonymous
mutations
Deletions
• Neutral mutation
Chromosomal translocations
• Silent mutations
Chromosomal inversions
Loss of heterozygosity
Examples of mutations
(by impact on protein
sequence)
Panel A shows the normal sequence
of DNA from one exon and the
protein product it encodes.
Panel B shows a silent mutation,
Panel C a conservative missense
mutation (serine and threonine have
very similar structures),
Panel D a nonconservative missense
mutation (serine and proline have
very different structures),
Panel E a nonsense mutation, and
Panel F a frame-shift mutation.
In Panel F, the insertion of a single G
throws off the reading frame, so that
all amino acids downstream are
changed radically.
N Engl J Med 2002; 347:1512-1520 November 7, 2002
the basics… in MDS
Myelodysplastic syndromes
When genetics meets
epigenetics:
mutations in epigenetic modifiers
•
•
•
•
hypermethylation of promoter-associated CpG islands
response to DNMTi
no correlation between abnormal epigenetic profiles and response to DNMTi therapy
?initiating mechanism in MDS downstream consequences of other pathogenic
mechanisms
missense mutations and are rarely cooccurring
prognosis in MDS
• Cytogenetics, marrow blast percentage, cytopenias
• Hb (transfusion dependence), neutrophil count, platelet count
IPSS (-R)
• age, performance status, serum ferritin, and lactate dehydrogenase levels
• Mutations – 70% -- most common TET2 (20%)
the basics… of the techniques
FISH
What is FISH?
• μια τεχνική που χρησιμοποιείται για να ανίχνευση την παρουσία
ή την απουσία και την περιοχή μια συγκεκριμένης γονιδιακής
αλληλουχίας
• μπορεί να «οπτικοποιήσει» συγκεκριμένες κυτταρογενετικές
ανωμαλίες (αριθμητικές χρωμοσωμικές ανωμαλίες, απαλείψεις,
ενισχύσεις, μεταθέσεις)
Κάθε ιχνηθέτης σημασμένος με φθοριόχρωμα μετά τον υβριδισμό θα
εμφανίζεται ως φωτεινή κουκίδα
Διπλοειδείς πυρήνες θα έχουν δύο φωτεινά σήματα
Εάν υπάρχει διπλασιασμός της υπό μελέτης περιοχής θα υπάρχουν
περισσότερα σήματα
Εάν υπάρχει απώλεια της υπό μελέτη περιοχής θα έχει ως αποτέλεσμα
μία ή καμία κουκίδα
Principles of FISH
a centromeric probe for chromosome 12, labelled with a green fluorochrome, is
used in conjunction with probes specific for 13q14 (red label) and 13q34 (blue
label).
microarrays…not so micro!
Microarrays - μικροσυστοιχίες
Μεμβράνη ή γυάλινη επιφάνεια
που περιέχει ιχνηθέτες που
αντιστοιχούν σε γενωμικές
περιοχές ενδιαφέροντος,
(arranged in a regular, matrixlike pattern)
Η ένταση του σήματος από
κάθε σημείο εξαρτάται από την
ποσότητα του στόχου που
υβριδίζεται με τον ιχνηθέτη
που βρίσκεται στην επιφάνεια
Microarrays - μικροσυστοιχίες
Applications 1) identification of a targeted sequence (gene, gene mutation,
transcript of interest); and 2) determination of the expression level, i.e.
abundance of the targeted sequence (RNA to be queried is first reversetranscribed into cDNA which is then allowed to hybridize with the microarray
probes).
The process of measuring gene expression via cDNA is called expression
analysis or expression
profiling (GEP)
Comparative genomic
hybridization (CGH)
©2007 Signature Genomic Laboratories, LLC
Expensive
Inability to detect several Mutational Events
Haematological malignancies NEED More
SNPs
Definition of SNPs
• At specific sites some people may have (for instance) a G, while others might have an A
these sites are called single nucleotide polymorphisms, or SNPs.
A SNP is defined as a DNA sequence variation at one specific position in the
genome that occurs in at least 1% of the human population
a mutation is a change of the nucleotide sequence of the genome of an organism
•
Each of the two bases that can occur at the SNP is called an allele.
• By convention, the most common allele at each SNP is called A and the less common SNP
is called B. Since there are two copies of each chromosome (except for X and Y in males),
there are three possible pairs of alleles for each SNP: AA, AB, and BB.
•
For each SNP, an individual’s genotype is the specific combination of alleles
that it possesses
SNP array design
ο σχεδιασμός του SNP chip είναι παρόμοιος με τις μικροσυστοιχίες
έκφρασης (expression arrays)
• ολιγονουκλεοτιδικές αλληλουχίες στην επιφάνεια (25 bp)= probes
• Το δείγμα DNA ενισχύεται, ένας ιχνηθέτης προσδένεται και υβριδίζεται
στην μικροσυστοιχία
• Η μικροσυστοιχία σκανάρεται για να εκτιμήσει την ποσότητα του
δείγματος που έχει προσδεθεί στα ολιγονουκλεοτίδια
• Για τα SNPs, υπάρχει ζεύγος probe: ένας για κάθε αλλήλιο
SNP arrays
5 εκατομμύρια SNPs έχουν αναγνωρισθεί στο ανθρώπινο
γονιδίωμα
Σήμερα σε microarray platforms 300,000 to 500,000 SNPs μπορούν να
ανιχνευθούν ταυτόχρονα
• ανίχνευση ελλείψεων, ενισχύσεων
• virtual karyotype using software to determine the copy number of each
SNP on the array (since the signal is quantitative) and then align the SNPs
in chromosomal order
• ανίχνευση loss of heterozygosity (LOH) με τη σύγκριση με patient’s
germline DNA
• Loss of heterozygosity σημαίνει απώλεια ενός αλληλίου σε μια
συγκεκριμένη περιοχή (ή περιοχές); Σχετίζεται με την ογκογένεση όταν η
απώλεια αφορά σε κάποιο ογκοκατασταλτικό γονίδιο (συνήθως το άλλο
αλλήλιο μεταλλαγμένο)
SNP arrays και CGH μπορούν να ανιχνεύσουν LOH
αλλά…
η SNP array analysis είναι η μοναδική τεχνική που
ανιχνεύει CNLOH ή UPD
Copy neutral LOH
•
During the establishment of the neoplastic clone, a segment of one chromosome is lost
and replaced by the same region of its homologous chromosome, resulting in segmental
LOH.
•
CNLOH can involve a whole chromosome (also known as UPD) or only a segment of a
chromosome (partial UPD)
• CNLOH represents an important mechanism by which point mutations or other microlesions can be
established in a homozygous state detectable by SNP array analysis.
• in cancer homozygosity for a mutation in one allele of a tumor suppressor gene or oncogene, together
with loss of the wild-type allele
•
the presence of a segment of CNLOH in a neoplastic clone could have a role in molecular
pathogenesis or could be unrelated to pathogenesis
•
this passenger-versus-driver issue can be partially addressed by analyzing a large patient
cohort and using statistical approaches
•
matched normal genomic DNA essential!
SNP arrays and pitfalls
SNP array (250K) in MDS επικεντρωμένη σε CNLOH, ανίχνευσε τη
διαταραχή στο 46% των 119 ασθενών.
• δεν υπήρχαν paired DNA samples
• σε συγκριτική μελέτη 13 περιπτώσεων με paired samples 12 από αυτές τις
CNLOH περιοχές ανιχνεύθηκαν και στο normal DNA (=όχι κλωνική επίκτητη
διαταραχή)
Prevalence and prognostic significance of allelic imbalance by single-nucleotide polymorphism analysis in
low-risk myelodysplastic syndromes. Blood. 2007;110(9):3365-3373.
The promise…
sequencing
Sanger sequencing (chain termination)
•
•
•
DNA has to be denatured into single
strands using heat.
a primer is annealed to one of the template
strands. This primer is specifically
constructed so that its 3' end is located
next to the DNA sequence of interest.
once the primer is attached to the DNA,
the solution is divided into four tubes
labeled "G", "A", "T" and "C"
Dideoxynucleotides are essentially the same as nucleotides except they contain a hydrogen group on the 3’
carbon instead of a hydroxyl group (OH)
http://www.youtube.com/watch?v=6ldtdWjDwes
Sanger sequencing (chain termination)
Sanger sequencing (chain termination)
Sanger sequencing (chain termination)
a phosphodiester bond cannot form
between the dideoxynucleotide and
the next incoming nucleotide, and
thus the DNA chain is terminated
Dideoxynucleotides are essentially the same as nucleotides except they contain a hydrogen group on the 3’
carbon instead of a hydroxyl group (OH)
http://www.youtube.com/watch?v=6ldtdWjDwes
Sanger sequencing
we no longer use radiolabelling, but fluorescent labeling instead. By using a
different fluorescent label for each ddNTP (say green for ddGTP, cyan for
ddCTP etc) we can run all of the reactions in just one tube and run the mishmash in a capillary (a really skinny gel) which is automatically read by a
computer to tell you what bases were added in what order. This produces
what’s called a chromatogram, which looks like this:
What’s next?
next generation sequencing
Sequencing workflow
Blood Cancer Journal (2013) 3, e127; doi:10.1038/bcj.2013.26
Preparation of DNA libraries for WGS
paired-end sequencing
~100bp are sequenced from each end of ~400-bp DNA fragments
• single nucleotide variants (SNV), insertions and deletions and copy-number
changes can be identified
• low-input quantities of DNA (<1 μg) for generating the libraries
mate-pair sequencing
 much larger DNA fragments than paired-end sequencing with fragments ranging
in length from 1 to 10 kb
longer distance between the read pairs enables improved detection of structural
rearrangements
 Very low coverage of the genome is enough for studies focused on the detection
of structural abnormalities, thus reducing costs and complexity of the analysis.
On the other hand, if the genome is covered in enough depth (>30X mean
coverage), mate-pair sequencing can be used for the simultaneous detection of
mutations, copy-number changes and structural abnormalities.
 disadvantage: a large quantity of DNA is required for the library preparation,
thus limiting its use in a significant number of tumors
Whole exome sequencing (WES)
•
χρήσιμο για τη μελέτη των εξωνιών (coding genome)
•
η μέθοδος βασίζεται σε ένα αρχικό στάδιο ενίσχυσης των εξωνίων
και στη συνέχεια ακολουθεί sequencing
•
Remember: the exome represents only 1.4% of the genome
Ιδανικά θα πρέπει να μελετηθεί ταυτόχρονα και DNA αναφοράς (nontumoral, reference DNA sample) π.χ. δέρμα
Εάν δεν υπάρχει χρησιμοποιούνται δημόσια διαθέσιμες βάσεις
δεδομένων όπως dbSNP, HapMap και 1000 genomes για να διακρίνουμε
φυσιολογικές γενετικές παραλλαγές από επίκτητες μεταλλάξεις
The choice between exome or genome ultimately depends on cost and
the need for non-coding data for clinical assessment
Blood Cancer Journal (2013) 3, e127; doi:10.1038/bcj.2013.26
RNA sequencing (RNAseq)
• Σημαντικά πλεονεκτήματα έναντι gene expression arrays
• Ανίχνευση υβριδικών μεταγράφων και
προέρχονται από εναλλάκτικό μάτισμα
ισομορφών
που
• Βασικό: χαρακτηρισμός του transcriptome χωρίς προηγούμενη
γνώση - οι μικροσυστοιχίες βασίζονται στη χρήση γνωστών
αλληλουχιών που χρησιμοποιούνται ως markers
• ανίχνευση miRNAs και άλλων non coding RNAs
https://cm.jefferson.edu/learn/laboratory_technologies.html
types of sequencing
Chromatin immunoprecipitation (ChIP)sequencing
•
Αναγνωρίζει τις θέσεις πρόσδεσης στο
DNA για μια συγκεκριμένη πρωτεϊνη
που μας ενδιαφέρει, π.χ. ιστόνες και
μεταγραφικοί παράγοντες
•
Χρησιμοποιείται αντίσωμα έναντι της
πρωτεΐνης
και
ακολουθεί
ανοσοκαθήλωση του συμπλέγματος –
απομακρύνονται στη συνέχεια τα
κομμάτια του DNA και ακολουθεί
sequencing
•
Συμπληρωματικό του γονοτύπου και
της ανάλυσης έκφρασης
https://cm.jefferson.edu/learn/laboratory_technologies.html
Τι είναι καλύτερο?
• Εξαρτάται από το τί θέλουμε να μελετήσουμε...
• WGS τα συμπεριλαμβάνει όλα αλλά έχει περιορισμούς: κόστος,
data storage και intensive computational analysis
• WES πιο καθιερωμένο για ανάλυση κωδικοποιούμενων περιοχών
με χαμηλό κόστος – ωστόσο αποκλείει από την ανάλυση το 98%
του γονιδιώματος
• Encyclopedia of DNA Elements Project: >80% of the genome is
biochemically active
Συμπερασματικά...
Data generation is just a small facet of the much bigger challenge
associated with data analysis
team, train, triumph
ευχαριστώ θερμά
Ίδρυμα Ελληνικής Αιματολογικής Εταιρείας
Computational Medicine, Jefferson Medical College, TJU
Prof Isidore Rigoutsos
Prof Evangelos Briasoulis