NOVÉ METODY SEKVENOVÁNÍ
• První generaceSangerovo sekvenování (dideoxy metoda) od roku 1977
• Druhé generaceNext-generation sequencing (masivní paralelní sekvenování) od roku 2005Roche 454 (pyrosekvenování)Illumina (metoda cyklické reverzibilní terminace)IonTorrent, Solid AB…
• Třetí generace sekvenace jedné molekuly DNA, od roku 2012Pacific Biosystems „PacBio“ – (SMRT – single molecule realtime)
PyrosekvencováníDNA polymerasa
dNTP mix
ATP sulfurylasa
Adenosine 5 fosfosulfát
Luciferasa
Luciferin
Apyrasa
http://www.youtube.com/watch?v=nFfgWGFe0aA
I. Izolace genomové DNA a fragmentace na vhodné úseky(300-800 bp)
II. Zatupení konců a navázání adaptorové sekvence s biotinovou značkou (modrá) a druhé bez (červená)
III. Navázání na kuličky se streptavidinem
IV. Provedení emulsního PCR (červený a modrý primer)
V. Nanesení na mikrotitrační destičku
VI. Paralelní pyrosekvencování ve všech jamkách
Illuminametoda cyklické reverzibilní terminace
Příprava knihovny
zatupení konců
fosforylace 5'konců
A - přesah na 3'konci
TA navázání adaptorů
IlluminaHybridizace ssDNA templátu na čip
1. ssDNA templát hybridizujena kovalentně navázanoučipovou próbu A
2. Polymerace probíháextenzí navázané próby A
Illumina
Nově syntetizovaný řetězec
discard
Generování klonálních klastrů (zesílení signálu)
1. dsDNA jedenaturována
2. Nově syntetizovanýřetězec je kovalentněnavázán
3. Templát je odmyt
IlluminaGenerování klonálních klastrů
1. 3'konec templátu hybridizuje s próbou B
2. Tvorba "bridge" můstku
3. Polymerace probíhá opětextenzí od próby B
komplementární adaptorová sekvence
Illumina Generování klonálních klastrů
1. dsDNA je denaturována
Výsledek: dva kovalentněnavázané komplementární řetězce
Opakování cyklů
Generování klonálních klastrůblokace 3'konce
blokace 3'konce
blokace 3'konců zabraňuje extenzi při nespecifickém navázání primerů během vlastní sekvenace
PacBIO – single molekulové čtení
- nukleotidy značeny čtyřmi fluorochromy- velmi citlivá detekce- sekvenace v milisekundách a zeptolitrech
SMRT (Single molecule real-time)
pg10
Snímek 18
pg10 A ZMW is a hole, tens of nanometers in diameter, fabricated in a 100nm metal film deposited on a glass substrate. The small size of the ZMW prevents visible laser light, which has a wavelength of approximately 600nm, from passing entirely through the ZMW. Rather than passing through, the light exponentially decays as it enters the ZMW. Therefore, by shining a laser through the glass into the ZMW, only the bottom 30nm of the ZMW becomes illuminated. Within each ZMW, a single DNA polymerase molecule is anchored to the bottom glass surface using a proprietary technique. Nucleotides, each type labeled with a different colored fluorophore, are then flooded above an array of ZMWs at the required concentration. Diffusion at the nanoscale is incredibly fast. Within microseconds, labeled nucleotides travel down into the ZMW, surround the DNA polymerase, then diffuse back up and exit the hole. As no laser light penetrates up through the holes to excite the fluorescent labels, the labeled nucleotides above the ZMWs are dark. Only when they diffuse through the bottom 30nm of the ZMW do they fluoresce. When the correct nucleotide is detected by the polymerase, it is incorporated into the growing DNA strand in a process that takes milliseconds in contrast to simple diffusion which takes microseconds. This difference in time results in higher signal intensity for incorporated versus unincorporated nucleotides, which creates a high signal-to-noise ratio. Thus, the ZMW has the ability to detect a single incorporation event against the background of fluorescently labeled nucleotides at biologically relevant concentrations.galuszka; 13.3.2012
SROVNÁNÍplatforma Příprava
templátuchemismus Délka
jednoho čtení(bp)
Doba běhu
KapacitaRunuGb
Cena přístroje(USD)
ROCHE 454
Fragmentace + emulsní PCR
pyrosekvenování 700 8 hod. 0.5 500.000
ILLUMINA Fragmentace + „bridge“ PCR
Cyklická reverz. terminace
100 9 dní 120 654.000/120.000
PacBIO fragmentace SMRT 1700 hodiny 0.05 695.000
SOLID Fragmentace + emulsní PCR
Sekvenace ligací 50 14dní 50 600.000
ROCHE 454 + dlouhé běhy, lze dělat i de novo nekomplikované genomy (mikroorganismy)+ rychlé-- chyby v homopolymerních repeticích (AAAAAAAAA, GGGGGGGGGGG)
ILLUMINA + nejpoužívanější+ obrovský rozsah, resekvenace celého genomu v jednom běhu-- nízká multiplexita
PaCBIO + velmi levné, nejdelší čtení-- vysoká chybovost
největší význam DIAGNOSTIKA• zlevnit přesekvenování lidského genomu na 1.000 USD (do roku 2015)
(nové levnější přístupy: SOLID Applied Biosystems, HELIOS)
• CANCER GENOME ATLASkromě SNP a mutací, míra exprese, metylace, copy number variants
• TRANSCRIPTOME SEQUENCING (RNA-seq) – výhoda oproti DNA čipům je že 100% postihuje alternativní sestřih a alelickou variabilitu
• SINGLE MOLECULE SEQUENCING (Helios, PacBio) – preinplantačnídiagnostika
• SOLID PHASE CAPTURE – NimbleGene™ čip vyrobený pro vychytání kodujících sekvencí a regulačních oblastí z rozfragmentované genomickéDNA před vlastním sekvenováním
1
Snímek 22
1 The project scheduled 500 patient samples, more than most genomics studies, and used different techniques to analyze the patient samples. Techniques include gene expression profiling, copy number variation profiling, SNP genotyping, genome wide DNA methylation profiling, microRNA profiling, and exon sequencing of at least 1,200 genes. TCGA is sequencing the entire genomes of some tumors, including at least 6,000 candidate genes and microRNA sequencesDoc. Mgr. Petr Galuszka, Ph.D.; 13.11.2016
HapMap (haplotype mapping)mezinárodní program mapující lidskou druhovou variabilitu
• konsorcium vědců ze 6 států
• od roku 2002 – se sestavují mapy vzorců SNP vyskytující v rámci populací jednotlivých ras v Africe, Asii a Spojených státech
• cílem je dramaticky snížit celkový počet nalezených SNP (3.000.000)
• selektování těch, které souvisejí s geneticky podmíněnými nemocemi
1000 Genome Project
studium biologické rozmanitosti a genetického materiálu celé komunity (mikro)organismů přímo v jejich přirozeném prostředí bez nutnosti jejich
kultivace v laboratoři (např. z půdy, střevní mikroflora)
Metagenomika
Metagenom
celková genetická informace komunity
organismů
GenomX
celková genetická informace jednoho
organismu
Nextgenové sekvenování umožnilo rozvoj metagenomiky:
• Rychlé a levné sekvencování genomů jednotlivců• Nelze sekvencovat neznáme genomy, kvůli obtížnosti přiřazení (repetice) pouze ty u
kterých je znám homologický genom (stejného biologického druhu)
Střevní mikroflóra
P. J. Turnbaugh et al. (2006) An obesity-associated gut microbiome with increased capacity for energy harvest. Nature. Dec 21;444(7122):1027-31.
• Apendikální mikrobiální DNA z ob/ob, ob/+, +/+ myši
• Složení mikroflóry střeva závislé na obezitě• změny v zastoupení bakteriálních kmenů Bacteroidetes a
Firmicutes• změny v metabolickém potenciálu střeva (ukládání energie)
DNA mamuta - Mammoth Project
Hendrik N. Poinar et al (2006): Metagenomics to Paleogenomics: Large-Scale Sequencing of Mammoth DNA. Science Jan. 20, 311 (5759): 392-394.
•DNA extrahována z 1 g mamutí kosti (28000 let, Siberia) – 100 ml• DNA fragmenty 500 – 700 bp• „454“ sekvenování
• 28 miliónů bp• 302 692 čtení
• 45,4% čtení se přirovnalo se sekvencí slona afrického, 1,4% - s lidskou a 1,2% se psí sekvencí.
„De novo assembly“ nových genomů pomocí nextgenového sekvenování
• Mate-pair a pair-endové knihovny
• Kombinace dvou platforem s krátkým a dlouhým čtením
• Vhodný softwarový nástroj
Next-gen sequencingde novo Genome assemblyClaviceps truncatispora
NO EAS GENES DETECTEDClaviceps africana
RNA-seqClaviceps purpurea
transcriptome from different stages during infection:
• germinated spore in ovary
• sfacelium• sclerotium• mycelium
IPTLOG
Proteasomeactivator
IPTLOG
Proteasomeactivator
CK-specificcytochrome P450HsBAAdenosine
deaminaseUnknownproteinSRP40NIPA-like
protein
UnknownproteinSRP40NIPA-like
protein
IPTLOGUnknownprotein
Proteasomeactivator
Proteasomeactivator
FAD containingmonooxygenase
IPTLOG
Proteasomeactivator
CK-specificcytochrome P450HsBAAdenosine
deaminaseUnknownproteinSRP40 FAD containing
monooxygenase
IPTLOG
Proteasomeactivator
FAD containingmonooxygenase
C. purpurea
C. africana
C. fusiformis
C. paspali
C. truncatispora
CK-specificcytochrome P450
5.000bp
indole-3-pyruvate monooxygenase (YUCCA) – auxin biosynthesis
Adenosine deaminase
Yeast ADA is able to degradate cytokininswith reaction rate 1/10 of ADO
CPUR04171 CPUR04172 CPUR04173 CPUR04174 CPUR04175 CPUR04176 CPUR04177 CPUR04178
FAD containingmonooxygenase
CK-specificcytochrome P450
Comparative genomic of cytokinin cluster in genus Claviceps
DIAGNOSTIKAChIP-seq (chromatin imuno precipitation)
Methyl-seq
detekce CpG oblastí (epigenetika)využívá konverze cytidinu na uridin za pomocí bisulfidumethylovaný cytidin není konvertován