Epigenetika - metylace DNA
Jan 16, 2016
Epigenetika- metylace DNA
Metylace DNA u Eukaryot
nemetylovaná DNA: kvasinka Saccharomyces cerevisiae, octomilka Drosophila (málo), kroužkovci, hlístice Caenorhabditis
savci: 3-8 % cytosinových zbytků, CG sekvence(u embryonálních kmenových buněk i v non-CG kontextu)- nízký výskyt CG v repetitivních heterochromatinových oblastech (mutageneze metylC)
rostliny: 25-30 % cytosinových zbytků (~ velikosti genomu)- především v repetitivních heterochromatinových oblastech(pravidelný výskyt nemetylovaných míst – SAR, MAR)- u větších genomů (obiloviny) ostrovy transkripčně aktivní DNA s nižším obsahem metC - metC (CG) je ale i v kódujících sekvencích exprimovaných genů!!!
Úloha a projevy metylace DNA- dědičná (mitoticky a částečně i meioticky) modulace transkripce - genové exprese
- obranný mechanismus vůči invazní DNA (transpozóny)- regulace genové exprese (ontogeneze, diferenciace a
buněčná paměť, reakce na stres) - parentální imprinting
- modulace struktury chromatinu (příčina i následek)- časování DNA replikace- regulace homologní rekombinace (meiosa)- definování hranic exon-intron
- nástroj evoluce - genomů polyploidních rostlin (rozsáhlé změny metylace)- nových genů (mutageneze pseudogenů)
Metylace DNA u Arabidopsis
„Chromosome epigenetic landscape“
? ?
Silná metylace v repetitivních heterochromatinových oblastech v okolí centromery
Metylace genů (CpG)Metylace v kódujících sekvencích genů – více než 30 % exprimovaných genů (metylace především u genů se stabilní expresí – house keeping)
Metylace v promotorech – u méně než 5 % genů (geny s vývojově a pletivově specifickou expresí)
Coleman-Derr and Zilberman 2012
- metylace DNA brání inkorporaci H2A.Z- H2A.Z patrně nevhodný/neumožňuje stabilní transkripci (house-keeping genů)
( )
Mechanismus metylace DNA
- metylace bází - cytosinu a adeninu (bakterie – restrikce cizorodé DNA)
Eukaryota - biologicky významná metylace cytosinu na C5 purinového kruhu (u savců i hydroxymethylC)
N
N
NH
C*
H
O
CH3
5-methyl cytosine
N
N
NH
C
H
O
cytosine
+ SAM N
N
OH
TO
CH3
thymine
+ H2O- NH3
„horký bod mutageneze“
Mutace zprostředkované metylací C
C TmetC G
TG
CG
TA
Možná role v evoluci genů (hypotetický scénář):- zdvojení sekvencí (např. po polyploidizaci) navodí metylaci - metylace navodí reversibilní inaktivaci- mutace metC může navodit irreversibilní inaktivaci - kopie genu může být postupně masivně mutována
(bez selekčního tlaku)
- vznik a reaktivace genu s novou funkcí (x model EAC)
replikace reparace
Metylace DNA – cílové sekvence- symetrické (palindromatické), polosymetrické i nesymetrické sekvence:
5’ -------CG-------CHG----------C---C------G--C---- 3’3’ -------GC-------GDC----------G---G------C--G---- 5’
Symetrické sekvence – snadné udržování při replikaci hemimetylovaný stav je signálem pro udržovací metylaci
----C*G------------- C*HG---------- C* ----------------C*G ---- ---- G C------------ G DC-----------G ----------------G C*----
-----CG -------------CHG -----------C-------------GC* -------------GDC*-----------G--------
Asymetrické sekvence – nutno neustále metylovat de novo (principielně je ale také udržovací, pokud byla na mateřském vlákně)
- signál: metylace histonů a sRNAs
(H = A, T nebo C; D = A,T,G)
Rostlinné cytosin 5-metyltransferázy
- 3 rodiny u Arabidopsis
MET1 (metyltransferase)
CMT3 a CMT2 (chromomethyltransferase, „chromomethylase“)
DRM2 (a DRM1) (domain rearranged methyltransferase)
MET1 (metyltransferase1)
- příbuzná savčí Dnmt1
- udržovací metylace symetrických CG
- asociovaná s replikací
- spoluúčast komplexu remodulujícího nukleosómy DDM1 (u heterochromatinových sekvencí)
Signál – hemimetylovaná CG sekvence
----C*G------------- C*HG---------- C* ----------------C*G ---- ---- G C------------ G DC-----------G ----------------G C*----
-----CG -------------CHG -----------C-------------GC*-------------GDC*-----------G--------
CMT3 (chromomethylase3)
- unikátní pro rostliny a houby (příbuzné savčím Dnmt1, ale navíc obsahují chromodoménu = doménu interagující s metK histonu
- asociovaná především s konstitutivním heterochromatinem (repetitivní sekvence, TE - retrotranspozóny)
- „udržovací“ metylace sekvencí CHG
- zřejmě kooperace s DDM1 (nukleozómy remodelující protein)
Aktivita podmíněna dimetylací histonu H3 na lyzinu K9 - (interakce zprostředkovaná chromodoménou)
----C*G------------- C*HG---------- C* ----------------C*G ---- ---- G C------------ G DC-----------G ----------------G C*----
-----CG ------------- CHG -----------C-------------GC* -------------GDC*-----------G--------
CMT2 (chromomethyltransferase2)
- příbuzná CMT3, rovněž obsahuje chromodoménu
- asociovaná s konstitutivním heterochromatinem
- „udržovací“ metylace sekvencí CHH
- kooperace s DDM1 (nukleozómy remodelující protein)
Aktivita podmíněna dimetylací histonu H3 na lyzinu K9 – (interakce zprostředkovaná chromodoménou)
----C*G------------- C*HG---------- C* ----------------C*G ---- ---- G C------------ G DC-----------G ----------------G C*----
-----CG ------------- CHG -----------C-------------GC* -------------GDC*-----------G--------
DRM2 a 1 (domain rearranged methyltransferase)
- příbuzné savčím Dnmt3, ale mají přeskupené domény- DRM1 – v časné fázi vývoje semen-„udržovací metylace“ asymetrických sekvencí CHH (CHG)
(euchromatin a okraje heterochromatinu)- regulace genové exprese, silencing - nutná spoluúčast katalyticky neaktivního paralogu DRM3 u
Arabidopsis
Cílové sekvence jsou určeny přítomností homologních siRNA= RNA-directed DNA Methylation (RdDM)
----C*G------------- C*HG---------- C* ----------------C*G ---- ---- G C------------ G HC-----------G ----------------G C*----
-----CG -------------CHG -----------C-------------GC* -------------GHC*-----------G--------
Udržovací metylace DNA(po replikaci)
Heterochromatin s histonem H1 (chromatin remodel. faktor DDM1)
- střední části dlouhých TE (kódující sekvence)- metylace řízena: H3K9me2 – CMT2, CMT3 (CHH, CHG)
hemimetylací – MET1 (CG)
Chromatin bez histonu H1 (chromatin remodel. faktor DRD1)
- okraje TE, krátké TE, geny- metylace řízena především siRNA (RdDM) – DRM2
(RdDM – iniciována na H3K9me2 a nemetyl. H3K4, viz dále u RNAi)
- metylace CG řízena hemimetylací – MET1
Zemach et al. 2013
Udržovací metylace transpozónů Střední části dlouhých TE – smyčka metylace DNA met. H3K9
Okraje TE, krátké TE – metylace řízena sRNA (RdDM)
- RdDM – možnost umlčení nových insercí (in trans)
- „smyčka“H3K9me2 – C*Hx spolehlivá, ekonomická
Význam?
Demetylace DNA
1) při replikaci s vyloučením aktivity udržovacích cytosin metyltransferáz (a histonových metyláz)
2) DNA glykosylázy(odštěpení metylcytosinu, reparací doplněn cytosin)
ROS1 REPRESSOR OF SILENCING – somatické buňky(k demetylaci nutný ROS3 – protein vázající RNA – sRNA ? mRNA)
DEMETER-LIKE (DML2, DML3) – somatické buňky DME1 DEMETER – parentální imprinting (endosperm)
Demetylace DNA ROS1 REPRESSOR OF SILENCING DEMETER-LIKE (DML2, DML3)
(částečně zastupitelné)
- aktivní ochrana reg. sekvencí genů (promotorů) před metylací
- vývojová aktivace genů (zrání rajčat)
- mutace v „demetylačních“ genech se projeví především nárustem metylace v 3’ a 5’ UTR
V metylačních (metyltransferázových) mutantech je demetylace utlumena (zpětná vazba).
ros1 dml2 dml3
WT
metylace
rel. nárůstmetylace
WT
Ovlivňování metylace DNA
- aplikace 5-azacytidinu – blokování aktivity MET1
- dihydroxypropyladenin (DHPA) – ovlivnění hladiny SAM
- inaktivace genů MET1, DDM1, CMT3, …(přirozené populace A. thaliana s mutantní CMT2 odolnější vůči teplotnímu stresu)
Projevy:
- různé: žádné až výrazné změny fenotypu (způsobené TE)- pohlavní reverze u knotovky (andromonoecie), fenotyp cycloidea u lnice, …
Reaktivace umlčených transgenů 5-azacytidinem
- inhibitor MET1 (5-azacytidin, AzaC) hemiMet?
deMet
Nocarová, Fischer, nepubl.
+ AzaC+ AzaC
Demethylated
- obnovení často jen přechodné!
Stérické důsledky metylace DNA- buněčná interpretace metylace DNA
• změny na úrovni histonů- posttranslační modifikace histonů
- SRA domény: metylace (SUVH family),- Metyl CpG-binding d.: deacetylace (HDAC)
- zastoupení různých forem histonů (H2A.Z) • změna vazby dalších interagujících proteinů
- regulátorů (aktivátorů a represorů) transkripce - proteinů zodpovědných za strukturu/modifikace chromatinu
příklad: MBD proteiny(metyl-CpG-binding domain)
- rostlinné MBD proteiny nemají TRD (transcription repression domain)
- specifita vazby je dána i dalšími interagujícími proteiny- kolokalizace a interakce s DDM1
- AtMBD5 interaguje i s C*HH
- MBD proteiny zřejmě interagují s histon modifikujícími proteiny (HDAC= histon deacetylázy)
Model komprimace chromatinuvazbou dimerizujícího AtMBD7
proteinu
Obdobné snížení množství H3K9me2 u mutantů kyp a cmt3
Autokatalytická smyčka - metylace CHG (CMT3) a dimetylace H3K9 (KYP, KRYPTONITE)
- transkripce indukuje demetylaci H3K9me2 (IBM1)
ROS1/ ROS3 ??? x
DRM2
„co je defaultní“ stav?
Metylace DNA a stav chromatinu- přehled
- prokázána korelace hypermetylace DNA a hypoacetylace histonů (pozdní replikace DNA)
- metylace DNA je dědičným signálem k deacetylaci histonů a kondenzaci chromatinu
- obdobné fenotypové změny při potlačení metylace (MET1) a deacetylace histonů (AtHD1)
- přítomnost histonu H2A.Z se vzájemně vylučuje s metylací DNA!!! (typicky v promotorech house-keeping genů), H2A.W je naopak společně s metylovanou DNA v heterochromatinu
Udržování epigenetického stavu – přehled
Heterochromatin- dimetylace H3K9 (KYP) je signálem pro metylaci CHG (i pro tvorbu siRNA)- metylace CHG je signálem pro metylaci H3K9
MET 1 – udržovací metylace C*G
KYP (SUVH5,6) – H3K9me2 CMT3 - C*HG (CMT2 – C*HH)
DRM2, (DRM1) – udrž. metylace CHH komplement. siRNA
Euchromatin- trimetylace H3K4 a zřejmě i demetylace H3K9 (IBM1) v souvislosti s transkripcí Pol II
transkripce IBM1 – demetylace H3K9, H3K4me3 (x tvorbě siRNA)
ROS1/ROS3, DML2, DML3 – demetC transkripce?, sRNA?
Vzájemná provázanost metylace DNA a struktury chromatinu
metC = modifikace
dvoušrouboviceDNA
post-translační
modifikace a varianty histonů
vazba interagujících
proteinůTF, RNA pol.,
MBD, …
Analýzy metylace DNA
Přímé (strukturní): - spektrofotometrie, HPLC (celkový stav)
- %metC- anti metC protilátky (na chromozómu …)
- lokalizace metC bohatých úseků chromozómů- pomocí restriktáz citlivých k metylaci
- detekce metC v konkrétním restrikčním místě - hydrogensiřičitanovým sekvenováním
- přesné určení C a metC v určité sekvenci- i v celém genomu (v kombinaci s moderními technikami sekvenování)
Nepřímé (funkční) – vztah mezi metylací a genovou expresí- např. sledování reaktivace umlčených genů
Analýzy metylace DNApomocí restrikčních endonukleáz citlivých k metylaci - štěpení, Southernova hybridizace - PCR, elektroforéza (méně spolehlivé)(izolace krátkých na geny bohatých fragmentů u velkých genomů - kukuřice)
A -----------C CGG-----------------------------------CmetCGG--------------------------C CGG----------------------
B -----------C CGG-----------------------------------C CGG--------------------------C CGG----------------------
- štěpení restriktázou citlivou k metylaci cílové sekvence PCR primer
elektroforéza a Southern
PCR a elektroforéza
A B A B
Analýzy metylace DNA1. hydrogensiřitanová modifikace, 2. shotgun sequencing
nebo PCR + sekvenace
1. denaturace---------C*C*---------C--------CC---C*C*------C------------C--
2. modifikace Cyt na Ura(5metC zůstává nezměněn)---------C*C*---------U--------UU---C*C*------U------------U--
3. PCR, sekvenace (WGS)
původní sekvence---------CC---------C-------- CC---CC------C------------C-----------G---------G--------GG---G------G------------G--
modifikovaná sekvence---------CC---------U--------UU---CC------U------------U-----------G---------A--------AA---G------A------------A--
Preferenční metylace exonů– souvislost s preferenčním výskytem nukleozómů na exonech (spoludefinování přechodu intron – exon a exon – intron)- současně zvýšený výskyt polymerázy II - zbrždění nukleozómem
Preferenční výskyt metC na vnější straně nukleozómů - souvisí s preferenčním výskytem C-G na vnější straně (stérické důvody)- lépe přístupný pro metyltransferázy
Cílová místa metylace DNA v chromatinové struktuře/sekvenci
Feature Value
DNA molecule Chr.1 Chr.2 Chr.3 Chr.4 Chr.5 SUM
Length (bp)Top arm (bp)Bottom arm (bp)
Base composition (%GC) Overall Coding Non-coding
Number of genes Gene density (kb per gene ) Average gene Length (bp) Average peptide Length (bp)
Exons Number Total length (bp) Average per gene Average size (bp)
Number of genesWith ESTs (%) Number of ESTs
29,105,11114,449,21314,655,898
33.444.032.4
6,5434.0
2,078
446
35,4828,772,5595.4247
60.8
30,522
19,646,9453,607,09116,039,854
35.544.032.9
4,0364.9
1,949
421
19,6315,100,2884.9259
56.9
14,989
23,172,61713,590,2689,582,349
35.444.333.0
5,2204.5
1,925
424
26,5706,654,5075.1250
59.8
20,732
17,549,8673,052,10814,497,759
35.544.132.8
3,8254.6
2,138
448
20,0735,150,8835.2256
61.4
16,605
25,53,40911,132,19214,803,217
34.544.132.5
5,8744.4
1,974
429
31,2267,571,0135.3242
61.4
22,885
115,409,949
25,498
132,98233,249,250
105,773
Genom Arabidopsis - statistika
Nižší obsah CG v nekódujících sekvencích může odrážet mutace C* → T