CRO GRID Aplikacije Modeliranje i simulacija savijanja proteina i katalitičke uloge enzima Izvješće za razdoblje 01.01.2004 – 1.12.2006. Prof. dr. sc. Zvonimir Maksić Institut “Ruđer Bošković” Zagreb, Studeni 2006.
Jan 11, 2016
CRO GRID Aplikacije
Modeliranje i simulacija savijanja proteina i katalitičke uloge enzima
Izvješće za razdoblje01.01.2004 – 1.12.2006.
Prof. dr. sc. Zvonimir Maksić
Institut “Ruđer Bošković”
Zagreb, Studeni 2006.
CILJEVI
Modeliranje i simulacija savijanja proteina i katalitičke uloge enzima
Ciljevi:
- Primjeniti moderne računske metode u analizi strukture i
dinamike bioloških sustava, konkretno peptida i malih proteina.
- Razraditi proceduru za simulaciju dinamike peptida i manjih proteina u fiziološkim uvjetima (MD simulacije), te proceduru analize rezultata dobivenih MD simulacijama (analiza MD trajektorija).
- Identificirati računski zahtjevne dijelove simulacije i analize koji bi se mogli ubrzati računanjem na GRID-u.
- Razviti vlastitu aplikaciju za GRID.
- Primjeniti alikaciju na složenije sustave.
METODE
Metode
- U simulaciji dinamike peptida korištena je metoda klasične molekulske dinamike (MD)
U toj metodi atomi u molekuli tretiraju se kao klasične čestice koje se gibaju u skladu sa
zakonima klasične mehanike. Sile koje djeluju na čestice izvode se iz funkcije
potencijalne energije odnosno iz parametara tzv. polja sila koji su dobiveni vrlo točnim
kvantno kemijskim računima. MD računi se svode na rješavanje Newtonovih jednadžbi
gibanja:
Fi = mi ai (1) (2)
U praksi se jednadžba (2) numerički integrira sa konačnim vremenskim korakom t koji
tipično iznosi 1-2 ps.
- U analizi rezultata korištene su metode analize glavnih komponenti (PCA) i clustering
analiza. Potrebne rutine za analizu preuzete su iz 'open source' paketa MMTSB
(Multiscale Modeling Tools for Structural Biology). Za procesiranje MD trajektorija
korišten open source alat ‘ptraj’.
-dUdri
= mid2ridt2
Znanstveni cilj projekta bio je ispitivanje postojanja specifičnih interakcija između peptida, tzv. sense-antisense interakcija. Te interakcije su izuzetno važne u teoriji molekulskog prepoznavanja. Premda je bilo dosta eksperimentalnih podataka koji su upućivali na postojanje specifičnih interakcija među peptidima, konačna eksperimentalna, a pogotovo teorijska potvrda nije postojala.
Kao modelni sustav za simulacije izabran je pentapeptid Met-enkefalin (peptid spada u endogene opioidne peptide koji su odgovorni za različite biološke procese od kojih je najbolje opisan proces ublažavanja boli).
Na primjeru tog peptida prvo je razrađena procedura za simulaciju dinamike peptida (MD simulacija). Testirana je tzv. replika exchange metoda koja se odnedavno koristi u simulacijama ovakvog tipa. Mi smo utvrdili da se ona može u većini slučajeva zamijeniti metodom neinteragirajućih replika, koja se pak može izvoditi na GRID-u jer ne zahtijeva komunikaciju među procesima Dobivena znanja pretočena su u tutorial za MD simulacije koji se može pronaći na adresi http://spider.irb.hr/tutorial
POSTIGNUTI REZULTATI - SIMULACIJA
POSTIGNUTI REZULTATI - SIMULACIJA
50 ps MD simulacije na 300 K s implicitnim otapalom
Primjer simulacije peptida Met-enkefalina u implicitnom otapalu – animacija trajektorije
Kako zapravo izgleda jedna tipična MD simulacija ?
POSTIGNUTI REZULTATI - SIMULACIJA
Primjer simulacije peptida Met-enkefalina u eksplicitnom otapalu (H2O) – animacija trajektorije
50 ps MD simulacije na 300 K sa eksplicitnim otapalom (kutija vode)
Animacije su vizalno dojmljive, ali što iz njih možemo zaključiti o ponašanju peptida?
GOTOVO NIŠTA!
POSTIGNUTI REZULTATI - ANALIZA
Problem koji je bilo potrebni riješiti, bio je problem analize trajektorija dobivenih MD simulacijama (posebno trajektorija dobivenih tzv. “replika exchange” metodom).
Rezultat simulacije od 1ns za Met-enkefalin koji ima 5 aminokiselina, u ‘kutiji’ vode dimenzija 27 Å, je datoteka veličine oko 16 GB (850 MB kad se izbaci voda), dakle radi se o ogromnoj količini podataka koju je potrebno analizirati. Ovaj problem u analizi identificiran je kao problem koji je moguće adekvatno riješiti pisanjem aplikacije za GRID.
Na primjeru gore spomenutog peptida razrađena je procedura za analizu MD trajektorija. Procedura je opisana u tutorialu koji se nalazi na adresi http://spider.irb.hr/tutorial2
Na osnovu definirane procedure opisane u “tutorialu 2” napisan je program koji nam je omogućio rutinsku analizu MD trajektorija. U analizi se koristi tzv. analiza glavnih komponenti (PCA) i klastering analiza. Program je korišten u analizi trajektorija modelnog sustava Met-enkefalina a kasnije je primijenjen i u analizi većeg sustava – hormona -MSH.
POSTIGNUTI REZULTATI - ANALIZA
Analiza: Clustering
Cluster 1, Pop. = 61%Cluster 2, Pop. = 13% Cluster 3, Pop. = 26%
Ace-Ile-Pro-Pro-Lys-Tyr-Nme
POSTIGNUTI REZULTATI - ANALIZA
Analiza glavnih komponenti (PCA)
Projekcija na vlastite vektore matrice kovarijance
Ace-Ile-Pro-Pro-Lys-Tyr-Nme
POSTIGNUTI REZULTATI - ANALIZA
Analiza glavnih komponenti
Kombinirana sa clustering analizomAce-Ile-Pro-Pro-Lys-Tyr-Nme
POSTIGNUTI REZULTATI - ANALIZA
Analiza glavnih komponenti
Kombinirana sa ‘potential of mean force’ [-ln(M/Mtot)]
Ace-Ile-Pro-Pro-Lys-Tyr-Nme
POSTIGNUTI REZULTATI - ANALIZA
Analiza trajektorija dobivenih replika exchage dinamikom (REMD) je puno zahtjevnija
REMD -Istodobno izvršavanje nekoliko simulacija (replika) na različitim temperaturamapri čemu se dozvoljava njihova izmjena kada je ispunjen određen uvjet sličnosti
16 replika, svaka simulira 2.5 ns što znači da je ukupno vrijeme simulacije 40 ns. Temperaturni rasponje od 275K do 420K.
POSTIGNUTI REZULTATI - ANALIZA
REMD – analiza 4 temperature
Ace-Tyr-Gly-Gly-Phe-Met-Nme
POSTIGNUTI REZULTATI - ANALIZA
3’ → AUA-CCC-CCG-AAG-UAC → 5’Complementary mRNA (-)
N → Ile-Pro-Pro-Lys-Tyr→ CComplementary Peptide
3’ → AUA-CCC-CCG-AAG-UAC → 5’Complementary mRNA (-) 3’ → AUA-CCC-CCG-AAG-UAC → 5’Complementary mRNA (-)
N → Ile-Pro-Pro-Lys-Tyr→ CComplementary Peptide N → Ile-Pro-Pro-Lys-Tyr→ CComplementary Peptide
5’ → TAT-GGG-GGC-TTC-ATG → 3’Sense DNA
3’ ← ATA-CCC-CCG-AAG-TAC ← 5’Complementary DNA
5’ → UAU-CCC-GGC-UUC-AUG → 3’Sense mRNA (+)
N → Tyr-Gly-Gly-Phe-Met→ CSense Peptide
5’ → TAT-GGG-GGC-TTC-ATG → 3’Sense DNA 5’ → TAT-GGG-GGC-TTC-ATG → 3’Sense DNA
3’ ← ATA-CCC-CCG-AAG-TAC ← 5’Complementary DNA 3’ ← ATA-CCC-CCG-AAG-TAC ← 5’Complementary DNA
5’ → UAU-CCC-GGC-UUC-AUG → 3’Sense mRNA (+) 5’ → UAU-CCC-GGC-UUC-AUG → 3’Sense mRNA (+) 5’ → UAU-CCC-GGC-UUC-AUG → 3’Sense mRNA (+)
N → Tyr-Gly-Gly-Phe-Met→ CSense Peptide N → Tyr-Gly-Gly-Phe-Met→ CSense Peptide N → Tyr-Gly-Gly-Phe-Met→ CSense Peptide
Pro. Nat. Acad. Sci. 1985, 82, 1372
Što su zapravo sense i komplenetarni peptidi ?
POSTIGNUTI REZULTATI - ANALIZA
ArgArgArgArg
Ala
GlyGlyGlyGly
Pro
ProProProPro
Gly
CysCysTrpstop
Thr
Sense Complementary Sense Complementary
J . Theor. Biol. 1983, 100, 99
Svakoj aminokiselini iz sense peptida odgovara jedna ili dvije aminokiseline u komplementarnom peptidu
POSTIGNUTI REZULTATI - ANALIZA
Sense i koplementarni (antisense) peptid – postoji li specifična interakcija?
Ace-Tyr-Gly-Gly-Phe-Met-NmeAce-Ile-Pro-Pro-Lys-Tyr-Nme
POSTIGNUTI REZULTATI - ANALIZA
Analiza: Strukturna svojstva
Histogrami udaljenosti centara masa (COM) komplementarnih aminokiselina
POSTIGNUTI REZULTATI - ANALIZA
Analiza: Strukturna svojstva
Udaljenosti između centara masa komplementarnih peptida
i di
ni di
ni di
ni di
n
didi
i di
n
|di - dj|
n(n-1)i<j2
xi di
ni di
n
|di - dj|
n(n-1)i<j2 |di - dj|
n(n-1)i<j2
x
|di - dj|
n(n-1)i<j2 |di - dj|
n(n-1)i<j2 |di - dj|
n(n-1)i<j2
POSTIGNUTI REZULTATI - ANALIZA
Mjera komplementarnosti ?
Mjera komplementarnosti peptida
|di - dj|
n(n-1)i<j2 |di - dj|
n(n-1)i<j2
i di
n
|di - dj|
n(n-1)i<j2
xi di
ni di
n
|di - dj|
n(n-1)i<j2 |di - dj|
n(n-1)i<j2
x
POSTIGNUTI REZULTATI - ANALIZA
di i di
ni di
n
Strukture koje su unutar granične vrijednosti za komplementarnost
grupiraju se u dva klastera.
Te strukture čine 2% ukupnog konformacijskog prostora
POSTIGNUTI REZULTATI - ANALIZA
POSTIGNUTI REZULTATI - ANALIZA
Zaključak:
• Simulacije ukazuju na postojanje interakcija između Met-Enkefalina i njegovog antisense peptida.
• Simulacije također pokazuju da se 2% ukupnog broja struktura u simulacijimože smatrati strukturama sparenim prema definiciji komplementarnosti.
• Ovaj pristup simulaciji i analizi peptida koji smo razvili pokazao se vrlo obećavajućiu razumijevanju interakcija između sense i komplementarnih peptida.
۰ Analiza trajektorija dobivenih ‘replica – exchhange’ simulacijama pokazala se izuzetno zahtjevnom ۰ Količina podataka prelazi 16 GB za pentapeptid u kutiji vode veličine 27 Å. ۰ Analiza je zahtijevala izradu odgovarajućeg programa, koji je u početku napisan za izvršavanje na klasteru a kasnije je modificiran i prilagođen radu na GRID-u. ۰ Program je zamišljen tako da analizira podatke za svaku pojedinu temperaturu iz ‘replica exchange’ simulacije na zasebnom nodu unutar klastera odnosno na zasebnom računalu unutar GRID-a.۰ Analiza MD trajektorija sastoji se od posla koji se može razdijeliti na nekoliko neovisnih procesa (analiza pojedinih teperatura) i posla koji se mora izvršiti na jednom procesoru (dijeljenje trajektorije na n dijelova pri čemu je n broj temperatura). ۰ Da bi se takav kompleksan posao mogli izvršavati na GRID-u bilo je potrebno definirati ‘workflow’. To smo postigli pisanjem odgovarajuće CONDOR-DAGMAN skripte, te nekoliko CONDOR skripti. Program se na gridu pokreće izvršavanjem jedne skripte sa nekoliko argumenata: [TRAJEKTORIJA] [BROJ REPLIKA] [BROJ STRUKTURA] [TOPOLOGIJA] [RADIJUS KLASTERA]
POSTIGNUTI REZULTATI – PROGRAM ZA ANALIZU
Output programa čine slijedeće datoteke:Centroid.stats sadrži informacije o broju klastera i njihovoj populaciji
(statistika)CentroidI.member.dat (gdje je I broj klastera) sadrži strukture koje
su dio tog klasteraCentroidI.pdb (gdje je I broj klastera) sadrži kordinate centroida tog
klasteraClustI.crd (gdje je I broj klastera) je ASCII trajektorija tog
klasterabestI-J.pdb (gdje je I broj klastera a J je broj strukture najbliže
centroidu tog klastera) sadrži strukturu najbližu centroidu klasterapca-I.dat (gdje je I broj klastera) sadrži projekciju prve dvije
glavne komponente struktura u I-to klasterurmscI.dat (gdje je I broj klastera) sadrži rmsd struktura u
klasteru I u odnosu na centroid I-tog klasterarmsbI.dat (gdje je I broj klastera) sadrži rmsd struktura u
klasteru I u odnosu na strukturu najbližu centroidu klasteraProgram je testiran na analizi Met-enkefalina i kasnije je rutinski primjenjen
u analizi većeg peptida tzv. -melanocit hormona - peptida koji se sastoji od 13 aminokiselina.
POSTIGNUTI REZULTATI – PROGRAM ZA ANALIZU
POSTIGNUTI REZULTATI – PROGRAM ZA ANALIZU
Zaključak:
• Pokazali smo da je analizu trajektorija dobivenih ‘replica exchange’ MD
simulacijama moguće izvršavati na GRID-u.
• Napisan je program za analizu MD trajektorija prilagođen radu na
postojećoj CRO-GRID infrastrukturi i instaliranom middleware-u.
• Korištenjem programa na GRID-u analiza je ubrzana nekoliko puta u odnosu
analizu koja se prije izvršavala sekvencijalno na jednom računalu.
• Korištenjem programa sada je moguće rutinski analizirati i veće sustave
što smo demonstrirali na slučaju peptida -MSH (koji ima 13 aminokiselina)
i dimera -MSH i njegovog komplementarnog peptida.
POSTIGNUTI REZULTATI - SAŽETAK
Razrađena je procedura simulacije dinamike peptida, te procedura analize MD trajektorija.
Napisan je tutorial za simulaciju dinamike peptida (http://spider.irb.hr/tutorial ), te tutorial za analizu rezultata (http://spider.irb.hr/tutorial2/Tutorial2.htm)
Završene su simulacije dinamike peptida Met-Enkefalina i njegovog antisense peptida, te simulacije -melanocit hormona i njegovog antisense analoga. Završena je i analiza MD trajektorija za oba peptida. Dobiveni rezultati upućuju na postojanje specifičnih sense-antisense interakcija.
Napisan je program za analizu MD trajektorija i prilagođen radu na CRO-GRID-u. Napisana su dva znanstvena rada i poslana u časopis. Trenutno su u postupku
recenzije. Održano je nekoliko pozvanih predavanja na skupovima i nekoliko predavanja na
Institutu Ruđer Bošković. Prezentacije se mogu naći na http://spider.irb.hr/GRID/prezentacijee.htm
Sažetak postignutih rezultata:
Kadrovsko izvješće
Popis suradnika na podprojektu
Dr. sc. Borislav Kovačević Dr. sc. Danijela Barić Dr. sc. Robert Vianello Prof. dr. sc. Zvonimir Maksić
Dr. sc. David Smith