Bioinformatika - Proteomika Medzihradszky (Fölkl) Katalin Dept. of Pharmaceutical Chemistry, University of California San Francisco és Proteomikai Kutatócsoport, SzBK e-mail: [email protected]
Jan 15, 2016
Bioinformatika - Proteomika
Medzihradszky (Fölkl) KatalinDept. of Pharmaceutical Chemistry,
University of California San Francisco
és
Proteomikai Kutatócsoport, SzBK
e-mail: [email protected]
Bioinformatika úgy általában
• adatbázisok felépítése
• ezen adathalmazok statisztikai analízise, matematikai értelmezése
• szabályszerűségek meghatározása
• szabályok hasznosítása – predikciók pl. funkcióra, rokonságra, eredetre, szerkezetre stb.
Bioinformatika úgy általában
• „összehordott” adatokból építkezünk
• többnyire elmélet eleinte
• a gyakorlati hasznosítás majd a végén jön
• persze ez visszahat az elméletre
Mit lehet kiaknázni?
• genomiális adatbázisok
• fehérje szekvencia adatbázisok
• fehérje 3D szerkezeti adatbázisok
• stb, stb
Meghatározó faktor:
Mennyire megbízhatóak az adatok?
Proteomika
A sejt fehérjetartalmának kvalitatív és kvantitatív
jellemzése
Mi van jelen? Mennyi? Milyen formában?
Lokalizáció? Kölcsönhatások? Partnerek?
Problémák
• állandó dinamikus változások
• hatalmas mennyiségi különbségek
• igen eltérő fizikai tulajdonságok – még ugyanarra a géntermékre is
Még mindig „problémák”
Poszt-transzlációs módosítások
Idő-, faj-, állapot-, lokalizáció- stb. -függő
• permanens vs. dinamikus
• teljes vs. részleges
• jelentős vs. csekély méretváltozás
• hidrofil
• hidrofób
Nem árt érteni a biológiához!
Láthatóvá tenni a komplexitást...
Frakcionálni kell !
1D-, 2D-, multidimenziós módszerek
23
45
67 8
18
1716
15
19
14
910
11 1213
11D-SDS-PAGE
* Minden belemegy a gélbe, de kicsi a felbontás.
* Várhatóan fehérje-elegyeketkell analizálni
2D elfo
1. dimenzió: izoelektromos fókuszálás
→ pI szerint - pH 3-10
DE
savas vagy bázikus fehérjék NEM fókuszálódnak
membrán-fehérjék kicsapódnak
– ionos detergens nem használható
2. dimenzió: SDS-PAGE
1. spot7. spot
8. spot
2. spot
3. spot
4. spot
5. spot
6. spot
9. spot
pH: 3 4 5 6 7 8 9 10
2 proteins
2 proteins
3 proteins
2 proteins
1 protein
1 protein
4 proteins
1 protein
3 proteins
2D elfo másképpen
1. dimenzió: 16 BAC-PAGE
(pozitív „fejű” detergens)
2. dimenzió: SDS-PAGE
Minden belemegy a gélbe, de átlósan frakcionálódik – kis felbontás
Speciális 2D elválasztás
16-BAC
SDS
Pros35 10/14 (71%) 33%
Pros7 34/36 (94%) 63%
Pros6 12/12 (100%) 42%
Pros28.1 14/21 (66%) 54%
Pros29 19/23 (83%) 59%
Pros2 13/15 (86%) 42%
GC12000 13/14 (93%) 35%
ProsMA5 22/44 (50%) 56%
Pros25 12/15 (80%) 50%
Pros3 18/24 (75%) 53%
Pros26 6/15 (40%) 46%
Pros5 11/12 (92%) 26%
GC17331 11/23 (47%) 46%
l(2)05070 15/19 (79%) 72%
Festés
• Commassie Brillian Blue – kvanti
• Ezüst – érzékenyebb, de NEM kvanti
Trükkök:
• funkciós csoportra specifikus festés
• differenciál festés
2D-kromatográfia
1. dimenzió: kation - ioncsere
2. dimenzió: fordított fázisú HPLC
Követés: 215 nm-en → peptidkötés
Nyilván semmi hidrofób nem érvényesül ilyen körülmények között...
Reprodukálhatóság degradálódik az oszlop életkorával!
Ki is kell találni mit is válogattunk szét!
• Edman szekvenálás
→ N-terminuson blokkolt fehérjékkel, keverékkel nem megy
• Western-blot
→ tudni kell, hogy mit keresünk, és kell jó ellenanyag
alapötlet• Egy bizonyos fehérje adott specificitású
enzimmel emésztve szekvenciájára jellemző hasítási termékeket fog produkálni
• Ha a valóságos emésztményt az adatbázis „in-silico” eredményeivel összevetjük azonosítani tudjuk a fehérjét
Az összehasonlítás alapja csak valami biztosan megjósolható és egyértelműen meghatároztató
tulajdonság lehet: TÖMEG
A tömegspektrometria előnyei
• alkalmazható keverékekre
• blokkolt fehérjékre is
• kovalens módosítások azonosíthatóak
Detektálási érzékenység
• Edman szekvenálás – kb. 1 pmól - 10-12 M
• MS – kb. 5-50 fmól - 5x 10-15 - 10-14 M
• Western blot – kevesebb, mint 10-15 M
MS-alapú Proteomika
• Fordított bioinformatika:
mérési adatok + adatbázisok + algoritmusok → biológiai eredmények
Tudni illik valamit az analitikai módszerről
Mass Spectrometry 101
• Ionokat mérünk Matrix Assisted Laser Desorption Ionization
Electrospray Ionization – többszörösen töltött ionok
• Nagy vákuumban• quadrupole, Time-of-Flight, ioncsapda
MS → MH+ adatokMS-MS alias CID, CAD, PSD ...
→ szekvencia info
3000
2500
2000
1500
1000
500
0
15711570156915681567
1567.69 Monoizotópos tömegcsak C12, H1, N14, O16 and S32
← 1 C13
2 C13
3000
2500
2000
1500
1000
500
0
15711570156915681567
1567.69Felbontás: m/m = 1567.69/0.2
~ 8000
Miért is kell felbontás?
Normál peptid, 1000-es felbontás
Normál peptid, 10 000-es felbontás
Br-Trp-tartalmú peptid, 1000-es felbontás
Br-Trp-tartalmú peptid, 10 000-es felbontás
3+ töltésű peptid, kis felbontás
3+ töltésű peptid, nagy felbontás
492.26522Δ = 0.33426 = kb. 1/3
492.59948
Tömegmérés pontossága
0.1 Da mérési hiba egész jó 2 kDa-nál,
DE katasztrófális egy kis molekulánál
Relatív értéket adjunk meg!
pars per million
Milyen pontosan tudunk mérni?belső standarddal 20 ppm-en belül
± 0.02 Da @ 1000
külső standarddal 200 ppm-en belül
± 0.2 Da @ 1000
intakt fehérjékre 0.1%-on belül
± 100 Da @ 10 000
Gyenge jeleknél nem érvényesül a Gauss eloszlás!
Emésztési elegy MALDI-spektruma
Peptidek ESIMS analízise
200
150
100
50
0
Ion
Cou
nts
590585580575570565560
m/z
250
200
150
100
50
0
Ion
Cou
nts
57
2.4
57
2.2
57
2.0
57
1.8
57
1.6
57
1.4
57
1.2
57
1.0
57
0.8
m/z
[1-4
5]M
e
[1-4
5]M
e2
[1-45]Me3
[1-4
5]A
cMe
[1-4
5]A
cMe
2&
[1-4
5]M
e
[1-45]AcMe3& [1-45]Me2
[1-45]Me3
[1-4
5]A
cMe
[1-4
5]A
cMe
2
[1-45]AcMe3571.03(9+)
Intakt fehérjék MALDI-analízise7000
6000
5000
4000
3000
2000
1000
0
Inte
nsi
ty
50000400003000020000m/z
1569
6
2174
1
2458
5
2743
1
3400
63216
73126
6
4917
0
1791
217
010 x4
Intakt fehérje ESI-analízise
Ha ez így megy, minek egyáltalán emésztgetni?
Miért nem mérjük az intakt fehérjéket?
preparatív és interpretív akadályok
Minta-előkészítés
Legyen a fehérje hozzáférhető a hasításra:
→ denaturálás
→ diszulfid-hidak bontása
Emésztés, kémiai hasítás
Specifikus hasítások
• tripszin - Lys↓ Arg ↓
• endoproteáz Lys-C - Lys ↓
• endoproteáz Glu-C - Glu ↓ (Asp ↓)
• endoproteáz Asp-N - ↓Asp (↓Glu)
pH kb. 7.5 - 8
• CNBr (+75 %-os TFA) - Met ↓
Az analízis
• Egybemérjünk vagy frakcionáljunk?
MALDI vs ESIMS
LC-MALDI
LC-ESIMS
Mennyire kellene pontosan mérni a peptideket ?
MH+ = 1296.4 ± 0.3 ppm
• 9 különböző aminosav-összetétel
• 36292 különböző szekvencia
• 3 különböző elemi összetétel
Ile/Leu ThrVal/SerLeu GlyGlu/AlaAsp
Miért kell még szekvencia info?
• Keverékek
• Kovalens módosítások
• Izoformák
• Splice variants
• És ha nincs bent az adatbázisban?
Hogyan tegyünk szert a szükséges információra?
Feladat: → meghatározni a komponensek tömegét→ egyet fizikailag elkülöníteni→ „szétverni”
Műszeres megoldás: tandem tömegspektrometria, ionkapu, ioncsapda
Fragmentálás: post-source decay (PSD),
ütközéses aktiválás (CID/CAD), elektron-befogás (ECD)
Peptid fragmentáció
NH2-CH(R1)-CO-NH-CH(R2)-CO~ ~CO-NH-CH(Rn)-COOHyn-1 y1
yn-2 bn-1b2
(72) 159 256 371 534Ala-Ser-Pro-Asp-Tyr-Arg 637 550 453 338 175
bi= gyöksúly + 1
yi = gyöksúly + 19
A fragmentáció módszer- és készülék-függő!
60.04 S 130.09 y1-NH3 276.16 y2 399.21 b3+H2O 528.25 b4+H2O
70.07 R 138.07 H 277.14 HR-NH3 406.18 HRE-NH3 552.29 y4-NH3
84.08 K 147.11 y1 286.15 RE 415.23 y3-NH3 556.26 m3
87.09 R 197.10 a2 294.17 HR 423.21 HRE 569.32 y4
100.09 R 207.09 b2-H2O 336.18 a3-NH3 432.26 y3 575.30 m2
101.11 K 225.10 b2 353.20 a3 465.22 a4-NH3 583.32 m4
102.06 E 258.16 RE-28 363.19 b3-H2O 482.25 a4 584.27 m5
110.07 H 259.13 y2-NH3 364.17 b3-NH3 492.23 b4-H2O 625.33 m1
112.09 R 266.17 HR-28 381.20 b3 493.22 b4-NH3
129.10 K 269.12 RE-NH3 395.22 HRE-28 510.24 b4
SHREK - Elméleti MALDI-CID spektrum – MS product
131.0946 z1 242.1253 c2 353.2050 a3 416.2383 z3 527.2690 c4
197.1039 a2 260.1372 z2 398.2264 c3 482.2476 a4 553.2972 z4
SHREK – elméleti ECD fragmensek
Elméleti „spektrum”: → lehetséges fragmensek, egyenlő intenzitással
És egy valóságos spektrum
120
100
80
60
40
20
0
Ion
Co
un
ts
140012001000800600
m/z
300
250
200
150
100
50
0
Ion
Co
un
ts
600500400300200100
m/z
1478.771377.741320.75
1175.761074.66
987.58
930.55
817.45
702.43
615.40
y5
y15y14y13
y12y11
y10
y9
y8
y6
y7
516.31
175.11
187.10
118.02
72.07
74.05
V
T
C* 141.09
159.10
171.07
228.09
270.15
274.19
345.23459.27
y1
y2
y3y4
b2a2
GL
TSG-H2O
b3-H2O474.19TSGLD
363.14
GC*TS-28
327.17210.08
414.20
396.19
SGLDS-28-H2O
730.91(2+)
y152+
832.92(2+)
precursor ion
Arg
ValAla
Asn Gly Val
Ser
Asp
Leu Gly
Ser
ThrCys*
GlyThr
bioinformatika = bio + informatika
• Nem szabad elfelejtenünk, hogy biológiai mintákkal dolgozunk!
• és kémiailag is aktív vegyületekkel!
• Az algoritmus lehet tökéletes, csak a biológiai rendszer nem viselkedik!
Megtörtént a frakcionálás, az emésztés...Jön az analízis!
Mondjuk, MALDI
MS-mérés frakcionálatlan, vagy HPLC után
→ egy jellemző (?) MH+ sorozat
↓ MS-Fit
Peptide Mass Fingerprint – alapú fehérjeazonosítás
Mi lehet a baj?
→ aspecifikus hasítás, kovalens módosítás, szennyezés stb.
Nem mindig ilyen szép a menyasszony!
• azaz a PMF-alapú azonosítást meg kell erősíteni
MIÉRT??? – lásd előbb és később is...
• a „vád tanúja”: az MS-MS kísérlet eredménye
MS-MS eredményekkel is lehet keresgélni!
Független PMF és MS-MS azonosítás az igazi!
Elegánsabb az on-line LCMSMS
A nanoHPLC oszlopról minden megy a tömegspektrométerbe (250 nL/min)
ún. „adatfüggő” adatgyűjtés
1) MS mérés
2) Komputer kiválasztja a legintenzívebb iont
3) MS-MS mérés
MS + MS-MS combined total ion current
MS
MS-MS
Lekeresés csak MS-MS adatokkal
„script” – az összes MS-MS adatok megfelelő formába rendezve
az egyes spektrumokkal független lekeresés
az eredményeket viszont fehérjénként összegezzük
Nem igazi adatokhoz, hanem az elméleti spektrumhoz hasonlítunk!
Kovalens módosítások detektálása
• szerencsés esetben találhatunk ilyet is automatizált MS-MS analízissel
• lekereső programok lehetővé teszik a kovalens módosítások követését
Túl sok variációs lehetőség
rengeteg félreértelmezést okozhat !
Proteomic studies on Schistosoma mansoni G. Knudsen, J.H McKerrow, UCSF
* “waterborn” parasitic disease, 200 M people infected worldwide through their skin
* Intermediate host – Biomphalaria glabrata
* Enzymes in cercaria secretion are the key to infection
Illusztráció a teljes (nem faj-specifikus) adatbázis lekeresés előnyéről
It was assumed a simple mixture
• cercaria released from snails, rinsed • secretion triggered with skin lipid• solution collected, concentrated• 1D SDS-PAGE protein-fractionation• in-gel digestion with trypsin• LC/MS analysis Eksigent/Famous - 75 m ID PepMap column; 300 nL/min flow;
water/ACN/0.1% HCOOH mobile phase, gradient elution,
QSTAR; 1 sec MS/3 sec CID; single charged and dynamic exclusion
What did we find?
• cercaria surface proteins
• cercaria elastases, and glycolytic enzymes
• snail immune response proteins
• photosynthetic proteins
• human keratin
• bovine serum albumin!
Where did they come from?
• contamination from the cercaria
• SECRETION – the real stuff!
• contamination from the host
• lettuce - should we starve the snails?
• technician
• lab – should we clean the lab?
Eddig csak kvali volt...
Kvantitatív proteomika1) a frakcionálás szintjén
Pl. 2D gélek összehasonlítása vizuálisan, komputer programokkal, differenciál festéssel
2) az MS-analízis során
Az MS NEM kvantitatív módszer
* a különböző molekulák nem egyformán detektálhatók
pl. különböző peptidek relatív intenzitása nem tükrözi relatív mennyiségüket
* nem minden komponenst detektálunk az elegyekből
Hogy lehet ezt legyőzni?
csak nagyon hasonló peptidek relatív intenzitását vethetjük össze!
1) Jelöljünk két sejt-populációt hasonlóan, de megkülönböztethetően!
2) Keverjük össze az összes fehérjét!
3) A keveréket emésszük, analizáljuk!
És így kvantizhatunk!
Hogyan jelölhetünk?
• ICAT – Cys-oldalláncának alkilezése, könnyű (H8) és nehéz (D8) alkil-csoporttal
→ amiben nincs Cys, az kiesik
→ a deuterált vegyület retenciós ideje kicsit hosszabb
azonosítás: MS-MS alapon
kvanti: relatív intenzitásokból
ingadozás: van az 30% is!
Hogyan jelölhetünk?
• SILAC (stable isotope labeling)C13, N15, O18
tápanyaggal visszük be – jelölt aminosav→ Olyat kell választani, ami nem alakulhat át más
aminosavvá, illetve nem szintetizálódik a sejtbenTripszines emésztéshez Arg a menő!
a keveréket frakcionáljuk, emésztjük, analizáljuk azonosítás MS-MS alapon kvanti a relatív intenzitásból
Hogyan jelölhetünk?
• tripszines emésztés H2O18-ban
Két oxigén lép be, minden peptid jelölődik
Rengeteg információ
Még a szekvenálás is könnyebb, a C-terminális ionok csúsznak
DE beszárítás a normál emésztés után, hosszú enzimes inkubáció...
→ veszteségek, nem specifikus hasítások
Hogyan jelölhetünk?
• iTRAQ ™ (Applied Biosystems)
Nagyon ravasz jelölés!
• amino-csoportra (N-terminus, Lys)
• 4-féle stabil izotópos szerkezet, azonos additív tömeggel, de különböző fragmensekkel (m/z 114, 115, 116, 117)
azonosítás és kvanti az MS-MS adatokból!
Hasznos web-oldalak
ProteinProspector – http://prospector.ucsf.edu
MS-BLAST - http://dove.embl-heidelberg.de/Blast2/msblast.html
BLAST - http://www.ncbi.nlm.nih.gov/BLAST/
European Bioinformatics Institute - http://www.ebi.ac.uk/
Szekvencia-összehasonlítás -http://www.ebi.ac.uk/clustalw/index.html
MS kezdőknek - „What is mass spectrometry” - www.asms.org