Top Banner
Ulf Leser Wissensmanagement in der Bioinformatik Molekularbiologische Datenbanken Grundlagen der Molekularbiologie
28

Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Sep 18, 2018

Download

Documents

vuongtuyen
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r

Wis

sens

man

agem

ent

in d

er

Bioi

nfor

mat

ik

Mol

eku

larb

iolo

gisc

he

Dat

enba

nke

nG

rund

lage

n de

r M

olek

ular

biol

ogie

Page 2: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

2

50th

anni

vers

ary

•25

.4.1

953

-Ja

mes

Wat

son,

Fra

ncis

Cric

k-

„Mol

ecul

ar S

truc

ture

of N

ucle

ic

Acid

s “-

Nat

ure,

1 p

age

-„T

his

stru

ctur

e ha

s tw

o he

lical

ch

ains

eac

h co

iled

arou

nd th

e sa

me

axis

•Ba

sed

on w

ork

by W

ilkin

s&

Fran

klin

Page 3: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

3

Cells

Page 4: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

4

Her

itabl

e In

form

atio

n

•Ce

ll nu

cleu

s

•Ch

rom

osom

es

•D

NA

•Th

e bl

uepr

int

of li

fe

Page 5: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

5

Des

oxyr

iboN

ucle

icA

cid

•Ch

rom

osom

e: s

trin

g of

DN

A•

Onl

y 4

diff

eren

t nu

clei

c ac

ids

•Fi

xed

pairs

: A-

T, G

-C•

Sam

e m

echa

nism

in a

ll sp

ecie

s

Page 6: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

6

Stru

ctur

e of

DN

A

Que

lle:

http

://w

ww

.nhg

ri.ni

h.go

v/

5’

3’

3’

5’

Nucleotide

Base

Page 7: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

7

DN

A St

rand

s

•D

NA

sing

le o

r do

uble

str

ande

d•

DN

A ha

s fix

ed o

rient

atio

n -

read

fro

m 5

’to

3’-

Stra

nds

are

antip

aral

lel

5’…

TACT

GAA

…3’

3’…

ATG

ACTT

…5’

Page 8: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

8

DN

A Rep

licat

ion

•M

itosi

s: C

ell r

eplic

atio

n•

Mei

osis

: Sp

ecie

s re

plic

atio

n

Page 9: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vor

lesu

ng, S

oSe

2003

9

Spec

ies

•Pr

okar

yote

s: c

ell n

ucle

us, d

iffer

entia

l spl

icin

g,

gene

reg

ulat

ion,

com

plex

ity•

Mod

el o

rgan

ism

Page 10: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

10

Gen

ome

•Se

t of

all

gene

s of

a s

peci

es is

its

geno

me

•H

uman

s-

App.

3.3

00.0

00.0

00 b

p-

22 c

hrom

osom

es +

2

sex

chro

mos

omes

-Le

ngth

50–

250

MB

Page 11: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

11

Hum

an G

enom

e Pr

ojec

t

•D

NA:

~

3.3

00.0

00.0

00 b

ase

pairs

•H

uman

Gen

ome

Proj

ect:

Seq

uenc

ing

the

com

plet

e H

uman

Gen

ome

(sch

edul

ed 2

005)

•W

orld

-wid

e Ef

fort

(G

erm

any:

sin

ce 1

996)

•“F

inis

hed”

in 2

000

-Ra

pid

impr

ovem

ent

in t

echn

olog

y-

Com

mer

cial

com

pani

es ju

mpe

d on

it (

Cele

ra)

•“A

lmos

t” f

inis

hed

in 2

001

•“R

eally

” fin

ishe

d in

200

3

Page 12: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

12

Sequ

enci

ng a

Gen

ome

gatcaattatagttgacttcagtcctgcctgattcatctcca

aaaatgtagtctgcctgattcatctcccaaaaatgtagctc

cgcttaaaggagctttcaagttgggggtggtgggccattc

agtgttgtcactaacagatgcatcttgtgggggtaaaatgt

cccaaagtatcttttcttgcttatgttcataagggcgctggtc

tggaatgtgccacatctgttctcactctgccatggactcctg

gaccctctgtgtgtccctttgtatcctggtagcgagtgagtc

ctcatgatttatcatcctcatgctgggcctctgtatagatga

•Br

eak

it up

into

ver

y sm

all p

iece

s•

Read

the

seq

uenc

e on

e-by

-one

•As

sem

ble

the

piec

es t

o co

ntig

s

Page 13: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

13

Wha

t do

es D

NA

tell

us ?

actt

tcct

cg g

cagc

ggta

g gc

gaga

gcac

gcg

gagg

agc

gtgc

gcgg

gg g

cccc

ggga

gac

ggcg

gcgg

tgg

cggc

gcg

ggca

gagc

aa g

gacg

cggc

g ga

tccc

actc

gca

cagcagc

gcac

tcgg

tg c

cccg

cgca

g gg

tcgc

gatg

ctg

cccg

gtt

tggc

actg

ct c

ctgc

tggcc

gcct

ggac

gg c

tcgg

gcgc

t gg

aggt

accc

act

gatg

gta

atgc

tggc

ct g

ctgg

ctgaa

cccc

agat

tg c

catg

ttct

g tg

gcag

actg

aac

atgc

aca

tgaa

tgtc

ca g

aatg

ggaag

tggg

attc

ag a

tcca

tcag

g ga

ccaa

aacc

tgc

attg

ata

ccaa

ggaa

gg c

atcc

tgcag

tatt

gcca

ag a

agtc

tacc

c tg

aact

gcag

atc

acca

atg

tggt

agaa

gc c

aacc

aacca

gtga

ccat

cc a

gaac

tggt

g ca

agcg

gggc

cgc

aagc

agt

gcaa

gacc

ca t

cccc

acttt

gtga

ttcc

ct a

ccgc

tgct

t ag

ttgg

tgag

ttt

gtaa

gtg

atgc

cctt

ct c

gttc

ctgac

aagt

gcaa

at t

ctta

cacc

a gg

agag

gatg

gat

gttt

gcg

aaac

tcat

ct t

cact

ggcac

accg

tcgc

ca a

agag

acat

g ca

gtga

gaag

agt

acca

act

tgca

tgac

ta c

ggca

tgttg

ctgc

cctg

cg g

aatt

gaca

a gt

tccg

aggg

gta

gagt

ttg

tgtg

ttgc

cc a

ctgg

ctgaa

gaaa

gtga

ca a

tgtg

gatt

c tg

ctga

tgcg

gag

gagg

atg

actc

ggat

gt c

tggt

ggggc

ggag

caga

ca c

agac

tatg

c ag

atgg

gagt

gaa

gaca

aag

tagt

agaa

gt a

gcag

aggag

gaag

aagt

gg c

tgag

gtgg

a ag

aaga

agaa

gcc

gatg

atg

acga

ggac

ga t

gagg

atggt

gatg

aggt

ag a

ggaa

gagg

c tg

agga

accc

tac

gaag

aag

ccac

agag

ag a

acca

ccagc

gcca

acga

ga g

acag

cagc

t gg

tgga

gaca

cac

atgg

cca

gagt

ggaa

gc c

atgc

tcaat

gacc

gccg

cc g

cctg

gccc

t gg

agaa

ctac

atc

accg

ctc

tgca

ggct

gt t

cctc

ctcgg

•D

NA

is ju

st a

str

ing:

[AC

TG]*

•In

hum

ans,

mos

t D

NA

is c

onsi

dere

d ju

nk•

All D

NA

is r

eplic

ated

, but

...

•...

onl

y D

NA

that

is t

rans

form

ed in

to

„som

ethi

ng“

mat

ters

Page 14: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

14

Cent

ral D

ogm

a

The

Cent

ral D

ogm

a of

Mol

ecul

arG

enet

ics

Page 15: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

15

Gen

e /

prot

ein

func

tions

•St

ruct

ure

-ce

ll w

all,

mem

bran

es, o

rgan

elle

s, ..

.•

Sign

al t

rans

duct

ion

-Si

gnal

rec

ogni

tion

(out

side

cel

l), t

rans

duct

ion,

and

re

actio

n•

Enzy

mat

ic c

atal

ysis

-Su

ppor

t fo

r ch

emic

al r

eact

ions

: re

spira

tion,

m

etab

olis

m, p

rote

in c

onst

ruct

ion/

deco

nstr

uctio

n, ..

.•

Tran

spor

t-

mRN

Afr

om n

ucle

us t

orib

osom

es, p

rote

ins

from

ribos

omes

to c

ell w

ell,

...

Page 16: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

16

Inte

ract

ion

of g

enes

/ p

rote

ins

KEG

G, 1

998

Pat

hw

ays

•M

etab

olic

pa

thw

ays

•Reg

ulat

ory

path

way

s•

Sign

al

tran

sduc

tion

path

way

s

Page 17: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

17

DN

A an

d G

enes

•G

enes

are

cod

ing

regi

ons:

DN

A ->

RN

A (

-> P

rote

in)

•Su

bjec

t to

evo

lutio

nary

prin

cipl

es:

mut

atio

n, s

elec

tion

•M

utat

ion

mig

ht c

hang

e ph

enot

ype

-ge

netic

dis

ease

•Co

mpl

ex r

egul

atio

n m

echa

nism

s

Page 18: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

18

No.

of

gene

s do

esn‘

t m

ean

... 3000

MB

30.0

00M

ouse

100

MB

18.0

00C.

ele

gans

1600

0 M

BW

heat

180

MB

13.0

00Fl

y33

00 M

B30

.000

Hum

anG

enom

e si

zeN

o of

gen

esSp

ecie

s

•G

enom

ic r

earr

ange

men

ts &

dup

licat

ions

•In

activ

atio

n•

Gen

e tr

ansf

er

Page 19: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

19

Gen

otyp

e -

Phen

otyp

e

•G

enes

are

diff

eren

t be

twee

n in

divi

dual

s-

Alle

les

•G

enot

ype:

se

t of

gen

es o

f an

indi

vidu

al•

Phen

otyp

e: a

ppea

ranc

e of

an

indi

vidu

al

-Vi

sual

fea

ture

s, b

ehav

iora

l fea

ture

s, s

usce

ptib

ility

to

dise

ases

, ...

•G

enot

ype

dete

rmin

es p

heno

type

-To

wha

t ex

tend

?

Page 20: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

20

From

Gen

es t

o Pr

otei

ns

•G

enes

are

tra

nscr

ibed

into

mRN

A•

Post

-Pro

cess

ing

(spl

icin

g)•

mRN

Ais

tra

nsla

ted

into

pro

tein

s•

Post

-pro

cess

ing

•Co

de n

ot

univ

ersa

l

Page 21: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

21

Alte

rnat

ive

Splic

ing

One

gen

e –

one

prot

ein

is m

ostly

wro

ng

Page 22: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

22

Hum

an G

enom

e

•Ap

p. 3

0.00

0 ge

nes

•Le

ngth

fro

m 1

00bp

–2M

B (in

tron

s+ex

ons)

•Le

ngth

avg

. 140

0 bp

s (o

nly

exon

s)-

Avg.

pro

tein

leng

th 4

47 a

min

o ac

ids

•Av

gge

ne h

as 9

exon

s•

Onl

y 3%

of

hum

an g

enom

e is

cod

ing

-Re

st „

junk

“ ?

-M

any

repe

ats,

tra

nspo

sons

, low

-com

plex

ity s

eque

nce

-Re

gula

tory

ele

men

ts

Page 23: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

23

Gen

e st

ruct

ure

Page 24: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

24

Prot

eins

•Pr

otei

ns m

ake

(alm

ost)

eve

ryth

ing

-M

etab

olis

m-

Sign

al g

ener

atio

n, t

rans

port

atio

n, r

ecog

nitio

n, a

nd

reac

tion

-Ce

llula

r st

ruct

ures

-Re

gula

tion

of g

ene

expr

essi

on•

Prot

ein

sequ

ence

-Am

ino

acid

s-

20-le

tter

alp

habe

t-

300-

500

AA lo

ng

Page 25: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

25

Prot

ein

Fold

ing

•Pr

otei

ns f

old

into

3D

-str

uctu

re•

Com

plex

and

dyn

amic

pro

cess

•M

ain

prob

lem

in b

ioin

form

atic

s•

„Fun

ctio

n fo

llow

s st

ruct

ure“

Page 26: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

26

Prot

ein

stru

ctur

e

•Pr

imar

y:aa

sequ

ence

•Se

cond

ary:

H

elix

es &

she

ets

•Te

rtia

ry:

3D-S

truc

ture

•Q

uart

ary:

Pr

otei

n co

mpl

exes

Page 27: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

27

From

Gen

otyp

e to

Phe

noty

p

Mol

ecul

arSt

ruct

ure

Bio

chem

ical

Inte

ract

ion

Phen

otyp

eG

enot

ype

Page 28: Molekularbiologische Datenbanken Grundlagen der ... · Molekularbiologische Datenbanken Grundlagen der Molekularbiologie Ulf Leser Wissensmanagement in der Bioinformatik. ... Vorlesung,

Ulf

Lese

r:M

olek

ular

biol

ogis

che

Dat

enba

nken

, Vo

rlesu

ng, S

oSe

2003

28

The

„-om

ics“

in L

ife S

cien

ce

•G

enom

e-

All D

NA

sequ

ence

in a

cel

l-

Cons

tant

•Tr

ansc

ripto

me

-Al

lmRN

Ain

a c

ell a

t gi

ven

time

-Va

ries

grea

tly w

ith c

ell t

yp, e

nviro

nmen

tal c

ondi

tions

, de

velo

pmen

tal s

tage

, sex

, ...

of c

ells

•Pr

oteo

me

-Al

l pro

tein

s in

a c

ell a

t gi

ven

time

-Ev

en m

ore

com

plex

tha

n tr

ansc

ripto

me:

life

spa

n, in

tera

ctio

n,

post

-tra

nsla

tiona

lmod

ifica

tions

, ...

•M

etab

olom

e-

All n

on-p

rote

in t

hing

s in

a c

ell a

t gi

ven

time