Top Banner
Introduction à la biologie moléculaire et à la bio-informatique Cours de Master Recherche M2, 2004/2005 Jean-Philippe Vert [email protected] Master Recherche M2 c 2003-2005 Jean-Philippe Vert, ([email protected]) – p.1/76
76

Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Jun 06, 2018

Download

Documents

lykhanh
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Introduction à la biologiemoléculaire

et à la bio-informatiqueCours de Master Recherche M2, 2004/2005

Jean-Philippe Vert

[email protected]

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.1/76

Page 2: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Plan

Organismes et cellules

Molécules de la vie

Gènes et génomes

Technologies et données

Challenges en bio-informatique

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.2/76

Page 3: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Organismes et cellules

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.3/76

Page 4: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Cellules

Tout organisme vivant est composé de cellules

Une cellule est une solution contenant différentesmolécules entourée d’une membrane

Il y a des organismes unicellulaires (bactéries, levure...)ou multicellulaires.

Exemple: il y a environ 6×1023 cellules dans un humain,

de 320 types différents (peau, muscles, neurones...)

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.4/76

Page 5: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Cellules

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.5/76

Page 6: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Classification des organismes

On distingue généralement les eukaryotes desprokaryotes

Les prokaryotes (eux-memes subivisés en bactéries etarchéens) sont unicellulaires, de petite taille(typiquemet 1µm), et ont une structure simple

Les eukaryotes sont uni- ou multicellulaires, plusgrands, et ont une structure plus complexes

La vie est apparue il y a 3, 8 milliards d’années, tous lesorganismes proviennent d’un ancêtre commun

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.6/76

Page 7: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

La cellule eukaryote

Différents organelles. Un noyau qui contient l’ADN (chromo-

somes).

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.7/76

Page 8: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Caractéristiques de la cellule

La plupart des cellules sont capables de grossir et dese diviser (exception: neurones)

Elles ont un métabolisme, i.e., importent des nutrimentset les convertissent en molécules utiles et énergie

Elles peuvent réagir à leur environnement

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.8/76

Page 9: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Les molécules de la vie

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.9/76

Page 10: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Types de molécules

On les regroupe en 4 grandes familles:

les petite molécules

les protéines

l’ADN

l’ARN

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.10/76

Page 11: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Dans la cellule

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.11/76

Page 12: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Petites molécules

Petites molécules ayant un rôle: ATP , NADPH

stockent l’energie

Sucres, lipides (sources d’energie, structure desmembranes)

Acides aminés et nucléotides, qui sont les blocs debase pour former les protéines et l’ADN/ARN.

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.12/76

Page 13: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Protéines

Les protéines représentent 20% du poids de la cellule(eau=70%). Elles ont de multiples fonctions:

Structurale : ex: le collagene relie les os et les tissus

Catalytique: les enzymes catalysent une multitude deréactions biochimique (formant le métabolisme). Ex: labexokinase permet la conversion du glucose auglucose-6-phosphate

Les protéines membranaires maintiennentl’environnement cellulaire, régulent le volume de lacellule, créent des gradients ioniques pour les muscleset le systeme nerveux...

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.13/76

Page 14: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Protéine = polymère d’acides aminés

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.14/76

Page 15: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Structure primaire

Il y a 20 acides aminés. On peut donc représenter lastructure chimique d’une protéine comme un texte sur unalphabet de 20 lettre.Exemple: l’insuline:

FVNQHLCGSHLVEALYLVCGERGFFYTPKA

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.15/76

Page 16: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Structure secondaire

Hélice α Feuillet β

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.16/76

Page 17: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Structure tertiaire

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.17/76

Page 18: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Structure quaternaire

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.18/76

Page 19: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

ADN

L’acide desoxyribonucléique (ADN) est la molécule,présente dans toutes les cellules, qui contientl’information génétique transmise entre générations.

L’ADN peut être en simple brin ou double brin.

Un brin simple (aussi appelé polynucléotide) est unpolymère linéaire composé de 4 nucléotides: adénosine(A), cytosine (C), guanine (G) et thymine (T)

On représente un polynucléotide par une séquenceorientée de lettres:5’ -A-T-T-C-A-G-G-C-A-T-T-A-G-C- 3’

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.19/76

Page 20: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

ADN double brin

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.20/76

Page 21: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Structure de l’ADN (Watson et Crick, 1953)

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.21/76

Page 22: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

ADN et information

La double hélice est stable, quelle que soit la séquencede nucléotides

Parfait pour stocker 2 bits/base

Distance entre 2 bases = 0.34nm, donc 6.107 bits/cm =

75ko/cm

Par repliement de l’ADN en 3D, on peut théoriquement

monter à 2.1021 bits/cm3

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.22/76

Page 23: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

ARN

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.23/76

Page 24: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

ARN

L’ARN (acide ribonucléique) ressemble beaucoup à l’ADNmais:

Le sucre de l’ADN (désoxyribose) est remplacé par uneautre sucre dans l’ARN (ribose)

La thymine (T) de l’ADN est remplacée par l’uracile (U)dans l’ARN.

L’ARN peut s’apparier avec un ARN complémentaire,mais les ARN sont généralement simple brin et sontdonc le siège d’appariements intramoléculaires.

On connait depuis longtemps 3 types d’ARN: ARNmessagers (ARNm), ARN ribosomiques (ARNr), ARNde transfert (ARNt). Mais on en découvre de nouveauxdepuis quelques années...

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.24/76

Page 25: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Gènes et génomes

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.25/76

Page 26: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

ADN et chromosomes

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.26/76

Page 27: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Génome

Toutes les cellules d’un organisme ont (à peu près) lemême ADN, appelé génome

Organisme Chromosomes Taille du génome (bp)

Bactéries 1 400,000 a 10,000,000

Levure 12 14,000,000

Mouche 4 300,000,000

Homme 46 6,000,000,000

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.27/76

Page 28: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Génomes humains

22 paires de chromosomes + chromosomes X/X ou X/Y =

46 chromosomes.

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.28/76

Page 29: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Séquencage

Séquencer = déterminer la séquence des lettres d’unADN

1995: premier génome bactérien séquencé

levure (1997), mouche (2000), homme (2003)...

Approche “shotgun”: les plus grands problèmes pour leséquencage des eukaryotes supérieurs sontinformatique (assemblage)!

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.29/76

Page 30: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Gène

Une partie continue d’un brin d’ADN, à partir de laquelle une

machinerie moléculaire complexe peut lire de l’information

(encodée dans les lettes A,C,G,T) et créer une protéine par-

ticulière

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.30/76

Page 31: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Dogme central

mRNADNA Protein1 nucleotide to 1 nucleotide 1 codon (3 nucleotides) to 1 amino acid

translationtranscription

according to the ’genetic code’

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.31/76

Page 32: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

ARN messager

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.32/76

Page 33: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

De l’ADN aux protéines

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.33/76

Page 34: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Gènes

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.34/76

Page 35: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Code génétique

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.35/76

Page 36: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

De l’ADN à la protéine

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.36/76

Page 37: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Contrôle de l’expression (induction)

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.37/76

Page 38: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Contrôle de l’expression (répression)

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.38/76

Page 39: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Exemple: B-globine humaine

La B-globin joue un rôle important dans le développement des cellules rouges du sang. Cer-

taines protéines régulatrices, comme CP1, sont présentes dans de nombreuses cellules,

mais d’autres, comme GATA-1, ne se trouvent que dans quelques types de cellules, dont les

précurseurs des cellules rouges.

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.39/76

Page 40: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Coordination du contrôle

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.40/76

Page 41: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Réseau de régulation

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.41/76

Page 42: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Autres contrôles: du gène à la protéine active

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.42/76

Page 43: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Epissage

transcribed region

startcodon

stopcodon

C DS5'UTR 3'UTR

exon

exon

intronintron

promoter

transcriptionfactor binding

sites

spliced mRNA

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.43/76

Page 44: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Epissage alternatif

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.44/76

Page 45: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Nouveau dogme

Avant: 1 gene = 1 ARNm = 1 protéine

Maintenant: 1 gene = x ARNm = xy protéines

Rappel: 30,000 genes (?) chez l’homme

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.45/76

Page 46: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Technologies et données

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.46/76

Page 47: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Séquenceur

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.47/76

Page 48: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Microarrays

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.48/76

Page 49: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Transcriptome

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.49/76

Page 50: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Protéome

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.50/76

Page 51: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Interactome

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.51/76

Page 52: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Métabolome

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.52/76

Page 53: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Data types and representations

Data Type and Details Representation

Sequences

- DNA: genome (hereditary in-formation)

string over nucleotides{A,C,G,T}

- full length mRNAs: splicedgene copies

string over ribonucleotides{A,C,G,U}

- ESTs (expressed sequencetags): partial mRNAs

string over ribonucleotides{A,C,G,U}

- proteins string over amino acids(size 20)

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.53/76

Page 54: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Data types and representations

Data Type and Details Representation

Structures

- metabolites: positions andbonds of atoms

labeled graph embeddedinto 3D-space

- macromolecules (proteins,RNAs, DNA)

labeled graph embeddedinto 3D-space

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.54/76

Page 55: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Data types and representations

Data Type and Details Representation

Interactions

- proteins with metabolites: re-ceptors or enzymes bindingligands

real vectors (binding ener-gies)

- proteins with DNA: transcrip-tion factors; etc.

binary (bipartite graph)

- proteins with proteins: com-plexes; etc.

binary (graph); Petri-net

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.55/76

Page 56: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Data types and representations

Data Type and Details Representation

Expression / Localization Data

- gene expression: abun-dances of mRNAs

real vectors or matrices

- protein expression: abun-dances of proteins

real vectors or matrices

- metabolite (small molecule) “ex-

pression”: concentrations ofmetabolites

real vectors or matrices

- protein localization: compart-ment of presence

categorical

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.56/76

Page 57: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Data types and representations

Data Type and Details Representation

Cell / Organism Data

- genotype: single nucleotidepolymorphisms

vector of nucleotides{A,C,G,T}

- phenotype: cell type; size;gender; eye color; etc.

vector of real and categori-cal attributes

- state / clinical data: disease;blood sugar; etc.

vector of real and categori-cal attributes

- environment: nutrients; tem-perature; etc.

vector of real and categori-cal attributes

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.57/76

Page 58: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Data types and representations

Data Type and Details Representation

Population Data

- linkage disequilibrium: LOD-scores

real numbers

- pedigrees certain (tree-like) graphs

- phylogenies: “pedigree ofspecies”

trees or generalizations oftrees

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.58/76

Page 59: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Data types and representations

Data Type and Details Representation

Scientific Texts

- Texts: articles, abstracts,web-pages

natural language texts (inEnglish)

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.59/76

Page 60: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Sequence sources

Database URL (http://. . . ) Remark

Nucleotide sequence databases

- DDBJ www.ddbj.nig.ac.jp these threedatabases . . .

- EMBL www.ebi.ac.uk/embl/ . . . synchronizetheir . . .

- Gen-Bank

www.ncbi.nlm.nih.gov . . . contentsdaily

Protine sequence databases

- Swis-sProt

www.expasy.org/sprot/ curated

- TrEMBL www.expasy.org/sprot/ not curated

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.60/76

Page 61: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Sequence sources

(Some) Sequence motif databases

- eMotif motif.stanford.edu/emotif/ protein regularexpression pat-terns

-SMART

smart.embl-heidelberg.de/ protein domainHMMs

-TRANS-FAC

transfac.gbf.de/TRANSFAC/ transcriptionfactor bindingsites

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.61/76

Page 62: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Sequence sources

General portals

- EBI www.ebi.ac.uk EuropeanBioinformaticsInstitute

- Entrez www.ncbi.nlm.nih.gov/Entrez/ U.S. NationalBioinf. Institute

- Ex-PASy

www.expasy.org Expert Pro-téine AnalysisSystem

- SRS srs.ebi.ac.uk Sequence Re-trieval System

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.62/76

Page 63: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Expression sources

Database URL (http://. . . ) Remark

General databases

- ArrayEx-press

www.ebi.ac.uk/arrayexpress/ by the EBI

- GEO www.ncbi.nlm.nih.gov/geo/ by theNCBI

Organism specific databases

- MGI GXD www.informatics.jax.org mouse

- TAIR Mi-croarray

www.arabidopsis.org arabidopsis

- WormBase www.wormbase.org C. elegans

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.63/76

Page 64: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Protéine properties sources

Database URL (http://. . . ) Remark

Protine structures

- PDB www.rcsb.org/pdb/ 3D struc-tures

- SCOP scop.mrc-lmb.cam.ac.uk/scop/ structuralclassification

- CATH www.biochem.ucl.ac.uk/bsm/cath/structuralclassification

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.64/76

Page 65: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Protéine properties sources

Molecular interactions and networks

- BIND www.bind.ca interactionnetwork

- KEGG www.genome.ad.jp/kegg/ metabolicpathways

- DIP dip.doe-mbi.ucla.edu interactingproteins

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.65/76

Page 66: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Protéine properties sources

Protine functions

- GO www.geneontology.org controlledvocabulary

- EC www.chem.qmul.ac.uk/iubmb/enzyme/enzymenumbers

- MIPS mips.gsf.de/proj/yeast/

catalogs/funcat/

yeast genefunctions

Protine expression

-2DPAGE

us.expasy.org/ch2d/ 2D gel elec-trophoresisdata

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.66/76

Page 67: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Challenge en bio-informatique

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.67/76

Page 68: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Génomique

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.68/76

Page 69: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Protéomique

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.69/76

Page 70: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Pharmacogénomique

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.70/76

Page 71: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Caractéristiques

Beaucoup de données...

mais beaucoup de ”bruit”

Données hétérogenes (séquences, structures,vecteurs, graphes...)

”Small n large p”

problèmes souvent mal posés (data mining)

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.71/76

Page 72: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Pour vous motiver

discipline nouvelle (les données n’existaient pas il y a10 ans)

application (therapeutique, biologie fondamentale)

besoin de math/info de plus en plus pointu (voirévolution récente du domaine)

peu de spécialistes...

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.72/76

Page 73: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

But du cours

Proposer une théorie et des outils pour

représenter les données dans un cadre mathématiquecohérent...

...avec des méthodes d’analyse performantes...

...en pleine expansion actuellement.

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.73/76

Page 74: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Contenu du cours

Introduction à la biologie moléculaire et à la génomique

Noyaux positifs: définition, propriétés, espaces deHilbert à noyau reproduisant, kernel trick, théorème durepresentant

Méthodes à noyau: kernel PCA, SVM, LS-SVM, kernelCCA

Noyaux: pour séquences, pour graphes, noyau dediffusion, noyau de convolution, noyau de semi-groupe

Applications: classification de séquences, inférence surdes graphes, sélection de genes

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.74/76

Page 75: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Crédits

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.75/76

Page 76: Introduction à la biologie moléculaire et à la bio ...members.cbio.mines-paristech.fr/~jvert/teaching/2004dea/slides/1... · Introduction à la biologie moléculaire et à la bio-informatique

Source des images et tables

Alex Zien, ”A primer on molecular biology”, Kernel

Methods in Computational Biology (B. Scholkopf, K. Tsuda, J.-P.

Vert ed.), MIT Press, 2004

Image gallery:http://www.accessexcellence.org/AB/GG/

A quick introduction to elements of biology - cells,molecules, genes, functional genomics, microarrays, byAlvis Brazma, Helen Parkinson, Thomas Schlitt,Mohammadreza Shojatalabhttp://www.ebi.ac.uk/microarray/biology_intro.ht

.. et quelques images trouvées sur le web

Master Recherche M2 c©2003-2005 Jean-Philippe Vert, ([email protected]) – p.76/76