Top Banner
Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)
27

Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Apr 04, 2015

Download

Documents

Felice Ramos
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Introduction à la bioinformatique

Ce cours est supporté par

Chemical Computing Group

&Jonathan Pevsner (JHU)

Page 2: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Ce qu’est la bioinformatique

• Interface entre la biologie et l’ordinateur

• Analyse de proteines, gènes et génomes à l’aide d’algorithmes et de banques de données

• Génomique : analysis de génomes. Donner un sens aux milliards de paires de bases de DNA qui sont séquencées

Page 3: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

[1] Élaborer un modèle de transcription. Où et quand un gène va s’exprimer

[2] Prédire les épissages alternatifs du RNA

[3] Établir les voies de transduction ; prédire la réponse cellulaire à un stimulus

[4] Déterminer les codes de reconnaissance entre protein:DNA, protein:RNA, protein:protein

[5] Prédire ab initio la structure des protéines

Principaux défis de la discipline

Page 4: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

[6] Design de petites molécules (inhibiteurs)

[7] Expliquer l’évolution des protéines.

[8] Expliquer la spéciation.

[9] Développer des manières systématiques de décrire la fonction des gène et des proteines.

Page 5: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

DNA RNA phenotypeprotein

Page 6: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)
Page 7: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

DNA RNA

cDNAESTsUniGene

phenotype

genomicDNAdatabases

protein sequence databases

protein

Page 8: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

GenBankEMBL DDBJ

EBIEuropean

BioinformaticsInstitute

3 Banques publiques majeures de DNA

NCBINational

Center forBiotechnology

Information

Japan

Page 9: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

>100,000 espèces sont représentéesdans GenBank

tt espèces 128,941

virus 6,137

bactéries 31,262

archaea 2,100

eucariotes 87,147

Page 10: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Homo sapiens (6.9 millions entrées)Mus musculus (5.0 millions)Zea mays (896,000)Rattus norvegicus (819,000)Gallus gallus (567,000)Arabidopsis thaliana (519,000)Danio rerio (492,000)Drosophila melanogaster (350,000)Oryza sativa (221,000)

Organismes les plus séquencésdans Genbank

Page 11: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

National Center for BiotechnologyInformation (NCBI)

www.ncbi.nlm.nih.gov

Page 12: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)
Page 13: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

PubMed • National Library of Medicine (serv. de recherche)

• 11 millions citations ds MEDLINE• liens vers journaux online• PubMed tutorial (via “Education” side bar)

Page 14: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

BLAST• Basic Local Alignment Search Tool• Outil NCBI pour recherche de similarité• analyse banques de DNA et protéines• > 80,000 recherches par jour

Page 15: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

OMIM•Online Mendelian Inheritance in Man•catalogue des désordres génétiques chez Hs•edité par Dr. Victor McKusick & al. JHU

Page 16: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

TaxBrowser• browser pour divisions principales des organismes (archaea, bacteries, eucariotes, virus)• informations taxonomiques• données moleculaires sur organismes disparus

Page 17: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Structure• Molecular Modelling Database (MMDB)

• structures de Protein Data Bank (PDB)• Cn3D (a 3D-structure viewer)• vector alignment search tool (VAST)

Page 18: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

[1] LocusLink (RefSeq)[2] Entrez (Unigene, Nucléotides., Protéines, Gènes et Génomes)[3] EBI et Ensembl[4] ExPASy Sequence Retrieval System (EXpert Protein Analysis SYstem))

Plusieurs façons d’accéder à la séquence d’un gène ou d’une protéine

Page 19: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

[1] LocusLink with RefSeq

LocusLink : un bon point de départInfos sur chaque gène ou protéine à partieDe plusieurs banques.

RefSeq : numéro d’accèssion unique pourchaque DNA (NM_006744) ou protéine (NP_007635)

RefSeq: séq. la plus stable (consensus)

Page 20: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Ce qu’est un accession number ?

Étiquette qui identifie une séquence. Série de lettres et/ou chiifres qui correspondent à une séquence moléculaire.

Exemples (pour retinol-binding protein, RBP4):

X02775 GenBank genomic DNA sequenceNT_030059 Genomic contig

N91759.1 An expressed sequence tag (1 of 170)NM_006744 RefSeq DNA sequence (from a transcript)

NP_007635 RefSeq proteinAAC02945 GenBank proteinQ28369 SwissProt protein1KT7 Protein Data Bank structure record

protein

DNA

RNA

Page 21: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

À propos de RefSeq

RefSeq ne donne qu’un seul # accès pour un gène ou une protéine.

Il peut y avoir des centaines de # accès à un gène dans GenBank mais il n’y en aura qu’un seul dans RefSeq (plusieurs s’il existe des épissages variables.

Page 22: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

???

pour Mme NCBI sur

gène

protéine

Page 23: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)
Page 24: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Entrez intègre les éléments suivants:

Page 25: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

UniGeneProjet qui vise à assigner un cluster de

séquences à un seul gène

Pour RBP4 il a un seul # accès Hs.418083

Qui donne la liste de toutes les entrées GenBank pour cette protéine (incluant EST)

Page 26: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)
Page 27: Introduction à la bioinformatique Ce cours est supporté par Chemical Computing Group & Jonathan Pevsner (JHU)

Plug the figures …

and press …