Top Banner
Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas, Engenharia Biológica João Varela [email protected]
40

Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Feb 23, 2020

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Bioinformática Licenciaturas em Biologia, Bioquímica, Biotecnologia, Ciências Biomédicas,

Engenharia Biológica

João Varela [email protected]

Page 2: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Docentes

•  Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

•  João Varela (bioinformática: conceitos, bases de dados, aplicações, pesquisa de ORFs e suas funções, anotação de sequências, uso da ferramenta Annothaton, intrões e exões, localização intracelular, optimização de PCR).

•  Rita Castilho (Filogenética)

Page 3: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Competências

•  Conceito de ORF, pesquisa de ORFs em sequências nucleotídicas (JV)

•  Previsão da localização de genes em genomas e metagenomas (JV)

•  Bioinformática aplicada à taxonomia molecular (JV e RC)

•  Estimação de massa molecular de proteínas e ácidos nucleicos (JV)

•  Alinhamentos de sequências: ferramentas e aplicações (PM e JV)

•  Construção de árvores filogenéticas: modelos, ferramentas e aplicações (RC)

•  Previsão da função de genes e/ou proteínas por pesquisa de domínios funcionais (JV)

•  Previsão da estrutura de proteínas; previsão da função e compreensão dos mecanismos de acção de proteínas através da bioinformática estrutural (PM)

•  Anotação de sequências de bases de dados via Annothaton (PM, JV, RC)

Page 4: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Avaliação - Bioinformática

•  Exame teórico – PM 40%, JV 47% e RC 13%

•  Componente Prática - Anotação de 1 sequência metagenómica (Annotathon) – não há grupos

•  NOTA FINAL = 70% Teórica + 30% Prática

•  Todas as aulas são obrigatórias, incluindo as teóricas, para alunos que têm a 1ª frequência à disciplina; segundo o regulamento de avaliação os alunos terão de ter 75% de assiduidade a todas as componentes.

Page 5: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Avaliação – Fundamentos de Bioinformática

•  Exame teórico – PM 45%, JV 33% e RC 22%

•  Componente Prática – Exame escrito da componente prática – PM 50%, JV25% e RC 25%

•  NOTA FINAL = 70% Teórica + 30% Prática

•  Todas as aulas são obrigatórias, incluindo as teóricas, para alunos que têm a 1ª frequência à disciplina; segundo o regulamento de avaliação os alunos terão de ter 75% de assiduidade a todas as componentes.

Page 6: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Bioinformática: Conceito

Bioinformática - campo interdisciplinar da Biologia, Ciências Informáticas, Matemática e Estatística para analisar dados de sequências biológicas e genomas (genes e disposição de genes em cromossomas) e prever a estrutura e função de macromoléculas

Page 7: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Bioinformática vs. Biologia Computacional

•  Bioinformática – desenvolvimento empírico de ferramentas práticas para gestão de dados (sequências, genomas)

•  Biologia Computacional – desenvolvimento de algoritmos eficazes para resolver problemas específicos (alinhamentos de sequências) com maior ênfase na correcção e eficiência

Page 8: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Algoritmo

Conjunto de instruções bem definidas para resolver um problema; quando aplicado em informática, um algoritmo pode ser transformado em um programa e este numa aplicação informática

Page 9: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Algoritmo representado por um diagrama de fluxo

Início

Há luz? Fazer algo Sim

Não

Lâmpada fundida? Substituir lâmpada

Sim

Page 10: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Bioinformática: para que serve?

•  Complexidade dos genomas

•  Nº crescente de genomas sequenciados

•  Nº crescente de anotações estruturais, funcionais e bibliográficas

Limitação da mente humana em armazenar e processar informação devido a:

Page 11: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Como resolver esta limitação humana?

•  Aplicações computorizadas de armazenamento de dados: bases de dados

•  Aplicações computorizadas de processamento de dados

Page 12: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Exemplo de Bases de Dados

•  GenBank (NCBI, EUA) http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi

•  EMBL Nucleotide Sequence Database (Europa) http://www.ebi.ac.uk/embl/

•  DNA Data Bank of Japan (DDBJ, Japão) http://www.ddbj.nig.ac.jp/

(sequências primárias de ácidos nucleicos e proteína com anotação básica)

Page 13: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Tipo de dados armazenados

•  Sequências de DNA (desoxinucleótidos)

•  Sequências de RNA (nucleótidos)

•  Sequências de Proteína (aminoácidos)

•  Anotações estruturais

•  Anotações funcionais

•  Anotações de localização intracelular

•  Anotações de localização genómica

•  Anotações bibliográficas

Page 14: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Exemplo de Bases de Dados

•  Ensembl (+ BioMart) (Genomas) http://www.ensembl.org/

•  UniProtKB/Swiss-Prot (Proteínas) http://www.ebi.ac.uk/swissprot/

(sequências primárias de ácidos nucleicos e proteína com anotação mais complexa)

Page 15: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Exemplo de Bases de Dados

•  InterProScan http://www.ebi.ac.uk/InterProScan/

•  ScanProsite http://expasy.org/tools/scanprosite/

(estruturas secundárias de proteínas - domínios funcionais)

Page 16: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Estrutura Secundária e Domínios Funcionais

héliceα

Folhas β pregueadas

Page 17: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Domínios Funcionais Anotados (Ex: InterProScan – Anotações estruturais e funcionais)

Page 18: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Como funciona a bioinformática em termos práticos?

1.  Recolha de amostras (laboratoriais, ambientais)

2.  Isolamento de DNA (ou RNA) [por vezes opcional]

3.  Amplificação de sequências de DNA (ou cDNA) por PCR [opcional]

4.  Sequenciação de DNA

5.  Armazenamento da sequência em ficheiros informáticos

6.  Tratamento bioinformático das sequências

Page 19: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Recolha de Amostras Ambientais

Annothaton: Amostras de água do mar

Page 20: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Recolha de Amostras Ambientais

Annothaton: Amostras de água do mar (http://annotathon.univ-mrs.fr/)

Page 21: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Como funciona a bioinformática em termos práticos?

1.  Recolha de amostras (laboratoriais, ambientais)

2.  Isolamento de DNA (ou RNA) [por vezes opcional]

3.  Amplificação de sequências de DNA (ou cDNA) por PCR [opcional]

4.  Sequenciação

5.  Armazenamento da sequência em ficheiros informáticos

6.  Tratamento bioinformático das sequências

Page 22: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Como funciona a bioinformática em termos práticos?

1.  Recolha de amostras (laboratoriais, ambientais)

2.  Isolamento de DNA (ou RNA) [por vezes opcional]

3.  Amplificação de sequências de DNA (ou cDNA) por PCR [opcional]

4.  Sequenciação de DNA

5.  Armazenamento da sequência em ficheiros informáticos

6.  Tratamento bioinformático das sequências

Page 23: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Sequenciação de DNA

Desoxinucleótidos vs. Didesoxinucleótidos

O Método de Sanger baseia-se no uso de desoxinucleótidos artificiais em reacções de síntese de DNA (polimerização).

dNTP

ddNTP

Page 24: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Sequenciação de DNA

Ex: Uso de ddTTP para gerar fragmentos de diferente tamanho terminando na posição das T

Os didesoxinucleótidos bloqueiam a polimerização

Page 25: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Sequenciação de DNA

Page 26: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Como funciona a bioinformática em termos práticos?

1.  Recolha de amostras (laboratoriais, ambientais)

2.  Isolamento de DNA (ou RNA) [por vezes opcional]

3.  Amplificação de sequências de DNA (ou cDNA) por PCR [opcional]

4.  Sequenciação de DNA

5.  Armazenamento da sequência em ficheiros informáticos

6.  Tratamento bioinformático das sequências

Page 27: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Ficheiros Bioinformáticos

•  Ficheiros de texto

•  Ficheiros de DNA contêm letras que representam desoxinucleótidos

•  Ficheiros de Proteína contêm letras que correspondem a aminoácidos

•  Podem conter também notas explicativas sobre a sequência que se denominam: ANOTAÇÕES

Page 28: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Códigos de representação de sequências nucleotídicas em ficheiros bioinformáticos

Page 29: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Códigos de representação de sequências proteicas em ficheiros bioinformáticos

Page 30: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Formato de ficheiros de sequências nucleotídicas e a.a.

•  FASTA

•  FASTA-PEARSON

•  NBRF

•  GCG

•  PIR

•  GenBank

•  PHYLIP

•  ASN.1

•  PAUP

Page 31: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Formato FASTA

Ficheiro de texto (ASCII) com:

•  Linha de comentário iniciada por “>”

•  Sequência (nucleotídica ou proteica)

•  Terminação da sequência por “*” (opcional)

> YCZ2_Yeast protein in HMR 3’ region!MKAVVIEDGKAVVKEVGP*!

Exemplo:

Page 32: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Formato de ficheiros de sequências

•  FASTA

•  FASTA-PEARSON

•  NBRF

•  GCG

•  PIR

•  GenBank

•  PHYLIP

•  ASN.1

•  PAUP

Page 33: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Formato GenBank

Ficheiro de texto com:

•  Cabeçalho (header)

•  Anotações (features)

•  Sequência

Page 34: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Formato GenBank: Cabeçalho

Page 35: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Formato GenBank: Anotações

Page 36: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Formato GenBank: Sequência

Page 37: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Como funciona a bioinformática em termos práticos?

1.  Recolha de amostras (laboratoriais, ambientais)

2.  Isolamento de DNA (ou RNA) [por vezes opcional]

3.  Amplificação de sequências de DNA (ou cDNA) por PCR [opcional]

4.  Sequenciação de DNA

5.  Armazenamento da sequência em ficheiros informáticos

6.  Tratamento bioinformático das sequências (anotações)

Page 38: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Tradução virtual de sequências nucleotídicas em proteicas

quadro de leitura aberto (open reading frame [ORF])

+1

+2

+3

Quadros de leitura

(reading frames)

Page 39: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Genómica vs. Metagenómica

DNA

Organismo

Sequenciação de DNA

Sequência do genoma de um organismo

DNA

Vários organismos (comunidade)

Sequenciação aleatória de DNA

Sequência de genomas de uma comunidade de

organismos

Page 40: Bioinformática - w3.ualg.ptw3.ualg.pt/~jvarela/bioinformatica/T01.pdf · Docentes • Paulo Martel (alinhamentos, pesquisas de sequências em bases de dados, bioinformática estrutural)

Preparação para a aula teórico-prática

•  Ir ao site ANNOTHATON http://annotathon.org/

•  Leiam a página “Rule Book” para ver o que tem que fazer nas aulas teórico-práticas