Top Banner
1 Universidade Federal do Pampa Curso de Bacharelado em Ciências Biológicas Trabalho de Conclusão V RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador São Gabriel-RS 2011 L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51
47

Rethinking microbial diversity analysis in the high throughput sequencing era

Jan 11, 2015

Download

Education

Leandro Lemos

 
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Rethinking microbial diversity analysis in the high throughput sequencing era

1

Universidade Federal do PampaCurso de Bacharelado em Ciências Biológicas

Trabalho de Conclusão V

RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA

Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador

São Gabriel-RS2011

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 2: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 3: Rethinking microbial diversity analysis in the high throughput sequencing era

~ 5%

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1. Introdução Geral

1) dificuldade em simular inúmeras condições ambientais em meios de cultura.

1.1. - Estimativa da diversidade microbiana

a) Anomalia de Placas

Page 4: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1.1. - Estimativa da diversidade microbiana

1. Introdução Geral

b) Técnicas independentes de cultivo de micro-organismos

Page 5: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1.3. Sequenciadores de nova geração

1. Introdução Geral

…ACGTGACTGAGGCTAG

CTAGACTACTTTATATATATACGTCGT

CACTGATGACTAGATTAACTGATTTAGATACCTTGATTTTAAAAAAATA

Primeira Geração

Segunda Geração

Terceira Geração

Page 6: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

16S primer

ABacterial DNA

16S primer BBarcode

primer B Barcodes 16S rRNA primer

Sample ABarcode 1

Sample BBarcode 2

Sample CBarcode 3

Sample DBarcode 4

Sample A Sample B Sample C Sample D

Mo

difie

d fro

m H

offm

an

n e

t al. (2

00

7) N

ucl. A

cid. R

es.

Page 7: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

1.3. Crescimento do número de sequências no RPD II e SILVA

1. Introdução Geral

-> Maior crescimento a partir de 2007 (Roesch et al., 2007).

Page 8: Rethinking microbial diversity analysis in the high throughput sequencing era

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

http://biology.uoregon.edu/people/BOHANNAN/pics/Microbes.jpg

Grande diversidade

a) O solo apresenta a maior

diversidade microbiana do

ambiente terrestre. O número de

sequências é de fundamental

importância para obtenção

de resultados confiáveis.

Page 9: Rethinking microbial diversity analysis in the high throughput sequencing era

- Se o número de sequências não é representativo em um ambiente, os resultados obtidos podem não ser válidos e confiáveis;

- O número de sequências necessários em cada tipo de abordagem pode variar de acordo com o teste aplicado e a diversidade de cada ambiente.

Hipótese:

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 10: Rethinking microbial diversity analysis in the high throughput sequencing era

- Demonstrar que o nível de esforço amostral obtido em análises de comparação de comunidades microbianas pode produzir resultados distintos;

- Determinar quais os tipos de análises e inferências mais eficientes quando temos disponível um número pequeno ou grande de sequências obtidos por plataformas de sequenciadores de nova geração.

Objetivos:

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 11: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material e Métodos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

5

Page 12: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.1. Processamento de sequências, simulação de comunidades

microbianas e análises de Bioinformática

Eliminação de sequênciasde baixa qualidade

trim.pl

Simulação de comunidadesmicrobianas hipotéticas

r_s_q.pl

500 500 500 500100 500 1000 5000

10000 20000

Page 13: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.2. Análises de Bioinformática

Page 14: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.3. Abordagens baseadas em táxons (taxon-based approaches)

Alinhamento de sequências(Algoritmo de Needleman-Wunsch)

GreengenesMothur

Agrupamento de sequênciaspara formação de UnidadesTaxonômicas Operacionais3 e 20% de dissimilaridade

Mothur

campo1 campo2 campo3

UTO1 4 8 19

UTO2 2 2 1

UTO3 0 1 34

Page 15: Rethinking microbial diversity analysis in the high throughput sequencing era

2. Material & Metódos

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

2.2. Abordagens baseadas em testes de hipóteses ( hypothesis testing approaches)

Agrupamento de sequências

CD-HIT

Construção de uma árvorefilogenética

MUSCLE

Comparação de comunidadesmicrobianas

UNIFRAC

Page 16: Rethinking microbial diversity analysis in the high throughput sequencing era

Comparação entre comunidades microbianas

ACP - Qualitativo ACP - Quantitativo

Análise de Coordenadas Principais (ACP)

Page 17: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Análise de Cobertura = representatividade

Page 18: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Page 19: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Florida - 5%; Antártica - 15%; Mauna Ulu - 9.3%; Pu'u Puai bare - 12.4%;– Era esperado um número maior de sequências compartilhadas;– Mesmo conjunto de dados.

a) indivíduos únicos ou compartilhados;

Page 20: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Florida - 48%; Mauna Ulu - 59%; Pu'u Puai bare - 47%;

Page 21: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

– ---> Amostras com uma baixa cobertura não apresentam resultados confiáveis ao ser aplicado Diagramas de Venn;

– ---> É necessário uma alta cobertura (> 90%);

Page 22: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Aumento da diversidade com o aumento do número desequências em uma amostra;

a) Índices de diversidade = comparação e caracterização decomunidades microbianas

Page 23: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

Page 24: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Sem mudanças significativas.

Page 25: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Sem mudanças significativas.

Page 26: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

---> Sem mudanças significativas.

Page 27: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

b) Estimador de riqueza = Chao1

Page 28: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.1. Abordagens baseada em táxons (Quantas sequências são necessárias?)

– ---> Chao1 não apresenta resultados confiáveis quando aplicado numa base de dados com um pequeno número de sequências.

Page 29: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– a) amostras aleatórias com a mesma intensidade amostral (4

– amostras de 500 sequências para cada ambiente);

– b) amostras aleatórias com o aumento da intensidade amostras (100, 500, 1.000, 5.000, 10.000 e 20.000)

– c) amostras aleatórias com o aumento da intensidade amostral (100, 500 e 20.000) para comparação de três ambientes.

Page 30: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

Page 31: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– ---> (A) - 10.000 sequências são necessárias para formação de agrupamento;

– ---> (B) - Formação de agrupamentos a partir de 500 sequências.

Page 32: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– ---> (A) e (B): sem formação de agrupamentos.

Page 33: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– ---> Limitação: as amostras poderiam ser muito similares, devido a uma mesma origem de base de dados;

– ---> Qual o nível de cobertura para comparar comunidades microbianas de ambientes distintos?

Page 34: Rethinking microbial diversity analysis in the high throughput sequencing era

3. Resultados

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

3.2. Abordagens filogenéticas (Quando devem ser usadas?)

– (A) e (B) baixa cobertura = ambientes distintos (escala continental)

Page 35: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Cobertura;

b) Ambiente a ser analisado.

Page 36: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Cobertura;

Com base nos resultados de cobertura (51 - 81%) era esperado que o número de Unidades Taxonômicas Operacionais entre as amostras fosse relativamente alto.

É necessário ter uma cobertura (> 90%) para a aplicação dos Diagramas de Venn

Page 37: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Cobertura;

– Um grande porcentagem de espécies estão presentes em um número pequeno.

Page 38: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Normalização do número de sequências;

Page 39: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Normalização do número de sequências;

Page 40: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Chao1 = apenas com intensidade amostral alta

Page 41: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Chao1 = apenas com intensidade amostral alta

Page 42: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

a) Baixa cobertura e abordagens filogenéticas

Page 43: Rethinking microbial diversity analysis in the high throughput sequencing era

4. Discussão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Realmente precisamos de milhares de sequências para avaliar a diversidade microbiana?

b) Ambientes similares

I) ACP - quantitativo = 500 sequências

II) ACP = qualitativo = 10.000 sequências

Page 44: Rethinking microbial diversity analysis in the high throughput sequencing era

5. Conclusão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

- Abordagens baseadas na informação filogenética são de extrema importância para a comparação de comunidades microbianas do solo com alta ou baixa cobertura;

- Abordagens baseadas em Unidades Taxonômicas Operacionais são úteis para detectar mudanças em UTOs específicas, mas é necessário uma alta cobertura.

Page 45: Rethinking microbial diversity analysis in the high throughput sequencing era

5. Conclusão

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51

Page 46: Rethinking microbial diversity analysis in the high throughput sequencing era

46

Agradecimentos:

- Ao CNPq, pela bolsa de Iniciação Científica;

Page 47: Rethinking microbial diversity analysis in the high throughput sequencing era

47

Universidade Federal do PampaCurso de Bacharelado em Ciências Biológicas

Trabalho de Conclusão V

RETHINKING MICROBIAL DIVERSITY ANALYSIS IN THE HIGH THROUGHPUT SEQUENCING ERA

Acadêmico: Leandro Nascimento Lemos Prof. Dr. Luiz Fernando Wurdig Roesch - Orientador

São Gabriel-RS2011

L.N. Lemos et al. / Journal of Microbiological Methods 86 (2011) 42–51