Polimorfismos de nucleotídeos únicos em espécies poliplóides Ramon Oliveira Vidal Email: [email protected]Doutorando em Genética e Biologia Molecular Sub área: Bioinformática Orientador: Gonçalo A.G. Pereira LGE - Laboratório de Genômica e Expressão @ramonvidal
81
Embed
Polimorfismos de nucleotídeos únicos em espécies poliplóides
Polimorfismos de nucleotídeos únicos em espécies poliplóides. LGE - Laboratório de Genômica e Expressão. Ramon Oliveira Vidal Email: [email protected] Doutorando em Genética e Biologia Molecular Sub área : Bioinformática Orientador : Gonçalo A.G. Pereira . @ ramonvidal. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
ou ASA (Amplified Specific Amplicon)◦ Microssatélites –SSR (Simple Sequence Repeats)◦ AFLP (Amplified Fragment Length Polymorphism)
Tipos de marcadores
RFLP – Restriction Fragment Length Polymorphism
RFLP – Restriction Fragment Length Polymorphism
RAPD - Random Amplified Polymorphic DNA
Polimorfismo de DNA entre indivíduos pode ser devido a:• Ausência do sítio do
primer.• Surgimento de um novo
sítio.• Ao comprimento da
região amplificada entre sítios de primer
Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.
Essas seqüências são distribuídas ao acaso no genoma e é um dos marcadores mais utilizados atualmente
Microssatélites – SSR (Simple Sequence Repeats)
Primers específicos (20 a 30 pb). Diferentes números de elementos simples
repetidos. Cada segmento amplificado de tamanho
diferente representa um alelo diferente do mesmo loco
Microssatélites – SSR (Simple Sequence Repeats)
Genótipos na eletroforese
Mutações genéticas◦ Alteração na seqüência de nucleotídeos de uma molécula de
DNA. ◦ O termo "mutação“ é geralmente usado para referir-se a
alterações na seqüência de DNA que não estão presentes na maioria dos indivíduos de uma espécie
Polimorfismos genéticos◦ Diferença na seqüência de DNA entre indivíduos, grupos ou
populações. ◦ Incluem SNPs, seqüências repetitivas, inserções, deleções e
recombinações. Podem dar origem a olhos ou olhos castanhos, cabelo liso ou cabelos
crespo◦ Resultado de processos naturais ou induzidos por agentes
externos (como vírus ou radiação).
Polimorfismos genéticos X Mutações genéticas
Polimorfismos genéticos X Mutações genéticas
Polimorfismos são alterações no DNA que se mantém nas gerações futuras◦ Polimorfismo: variação >1%◦ Mutação: variação <1%
C T T A G C T T
C T T A G T T T
Polimorfismo
C T T A G C T T
C T T A G T T T
Mutação
94%
6%
99.9%
0.1%
TAAAAAT
TAACAAT
TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT
TAAAAAT TAACAAT
TAAAAAT
• Polimorfismos foram mutações que se propagaram ao longo de gerações
Polimorfismos genéticos X Mutações genéticas
Single Nucleotide Polymorphism, ou SNP ("snip"):
◦ pequena mudança, ou variação, que pode ocorrer em um único nucleotídeo numa sequência de DNA em uma porção significativa (mais de 1%) de uma população.
SNPs
SNPs são as mais frequêntes formas de variações genéticas◦90% das variações genéticas humanas vêm dos SNPs
SNPs tem se tornado marcadores de preferência pela sua grande abundância e pelo desenvolvimento de tecnologias de genotipagem em larga escala.
Single Nucleotide Polymorphism
SNPs em menor quantidade em genes do que em regiões não-codificantes
Menor quantidade de SNPs nos cromossomos sexuais (humano). Dentro de um único cromossomo, SNPs podem se concentrar em
uma região específica, geralmente implicando uma região de interesse ou de pesquisa.
Em média, ocorrem a cada 300~600 nucleotídeos (humano). Genes com maior pressão para modificação tem maior frequência
de SNP (resistência, adaptação, interação parasita-hospedeiro, etc)
Distribuição dos SNPs
Intra espécie◦Diversidade entre os indivíduos de uma
mesma espécie◦Reflete os SNPs entre os alelos (espécies
diplóides) Inter espécies
◦Diversidade entre espécies diferentes
SNPs intra/inter específicos
Não-codificantes Codificantes
Sinônimas Não-sinônimas
conservativas Não-conservativas
Classificação dos SNPTransições
Purina<->PurinaPirimidina<->Pirimidina
TransversõesPurina<->Pirimidina
Genotipagem ◦ Detecção de genótipos de individuos. ◦ Pode ser realizada observando os SNPs.
Haplótipo (genótipo haplóide) ◦ Alelo encontrado em um único cromossomo que
apresenta o mesmo padrão de SNPs. ◦ Blocos haplótipos e tendem a ser herdados
juntos.◦ Podem servir como marcadores de doença
genética. ◦ A análise de haplótipos é útil na identificação
de eventos de recombinação.
Blocos de haplótipos Dentro de um bloco haplótipo, acontece
pouca ou nenhuma recombinação Os SNPs dentro de um bloco haplótipo são
passados juntos nas gerações futuras
haplótipos Um haplótipo é um conjunto de SNP no
mesmo cromossomo
SNP1 SNP2 SNP3
-A C T T A G C T T-
-A A T T T G C T C-
-A C T T T G C T C-
Haplotype 2
Haplotype 3
C A T
A T C
C T CHaplotype 1
SNP1 SNP2 SNP3
Zonas de recombinação e Blocos de haplótipos
Recombinationhotspots
Chromosome
Haplotypeblocks
C1 C2 C1S1
S2
S3
S4
S5
S1
S2
S3
S4
S5
SNP loci
Haplotype patterns : Major allele
: Minor allele
SNP loci
C2
I1 I2
SNPs estão relacionados com a diversidade de genótipos de humanos◦ podem ser mapeados relacionando-os a
diversidade de fenótipos. Um SNP individual ou um bloco haplótipo
pode servir de indicação para◦ características agronômicas◦ doenças◦ etc
Essa relação constitui a base e a motivação para a identificação e genotipagem de SNPs.
Blocos de Haplótipos
O genoma de cada indivíduo contém distintos padrões de SNPs
Pessoas podem ser agrupadas de acordo com esse perfil
Perfil de SNPs são importantes na identificação de respostas a terapias◦ Existe uma correlação entre certos perfis de
SNPs e respostas específicas a tratamentos
Genotipagem e utilizando SNPs como marcadores
Genoma/transcriptoma◦Sanger◦454◦Solexa/Solid/...
Alinhamento de sequências Identificação de Discrepâncias
Identificação de SNPs através da análise de sequencias
Encontrando SNPs: Mineração de SNPs baseados no sequenciamento
(Sanger tradicional)
Sequenciamento De DNA
mRNA
cDNALibrary
ESTOverlap
Genomic
BACLibrary
RRSLibrary
BACOverlap
ShotgunOverlap
Fragment DNA
DNA from multiple individuals
Sequence and Reassemble (known sequence) Assembly with other overlapping
Tzeng, Y.H., et al. (2004) YN: Yang, Z. and Nielsen, R. (2000) MYN (Modified YN): Zhang, Z., et al. (2006) GY: Goldman, N. and Yang, Z. (1994) MS (Model Selection), MA (Model Averaging)
KaKs_calculator - Métodos
A taxa de KAKS em humanos e chimpanzes é de 0,23.
Assumindo que mutações sinônimas são neutras, esse resultado implica que 77% das alterações de aminoácidos em genes hominideos são suficientemente deletérias e são eliminadas por seleção natural. Como mutações sinônimas não são totalmente neutras, a proporção de alterações de aminoácido neutras com consequências deletérias deve ser maior
Identificação de SNPs e haplótipos na poliplóide Coffea arábica
Objetivos principais Identificar e caracterizar SNPs em
sequências de EST Identificar os haplótipos com base nos
padrões de SNPs Identificar kaks
Foram utilizados dados de duas espécies de café:◦ Coffea arabica,◦ Coffea canephora
Coffea canephora Espécie diplóide Polinização cruzada: Alógama. Alta variabilidade C. canephora é melhor adaptada ao clima
equatorial úmido e quente Cultivada em baixas e médias altitudes Qualidade de bebida inferior Mais resistente a diversas condições do
que Coffea arabica, em particular a doenças e pragas.
Coffea arabica Allopoliploide (tetraplóide) Autógama Baixa variabilidade Originada de um cruzamento recente
(1mya) entre Coffea eugenoides e Coffea canephora
Espécie mais cultivada. Ocupa 75% das plantações mundiais de café.
Qualidade da bebida excelente.
Poliploidia
SoftwaresCAP3 para montagem dos ESTQualitySNP KaKs_calculatorScripts PERL
A montagem 95% similaridade por 100bp
◦Previnir agrupamento de parálogos Remover clusters com menos de 4 ESTs
Remover clusters com mais de 500 ESTs◦Evitar contigs mal formados
QualitySNP Analisar informações do CAP3 (Arquivo ACE) Detecção de SNPs
◦ Filtros◦ Reconstrução de haplótipos
Detecção de polimorfismos sinônimos e não sinônimos com o FASTY
Construir Banco de dados com os dados gerados.
Filtro 1 – Detectar SNPs potenciais Detecta todos os SNPs bi, tri e tetra
alélicos Cada alelo é representado com mais de
uma sequencia. ◦ Excluindo SNPs singlets
Classificação dos SNPs como intra ou inter espécies
Filtro 2 – Reconstrução dos haplótipos Agrupa sequências que representam um
mesmo alelo Tem os mesmos nucleotídeos nos sítios
polimorficos. Utiliza métodos matemáticos para
minimizar falsas reconstruções de haplótipos
Exclui haplótipos formados por apenas uma sequencia
Filtro 3 – Busca SNPs com alto score de confiabildade É calculado de acordo com a ocorrencia do
SNP em cada alelo com relação às regiões de alta e baixa qualidade
O score de confiabilidade é o menor valor Descartados valores abaixo de 2
Identificação de SNPs não-sinônimos Fasty
◦ Produz menores alinhamentos em sequencias de baixa qualidade
Detecção da ORF Correção de frameshifts Detecção de sSNP/nsSNP e SNPs ou INDELs
em regiões UTR Kaks Calculator
The database
Identificação dos ancestrais haplótipos Padrões diferentes de expressão dos
homeologos Contribuição de cada ancestral de arabica
no transcriptoma relacionando ao fenótipo Genes com maior pressão seletiva para