Top Banner
La teoría de coalescencia Proceso estocástico Es un linaje de alelos proyectado hacia el pasado (su ancestro común mas reciente) Aproximación básica usando el modelo de Wright-Fisher Modelo probabilístico de una genealogía de una muestra de n genes tomados al azar de una población grande Es el avance mas importante de la genética de poblaciones de las últimas 3 décadas. Su uso se refiere a un análisis estadístico ruguroso de diferentes modelos usando datos de poblaciones naturales Surgió como una necesidad de estimar parámetros del pasado usando muestras de poblaciones actuales Trabajo original de: Kingman, J Appl Prob 19A:27, 1982
46

La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Sep 25, 2018

Download

Documents

truongxuyen
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

La teoría de coalescencia• Proceso estocástico

• Es un linaje de alelos proyectado hacia el pasado (suancestro común mas reciente)

• Aproximación básica usando el modelo de Wright-Fisher

• Modelo probabilístico de una genealogía de una muestrade n genes tomados al azar de una población grande

• Es el avance mas importante de la genética de poblacionesde las últimas 3 décadas. Su uso se refiere a un análisisestadístico ruguroso de diferentes modelos usando datosde poblaciones naturales

• Surgió como una necesidad de estimar parámetros del pasado usando muestras de poblaciones actuales

• Trabajo original de: Kingman, J Appl Prob 19A:27, 1982

Page 2: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Deriva génica: visión del pasado al presente (genética de poblaciones retrospectiva)

Page 3: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Una visión desde la replicación del ADN (Templeton)

Page 4: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Los tiempos de coalescencia son variables aleatorias distribuidos exponencialmente

Page 5: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

El tiempo de coalescencia (hasta el MRCA) depende de N

Page 6: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Si tomamos 6 haplotipos en 10 generaciones, un resultado podría ser este

Con los haplotipos que no dejaron descendencia (replicación) y sin ellos coalescencia

Page 7: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

La probabilidad de que 2 genes coalezcan

P(2 linajes tengan el mismo padre)y coalezcan

no lo hagan

1/ 2N

1- 1/ 2N

Si consideramos un tercer linaje, la probabilidad de que siendo desciendan

Page 8: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

La probabilidad de que 3 genes coalezcan

P(2 linajes tengan el mismo padre)Y coalezcan

No lo hagan

1/ 2N

1- 1/ 2N

Si consideramos un tercer linaje, la probabilidad de que desciendan de diferentes padres sería (1-1/2N) x ((2N-2)/2N) o(1-1/2N) x (1-2/2N)

Page 9: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

En general para n linajes

Probabilidad de que n linajes tengan n padres diferentes en la generación previasería:

Y la probabilidad de que los n linajes o genes muestreados tengan n ancestrost generaciones atrás sería:[Pr (n)]t

Page 10: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Probabilidad de que dos genes o linajes no coalezcan en tgeneraciones y coalezcan en la generación t+1

Esta ecuación se puede expresar también como:

Donde x es la ploidía y Nef esel tamaño efectivo de la población

Page 11: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

El tiempo promedio a la coalescencia sería entonces

Donde x depende de la ploidía y la forma de herencia y Nef el tamaño efectivo de la población

Page 12: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Probabilidad de que n genes o linajes tengan n-1 ancestros, t+1 generaciones atrás

Page 13: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

El n-colescente

Page 14: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Tiempo esperado durante el que hay nlinajes diferentes

Page 15: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

La variación entre muestras usando los mismos parámetros en la simulación

Page 16: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Tiempo esperado a la coalescencia de los nlinajes o genes

Para 5 genes el tiempo esperado es 3.2N generaciones

Page 17: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

El tiempo total de la coalescencia (Tcen Gillespie) sería:

Partiendo de:

y de:

Page 18: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Para generar estas genealogías podemos usar números aleatorios de una distribución

uniforme entre 0 y 1 y:

Por ejemplo si tenemos una muestra de 6 linajes y el primernúmero aleatorio es x = 0.22, entonces T6 = 0.0166, si el segundoes x = 0.57, T5 = 0.0844, etc.Cada simulación genera una topología diferente para 6.

Page 19: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Los tiempos de coalescencia y el número de mutaciones en la muestra

El tiempo total de coalescencia

Para 4 linajes

El número de mutaciones

El número de sitios segregantesesperado para 4 linajes sería

Page 20: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Si introducimos mutación…1

Caso 1. Coalescencia primero, mutación después

Page 21: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Si introducimos mutación…2

Caso 2. Mutación primero, coalescencia después

Page 22: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Si introducimos mutación…3

Esta última ecuación es igual a la ecuación de la heterocigosidad en elEquilibrio que derivamos antes y donde theta = 2xNef

Page 23: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Si introducimos mutación…4

Donde….

Page 24: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Estimación del MRCA para algunos genes en humanos

Page 25: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Y…

Sería un buen estimador de:

Page 26: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Muestras usando el modelo de Wright-Fisher

Page 27: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

La topologíade la coalescencia nos ayuda a entender la historia de la muestra demográfica y evolutivamente si tienen una baja

probabilidad de ser neutras

Ramas internas largas

Ramas externas largas

Si hay 4 mutaciones, en el caso de la izquierda habría dos haplotiposmientras que en el caso de la derecha habrá 4 haplotipos

Page 28: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

En el caso neutro, con mutación y deriva, se espera…

Page 29: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Los estimados de π y θ deben de ser iguales en un modelo Wright-Fisher con mutación

Page 30: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Prueba de Tajima

Hipótesis bajo un modelo Wright-Fisher con mutación

Estadístico de Tajima

Donde,

Page 31: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Frecuencias de los sitios polimórficos

• Definamos como el número de sitios segregantes donde la base mutante está en i secuencias y la ancestral en n-i.

• Por otro lado es el número de sitios segregantes donde la frecuencia del alelo es i.

Page 32: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Callitropsis guadalupensis, polimorfismos en dos regiones del cloroplasto

Datos de Rosas, 2008

Page 33: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Distribución de frecuencias de los sitios nucleotídicos polimórficos

Singletons = 105, 301, 842, 1316Doubletons = 333, 442Tenton = 113

Alelos ancestrales: 113 = C; 301= C; 333 = T, etc.

Page 34: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Prueba de Fu y Li

Donde, es el número de singletons de la muestray,

Page 35: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Las relaciones entre los estadísticos de la prueba de Tajima y los de la prueba de Fu y Li

Page 36: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Efecto de distintas historias demográficas neutrales en los patrones de polimorfismo

de ADN

Page 37: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Distintas historias demográficas producen diferentes genealogías

(a) Tamaño constante, (b) Disminución exponencial, (c) Aumento exponencial

Kuhner, 2009, TREE

Page 38: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Efecto de otros mecanismos evolutivos en la topología de la coalescencia para diferentes

regiones del genoma

Page 39: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Coalescencia y recombinación

• La recombinación genera un contexto téorico de la coalescencia que es mas difícil de incorporar en los análisis y generar predicciones.

• En este caso se reconstruyen ARCs (Ancestral Recombination Graphs).

Page 40: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Coalescencia y recombinación…2

Hudson, 1991Oxford Surveys in Evolutionary Biology

Page 41: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Coalescencia y estructura poblacional: la migración genera coalescencias mas recientes y distancias pareadas mayores

Page 42: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Coalescencia y estructura poblacional: la migración genera coalescencias mas recientes y distancias pareadas

mayores…2

(a) Dos poblacionesaisladas

(b) Una población

En ambos casos

4Nu = 5

Page 43: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

• La teoría de coalescencia permite hacer inferencias usando hipótesis nulas ad hoc

• Estas inferencias incluyen estimaciones de parámetros y de procesos poblacionales históricos

• El campo se está moviendo hacia generar hipótesis usando simulaciones con el conocimiento de la historia natural de las especies estudiadas

Conclusiones: coalescencia

Page 44: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Sobre la evolución y el origen del AH1N1

Mexico,Texas,NY

California

México 2007 y 2008

BEAST: Bayesian Evolutionary Analysis by Sampling Trees

Page 45: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

La topología no está tan bien resuelta

Mexico,Texas,NY

California

México 2007 y 2008

5 mesesLas barras muestran el 95% de la densidad posterior para cada tiempo de divergencia

Page 46: La teoría de coalescencia - ccg.unam.mxvinuesa/tlem09/docs/TLEM_Coalescencia_0609.pdf · Estadístico de Tajima. Donde, Frecuencias de los sitios polimórficos • Definamos como

Se pueden usar distintos modelos de evolución y tasas constantes o no

Evolución del virus del dengueDrummond y Rambaut, 2007