Introduction Mod` eles D´ emographiques Un exemple d’application D´ eveloppements Conclusion Mod` eles hi´ erarchiques bay´ esiens de diff´ erenciation g´ en´ etique et recherche de signatures de s´ election applications ` a des jeux de donn´ ees SNP haut-d´ ebit Mathieu Gautier UMR INRA/CIRAD/IRD/SupAgro CBGP 29 Juin 2011
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Modeles hierarchiques bayesiens de differenciationgenetique et recherche de signatures de selection
applications a des jeux de donnees SNP haut-debit
Mathieu Gautier
UMR INRA/CIRAD/IRD/SupAgro CBGP
29 Juin 2011
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Recherche de signatures de selection
Forces evolutives gouvernant l’evolution des frequencesalleliques
Mutation (et recombinaison a l’echelle haplotypique) : source de la variabilite
Derive genetique : introduit la stochasticite (Taille finie des populations)
Migration en terme de flux de genes
Selection
Influence differente a l’echelle du genome (Cavalli-Sforza, 1966)
Facteurs demographiques (derive, flux de gene) ⇒ effet global
Selection (mutation et recombinaison) ⇒ effet local
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Differentes approches
Principe General
Definition d’un estimateur de la variabilite genetique intra/interpopulation (e.g. FST , EHH)
Recherche d’outliers (relativement a l’attendu neutre)
Distribution theorique (Lewontin et Krakauer, 1973, Bonhomme et al., 2010)
Distribution simulee (Bowcock et al., 1991, Beaumont & Nichols, 1996)
Distribution empirique (Akey et al., 2002)
Modelisation Hierarchique (Bayesienne)
Efficace pour distinguer les effets locus des effets population-specifiquesur la variabilite genetique
La distribution (frequences alleliques) est connue (ou approchable) pour differentsmodeles (demographiques)
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
FST et pure-derive
Modele (demographique) de Wright/Fisher
Les populations ont evolue pendant t generations (non chevauchantes) encomplet isolement depuis une population ancestrale commune
Illustration dans le cas de taille de population constante (N)
BF peut s’exprimer en unite Deciban (BFdB = 10log10( Post. oddsPrior odds
))
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
La regle de decision de Jeffreys (Good, 1979)
Odds Ratio BF (dB) Strength of evidence
1 to 3.5 0 to 5 ”Barely worth mentionning”
3.5 to 10 5 to 10 ”Substantial”
10 to 30 10 to 15 ”Strong”
30 to 100 15 to 20 ”Very Strong”
>100 >20 ”Decisive”
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Puissance et robustesse
Robustesse
robuste aux ecarts a la panmixie (intra-pop) faibles a moderes (FIS > 0 ou
FIS < 0)
robuste au biais de recrutement des marqueurs
structure des populations ?
Puissance pour un seuil de 15 dB (”strong evidence”)
FDR ' 0
Bonne puissance pour les SNPs soumis a une selection positive moderee a
forte mais moins efficace pour la selection balancee
Si αi >= 2 (⇔ s ' 0.05) : FNR< 30% Si αi >= 3 (⇔ s ' 0.1) : FNR< 10% Si αi <= −2 (⇔ s ' 0.1) : FNR< 70%
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
>800 races bovines dans le monde
2 “especes”
Sans bosse : taurins (Bos taurus)
Avec bosse : zebus (Bos indicus)
Au moins 2 foyers de domestication
Croissant Fertile (taurins)
Vallee de l’Indus (Zebus)
Migration sur une echelle mondiale
Histoire liee aux flux migratoires humains
Adaptation a differents environnements(climatiques, modes d’elevage...)
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
ACP realisee a partir d’un jeu de donnees comprenant 44,706 SNPs genotypes sur1021 individus appartenant a 47 populations differentes (Gautier et al.,2010)
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Adaptation des bovins Ouest-Africaines (Gautier et al.,2009)
∼ 300 ind. issus de 9 pop ouest-africaines :5 taurines (trypanotolerantes), 2 Zebus (trypanosensibles) et 2 hybrides ( ?)
36,320 SNPs :MAF>0.01 (dans au moins une pop. zebu et une taurine) ⇒∼ 1 SNP tous les 70 kb
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Resultats
P[δi = 1|data] = 0.186
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Combiner l’information de SNPs voisins (a posteriori)
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Interpretation biologique
Au total 53 regions identifiees
Principales fonctions biologiques impliquees Reponse immunitaire
e.g. MHC region sous selection balancee
⇒ reponse aux pressions liees aux maladies infectieuses Systeme nerveux :
e.g. regulation de la temperature corporelle, horloge circadienne et reproduction
⇒ nouvelles contraintes environnementales proporietes des poils et de la peau :
e.g. taille des poils (et des cornes), coloration
⇒ Adaptation a la chaleur
Introduction Modeles Demographiques Un exemple d’application Developpements Conclusion
Modeliser la dependance spatiale des SNPs
Un modele CAR (Guo et al., 2009)
F ijST = θij = 1− (1− θi )(1− θj ) et log
(θi
1−θi
)= µ+ εi
CAR prior sur les εi : εi |ε−(i) ∼ N
(∑i 6=j
wij
wi+εj ,
1wi+σ
2
)ou wi+ =
I∑j=1
wij
definition des poids : wij =
c1 + c2e
−c3|dij | si j 6= i
0 si j = i
Limites du modele
definition des constantes (c1, c2 et c3), contrainte d’identifiabilite (∑εi = 0)