Page 1
LA DATATION MOLÉCULAIREDE LA PHYLOGÉNIE DES EUCARYOTES :
UNE HISTOIRE D'HORLOGES,DE FOSSILES ET DE GÉNOMES.
Emmanuel J. P. DOUZERY
Institut des Sciences de l'Evolution de Montpellier (ISE-M) Université Montpellier II
UE ADAPHYL "Adaptation & Phylogénie"Banyuls - 10 mai 2010
http://www.isem.cnrs.fr/spip.php?rubrique380&lang=en
Page 2
1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?
6. QUELS ENSEIGNEMENTS TIRER DE LA DATATIONDE L'HISTOIRE ÉVOLUTIVE DES EUCARYOTES ?
Page 3
1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
La datation moléculaire en 6 questions…
Page 4
Les biomolécules
constituent
une machine
à remonter
le temps.
Page 5
ALIGNEMENT DE L'α-GLOBINE CHEZ 6 VERTÉBRÉS(vache, homme, ornithorhynque, poulet, carpe, requin)
Page 6
L'HORLOGE MOLÉCULAIRE GLOBALE :LE CAS DE L'α-GLOBINE
0 100 200 300 400 500
Age de l'ancêtre commun (Ma)
vache
ornithorhynque
poulet
carperequin
homme
0
0.2
0.4
0.6
0.8
1.0
Page 7
0
0.2
0.4
0.6
0.8
1.0
0 100 200 300 400 500
Age de l'ancêtre commun (Ma)
Nombre desubstitutions
d'acidesaminés / site
vache / homme
ornithorhynque poulet
carpe
requin
L'HORLOGE MOLÉCULAIRE GLOBALE :LE CAS DE L'α-GLOBINE
Pente = 0.81 / 450= 1,8 . 10-3 subs./site/Ma
Page 8
COMPARAISON POULET / ALLIGATOR
K = 41 / 144 = 0.28Horloge = 1,8 . 10-3 subs./site/Ma
D'où la divergence Oiseaux / Crocodiles : 0.28 / 1,8 . 10-3 = 155 Ma
Page 9
1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
Page 10
[Avise & Johns 1999]40 30 20 10 0 Ma
Drosophiles(13 espèces
d'un seul genre)
Primates7 espèces
de diversesfamilles
Cichlidés(14 espècesen 9 genres)
Harmonisation de la taxonomie de groupes distinctsgrâce à l'établissement d'un cadre temporel de référence.
Page 11
UN SUPERARBREDES ANGIOSPERMES
(379 familles)
[Jones et al. 2004]
Taux de diversification :- faibles ;- élevés.
* : nœuds àforte asymétrie
de richesse spécifique
Compréhension des modalités de diversificationdes espèces au cours du temps.
Page 12
1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?
Page 13
Taux desubstitution r
A G
C T
rGTrAC
rAG
rCT
rATrCG
Fréquencesen bases π
Fréq
uenc
es
A C G TAPPROCHES
PROBABILISTES :Modèles d'évolution
des séquences
2N - 3Longueurs
de branches
LB
Vraisemblance
0 0,005 0,01 0,015 0,02 0,025 0,03 0,035 0,04
-6296
-6294
-6292
-6290
-6288
-6286
-6284
-6282
Page 14
QUANTITÉ D'ÉVOLUTION : Branche (Bi) =Taux d'évolution (Ri) x Temps (ΔTi)
Un arbre phylogénétique=
une topologie+
des longueurs de branches
i
A
B
C
D
E
F
Echelle :1 changement évolutif
En supposant la constance de R(hypothèse d'horloge moléculaire),
nous en déduisons que :
ΔTi = Bi / RABSOLU
Page 15
0.1 substitution par site
(= 10 %)
Branche (Bi)Taux d'évolution (Ri) x Temps (ΔTi)
i
A
B
C
D
E
F
1. Taux LENT = 0.1 % / Ma Temps important : 100 Ma
2. Taux RAPIDE = 1 % / Ma Temps plus court : 10 Ma
Page 16
Gène X
ArbreML
DATATION AVEC HORLOGE MOLÉCULAIRE
ArbreML
avec horloge
Calibrationfossile
Estimationsdes âges
Page 17
1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?
Page 18
A B C0
x
y
z
t A/B
Page 19
[Benton 2009]
Distribution de probabilité de l'âge d'origine d'un clade.
Courbelogistique
Des fossiles plus ancienspeuvent être découverts…
*
*
0
x
y
z
Page 20
LES PROBLÈMES POSÉSPAR LE REGISTRE FOSSILE
DES PREMIERS EUCARYOTES.
1. Distinction délicate entre Procaryotes / Eucaryotes :les 1ers seraient petits, et les 2nds plus grands ;
2. Difficultés d'interprétation du faitdu peu de différenciation morphologique.
Page 21
1 µ
PICO-EUCARYOTES
EUCARYOTESTANDARD
Euglène
BACTÉRIE
Il existe des eucaryotes aussi petits que des bactéries !
Page 22
Epulopiscium est unedes plus grandes bactéries
connues : 500 µ !
106 foisplus
volumineusequ'E. coli
[Angert et al. 1993]
Il existe des bactéries aussi grosses que des eucaryotes !
Page 23
[Javaux et al. 2001]
1 500 Ma(Australie)
ACRITARCHES[EUCARYOTES D’AFFINITÉSÉVOLUTIVES INCERTAINES]
Protistes avec une architecture cytosquelettique
35 µ
Page 24
Hallucigenia
EXPLOSION CAMBRIENNEDES ANIMAUX
505 Ma(Burgess, CA)
Diversification dite explosiveau début de l'ère primaire.Trilobites
Eponges
Annélides
Chordés
Page 25
1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?
Page 26
Gène X
ArbreML
ArbreML
avec horloge
Taux plus lent,âges plusprofonds
L'ERREUR PALÉONTOLOGIQUE
Une autrecalibration
fossile
Page 27
Gène Y
Longueursde branchesdifférentes
Arbreavec
horloge
Tauxdifférent,
âges différents
L'ERREUR STOCHASTIQUE
Calibrationfossileinitiale
Page 28
Gène Z
Longueursde branchesdifférentes
Distorsionde l'arbre
avec horloge
Tauxdifférent,
âges différents
L'ABSENCE D'HORLOGE
Calibrationfossileinitiale
Page 29
Heritabilitédes taux
Les taux d'évolution varientgraduellement le long des branches
Lent RapideTaux
LES HORLOGES MOLÉCULAIRES RELÂCHÉES
Page 30
Auto-corrélation des taux d'évolutionde branches en branches
rrP
[Kishino, Thorne & Bruno 2001]
3 % / Ma
4 % / Ma 5 % / Ma
5 % / Ma7 % / Ma 10 % / Ma
Page 31
Ages
APPROCHE BAYÉSIENNEPOUR L'HORLOGE MOLÉCULAIRE RELÂCHÉE
Chaîne stationnaireEchantillonnage de 9 000 valeurs
µ = 11,0 Ma ± 2,1Intervalle de crédibilité à 95% = 7,5 - 15,9 Ma
MCMC
Page 32
1. QU'EST CE QUE L'HORLOGE MOLÉCULAIRE ?
2. POURQUOI DATERLES ÉVÉNEMENTS DE SPÉCIATION ?
La datation moléculaire en 6 questions…
4. COMMENT MARIER GÉNOMES ET FOSSILESPOUR UNE DATATION MOLÉCULAIRE ?
5. QUELS SONT LES ÉCUEILSQUI LIMITENT LA FIABILITÉ DES DATATIONS ?
3. COMMENT EXTRAIRE L'INFORMATIONDE DATATION À PARTIR DES PHYLOGÉNIES ?
6. QUELS ENSEIGNEMENTS TIRER DE LA DATATIONDE L'HISTOIRE ÉVOLUTIVE DES EUCARYOTES ?
Page 33
LES ÂGES DE LA VIE DES BILATÉRIENS(Divergence Protostomiens / Deutérostomiens)
540Ma
Wray et al.(1996)
1 200 Ma
Aris-Brosou & Yang(2002, 2003)
582 Ma
656-573 MaPeterson et al.
(2004)
Lynch(1999)
630 Ma
Ayala et al.(1998)
736-670 Ma
850-730 MaFeng et al. (1997)
Gu(1998)
830 Ma
Wang et al.(1999)
993 Ma
1 000 MaHedges et al.
(2004)
700-579 MaPeterson & Butterfield (2005)
> 586 MaBromham & Hendy
(2000)
Blair et al. (2005)
1166-1074 Ma
x 2
Page 34
≠ caractères moléculairesADN mt ADN nuc Acides aminés
≠ marqueurs moléculaires chez ≠ espèces4 6 19 39 73 105 151 protéines
≠ méthodesHorloge globale Horloges relâchées
≠ calibrations paléontologiquesMammifères / Oiseaux à 310 ± 0 Ma
≠ niveaux de calibrationPrimaires (fossiles) / Secondaires (moléculaires)
≠ topologiesProtostomes versus Coelomates
Page 35
1. RÉDUIRE LES ERREURS STOCHASTIQUES !
Utilisation d’un grand nombre de protéines
2. RÉDUIRE LES ERREURS PHYLOGÉNÉTIQUES !
Utilisation d’un grand nombre d’espèces
3. RÉDUIRE LES ERREURS PALÉONTOLOGIQUES !
Utilisation de multiples intervalles de calibration.
4. RÉDUIRE LES ERREURS DE DATATION ! Utilisation d’horloges protéiques relâchées
par approche bayésienne
COMMENT AMÉLIORER LA DATATION MOLÉCULAIREDE L'HISTOIRE DES EUCARYOTES ?
Page 36
129 protéines30 399 sites 0.1
Choanoflagellés
StraménopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodium
ALVÉOLÉS
Dictyostelium
ANIMAUX(BILATÉRIENS)
[Philippe et al. 2004]
RhodophytaChlorophytaBryophytaLiliopsidaArabidopsis
PLANTES
BasidiomycètesSchizosaccharomycesSordarialesSaccharomycesCandida
FUNGI
ChelicerataDrosophilaLepidopteraHymenopteraPlathelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis
PROTOSTOMES
LeishmaniaTrypanosoma bruceiTrypanosoma cruzi
KINÉTOPLASTIDÉS
UrochordataActinopterygiiMammalia
DEUTEROSTOMES
Page 37
100Mya
RhodophytaChlorophytaBryophytaLiliopsidaArabidopsisLeishmaniaTrypanosoma bruceiTrypanosoma cruziStramenopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodiumBasidiomycetesSchizosaccharomycesSordarialesSaccharomycesCandidaChoanoflagellatesUrochordataActinopterygiiMammaliaChelicerataDrosophilaLepidopteraHymenopteraPlatyhelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis
PLANTS
KINETOPLASTIDS
ALVEOLATES
FUNGI
ANIMALS
DEUTEROSTOMES
PROTOSTOMESHorloge moléculairebayésienne relâchée.
849 ± 50
695 ± 30
984 ± 65
1085 ± 79
625 ± 20
727 ± 53
729 ± 38928 ± 60
1010 ± 69
872 ± 60
LATEMIDDLE IIIIIIPROTEROZOIC PHANEROZOIC [Douzery et al. 2004]
Page 38
CONCLUSIONS
L'horloge moléculaire bayésiennerelâchée sur 129 protéines :
réduit l'écart entre les estimations
paléontologiques et moléculaires
pour les âges des grands groupes eucaryotes ;
démontre l'importance de la prise en compte
des variations des taux d'évolution ;
souligne la nécessité d'un échantillonnage
taxonomique et génétique conséquent.
Page 42
Fossile basal« stem »
Fossileterminal
« couronne »
Les choanoflagellés
LE GROUPE ÉTUDIÉLes animaux
ORIGINE
DIVERSIFICATION
Taxonéteint †
QU'EST-CE QUE L'ÂGE D'UN TAXON ?
Ann. Arth.Moll. Chor.
LE PLUSPROCHE PARENT
Temps
Page 43
RhodophytaChlorophytaBryophytaLiliopsidaArabidopsisLeishmaniaTrypanosoma bruceiTrypanosoma cruziStraménopilesCiliophoraCryptosporidiumSarcocystidaePiroplasmidaPlasmodiumBasidiomycètesSchizosaccharomycesSordarialesSaccharomycesCandidaChoanoflagellésUrochordataActinopterygiiMammaliaChelicerataDrosophilaLepidopteraHymenopteraPlathelminthesTrichocephalidaStrongyloididaTylenchidaSpiruridaAscarididaDiplogasteridaCaenorhabditis
PLANTES
FUNGI
DEUTEROSTOMES
PROTOSTOMES
ALVÉOLÉS
KINÉTOPLASTIDÉS
ANIMAUX(BILATÉRIENS)
HORLOGES :lnL SANS = -779 283lnL AVEC = -783 020PLRT < 0.0001 [Douzery et al. 2004]
Page 44
δ = AX - BX
A
BC
X
R
δ = AC - BCVitesse A ≠ Vitesse B
si : δ / σ > 1.96
EVALUER L'HORLOGE : LE TEST DU TAUX RELATIF
Page 45
Ratio des taux
% derejet
du tauxconstant
100 pb
200
400700
2 kb3 kb
90%
1 kb