Maladies polygéniques/multifactorielles 26 novembre 2018 – 13h30-15h30 L3 Médecine – UE5 Génétique Médicale – Paris Diderot INSERM UMR-S-958 Génétique des diabètes Claire Vandiedonck Maitre de Conférences à Paris Diderot [email protected]Université Paris Diderot Faculté de Médecine Site Villemin 26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 1/78 Claire Vandiedonck - Université Paris Diderot
78
Embed
Diderot Paris Maladies polygéniques/multifactorielles ... · 4.1 –5 millions de sites polymorphes 99.9% de SNPs et petits indels 2100-2500 variants structuraux 160 CNV ~20 millions
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Maladies polygéniques/multifactorielles
26 novembre 2018 – 13h30-15h30
L3 Médecine – UE5 Génétique Médicale – Paris Diderot
INSERM UMR-S-958Génétique des diabètes
Claire VandiedonckMaitre de Conférences à Paris Diderot
PhénotypeSpécificité du phénotypeAge de début parfois tardif
GénotypeMultiplicité des gènesHétérogénéité génétiqueHétérogénéité alléliqueFréquence des allèles morbides
Relation génotype-phénotypeEffet modeste des variantsPleiotropie: effets multiples d’un même variant
=> Problème de puissance pour identifier les variants génétiques prédisposant aux maladies multifactorielles
Complexité de l’étude génotype-phénotypedans les maladies polygéniques
12
3
45
6
12
3
45
6
12
3
45
6
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 12/78
Claire Vandiedonck - Université Paris Diderot
PatientsContrôles
Mutations Variantsrares
Variantscommuns
Maladiesmendéliennes
Maladies polygéniquesHypothèse CVCD
= common variantfor common disease
Freq(allèle)
1%
Mutation/variant pathogène ou polymorphisme?
Un continuum des maladies mendéliennes aux maladies polygéniques:
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 13/78
Claire Vandiedonck - Université Paris Diderot
Maladies monogéniques versus maladies multifactorielles
monogénique multifactorielle
autre dénomination mendélienne polygénique,à hérédité complexe
prévalence = freq dans la population rare moyenne à forte
agrégation familiale forte faible
nb de gènes causaux 1 * plusieurs
fréquence allèles causaux rare fréquent à rare
pénétrance = proba d’être atteint pour les porteurs des variants
forte faible
=> Méthodes d’analyse différentes
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 14/78
Claire Vandiedonck - Université Paris Diderot
2. Diversité génétique humaineet déséquilibre de liaison
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 15/78
Claire Vandiedonck - Université Paris Diderot
Génome humain
Génome diploïde (2n)
46 chromosomes (2 x23)
22 paires d’autosomes: chr 1 à chr 22
1 paire de gonosomes = chromosomes sexuels X et Y
ou 2
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 16/78
Claire Vandiedonck - Université Paris Diderot
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 17/78
polymorphisme = variant = variation héréditaire de l’ADN= cas des marqueurs génétiquesdiversité génétique: + de 80 millions de variants validés
locus = un endroit donné du génome (ex: marqueur M1)
allèle = chaque forme particulière que prend le polymorphisme d’un locus (ex: allèle A et allèle G au marqueur M1)
génotype: le génome humain est diploïde donc deux allèles par locus = génotype (ex: A/A, A/G ou G/G au marqueur M1)
haplotype: séquence d’allèles à des locus voisins situés sur un même chromosome (en phase = en cis)
(ex: haplotype maternel GTC pour M1-M2-M3)
Polymorphisme génétique
M1
M2
M3
A
T
GC
G
T
A G A A
GA
ATTENTIONNe pas confondre chromosomes homologues et brins + et – de la double hélice de l’ADN. Un allèle/génotype/haplotype peut être donné sur le brin + ou sur le brin –
eg un génotype A/C sur le brin + = génotype T/G sur le brin moins!
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 18/78
Claire Vandiedonck - Université Paris Diderot
Génoypages de marqueurs polymorphes
Par puces
• par hybridation de l’échantillon sur sondes• détection de la fluoresence selon les allèles• rapide• dépend du contenu: variants connus• SNPs, INDELS ou CNVs
Par séquençage
• Sanger ou Nouvelle Génération (NGS)• nouveaux variants détectés y compris rares• difficile pour les insertions/délétions et variations structurales• coûteux et analyse bioinformatique plus lourde• exhaustif• résolution = 1 base
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 19/78
Claire Vandiedonck - Université Paris Diderot
Equilibre de Hardy- Weinberg
Les fréquences alléliques et génotypiques demeurent constantes d’une génération à l’autre
Soit un marqueur polymorphe avec les allèles A et a fréquences alléliques à la génération n et n+1
f(a)=p f(A)=q p+q=1
fréquence génotypiques à la génération n et n+1:
f(aa) = p² f(aA) = 2pq f(AA) = q² p²+2pq+q²=1
Conditions population panmictique = mariages au hasard taille infinie absence de mutations et de sélection
Absence d’équilibre de HW (test de Chi² significatif) mauvaise qualité de génotypage sélection, consanguinité -> importance du choix de la population
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 20/78
Claire Vandiedonck - Université Paris Diderot
Projet 1000 Genomes (2008-2015)Séquençage de 1000 individus par technique haut-débit
www.1000genomes.org
2012: fin de la phase pilote, 1092 genomes
2015: fin du projet, 2504 genomes
Recenser les variants génétiques avec une MAF= Minor Allele Frequency >1%
avec séquençage génome entier 7.4 X
Identifier les variants avec une MAF à 0.1% dans les régions codantes
avec séquençage 65.7 X des exons
Explorer ces variations génétiques dans 26 populations d’origines géographiques variées:
Afrique sub-saharienne 661
Asie de l’Est 504
Europe 503
Sud-Américains 347
Asie du Sud 489
Total = 2504 individus
Projets 1K genomes
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 21/78
Claire Vandiedonck - Université Paris Diderot
Au total
88 millions de SNPs
la moitié de nouveaux SNPs
dont 24% d’Asie du Sud et 28% d’Afrique
3.6 millions d’indels
60 000 variants structuraux
Genome typique
4.1 – 5 millions de sites polymorphes
99.9% de SNPs et petits indels
2100-2500 variants structuraux
160 CNV~20 millions de bases affectées (0.6% du génome)
la plupart sont rares~64 millions avec MAF <0.5%~12 millions avec MAF <5%
Diversité génétique humaine et projet 1K genomes
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 22/78
Claire Vandiedonck - Université Paris Diderot
Variants spécifiques de populations
3% des variants sont:
rares dans la population mondiale (MAF <0.5%)
fréquents dans une population (MAF>5%)
Globalement, plus de variabilité intra-population que inter-populations
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 23/78
Claire Vandiedonck - Université Paris Diderot
Détermination de la phase?
1. Analyse familiale 2. Génome haploïde 3. Méthodesprobabilistiquesdans les populations
A A
C C
A G
C T
A G
C T
Génotypes:
SNP1: A / G
SNP2: T / C
A G
T C
A G
C T
ou ?
Phase connue
Plus facile si :plusieurs marqueursmarqueurs informatifsplusieurs générations
directement dans des cellules haploïdes comme les gamètes:
NGS, facilité par long reads, sur chromosomes marqués ou séparés
reconstruction des phases les plus probables:
Algorithme EM(Expectation-Maximization)
Chaines de Markov cachées
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 24/78
Claire Vandiedonck - Université Paris Diderot
Haplotype et déséquilibre de liaison
dans une famille dans une population
Déséquilibre de Liaisonà la génération g
dans la population
Haplotypes parentaux et recombinants
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 25/78
Claire Vandiedonck - Université Paris Diderot
Le DL: une notion de génétique des populations multi-locus
Les 4 points clés du Déséquilibre de Liaison:
1. associations alléliques préférentielles entre deux locus différents
2. en présence de liaison: les locus sont génétiquement liés
(si les locus ne sont pas liés, on parle de déséquilibre gamétique)
3. détectées à la génération g
4. dans une population
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 26/78
Claire Vandiedonck - Université Paris Diderot
Le DL: une notion de génétique des populations centenaire !
further reading:
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 27/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 28/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
A
B
A
b
a
B
a
b
Il existe 4 HAPLOTYPES possibles dans la population:
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 29/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
A
B
A
b
a
B
a
b
Fréquencesà l’équilibre:
p q
Il existe 4 HAPLOTYPES possibles dans la population:
p (1- q) (1-p) q (1-p) (1–q)
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 30/78
Claire Vandiedonck - Université Paris Diderot
Déséquilibre de liaison (DL) Soient 2 locus A et B liés = sur un même chromosome (note: si chromosomes différents = on parlera de déséquilibre gamétique):
locus A: allèles A et a de fréquence f(A) = p et f(a) = (1-p)
locus B: allèles B et b de fréquence f(B) = q et f(b) = (1-q)
fréquences mesurées dans une population de sujets non apparentés
A
B
a
b
A
B
A
b
a
B
a
b
Fréquencesà l’équilibre:
p q
Il existe 4 HAPLOTYPES possibles dans la population:
p (1- q) (1-p) q (1-p) (1–q)
Il y a déséquilibre de liaison si les allèles des 2 locus ne sont pas associés indépendamment:
D = freq haplotypiques observées – freq à l’équilibre
2 mesures: D’ et r² D’ = 1 (DL complet) si 1 haplotype manquer² = 1 (DL parfait) si seuls deux haplotypes existent
Définition du Déséquilibre de liaison (DL)( = association allélique)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 31/78
Claire Vandiedonck - Université Paris Diderot
Exemple graphique
Equilibre de liaison Désequilibre de liaison
freq (A) = p = 0.6 et freq (a) = 1-p = 0.4freq (B) = q = 0.8 et freq (b) = 1-q = 0.2
freq (AB) = 0.6 x 0.8 = 0.48 ≠ freq (AB) ≅ 0.6 x 0.717 ≅ 0.43 => DAB ≅ 0.43 – 0.48 = -0.05 -> les allèles A et B sont moins souvent associés que ne le voudrait le hasard, cad qu’à l’équilibre
De même , on trouve DaB ≅ 0.05, DAb ≅ 0.05 -> associations en excèset Dab ≅ -0.05 -> associations en défaut
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 32/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 33/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 34/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 35/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
Evolution du DL
=> La recombinaison est le principal facteur diminuant le DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 36/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
a b
Evolution du DL
=> La recombinaison est le principal facteur diminuant le DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 37/78
Claire Vandiedonck - Université Paris Diderot
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
a b C
Evolution du DL
=> La recombinaison est le principal facteur diminuant le DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 38/78
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 39/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
a b c
=> La recombinaison est le principal facteur diminuant le DL
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 40/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
A B
A b
a B C
a b c
C
C
=> La recombinaison est le principal facteur diminuant le DL
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 41/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
DLa c > DLa b=> La recombinaison est le principal facteur diminuant le DL
A B
A b
a B C
a b c
C
C
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 42/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
DLa c > DLa b
=> mais le DL n’est pas 100% corrélé à la distance physique!=> La recombinaison est le principal facteur diminuant le DL
A B
A b
a B C
a b c
C
C
a b C
Claire Vandiedonck - Université Paris Diderot
Evolution du DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 43/78
A B
Chromosomeancestral
A B
A b
a B
Mutations
A B
A b
a B
Recombinaison
A B
A b
a B
a b
Dissipation du DL
DLa c > DLa b
Facteurs démographiques: croissance de la population: DL ↘ (en augmentant le nb de recombinaisons) dérive génétiquemélange et migration de populations
Sélection naturelle effet auto-stop epistasie
=> mais le DL n’est pas 100% corrélé à la distance physique!=> La recombinaison est le principal facteur diminuant le DL
A B
A b
a B C
a b c
C
C
a b C
Claire Vandiedonck - Université Paris Diderot
intérêts:1. SNP étiquette = "tagging SNP " -> réduction de la liste des SNPs génotypés
2. imputation des génotypes des variants fréquents et rares à partir de SNPs en DL dans un panel de référence (ex: 1Kgenome ou UK10K)
Les SNPs en r² > 0.8 sont redondants
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 44/78
Claire Vandiedonck - Université Paris Diderot
3. Méthode d’étude de l’hérédité multifactorielle: l’association allélique
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 45/78
Claire Vandiedonck - Université Paris Diderot
Etudes de liaison
bien adaptées pour variants rares à effets forts => peu adaptées pour maladies multifactorielles= étude de la co-ségrégation des marqueurs avec la maladie d’une génération à l’autre dans des familles = étude des méioses
Liaison => Locuséchantillons = familles
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 46/78
Claire Vandiedonck - Université Paris Diderot
Etudes d’association
bien adaptées pour variants frequents à effets faibles = bien adaptées pour maladies multifactorielles= recherche de marqueurs en DL avec le variant causal de la maladie
Association => Allèle
échantillons = cas et contrôles issus d’une population
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 47/78
Claire Vandiedonck - Université Paris Diderot
Etude d’association génétique = cartographie par DL
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 48/78
Principe association de l’allèle morbideau locus de la maladie avec les allèles des marqueurs voisins (génétiquement liés)
=> l’association détectée est indirecte
Variant causal non génotypéVariant génotypé
DL
Claire Vandiedonck - Université Paris Diderot
Etude d’association génétique
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 49/78
Contrôles Cas
Allèle 2 Allèle 2
Allèle 1 Allèle 1
Comparaison des fréquences alléliques entre cas et contrôles avec des contrôles intra-familiaux avec des contrôles pris dans la population générale
Ici: allèle 2 = allèle mineur = associé à la pathologie
Claire Vandiedonck - Université Paris Diderot
Comparaison des fréquences alléliques entre patients et contrôles pour un marqueur donné
non porteur de l’allèle à risque
porteur de l’allèle à risque
Cas Contrôles
test du Chi² à 1ddl sur les observations des comptes des différents allèles
Etude d’association cas / contrôles
cas contrôlesallèle 1 A B
allèle 2 C D
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 50/78
Claire Vandiedonck - Université Paris Diderot
Odds Ratio = rapport des côtes de chaque allèle entre cas et contrôles
l’OR est généralement donné pour l’allèle mineur
estimation de l’Odds Ratio et de son IC à 95%
IC 95% = exp [ ln(OR) ± 1.96 [var(lnOR)1/2]
avec var(lnOR) = (1/a1) + (1/a2) + (1/b1) + (1/b2)
Estimation des Odds Ratios
cas contrôlesallèle 1 A B
allèle 2 C D
𝑂𝑅 𝑝𝑜𝑢𝑟 𝑙′𝑎𝑙𝑙è𝑙𝑒 𝑛°1 =(𝑁𝑏 𝐴𝑙𝑙𝑒𝑙𝑒 1
𝑐𝑎𝑠𝑐𝑜𝑛𝑡𝑟ô𝑙𝑒𝑠
)
(𝑁𝑏 𝐴𝑙𝑙𝑒𝑙𝑒 2𝑐𝑎𝑠
𝑐𝑜𝑛𝑡𝑟ô𝑙𝑒𝑠)=(𝐴/𝐵)
(𝐶/𝐷)=𝐴𝑥𝐷
𝐶𝑥𝐵
OR > 1 => allele 1 sur-repésenté prédispose = allèle de risque OR < 1 => allele 1 sous-représenté = allèle protecteur
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 51/78
Claire Vandiedonck - Université Paris Diderot
L’allèle associé du marqueur est l’allèle causal (allèle fonctionnel)
allèle causal --> Maladie
L’allèle associé est en déséquilibre de liaison (DL) avec l’allèle causal
Ou c’est un faux positif !
allèle associé ----- allèle causal --> MaladieDL
Interprétation de l’association
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 52/78
Claire Vandiedonck - Université Paris Diderot
Etude d’association pangénomique (GWAS)
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 53/78
manhattan plot:
-log10(p-value) en function des positions génomiques des SNPs
Zoom sur une région associée
GWAS = Genome-Wide Association StudyPuces de génotypage avec 500 K à 5x106 SNPs
L’association est testée pour chaque SNP
p<5x10-8
norme
internationale
utilisée
Le seuil de décision est corrigé pour les tests multiples par correction de Bonferroni
sur la base de 106 marqueurs
Claire Vandiedonck - Université Paris Diderot
OR=1.2
OR=1.3
OR=1.5
OR=2
Puissance requiert de grands échantillons
=> Nécessité de regroupements au sein de grandsconsortiums
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 54/78
Claire Vandiedonck - Université Paris Diderot
2 000 cases for 7 diseases : Bipolar disorder, coronary artery disease, Crohn’s disease, hypertension, rheumatoid arthritis, type I and type II diabetes
3000 controls
Genotyped for the 500 K Affymetrix GeneChip
Le Wellcome Trust Case Control Consortium
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 55/78
Claire Vandiedonck - Université Paris Diderot
14000 Patients et 3000 contrôles
Nombreux SNPs associés mais leurs effets sont modestes (OR < 1.5)
Le Wellcome Trust Case Control Consortium
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 56/78
Claire Vandiedonck - Université Paris Diderot
Problèmes inhérents aux GWAS
Les populations de cas et contrôles doivent être homogènes
La stratification des populations conduit à des faux positifs =variants de population non associés à la maladie!
Cases Controls
allele1 1 10
allele2 10 100
=> OR=1
Cases Controls
allele1 101 20
allele2 20 101
=> OR=25.2
Cases Controls
allele1 100 10
allele2 10 1
=> OR=1
cases controls
020
4060
8010
0 allele1allele2
cases controls
020
4060
8010
0 allele1allele2
cases controls
020
4060
8010
012
0
Population 1Populations
1+2
Population 2
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 57/78
Claire Vandiedonck - Université Paris Diderot
Analyse en composante principale (ACP)
Évaluation de la stratification de la population
-> choix des sujets appartenant
aux même populations
-> utilisation des vecteurs de
l’ACP comme covariables dans
l’analyse d’association
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 58/78
Claire Vandiedonck - Université Paris Diderot
Calcul de puissance
Le phénotype étudié doit être homogène et spécifique
La population contrôle Variations de fréquences alléliques avec l’origine géographique ou ethnique sont modestes mais comparables à l’amplitude des effets recherchés=> ACP pour détecter les ‘outliers’
Allèles en équilibre de Hardy-Weinberg chez les contrôles
Prise en compte des multiples tests effectués!!!problème des faux-positifs à cause du grand nombre de testscorrection de Bonferroni: seuil fixé à p=5x10-8
FONDAMENTAL: Reproduire les résultats dans une cohorte indépendante
Précautions à prendre pour un GWAS
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 59/78
Claire Vandiedonck - Université Paris Diderot
Réplication des associations indispensable
Essentielle pour confirmer qu’une information est réelle
= même SNP et même allèle de risque
≠ autre allèle dans le même gène
Importance d’utiliser des échantillons de réplication indépendants
crédibilité augmentée si investigateurs multiples
dans le même groupe ethnique initialement
ensuite dans un groupe ethnique différent
idéal mais pas obligatoire car l’allèle peut être population-spécifiqueex: PTPN22*Arg620Trp
associé aux maladies autoimmunes (OR ~1.5-2)
allèle absent dans populations asiatiques
Forest plot
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 60/78
Claire Vandiedonck - Université Paris Diderot
Inconvénient du DL pour la cartographie fine
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 61/78
Marqueur
génétiqueLocus
de maladie
Principe association de l’allèle morbideau locus de la maladie avec les allèles des marqueurs voisins (génétiquement liés)
=> l’association détectée est indirecte, due au DL!
2 objectifs contradictoires liaison d’une région chromosomique:
atout d’un DL fort localisation fine:
inconvénient d’un DL fort
Variant causal non génotypéVariant génotypé
DL
Claire Vandiedonck - Université Paris Diderot
Comment affiner l’association?
Réduire l’étendue du déséquilibre de liaison augmenter la taille des échantillons
=> plus de recombinaisons
tester l’association dans une autre population
fréquences alléliques différentes
haplotypes plus ou moins étendus selon les populations
Densifier les variants dans la région associée par imputation à partir d’un panel de référence
par séquençage en particulier chez les patients
Recourir à des phénotypesintermédiaires
si possible quantitatifs
(ex: âge de début de la maladie, titres d’anticorps,
taux de lipides, expression des gènes…)26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 62/78
génotype trait complexe
Claire Vandiedonck - Université Paris Diderot
Identifier ensuite le variant causal de chaque region associée
Edwards, Am J Hum Genet 201326/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 63/78
Claire Vandiedonck - Université Paris Diderot
Approches intégratives pour identifier le variant causal
Hasin, Genome Biol 2017
Claussnitzer M, N Eng J 2015Smemo S, Nature 2014
Exemple: variant au locus FTO associé au Diabète de type 2
-> rôle du variant sur deux gènes distaux
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 64/78
Claire Vandiedonck - Université Paris Diderot
4. Bilan des GWAS
26/11/2018 L3 Médecine-UE5 Génétique Médicale-Maladies polygéniques/multifactorielles-2018-Vandiedonck C. 65/78
Claire Vandiedonck - Université Paris Diderot
Published Genome-Wide Associations through 07/2012Published GWA at p≤5X10-8 for 18 trait categories