Épidémiologie analytique
Cours IFSI S3 14/09/2010
Nicolas Griffon
Plan
Rappel Objectifs des enquêtes étiologiques Principaux types d'enquêtes Les biais Interprétation des résultats Liaison statistique et relation de causalité Principes généraux
Définition
Épidémiologie :
« Discipline scientifique étudiant la distribution et les caractéristiques des problèmes de santé au sein d'une population, cherchant à identifier les facteurs qui expliquent l'apparition de ces problèmes, et à juger de l'efficacité des mesures prises pour les éviter ou les corriger. »
Échantillons
Travail sur des échantillons issus de la population
Tirage au sort échantillon représentatif Simple : dans une liste de sondage Stratifié : dans plusieurs listes de sondage En grappe : tirage de liste...
Indicateurs
Prévalence : « Mesure quantitative de la fréquence des cas d'un problème de santé
donné (récents ou anciens) présents au sein d'une population, à un moment donné. Elle mesure l'état de santé de cette population. Elle est calculée en rapportant le nombre de personnes atteintes du problème à un moment donné à l'effectif de la population totale (proportion). »
Incidence : « Nombre de cas d’une affection définie nouvellement apparus dans un
groupe ou une population au cours d’une période donnée (souvent une année) ; il est généralement rapporté au nombre de personnes du groupe ou de la population chez qui l’affection était susceptibles d’apparaître (taux d’incidence). »
formules
Prévalence p = nombre de malade à l'instant t
population à cet instant
Incidence :
i = nombre de nouveau cas sur une période population exposée durant cette période
Exemple
t
Individu
1
2
3
4
5
6
7
01/10 01/11 01/12
I = 3/7 = 0,43 cas/mois/personneP = 0/7 = 0%P = 2/7 = 28,6%
Erreur aléatoire
Proportion de gaucher dans la population : 10%
Nombre de gaucher dans un échantillon :
0
5
10
15
20
25
30
35
0 1 2 3 4 5 6 7 8 9 10 nombred'échantillon
0
10
20
30
40
50
60
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
De 10 personnes De 100 personnes
Objectifs
Quantifier l'association entre une pathologie et une exposition : Estimateur de risque
Étudier la causalité : Déterminant Marqueur de risque/protecteur
Identifier les facteurs de risque des états de santé pour agir.
Facteur de risque/protecteur
Définitions
Déterminants : Caractéristique lié de façon causal à la survenue d'un problème
de santé
Marqueur de risque/protecteur :Caractéristique lié de façon non causal à la survenue d'un
problème de santé
Facteur de risque/protecteur :Caractéristique lié à la survenue d'un problème de santé, sans
présumer de la causalité.
Essais expérimentaux
• Une population Deux groupes
• Répartition au hasard (tirage au sort)
• Intervention différente dans chaque groupe (exposition)
• Comparaison du nombre d’évènement (calcul d’un risque relatif (RR))
Exemple
• Étude d’un nouveau médicament de l’hypertension.
Population d’hypertendu
Groupe A Groupe B
traitement placebo
Exemple
• Mesure de la tension après deux mois de traitement
HTA+ HTA- TA moyenne
ttt 17 103 152 mmHG
placebo 28 92 158 mmHG
P(HTA+/ttt)=17/120 = 14,2%P(HTA+/placebo)=28/120 = 23,3%RR = 14,2/23,3 = 0,61
Comparaison de 152 à 158 mmHG ?erreur aléatoire ou différence vrai ?
Limites
• C’est la méthode de référence
– On essaye toujours de s’en rapprocher au maximum
• Pas toujours applicable…
…recours à des enquêtes d’observation ou quasi-expérimentale
Enquête quasi-expérimentale
• Avant-après ou/et ici-ailleurs
t
i0 i1
i0
i1
•On compare i0 et i1 (calcul d’un RR), mais prise en compte :
• Des différences régionales• Des différences
temporelles
Enquête de cohorte
Constitution de deux échantillons dont on connaît le degré d'exposition...
Non exposé : non fumeur
Exposé : fumeur
1980 2010
Maladie
Maladie
MaladieMaladieMaladie
Maladie
Maladie
...qu'on va suivre dans le temps :
Enquête de cohorte
Il s'agit d'une enquête prospective On mesure les taux d'incidences de la maladie
étudié dans les deux groupes et on les compare (calcul d'un RR)
Exemple• Tabagisme et cancer du poumon : on suit des
classes de lycéens, de la seconde à leur décès.Mesure de l’exposition : questionnaire annuel sur leurs consommation de tabac.Malade : sujet qui aura développé une tumeur du poumon.
Malade Non-malade
Exposé 117 981Non exposé 12 1236
P(m+/e+) = 117 / 1098 = 10,7%P(m+/e-) = 12 / 1248 = 1,0%
RR = p(m+/e+) / p(m+/e-)RR = 10,7 / 1 RR = 10,7
Limites
• Suivi de 16 ans à… 60 ans de suivis !!!
– Long
– Coûteux
– Perdu de vue
La maladie doit être relativement fréquente
• Les fumeurs sont aussi de gros consommateurs de café ?
Enquête cas-témoins
Constitution de deux échantillons :
Qu'est ce qui les différencie ?
Mesure retrospective des expositions
Grossièrement, on compare le nombre d'exposé chez les malades à celui chez les non-malades (calcul d'un Odds Ratio (OR))
Malades Non-malades
Exemple
Consommation d'alcool pendant la grossesse et déficit neurologique du nouveau-né :
Cas : naissance avec déficit neurologiqueExposition : consommation d'alcool par la mère durant la
grossesse (évalué par questionnaire)Cas Témoins
Consomation d'alcool (même occasionel) 12 8
Mère sobre 38 92
On peut calculer un OR : OR = (12 x 92) / (8 x 38) = 3,6RR ≈ 3,6
p(exposé/cas) = 12/50 = 24%
p(exposé/témoins) = 8/100 = 8%
Limites
Les cas seront plus souvent inclus dans des maternité de niveau 3 : Dans quelle population faut il choisir les témoins ?
Une femme vient d'accoucher d'un enfant qui a des troubles neurologiques : Qualité des réponses aux questions ?
Les mères exposées ont aussi de moindres revenu ?
Comparaison cohorte/cas témoinsCohorte Cas/témoins
Type prospectif rétrospectif
Coût Élevé ++++ Faible
Rapidité des résultats -------------
Longs, peu reproductibles
+
Rapides
Reproductibles
Biais + -
Perdus de vue
++++++
Témoins comparables au cas : biais sélection
Mémorisation (rétrospectif)
mesure
Maladie multiples
fréquente
Unique
Maladie Rare
Indicateur RR Risque relatif (IC)
OR Odds Ratio (IC)
Enquête transversale
• Étude ponctuelle
• Permet de mesurer des prévalences
• Permet de mesurer des associations… à un instant t
Exemple
• Enquête de prévalence :
• Étude réalisée sur un ou quelques jours auprès de tous les patients des hôpitaux
• De nombreuses informations recueillies :
• Infection nosocomiale : 1,3% des patients
• Durée de séjour : plus longue pour les patients infectées que les autres
• Motif d’hospitalisation ?
Limites
• Les patients infectées sont hospitalisé plus longtemps que les non infecté et on donc plus de chance d’être là le jour de l’étude
• Les patients ventilées mécaniquement ont des durées de séjour plus élevées !
• Durée de séjour augmenté par l’infection ou infection car durée de séjour longue ?Aucun indice sur la causalité
Enquête écologique
Pas de suivis individuel Recueil de données au niveau d’ensemble
géographique (région, pays) et temporel Recherche d’une corrélation écologique
Exemple
Limites
• Données collectives :
– Impossible de prendre en compte des facteurs de confusions
– Relation au niveau individuelle pas nécessairement identique à la relation au niveau collectif
Les biais
Un biais est une erreur systématique (non liée au hasard) qui compromet la validité de l'enquête et empêche l'interprétation juste des résultats.
Il existe trois catégories de biais : biais de sélection biais de mesure biais d’analyse
Problème : extrapolation des résultats observés sur l’échantillon à la population ?
Biais de sélection
• Au niveau de la constitution des échantillons qui sont comparés
• Si l’échantillon n’est pas comparable à la population :
– Échantillon de malades plus exposé que population de malade
– …
Biais de sélection
• Sélection des cas :
– Sélection de cas hospitalier…
– Inclusion sur cas prévalent
• Sélection de la population de référence :
– Base de sondage de la population générale
• Perdu de vues
• Non répondants
ExemplePOP E+ E- totalM+ 100 000 75 000 175 000M- 350 000 475 000 825 000
total 450 000 550 000 1 000 000
Échantillon non biaisé
ECH E+ E- totalM+ 1 000 750 1 750M- 3 500 4 750 8 250
total 4 500 5 500 10 000
P = 10%RR = 1,63
P = 10%RR = 1,63
Exemple
Si les malades sont plus exposé dans l’échantillon
Si les non malades sont plus exposés
ECH E+ E- totalM+ 1 250 500 1 750M- 3 500 4 750 8 250
total 4 750 5 250 10 000
P = 12,5%RR = 2,76
ECH E+ E- totalM+ 1 000 750 1 750M- 4 000 4 250 8 250
total 5 000 5 000 10 000
P = 10%RR = 1,33
Biais de classement
• Au niveau de l’évaluation du statut exposé/non-exposé ou malade/non-malade :
– Biais de mémorisation
– Biais d’investigation
– Biais de déclaration
Erreur non-différentielle
– Erreurs sur l’exposition qui affectent de la même manière les malades et les non malades
– Erreurs sur la maladie qui affectent de la même manière les exposés et les non exposés.
ECH E+ E- total
M+ 1 000 500 1 500
M- 4 000 4 500 8 500
total 5 000 5 000 10 000
ECH E+ E- total
M+ 1 100 400 1 500
M- 4 900 3 600 8 500
total 6 000 4 000 10 000
OR = 2,25
OR = 2,02
Erreur de mesure de l’exposition : 20% de non exposés sont considérés exposés
Biaise le résultat vers 1 gênant, mais discutable
Erreur différentielle
– Si l’erreur de classement sur l’exposition varie selon le statut vis-à-vis de la maladie
– Si l’erreur de classement sur la maladie varie selon le statut vis-à-vis de l’exposition
ECH E+ E- total
M+ 1 000 500 1 500
M- 4 000 4 500 8 500
total 5 000 5 000 10 000
ECH E+ E- total
M+ 1 100 400 1 500
M- 4 000 4 500 8 500
total 5 100 5 000 10 000
OR = 2,25
OR = 3,09
Erreur de mesure de l’exposition chez les malades seulement : 20% de non exposés sont considérés exposés
(si même erreur pour les non maladeOR = 1,47)
Biaise le résultat dans un sens ou l’autre Difficile à discuter
Biais de confusion
Facteur de confusion• « Dans l'étude de la relation entre une caractéristique, possible
facteur de risque, et un problème de santé, toute caractéristique déjà connue pour être liée au problème de santé étudié. La présence de facteurs de confusion connus implique obligatoirement des conséquences dans l'étude, soit dans la constitution des groupes comparés (appariement), soit lors de l'analyse des données (ajustement). »
Associé à l’exposition&
Associé à la maladie
Exemple
Les hommes sont plus souvent exposés que les femmes (750 / 1050 > 375 / 1125)
Les femmes sont plus souvent malades que les hommes (175 / 1125 > 115 /1050)
Le sexe est un facteur de confusion entre l’exposition et la maladie
Hommes Femmes Total
E+ E- E+ E- E+ E-
M+ 100 15 100 75 200 90
M- 650 285 275 675 925 960
Total 750 300 375 750 1125 1050
RR1 = 2,67 RR2 = 2,67 RR = 2,07
Discussion
• Sens du biais : imprévisible
• Prise en compte du biais :
• Tirage au sort
• Restriction de la population étudiée
• Appariement
• Ajustement
Interprétation des résultats
• OR et RR
• =1 L’exposition étudiée n’est pas un facteur de risque
• <1 l’exposition étudiée est un facteur protecteur
• >1 l’exposition étudiée est un facteur de risque
• Coefficient de corrélation :
• =0 pas de corrélation entre exposition et maladie
• =1 corrélation maximum entre E et M, E facteur de risque
• =-1 corrélation maximum entre E et M, E facteur protecteur
Significativité
Rappel : erreur aléatoire !!!
Les valeurs observées dans deux échantillons différents sont par essence différentes…
…Sont elles statistiquement différente ?
Valeur de la différence
Réalisation de test statistique :
petit p ≈ probabilité que les deux échantillons soient issue de la même population
Choix d’une valeur seuil : 0,05
Intervalle de confiance
« Terme statistique désignant une "fourchette" de deux chiffres, permettant d'estimer la valeur d'une variable au niveau de la population que l'on souhaite étudier, à partir d'un échantillon extrait de cette population. La largeur de cette "fourchette" correspond à la précision de l'estimation. Le chiffre ponctuel dans la population ne peut être connu à partir d'un échantillon. »
En pratique :
Si l’IC contient la valeur neutre, il n’y a pas de différence significative entre les deux échantillons (ils sont issus de la même population)
Causalité
Marqueur de risque ≠ déterminant
Difficulté d’établir un lien causal :
Avoir des grand pied confère un QI plus élevé ?
La consommation d’alcool et de tabac est responsable des cancer des VADS ?
Question philosophique…
Critères de Hill
Critères de Hill
• Association statistique
• Forte
• Constante
• Relation dose-effet
• Temporalité
• Plausibilité biologique
Réaliser une étude épidémiologique
• Savoir ce que l’on sait
• Protocole d’étude
• Calcul d’un nombre de sujet à inclure
• Analyser et interpréter les données
Savoir ce que l’on sait
• Revue de la littérature
• Pubmed, google scholar, cochrane…
Facteurs de confusions
• Un pas en avant :
• Une hypothèse à tester ! Une question sur une maladie et une exposition !
Protocole
• Population étudiée
• Recueil de données :
• Mesure de la maladie• HTA
• Mesure de l’exposition• PM10
• Facteurs de confusion
Nombre de sujet nécessaire
• Gestion des coûts
• Hypothèses :
• Effet à mettre en évidence
• Choix du seuil (p = 0,05)
On peut calculer : La probabilité que l’on a de mettre en évidence la
différence prévu selonLe nombre de sujet que l’on va inclure dans l’étude
Données
• Les analyses doivent avoir été planifiées
• Validité des résultats :
• Analyse de sensibilité
• Interprétation des résultats
• En fonction de la revue de la littérature
• En fonction des données
• Conclure vis-à-vis de la question posée.
Merci
http://www.santepub-rouen.fr
> Nous > Nos travaux
Épidémiologie analytique [croix rouge S3]