IFCS 2008-2009 2
Plan
� Introduction
� Notion d'indicateur
� La variabilité
� Plans d'étude
� Épidémiologie descriptive, analytique et évaluation
� Éléments de méthodologie
� Etude de cas2
IFCS 2008-2009 3
De l’épidémiologie descriptive
� Définition(s)� OMS (1968)
"Étude de la distribution et des déterminants des maladies chez l'homme"� Idem Mac Mahon (1970)
� Rumeau-Rouquette (1993)
" Étude de la distribution des maladies et indicateurs de santé"
3
IFCS 2008-2009 4
� Recherche� Hypothèse à tester
� Vérification scientifique
� Généralisation
� Étiologie� Étude des causes et des facteurs de risque
� Choléra, Londres 1848
4
… vers …
IFCS 2008-2009 5
l’épidémiologie analytique
� Retour à la définition de l'épidémiologie descriptive� Au mieux = variation parallèle maladie-facteur
� Études écologiques
� Corrélation
� Étape suivante = causalité
� Épidémiologie analytique
5
IFCS 2008-2009 6
Epidémiologie évaluative
� Évaluer les actions de santé� Efficacité� Effets non prévus� Impact général� Couverture
� Les trois volets de l'évaluation (Donabedian)
Moyens
ProcéduresRésultats
6
IFCS 2008-2009 7
Bibliographie générale
� J. Bouyer, D. Hémon, S. Cordier et al. Épidémiologie : principes
et méthodes quantitative. Éditions INSERM, Paris, 1993.
� C. Rumeau-Rouquette, B. Blondel, M. Kaminski, G. Bréart.
Épidémiologie : méthodes et pratique. Médecine-Sciences,
Flammarion, Paris, 1993.
� NE. Breslow, NE. Day. Statistical methods in cancer research. IARC Scientific publication N°32 et N°82, Lyon, 1980 et 1987.
� M. Jenicek, R. Cléroux. Epidémiologie : principes, techniques,
applications. Edisem, Québec, 1987.
7
IFCS 2008-2009
Les indicateurs
IFCS 2008-2009 9
Indicateurs
� Normal � anormal (pathologique)
G. Canguilhem. Le normal et le pathologique. PUF, 2ième édition, Paris, 1996.
� Types d'indicateurs� Mortalité� Morbidité� Handicap
� Sources ponctuelles = enquêtes ad hoc
� Sondages
� Enquêtes épidémiologiques9
IFCS 2008-2009 10
Indicateurs
� Sources en routine� Statistiques de mortalité (INSERM)
� Déclarations obligatoires
� Hôpitaux (PMSI), médecins sentinelles, médecins du travail
� Registres
� Statistiques sociodémographiques (INSEE, INED)
� Moyens, consommations (Ministères, DREES)
� ETC
10
IFCS 2008-2009 11
Indicateurs
� Validité� Reproductibilité (temps, espace)
� Acceptabilité
� Fiabilité
� Utilité
� Sensibilité, spécificité, valeur prédictive positive
(cf. épidémiologie évaluative)
11
IFCS 2008-2009 12
Indicateurs de mortalité
� Nombre de cas
� Probabilité de décès
Nombre de décès sur la période
divisé par
Personnes présentes au début de la période
12
IFCS 2008-2009 13
Indicateurs de mortalité
� Mieux que "personnes présentes au début de la période" = personnes à risque et durée d'exposition� Personne-temps (person-year)
� Taux de mortalité
Nombre de décès sur la période
divisé par
Personnes-temps pendant la période13
IFCS 2008-2009 14
Indicateurs de morbidité
� Maladies ou symptômes
� Nombreux indicateurs
� Prévalence� Nombre de cas à un instant donné parmi une
population
� Coupe transversale
14
IFCS 2008-2009 15
Indicateurs de morbidité
� Incidence cumulée (cf. probabilité de décès)
Nombre de nouveaux cas sur la période
divisé par
Non malades au début de la période
� Incidence instantanée (cf. taux de mortalité)
Nombre de nouveaux cas sur la période
divisé par
Personnes-temps non malades pendant la période
15
IFCS 2008-2009 16
Espérance de vie
� Espérance de vie à la naissance = moyenne des âges au décès d'une génération fictive soumise aux conditions de mortalité de l’année
� Résumé annuel de mortalité pour des sujets nés une même année
16
IFCS 2008-2009 17
Indicateurs de handicaps
� � différentes situationsMaladie � déficience � incapacité � désavantage
(extériorisée) (objectivisée) (socialisée)
� Déficience = altération d'une fonction
� Incapacité = réduction de la capacité à accomplir une activité
� Désavantage = limitation d'un rôle normal
17
IFCS 2008-2009
La variabilité
IFCS 2008-2009
Un exemple
� Glycémie à jeun de plusieurs sujets4,2 4,8 4,8 6,44,2 5,8 6,3 4,53,8 5,7 4,9 5,24,9 4,8 3,5 5,04,2 5,5 6,7 4,7… … … ...
19
IFCS 2008-2009
Définition
� Le résultat d’une mesure diffère d’un mesurage à l’autre� D’un sujet à l’autre
� D’un temps à l’autre chez un même sujet
� La variabilité est un phénomène naturel et inévitable
� La variabilité n’est pas l'imprécision ni l'erreur de mesure
20
IFCS 2008-2009
Ce qu'il faut retenir (1)
� Les trois types d'épidémiologie
� La notion de personnes-années
� La définition de l'incidence et la prévalence
21
IFCS 2008-2009
Plan d'étude
IFCS 2008-2009 23
Plan de tout étude
� Grandes phases1. Problématique
2. Choix du type d'enquête et traitement des non-réponses
3. Définition de la population
4. Investigations
5. Analyse
� Rédiger un protocole précis
23
IFCS 2008-2009 24
(1) Problématique
� Études antérieures
� Définition des objectifs
� Moyens� Matériels
� Humains
� Juridiques et légaux (CNIL, Loi Huriet-Serusclat)
� De la formulation de la problématique dépend les étapes suivantes
24
IFCS 2008-2009 25
(1) Problématique
� Variable(s) résultat (à expliquer)
� Variable(s) explicative(s)
� Variables continues ou discrètes
� Types de variables� Qualitatives
� Non ordonnées
� Ordonnées
� Quantitatives
25
IFCS 2008-2009 26
(2) Type d'enquête
� Choix du type d'enquête� Échantillon = phénomène fréquent
� Exhaustif = phénomène rare
� Du choix dépend les étapes suivantes� Exemple : incidence du cancer � enquête
exhaustive dans un registre
� Traitement des "non-réponses"
26
IFCS 2008-2009 27
(3) Population d'étude
� Ensemble d'unités sur lesquelles on peut relever (mesurer) une caractéristique
� Peut être un groupe de personnes (famille, couple)
� Taille� Grande taille mais pas toujours
� En statistiques, supposée de taille infinie
� Exceptionnellement très petite : maladie génétique, intoxication
27
IFCS 2008-2009 28
(3) Population d'étude
� Les questions que l'on se pose s'adressent toujours à la population (même si théorique)
� On ne peut pas travailler sur l'ensemble de la population � Pour des raisons pratiques (populations
mouvantes, de taille variable)
� Pour des raisons éthiques (traitement toxique)
� Technique d'échantillonnage
28
IFCS 2008-2009 29
(3) Population d'étude
� Échantillon� Extrait de la population
� Apporte des informations sur la population
� Perte d'information
� Doit représenter au mieux la variabilité de la population� Sans en connaître toutes les caractéristiques
� Au mieux par tirage au sort
29
IFCS 2008-2009 30
(3) Population d'étude
� Population exhaustive� Disposer de la base exhaustive des unités
� Échantillon� Base exhaustive ou partielle
� Tirage au sort (théorie des sondages)
� Quotas
30
IFCS 2008-2009 31
(3) Population d'étude
� Type de population� Territorial
� Professionnel
� Clientèle� Hôpital
� Organisme de remboursement
31
IFCS 2008-2009 32
(3) Population d'étude
� Unités statistiques� Individu
� Ménage
� Évènement
� Actes médicaux
� …
32
IFCS 2008-2009 33
(3) Population d'étude
� Critères d'inclusion-exclusion� Larges et peu nombreux
� Résultats applicables à une large population
� Résultats pragmatiques
� Stricts et nombreux� Résultats applicables à un sous groupe seulement
� Résultats explicatifs
33
IFCS 2008-2009 34
(3) Échantillonnage
� Différents plans d'échantillonnage
� Sondage aléatoire simple� Unités tirées au sort dans la base de la population
� Nécessité d'une base exhaustive
� Plan de sondage de référence� Position des autres plans
� En terme de biais et dispersion
34
IFCS 2008-2009 35
(3) Échantillonnage
� Notion d'estimateur� Population = vraies valeurs
� Échantillon = estimation de ces vraies valeurs
� Estimation = imprécision
35
IFCS 2008-2009 36
(3) Échantillonnage� Deux écueils à corriger
� Biais = erreur systématique
� Le pire …
• Dispersion= erreur aléatoire
36
IFCS 2008-2009 37
(3) Échantillonnage
� Autres plans d'échantillonnage� Sondage stratifié
� Sous-groupes homogènes mais différents
� Sondage en grappe� Toutes les unités au sein de sous-groupes tirés au
sort
� Exemple� Tirage au sort d'immeubles� Interroger tous les habitants des immeubles retenus
� Plans complexes37
IFCS 2008-2009 38
(4) Investigations
38
IFCS 2008-2009 39
(5) Analyse : cf. dernier chapitre
39
0.0
0.1
0.2
0.3
0.4
IFCS 2008-2009
Épidémiologie descriptive
IFCS 2008-2009 41
Enquête transversale
� Objectif = mesurer la fréquence d'un phénomène ou la valeur d'un indicateur
� Unique = prévalence à l'instant t
� Répétée dans le temps� Évolution de prévalence
� (Évolution de l') incidence
� Avant-après
� Répétée dans l'espace� Comparaison de prévalence
� Ici-ailleurs
41
IFCS 2008-2009 42
Études écologiques
� Épidémiologie descriptive� Au mieux = variation parallèle maladie-facteur
� Études écologiques (corrélation)
� Peu coûteuses
� Vérification d'hypothèse(s) avant …
� Étape suivante = causalité = épidémiologie analytique
42
IFCS 2008-2009 43
Études écologiques
� Corrélation
� Prévisions
� MAIS PAS CAUSALITE
In S. Kono, M. Ikeda, M. Ogata.Salt and geographical mortality of gastric cancer and stroke in Japan.
J Epidemiol Community Health, 37:43-46, 1983
y = 21,655x - 73,989
R2 = 0,7205
200
250
300
350
400
12 14 16 18 20 22
sel/jour.personne (g)
Mor
talit
é A
VC
(p.100000
)
43
IFCS 2008-2009
Épidémiologie analytique
IFCS 2008-2009 45
Épidémiologie analytique
� Étude des causes� Basée sur l'observation
� Et non sur l'intervention (cf. épidémiologie évaluative)
� Mesure l'association entre "maladie" et "facteurs de risque " en tenant compte de ce qui pourrait brouiller cette association (facteurs de confusion)
45
IFCS 2008-2009 46
Jugement de causalité
� Causalité = faisceau d'arguments� Critères internes
� Séquence dans le temps� Facteur � Latence � Maladie
� Force de l'association maladie-facteur� Relation dose-effet
� Fréquence de la maladie augmente si la dose de facteur augmente (ou sa durée)
� Cohérence dans les sous-populations� Homme-femme par exemple
46
IFCS 2008-2009 47
Jugement de causalité
� Critères externes� Constances dans d'autres populations� Relation dose-effet entre études� Cohérence espace-temps
� Les variations de la maladie ou du facteur dans le temps ou dans l'espace entraîne des variations de l'autre
� Études expérimentales� Plausibilité biologique et physiopathologie� Connaissances générales
47
IFCS 2008-2009 48
Épidémiologie analytique
� Maladie� Malade vs Non malade
� Stades de maladie
� Facteurs� Exposé vs Non exposé
� Niveaux d'exposition (qualitatif ordonné)
� Exposition quantitative
48
IFCS 2008-2009 49
Types d'enquête
� Épidémiologie analytique basée sur l'observation de la maladie et des facteurs� Vers le futur = prospective
� Vers le passé = rétrospective
� Mixte
49
IFCS 2008-2009 50
Types d'enquête
� Cas-témoin� Malades et non malades ("comparables")� Reconstitution rétrospective de leur exposition
� Cohorte (prospective)� Non malades� Suivis pour mesurer exposition et maladie
� Cohorte rétrospective� Idem� Reconstitution rétrospective de leur exposition
50
IFCS 2008-2009 51
Je suis l'épidémiologiste
Passé Futur
Facteurs non
Facteurs oui
Non malades
Malades
Non maladesFacteurs non
Facteurs oui
Cohorte rétrospective
Facteurs non
Facteurs oui
Non malades
Malades
Non maladesCohorte
Non maladesMalades
Facteurs non
Facteurs oui
Cas-témoins
51
IFCS 2008-2009 52
Études cas-témoins
� Mesures association = odds-ratio uniquement
� Nombre plus faible de sujets
� Maladie rare
� Délai long entre exposition et maladie
� Absence de suivi
� Reconstitution des facteurs
� Population hospitalière� Choix des témoins
52
IFCS 2008-2009 53
Cohorte
� Mesures association = risque relatif ou odds-ratio
� Nombre élevé de sujets� Selon fréquence de la maladie
� Longueur du suivi� Moyens importants
� Perdus de vue
� Délai court entre exposition et maladie
� Milieux professionnels
� Pas les populations hospitalières
53
IFCS 2008-2009 54
Cas particulier : essai thérapeutique
� Confins entre essais biologiques, épidémiologie analytique et évaluation
� Déterminer l’utilité d’un produit pour traiter une pathologie� Médicament
� Procédure thérapeutique
� Procédure diagnostique
� Quatre types chronologiques
IFCS 2008-2009 55
Association maladie-facteur s
� Facteurs supposés explicatifs
� Facteurs de confusion� Facteur lié à la maladie et à l'exposition et qui brouille la
mesure de l'association maladie-exposition
� Lutte contre la confusion� Appariement (échantillon)
� Ajustements (analyse)� Chi² Mantel-Haenszel
� Modèles régressifs multivariés
� Modèle de Cox
C
MF
55
IFCS 2008-2009 56
Biais (le retour)
� Sélection (constitution de l'échantillon)� Non réponse, perdus de vue
� Non-comparabilité
� Autosélection dans les cas-témoins (survie sélective, décès précoces)
� Healthy worker effect des cohortes professionnelles
� Classement� Mesure d'exposition
� Mesure de la maladie
� Confusion
56
IFCS 2008-2009
Épidémiologie évaluative
IFCS 2008-2009 58
Définition
� Juger des effets (positifs et négatifs) d'une intervention en santé publique� Action destinée à améliorer l'état de santé d'un
groupe
� Prévention� Primaire : incidence de la maladie
� Exemple : évaluation d'une campagne de dépistage
� Secondaire : prévalence et évolution de la maladie
� Tertiaire : rechute, séquelles, dépendance
58
IFCS 2008-2009 59
Indicateurs
� Nombreux, différents selon les cas
� Mesurer� Amélioration des connaissances
� Modification du comportement
� Modification de l'état de santé
� Modification des attitudes thérapeutiques
59
IFCS 2008-2009 60
Qualité des indicateurs
� Sensibilité, spécificité
Malades Non maladesTest positifTest négatif
a bc d
ca
aésensibilit
+=
db
béspécificit
+=
Vrais positifs parmi les malades Vrais négatifs parmi les non malades
60
IFCS 2008-2009 61
Types d'enquête
� Recueil sur un groupe = avant-après� Mêmes sujets
� Groupe globalement
� Recueil sur un groupe avec intervention et un groupe sans = ici-ailleurs� Sans contrôle des sujets
� Essais randomisés la plus rigoureuse
61
IFCS 2008-2009 62
Ce qu'il faut retenir (2)
� Les grandes phases de tout plan d'étude
� Les notions de population et d'échantillon
� Caractériser� Étude cas-témoins
� Étude de cohorte
� Les définitions de sensibilité et spécificité
� La notion de biais
IFCS 2008-2009
Méthodes statistiques
Enfin!
IFCS 2008-2009 64
Plan de tout étude (rappel)
� Grandes phases1. Problématique
2. Choix du type d'enquête et traitement des non-réponses
3. Définition de la population
4. Investigations
5. Analyse
� Rédiger un protocole précis
64
IFCS 2008-2009 65
Types d'analyse
� Univariée� Graphes
� Tableaux
� Descriptif
� Tests d'hypothèses
� Multivariée
� Modélisation
65
IFCS 2008-2009 66
Analyses uni- vs multivariées
� Analyse univariée � Analyse d’un seul facteur sur le résultat
� Effet d’un traitement sur la survie
� Analyse multivariée� Analyse de plusieurs facteurs simultanément sur
le résultat
� Effet d’un traitement et de l’âge sur la survie
� "Multivariate" = plusieurs variables résultat
66
IFCS 2008-2009 67
Représentation graphique
� Selon le type de variables
� De nombreux types� Histogramme
� Nuage de point
� Boîte-à-moustaches = box-plot
� Courbes de survie (Kaplan-Meier)
� Autres (nombre +++)
67
IFCS 2008-2009 68
Histogramme
IFCS 2008-2009 69
Boîte à moustache
Médiane = p50
Q3 = p75
Q1 = p25
Donnée extrême
1,5 x (Q3 – Q1) = 1,5 x EIQ
IFCS 2008-2009 70
Autres
IFCS 2008-2009 71
Autres
IFCS 2008-2009 72
Autres
IFCS 2008-2009CECSMO 2008-2009 73
Autres
IFCS 2008-2009
Courbe de survie : Kaplan-Meier
74
100%
Décès
Censure
IFCS 2008-2009
Médiane 68 jours
Courbe de survie : Kaplan-Meier
75
IFCS 2008-2009
Survie à 100 jours 33%
Courbe de survie : Kaplan-Meier
76
IFCS 2008-2009 77
Analyse descriptive univariée
� Variable discrète� Tableau de fréquence
� Variable continue
77
IFCS 2008-2009 78
Analyse descriptive univariée
� Indicateur de position� Moyenne
� Indicateur de dispersion� Variance = somme des écarts carrés à la moyenne
pondérée par l'effectif� Écart-type = racine carrée de la variance
� Indicateur de distribution� Percentiles� Diviser la distribution en parts égales
� Médiane� Quartiles
78
IFCS 2008-2009 79
Analyse descriptive univariée
� Calcul d'estimateurs ponctuels et de leur variabilité � intervalle de confiance
σ+µσ−µ 22 ˆ96.1ˆ;ˆ96.1ˆ
∑=
=µn
1iix
n
1ˆ ( )∑
=µ−=σ
n
1i
2i
2 xn
1ˆ
Méthode dumaximum
devraisemblance
79
IFCS 2008-2009 80
Loi normale
� Loi de Laplace-Gauss ou loi normale� Principale loi de probabilité
� Quasi-généralité dans bien des domaines.
� Peut être observée empiriquement
� Aspect typique� Forme en cloche
� Symétrique
� Moyenne, médiane et mode sont confondus
80
IFCS 2008-2009 81
Loi normale
� Aire sous la courbe entre deux points
2,5%
2,5%
1,96
-1,96
ECH
IP
0.0
0.1
0.2
0.3
0.4
p(X
)
-3 -2 -1 0 1 2 3
X
Normal Densityµ = 0σ = 1
Moyenneet
écart-type
81
IFCS 2008-2009 82
Loi normale
� Loi de Gauss centrée-réduite� µ=0 et σ=1
� 95% des valeurs sont situées entre 0±1,96
� La relation se généralise� µ et σ quelconques
� 95% des valeurs sont situées entre µ±1,96.σ
82
IFCS 2008-2009 83
Tests d'hypothèses
� Formalisation� Comparer l'efficacité de deux traitements
� Hypothèse nulle H0 : µA=µB
� En raison des aléas du tirage au sort, même si les effets sont identiques, les différences observées mA-mB varient autour de 0
� Sous H0, on peut calculer la Pr(mA-mB>limite)
83
IFCS 2008-2009 84
Tests d'hypothèses
� Formalisation• S'il n'y a pas de différence entre les deux
moyennes, l'événement mA-mB>1,96.σ est rare : Pr<0,05
• Ici σ est un estimateur de la variabilité de la différence
• S'il a été observé c'est que H0 est fausse et on retient son complémentaire H1 : µA≠µB
• Test d'hypothèse nulle
84
IFCS 2008-2009 85
Tests d'hypothèses
� Si H0 est vraie, on la rejette (test significatif) avec un risque α
� Si H1 est vraie, on rejette H0 avec un risque 1-β : la puissance
� Classiquement� α=5%
� 1-β=80 ou 90%
85
IFCS 2008-2009 86
Association maladie-facteur
� Deux mesures très utilisées� Risque relatif = fréquence de la maladie chez les
exposés par rapport à la fréquence chez les non exposés (modèle multiplicatif)
Malades Non maladesFacteur ouiFacteur non
a bc d
dc
cba
a
RR .estim
+
+=Estimation donc erreur
86
IFCS 2008-2009 87
Association maladie-facteur
� Deux mesures très utilisées� Odds ratio = rapport des cotes (turf)
� "cote" de la maladie chez exposés = rapport entre fréquence de la maladie chez exposés et 1-fréquence
� "cote" chez les non exposés
Malades Non maladesFacteur ouiFacteur non
a bc d
bc
adOR .estim =
Estimation donc erreur
87
IFCS 2008-2009 88
Modélisation
•Buts de l'analyse statistique• Descriptif
• Explicatif
• Prédictif
•Besoin d'outils mathématiques• Traduction de la réalité
• Choix
• Perte d'information
88
IFCS 2008-2009 89
Modélisation
• Forme générale : g(Y) = f(X) + Σ• Y = variable(s) à expliquer
• X = variable(s) explicative
• g et f = éventuelles fonctions de transformation
• Σ = matrice de variance-covariance
• Un cas des plus simples• Y = aX + b + ε• ε ~ N(0,σ²)
– Importance des tests d'adéquation89
IFCS 2008-2009
Ce qu'il faut retenir (3)
� Analyses univariées vs multivariées
� Bases descriptives
� Notion de test d'hypothèse
� Mesures d'association exposition-maladie
90
IFCS 2008-2009 91
Mon cher Watson, essayer de faire votre propre analyse. Vous connaissez mes méthodes, appliquez les !
S. Holmes, Le signe des 4.
IFCS 2008-2009
Etude de cas
IFCS 2008-2009
Etude de cas
Lefèvre H, Jougla E, Pavillon G et Le Toullec A.
Disparités de mortalités "prématurée" selon le sexe et causes de décès "évitables".
Rev Epidemiol Sante Publique 52:317-28, 2004.
93