Professeur Pascale FRIANT-MICHEL > Faculté de Pharmacie [email protected] ASSOCIATION entre ASSOCIATION entre caractères qualitatifs caractères qualitatifs
Dec 31, 2015
Professeur Pascale FRIANT-MICHEL> Faculté de Pharmacie
ASSOCIATION entreASSOCIATION entre caractères qualitatifs caractères qualitatifs
I - INTRODUCTION (1)I - INTRODUCTION (1)
ASSOCIATION entreASSOCIATION entreCARACTERES QUALITATIFSCARACTERES QUALITATIFS
Y a-t-il association entre ces caractères ou sont-ils indépendants ?
• Etude de deux caractères qualitatifs appartenant à une même population
Remarque :
lorsqu’on conclut à une indépendance des caractères, en raison même des fluctuations d’échantillonnage, les caractères peuvent se trouver associés dans une certaine proportion de cas
• Problème :
dans quelle mesure la proportion d’association observée est-elle significative ?
I - INTRODUCTION (2)I - INTRODUCTION (2)
• Réponse :
méthode applicable au cas où les caractères (l’un ou l’autre ou les deux) existent sous plusieurs modalités
Exemple :caractère 1 : couleur des yeux
. bleu
. gris
. marron
. . . .
caractère 2 : couleur des cheveux. blond. châtains. brun. . . .
. 2 d’indépendance
. Test du 2
II - TEST de x2 (1)
1. Définition
Comparer deux distributions :
. les fréquences expérimentales observées
. les fréquences théoriques
Tester l’indépendance de deux caractères
2. Principe du test
a) disposer les fréquences expérimentales dans un tableau à double entrée, dit tableau de contingence
différentes colonnes :
diverses modalités de l’un des caractères
II - TEST de II - TEST de 22 (1) (1)
II - TEST de x2 (2)
différentes lignes :
diverses modalités de l’autre caractère
totaux des lignes et des colonnes :
nombre d’individus présentant tel aspect de l’un des caractères, indépendamment de l’état de l’autre
Soient k le nombre de modalités du 1er caractère et l . . . . . . 2ème . . .
Un tableau de contingence permet de présenter de façon simple et claire les résultats concernant la répartition de deux caractères
Cas particulier :
tableau de contingence 2 x 2
II – TEST de II – TEST de 22 (2) (2)
II -TEST de II -TEST de 2 2 (3)(3) II - TEST de x2 (3)
Car. 1
Car. 21 2 . . . k Totaux
12.....
l
O11
O12
.
.
.
.
.
O1l
O21
O22
.
.
.
.
.
O2l
. . .
. . ......
. . .
Ok1
Ok2
.
.
.
.
.
Okl
n1
n2
.
.
.
.
.
nl
Totaux n’1 n’2 . . . n’k N
II - TEST de II - TEST de 2 2 (4)(4)II - TEST de x2 (4)
b) . calculer les fréquences théoriques correspondant àl’indépendance rigoureuse des deux caractères
Exemple :
probabilité d’avoir un individu possédant
le caractère 1 selon la 2ème modalité (12) et
le caractère 2 selon la 1ère modalité (21)
n 2 . n1
N
n1
N
Pth = p12 . p21
Or p12 = et p21 =
=> Pth =
n 2 . n1
N2
n 2N
Or l’effectif théorique : T21 = N . Pth
donc T21 =
II - TEST de II - TEST de 2 2 (5)(5)
II - TEST de x2 (5)
. calculer :
. k - 1 effectifs théoriques par ligne car
= n et
. l - 1 . . . . . . colonne car
= n’
c) définir le nombre de degrés de liberté (nombre de termes indépendants)
. par ligne pour k colonnes, nous avons k - 1 degrés de liberté
. par colonne pour l lignes, nous avons l - 1 degrés de liberté
donc : = (k - 1) . (l - 1)
d) calculer l’écart entre l’effectif observé et l’effectif théorique puis le 2
Trr1
k
Tpp1
l
III - FORMULES dIII - FORMULES duu 22 III - FORMULES du x2
lorsque 30 ≤ N < 50 et que n < 5,
on utilise la formule de 2 avec correction de continuité due à YATES :
2 =
lorsque N ≥ 30 et n ≥ 5, la formule :
2 =
de K. PEARSON reste légitime
EXCLUSIVEMENT, lorsque tableau de contingence 2 x 2 ( = 1)
On augmente ainsi la sécurité du test en pratiquant la correctionde YATES
Oi Ti 2
Tii
Oi Ti 0,5 2
Tii
IV - EXEMPLE (1)IV - EXEMPLE (1)Le tableau suivant répertorie le nombre d’accidents en une année par classe d’âge des conducteurs dans un échantillon de 500 conducteurs de 18 à 50 ans.
Vérifier, au niveau de signification de 0,01, l’hypothèse selon laquelle le nombre d’accidents est indépendant de l’âge du conducteur.
Age du conducteurTotaux
18 - 25 26 - 40 41 - 50
Nombre
d’accidents
0 75 120 105 300
1 50 60 40 150
2 25 20 5 50
Totaux 150 200 150 500
IV - EXEMPLE (2)IV - EXEMPLE (2)
Age du conducteurTotaux
18 - 25 26 - 40 41 - 50
Nombre
d’accidents
0 75 120 105 300
1 50 60 40 150
2 25 20 5 50
Totaux 150 200 150 500
90 120 90
45 60 45
15 20 15
Ho : Pas de relation entre l’âge des conducteurs et le nombre d’accidents
Calcul des fréquences théoriques
Utilisation de la formule du 2 sans correction de YATES
IV - EXEMPLE (3)IV - EXEMPLE (3)
2 = + +
75 90 2
90
= + 0 + + + 0
+ + +
120 120 2
120
105 90 2
90
50 45 2
45
60 60 2
60
40 45 2
45
+ + +
25 15 2
15
20 20 2
20
5 15 2
15
15 2
90
15 2
90
5 2
45
+ + + 0 +
= 2,50 + 2,50 + 0,56 + 0,56 + 6,67 + 6,67
= 19,46
5 2
45
10 2
15
10 2
15
IV - EXEMPLE (4)IV - EXEMPLE (4)
2 > 2 => l’hypothèse nulle est rejetée à 1 % de risque
Conclusion :
Il y a une relation entre le nombre d’accidents et l’âge du conducteur
= (3 - 1) . (3 - 1) = 2 . 2 = 4
= 1 % => 2 = 13,28
L1 SANTE