Statistiques Séance 10 N. Yamaguchi. Résumé de la séance précédente Les ANOVA –À 1 facteur à n niveaux –À 1 facteur à mesures répétées –À 2 facteurs.
Post on 04-Apr-2015
108 Views
Preview:
Transcript
StatistiquesStatistiques
Séance 10Séance 10
N. YamaguchiN. Yamaguchi
Résumé de la séance Résumé de la séance précédenteprécédente
Les ANOVALes ANOVA– À 1 facteur à n niveauxÀ 1 facteur à n niveaux– À 1 facteur à mesures répétéesÀ 1 facteur à mesures répétées– À 2 facteurs (+ notion d’interaction)À 2 facteurs (+ notion d’interaction)
Les corrélationsLes corrélations– Test paramétrique: PearsonTest paramétrique: Pearson– Test non paramétrique: SpearmanTest non paramétrique: Spearman
Rappel : corrélation de Rappel : corrélation de SpearmanSpearman
Prend en compte les Prend en compte les rangsrangs Exercice sur SpearmanExercice sur Spearman
ExerciceExercice
Sujet Note de maths Note de français
1 15 18
2 5 10
3 15 10
4 5 11
5 12 16
6 8 12
7 10 14
Le Khi (Chi) 2Le Khi (Chi) 2
Ou Ou χχ22
Pourquoi faire?Pourquoi faire?
Comparer des Comparer des distributionsdistributions ou des ou des formes de distributionsformes de distributions
Etude des Etude des fréquencesfréquences ou des ou des effectifseffectifs impliquant des variables impliquant des variables nominalesnominales. Pas de variables . Pas de variables continues!continues!
Exemple du début : la BU.Exemple du début : la BU.
Comparaison d’une distr observée Comparaison d’une distr observée et d’une distr théoriqueet d’une distr théorique
Une seule variable nominaleUne seule variable nominale On analyse une seule distribution.On analyse une seule distribution. Question : est-elle homogène (= Question : est-elle homogène (=
semblable à la distribution théorique)semblable à la distribution théorique) H0: oui. Répartition homogène des H0: oui. Répartition homogène des
effectifs.effectifs.
Exemple (1) cf I. LehisteExemple (1) cf I. Lehiste
Perception du contexte d’une phrase par Perception du contexte d’une phrase par 30 auditeurs.30 auditeurs.
Tableau pour la phrase lue isolémentTableau pour la phrase lue isolément Comparaison avec la distrib théorique: Comparaison avec la distrib théorique:
répartition homogène des effectifs.répartition homogène des effectifs. Note: variable nominale à 4 modalités (les Note: variable nominale à 4 modalités (les
rentrer comme une variable continue ds rentrer comme une variable continue ds Statview)Statview)
H0?H0?
ProcédureProcédure
Données: comme une variable Données: comme une variable continuecontinue– Pas d’étiquettes!Pas d’étiquettes!– Pas besoin de rentrer la distribution Pas besoin de rentrer la distribution
théoriquethéorique Analyse:Analyse:
– Analyse univariée > Khi 2 (désselectionner Analyse univariée > Khi 2 (désselectionner test-t) > rentrer la distrib théorique!!!test-t) > rentrer la distrib théorique!!!
– Menu Analyse > test-t > Editer analyse > Menu Analyse > test-t > Editer analyse > Khi 2Khi 2
RésultatsRésultats
Valeur du Khi 2 à comparer avec p.Valeur du Khi 2 à comparer avec p. Hypothèse nulle non rejetéeHypothèse nulle non rejetée Conclusion?Conclusion? Mais…Mais…
Exemple (2ème partie)Exemple (2ème partie)
Même phrase lue à l’initiale. Même phrase lue à l’initiale. Distribution aléatoire?Distribution aléatoire?
Données: on rajoute une colonneDonnées: on rajoute une colonne Procédure : même chose. On peut Procédure : même chose. On peut
assigner une autre variable!assigner une autre variable! RésultatsRésultats ConclusionConclusion
Un autre cas du Chi 2Un autre cas du Chi 2
Comparaison de 2 distributions Comparaison de 2 distributions indépendantesindépendantes
Voir si les 2 distributions sont Voir si les 2 distributions sont homogènes. (répartition de homogènes. (répartition de fréquences)fréquences)
Hypothèse nulle: il n’y a pas de Hypothèse nulle: il n’y a pas de relation entre les fréquences des relation entre les fréquences des lignes et les fréquences des colonneslignes et les fréquences des colonnes
ExempleExemple
Étude sur l’efficacité d’une méthode Étude sur l’efficacité d’une méthode d’enseignement des langues: labo vs d’enseignement des langues: labo vs méthode traditionnelleméthode traditionnelle
Tableau de contingence
Calcul du Chi 2Calcul du Chi 2
Tableau de contingence: la Tableau de contingence: la colonnecolonne ds laquelle un sujet se trouve (= ds laquelle un sujet se trouve (= réussite vs échec) est contingente (= réussite vs échec) est contingente (= dépend de) la dépend de) la ligneligne ds laquelle le ds laquelle le sujet se trouve (= exp vs méthode sujet se trouve (= exp vs méthode trad)trad)
H0: il n’y a pas de relation entre ligne H0: il n’y a pas de relation entre ligne et colonneet colonne
Calcul du Chi 2 (suite)Calcul du Chi 2 (suite)
Calcul de la fréquence attendue si H0 Calcul de la fréquence attendue si H0 est vraie, pour chaque cellule du est vraie, pour chaque cellule du tableau:tableau:
Calcul du Chi 2 (suite)Calcul du Chi 2 (suite)
Résultat global par rapport à toutes Résultat global par rapport à toutes les cellules.les cellules.
Procédure:Procédure:– DonnéesDonnées– Tableau de contigence > tableau Tableau de contigence > tableau
résumé et Chi 2 des cellulesrésumé et Chi 2 des cellules
RésultatsRésultats
Tableau résuméTableau résumé– DDL : (C-1)(R-1)DDL : (C-1)(R-1)– Valeur Chi 2 et pValeur Chi 2 et p– Résultats? H0?Résultats? H0?
Chi 2 des cellulesChi 2 des cellules– Décomposition du Chi 2 global selon les Décomposition du Chi 2 global selon les
cellules (contribution des cellules)cellules (contribution des cellules)
ExerciceExercice
Étude de Butler sur la poésie de Sylvia Étude de Butler sur la poésie de Sylvia Plath: distribution des longueurs de mots Plath: distribution des longueurs de mots dans 2 de ses recueilsdans 2 de ses recueils
Lgr motsLgr mots 1 – 31 – 3 4 – 64 – 6 7 – 97 – 9 10 -10 -1212
>12>12
« The « The Colossus Colossus »»
34733473 37433743 12721272 285285 5454
« Winter « Winter trees »trees »
30003000 26742674 753753 165165 1818
ExerciceExercice
Quelle est H0?Quelle est H0? Quels sont les résultats?Quels sont les résultats?
Rappel! Quel test utiliser?Rappel! Quel test utiliser?
Il faut connaître:Il faut connaître:– Le type de distribution: test Le type de distribution: test
paramétrique ou non paramétrique?paramétrique ou non paramétrique?– Le nombre de variables et le nombre de Le nombre de variables et le nombre de
leurs modalitésleurs modalités– Le type de données: fréquences, Le type de données: fréquences,
mesures?mesures?– Ce qu’on veut étudier!Ce qu’on veut étudier!
1. Tester les différences entre 1. Tester les différences entre groupesgroupes
Groupes indépendants : ce ne sont pas Groupes indépendants : ce ne sont pas les mêmes sujets!les mêmes sujets!
ParamétriqueParamétrique– 1 variable nominale à 2 modalités; 1 variable nominale à 2 modalités;
mesures : test-t indépendantmesures : test-t indépendant– (test-t univarié: moyenne théorique)(test-t univarié: moyenne théorique)– 1 variable nominale à 3 ou + modalités, 1 variable nominale à 3 ou + modalités,
mesures: ANOVA à 1 facteur à n mesures: ANOVA à 1 facteur à n niveauxniveaux
1. Tester les différences entre 1. Tester les différences entre groupesgroupes
Paramétriques (suite):Paramétriques (suite):– 2 variables nominales: ANOVA à 2 2 variables nominales: ANOVA à 2
facteursfacteurs Non paramétriques:Non paramétriques:
– 1 variable nominale à 2 modalités; 1 variable nominale à 2 modalités; mesures: test U de Mann-Whitneymesures: test U de Mann-Whitney
– 1 variable nominale à 3 ou + modalités, 1 variable nominale à 3 ou + modalités, mesures: test des rangs de Kruskal-mesures: test des rangs de Kruskal-WallisWallis
2. Tester les différences entre 2. Tester les différences entre variablesvariables
Mêmes sujets, mais conditions Mêmes sujets, mais conditions différentesdifférentes
Paramétriques:Paramétriques:– 1 variable continue (mesures), 1 variable 1 variable continue (mesures), 1 variable
indépendante (à 2 modalités = 2 indépendante (à 2 modalités = 2 conditions): test-t appariéconditions): test-t apparié
– 1 variable continue (mesures), 1 variable 1 variable continue (mesures), 1 variable indépendante (à 3 ou + modalités = 3 ou indépendante (à 3 ou + modalités = 3 ou + conditions): ANOVA à mesures répétées+ conditions): ANOVA à mesures répétées
2. Tester les différences entre 2. Tester les différences entre variablesvariables
Non paramétriques:Non paramétriques:– Mesures, 1 variable indépendante (à 2 Mesures, 1 variable indépendante (à 2
modalités = 2 conditions): test des modalités = 2 conditions): test des rangs de Wilcoxonrangs de Wilcoxon
– Fréquences / effectifs, 1 variable Fréquences / effectifs, 1 variable indépendante aux modalités indépendante aux modalités dichotomiques: Chi 2dichotomiques: Chi 2
2. Tester les différences entre 2. Tester les différences entre variablesvariables
Non paramétriques (suite)Non paramétriques (suite)– 1 variable continue (mesures), 1 1 variable continue (mesures), 1
variable indépendante (à 3 ou + variable indépendante (à 3 ou + modalités = 3 ou + conditions): test de modalités = 3 ou + conditions): test de FriedmanFriedman
3. Tester les relations entre 3. Tester les relations entre variablesvariables
Paramétriques: corrélation de Paramétriques: corrélation de PearsonPearson
Non paramétriques: corrélation des Non paramétriques: corrélation des rangs de Spearman ou Chi 2 rangs de Spearman ou Chi 2 (fréquences / effectifs et variable à (fréquences / effectifs et variable à modalités catégorielles)modalités catégorielles)
top related