Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

1

Constats - terminologie - concepts de base Tests concernant une moyenne

- variance connue / variance inconnue- courbe caractéristique - n = ?

Tests concernant 2 moyennes- variances connues / courbes caractéristiques / n = ?- variances inconnues : égales / inégales- échantillons appariés (= dépendants)

Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes ou plus 12.1 HMGB

Utilisation de STATISTICA

Autres tests- Test de Shapiro-Wilk: distribution normale - Test d’ajustement à une distribution: test du Khi-deux

Tests d’hypothèses (ch. 11 HMGB)

Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

2Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Problèmes statistiques description / visualisation : données Y (ch8)

estimation : paramètres distribution (ch9/10)

tests statistiques : prise de décision avec Y (ch11/12)

modélisation Y = f(X) f = fonction de transfert f =? (ch13)

processussystème Y variable de réponsevariables X

Variable Y - plusieurs cas

- mesure : variable continue : distribution normale N(μ, σ2) … autre

- classement 0 ou 1 : variable qualitative : distribution Bernoulli Ber(θ)

- comptage 0,1,2,.. : variable entière : distribution Poisson Poi (λ)

Variables X - catégoriques / continues / une ou plusieurs

3

constats - terminologie – concepts de base

prendre des décisions à l’aide de données échantillonnalesprovenant d’observations passives ou de données expérimentales:- 2 appareils de mesure ont-ils la même justesse / précision?- traitement anti corrosion réduit – il la rouille de 50% après 4 ans?- un type de boulon peut-il être soumis à 100 000 cycles de

tension-compression sans se rompre par fatique? prendre une décision conjecture issue incertaine

formulation d’une hypothèse d’ordre statistique hypothèse statistique : affirmation concernant une population (distribution)

- elle est vraie jusqu’à preuve du contraire- on dispose d’un seul échantillon de taille n pour décider- RISQUES (probabilités ) de mauvaises décisions:

► rejeter une hypothèse vraie (erreur de type I , première espèce)► ne pas rejeter une hypothèse fausse (erreur de type II , deuxième espèce)

ne pas rejeter (réfuter) une hypothèse veut dire : les données del’échantillon n’indiquent pas clairement que l’on doive la rejeterc-s-d : statut quo est maintenu jusqu’à preuve du contraire

rejeter une hypothèse: les données témoigne fortement contre

Bernard CLÉMENT, PhDMTH2302 Probabilités et méthodes statistiques

4

Hypothèse nulle H0: hypothèse à tester (mettre à l’épreuve)

Contre hypothèse H1 : seule affirmation sensée lorsque que H0 est fausse

H0 est toujours formulée en termes d’une valeur exacte du paramètre statistique à tester - exemple : H0 : μ = 100

H1 prévoit toujours un ensemble de valeurs : ex. H 1 : μ < 100 test statistique : est définie par une région critique (région de rejet)

d’une statistique W = f(Y1, Y2,…, Yn) qui conduit au rejet de H0

erreur de type I : rejeter l’hypothèse nulle H0 alors qu’elle est vraie

erreur de type II : ne pas rejeter H0 alors qu’elle fausse

seuil (niveau) de signification: la probabilité de commettre erreur type 1

Région critique : W > cRégion de non rejet de H0 c

Bernard CLÉMENT, PhD

terminologie – concepts de base

W

MTH2302 Probabilités et méthodes statistiques

5

H0

VRAIE FAUSSE

REJETER H0 erreur type I pas d’erreur

NE PAS REJETER H0 pas d’erreur erreur type II

Risque de type I = P (erreur type I ) = α

Risque de type II = P (erreur type II ) = β

LA DÉCISION EST BASÉE SUR DES OBSERVATIONS Yi LE STATUT (VRAIE OU FAUSSE) DE H0 N’ EST JAMAIS CONNU

β EST UNE FONCTION COURBE D’ EFFICACITÉ

STATUTDÉCISION


constats - terminologie – concepts de base


remarque ne jamais utiliser l’expression « accepter H0 »

mais toujours « ne pas rejeter H0 »

6

LES DÉCISIONS STATISTIQUES

La statistique n’est pas une discipline qui permet de décider de la vérité ou de la fausseté des questions qu’elle examine :c’est une science du comportement rationnel qui fournit des règlesde conduite pratiques dans des situations d’incertitude.il y a 2 cas possibles:

cas 1 si une hypothèse particulière (dite nulle) n’est pas rejetée :sur la base de données disponibles vous pouvez la tenir vraiejusqu’à preuve du contraire.

cas 2 si une hypothèse particulière (dite nulle) est rejetée : sur la base de données disponibles vous ne pouvez pas latenir pour vraie.

Dans les deux cas, vous aurez raison en moyenne, 19 fois sur 20, (95%), ou n’importe quel niveau de confiance ou niveau derisque (= 1- niveau de confiance) que l’on se fixe d’avance.

En moyenne, vos conclusions seront donc bonnes, mais on nepourra jamais savoir avec certitude si une décision particulièreest bonne ou non.


7

LISTE de TESTS STATISTIQUES


Cas A : moyenne μ = μ0 - variance σ2 connue

Cas B : moyenne μ = μ0 - variance σ2 inconnue

Cas C : égalité de 2 moyennes μ1 = μ2

cas C1 : variances connues cas C2 : variances inconnues égalescas C3 : variances inconnues inégalescas C4 : échantillons appariés

Cas D : variance σ2 = σ02

Cas E : égalité de 2 variances σ12 = σ2

2

Cas G : égalité k (k ≥ 3) moyennes μ1 = μ2 = … = μk chap. 12.1 HMGB

Cas F : proportion θ = θ0

autre cas : ajustement à des distributions

8

Cas A : test moyenne μ - population gaussienne - variance σ2 connue Y ~ N (μ, σ2 )

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

si H0 est vraie μ = μ0

Z = ( Y – μ0 ) / (σ / √ n ) ~ N ( 0, 1)

μ0

H0 : μ = μ0 vs H1 : μ > μ0

N ( μ, σ2 ) Y1, Y2, …, Yn : échantillon de Y

Y = ∑ Yi / n : moyenne échantillonnale

Y

Y

Z

0

c

σ

Région critique :rejeter H 0 si Y > c c = ?

P ( rejeter H0 quand elle est vraie ) = α P ( Y > c ) = P ( Y - μ0 > c - μ0 )

( Y – μ0 ) ( c - μ0 ) σ/√ n σ/√ n

= P ( Z > z0 ) = α

z0 = ( c - μ0 ) / σ/√ n = z 1-α

c = μ0 + z1-α ( σ /√ n )

σ/√ n

σz =1

z1 – α

aussi noté z α

α

= P >


9

Exemple 1 : un acier d’un alliage spécial a une tension de rupture Y (psi) dont la moyenne est de 25800 avec un écart type de 300. Un changement dans la composition de l’alliage devrait augmenter la tension moyenne sans changer l’écart type. Si le nouvel alliage ne produit aucun changement on voudrait pouvoir le dire avec une probabilité de 0.99. Par contre, si la tension moyenne est augmentéede 250, on veut que le risque de ne pas le détecter soit 0.10Questions(a) Définir l’hypothèse nulle , la contre hypothèse, le seuil du test, le risque de type II.(b) Poser les équations définissant les risques de type I et de type II; résoudre afin de trouver la taille de

l’échantillon à prélever et déterminer la région critique du test.(c) Un échantillon de 19 observations a donné une moyenne de 25970. Le nouvel alliage est-il supérieur ?

Solution (a)-(b)

Yμ0 = 25800

H0

μ1 = 25800 + 250 = 26050

H1 : μ > μ0 ( unilatérale )

c

Région critique

Y > c

σ/√n

α

P( erreur type I ) = P ( Y > c ) = α = 0.01P( erreur type II ) = P ( Y < c ) = β = 0.10

β

σ= 300




10

Solution (a)-(b)

Yμ0 = 25800

H0

μ1 = 25800 + 250 = 26050

H1

c

Région critique

X > c

σ/√n

α

P( erreur type I ) = P ( Y > c ) = α = 0.01P( erreur type II ) = P ( Y < c ) = β = 0.10

β

Solution (a)-(b) P ( Y > c | si μ = 25800) = α = 0.01 (1)P ( Y < c | si μ = 26050) = β = 0.10 (2)2 équations avec 2 inconnus : n et c

n = ( z0.99 + z0.90 )2 σ2 / (26050 – 25800)2 = (2.33 + 1.28)2 (300 / 250 )2 = 18.8 ≈ 19

c = 25800 + 2.33 * 300 / (19)0.5 = 25960.36

( c ) puisque Y = 25970 > c = 25960.36 on rejette H0

σ= 300



H0

y = 25970

11

Courbe d’efficacité (caractéristique) du test

Définition: probabilité de ne pas rejeter H0 en fonction de la moyenne μ de la

populationβ ( μ ) = P ( Y < c = μ0 + z 1-α ( σ /√ n ) | μ )

= P [ ( Y - μ ) / σ /√ n < z 1-α + (μ0 - μ) / σ /√n ]

β ( μ ) = Φ (z 1-α + δ √ n ) ( * ) dépend de α, n, δoù δ = (μ0 - μ) / σ : paramètre de non centralité (écart par rapport à H0)

graphiques : page 12 avec α = 0.05, 0.01 / n = 1,2,3, … / -1 ≤ δ ≤ 3

Calcul de n : on veut que β (μ1) = β pour une valeur particulière μ1 de μ

n = ( z 1-α + z 1- β )2 σ2 / (μ1 – μ0)2

Exemple : page 9 avec α = 0.01 β = 0.10 σ = 300 μ0 = 25800 μ1 = 26050

Exemple : calcul de la fonction d’efficacité μ = 25800 26000 26050 26100

μ 25800 26000 26050 26100

β 0.99 0.28 0.10 0.02

avec la formule ( * ) ci haut




12

courbe d’efficacité (caractéristique) du test Z: unilatéral



ProbdenepasrejeterHo


13

type de la CONTRE HYPOTHÈSE : unilatérale ou bilatérale

Exemple 1 : contre hypothèse H1 : μ > μ0 unilatéral droite (cas 1)

autres cas H1 : μ < μ0 unilatéral gauche (cas 2)

H1 : μ ≠ μ0 bilatéral (cas 3)

Formules

Cas 2 rejeter H0 si y < c = μ0 - z1-α ( σ /√ n ) note : - z1-α = zαn = ( z1-α + z1- β )2 σ2 / (μ1 – μ0) 2

β(μ) = Φ (z1-α - δ √ n ) δ = (μ0 - μ) / σ

Cas 3 rejeter H0 si y < c1 = μ0 - z1-α/2 ( σ /√ n ) ou si y > c2 = μ0 + z1-α/2 ( σ /√ n )

région critique bilatérale

équivalent à : rejeter H0 si │ y - μ0 │ / σ /√ n > z1-α/2

n = ( z1-α/2 + z 1- β )2 σ2 / (μ1 – μ0) 2

β(μ) = Φ (z 1-α/2 - δ √ n ) + Φ (z 1-α/2 - δ √ n ) - 1



14

courbe d’efficacité (caractéristique) du test Z : bilatéral





15

Cas B : test moyenne μ - population N ( μ, σ2) variance σ2 inconnue

Si σ2 est inconnue : on en fait l’estimation avec la variance échantillonnale s2

S2 = ∑ ( Y i – Y )2 / ( n - 1 ) et on utilise la statistique T de Student en place de Z

Les 2 cas sont résumés dans le tableau.

0: µµ =NH

2σ0

0yZ

nµ

σ−

=

0: µµ ≠AH

0: µµ <AH0: µµ >AH

210 α−> zZ

α−−< 10 zZ

α−> 10 zZ

0: µµ =NH

2σ0

0yTs n

µ−=

0: µµ ≠AH

0: µµ <AH

0: µµ >AH

21,10 α−−> ntT

α−−−< 1,10 ntT

α−−> 1,10 ntT

Remarque : le test est employé pour le cas de différences appariées

(2 échantillons dépendants) avec 1 2i i iy y y= −

Hypothèse nulleHN (H0)

Statistiquepour le test

Contre hypothèse(alternative) HA (H1)

Critère de rejet

connue

inconnue


Cas

A

Cas

B

16

courbe d’efficacité (caractéristique) du test T : unilatéral





17

courbe d’efficacité (caractéristique) du test T : bilatéral



18

Exemple 2 : étiquette sur un contenant 4 litres de peinture ‘’couvre

325 pi. ca’’ en moyenne dans des conditions normales d’utilisation.

Vous testez 6 contenants - données : 305, 285, 310, 300, 280, 290

( a ) Testez H0 : μ = 325 vs H1: μ < 325 au seuil α = 0,05

( b ) calculer le nombre d’observations nécessaire pour détecter

un écart de moyenne de 10 pi. car. avec un risque de type 2 de 0,10

Solution : ( a ) n = 6 y = 295 s = 11,83 ,

T5 = ( 295 – 325 ) / 11.83 √ 6 = - 6.21 < - t 5 , 0.95 = - 2,015

H0 est rejetée

( b ) δ = 10 / 11,83 = 0,84 noté d (page12)

on obtient une valeur de n = 15




19

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Y11, Y12, … , Y1n1

Y1 ~ N ( μ1, σ12) Y2 ~ N ( μ2, σ2

2)

σ1 σ2

μ2

Y21, Y22, … , Y2n2

Cas C : test d’égalité de 2 moyennes

échantillonsindépendants

Y1 = ∑ Y1i / n1Y2 = ∑ Y2i / n2moyennes

H0 : μ1 = μ2

cas C1 : variances connues

cas C2 : variances inconnues égales

cas C3 : variances inconnues inégales

cas C4 : échantillons appariés

(échantillons dépendants)

Tableau page suivante


μ1


XX= groupe 1

X: facteur input X= groupe 2

20

Cas C : tests d’égalité de 2 moyennes

0: 21 =− µµNH

22

21 ,σσ

1 20 2 2

1 2

1 2

( )y yZ

n nσ σ

−=

+

0: 21 ≠− µµAH

0: 21 <− µµAH

0: 21 >− µµAH

210 α−> zZ

α−−< 10 zZ

α−> 10 zZ

0: 21 =− µµNH

222

21 σσσ ==

1 20

1 2

( )1 1

P

y yTS

n n

−=

+0: 21 ≠− µµAH

0: 21 <− µµAH

0: 21 >− µµAH

21,2210 α−−+> nntT

α−−+−< 1,2210 nntT

α−−+> 1,2210 nntT

2)1()1(

21

222

2112

−+−+−

=nn

SnSnS p

0: 21 =− µµNH

22

21 σσ ≠

1 20 2 2

1 2

1 2

( )y yTS Sn n

−=

+

0: 21 ≠− µµAH

0: 21 <− µµAH

0: 21 >− µµAH

21,0 αν −> tT

αν −−< 1,0 tT

αν −> 1,0 tT

2221

21 , nsbnsa ==

)1()1()(

22

12

2

−+−

+=

nbnabaν

Hypothèse nulle HN Statistique pour le test Contre hypothèse Critère de rejet

connues

σ 2 inconnue

inconnuesinégales


C1

C2

C3

21

Exemple 3 : calculer un intervalle de confiance avec coefficient de confiance 0.95pour la différence de vie ( heures ) moyenne de deux types 1 et 2

d’ampoules électriques à l’aide des informations suivantes :échantillon 1 : n1 = 16 σ1 = 128 Y1= 1050échantillon 2 : n2 = 9 σ2 = 81 Y2 = 970

Intervalle de confiance avec coefficient de confiance 0.95

μ1 – μ2 : 1050 – 970 ± 1,96 ( 1282 / 16 + 812 / 9 )0.5 = 80 ± 82.1 = ( - 2.1, 162.9 )

Question : les ampoules de type 1 durent - elles (en moyenne) plus longtemps que les ampoules de type 2 ?

solution avec un test d’hypothèse : bilatéral - variances connues - alpha = 0.05

Z = ( 1050 – 970 ) / ( 1282 / 16 + 812 / 9 )0.5 = 80 / 41,87 = 1,91 < 1,96 = z0,975

conclusion: la durée moyenne ampoules type 1 n’est pas différente

de la durée moyenne des ampoules de type 2


Cas C1 : tests d’égalité de 2 moyennes - variances connues


22

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Résultat ( Y1 – Y2 ) - (μ1 - μ2)

Sp√ 1/ n1 + 1 / n2

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Y11, Y12, … , Y1n1

Y1 ~ N ( μ1, σ2 ) Y2 ~ N ( μ2, σ2 )

σσ

μ1 μ2

Y21, Y22, … , Y2n2

Cas C2 : différence entre 2 moyennes avec variances inconnues égales

échantillons indépendants

Y1 = ∑ Y1i / n1 Y2 = ∑ Y 2i / n2moyennes

S12 = ∑ ( Y1i – Y1 ) 2 / ( n1 - 1 ) S2

2 = ∑ ( Y2i – Y2 ) 2 / ( n2 – 1) variances

Sp2 = [ ( n1 -1 ) S12 + ( n2 – 1) S22 ] / ( n1 + n2 - 2) ‘ pooled ’

= T ~ Student avec n1 + n2 - 2 ddl


X

X = groupe1

X =groupe2

23

Exemple 4 : comparaison de l’épaisseur : heure 1 VS heure 2

Heure 1 : 10.0-11.2- 8.1- 8.3- 10.8- 10.3- 9.5- 8.2- 10.0- 10.1- 9.2- 8.4- 6.4- 8.3- 8.2- 7.0- 10.8- 7.5 7.4- 9.5- 9.7- 9.4-8.6-10.4-8.3-8.0-8.7-9.6-8.9-8.9

Heure 2 : 12.4-10.9- 10.4- 10.3- 10.6- 9.6- 9.7- 9.6- 9.8- 10.3- 7.7- 12.7- 10.2- 10.2- 8.6- 8.4- 9.5- 7.8 11.5- 10.0- 10.0- 8.4-10.0-11.5-11.4-11.7-10.7-10.8-9.4-10.7

Solution : avec Statistica / Statistiques élémentaires / test t échantillons indépendants

épaisseur

No

of o

bs

HEURE: x

5 6 7 8 9 10 11 12 13 140

2

4

6

8

10

12

HEURE: y

5 6 7 8 9 10 11 12 13 14

Test T avec variances

inconnues et égales

sp = 1,20

T = - 3,77 ddl = 58p- value = 0,0004

égalité moyennes rejetée

groupe n moy écart type

1 30 8,99 1,18

2 30 10,16 1,22


24

Cas C4 : Test d’égalité de 2 moyennes : échantillons appariés (pairés)

Contexte : lorsque les 2 séries de mesures proviennent des mêmes unités expérimentales.Par exemple, lorsque que l’on fait une comparaison AVANT-APRÈS :

groupe 1 : y11, y12, …, y1n mesures avant sur n unités expérimentalesgroupe 2 : y21, y22, …, y2n mesures après sur les mêmes unités expérimentales

l’indépendance des 2 échantillons n’est pas vérifiée car les mêmes unités expérimentalessont utilisées pour faire la comparaison. Le test est basé sur les différences :

Di = y1i - y2i i = 1, 2, …, nLe problème est ramené à un test de la nullité d’une moyenne avec variance inconnue.Remarque: il est important de reconnaître le cas d’échantillons appariés (= dépendants)

afin d’exécuter le bon test : échantillons indépendants ou échantillons dépendants?

Exemple 5 : 15 composants électroniques sont testés à 2 niveaux de température : N normale (20 deg C) et E élevée (100 deg C)

Une mesure de qualité importante Y fut mesurée à ces 2 niveaux de températureComposant : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

N (normale) : 7.6 - 10.2 - 9.5 - 1.3 - 3.0 - 6.3 - 5.3 - 6.2 - 2.2 - 4.8 - 11.3 - 12.1 - 6.9 - 7.6 - 8.4

E (élevée) : 7.3 - 9.1 - 8.4 - 1.5 - 2.7 - 5.8 - 4.9 - 5.3 - 2.0 - 4.2 - 11.0 - 11.0 - 6.1 - 6.7 - 7.5

D = YN – YE : 0.3 1.1 1.1 -0.2 0.3 0.5 0.4 0.9 0.2 0.6 0.3 1.1 0.8 0.9 0.9

test : D = 0.61 sD = 0.39 T = D / (s D/√ 15) = 6.02 > t14, 0.995 = 2.977

On rejette l’égalité des 2 moyennes avec risque de type 1 de 0.001


25

Cas D : test sur une variance H0 : σ2 = σ02

Exemple 6 : n = 75 données de poids donne s2 = ( 0,101 )2 = 0,010

test de H0 : σ2 = 0,015 vs H1 : σ2 < 0,015

W = 74 ( 0,01) / 0,015 = 50,3

p-value = P ( W ≤ 50,3 ) = 0,016

on rejette H0 si on utilise un risque de type I de 0,05

Statistique du test rejet de H0 au seuil α

contre hypothèse σ2 < σ02 σ2 > σ0

2 σ2 ≠ σ02

W = ( n – 1 ) s2 / σ02 W < χ2 n – 1, α W < χ2 n – 1, 1- α W < χ2 n – 1, α / 2 ou W < χ2 n – 1, 2- α/ 2



26

Courbes

d’efficacité du

test Khi-deux

---------------------

Application :

Calcul de n


27

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Résultat s12 / s2

2 suit distribution Fisher Fn1-1 , n2-1

-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26

U

-0.02

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

GAUS

S

Y11, Y12, … , Y1n1

Y1 ~ N ( μ1, σ12 ) Y2 ~ N ( μ2, σ1

2 )

σ1 σ2

μ1 μ2

Y21, Y22, … , Y2n2échantillons indépendants

Y1 = ∑ Y1i / n1 Y2 = ∑ Y 2i / n2moyennes

S12 = ∑ ( Y1i – Y1 ) 2 / ( n1 - 1 ) S2

2 = ∑ ( Y2i – Y2 ) 2 / ( n2 – 1) variances


X

X = 1 X = 2

Cas E : test d’égalité de 2 variances H0 : σ12 = σ2

2

Exemple 7 : n1 = 16 s1 = 1,93 et n2 = 10 s2 = 1,00test bilatéral F = 1,932 / 1,00 2 = 3,72loi de Fisher avec (15, 9) ddl F15 ,9, 0,975 = 3,77H0 non rejetée car 3,72 inférieur à 3,77

TEST BILATÉRAL H0 vs H1 : σ12 ≠ σ2

2 s1 = max (s1, s2) rejeter H0 si s1

2 / s22 ≥ Fn1-1 , n2-1, 1 – (α/2)

autres cas:

tests

Unilatéral

Voir

formulaire

28


Cas F : proportion p = p0

Cas F : calcul de β et n - test unilatéral Cas F : calcul de β et n - test bilatéral

29


Exemple 8 : test sur une proportion p

30


Tests de moyennes et variances avec STATISTICA

Test T pairé - 2 échantillons dépendants

Test 2 moyennes - échantillons indépendants

Test plusieurs moyennes (2 et plus)

One-way ANOVA

classification simplek groupes k ≥ 3

Test T - 1 moyenne

31Bernard CLÉMENT, PhD MTH2302 Probabilités et méthodes statistiques

Tests de moyennes et variances avec STATISTICAExemple 2

1new

2Y

123456

exemple 2 305test 285une 310

moyenne 300280290

Hypothèse H0 : μ = 325

rejetée car p-value = 0,001581 ≤ 0,05

Mean

Std.Dv.

N

Std.Err.

Reference Constant

t-value

df

p

Y

295,0 11,8 6 4,83 325 - 6,21 5 0,001581

32Bernard CLÉMENT, PhD



Exemple 4 : comparaison de l’épaisseur : heure 1 VS heure 2Heure 1 : 10.0-11.2- 8.1- 8.3- 10.8- 10.3- 9.5- 8.2- 10.0- 10.1- 9.2- 8.4- 6.4- 8.3- 8.2- 7.0- 10.8- 7.5

7.4- 9.5- 9.7- 9.4-8.6-10.4-8.3-8.0-8.7-9.6-8.9-8.9

Heure 2 : 12.4-10.9- 10.4- 10.3- 10.6- 9.6- 9.7- 9.6- 9.8- 10.3- 7.7- 12.7- 10.2- 10.2- 8.6- 8.4- 9.5- 7.8 11.5- 10.0- 10.0- 8.4-10.0-11.5-11.4-11.7-10.7-10.8-9.4-10.7

1new

2Y

3heure

123456789

10

exemple 4 10,0 1test 11,2 1

2 8,1 1moyennes 8,3 1

10,8 1. .

8,9 112,4 2

. .10,7 2

Fichier Statistica



Conclusion

moyennes inégales et variances égales

T-tests; Grouping: heure Group 1: 1 Group 2: 2 Mean

1

Mean 2

t-value

df

p

N1

N2

8,99 10,16 -3,77 58 0,00038 30 30

T-tests; Grouping: heure Group 1: 1 Group 2: 2

Std.Dev 1

Std.Dev 2

F-ratio Variances

p Variances

1,182 1,22 1,065 0,866832

34




Test de moyennes avec variances inégales

35


Exemple 9 : n = 10

Y : 4050 - 4185 - 4080 - 4100 - 4160 - 4230 - 4350 - 4290 - 4320 - 4710

W calculée = 0.85 et P ( W ≤ 0.85) = 0.06 = p-value

on ne rejette pas la loi normale pour ces données.

36

Cas G : test d’ajustement à une loi normale - procédure de Shapiro-Wilk

BUT : vérifier si une série de données x1 , x2 , x3 , …….. xn provient d’unepopulation distribué selon une loi gaussienne.

H0 : Y ~ N ( μ, σ2 ) vs H1 : Y ~ autre distribution

Plusieurs tests : Khi2, Kolmogorov-Smirnov (D ), Lilifors, Shapiro-Wilk (W)Statistique W du test de Shapiro-Wilk :

W = [ ∑ an, i y( i ) ] 2 / [ ∑ ( yi - y ) ] 2a n, i coefficients spéciaux ( table non disponible dans le manuel du cours ).La statistique W mesure la corrélation entre la série ordonnée des observationset les quantiles théoriques d’une loi N( 0,1 ). 0.70 ≤ W ≤ 1

Décision : rejeter H0 si W est ‘’petite’’

Mise en oeuvre avec le logiciel Statistica : p-value = P ( W < Wcalculée )

Si le p-value est petite (disons inférieure à 0.05 ) on rejette loi normale

comme modèle acceptable pour les observations.

Exemple 9 : n = 10

Y : 4050 - 4185 - 4080 - 4100 - 4160 - 4230 - 4350 - 4290 - 4320 - 4710

W calculée = 0.85 et P ( W ≤ 0.85) = 0.06 = p-value

on ne rejette pas la loi normale pour ces données.


37

Exemple 9 : graphique quantile – quantile W = 0.85 et P (W ≤ 0.85) = 0.06 = p-value


Quantile-Quantile Plot of EX3_Y ( 6v*60c)Distribution: Normal

EX3_Y = 4247,5+187,1784*x

-2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0

Theoretical Quantile

0,05 0,10 0,25 0,50 0,75 0,90 0,95

4000

4100

4200

4300

4400

4500

4600

4700

4800

Obs

erve

d V

alue

Histogram: EX3_YK-S d=.19683, p> .20; Lilliefors p> .20

Shapiro-Wilk W=.85334, p=.06364

3900 4000 4100 4200 4300 4400 4500 4600 4700 4800

X <= Category Boundary

0

1

2

3

No. of obs.

Test Shapiro-Wilk

W = 0,85 p = 0,06

on ne rejette pas la distribution normale pour ces données


Cas H : test d’ajustement à une loi de probabilité - test du Khi-deux

H0 : X suit loi fx (x; θ) exemple: X suit loi Weibull (θ1= b, θ2= c)

H1 : X ne suit pas loi fX(x; θ)

Statistique

pour le test ∑=

−=

k

i i

ii

een

D1

22 )(données : tableau d’effectifs n i

n i : effectifs observése i : effectifs calculés sous H0

Test : H0 rejetée si D2 > χ2ν, 1-α ν = k – p - 1 k = nombre classes

p = nombre paramètres estimés de la distribution

Condition d’application : e i > 5 α = seuil (niveau) du test)

Exemple 10 : données : n = 100 présentées en ordre croissant63.12 65.90 67.99 68.68 72.51 72.89 73.16 76.67 76.82 77.22 79.80 80.16 82.09 83.13 84.03

84.19 85.56 85.60 85.68 86.06 86.08 86.81 86.87 88.47 89.89 90.23 90.48 90.64 91.39 91.80

92.53 92.93 93.84 93.90 94.02 94.06 94.26 94.60 95.24 95.97 96.71 97.39 97.96 98.50 99.72

99.88 99.89 100.30 100.46 100.51 101.03 102.00 102.37 103.20 103.64 103.96 104.12 104.35 105.22 105.34

105.49 106.99 107.08 107.20 107.72 108.57 108.65 108.85 109.17 109.54 109.60 109.78 110.55 110.75 111.23

111.45 112.41 113.19 113.45 113.54 115.45 115.46 116.21 116.41 118.24 118.27 118.72 119.05 119.76 121.28

121.37 121.47 124.33 126.32 126.96 128.28 128.44 134.69 136.77 138.57

H0 : X suit une loi N(μ, σ2)

39



Histogram ( 11v*100c)X = 100*7,5448*normal(x; 100,7308; 16,3745)

4%

6%

9%

13%

18%

15%

17%

10%

5%

3%

63,118570,6633

78,208185,7530

93,2978100,8426

108,3875115,9323

123,4771131,0220

138,5668

X

0

2

4

6

8

10

12

14

16

18

20

No

of o

bs

4%

6%

9%

13%

18%

15%

17%

10%

5%

3%

X: SW-W = 0.9938; p = 0.9292; N = 100; Mean = 100.7308; StdDv = 16.3745; Max = 138.5668; Min = 63.1185

Quantile-Quantile Plot of X ( 11v*100c)Distribution: Normal

X = 100,7308+16,5245*x

-3 -2 -1 0 1 2 3

Theoretical Quantile

0,01 0,05 0,25 0,50 0,75 0,90 0,99

60

70

80

90

100

110

120

130

140

150

Obs

erve

d Va

lue

Normal Probability Plot of X ( 11v*100c)

60 70 80 90 100 110 120 130 140 150

Observed Value

-3

-2

-1

0

1

2

3

Expe

cted

Nor

mal

Val

ue

40



<= 64.5 1 1 1.00 1.00 1.35 1.35 1.35 1.3 -0.35

74.0 6 7 6.00 7.00 3.78 5.13 3.78 5.1 2.22

83.5 7 14 7.00 14.00 9.50 14.63 9.50 14.6 -2.50

93.0 18 32 18.00 32.00 17.21 31.84 17.21 31.8 0.79

102.5 21 53 21.00 53.00 22.46 54.30 22.46 54.3 -1.46

112.0 23 76 23.00 76.00 21.13 75.43 21.13 75.4 1.87

121.5 16 92 16.00 92.00 14.33 89.77 14.33 89.8 1.67

131.0 5 97 5.00 97.00 7.01 96.77 7.01 96.8 -2.01

140.5 3 100 3.00 100.00 2.47 99.24 2.47 99.2 0.53

infinity 0 100 0.00 100.00 0.76 100.00 0.76 100.0 -0.76

Procédure : « distribution fitting » de STATISTICA

Variable: X Distribution: Normal

Chi-Square = 2.31985 = D2 df = 4 (adjusted) p = 0.67716

loi normale n’est pas rejetée

Intervalle ni cum ni ni (%) cum ni (%) ei cum ei ei (%) cum ei (%) ni - ei

ni : observés

ei : attendus

sous H0

Tests d’hypothèses (ch. 11 HMGB)€¦ · Tests concernant variances 1 variance / 2 variances Test concernant proportions 1 proportion / 2 proportions Test comparaison 3 groupes

Documents