Testy Testy nieparametryczne nieparametryczne
Jan 21, 2016
Testy Testy nieparametrycznenieparametryczne
Testy nieparametryczne
losowości
zgodności
jednorodności
Testy losowościTesty losowości
►Weryfikują hipotezę, że dobór Weryfikują hipotezę, że dobór jednostek do próby był jednakowyjednostek do próby był jednakowy
Test serii StevensaTest serii Stevensa
1. Ho: Dobór jednostek do próby jest losowy1. Ho: Dobór jednostek do próby jest losowyH1:Dobór jednostek do próby nie jest losowyH1:Dobór jednostek do próby nie jest losowy
2. Procedura testowa:2. Procedura testowa:2a. Wyznaczamy na podstawie uporządkowanych 2a. Wyznaczamy na podstawie uporządkowanych
danych medianędanych medianę2b. Danym nieuporządkowanym przyporządkowujemy 2b. Danym nieuporządkowanym przyporządkowujemy
następujące oznaczenia:następujące oznaczenia:A gdy x<MeA gdy x<MeB gdy x>MeB gdy x>Me0 gdy x=Me (zera pomijamy w dalszej analizie)0 gdy x=Me (zera pomijamy w dalszej analizie)Statystyką testową jest liczba serii (k)Statystyką testową jest liczba serii (k)
►Seria – ciąg identycznych symboli (A Seria – ciąg identycznych symboli (A lub B)lub B)
np. np. AAAAAAAA BB AA BBBB k=4k=4
AAA 0 AAAA 0 A BBBBBB 0 0 AAAA k=3k=3
3. Ustalamy poziom istotności3. Ustalamy poziom istotności4. Obszar krytyczny testu jest zawsze dwustronny. 4. Obszar krytyczny testu jest zawsze dwustronny.
Odczytujemy z rozkładu liczby serii wartości Odczytujemy z rozkładu liczby serii wartości krytycznekrytyczne
5. Podejmujemy decyzję5. Podejmujemy decyzję
);;2
1(
);;2
(
2
1
BA
BA
nnk
nnk
Przykład 1:Przykład 1:
Wylosowano 12 spółek i zbadano cenę ich Wylosowano 12 spółek i zbadano cenę ich akcji (w zł). Otrzymano następujące akcji (w zł). Otrzymano następujące wyniki: wyniki:
74,5 191,0 55,5 5,15 36,4 35,0 46,0 74,5 191,0 55,5 5,15 36,4 35,0 46,0 10,9 7,35 6,65 173,5 26,0. 10,9 7,35 6,65 173,5 26,0.
Czy dobór spółek do próby był losowy?Czy dobór spółek do próby był losowy?
Wysuniętą hipotezę zweryfikuj na poziomie Wysuniętą hipotezę zweryfikuj na poziomie istotności 0,05.istotności 0,05.
Rozwiązanie:Rozwiązanie:
Ho: dobór jednostek do próby jest losowyHo: dobór jednostek do próby jest losowyH1:Dobór jednostek do próby nie jest losowyH1:Dobór jednostek do próby nie jest losowy
Wyznaczamy medianę:Wyznaczamy medianę:
Poz. Me=(n+1)/2=6,5Poz. Me=(n+1)/2=6,5Me=35,7Me=35,7Danym pierwotnym przypisujemy litery A, B, 0 Danym pierwotnym przypisujemy litery A, B, 0
kolejnym obserwacjomkolejnym obserwacjom
5,15 6,65 7,35 10,9 26 35 36,4 46 55,5 74,5 173,5 191
74,5 191 55,5 5,15 36,4 35 46 10,9 7,35 6,65 173,5 26B B B A B A B A A A B A
► Obliczamy liczbę serii:Obliczamy liczbę serii:► k=8k=8► Poziom istotności 0,05Poziom istotności 0,05► Odczytujemy wartości krytyczne:Odczytujemy wartości krytyczne:
10)6;6;975,02
1(
3)6;6;025,02
(
2
1
BA
BA
nnk
nnk
► Porównujemy wartość statystyki z próby z Porównujemy wartość statystyki z próby z wartościami krytycznymi:wartościami krytycznymi:
► Brak podstaw do odrzucenia hipotezy Brak podstaw do odrzucenia hipotezy zerowej, która mówi, że dobór jednostek do zerowej, która mówi, że dobór jednostek do próby był losowy.próby był losowy.
3 108
Testy zgodności:Testy zgodności:
► Weryfikują hipotezę o zgodności rozkładu Weryfikują hipotezę o zgodności rozkładu empirycznego (rozkładu z próby losowej) z empirycznego (rozkładu z próby losowej) z rozkładem teoretycznym (np. normalnym, rozkładem teoretycznym (np. normalnym, dwumianowym itp.) lub inaczej ujmując – dwumianowym itp.) lub inaczej ujmując – dotyczą postaci rozkładu badanej cechy w dotyczą postaci rozkładu badanej cechy w populacji.populacji.
)()(:
)()(:
01
00
xFxFH
xFxFH
Testy zgodności Testy zgodności (normalności)(normalności)
1.1. Test Kołmogorowa- Smirnowa (D) Test Kołmogorowa- Smirnowa (D)
(próby małe n<100, zmienna ciągła)(próby małe n<100, zmienna ciągła)
2. 2. Test Test - Kołmogorowa - Kołmogorowa
(próby duże n(próby duże n100, zmienna ciągła)100, zmienna ciągła)
3.3. Test Test 2 2
(wszystkie zmienne, szeregi rozdzielcze o dużych (wszystkie zmienne, szeregi rozdzielcze o dużych liczebnościach w przedziałach , próby liczebnościach w przedziałach , próby duże) duże)
8in
Etapy testów zgodności Etapy testów zgodności (aproksymacja rozkładu (aproksymacja rozkładu
normalnego):normalnego):1. Ustalamy parametry rozkładu normalnego1. Ustalamy parametry rozkładu normalnego
2. Standaryzujemy prawe (górne) granice 2. Standaryzujemy prawe (górne) granice przedziałów (poza ostatnim)przedziałów (poza ostatnim)
3. Odczytujemy wartości dystrybuant z tablicy 3. Odczytujemy wartości dystrybuant z tablicy rozkładu normalnego (jako ostatnią dystrybuantę rozkładu normalnego (jako ostatnią dystrybuantę przyjmujemy wartość 1)przyjmujemy wartość 1)
4a. Z dystrybuant obliczamy skumulowane wartości 4a. Z dystrybuant obliczamy skumulowane wartości teoretyczne (test Chi-kwadrat)teoretyczne (test Chi-kwadrat)
lublub
4b. Obliczamy dystrybuanty empiryczne (test 4b. Obliczamy dystrybuanty empiryczne (test Kołmogorowa) Kołmogorowa)
nzFn iisk )(ˆ
n
nzF iski )(
Etapy testów zgodności (c.d.):Etapy testów zgodności (c.d.):
5. Obliczamy wartość statystyki testowej5. Obliczamy wartość statystyki testowej
6 a. Odczytujemy wartość krytyczną z 6 a. Odczytujemy wartość krytyczną z tablictablic
LubLub
6 b. Obliczamy prawdopodobieństwo testu6 b. Obliczamy prawdopodobieństwo testu
7. Podejmujemy decyzję7. Podejmujemy decyzję
Przykład 1:Przykład 1:
Struktura wieku inwestorów giełdowych w pewnej grupie zawodowej w Polsce jest następująca: Wiek w latach Liczba osób 15-25 2 25-35 3 35-45 6 45-55 5 55-65 1 Zweryfikować hipotezę, że rozkład wieku inwestorów giełdowych jest normalny
)()( 0 xFxF
)()(:
)()(:
01
00
xFxFH
xFxFH
Wiek w latach
Liczba osób Z F(Z) nisk F(X)
15-25 2 -1,38 0,0833 2 0,1176 0,0343
25-35 3 -0,46 0,3224 5 0,2941 0,0283
35-45 6 0,46 0,6776 11 0,6471 0,0305
45-55 5 1,38 0,9167 16 0,9412 0,0245
55-65 1 x 1 17 1,0000 0,0000
Suma 17 x x x x
latx 40 lats 85,10s
xxz ii
1
0343,0)()(max 0 xFxFD05,0
206,0)17,05,0( nD
0,2060,0343
Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.
Przykład 2:Przykład 2:I sposób (test I sposób (test - Kołmogorowa) - Kołmogorowa)
Struktura wieku inwestorów giełdowych w pewnej grupie zawodowej w Polsce jest następująca: Wiek w latach Liczba osób 15-25 20 25-35 30 35-45 60 45-55 50 55 i więcej 10 Suma 170 Zweryfikować hipotezę, że rozkład wieku inwestorów giełdowych jest normalny
)()( 0 xFxF
)()(:
)()(:
01
00
xFxFH
xFxFH
Wiek w latach
Liczba osób Z F(Z) nisk F(X)
15-25 20 -1,38 0,0833 20 0,1176 0,0343
25-35 30 -0,46 0,3224 50 0,2941 0,0283
35-45 60 0,46 0,6776 110 0,6471 0,0305
45-55 50 1,38 0,9167 160 0,9412 0,0245
55 i więcej
10x 1 170 1,0000 0,0000
Suma 170 x x x x
latx 40 lats 85,10s
xxz ii
1
0343,0)()(max 0 xFxFD
05,036,1
1,360,447
Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.
447,01700343,0 nD
Przykład 2:Przykład 2:II sposób (test Chi - kwadrat)II sposób (test Chi - kwadrat)
Struktura wieku inwestorów giełdowych w pewnej grupie zawodowej w Polsce jest następująca: Wiek w latach Liczba osób 15-25 20 25-35 30 35-45 60 45-55 50 55 i więcej 10 Suma 170 Zweryfikować hipotezę, że rozkład wieku inwestorów giełdowych jest normalny
iskn̂i
i
n
n
ˆ
2
in̂
)()(:
)()(:
01
00
xFxFH
xFxFH
Wiek w latach
Liczba osób Z F(Z)
15-25 20 -1,38 0,0833 14,16 14,16 28,25
25-35 30 -0,46 0,3224 54,81 40,65 22,14
35-45 60 0,46 0,6776 115,19 60,38 59,62
45-55 50 1,38 0,9167 155,84 40,65 61,50
55 i więcej
10x 1 170 14,16 7,06
Suma 170 x x x 170 178,57
latx 40 lats 85,10s
xxz ii
1
57,817057,178ˆ1
22
n
i i
i
n
n
05,0)1,(2 rkv
1,368,57
Brak podstaw do odrzucenia hipotezy zerowej o zgodności rozkładu wieku inwestorów z rozkładem normalnym.
Testy jednorodnościTesty jednorodności
► Weryfikują hipotezę o zgodności dwóch Weryfikują hipotezę o zgodności dwóch rozkładów empirycznych ze sobą (oba rozkładów empirycznych ze sobą (oba rozkłady pochodzą z tej samej populacji)rozkłady pochodzą z tej samej populacji)
)()(:
)()(:
211
210
xFxFH
xFxFH
Testy jednorodnościTesty jednorodności
► Test serii Walda – WolfowitzaTest serii Walda – Wolfowitza(próby niezależne, małe, dane szczegółowe)(próby niezależne, małe, dane szczegółowe)► Test Test 2 2 (Snedeckora)(Snedeckora)(próby niezależne, duże, szeregi rozdzielcze o (próby niezależne, duże, szeregi rozdzielcze o
licznych przedziałach , wszystkie rodzaje licznych przedziałach , wszystkie rodzaje cech)cech)
► Test Kołmogorowa - Smirnowa (Test Kołmogorowa - Smirnowa ())(próby niezależne, duże, tylko cechy ilościowe (próby niezależne, duże, tylko cechy ilościowe
ciągłe)ciągłe)► Test znaków (Dixona - Mooda) Test znaków (Dixona - Mooda) (próby zależne, małe, dane szczegółowe, cechy (próby zależne, małe, dane szczegółowe, cechy
ilościowe ciągłe)ilościowe ciągłe)
Przykład:Przykład:Liczba zgonów niemowląt wg wieku w losowo wybranych próbach w 1989 roku i 1990 roku.
Wiek Liczba niemowląt
1989 1990
0 dni 112 73
1-6 132 135
7-13 27 21
14-20 11 17
21-29 8 9
1-2 m-ce
28 26
3-5 24 37
6-11 24 21
Razem 366 339
Czy rozkłady zgonów niemowląt według wieku w obu badanych próbach są takie same? =0.05
)()(:
)()(:
211
210
xFxFH
xFxFH
Test jednorodności chi-kwadrat
k
i ii
i
nn
n
nn
n
nn
nn
1 21
21
21
21
11
212 )(
Wiek Liczba niemowląt
1989 1990
0 dni 112 73 67,81
06-sty 132 135 65,26
13-lip 27 21 15,19
14-20 11 17 4,32
21-29 8 9 3,76
1-2 m-ce
28 2614,52
05-mar 24 37 9,44
11-cze 24 21 12,80
Razem 366 339 193,10
ii
i
nn
n
21
21
017566,0339366
36610,193
339366
)339366( 22
018,02
067,14)7181;05,0(2 kv
14,0670,018
Brak podstaw do odrzucenia hipotezy zerowej o jednorodności rozkładu zgonów niemowląt.
Przykład:Przykład:Zbadano grupę 12 osób, które poddały się kuracji odchudzającej. Ich waga przed kuracją (x1) i po kuracji (x2) kształtowała się następująco: (x1) 64 78 92 66 85 71 98 85 63 60 84 90 (x2) 60 72 93 66 81 72 90 76 64 58 76 92 Na poziomie istotności =0.01 zweryfikować hipotezę, że waga ciała badanych osób uległa zmniejszeniu po kuracji odchudzającej.
)()(:
)()(:
211
210
xFxFH
xFxFH
(x1) 64 78 92 66 85 71 98 85 63 60 84 90
(x2) 60 72 93 66 81 72 90 76 64 58 76 92
znak: + + - 0 + - + + - + + -
05,0
4)7;4min();min( rrr
2);05,0( rrnr
2 4
Brak podstaw do odrzucenia hipotezy zerowej o identyczności rozkładów wagi przed i po kuracji.