NEPARAMETRIJSKI TESTOVINEPARAMETRIJSKI TESTOVI
Parametrijske metode: merljivi podaci koji se normalno distribuiraju
Neparametrijske metode: nije važno da li rezultati podležu
normalnoj raspodeli, često rezultati nisu izraženi mernim
jedinicama već frekvencijama "statistika slobodna od distribucije"
"snaga" neparametrijskih testova
< "snaga" parametrijskih testova
Pogodne za: preliminarna ispitivanja malog broja
merenja brza izračunavanja (često bez tablica) raspodela značajno odstupa od
normalne
Mera centralne tendencije: obično medijana Merilo disperzije: interkvartilni interval
Primer 1. Utvrđeno je da nivo proteina krvne plazme kod 20 muškaraca i 20 žena iznosi (mg/100 mL): M: 3 2 1 4 3 2 9 13 11 3 18 2 4 6 2
1 8 5 1 14 Ž: 6 5 2 1 7 2 2 11 2 1 1 3 11 3 2
3 2 1 4 8. Kakve informacije o razlici između nivoa ovog proteina kod muškaraca i žena možete dobiti na osnovu ovih rezultata?
M: 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 6, 8, 9, 11, 13, 14, 18
8,5 2
Z: 1, 1, 1, 1, 2, 2, 2, 2, 2, 2,3, 3, 3, 4, 5, 6, 7, 8, 11, 11
3,5
2
2,5
5,5
Rezultati se prikazuju u obliku tablice: min. niži medijana viši max kvartil kvartil
M: 1 2 3,5 8,5 18 Ž: 1 2 2,5 5,5 11 može i grafički nesimetrična distribucija metode koje
podrazumevaju normalnu raspodelu nisu pogodne
medijane slične interval vrednosti značajno širi za muškarce
proveriti pogodnim testom da li je ta razlika statistički značajna
Test predznaka (The sign test) najjednostavnija od svih neparametrijskih
metoda nalik t-testu može da se primeni na nekoliko načina
Primer 2. Neki farmaceutski preparat treba da ima medijanu sadržaja aktivne komponente od 8%. Ispitivanja uzastopnih šarži dala su sledeće rezultate: 7,3; 7,1; 7,9; 9,1; 8,0; 7,1; 6,8; 7,3%. Da li se podaci značajno razlikuju od postulirane medijane na nivou značajnosti od P = 0,05?
parametrijska metoda → t-test neparametrijski postupak:
)()()( knknk qpkP p = q = 1/2
P(6) = 7C6 × (1/2)6 × (1/2)1 = 7/128;
P(7) = 1/128 P(6 ili više "-") = 8/128
- dvosmerni test: P(6 ili više identičnih
znakova) = 16/128 = 0,125 > 0,05
Ne može da se odbaci H0
Može da se koristi i za poređenje dva seta rezultata;
da ukaže na trend
Primer 3. Nivo hormona u krvnoj plazmi pacijenta meren je u isto vreme tokom 10 dana. Dobijeni su sledeći rezultati:
Dan 1 2 3 4 5 6 7 8 9 10
ng/mL 5,8 7,3 4,9 6,1 5,5 5,5 6,0 4,9 6,0 5,0
Da li ovi rezultati ukazuju na trend u koncentraciji hormona?
Parametrijska metoda: linearna regresiona analiza i provera da li se nagib dobijene prave značajno razlikuje od 0
neparametrijska metoda – jednostavnija: H0: ne postoji trend u rezultatima. Postupak: podaci se podele u dva jednaka seta, pri čemu se zadrži njihov redosled:
5,8 7,3 4,9 6,1 5,5 5,5 6,0 4,9 6,0 5,0 + + 0 + + 4 rezultata, svi pozitivni P 4 ista znaka od 4 = 2 × 1/16 = 0,125 > 0,05 H0: nema trenda u rezultatima ne može da se odbaci na nivou značajnosti od P = 0,05.
Test homogenog niza (Wald-Wolfowitz runs test)
da li pojave imaju "+" ili "-" znak da li se ovi znaci javljaju u slučajnoj
sekvenci. Primer 4.
Linearna regresiona jednačina je primenjena za podešavanje prave od 12 kalibracionih tačaka. Znaci rezultujućih y-ostataka u nizu rastućih x-vrednosti su: ++++------++. Da li je bolje prihvatiti krivolinijsko podešavanje tačaka?
Nul-hipoteza: sekvenca + i - znakova je slučajna.
N = broj "+" znakova = 6
M = broj "–" znakova = 6
broj nizova = 3 (i jedan znak predstavlja niz)
Tablica: na nivou značajnosti od P = 0,05 broj nizova mora da bude < 4 da bi nulta hipoteza bila odbačena
ODBACUJEMO NUL-HIPOTEZU
KRIVOLINIJSKA ZAVISNOST
Test ekvivalentnih parova (Wilcoxon signed rank test)
Vilkoksonov test ekvivalentnih parova = Vilkoksonov test predznaka i ranga = Vilkoksonov test ranga sa predznakom da li su individualna merenja veća ili manja
od medijane, a veličina ovih devijacija se ne uzima u obzir;
Primer.
Nivo Pb u krvi (u pg/mL) sedmoro dece iznosi:
104; 79; 98; 150; 87; 136 i 101. Mogu li ovakvi podaci pripadati istoj populaciji, za koju je pretpostavljeno da je simetrična, sa medijanom (srednjom vrednošću) od 95 pg/mL?
Odstupanja od medijane iznose: 9, -16, 3, 55, -8, 41, 6.
Ove vrednosti se poređaju u rastući niz bez obzira na znak: 3, 6, 8, 9, 16, 41, 55, a onda im se pridružuju znaci: 3, 6, -8, 9, -16, 41, 55.
Brojevi se onda rangiraju uz zadržavanje predznaka: 1, 2, -3, 4, -5, 6, 7. Suma pozitivnih rangova = 20 Suma negativnih rangova = 8. - manja vrednost (8) se poredi sa tabličnom vrednošću
Wilcoxon-ov test sume rangova poređenje dva nezavisna uzorka koji ne
mogu da budu svedeni na jedan set podataka Primer: Uzorak fotografskog otpadnog materijala analiziran je na sadržaj Ag AAS-metodom i dobijeni su sledeći rezultati: 9,8; 10,2; 10,7; 9,5 i 10,5 g/cm3. Posle određenog hemijskog tretmana fotografski otpad je ponovo analiziran istim postupkom i dobijeni su rezultati: 7,7; 9,7; 8,0; 9,9 i 9,0 g/cm3.
Da li primenjeni hemijski tretman dovodi do značajnog sniženja sadržaja Ag? H0: Dva seta pripadaju istoj populaciji
p r v o : r a n g i r a n j e s v i h r e z u l t a t a :
2
1nnST 11
11
;
2
1nnST 22
22
n 1 = n 2 = 5 ; n i ( n i + 1 ) / 2 = 1 5 T 1 = 3 ; T 2 = 2 2 3 s e p o r e d i s a t a b l i č n i m v r e d n o s t i m a ( j e d n o s m e r n i t e s t ) : T n 4 o d b a c u j e s e H 0 d a d v a s e t a p r i p a d a j u i s t o j p o p u l a c i j i t j . h e m i j s k i t r e t m a n s m a n j u j e s a d r ž a j A g
NEPARAMETRIJSKA ANOVA
Jednofaktorska (više nezavisnih uzoraka): - (prošireni medijana-test) - Kruskal-Wallis-ov test: koristi rangove umesto “sirovih” podataka; “snažniji” od proširenog medijana-testa χ2
Više zavisnih uzoraka: - Friedman-ov test
Neparametrijske regresione metode
najjednostavnija tzv. Theil-ova "nepotpuna" metoda
Pretpostavka: serija tačaka (x1,y1), (x2, y2) ... koje se podešavaju pomoću prave y = a + bx.
Prvi korak: rangiranje tačaka u nizu rastućih x-vrednosti.
izračunavanja se uvek vrše sa parnim brojem tačaka
Za svaki par tačaka (xi, yi) (xj, yj), gde je j = n/2+i, nagib bij linije koja prolazi kroz te tačke može da se izračuna kao:
bij = (yj - yi) / (xj - xi).
medijana izračunatih vrednosti predstavlja nagib regresione prave
Sa ovom vrednošću b izračunavaju se a
vrednosti, koje se zatim poređaju u rastući niz čija medijana predstavlja najbolju izračunatu vrednost odsečka na y-osi.
Theil-ova potpuna metoda: Nagib se računa kao medijana nagiba za svaki par tačaka (1 ≤ i, j ≤ n) odsečak isto kao kod nepotpune metode više računanja
Prednosti Theil-ovih metoda:• ne pretpostavljaju greške samo u y-vrednostima• ne pretpostavljaju normalnu raspodelu grešaka • neosetljive na ekstremne vrednosti (outliers)
A comparison of best fit lines for data with outliers(Glaister, P. Int. J. Math. Educ. Sci. Technol. 2005, 36, 110–117)
KolmogorovKolmogorov-Smirnov-Smirnov-ljev-ljev test test
Za testiranje normalnosti raspodelePoredi krivu kumulativne frekvencije sa krivom pretpostavljene raspodelePodaci se transformišu u standardnu formu(izračunavaju se z-vrednosti)
x
z