2007/2008 1 Procedure za testiranje hipoteze Procedure za testiranje hipoteze Testiranje Testiranje hipoteze hipoteze - testovi - - testovi - Parametarski Parametarski Neparametars Neparametars ki ki za jednu za jednu populaciju populaciju za dve i za dve i više više populacija populacija
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
2007/20081
Procedure za testiranje hipotezeProcedure za testiranje hipoteze
Dvostrani z-test za srednju vrednostDvostrani z-test za srednju vrednost
Pretpostavke:Pretpostavke: poznata standardna devijacija populacije - poznata standardna devijacija populacije - σσ populacija je normalno distribuiranapopulacija je normalno distribuirana
Nulta hipoteza ima samo znak Nulta hipoteza ima samo znak == Alternativna hipoteza ima znakAlternativna hipoteza ima znak ≠≠ Izračunava se vrednost Izračunava se vrednost zz
N
σx
z
2007/20084
Dvostrani z-test - PrimerDvostrani z-test - Primer
Da li je neto težina kutije sa čajem jednaka Da li je neto težina kutije sa čajem jednaka 300 g300 g? ?
Slučajni uzorak od 25 kutija ima Slučajni uzorak od 25 kutija ima xxsr sr = 305,4 g= 305,4 g
Poznato je da je Poznato je da je σσ = 15 g (standardna devijacija = 15 g (standardna devijacija populacije)populacije)
TTestestirati hipotezu za irati hipotezu za αα = 0, = 0,0505
Vrednost z u regionu za prihvatanje: -1,96 < z Vrednost z u regionu za prihvatanje: -1,96 < z (+1,80) < 1,96(+1,80) < 1,96
vrednost p: vrednost p: p p ((zz ≤ -1 ≤ -1,8,80 0 i i z z ≥ 1≥ 1,8,80) = 0) = 0,07180,0718 p > p > ((αα = = 0,0,05)05)
Nulta hipoteza se prihvataNulta hipoteza se prihvata
2007/20088
Pretpostavke:Pretpostavke: poznata standardna devijacija populacije - poznata standardna devijacija populacije - σσ populacija je normalno distribuiranapopulacija je normalno distribuirana
Nulta hipoteza ima znak Nulta hipoteza ima znak iliili Alternativna hipoteza ima znak Alternativna hipoteza ima znak >> ili ili << Izračunava se vrednost zIzračunava se vrednost z
Jednostrani z-test za srednju vrednostJednostrani z-test za srednju vrednost
N
σμx
z
2007/20089
Jednostrani z-test - primerJednostrani z-test - primer
Da li je neto težina kutije sa čajem Da li je neto težina kutije sa čajem većaveća od od 300 g300 g? ?
Slučajni uzorak od 25 kutija ima Slučajni uzorak od 25 kutija ima xxsr sr = 305,4 g= 305,4 g
Poznato je da je Poznato je da je σσ = 15 g = 15 g TTestestirati hipotezu za irati hipotezu za αα = 0, = 0,0505
Teorija normalne raspodele je razvijena iz velikog broja Teorija normalne raspodele je razvijena iz velikog broja podataka podataka
Praktičnim radom često ne može da se dobije veliki broj Praktičnim radom često ne može da se dobije veliki broj podataka podataka
Razvijena je teorijska raspodela verovatnoće slučajne Razvijena je teorijska raspodela verovatnoće slučajne promenljive promenljive tt za mali broj podataka uzetih iz normalne za mali broj podataka uzetih iz normalne raspodeleraspodele
Kada se radi sa malim brojem podataka nisu poznate Kada se radi sa malim brojem podataka nisu poznate populaciona standardna devijacija σ i srednja vrednost μpopulaciona standardna devijacija σ i srednja vrednost μ
σ se zamenjuje sa σ se zamenjuje sa SdSd, a μ sa , a μ sa xxsrsr
2007/200816
Studentov t-testStudentov t-test
• Postoji beskonačno mnogo t-krivih koje zavise od broja Postoji beskonačno mnogo t-krivih koje zavise od broja podatakapodataka
• t-raspodela se približava normalnoj raspodeli kada se t-raspodela se približava normalnoj raspodeli kada se povećava broj podatakapovećava broj podataka
2007/200817
Dvostrani t-test za srednju vrednostDvostrani t-test za srednju vrednost
Parametarski test Parametarski test
Pretpostavka za testPretpostavka za test Nije poznata standardna devijacija populacije - Nije poznata standardna devijacija populacije - σσ
Populacija je normalno distribuiranaPopulacija je normalno distribuirana
Izračunava se veličina t prema izrazu:Izračunava se veličina t prema izrazu:
N
Sdx
t
2007/200818
Dvostrani t-test - PrimerDvostrani t-test - Primer
Da li je sadržaj kontrolnog uzorka za odredjivanje Na Da li je sadržaj kontrolnog uzorka za odredjivanje Na jednak jednak 135 mmol/L135 mmol/L??
U slučajnom uzorku od U slučajnom uzorku od N = 16N = 16 izračunato je: izračunato je:
xxsrsr = 135,8 mmol/L i Sd = 2,04 mmol/L = 135,8 mmol/L i Sd = 2,04 mmol/L
Testirati hipotezu za Testirati hipotezu za αα = 0,05 φ = 15 = 0,05 φ = 15
HH00 : μ = 135 i H : μ = 135 i H11 : μ : μ 135135
1,5690,51
0,8
16
2,04135135,8
N
Sdx
t
2007/200819
Kritična vrednost za tKritična vrednost za t
Nulta hipoteza Nulta hipoteza se prihvatase prihvata, razlika nije statistički značajna, razlika nije statistički značajnat < tt < t0,050,05 p > 0,05 p > 0,05
t0 2,1312,131
0,0250,0250,0250,025
-2,131-2,131
region za odbacivanjeregion za odbacivanje
t = 1,569t = 1,569
region za region za odbacivanjeodbacivanje
jednostr. 0,05 0,025 0,005
dvostr. 0,10 0,05 0,01
φ = 1 6,314 12,706 63,657
2 2,920 4,303 9,925
3 2,353 3,182 5,841
.... .... .... ....
13 1,771 2,160 3,012
14 1,761 2,145 2,977
15 1,753 2,131 2,947
16 1,746 2,120 2,921
2007/200820
Dvostrani t-test - primerDvostrani t-test - primer
Nulta hipoteza se Nulta hipoteza se ne prihvatane prihvata, razlika jeste statistički značajna, razlika jeste statistički značajnatt0,05,350,05,35 = 2,030 = 2,030 t > t t > t0,050,05 p < 0,05 p < 0,05
2007/200821
Dvostrani t-test - primerDvostrani t-test - primer
Nulta hipoteza se ne prihvata, razlika je statistički značajnaNulta hipoteza se ne prihvata, razlika je statistički značajnatt0,05,350,05,35 = 2,030 = 2,030 t > tt > t0,050,05 p < 0,05 p < 0,05
tt0 2,0302,030
0,0250,0250,0250,025
-2,030-2,030
region za odbacivanjeregion za odbacivanje
t = 2,35t = 2,35
region za odbacivanjeregion za odbacivanje
2007/200822
Dvostrani t-test - primerDvostrani t-test - primer
Uticaj standardne devijacijeUticaj standardne devijacije
N = 36N = 36 x xsrsr = 135,8 mmol/L = 135,8 mmol/L Sd = 4,04 mmol/LSd = 4,04 mmol/L
μ = 135mmol/Lμ = 135mmol/L
HH00 : μ = 135 i H : μ = 135 i H11 : μ : μ ≠≠ 135 135
Nulta hipoteza se prihvata, razlika nije statistički značajnaNulta hipoteza se prihvata, razlika nije statistički značajnatt0,05,350,05,35 = 2,030 = 2,030 t < t t < t0,050,05 p > 0,05 p > 0,05
2007/200823
Jednostrani t-test - primerJednostrani t-test - primer
Da li je sadržaj kontrolnog uzorka za odredjivanje Na Da li je sadržaj kontrolnog uzorka za odredjivanje Na većiveći od od 135 mmol/L?135 mmol/L?
U slučajnom uzorku od N = 16 izračunato je:U slučajnom uzorku od N = 16 izračunato je:
xxsrsr = 135,8 mmol/L i Sd = 2,04 mmol/L = 135,8 mmol/L i Sd = 2,04 mmol/L
HH00 : μ : μ ≤≤ 135 135 H H11 : μ : μ >> 135135
Testirati hipotezu za Testirati hipotezu za αα = 0,05 = 0,05 φφ = 15 = 15
PretpostavkePretpostavke Populacija obično sledi binomnu raspodeluPopulacija obično sledi binomnu raspodelu Aproksimacija za normalnu raspodelu se koristi ako jeAproksimacija za normalnu raspodelu se koristi ako je
NN·p ·p ≥≥ 5 5 i i N N·(1 - p) ·(1 - p) ≥≥ 5 5
p – proporcija koja se testirap – proporcija koja se testira Izračunava se vrednost z za proporcijuIzračunava se vrednost z za proporciju
Dvostrani z-test za proporciju - rešenjeDvostrani z-test za proporciju - rešenje
HH00: p = : p = 0,10,1
HH11: p : p ≠≠ 0,10,1
αα = = 0,0,0505
NN = = 220000
2,12
2000,10)(10,10
0,1020011
Np)(1p
ppz s
p = p = 0,10,1
ppss = 11/200 = 11/200
NN = = 220000
2007/200829
Dvostrani z-test za proporciju - rešenjeDvostrani z-test za proporciju - rešenje
OdlukaOdluka:: Nulta hipoteza se ne prihvata za Nulta hipoteza se ne prihvata za αα = = 0,0,0505
ZaključakZaključak:: Nema dokaza da je proporcija jednaka 0,1Nema dokaza da je proporcija jednaka 0,1
z = -2,12z = -2,12
zz00 1,961,96-1,96-1,96
0,0250,025
odbacuje se Hodbacuje se H00
0,0250,025
odbacuje se Hodbacuje se H00
2007/200830
Jednostrani z-test za proporciju - primerJednostrani z-test za proporciju - primer
Sistem za pakovanje tableta daje 10% Sistem za pakovanje tableta daje 10% neispravnih pakovanjaneispravnih pakovanja
Korišćenjem novog sistema u slučajnom uzorku Korišćenjem novog sistema u slučajnom uzorku od 200 kutija dobijeno je 11 neispravnihod 200 kutija dobijeno je 11 neispravnih
Da li novi sistem daje Da li novi sistem daje manjimanji broj neispravnih broj neispravnih pakovanja?pakovanja?
Testirati hipotezu za Testirati hipotezu za αα = = 0,0,05 05
Jednostrani z-test za proporciju - rešenjeJednostrani z-test za proporciju - rešenje
HH00: p : p ≥≥ 0,10,1
HH11: p : p < 0,1< 0,1
αα = = 0,0,0505
NN = = 220000
2,12
2000,10)(10,10
0,1020011
Np)(1p
ppz s
p = p = 0,10,1
ppss = 11/200 = 11/200
NN = = 220000
2007/200832
Jednostrani z-test za proporciju - rešenjeJednostrani z-test za proporciju - rešenje
Odluka:Odluka: Nulta hipoteza se ne prihvata za Nulta hipoteza se ne prihvata za αα = = 0,0,0505
Zaključak:Zaključak: Ima dokaza da je proporcija manja od 0,1, odnosno novi Ima dokaza da je proporcija manja od 0,1, odnosno novi sistema daje značajno manji procenat neispravnih pakovanjasistema daje značajno manji procenat neispravnih pakovanja
zz00-1,645-1,645
0,05
odbacuje se Hodbacuje se H00
z = - 2,12z = - 2,12
2007/200833
Testovi za dve i više populacijaTestovi za dve i više populacija
dvedve i više i više populacijapopulacija
varijansavarijansa
srednja srednja vrednostvrednost
F F ttestest
z-testz-testt-testt-test ANOVAANOVA
brojbrojuzorakauzoraka
22 nn
2007/200834
Razlika između dve srednje vrednostiRazlika između dve srednje vrednosti
Uzorci su iz normalno distribuiranih populacija sa Uzorci su iz normalno distribuiranih populacija sa poznatim varijansamapoznatim varijansama
z-test: dvostrani i jednostraniz-test: dvostrani i jednostrani
Uzorci su iz normalno distribuiranih populacija sa Uzorci su iz normalno distribuiranih populacija sa nepoznatim varijansamanepoznatim varijansama
t-test: dvostrani i jednostranit-test: dvostrani i jednostrani
2007/200835
Dvostrani z-test za razliku između dve sr. vrednostiDvostrani z-test za razliku između dve sr. vrednosti
Testira se razlika izmedju srednjih vrednosti dve Testira se razlika izmedju srednjih vrednosti dve nezavisne populacijenezavisne populacije
Pretpostavke:Pretpostavke: populacione standardne devijacije su poznatepopulacione standardne devijacije su poznate populacije su normalno distribuiranepopulacije su normalno distribuirane
Izračunava se vrednost zIzračunava se vrednost z
2007/200836
Dvostrani z-test za razliku između dve sr. vrednostiDvostrani z-test za razliku između dve sr. vrednosti
HH00 se odbacuje kada je t se odbacuje kada je tizračunatoizračunato > t > t0,05, 0,05, φφ
2007/200847
Uticaj različitih faktoraUticaj različitih faktora
Na krajnji zaključak kod testiranja hipoteze utiču:Na krajnji zaključak kod testiranja hipoteze utiču: veličina razlike između srednjih vrednostiveličina razlike između srednjih vrednosti veličina uzorkaveličina uzorka varijacija (veličina standardne devijacije) u uzorkuvarijacija (veličina standardne devijacije) u uzorku
razlika između razlika između srednjih vrednostisrednjih vrednosti
veličina uzorkaveličina uzorka
Sd uzorkaSd uzorka
t-testt-test t t ++
++
2007/200848
Razlika između srednjih vrednostiRazlika između srednjih vrednosti
mala razlika između grupamala razlika između grupaNulta hipoteza se lako dokazujeNulta hipoteza se lako dokazuje
velika razlika između grupavelika razlika između grupaNulta hipoteza se teško dokazujeNulta hipoteza se teško dokazuje
2007/200849
Razlika između srednjih vrednostiRazlika između srednjih vrednosti
Što je razlika između srednjih vrednosti veća to je Što je razlika između srednjih vrednosti veća to je teže dokazati nultu hipotezuteže dokazati nultu hipotezu
Velika razlika između srednjih vrednosti daje Velika razlika između srednjih vrednosti daje veliku vrednost t (veću od kritične vrednosti za veliku vrednost t (veću od kritične vrednosti za izabrani nivo značajnosti)izabrani nivo značajnosti)
2007/200850
Veličina uzorkaVeličina uzorka
mali broj podataka u grupimali broj podataka u grupiNulta hipoteza se lako dokazujeNulta hipoteza se lako dokazuje
veliki broj podataka u grupiveliki broj podataka u grupiNulta hipoteza se teško dokazujeNulta hipoteza se teško dokazuje
2007/200851
Veličina uzorkaVeličina uzorka
Što je uzorak veći to je teže dokazati nultu Što je uzorak veći to je teže dokazati nultu hipotezuhipotezu
Veliki uzorak (veliko N) daje veliku vrednost t Veliki uzorak (veliko N) daje veliku vrednost t (veću od kritične vrednosti za izabrani nivo (veću od kritične vrednosti za izabrani nivo značajnosti)značajnosti)
Što je veća standardna devijacija to je lakše Što je veća standardna devijacija to je lakše dokazati nultu hipotezudokazati nultu hipotezu
Velika standardna devijacija daje malu vrednost t Velika standardna devijacija daje malu vrednost t (manju od kritične vrednosti za izabrani nivo (manju od kritične vrednosti za izabrani nivo značajnosti)značajnosti)
2007/200854
t-Test za razliku izmedju parova vrednostit-Test za razliku izmedju parova vrednosti
N
Sdd
td
N
d
N
xxd
21
1N
dNdSd
22
d
Φ = N - 1Φ = N - 1
N - broj parovaN - broj parova
2007/200855
t-Test za razliku izmedju parova - primert-Test za razliku izmedju parova - primer