Analiza Varijanse i Analiza Kovarijanse
Post on 25-Oct-2014
592 Views
Preview:
Transcript
Analiza varijanse i
analiza kovarijanse
Jelena Marinković, maj 2012.
A šta ćemo danas i narednih dana učiti?
p Koje statističke metode primeniti kada se radi o: n Više od dva uzorka i/ili n Više od dve varijable merene na istim
ispitanicima p Zašto u takvim situacijama višestruko
ponavljanje statističkih testova za dva uzorka nije ispravno?
Kako rešiti ovaj problem? (nastavak)
p Potrebne su neke druge, nove, statističke metode. Prva od njih je:
p Analiza varijanse (analiza varijansnog količnika, ANOVA - ANalysis Of VAriance).
ANOVA Dizajn eksperimenta
Opšte okruženje eksperimenta p Istraživač kontroliše jednu ili više
nezavisnih varijabli n ime im je faktori ili varijable tretmana n svaki faktor ima bar dva nivoa / gradacije,
kategorije, klasifikacije / p Istraživač meri efekte faktora na zavisnoj
varijabli p Eksperimentalni dizajn – plan za testiranje
istraživačke hipoteze
Eksperimentalni dizajn / plan, vrste p Potpuno randomizovani faktorijalni plan
n eksperimentalne jedinice su slučajno birane i randomizovano se dodeljuju tretmanima
p Randomizovani blok dizajn n jedinice se dele u blokove i uparuju se jedinice
u različitim uzorcima p Dizajn ponovljenih merenja
n jedinice se više puta mere
Skala merenja
(samo jedne) rezultujuće varijable
Eksperimentalni dizajni / Istraživački planovi
Faktorijalni eksperiment Randomizovani
potpuni blok dizajn
Dizajn ponovljenih merenja
1 faktor 2 i više faktora 1 faktor i 1 kriterijum
klasifikacije 1 faktor i 1 kriterijum
klasifikacije
Omerna / Intervalna
Jednofaktorska ANOVA
Dvofaktorska i višefaktorske
ANOVE
Dvosmerna ANOVA (ili jednofaktorska
ANOVA sa blokovima)
Jednofaktorska ANOVA sa
ponovljenim merenjima (ili
dvosmerna ANOVA)
Ordinalna Kraskal-Volisova analiza varijanse
sa rangovima
Fridmanova dvosmerna analiza
varijanse sa rangovima
Fridmanova dvosmerna analiza
varijanse sa rangovima
Nominalna
Fišerov varijansni količnik za proporcije
Loglinearni modeli* Kohrejnov Q test Kohrejnov Q test
χ2 test za učestalosti / proporcije
Opšti model analize varijanse p U opštem modelu analize varijanse
odnos variranja uobičajeno se predstavlja sledećim zapisom: Y = X + Z tj. Ukupno variranje (Y) = variranje čiji je izvor u organizovanom delu eksperimenta (X) + variranje čiji je izvor u neorganizovanom delu eksperimenta (Z)
Faktorski varijablitet
grupa 1 grupa 2 grupa 3
x1x
2x3x
Slučajni varijablitet
grupa 1 grupa 2 grupa 3
1x2x
3x
Ukupan varijablitet
grupa 1 grupa 2 grupa 3
x
Šta je ANOVA? p Analiza varijanse (ANOVA) je statistička
metoda zaključivanja zasnovana na generalnim linearnim modelima, koja ukupan varijabilitet skupa podataka deli na bar dve komponente (faktorsku-organizovanu i rezidualnu-slučajnu).
A koje hipoteze testira? p H 0 : µ 1 = µ 2 = ...
= µ k p H 1: sve µ j nisu
jednake.
Tablica sheme rezultata analize varijanse
Izvor variranja Disperzija
Broj stepena slobode
Varijansa F
Između grupa Cx dfx = k-1 sdx
2
Unutar grupa Cz dfz = n-k sdz
2
Opšti Cy dfy = n-1
Višestruka poređenja p Uvek kada analiza varijanse dovede do
odluke o odbacivanju (neprihvatanju) nulte hipoteze postavlja se pitanje koji je par (ili parovi) prosečnih vrednosti značajno različit, odnosno, koju od (u datom primeru 10 mogućih) pojedinačnih hipoteza treba odbaciti.
Metode post hoc testiranja: • Tukey - najbolji balans odnosa greške prvog i
drugog tipa • Scheffe – prikladniji nego Tukey ako se veličine
grupa razlikuju značajno • Dunnett - kada treba porediti nekoliko grupa sa
kontrolnom grupom • Bonferroni – više konzervativan (manja je
verovatnoća da će biti nađena statistička značajnost) u odnosu na Tukey i Scheffe
• Newman-Keuls, Duncan, Fisher’s LSD – ne kotrolišu sveukupno alfa, više liberalni
SAS i DS 2010/2011 Statistika za istraživače
Katedra za medicinsku statistiku i informatiku
Prirodno proširenje ove statističke metode je MANOVA p Više od jedne zavisne varijable p Zavisne varijable bi trebalo da budu povezane
konceptualno p Zavisne varijable bi trebalo da budu slabo do
osrednje statistički povezane (korelisane). Ako između njih ne postoji nikakva povezanost, nema razloga da se one analiziraju zajedno u okviru MANOVA
SAS i DS 2010/2011 Statistika za istraživače
Katedra za medicinsku statistiku i informatiku
ANCOVA Analiza kovarijanse
ANCOVA – analiza kovarijanse p Proverava razlike između aritme0čkih sredina ishodne (rezultujuće, zavisne) varijable dve ili više grupa u situaciji kada znamo da je neka druga – pridružena varijabla (kovarijata) ili više njih povezano sa ishodom.
p Koris0 se da kontroliše kovarijatu, tj. da otkloni efekat pridružene varijable kao izvora mogućeg objašnjenja razlike tretmana.
p Najčešće se koris0 kada grupe nisu formirane randomizacijom, već su formirane same po sebi, npr. pacijen0 koji su primili određeni tretman na osnovu nekog kriterijuma.
Slide 22
Varijanse
Slučajno variranje Faktorsko variranje
Ukupno variranje podataka
SV Kovarijata
Prednosti ANCOVE p Redukuje slučajnu varijansu
n Objašnjavanjem dela slučajnog variranja pridruženom varijablom slučajna varijansa može bi0 redukovana.
p Veća eksperimentalna kontrola: p Kontrolom poznate pridružene varijable s0čemo bolje
objašnjenje o efektu(ima) faktora.
p Sta0s0čki metod za kontrolu inicijalnih razlika varijabli u istraživanju.
Nulta hipoteza u analizi kovarijanse Jednakost prilagođenih aritmetičkih sredina:
H0: µ1* = µ2* = ... = µj* U interpretaciji razmotriti i originalne i
prilagođene aritmetičke sredine.
Prilagođavanje aritmetičkih sredina p Podrazumeva prilagođavanje aritmetičkih
sredina grupa na one vrednosti koje bi inače imale kada bi sve grupe bile jednake na pridruženoj varijabli. Preduslov je jednakost regresionih nagiba za sve grupe
Izbor pridružene vrijable p Svaka varijabla koja je povezana sa zavisnom
varijablom može biti analizirana kao pridružena varijabla
p Ako je u analizu uključeno više od jedne pridružene varijable, poželjno je da povezanost između njih bude slaba, jer tada svaka od njih uklanja relativno različite delove rezidualnog srednjeg kvadrata
Primer p Fieldov (2009) Viagra eksperiment:
n Ishod (ili ZV) = Učesnikov libido n Faktor / Prediktor (ili NV) = Doza vijagre (Placebo, Niska & Visoka)
n Kovarijata = Partnerov libido
Odnosi između NV i kovarijate
Homogenost regresionih nagiba
Dose Par8cipant’s
Libido Partner’s Libido
Placebo 3.22 (1.79) 3.44 (2.07)
Low Dose 4.88 (1.46) 3.12 (1.73)
High Dose 4.85 (2.12) 2.00 (1.63)
Covariate210 bXbbY ii ++=
iii bDosebbLibido Libido sPartner'210 ++=
Slide 31
4.854.883.22
0
1
2
3
4
5
Placebo Low High
1.66
ANCOVA u SPSS-u
Kontrasti
Opcije
Slide 35
Bez u0caja kovarijate
Tests of Between-Subjects Effects
Dependent Variable: Libido
16.844a 2 8.422 2.416 .108535.184 1 535.184 153.522 .00016.844 2 8.422 2.416 .10894.123 27 3.486
683.000 30110.967 29
SourceCorrected ModelInterceptDOSEErrorTotalCorrected Total
Type III Sumof Squares df Mean Square F Sig.
R Squared = .152 (Adjusted R Squared = .089)a.
Slide 36
Izveštaj Levene's Test of Equality of Error Variancesa
Dependent Variable: Libido
5.525 2 27 .010F df1 df2 Sig.
Tests the null hypothesis that the error variance ofthe dependent variable is equal across groups.
Design: Intercept+PARTNER+DOSEa.
Tests of Between-Subjects Effects
Dependent Variable: Libido
34.750a 3 11.583 3.952 .01912.171 1 12.171 4.152 .05217.906 1 17.906 6.109 .02028.337 2 14.169 4.833 .01676.216 26 2.931
683.000 30110.967 29
SourceCorrected ModelInterceptPARTNERDOSEErrorTotalCorrected Total
Type III Sumof Squares df Mean Square F Sig.
R Squared = .313 (Adjusted R Squared = .234)a.
Slide 37
SPSS Output: Contrasts
Slide 38
Output
Slide 39
4.854.883.22
0
1
2
3
4
5
Placebo Low High
3.22
4.88 4.85
Neprilagođene aritme0čke sredine
Glavni efekat
2.934.71
5.15
0
2
4
6
8
10
Placebo Low High
F(2, 26) = 4.14, p < .05
SAS i DS 2010/2011 Statistika za istraživače
Katedra za medicinsku statistiku i informatiku
Prirodno proširenje ove statističke metode je MANCOVA p Dve ili više zavisnih varijabli, jedna ili više
pridruženih varijabli p Pretpostavka je da postoji povezanost
skupa zavisnih varijabli i skupa pridruženih varijabli
SAS i DS 2010/2011 Statistika za istraživače
Katedra za medicinsku statistiku i informatiku
top related