Analiza Varijanse i Analiza Kovarijanse

Post on 25-Oct-2014

592 Views

Category:

Documents

6 Downloads

Preview:

Click to see full reader

Transcript

Analiza varijanse i

analiza kovarijanse

Jelena Marinković, maj 2012.

A šta ćemo danas i narednih dana učiti?

p Koje statističke metode primeniti kada se radi o: n  Više od dva uzorka i/ili n  Više od dve varijable merene na istim

ispitanicima p Zašto u takvim situacijama višestruko

ponavljanje statističkih testova za dva uzorka nije ispravno?

Kako rešiti ovaj problem? (nastavak)

p  Potrebne su neke druge, nove, statističke metode. Prva od njih je:

p Analiza varijanse (analiza varijansnog količnika, ANOVA - ANalysis Of VAriance).

ANOVA Dizajn eksperimenta

Opšte okruženje eksperimenta p  Istraživač kontroliše jednu ili više

nezavisnih varijabli n  ime im je faktori ili varijable tretmana n  svaki faktor ima bar dva nivoa / gradacije,

kategorije, klasifikacije / p  Istraživač meri efekte faktora na zavisnoj

varijabli p  Eksperimentalni dizajn – plan za testiranje

istraživačke hipoteze

Eksperimentalni dizajn / plan, vrste p  Potpuno randomizovani faktorijalni plan

n  eksperimentalne jedinice su slučajno birane i randomizovano se dodeljuju tretmanima

p Randomizovani blok dizajn n  jedinice se dele u blokove i uparuju se jedinice

u različitim uzorcima p Dizajn ponovljenih merenja

n  jedinice se više puta mere

Skala merenja

(samo jedne) rezultujuće varijable

Eksperimentalni dizajni / Istraživački planovi

Faktorijalni eksperiment Randomizovani

potpuni blok dizajn

Dizajn ponovljenih merenja

1 faktor 2 i više faktora 1 faktor i 1 kriterijum

klasifikacije 1 faktor i 1 kriterijum

klasifikacije

Omerna / Intervalna

Jednofaktorska ANOVA

Dvofaktorska i višefaktorske

ANOVE

Dvosmerna ANOVA (ili jednofaktorska

ANOVA sa blokovima)

Jednofaktorska ANOVA sa

ponovljenim merenjima (ili

dvosmerna ANOVA)

Ordinalna Kraskal-Volisova analiza varijanse

sa rangovima

Fridmanova dvosmerna analiza

varijanse sa rangovima

Fridmanova dvosmerna analiza

varijanse sa rangovima

Nominalna

Fišerov varijansni količnik za proporcije

Loglinearni modeli* Kohrejnov Q test Kohrejnov Q test

χ2 test za učestalosti / proporcije

Opšti model analize varijanse p U opštem modelu analize varijanse

odnos variranja uobičajeno se predstavlja sledećim zapisom: Y = X + Z tj. Ukupno variranje (Y) = variranje čiji je izvor u organizovanom delu eksperimenta (X) + variranje čiji je izvor u neorganizovanom delu eksperimenta (Z)

Faktorski varijablitet

grupa 1 grupa 2 grupa 3

x1x

2x3x

Slučajni varijablitet

grupa 1 grupa 2 grupa 3

1x2x

3x

Ukupan varijablitet

grupa 1 grupa 2 grupa 3

x

Šta je ANOVA? p Analiza varijanse (ANOVA) je statistička

metoda zaključivanja zasnovana na generalnim linearnim modelima, koja ukupan varijabilitet skupa podataka deli na bar dve komponente (faktorsku-organizovanu i rezidualnu-slučajnu).

A koje hipoteze testira? p H 0 : µ 1 = µ 2 = ...

= µ k p H 1: sve µ j nisu

jednake.

Tablica sheme rezultata analize varijanse

Izvor variranja Disperzija

Broj stepena slobode

Varijansa F

Između grupa Cx dfx = k-1 sdx

2

Unutar grupa Cz dfz = n-k sdz

2

Opšti Cy dfy = n-1

Višestruka poređenja p Uvek kada analiza varijanse dovede do

odluke o odbacivanju (neprihvatanju) nulte hipoteze postavlja se pitanje koji je par (ili parovi) prosečnih vrednosti značajno različit, odnosno, koju od (u datom primeru 10 mogućih) pojedinačnih hipoteza treba odbaciti.

Metode post hoc testiranja: •  Tukey - najbolji balans odnosa greške prvog i

drugog tipa •  Scheffe – prikladniji nego Tukey ako se veličine

grupa razlikuju značajno •  Dunnett - kada treba porediti nekoliko grupa sa

kontrolnom grupom •  Bonferroni – više konzervativan (manja je

verovatnoća da će biti nađena statistička značajnost) u odnosu na Tukey i Scheffe

•  Newman-Keuls, Duncan, Fisher’s LSD – ne kotrolišu sveukupno alfa, više liberalni

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku

Prirodno proširenje ove statističke metode je MANOVA p  Više od jedne zavisne varijable p  Zavisne varijable bi trebalo da budu povezane

konceptualno p  Zavisne varijable bi trebalo da budu slabo do

osrednje statistički povezane (korelisane). Ako između njih ne postoji nikakva povezanost, nema razloga da se one analiziraju zajedno u okviru MANOVA

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku

ANCOVA Analiza kovarijanse

ANCOVA – analiza kovarijanse p  Proverava  razlike  između  aritme0čkih  sredina  ishodne  (rezultujuće,  zavisne)  varijable  dve  ili  više  grupa  u  situaciji  kada  znamo  da  je  neka  druga  –  pridružena  varijabla  (kovarijata)  ili  više  njih  povezano  sa  ishodom.    

p  Koris0  se  da  kontroliše  kovarijatu,  tj.  da  otkloni  efekat  pridružene  varijable  kao  izvora  mogućeg  objašnjenja  razlike  tretmana.  

p Najčešće  se  koris0  kada  grupe  nisu  formirane  randomizacijom,  već  su  formirane  same  po  sebi,  npr.  pacijen0  koji  su  primili  određeni  tretman  na  osnovu  nekog  kriterijuma.      

Slide  22  

Varijanse  

Slučajno  variranje Faktorsko  variranje

Ukupno  variranje  podataka

SV Kovarijata  

Prednosti ANCOVE p  Redukuje  slučajnu  varijansu  

n  Objašnjavanjem  dela  slučajnog  variranja  pridruženom  varijablom  slučajna  varijansa  može  bi0  redukovana.  

p  Veća  eksperimentalna  kontrola:  p  Kontrolom  poznate  pridružene  varijable  s0čemo  bolje  

objašnjenje  o  efektu(ima)  faktora.  

p  Sta0s0čki  metod  za  kontrolu  inicijalnih  razlika  varijabli  u  istraživanju.  

Nulta hipoteza u analizi kovarijanse Jednakost prilagođenih aritmetičkih sredina:

H0: µ1* = µ2* = ... = µj* U interpretaciji razmotriti i originalne i

prilagođene aritmetičke sredine.

Prilagođavanje aritmetičkih sredina p  Podrazumeva prilagođavanje aritmetičkih

sredina grupa na one vrednosti koje bi inače imale kada bi sve grupe bile jednake na pridruženoj varijabli. Preduslov je jednakost regresionih nagiba za sve grupe

Izbor pridružene vrijable p Svaka varijabla koja je povezana sa zavisnom

varijablom može biti analizirana kao pridružena varijabla

p Ako je u analizu uključeno više od jedne pridružene varijable, poželjno je da povezanost između njih bude slaba, jer tada svaka od njih uklanja relativno različite delove rezidualnog srednjeg kvadrata

Primer p  Fieldov  (2009)  Viagra  eksperiment:  

n  Ishod  (ili  ZV)  =  Učesnikov  libido  n  Faktor  /  Prediktor  (ili  NV)  =  Doza  vijagre  (Placebo,  Niska  &  Visoka)  

n  Kovarijata  =  Partnerov  libido

Odnosi između NV i kovarijate

Homogenost regresionih nagiba

Dose Par8cipant’s  

Libido Partner’s  Libido

Placebo 3.22  (1.79) 3.44  (2.07)

Low  Dose 4.88  (1.46) 3.12  (1.73)

High  Dose 4.85  (2.12) 2.00  (1.63)

Covariate210 bXbbY ii ++=

iii bDosebbLibido Libido sPartner'210 ++=

Slide  31  

4.854.883.22

0

1

2

3

4

5

Placebo Low High

1.66

ANCOVA u SPSS-u

Kontrasti

Opcije

Slide  35  

Bez  u0caja  kovarijate  

Tests of Between-Subjects Effects

Dependent Variable: Libido

16.844a 2 8.422 2.416 .108535.184 1 535.184 153.522 .00016.844 2 8.422 2.416 .10894.123 27 3.486

683.000 30110.967 29

SourceCorrected ModelInterceptDOSEErrorTotalCorrected Total

Type III Sumof Squares df Mean Square F Sig.

R Squared = .152 (Adjusted R Squared = .089)a.

Slide  36  

Izveštaj  Levene's Test of Equality of Error Variancesa

Dependent Variable: Libido

5.525 2 27 .010F df1 df2 Sig.

Tests the null hypothesis that the error variance ofthe dependent variable is equal across groups.

Design: Intercept+PARTNER+DOSEa.

Tests of Between-Subjects Effects

Dependent Variable: Libido

34.750a 3 11.583 3.952 .01912.171 1 12.171 4.152 .05217.906 1 17.906 6.109 .02028.337 2 14.169 4.833 .01676.216 26 2.931

683.000 30110.967 29

SourceCorrected ModelInterceptPARTNERDOSEErrorTotalCorrected Total

Type III Sumof Squares df Mean Square F Sig.

R Squared = .313 (Adjusted R Squared = .234)a.

Slide  37  

SPSS  Output:  Contrasts  

Slide  38  

Output  

Slide  39  

4.854.883.22

0

1

2

3

4

5

Placebo Low High

3.22

4.88   4.85  

Neprilagođene  aritme0čke  sredine

Glavni  efekat  

2.934.71

5.15

0

2

4

6

8

10

Placebo Low High

F(2, 26) = 4.14, p < .05

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku

Prirodno proširenje ove statističke metode je MANCOVA p Dve ili više zavisnih varijabli, jedna ili više

pridruženih varijabli p  Pretpostavka je da postoji povezanost

skupa zavisnih varijabli i skupa pridruženih varijabli

SAS i DS 2010/2011 Statistika za istraživače

Katedra za medicinsku statistiku i informatiku

top related