Top Banner
Statistično zaključevanje (inferenčna statistika) = zaključevanje o značilnostih populacije ven
40

Statistično zaključevanje (inferenčna statistika)

Jan 13, 2016

Download

Documents

Inga

Statistično zaključevanje (inferenčna statistika). = zaključevanje o značilnostih populacije. ven. Inferenčna statistika. Izberemo vzorec. Določimo statistiko (npr. M ). Posplošujemo z vzorca na populacijo. ocenjevanje parametra Vprašanje: Kolikšen je parameter ( m ) v populaciji? - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Statistično zaključevanje (inferenčna statistika)

Statistično zaključevanje

(inferenčna statistika)

= zaključevanje o značilnostih populacije

ven

Page 2: Statistično zaključevanje (inferenčna statistika)

Inferenčna statistika

Izberemo vzorec. Določimo statistiko (npr. M).Posplošujemo z vzorca na populacijo.

• ocenjevanje parametraVprašanje: Kolikšen je parameter () v populaciji?

• testiranje hipotezVprašanje: Ali je M pomembno različna od neke vrednosti?

ven

Page 3: Statistično zaključevanje (inferenčna statistika)

Populacija in vzorec

• posploševanje z vzorca na populacijo • opredelitev populacije in vzorca

sestavljanje liste, s katere vzorčimo

• reprezentativnost, nepristranskost vzorec ima podobne lastnosti kot populacija (enakost deležev)

• velikost vzorca ekonomičen N, dopustna napaka vzorčenja, variabilnost pojava, pričakovana razlika, določitev N iz enačb za testiranje hipotez

ven

Page 4: Statistično zaključevanje (inferenčna statistika)

Vzorčne porazdelitve

ven

Page 5: Statistično zaključevanje (inferenčna statistika)

Vzorčne porazdelitve

ven

Page 6: Statistično zaključevanje (inferenčna statistika)

Vzorčne porazdelitve

• Če iz definirane populacije izberemo vse možne vzorce velikosti N, lahko za vsak vzorec določimo statistike (npr. M, SD). Statistike se od vzorca do vzorca spreminjajo.

vzorčne porazdelitve statistik – opisnih statistik vzorca, npr. M, var, p, r…– drugih izrazov, npr.

• Vsako vzorčno porazdelitev lahko opišemo: Mstatistike SD = SEstatistike

21

21

MMSE

MM

ven

Page 7: Statistično zaključevanje (inferenčna statistika)

Vzorčne porazdelitve

Mstatistike

SEstatistike

M

SD

frekvenčna porazdelitev spremenljivke

vzorčna porazdelitev statistike

Vzorčne porazdelitve različnih statistik se razlikujejo:normalna, F, t, 2

ven

Page 8: Statistično zaključevanje (inferenčna statistika)

Vzorčne porazdelitve

Mstatistike

SEstatistike

M

SD

frekvenčna porazdelitev spremenljivke

vzorčna porazdelitev statistikeza manjše /večje vzorce

Če je vzorec velik, bo statistika vzorca bolj podobna parametru. Razpršenost vzorčne porazdelitve se z večanjem vzorca manjša.

ven

Page 9: Statistično zaključevanje (inferenčna statistika)

NSEMX

'

Standardna napaka M

SEM = standardni odklon vzorčnih aritmetičnih sredin

Standardna napaka

Standardna napaka se z večanjem vzorca manjša.

ven

Page 10: Statistično zaključevanje (inferenčna statistika)

Vzorčna statistika je ocena populacijskega parametra.

Točkovna ocena parametra

• Nepristranska ocena: Sredina vzorčne porazdelitve statistike je enaka ocenjevanemu parametru. Velja za vse mere centralne tendence, deleže, korelacijske koeficiente.

• Pristranska ocena: Mere razpršenosti.Vzorčna SD podcenjuje vrednost .

1

2

2'

2

2

N

XX

N

XXSD

Ocenjevanje parametra

ven

Page 11: Statistično zaključevanje (inferenčna statistika)

Ocenjevanje parametra

Intervalna ocena parametra

razpon vrednosti, znotraj katerega se bo populacijski parameter nahajal z določeno verjetnostjo B

= B-odstotni interval zaupanja

ven

Page 12: Statistično zaključevanje (inferenčna statistika)

Ocenjevanje parametra

Mp SEz

Intervalno ocenjevanje Mpri velikih vzorcih

SEM

vzorčna porazdelitev M je N.D.

M

0

1N (0,1)

Mp SE

Mz

z

Page 13: Statistično zaključevanje (inferenčna statistika)

sp zg

p / 2 / 2

1 -

SEM

vzorčna porazdelitev M

/ 2

M

kk SE

z

vzorčna porazdelitev z

zsp zzg

p / 2

1 -

SDz = 1

z = 0

SDz · zp

SEM · zp

M

zgzg

Mzgzg

SEz

SEz

grafični prikaz kvantilov

ven

Page 14: Statistično zaključevanje (inferenčna statistika)

Ocenjevanje parametra

Pri majhnih vzorcih

SEM

Vzorčna porazdelitev M je N.D. le, če je frekvenčna porazdelitev spremenljivke normalna.

preveriti

Vrednost SEM se spreminja z velikostjo vzorca. Vzorčna porazdelitev je odvisna odstopenj prostosti.

0

1

Mp SE

Mt

Mp SEtM Interval zaupanja za

df = N - 1

Page 15: Statistično zaključevanje (inferenčna statistika)

• Postavimo dve nasprotni si hipotezi (ničelno in alternativno).

H0: V našem vzorcu je povprečni IQ enak 100 (oz. naš vzorec izhaja iz populacije, kjer je povprečni IQ enak 100; M = 100).

H1: V našem vzorcu je povprečni IQ različen od 100.(oz. naš vzorec ne izhaja iz populacije, kjer je povprečni IQ enak 100; M 100).

• Konstruiramo vzorčno porazdelitev (pod predpostavko pravilnosti ničelne hipoteze).

Testiranje hipotez

100

SE

odvisna od velikosti vzorca

odvisna odrazpršenosti v populaciji

Page 16: Statistično zaključevanje (inferenčna statistika)

Če je vrednost statistike verjetna (znotraj intervala zaupanja), ohranimo ničelno hipotezo.

Testiranje hipotez

Če je vrednost višja/nižja od zgornje/spodnje meje intervala zaupanja (pade v kritično regijo), ničelno hipotezo zavrnemo. (Pravilnost ničelne hipoteze je malo verjetna. Alternativna hipoteza je verjetnejša. Statistika našega vzorca se od poznanega / predpostavljenega parametra

pomembno razlikuje.)

Na osnovi vzorčne porazdelitve poznamo verjetnost pojavljanja določene vrednosti statistike.

100

SE

M 100

SE

M

Page 17: Statistično zaključevanje (inferenčna statistika)

Napake pri statističnem zaključevanju

= 0M =

0M

dejanskostanje

naš zaključek

pravilna potrditev ničelne hipoteze

napaka

pravilna zavrnitev ničelne hipoteze

napaka

0M

= 0M =

Page 18: Statistično zaključevanje (inferenčna statistika)

zkrit.

Napake pri statističnem zaključevanju

zzkrit.

napaka

napaka

zkrit.zzkrit.

Mp SE

Mz

ven

Page 19: Statistično zaključevanje (inferenčna statistika)

• primerjava vzorca s populacijo (primerjava vzorčne statistike s poznano ali predpostavljeno vrednostjo parametra)

• primerjava statistik dveh vzorcev• primerjava statistik več vzorcev

Ali so vrednosti preveč različne?Ali vzorci pripadajo isti populaciji?

Raziskovalni načrti z 1 NV in 1 OV

ven

Page 20: Statistično zaključevanje (inferenčna statistika)

Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo

SEM

M

H0: M = H1: M

0

1

z

Mp SE

Mt

t primerjamo s tkrit tkrit.tkrit.

Page 21: Statistično zaključevanje (inferenčna statistika)

Testiranje hipotez o povprečju: primerjava povprečja vzorca z znano vrednostjo

H0: M = 6.0H1: M

Študenti v povprečju na nekem testu dosegajo rezultat 6.0,rezultati testa v naši skupini pa so bili naslednji:9 7 4 11 10 8 7 10 7 4 7 10 8 10 6 8 10 7 8 9

Vprašanje: Ali je naša skupina običajna skupina študentov ali morda ne? Ali je povprečje našega vzorca enako 6.0?

Če bi bila ničelna hipoteza pravilna (če bi vzorčili iz populacije s sredino 6.0), bi vrednosti t v 5 % vzorcev presegale 2.09. Verjetnost pojavljanja t vrednosti 4.60 zaradi napake vzorčenja bi bila zelo majhna, manjša od 5 %. Večja verjetnost je, da vrednost našega vzorca ni posledica napake vzorčenja, temveč da naš vzorec pripada neki drugi populaciji. Ničelno hipotezo zavrnemo, sprejmemo alternativno. Povprečje našega vzorca statistično pomembno odstopa od 6.0.

M = 8.0’ = 1.95SEM = 1.95 / Sqrt(20) = 0.44t = (8.0 - 6.0) / 0.44 = 4.60df = N - 1 = 19tkrit (19) = 2.09t > tkrit

0.44

8.0 --- t = 4.6

Page 22: Statistično zaključevanje (inferenčna statistika)

t-test

Ali oba vzorca izhajata iz iste populacije?Je razlika med njunimi M ničelna? Ima NV vpliv na OV?

Primerjava povprečij dveh vzorcev

Page 23: Statistično zaključevanje (inferenčna statistika)

SE SE SEn nX X X X1 2 1 2

2 2 12

1

22

2

21

21

XXSE

XXt

Pr.1 S1 S2 7.0 7.514.0 5.010.0 5.011.0 6.0 8.5 1.0 5.0 6.0 4.5 9.011.0 3.0 9.0 6.010.0 7.0

M 9.00 5.55’ 2.90 2.27var’ 8.41 5.15

t = (9.00-5.55) / 1.16 = 2.97df = 10+10-2 = 18; t.05(18) = 2.101

Primer t testa dva neodvisna vzorca

Naša vzorca se razlikujeta za 3.45, medtem ko je variabilnost vrednosti znotraj vsakega vzorca sorazmerno majhna. Razlika med vzorcema je v primerjavi z razlikami med osebami znotraj vzorcev precejšnja. S t-testom ugotovimo, ali je razlika med sredinama obeh vzorcev tudi statistično pomembna. Če bi neštetokrat vzorčili po dva vzorca iz iste populacije, bi pri 5% primerov vzorčenj vrednost t-testa presegla kritično vrednost 2.101. Naš dobljeni t znaša 2.97 in je višji od kritične vrednosti. To pomeni, da bi v manj kot 5% primerov vzorčenj iz iste populacije potegnili dva tako različna vzorca, kot sta naša. Ker je naša dobljena vrednost t višja od kritične, zaključujemo, da je verjetnost, da smo oba vzorca potegnili iz iste populacije, premajhna. Najverjetneje vzorca izhajata iz dveh različnih populacij. Zaključimo, da se aritmetični sredini pri naših vzorcih statistično pomembno razlikujeta, oz. da je S1 dosegala statistično pomembno drugačne rezultate od S2. Neodvisna spremenljivka (to, iz katere skupine držav je učenec) je imela učinek na merjeno odvisno spremenljivko (znanje slovenščine).

kritični t

1.16 10

272.2

10

2.902 SEd

Vprašanje:Ali se študenti iz EU po znanju slovenščine razlikujejo od študentov iz drugih držav?

Page 24: Statistično zaključevanje (inferenčna statistika)

Analiza variance

• preverjamo pomembnost razlik med sredinami več vzorcev

• meritve v več pogojih (oz. vzorčenje iz več populacij)

• H0: ni razlik med njihovimi

Primerjava povprečij več vzorcev

ven

Page 25: Statistično zaključevanje (inferenčna statistika)

Analiza variance

• preverjamo pomembnost razlik med sredinami več vzorcev

• meritve v več pogojih (oz. vzorčenje iz več populacij)

• H0: ni razlik med njihovimi

skupinznotrajostiabi

skupinamimedostiabiF

__lnvar

__lnvar

ven

Page 26: Statistično zaključevanje (inferenčna statistika)

Analiza variance

Ocena variance

Skupno varianco vseh podatkov lahko razstavimo na dva dela:• varianco napake, ki je posledica:

– napak merjenja (slabih merskih instrumentov), – napak kontrole (zunanjih spremenljivk), – razlik med posamezniki

• varianco, nastalo zaradi učinkov neodvisne spremenljivke

2

2

1

X X

N

vsota kvadratov odklonov (SS)

df

Page 27: Statistično zaključevanje (inferenčna statistika)

Analizavariance

totjjijtotij MMMYMY

Mtot Mj Yi

222totjjijtotij MMMYMY

skupna variabilnost

variabilnostznotraj skupin

variabilnostmed skupinami

1

a

SS

df

SSMS med

med

medmed 1

na

SS

df

SSMS zn

zn

znzn

zn

med

MS

MSF

Page 28: Statistično zaključevanje (inferenčna statistika)

2 3 4 5 6 7 8 9 10 11 12MT = 7

SSznotraj-1 = 1(2-4)2 + 2(3-4)2 + 3(4-4)2 + 2(5-4)2 + 1(6-4)2 =12SSznotraj-2 = 1(8-10)2 + 2(9-10)2 + 3(10-10)2 + 2(11-10)2 + 1(12-10)2 =12

SSmed = 9(4-7)2 + 9(10-7)2 = 81 + 81 = 162

dfznotraj = N - a = 18 - 2 = 16 dfmed = a - 1 = 2 - 1 = 1

MSznotraj = SSznotraj / dfznotraj = 24 / 16 = 1.5MSmed = SSmed / dfmed = 162 / 1 = 162F = 162 /1.5 = 108Ft (1,16) = 4.49

Primer analize variance za dva vzorca

ven

Page 29: Statistično zaključevanje (inferenčna statistika)

Tabela povzetka analize variance

izvor variabilnost SS df MS F p

NV 162 1 162.0 108 < .001

napaka 24 16 1.5

skupaj 186 89

Skupina 1 (M = 4.0, SD = 1.2) je dosegla statistično pomembno drugačne rezultate od skupine 2 (M = 10.0, SD = 1.2), F (1, 16) = 108, p < .001.

Primer analize variance za dva vzorca

t-test ven

Page 30: Statistično zaključevanje (inferenčna statistika)

Analiza variance

• neponovljene in ponovljene meritve• pogoji:

– nominalna NV– OV na vsaj intervalni merski ravni– normalna porazdelitev spremenljivke v populaciji– enakost varianc vzorcev

• analiza variance za več NV– dvosmerna, trismerna ANOVA– glavni učinki + interakcija med NV

ven

Page 31: Statistično zaključevanje (inferenčna statistika)

Statistično zaključevanje za frekvence

• Opis: tabele, frekvenčni poligoni, histogrami

• Običajna vprašanja:- enakost deležev kategorij pri več vzorcih- ujemanje dejanskih podatkov s pričakovanimi, testiranje hipotez o obliki porazdelitve - povezanost (interakcija) med dvema nominalnima spremenljivkama

ven

Page 32: Statistično zaključevanje (inferenčna statistika)

2 test za eno spremenljivko

• Ali je višja pogostost ene kategorije slučajna?• pričakovane frekvence

• H0: Populacijska frekvenčna distribucija je enaka pričakovani.

• odstopanje dejanskih od pričakovanih vrednosti

… Pearsonov 2 - približek 2 distribucije

df = a - 1

2

2

f f

fe t

t

ven

Page 33: Statistično zaključevanje (inferenčna statistika)

Primer 2 testa za preverjanje pravokotnosti porazdelitve (= enakosti deleža oseb v vseh kategorijah)

Delež izbir napačnih alternativ na vprašanju zaprtega tipa: a) b) c)

fe 30 40 80 skupaj 150dejanski delež 0.20 0.27 0.53

ft 50 50 50teoretični delež 0.33 0.33 0.33

2(2) = (30-50)2/50 + (40-50)2/50 + (80-50)2/50 = 28kritična vrednost 2 pri 5% tveganju: 5.99

Naš dobljeni 2 presega kritično vrednost. Če bi neštetokrat vzorčili iz populacije, kjer osebe enakovredno izbirajo napačne alternative (kjer je delež izbire vseh alternativ enak, in sicer 0.33), bi kritično vrednost 2 po slučaju preseglo le 5 % vzorcev. Ker so bili deleži v našem vzorcu zelo različni od teoretičnega deleža 0.33 in je zato 2 pri našem vzorcu zelo presegel kritično vrednost, ni preveč verjetno, da smo ga potegnili iz populacije, kjer osebe enako pogosto izbirajo vse tri alternative. Bolj verjetno kot to je, da smo ga povlekli iz populacije, kjer osebe različne alternative izbirajo različno pogosto. Zaključimo torej, da alternativni odgovori niso enako privlačni.

ven

Page 34: Statistično zaključevanje (inferenčna statistika)

2 test odvisnosti dveh spremenljivk

• kontingenčna tabela• H0: Vpliv ene spremenljivke ni odvisen od druge spremenljivke (na vseh

ravneh ene spremenljivke so ravni druge enako izražene).• pričakovana frekvenca ft = fvrsta fstolpec / N• v vsakem polju izračunamo

• seštejemo izračune v vseh poljih, dobimo 2

• Dobljeno vrednost primerjamo s kritično vrednostjo 2 df = (število vrstic - 1) (število stolpcev - 1)

t

te

f

ff 2

ven

Page 35: Statistično zaključevanje (inferenčna statistika)

uspešnost pri nalogi 1+ -

ženske 36 14 50(29) (21)

moški 22 28 50(29) (21)

58 42 100

2 = (36-29)2/29 + (14-21)2/21 + (22-29)2/29 + (28-21)2/21 = 8.05df = (število vrstic - 1) ·(število stolpcev - 1) = (2-1)(2-1) = 1kritična vrednost:2

.05 (1) = 3.841

Naš dobljeni 2 je višji od kritične vrednosti, kar pomeni, da je rezultat statistično pomemben. Če bi naš vzorec izhajal iz populacije, kjer se moški in ženske ne bi razlikovali v uspešnosti pri nalogi, bi v manj kot 5% vzorcev dejanske frekvence tako zelo odstopale od teoretičnih. To pomeni, da je bolj kot to, da smo vzorec vlekli iz populacije, kjer oba spola enako pogosto pravilno odgovorita, verjetno, da smo vzorec vlekli iz populacije, v kateri se ženske in moški razlikujejo v uspešnosti reševanja naloge. Zaključimo, da so ženske pri reševanju naloge statistično pomembno bolj uspešne kot moški.

robna vsota frekvenc

V oklepajih so navedene teoretične frekvence.

robna vsotafrekvenc

število vseh oseb

Page 36: Statistično zaključevanje (inferenčna statistika)

Previdnost!

• Interpretacija izsledka naj upošteva značilnosti raziskovalnega načrta.

• Statistična pomembnost je relativen pojem. Raste z velikostjo vzorca.

------- Pregledati velikost učinka• Ni statistično pomembno = ni dokazano.

Če ničelne hipoteze ne zavrnemo, to še ne pomeni, da je pravilna. Pri opazovanem pojavu ni bilo tako izrazitega učinka NV, da bi ga zaznali, kar ne pomeni, da zagotovo ne obstaja.

• V nekaterih primerih parametričnih testov ne moremo uporabiti.

ven

Page 37: Statistično zaključevanje (inferenčna statistika)

Izbor ustreznega statističnega testa

• vrsta statistike

• raven merjenja

• normalnost porazdelitve

• enakost varianc

• odvisni / neodvisni vzorci

• majhni / veliki vzorci

• vrednost ničelne hipoteze

• nivo tveganja

• enosmerno / dvosmerno testiranje

Neparametrični testi• pogosto pri majhnih vzorcih, pri

omejenosti razpona, stališča (U-porazdelitev)

• Pri intervalnih ali razmernostnih spremenljivkah z neparametričnimi testi ne upoštevamo vseh informacij - nižja moč testa (ničelno hipotezo, ki je napačna, težje ovržemo).

ven

Page 38: Statistično zaključevanje (inferenčna statistika)

Testiranje hipotez o povprečju

Povprečja

N.D.parametrični testi

1 vzorec 2 vzorca

neodvisna odvisna

t test(independent)

t test(paired-samples)

t test(one-sample)

več vzorcev

neodvisnih odvisnih

enosmerna ANOVA(GLM - univariate)

enosmerna ANOVA(GLM - repeated-measures) ven

Page 39: Statistično zaključevanje (inferenčna statistika)

Testiranje hipotez o povprečju

Povprečja

ni N.D.neparametrični testi

1 vzorec 2 vzorca

neodvisna odvisna

- Mann- Whitneyev U- medianski test

- Wilcoxonov T test (matched pairs)

- test predznakov

binomski test

več vzorcev

neodvisnih odvisnih

- Kruskal- Wallisov H- razširjeni medianski test

Friedmanovtest

ven

Page 40: Statistično zaključevanje (inferenčna statistika)

Osnovna literatura

• Ferguson, G. A. (1998). Statistical analysis in psychology and education (3.izd.). New York: McGraw-Hill.

• Graveter, F.J., in Wallnau, L.B. (2000). Statistics for the Behavioral Sciences (5.izd.). Belmont, CA: Wadsworth/Thomson Learning.

• Pagano, R.R. (2001). Understanding Statistics in the Behavioral Sciences (6.izd.). Belmont, CA: Wadsworth/Thomson Learning.

• Petz, B. (1997). Osnovne statističke metode za nematematičare (3. izd.). Jastrebarsko: Naklada Slap.

• Spatz, C. (2001). Basic Statistics (7.izd.). Belmont, CA: Wadsworth/Thomson Learning.

• Spiegel, M. R. (1991). Theory and problems of statistics (2. izd.). New York: McGraw - Hill.

ven