Top Banner
FILOZOFIJA STATISTIKE Prof. dr. Davor Eterović EBM-2011/Klinička biostatistika
41

FILOZOFIJA STATISTIKE

Feb 07, 2016

Download

Documents

Greta*

FILOZOFIJA STATISTIKE. Prof. dr. Davor Eterović EBM-2011/Klinička biostatistika. UZORAK I POPULACIJA. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: FILOZOFIJA STATISTIKE

FILOZOFIJA STATISTIKE

Prof. dr. Davor Eterović EBM-2011/Klinička biostatistika

Page 2: FILOZOFIJA STATISTIKE

UZORAK I POPULACIJA

Page 3: FILOZOFIJA STATISTIKE

Populacija je veliki skup jedinki određenog istog svojstva (npr. sve Splićanke). Ali, druga se svojstva individualno razlikuju, tj. imaju svoje distribucije (dob, visina, masa, bračni status, zanimanje, naobrazba, genotip, krvna slika).

Kada uspoređujemo dvije populacije (npr. Splićanke i Kaštelanke), one se razlikuju u osnovnom obilježju (prebivalište), dok im se distribucije ostalih svojstava mogu, ali ne moraju bitno razlikovati (npr. vjerojatno Splićanke nisu prosječno više od Kaštelanki, ali je moguće da se manje bave poljoprivredom).

Page 4: FILOZOFIJA STATISTIKE

Populacije možemo uspoređivati u cijelosti (rijetko) ili na temelju uzoraka (češće).

Uzorak: Dio (podskup) populacije (npr. Splićanke koje stanuju u Varošu su uzorak iz populacije svih

Splićanki).

Page 5: FILOZOFIJA STATISTIKE

Uzorak je reprezentativan za populaciju iz koje potiče ako su njegova prosječna svojstva (točnije: distribucije svojstava) uglavnom slična prosječnim svojstvima (njihovim distribucijama) matične populacije.

Page 6: FILOZOFIJA STATISTIKE

Npr. Varošanke se vjerojatno ne razlikuju od prosječnih Splićanki u mnogim svojstvima, ali je za pretpostaviti da su im roditelji nešto češće rođeni Splićani.

Također, stanovnici Meja (i Bačvica) vjerojatno nisu reprezentativan uzorak Splićana, ako je ispitivano obilježje imovinski status, ali to mogu biti u slučaju tjelesne visine.

Page 7: FILOZOFIJA STATISTIKE

ZAŠTO UZIMAMO UZORKE:

Cijele su populacije najčešće nedostupne (npr. u bolnici su u određenom vremenu samo neki srčani bolesnici, a ne svi iz tog grada), ili su prevelike za analizu (predugo, preskupo).

Page 8: FILOZOFIJA STATISTIKE

Ako populacije uspoređujemo na temelju uzoraka, osnovni je preduvjet pouzdanosti zaključaka da su uzorci reprezentativni za populacije iz kojih potiču, posebno glede ispitivanog obilježja.

Page 9: FILOZOFIJA STATISTIKE

Ako npr. uspoređujemo Splićanke i Omišanke, tada je slučajni uzorak od 120 Varošanki vjerojatno reprezentativan za populaciju Splićanki ako se uspoređuje tjelesna visina, ali nije reprezentativan ako se Splićanke i Omišanke uspoređuju glede porijekla roditelja.

Page 10: FILOZOFIJA STATISTIKE

Ako uzorak ne možemo birati (npr. bolesnici koji su momentalno dostupni), njegovu reprezentativnost možemo samo procjenjivati, ali na nju ne možemo utjecati.

Ako uzorak biramo, najbolja je metoda slučajnog izbora.

Page 11: FILOZOFIJA STATISTIKE

Slučajni izbor ili randomizirano uzorkovanje (engl. random sampling): svaka jedinka iz populacije ima jednaku šansu biti izabrana u uzorak.

Metoda slučajnog izbora osigurava reprezentativan uzorak tim sigurnije što je broj jedinki uzorka (N) veći.

Page 12: FILOZOFIJA STATISTIKE

ŠTO JE ZAJEDNIČKO STATISTIČKIM ANALIZAMA

Page 13: FILOZOFIJA STATISTIKE

1. Zanima nas samo uzorak, ne cijela populacije (npr. mene zanima vaša matematička izobrazba, jer ovu skriptu pravim za vas.

2. Ispitujemo cijelu populaciju (jednu ili više njih).

3. Zaključujemo iz uzorka (uzoraka) na populaciju (populacije).

Tri su različite mogućnosti:

1. i 2. je jednostavno, statistika u užem smislu se bavi s 3.

Page 14: FILOZOFIJA STATISTIKE

Statističke metode (u slučaju 3.) koriste se u svrhu:

PROCJENE POUZDANOSTI ZAKLJUČIVANJA NA TEMELJU UZORAKA IZ POPULACIJA

Tri su osnovne namjene statističkih metoda:

Page 15: FILOZOFIJA STATISTIKE

1. testiraju hipoteze (pretpostavke) o različitosti populacija glede nekog svojstva. Primjer je pretpostavka da su muškarci viši od žena, ili da češće dobivaju rak pluća.

2. procjenjuju intenzitet povezanosti između dvije kategorijske varijable. Primjer je koliko češće pušači dobivaju rak pluća nego nepušači.

3. procjenjuju mogućnost predviđanja jednog svojstva (npr. preživljenje infarkata srca) iz jednog ili više drugih svojstava (dob, spol, veličina infarkta) iste populacije.

Page 16: FILOZOFIJA STATISTIKE

Ovisno o vrsti ispitivanog svojstva statističke metode koje testiraju hipoteze dijelimo na: metode koje uspoređuju metričke varijable (npr. t-test) imetode procjenjuju povezanosti kategorijskih varijabli (npr. test), dok su za ordinalne varijable razvijeni su posebni, neparametrijski testovi.

Page 17: FILOZOFIJA STATISTIKE

Obično metričke varijable uspoređujemo parametrijskim testovim. Bitna je pretpostavka tih testova da je raspodjela aritmetičkih sredina normalna, ili barem simetrična. To je uvijek tako ako su same varijable simetrično distribuirane, a za velike uzorke i bez obzira na njihovu raspodjelu (tzv. teorem o središnjoj graničnoj vrijednosti). Ako se radi o malim uzorcima i uz to su još varijable vrlo nesimetrično raspoređene, parametrijski testovi nisu uporabivi.

Page 18: FILOZOFIJA STATISTIKE

Neparametrijski testovi ne tretiraju varijable kao brojeve s kojima su moguće matematičke operacije, već kao rangirani niz (zato ih možemo koristiti za ordinalne varijable).

Page 19: FILOZOFIJA STATISTIKE

Dakle, neparametrijske testove koristimo:

uvijek za ordinalne varijable ponekad za metričke varijable, kada je broj podataka N mali, a podaci su nesimetrično distribuirani i ne mogu se transformirati u simetrično (normalno) raspoređene.

Odstupanje od normalne (Gaussove) raspodjele testira se posebnim testovima.

Inače, neparametrijske testove izbjegavamo jer su manje pouzdani od parametrijskih testova.

Page 20: FILOZOFIJA STATISTIKE

STATISTIČKO ZAKLJUČIVANJE

Page 21: FILOZOFIJA STATISTIKE

Obzirom da nikad ne možemo biti sigurni koliko su uzorci reprezentativni za matične populacije, u statistici nema potpuno sigurnih tvrdnji, sve se vezuje za određene vjerojatnosti.

Page 22: FILOZOFIJA STATISTIKE

Na uzorcima iz populacija istraživane varijable se uvijek barem malo razlikuju, bez obzira da li u matičnim populacijima stvarna razlika postoji ili ne (npr. izmjerimo svima vama visinu danas i nakon mjesec dana-malo je vjerojatno da ćemo dobiti potpuno iste aritmetičke sredine).

To su tzv. opažene razlike (nasuprot stvarnim razlikama između matičnih populacija).

Page 23: FILOZOFIJA STATISTIKE

Dakle, opažene se razlike redovno razlikuju od stvarnih. Statistički testovi procjenjuju “kvalitetu” opaženih razlika.

Nul-hipoteza je pretpostavka da se populacijene razlikuju u ispitivanom obilježju, tj. da su opažene razlike slučajne (da stvarne, populacijske razlike ne postoje).

Page 24: FILOZOFIJA STATISTIKE

p-vrijednost odgovara vjerojatnosti da je nul-hipoteza točna (tj. vjerojatnosti dobivanja uočene ili još veće razlike na slučajnim uzorcima iz populacija koje se u istraživanom obilježju ne razlikuju).

1 - p = odgovara vjerojatnost da nul-hipoteza nije točna, tj. da stvarna razlika postoji i naziva se razina značajnosti.

Page 25: FILOZOFIJA STATISTIKE

Tradicionalno (i nažalost!) najvažniji rezultat statističkih testova usporedbe su p-vrijednosti.

Što je p-vrijednost manja, razina značajnosti je veća, tj. pouzdanija je procjena stvarnih iz uočenih razlika.

Page 26: FILOZOFIJA STATISTIKE

granična razina značajnosti ==1- granična p-vrijednost

Granična je ona razina značajnosti iznad koje prihvaćamo da su uočene razlike stvarne, tj.

zanemarujemo malu vjerojatnost (p-vrijednost) da se radi o slučaju.

Page 27: FILOZOFIJA STATISTIKE

Kažemo da se uzorci statistički značajno razlikuju ako je dobivena p-vrijednost testa manja od granične p-vrijednosti: prihvatljive nepouzdanosti u odbacivanju nuil-hipoteze.

Ako to nije slučaj, tj. ako je p-vrijednost testa veća ili jednaka od granične p-vrijednosti, kažemo da se uzorci ne razlikuju statistički značajno.

• U prvom slučaju nul-hipotezu odbacujemo, a u drugom ju prihvaćamo

Page 28: FILOZOFIJA STATISTIKE

U biomedicini je uobičajena 95% granična razina značajnosti, odnosno čuvena graničnap-vrijednost = 5%.

Usporedbe razlika koji rezultiraju s p<0.05 smatramo statistički značajnim, a druge (p0.05) statistički neznačajnim.

Page 29: FILOZOFIJA STATISTIKE

Razgraničenje pomoću granične razine značajnosti povlači mogućnost pogrešaka u zaključivanju:

• Alfa () pogreška (ili pogreška tipa 1) je odbacivanje nul-hipoteze, dok je ona u stvari točna.

• Beta () pogreška (ili pogreška tipa 2) je prihvaćanje nul-hipoteze, dok je ona u stvarnosti netočna.

Page 30: FILOZOFIJA STATISTIKE

Vjerojatnost alfa pogreške jednaka je p-vrijednosti. Vjerojatnost da nećemo napraviti pogrešku tipa 1 je razina značajnosti (1-p).

Vjerojatnost beta pogreške ovisi o tome što prihvaćamo kao stvarnu razliku u promatranoj veličini.

Vjerojatnost da nećemo napraviti pogrešku tipa 2 zove se snaga istraživanja. Snaga istraživanja raste s veličinom uzorka (N) i s veličinom razlike koju smatramo stvarno značajnom, a opada s razinom značajnosti (statističke).

Page 31: FILOZOFIJA STATISTIKE

Tri su čimbenika pouzdanosti zaključivanja na temelju uzoraka iz populacija:

1. Koliko se populacije zaista razlikuju u istraživanom obilježju

2. Kolike su širine distribucija, tj. varijabilnosti istraživane varijable u populacijima

3. Kolike su veličine uzoraka iz populacija

Page 32: FILOZOFIJA STATISTIKE

Dakle, dobivena p-vrijednost tim je manja (procjena je pouzdanija), što su:

opažene razlike veće

varijabilnosti manje

uzorci veći

Page 33: FILOZOFIJA STATISTIKE

Rasponi pouzdanosti (1)Standardna pogreška aritmetičke sredine (SE) govori o gustoći grupiranja prosjeka uzoraka oko prave, populacijske sredine (2/3 rezultata je u području prava sredina +/- SE, a 95% u području prava sredina +/- 1.96 x SE). Pretpostavke su:

1. broj uzoraka relativno velik (nije nužna normalna raspodjela uzoraka!)2. SE dobivena na uzorku jednaka je populacijskoj SE.

Dokažite (nije teško) da slijedi: 95% je vjerojatno da se prava sredina nalazi u području prosjek slučajnog uzorka +/- 1.96 SE.

Page 34: FILOZOFIJA STATISTIKE

• X +/- 1.96 SE (X) naziva se 95% raspon pouzdanosti veličine X (engl. 95% confidence interval; 95% CI).

• Slično se dobivaju drugi, npr. 99% CI. • X može biti neka neposredna veličina, kao i razlika

ili omjer veličina između skupina .

Page 35: FILOZOFIJA STATISTIKE

Rasponi pouzdanosti (3)

1. Na našem je uzorku prosječna visina odraslih Splićana 182 cm (178-186 cm; 95% CI).

2. Rezultati mjerenja hemoglobina pokazuju da je u zdravih muškaraca prosječno za 10 mg/dl (8-12 mg/dl; 95% CI) veći nego u premenopauzalnih zdravih žena.

3. Križni je pokus pokazao da lijek A snižava dijastolički arterijski tlak za 4 mm Hg (2-6 mm Hg; 95% CI) više od lijeka B.

4. Rak pluća 8 je puta učestaliji u pušača nego u nepušača (4-17; 95% C.I.).

Page 36: FILOZOFIJA STATISTIKE

Rasponi pouzdanosti (4)1. Informativniji od p-vrijednosti: pokazuju veličinu

učinka (svojstva, razlike) i preciznost njene procjene, dakle i biološku (kliničku) i statističku značajnost

2. Ne počivaju na testu nul-hipoteze (čiju vjerojatnost pouzdano nikad ne znamo)

3. Ipak, kao i p-vrijednosti pate od: a) često neispunjene pretpostavke slučajnog uzorkovanja (za razliku od tzv. permutacijske statistike)b) ne daju informacije o pojedincu, već samo o prosjekuc) ne integriraju apriorna znanja o problemu (od čega polazi tzv. bajezijanska statistika)

Page 37: FILOZOFIJA STATISTIKE

Rasponi pouzdanosti (5)

Rasponi pouzdanosti sve više dopunjuju i čak zamjenjuju iskaze p-vrijednosti u prikazima znanstvenih radova u biomedicini.

Page 38: FILOZOFIJA STATISTIKE

Rasponi pouzdanosti (6)Poveznica između CI i p-vrijednosti:

ako 95% CI uključuje nulu na lijevom kraku (ili jedinicu u slučaju omjera tipa OR (omjer šansi), RR (omjer rizika/stopa), omjer prevalencija, HR (omjer hazarda) između ispitne i kontrolne skupine), p-vrijednost je veća od 0.05, tj. tradicionalno se rezultat ne smatra statistički značajnim.

To znači da iz CI možemo ugrubo procijeniti p-vrijednost, obrnuto ne vrijedi!

Page 39: FILOZOFIJA STATISTIKE

Rasponi pouzdanosti (7)• Manja p-vrijednost ne znači i klinički značajniji rezultat.

Npr. ako jedno istraživanje na 100 ispitanika procjenjuje da lijek A snižava dijastolički tlak za 2 mm Hg (1-3 mm Hg; 95% CI), dok drugo istraživanje na 30 bolesnika za lijek B daje rezultate- 5 mm Hg (-1, 11 mm Hg; 95% CI), prvi je rezultat statistički značajan, ali klinički trivijalan, dok je drugi statistički neznačajan, ali potencijalno važan: vjerojatnost da lijek B snižava tlak za više od 5 mm Hg (klinički značajna granica) je oko 50%, a ista je vjerojatnost za lijek A oko nule. Poruka je da lijek B treba provjeriti na većem uzorku.

Page 40: FILOZOFIJA STATISTIKE

Rasponi pouzdanosti (8)• Dakle, apsolutno je neprihvatljivo (osobito u

sažetku) navoditi samo p-vrijednosti rezultata, uz dihotomizaciju značajno/neznačajno. Ne samo da statistička značajnost ne povlači kliničku, već po p-vrijednostima ne možemo kliničke značajnosti niti poredati (osobito u slučaju nejednako velikih uzoraka).

• Fraza ‘značajno’ treba značiti klinički značajno, dok se statistička značajnost implicitno podrazumijeva.

Page 41: FILOZOFIJA STATISTIKE

Pet ‘grijeha’ p-vrijednosti1. Neprirodna dihotomizacija (rješenje: odustajanje od

‘policijskih’ granica)2. Izostavljanje glavne informacije: biološke, tj. kliničke

značajnosti (rješenje: rasponi pouzdanosti)3. Neispunjen uvjet slučajnih uzoraka (rješenje: primjena

permutacijske statistike) 4. Neznanstven pristup neuvažavanja prethodnih znanja o

problemu (rješenje: Bayesova statistika)5. Primjena prosjeka na pojedinca (rješenje: ne postoji,

uvid u pogrešku- standardna devijacija uzoraka (ne standardna pogreška sredina!))