FILOZOFIJA STATISTIKE

FILOZOFIJA STATISTIKE

Prof. dr. Davor Eterović EBM-2011/Klinička biostatistika

UZORAK I POPULACIJA

Populacija je veliki skup jedinki određenog istog svojstva (npr. sve Splićanke). Ali, druga se svojstva individualno razlikuju, tj. imaju svoje distribucije (dob, visina, masa, bračni status, zanimanje, naobrazba, genotip, krvna slika).

Kada uspoređujemo dvije populacije (npr. Splićanke i Kaštelanke), one se razlikuju u osnovnom obilježju (prebivalište), dok im se distribucije ostalih svojstava mogu, ali ne moraju bitno razlikovati (npr. vjerojatno Splićanke nisu prosječno više od Kaštelanki, ali je moguće da se manje bave poljoprivredom).

Populacije možemo uspoređivati u cijelosti (rijetko) ili na temelju uzoraka (češće).

Uzorak: Dio (podskup) populacije (npr. Splićanke koje stanuju u Varošu su uzorak iz populacije svih

Splićanki).

Uzorak je reprezentativan za populaciju iz koje potiče ako su njegova prosječna svojstva (točnije: distribucije svojstava) uglavnom slična prosječnim svojstvima (njihovim distribucijama) matične populacije.

Npr. Varošanke se vjerojatno ne razlikuju od prosječnih Splićanki u mnogim svojstvima, ali je za pretpostaviti da su im roditelji nešto češće rođeni Splićani.

Također, stanovnici Meja (i Bačvica) vjerojatno nisu reprezentativan uzorak Splićana, ako je ispitivano obilježje imovinski status, ali to mogu biti u slučaju tjelesne visine.

ZAŠTO UZIMAMO UZORKE:

Cijele su populacije najčešće nedostupne (npr. u bolnici su u određenom vremenu samo neki srčani bolesnici, a ne svi iz tog grada), ili su prevelike za analizu (predugo, preskupo).

Ako populacije uspoređujemo na temelju uzoraka, osnovni je preduvjet pouzdanosti zaključaka da su uzorci reprezentativni za populacije iz kojih potiču, posebno glede ispitivanog obilježja.

Ako npr. uspoređujemo Splićanke i Omišanke, tada je slučajni uzorak od 120 Varošanki vjerojatno reprezentativan za populaciju Splićanki ako se uspoređuje tjelesna visina, ali nije reprezentativan ako se Splićanke i Omišanke uspoređuju glede porijekla roditelja.

Ako uzorak ne možemo birati (npr. bolesnici koji su momentalno dostupni), njegovu reprezentativnost možemo samo procjenjivati, ali na nju ne možemo utjecati.

Ako uzorak biramo, najbolja je metoda slučajnog izbora.

Slučajni izbor ili randomizirano uzorkovanje (engl. random sampling): svaka jedinka iz populacije ima jednaku šansu biti izabrana u uzorak.

Metoda slučajnog izbora osigurava reprezentativan uzorak tim sigurnije što je broj jedinki uzorka (N) veći.

ŠTO JE ZAJEDNIČKO STATISTIČKIM ANALIZAMA

1. Zanima nas samo uzorak, ne cijela populacije (npr. mene zanima vaša matematička izobrazba, jer ovu skriptu pravim za vas.

2. Ispitujemo cijelu populaciju (jednu ili više njih).

3. Zaključujemo iz uzorka (uzoraka) na populaciju (populacije).

Tri su različite mogućnosti:

1. i 2. je jednostavno, statistika u užem smislu se bavi s 3.

Statističke metode (u slučaju 3.) koriste se u svrhu:

PROCJENE POUZDANOSTI ZAKLJUČIVANJA NA TEMELJU UZORAKA IZ POPULACIJA

Tri su osnovne namjene statističkih metoda:

1. testiraju hipoteze (pretpostavke) o različitosti populacija glede nekog svojstva. Primjer je pretpostavka da su muškarci viši od žena, ili da češće dobivaju rak pluća.

2. procjenjuju intenzitet povezanosti između dvije kategorijske varijable. Primjer je koliko češće pušači dobivaju rak pluća nego nepušači.

3. procjenjuju mogućnost predviđanja jednog svojstva (npr. preživljenje infarkata srca) iz jednog ili više drugih svojstava (dob, spol, veličina infarkta) iste populacije.

Ovisno o vrsti ispitivanog svojstva statističke metode koje testiraju hipoteze dijelimo na: metode koje uspoređuju metričke varijable (npr. t-test) imetode procjenjuju povezanosti kategorijskih varijabli (npr. test), dok su za ordinalne varijable razvijeni su posebni, neparametrijski testovi.

Obično metričke varijable uspoređujemo parametrijskim testovim. Bitna je pretpostavka tih testova da je raspodjela aritmetičkih sredina normalna, ili barem simetrična. To je uvijek tako ako su same varijable simetrično distribuirane, a za velike uzorke i bez obzira na njihovu raspodjelu (tzv. teorem o središnjoj graničnoj vrijednosti). Ako se radi o malim uzorcima i uz to su još varijable vrlo nesimetrično raspoređene, parametrijski testovi nisu uporabivi.

Neparametrijski testovi ne tretiraju varijable kao brojeve s kojima su moguće matematičke operacije, već kao rangirani niz (zato ih možemo koristiti za ordinalne varijable).

Dakle, neparametrijske testove koristimo:

uvijek za ordinalne varijable ponekad za metričke varijable, kada je broj podataka N mali, a podaci su nesimetrično distribuirani i ne mogu se transformirati u simetrično (normalno) raspoređene.

Odstupanje od normalne (Gaussove) raspodjele testira se posebnim testovima.

Inače, neparametrijske testove izbjegavamo jer su manje pouzdani od parametrijskih testova.

STATISTIČKO ZAKLJUČIVANJE

Obzirom da nikad ne možemo biti sigurni koliko su uzorci reprezentativni za matične populacije, u statistici nema potpuno sigurnih tvrdnji, sve se vezuje za određene vjerojatnosti.

Na uzorcima iz populacija istraživane varijable se uvijek barem malo razlikuju, bez obzira da li u matičnim populacijima stvarna razlika postoji ili ne (npr. izmjerimo svima vama visinu danas i nakon mjesec dana-malo je vjerojatno da ćemo dobiti potpuno iste aritmetičke sredine).

To su tzv. opažene razlike (nasuprot stvarnim razlikama između matičnih populacija).

Dakle, opažene se razlike redovno razlikuju od stvarnih. Statistički testovi procjenjuju “kvalitetu” opaženih razlika.

Nul-hipoteza je pretpostavka da se populacijene razlikuju u ispitivanom obilježju, tj. da su opažene razlike slučajne (da stvarne, populacijske razlike ne postoje).

p-vrijednost odgovara vjerojatnosti da je nul-hipoteza točna (tj. vjerojatnosti dobivanja uočene ili još veće razlike na slučajnim uzorcima iz populacija koje se u istraživanom obilježju ne razlikuju).

1 - p = odgovara vjerojatnost da nul-hipoteza nije točna, tj. da stvarna razlika postoji i naziva se razina značajnosti.

Tradicionalno (i nažalost!) najvažniji rezultat statističkih testova usporedbe su p-vrijednosti.

Što je p-vrijednost manja, razina značajnosti je veća, tj. pouzdanija je procjena stvarnih iz uočenih razlika.

granična razina značajnosti ==1- granična p-vrijednost

Granična je ona razina značajnosti iznad koje prihvaćamo da su uočene razlike stvarne, tj.

zanemarujemo malu vjerojatnost (p-vrijednost) da se radi o slučaju.

Kažemo da se uzorci statistički značajno razlikuju ako je dobivena p-vrijednost testa manja od granične p-vrijednosti: prihvatljive nepouzdanosti u odbacivanju nuil-hipoteze.

Ako to nije slučaj, tj. ako je p-vrijednost testa veća ili jednaka od granične p-vrijednosti, kažemo da se uzorci ne razlikuju statistički značajno.

• U prvom slučaju nul-hipotezu odbacujemo, a u drugom ju prihvaćamo

U biomedicini je uobičajena 95% granična razina značajnosti, odnosno čuvena graničnap-vrijednost = 5%.

Usporedbe razlika koji rezultiraju s p<0.05 smatramo statistički značajnim, a druge (p0.05) statistički neznačajnim.

Razgraničenje pomoću granične razine značajnosti povlači mogućnost pogrešaka u zaključivanju:

• Alfa () pogreška (ili pogreška tipa 1) je odbacivanje nul-hipoteze, dok je ona u stvari točna.

• Beta () pogreška (ili pogreška tipa 2) je prihvaćanje nul-hipoteze, dok je ona u stvarnosti netočna.

Vjerojatnost alfa pogreške jednaka je p-vrijednosti. Vjerojatnost da nećemo napraviti pogrešku tipa 1 je razina značajnosti (1-p).

Vjerojatnost beta pogreške ovisi o tome što prihvaćamo kao stvarnu razliku u promatranoj veličini.

Vjerojatnost da nećemo napraviti pogrešku tipa 2 zove se snaga istraživanja. Snaga istraživanja raste s veličinom uzorka (N) i s veličinom razlike koju smatramo stvarno značajnom, a opada s razinom značajnosti (statističke).

Tri su čimbenika pouzdanosti zaključivanja na temelju uzoraka iz populacija:

1. Koliko se populacije zaista razlikuju u istraživanom obilježju

2. Kolike su širine distribucija, tj. varijabilnosti istraživane varijable u populacijima

3. Kolike su veličine uzoraka iz populacija

Dakle, dobivena p-vrijednost tim je manja (procjena je pouzdanija), što su:

opažene razlike veće

varijabilnosti manje

uzorci veći

Rasponi pouzdanosti (1)Standardna pogreška aritmetičke sredine (SE) govori o gustoći grupiranja prosjeka uzoraka oko prave, populacijske sredine (2/3 rezultata je u području prava sredina +/- SE, a 95% u području prava sredina +/- 1.96 x SE). Pretpostavke su:

1. broj uzoraka relativno velik (nije nužna normalna raspodjela uzoraka!)2. SE dobivena na uzorku jednaka je populacijskoj SE.

Dokažite (nije teško) da slijedi: 95% je vjerojatno da se prava sredina nalazi u području prosjek slučajnog uzorka +/- 1.96 SE.

• X +/- 1.96 SE (X) naziva se 95% raspon pouzdanosti veličine X (engl. 95% confidence interval; 95% CI).

• Slično se dobivaju drugi, npr. 99% CI. • X može biti neka neposredna veličina, kao i razlika

ili omjer veličina između skupina .

Rasponi pouzdanosti (3)

1. Na našem je uzorku prosječna visina odraslih Splićana 182 cm (178-186 cm; 95% CI).

2. Rezultati mjerenja hemoglobina pokazuju da je u zdravih muškaraca prosječno za 10 mg/dl (8-12 mg/dl; 95% CI) veći nego u premenopauzalnih zdravih žena.

3. Križni je pokus pokazao da lijek A snižava dijastolički arterijski tlak za 4 mm Hg (2-6 mm Hg; 95% CI) više od lijeka B.

4. Rak pluća 8 je puta učestaliji u pušača nego u nepušača (4-17; 95% C.I.).

Rasponi pouzdanosti (4)1. Informativniji od p-vrijednosti: pokazuju veličinu

učinka (svojstva, razlike) i preciznost njene procjene, dakle i biološku (kliničku) i statističku značajnost

2. Ne počivaju na testu nul-hipoteze (čiju vjerojatnost pouzdano nikad ne znamo)

3. Ipak, kao i p-vrijednosti pate od: a) često neispunjene pretpostavke slučajnog uzorkovanja (za razliku od tzv. permutacijske statistike)b) ne daju informacije o pojedincu, već samo o prosjekuc) ne integriraju apriorna znanja o problemu (od čega polazi tzv. bajezijanska statistika)

Rasponi pouzdanosti (5)

Rasponi pouzdanosti sve više dopunjuju i čak zamjenjuju iskaze p-vrijednosti u prikazima znanstvenih radova u biomedicini.

Rasponi pouzdanosti (6)Poveznica između CI i p-vrijednosti:

ako 95% CI uključuje nulu na lijevom kraku (ili jedinicu u slučaju omjera tipa OR (omjer šansi), RR (omjer rizika/stopa), omjer prevalencija, HR (omjer hazarda) između ispitne i kontrolne skupine), p-vrijednost je veća od 0.05, tj. tradicionalno se rezultat ne smatra statistički značajnim.

To znači da iz CI možemo ugrubo procijeniti p-vrijednost, obrnuto ne vrijedi!

Rasponi pouzdanosti (7)• Manja p-vrijednost ne znači i klinički značajniji rezultat.

Npr. ako jedno istraživanje na 100 ispitanika procjenjuje da lijek A snižava dijastolički tlak za 2 mm Hg (1-3 mm Hg; 95% CI), dok drugo istraživanje na 30 bolesnika za lijek B daje rezultate- 5 mm Hg (-1, 11 mm Hg; 95% CI), prvi je rezultat statistički značajan, ali klinički trivijalan, dok je drugi statistički neznačajan, ali potencijalno važan: vjerojatnost da lijek B snižava tlak za više od 5 mm Hg (klinički značajna granica) je oko 50%, a ista je vjerojatnost za lijek A oko nule. Poruka je da lijek B treba provjeriti na većem uzorku.

Rasponi pouzdanosti (8)• Dakle, apsolutno je neprihvatljivo (osobito u

sažetku) navoditi samo p-vrijednosti rezultata, uz dihotomizaciju značajno/neznačajno. Ne samo da statistička značajnost ne povlači kliničku, već po p-vrijednostima ne možemo kliničke značajnosti niti poredati (osobito u slučaju nejednako velikih uzoraka).

• Fraza ‘značajno’ treba značiti klinički značajno, dok se statistička značajnost implicitno podrazumijeva.

Pet ‘grijeha’ p-vrijednosti1. Neprirodna dihotomizacija (rješenje: odustajanje od

‘policijskih’ granica)2. Izostavljanje glavne informacije: biološke, tj. kliničke

značajnosti (rješenje: rasponi pouzdanosti)3. Neispunjen uvjet slučajnih uzoraka (rješenje: primjena

permutacijske statistike) 4. Neznanstven pristup neuvažavanja prethodnih znanja o

problemu (rješenje: Bayesova statistika)5. Primjena prosjeka na pojedinca (rješenje: ne postoji,

uvid u pogrešku- standardna devijacija uzoraka (ne standardna pogreška sredina!))

FILOZOFIJA STATISTIKE

Documents