04opis_kategoricke_varijable

Post on 22-Aug-2014

106 Views

Category:

Documents

1 Downloads

Preview:

Click to see full reader

Transcript

STATISTIKA U ISTRAŽIVANJU OBRAZOVANJAGRAFIČKO PREDSTAVLJANJE NUMERIČKIH VARIJABLIOPIS KATEGORIČKIH VARIJABLI GRAFIČKO PREDSTAVLJANJE KATEGORIČKIH VARIJABLI

Oliver Tošković

Univerzitet u BeograduFilozofski fakultet

DESKRIPTIVNA vs INFERENCIJALNA STATISTIKA• Parametar - statistička mera numeričke

karakteristike populacije– “the real thing”

• Statistik - statistička mera numeričke karakteristike uzorka– “even better than the real thing”

• Deskriptivna statistika – opis populacije– “Statistika je kao bikini - pokazuje sve, a ne otkriva

ništa!” (Z. Mihajlovski)• Inferencijalna – izvođenje zaključaka (odnosi

pojava u populaciji)

GRAFIČKI PRIKAZ NUMERIČKE VARIJABLE

• Poligon frekvenci• Histogram – poligon stubaca• Grafik kumulativnih frekvenci• Grafik kumulativnih procenata

POLIGON FREKVENCI

 ocena razred frekvencasredina razreda

6 21-24 50 22.5

7 25-28 61 26.5

8 29-32 55 30.5

9 33-36 23 34.5

10 37-40 30 38.5

POLIGON FREKVENCI

HISTOGRAM• Obe egzaktne granice – donja i gornja +0.5

GRAFIK KUMULATIVNIH FREKVENCI

 ocena razred frekvencasredina razreda

kumulativna f

gornja egzaktna granica

6 21-24 50 22.5 50 24.5

7 25-28 61 26.5 111 28.5

8 29-32 55 30.5 166 32.5

9 33-36 23 34.5 189 36.5

10 37-40 30 38.5 219 40.5

GRAFIK KUMULATIVNIH FREKVENCI

GRAFIK KUMULATIVNIH PROCENATA - OGIVA

 ocena razred frekvencasredina razreda

kumulativna f

kumulativna prop

gornja egzaktna granica

6 21-24 50 22.5 50 0.23 24.5

7 25-28 61 26.5 111 0.51 28.5

8 29-32 55 30.5 1660.76

32.5

9 33-36 23 34.5 189 0.86 36.5

10 37-40 30 38.5 219 1 40.5

GRAFIK KUMULATIVNIH PROCENATA - OGIVA

BOX & WHISKER

medijana

prvi kvratil

treći kvratil

donja okolinska

gornja okolinska

okolinske vrednosti – kvartili +/- 1.5*interkvratilni opseg

outlier

OUTLIER

OPIS KATEGORIČKE VARIJABLE

• E = { ei; i =1, 2,..., n} P – ispitanici (Keni, Kajl, Sten, Kartman...)

• Q = { qk; k =1, 2,..., g}, g ≥ 2 – varijabla sa dve i više kategorija (pol, boja kose...)

• eik= ok │ ei ϵ qk – oznaka kategorije kojoj ispitanik pripada (Keni je

muško...)

OPIS KATEGORIČKE VARIJABLE

• presek različitih kategorija = prazan skup– ne sme isti ispitanik biti u dve grupe (ako je

Keni muško ne može da bude i žensko)• unija kategorija = varijabla• iscrpnost – svi moraju negde pripadati

KODIRANJE KATEGORIČKE VARIJABLE

• Faktor – vektorski oblik

ISPITANIK SES

Keni 1 (siromašan)

Kajl 2 (srednji)

Sten 2 (srednji)

Kartman 3 (bogat)

KODIRANJE KATEGORIČKE VARIJABLE

• Kompletni disjunktni oblik – matrica binarnih varijabli (0 ili 1)– više odgovora na istom pitanju!ISPITANIK siromašan srednji bogat

Keni 1 0 0

Kajl 0 1 0

Sten 0 1 0

Kartman 0 0 1

STATISTIČKI OPIS KATEGORIČKE VARIJABLE

• Prebrojavanje – frekvenca, učestalost• Proporcija – relativna frekvenca

– frekvenca kategorije / ukupni broj ispitanikaHOROSKOPSKI ZNAK broj sportista proporcija

vodolija 200 200/1000=0,20

ribe 210 210/1000=0,21

...

strelac 10 10/1000=0,01

TOTAL 1000 1000/1000=1

STATISTIČKI OPIS KATEGORIČKE VARIJABLE

• Entropija – mera neuređenosti sistema– H=-Σp*log10p – jedinica hartli

– H=-Σp*log2p – jedinica bit

– H=-Σp*logep – prirodna jedinica (e)

• koliko informacija nosi činjenica da znamo da je Keni iz South Park-a

• Zavisi od:– verovatnoće– broja događaja

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Štapićasti dijagram (barchart)

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Štapićasti dijagram (barchart)

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Pitasti dijagram (piechart)

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Pitasti dijagram (piechart)