Top Banner
STATISTIKA U ISTRAŽIVANJU OBRAZOVANJA GRAFIČKO PREDSTAVLJANJE NUMERIČKIH VARIJABLI OPIS KATEGORIČKIH VARIJABLI GRAFIČKO PREDSTAVLJANJE KATEGORIČKIH VARIJABLI Oliver Tošković Univerzitet u Beogradu Filozofski fakultet
23

04opis_kategoricke_varijable

Aug 22, 2014

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: 04opis_kategoricke_varijable

STATISTIKA U ISTRAŽIVANJU OBRAZOVANJAGRAFIČKO PREDSTAVLJANJE NUMERIČKIH VARIJABLIOPIS KATEGORIČKIH VARIJABLI GRAFIČKO PREDSTAVLJANJE KATEGORIČKIH VARIJABLI

Oliver Tošković

Univerzitet u BeograduFilozofski fakultet

Page 2: 04opis_kategoricke_varijable

DESKRIPTIVNA vs INFERENCIJALNA STATISTIKA• Parametar - statistička mera numeričke

karakteristike populacije– “the real thing”

• Statistik - statistička mera numeričke karakteristike uzorka– “even better than the real thing”

• Deskriptivna statistika – opis populacije– “Statistika je kao bikini - pokazuje sve, a ne otkriva

ništa!” (Z. Mihajlovski)• Inferencijalna – izvođenje zaključaka (odnosi

pojava u populaciji)

Page 3: 04opis_kategoricke_varijable

GRAFIČKI PRIKAZ NUMERIČKE VARIJABLE

• Poligon frekvenci• Histogram – poligon stubaca• Grafik kumulativnih frekvenci• Grafik kumulativnih procenata

Page 4: 04opis_kategoricke_varijable

POLIGON FREKVENCI

 ocena razred frekvencasredina razreda

6 21-24 50 22.5

7 25-28 61 26.5

8 29-32 55 30.5

9 33-36 23 34.5

10 37-40 30 38.5

Page 5: 04opis_kategoricke_varijable

POLIGON FREKVENCI

Page 6: 04opis_kategoricke_varijable

HISTOGRAM• Obe egzaktne granice – donja i gornja +0.5

Page 7: 04opis_kategoricke_varijable

GRAFIK KUMULATIVNIH FREKVENCI

 ocena razred frekvencasredina razreda

kumulativna f

gornja egzaktna granica

6 21-24 50 22.5 50 24.5

7 25-28 61 26.5 111 28.5

8 29-32 55 30.5 166 32.5

9 33-36 23 34.5 189 36.5

10 37-40 30 38.5 219 40.5

Page 8: 04opis_kategoricke_varijable

GRAFIK KUMULATIVNIH FREKVENCI

Page 9: 04opis_kategoricke_varijable

GRAFIK KUMULATIVNIH PROCENATA - OGIVA

 ocena razred frekvencasredina razreda

kumulativna f

kumulativna prop

gornja egzaktna granica

6 21-24 50 22.5 50 0.23 24.5

7 25-28 61 26.5 111 0.51 28.5

8 29-32 55 30.5 1660.76

32.5

9 33-36 23 34.5 189 0.86 36.5

10 37-40 30 38.5 219 1 40.5

Page 10: 04opis_kategoricke_varijable

GRAFIK KUMULATIVNIH PROCENATA - OGIVA

Page 11: 04opis_kategoricke_varijable

BOX & WHISKER

medijana

prvi kvratil

treći kvratil

donja okolinska

gornja okolinska

okolinske vrednosti – kvartili +/- 1.5*interkvratilni opseg

outlier

Page 12: 04opis_kategoricke_varijable

OUTLIER

Page 13: 04opis_kategoricke_varijable
Page 14: 04opis_kategoricke_varijable

OPIS KATEGORIČKE VARIJABLE

• E = { ei; i =1, 2,..., n} P – ispitanici (Keni, Kajl, Sten, Kartman...)

• Q = { qk; k =1, 2,..., g}, g ≥ 2 – varijabla sa dve i više kategorija (pol, boja kose...)

• eik= ok │ ei ϵ qk – oznaka kategorije kojoj ispitanik pripada (Keni je

muško...)

Page 15: 04opis_kategoricke_varijable

OPIS KATEGORIČKE VARIJABLE

• presek različitih kategorija = prazan skup– ne sme isti ispitanik biti u dve grupe (ako je

Keni muško ne može da bude i žensko)• unija kategorija = varijabla• iscrpnost – svi moraju negde pripadati

Page 16: 04opis_kategoricke_varijable

KODIRANJE KATEGORIČKE VARIJABLE

• Faktor – vektorski oblik

ISPITANIK SES

Keni 1 (siromašan)

Kajl 2 (srednji)

Sten 2 (srednji)

Kartman 3 (bogat)

Page 17: 04opis_kategoricke_varijable

KODIRANJE KATEGORIČKE VARIJABLE

• Kompletni disjunktni oblik – matrica binarnih varijabli (0 ili 1)– više odgovora na istom pitanju!ISPITANIK siromašan srednji bogat

Keni 1 0 0

Kajl 0 1 0

Sten 0 1 0

Kartman 0 0 1

Page 18: 04opis_kategoricke_varijable

STATISTIČKI OPIS KATEGORIČKE VARIJABLE

• Prebrojavanje – frekvenca, učestalost• Proporcija – relativna frekvenca

– frekvenca kategorije / ukupni broj ispitanikaHOROSKOPSKI ZNAK broj sportista proporcija

vodolija 200 200/1000=0,20

ribe 210 210/1000=0,21

...

strelac 10 10/1000=0,01

TOTAL 1000 1000/1000=1

Page 19: 04opis_kategoricke_varijable

STATISTIČKI OPIS KATEGORIČKE VARIJABLE

• Entropija – mera neuređenosti sistema– H=-Σp*log10p – jedinica hartli

– H=-Σp*log2p – jedinica bit

– H=-Σp*logep – prirodna jedinica (e)

• koliko informacija nosi činjenica da znamo da je Keni iz South Park-a

• Zavisi od:– verovatnoće– broja događaja

Page 20: 04opis_kategoricke_varijable

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Štapićasti dijagram (barchart)

Page 21: 04opis_kategoricke_varijable

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Štapićasti dijagram (barchart)

Page 22: 04opis_kategoricke_varijable

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Pitasti dijagram (piechart)

Page 23: 04opis_kategoricke_varijable

GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE

• Pitasti dijagram (piechart)