STATISTIKA U ISTRAŽIVANJU OBRAZOVANJA GRAFIČKO PREDSTAVLJANJE NUMERIČKIH VARIJABLI OPIS KATEGORIČKIH VARIJABLI GRAFIČKO PREDSTAVLJANJE KATEGORIČKIH VARIJABLI Oliver Tošković Univerzitet u Beogradu Filozofski fakultet
Aug 22, 2014
STATISTIKA U ISTRAŽIVANJU OBRAZOVANJAGRAFIČKO PREDSTAVLJANJE NUMERIČKIH VARIJABLIOPIS KATEGORIČKIH VARIJABLI GRAFIČKO PREDSTAVLJANJE KATEGORIČKIH VARIJABLI
Oliver Tošković
Univerzitet u BeograduFilozofski fakultet
DESKRIPTIVNA vs INFERENCIJALNA STATISTIKA• Parametar - statistička mera numeričke
karakteristike populacije– “the real thing”
• Statistik - statistička mera numeričke karakteristike uzorka– “even better than the real thing”
• Deskriptivna statistika – opis populacije– “Statistika je kao bikini - pokazuje sve, a ne otkriva
ništa!” (Z. Mihajlovski)• Inferencijalna – izvođenje zaključaka (odnosi
pojava u populaciji)
GRAFIČKI PRIKAZ NUMERIČKE VARIJABLE
• Poligon frekvenci• Histogram – poligon stubaca• Grafik kumulativnih frekvenci• Grafik kumulativnih procenata
POLIGON FREKVENCI
ocena razred frekvencasredina razreda
6 21-24 50 22.5
7 25-28 61 26.5
8 29-32 55 30.5
9 33-36 23 34.5
10 37-40 30 38.5
POLIGON FREKVENCI
HISTOGRAM• Obe egzaktne granice – donja i gornja +0.5
GRAFIK KUMULATIVNIH FREKVENCI
ocena razred frekvencasredina razreda
kumulativna f
gornja egzaktna granica
6 21-24 50 22.5 50 24.5
7 25-28 61 26.5 111 28.5
8 29-32 55 30.5 166 32.5
9 33-36 23 34.5 189 36.5
10 37-40 30 38.5 219 40.5
GRAFIK KUMULATIVNIH FREKVENCI
GRAFIK KUMULATIVNIH PROCENATA - OGIVA
ocena razred frekvencasredina razreda
kumulativna f
kumulativna prop
gornja egzaktna granica
6 21-24 50 22.5 50 0.23 24.5
7 25-28 61 26.5 111 0.51 28.5
8 29-32 55 30.5 1660.76
32.5
9 33-36 23 34.5 189 0.86 36.5
10 37-40 30 38.5 219 1 40.5
GRAFIK KUMULATIVNIH PROCENATA - OGIVA
BOX & WHISKER
medijana
prvi kvratil
treći kvratil
donja okolinska
gornja okolinska
okolinske vrednosti – kvartili +/- 1.5*interkvratilni opseg
outlier
OUTLIER
OPIS KATEGORIČKE VARIJABLE
• E = { ei; i =1, 2,..., n} P – ispitanici (Keni, Kajl, Sten, Kartman...)
• Q = { qk; k =1, 2,..., g}, g ≥ 2 – varijabla sa dve i više kategorija (pol, boja kose...)
• eik= ok │ ei ϵ qk – oznaka kategorije kojoj ispitanik pripada (Keni je
muško...)
OPIS KATEGORIČKE VARIJABLE
• presek različitih kategorija = prazan skup– ne sme isti ispitanik biti u dve grupe (ako je
Keni muško ne može da bude i žensko)• unija kategorija = varijabla• iscrpnost – svi moraju negde pripadati
KODIRANJE KATEGORIČKE VARIJABLE
• Faktor – vektorski oblik
ISPITANIK SES
Keni 1 (siromašan)
Kajl 2 (srednji)
Sten 2 (srednji)
Kartman 3 (bogat)
KODIRANJE KATEGORIČKE VARIJABLE
• Kompletni disjunktni oblik – matrica binarnih varijabli (0 ili 1)– više odgovora na istom pitanju!ISPITANIK siromašan srednji bogat
Keni 1 0 0
Kajl 0 1 0
Sten 0 1 0
Kartman 0 0 1
STATISTIČKI OPIS KATEGORIČKE VARIJABLE
• Prebrojavanje – frekvenca, učestalost• Proporcija – relativna frekvenca
– frekvenca kategorije / ukupni broj ispitanikaHOROSKOPSKI ZNAK broj sportista proporcija
vodolija 200 200/1000=0,20
ribe 210 210/1000=0,21
...
strelac 10 10/1000=0,01
TOTAL 1000 1000/1000=1
STATISTIČKI OPIS KATEGORIČKE VARIJABLE
• Entropija – mera neuređenosti sistema– H=-Σp*log10p – jedinica hartli
– H=-Σp*log2p – jedinica bit
– H=-Σp*logep – prirodna jedinica (e)
• koliko informacija nosi činjenica da znamo da je Keni iz South Park-a
• Zavisi od:– verovatnoće– broja događaja
GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE
• Štapićasti dijagram (barchart)
GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE
• Štapićasti dijagram (barchart)
GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE
• Pitasti dijagram (piechart)
GRAFIČKI PRIKAZ KATEGORIČKE VARIJABLE
• Pitasti dijagram (piechart)