Statistika proučuje množične pojave s kvantitativnimi metodami. Predmet proučevanja so množični pojavi = STATISTIČNA MNOŽICA – SM ali POPULACIJA (rojstva, smrti, prebivalstva, zaposlenost, izvoz, uvoz, inštitucije ali kaj drugega…) in je osnovni pojem na področju statistike. SM je sestavljena iz statističnih enot. OPREDELJUJOČI POGOJ je opis statistične množice. Je del množičnega pojava, ki izpolnjuje pogoje, ki se nanašajo na vsebino, kraj in čas. STVARNI OP -SOP KRAJEVNI OP - KOP ČASOVNI OP - ČOP Kaj je statistična množica Kje se statistična množica nahaja Kdaj se statistična množica nahaja. Primer: Učenci 7. razreda OŠ v Ljubljani, v šolskem letu 2006/07. Odgovor: SOP- učenci 7. razreda OŠ, KOP- v Ljubljani, ČOP- leto 2006/07. STATISTIČNA ENOTA je (en) element statistične množice (pazi!!! Samo enega opredelimo). Je vsak posamezen pojav, ki sestavlja statistično množico: Realne statistične enote (obstajajo v času in prostoru – kritični moment), Dogodki (smrt, rojstvo, nesreča) = časovni interval, Dogajanja (proizvodnja, nabava) = časovni interval. Odgovor: Eden učenec. Značilnosti oz. lastnosti SM so SPREMENLJIVKE oz. VARIABLE, ki so enote iste statistične množice in se med sabo razlikujejo. Delimo jih na: - atributivne spremenljivke (nominalne in ordinalne) in na - numerične spremenljivke (intervalne in proporcionalne). Lastnost mora iemti vsaj dve vrednoti, da je lahko spremenljivka. ATRIBUTIVNE SPREMENLJIVKE NUMERIČNE SPREMENLJIVKE Pove nam natančno kakšna je spremenljivka NOMINALNE SPREMENLJIVKE ORDINALNE SPREMENLJIVKE INTERVALNE SPREMENLJIVKE RAZMERNOSTNE – PROPORCIONALNE SPREMENLJIVKE Pove nam ali sta dve spremenljivki enaki ali različni Pove nam ali imata spremenljivki enako ali različno oceno in ali ima enako ali različno znanje Povemo razliko, za koliko je topleje ali hladneje. Ne moremo pa povedati za koliko je bolj toplo ali bolj hladno 2x, 3x. Povemo razmerja, ki se začnejo od 0 naprej. Spol = ali sta istega spola ali različnega. Kraj bivanja. Šolska ocena – ni numerična spremenljivka, ker ima v ozadju znanje, ki pa ga ne moremo Temperatura 0 C-če bi imeli Kelvine, to ni absolutna 0! Skok v daljino. Eden skoč 3 m več od drugega – lako naredimo razmerja, ker imamo absolutno 0. 1
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Statistika proučuje množične pojave s kvantitativnimi metodami. Predmet proučevanja so množični pojavi = STATISTIČNA MNOŽICA – SM ali POPULACIJA (rojstva, smrti, prebivalstva, zaposlenost, izvoz, uvoz, inštitucije ali kaj drugega…) in je osnovni pojem na področju statistike. SM je sestavljena iz statističnih enot.
OPREDELJUJOČI POGOJ je opis statistične množice. Je del množičnega pojava, ki izpolnjuje pogoje, ki se nanašajo na vsebino, kraj in čas.
STVARNI OP -SOP KRAJEVNI OP - KOP ČASOVNI OP - ČOPKaj je statistična množica Kje se statistična množica nahaja Kdaj se statistična množica nahaja.Primer:Učenci 7. razreda OŠ v Ljubljani, v šolskem letu 2006/07.
Odgovor:SOP- učenci 7. razreda OŠ,KOP- v Ljubljani,ČOP- leto 2006/07.
STATISTIČNA ENOTA je (en) element statistične množice (pazi!!! Samo enega opredelimo). Je vsak posamezen pojav, ki sestavlja statistično množico:
Realne statistične enote (obstajajo v času in prostoru – kritični moment),Dogodki (smrt, rojstvo, nesreča) = časovni interval,Dogajanja (proizvodnja, nabava) = časovni interval.
Odgovor: Eden učenec.
Značilnosti oz. lastnosti SM so SPREMENLJIVKE oz. VARIABLE, ki so enote iste statistične množice in se med sabo razlikujejo. Delimo jih na:
- atributivne spremenljivke (nominalne in ordinalne) in na- numerične spremenljivke (intervalne in proporcionalne).
Lastnost mora iemti vsaj dve vrednoti, da je lahko spremenljivka.ATRIBUTIVNE SPREMENLJIVKE NUMERIČNE SPREMENLJIVKE
Pove nam natančno kakšna je spremenljivkaNOMINALNE
enaki spremenljivki+različni spremenljivki+primerjava+razlika, ki NI absolutna 0
enaki spremenljivki+različni spremenljivki+primerjava+razlika+razmerja, ki IMA absolutno 0
Če je spremenljivka RAZMERNOSTNA, je tudi NOMINALNA, ORDINALNA in INTERVALNA.Vedno je potrebno povedati najvišjo skupino določitev. Vedno je potrebno napisati zakaj si se odločil za opredelitev.
Naloga:1. Za podatke, ki so navedeni spodaj določite statistično enoto in vrste spremenljivk.
Bruto domači proizvod občin v Sloveniji leta 2002.Statistična enota: ______________________________________________Nominalna spremenljivka: ______________________________________________Ordinalna spremenljivka: ______________________________________________Intervalna spremenljivka: ______________________________________________Razmernostna spremenljivka: ______________________________________________
1
Javna podjetja v Mestni občini Ljubljana dne 31.12.2002 po številu zaposlenih, višini Statistična enota:______________________________________________
Nominalna spremenljivka: ______________________________________________Ordinalna spremenljivka: ______________________________________________Intervalna spremenljivka: ______________________________________________Razmernostna spremenljivka: ______________________________________________Rojeni otroci v Postojni v letu 2000 po spolu in glede na starost matere.Statistična enota: ______________________________________________Nominalna spremenljivka: ______________________________________________Ordinalna spremenljivka: _____________________________________________Intervalna spremenljivka: ______________________________________________Razmernostna spremenljivka: ______________________________________________
2. določi ali je posamezna spremenljivka nominalna, ordinalna, intervalna ali razmernostna oz. proporcionalna
Oddaljenost med dvema krajema ____________________Starost ____________________Število otrok ____________________Cena knjige ____________________Država bivanja ____________________Število točk na preizkusu znanja ____________________Zadovoljnost ____________________Temperatura v oC ____________________
INTERPRETACIJA-ko podatke zberemo, jih dobimo kot neurejeno STATISTIČNO VRSTO uredimo jih po kraju, po opisnih spremenljivkah (stvarno) in po času.
STATISTIČNE VRSTE prikazujemo v:- strukturnih (%) in frekvenčnih (števila) tabelah in/ali- grafikonih. Le-ti so za prikaz številk iz tabel in lahko izbiramo med
● stolpci, ● strukturnimi krogi in ● linijskimi grafikoni.
Tabela je opisna in številčna ocena. Poznamo enostavne statistične tabele in sestavljene statistične tabele (dve statistični vrsti po isti spremenljivki).
Sestavljene statistične tabele (dve statistični vrsti po isti spremenljivki).država uvoz IzvozZDANemčijaAvstrijaKombinacijske statistične tabele ( prikazujemo enote po dveh spremenljivkah hkrati).Opazujemo zaposlene po spolu in po kvalifikaciji.
SpolKvalifikacija Moški Ženski SkupajNKKVVKSVIŠJAVISOKASkupaj
2
Naloga:3. Interpretiraj podatke, prikazane v spodnjih tabelah.
Tabela 1: Frekvenčna in strukturna tabela odgovorov staršev in učiteljev na trditev, »Menim, da je številčna ocena bolj privlačna kot opisna.«, za vrsto anketirancev in stališče hkrati.
Interpretacija: dvakrat imamo 100%, kar pomeni, da predstavljajo 1x starši celoto in 1x učitelji celoto, zato predstavimo tabelo z dvema strukturnima krogoma.Izmed anketiranih staršev se 55,9 % z mnenjem ''…'' strinja, 32,6 % se ne strinja, 11,5 pa je ostalo neopredeljenih.Dobri dve tretjini učiteljev (75,6 %) se z mnenjem ''…'' ne strinja, medtem ko se slaba tetina porazdeli na nestrinjanje 16,2 % in 8,3 % na ne vem.
Tabela 2: Frekvenčna in strukturna tabela odgovorov staršev in učiteljev na trditev, »Menim, da je številčna ocena bolj privlačna kot opisna.«, za vrsto anketirancev in stališče hkrati.
Interpretacija: 100% je samo enkrat, je kot celota, zato interpretiramo, da se izmed vseh anketirancev. Med sabo je potrebno primerjati obe skupini.Anketa je zajela 91 % staršev in 9 % učiteljev. Izmed vseh anketirancev se 50,8 % staršev strinja z mnenjem, da je številčna ocena bolj privlačna kot opisna, 29,7 % staršev se s tem ne strinja, medtem ko je 10,5 % staršev ostalo neopredeljenih.Izmed vseh anketiranih oseb je 1,5 % učiteljev, ki se z mnenjem strinja, 6,8 % se ne strinja in le peščica učiteljev (0,7 %) je ostalo neopredeljenih.
skupaj
se strinjam
53%
ne vem
11%
se ne strinjam
36%
Tabela 3: Frekvenčna in strukturna tabela odgovorov staršev in učiteljev na trditev, »Menim, da je številčna ocena bolj privlačna kot opisna.«, za vrsto anketirancev in stališče hkrati.
se strinjam se ne strinjam ne vem skupaj f f% f f% f f% f f%
Interpretacija: Posamezne statistične spremenljivke predstavljajo celoto (3 x 100%), zato tudi vsako posamezno interpretiramo.Med tistimi, ki se strinjajo z mnenjem '…' je 97,2 % staršev in 2,8 % učiteljev. Med tistimi, ki se ne strinjajo je 81,3 % staršev in 18,7 % učiteljev. Med neopredeljenimi z mnenjem je 93,4 % staršev in 6,6 % učiteljev.
Naredimo tri strukturne kroge, z dvemi polji, za vsako posamezno spremenljivko.
Naloga:4. Število zaposlenih po stopnji izobrazbe in spolu v trgovskem podjetju X, 2002.a) izračunaj izobrazbeno strukturo po spolu zaposlenih in izobrazbeno strukturo celotnega števila zaposlenih.b) izračunaj spolno strukturo posamezne stopnje izobrazbe zaposlenih in spolno strukturo celotnega števila zaposlenih.c) izračunaj strukturo zaposlenih hkrati po spolu in izobrazbi.d) v dveh strukturnih krogih prikaži strukturne odstotke moških in žensk po izobrazbi.e) rezultate pod a) in b) prikaži s strukturnimi stolpci.
Vrednost spremenljivke Stopnja izobrazbe = vrsta spola Srednja Višja Visoka Skupaj
Naloga:5. Študenti in dijaki štipendisti po vrstah štipendij, 31.12.2000.
a) izračunaj strukturo posamezne vrste štipendije po vrstah štipendistov.b) izračunaj strukturo posamezne vrste štipendije po vrstah štipendij.c) izračunaj strukturo štipendistov hkrati po vrsti štipendistov in vrsti štipendij.d) v dveh strukturnih krogih prikaži strukturne odstotke vrst štipendistov po vrsti štipendij (tabela b).
UREJANJE NUMERIČNIH PODATKOVRanžirna vrsta – RANG: če opazujemo manjše število enot po numeričnih spremenljivkah, uredimo podatke po velikosti (npr. 10 zaposlenih po dohodku).
Ranžirna vrsta:X: 10 2 5 6 8 2 7 10
Nevezani rang - vsako število je drugačno:R: 1 2 3 4 5 6 7 8
Vezani rang - vsaj eno število se ponovi:R: 1,5 1,5 3 4 5 6 7,5 7,5
FREKVENČNA PORAZDELITEV –FP ali DISTRIBUCIJA. Če opazujemo večje število enot naredimo ureditev numeričnih podatkov sorodnih vrednosti, kjer so numerične spremenljivke združene v grupe imenovane – RAZREDI.
V vsakem razredu poznamo število enot, ki ima vrednost spremenljivke v ustreznem razredu, to število enot imenujemo – FREKVENCA - f. = število, ki nam pove kolikokrat se posamezna vrednost ponovi.
4
se s trinjam
učitelji
3%
starš i
97%
se ne strinjam
učitelji
19%
starši
81%
ne vem
starš i
93%
učitelji
7%
FREKVENČNA PORAZDELITEV INDIVIDUALNE VREDNOSTI SPREMENLJIVKENarediti moramo tabelo, števila uredimo po zaporedju, od najnižjega k najvišjemu in pod frekvenco vpišemo kolikokrat se posamezne vrednosti ponovijo:
X: 10 2 5 6 8 2 7 10
Vrednost spremenljivke
= X
f
2 25 16 17 18 110 2
FREKVENČNA PORAZDELITEV GRUPIRANE VREDNOSTI SPREMENLJIVKENarediti moramo tabelo, števila uredimo po grupah, od najnižje k najvišji, tako da pri prvi grupi določimo širino razreda- i in pod frekvenco vpišemo koliko števil – vrednosti spremenljivk je vključeno v posamezno grupo:X: 2 2. 5 6 7. 8 10 10
Vrednost Spremenljivke=RAZREDI
f
2 - 4 25 – 7 38 - 10 3- i =3
GAUSOVA KRIVULJAUNIMUDALNA (enovrhna) in SIMETRIČNA
UNIMUDALNA in ASIMETRIČNA V LEVO (v tisto smer kjer je bolj položna)
5
Vrednost spremenljivke
f
1 22 53 84 55 2
1 2 3 4 5Ocena 3 se največkrat ponov.Kolikor je 2 naj bi bilo tudi 4.Kolikor je 1 naj bi bilo tudi 5.
Vrednost spremenljivke
f
1 22 43 64 85 1
Dviga se polagoma nato kar naenkrat strmo pade.
UNIMUDALNA in ASIMETRIČNA V DESNO
BIMODALNA – ima dva vrha in ni potrebno gledati ali je simetrična ali je asimetrična.
POLIMODALNA – ima tri vrhe ali več in ne gledamo ali je simetrična ali je asimetrična.
SREDNJE VREDNOSTI 1. ARITMETIČNA SREDINA – M: iz podanih števil ranga izračunamo povprečje:
X: 10 2 6 5 8
M =∑XN
2. MEDIANA – Me ali CENTRALNA VREDNOST ali 2 KVARTIL : je najbolj natančna srednja vrednost, ker je odvisna od vsakega rezultata. Pomeni tudi četrtino in ji pravimo KVARTIL.
1 2 3 4Je vrednost, ki je v ranžirni vrsti točno na sredini.Najprej rang razvrstimo od najnižjega števila do najvišjega:
- če je liho število je točno na sredini je mediana, X: 2 5 6 8 10 Me = 6
- če pa je sodo število pa izračunamo Me tako, izračunamo povprečje med srednjima vrednositma.X: 2 5 6 V 8 10 11
M =10+2+6+5+8
5=
315
= 6,20
6
Vrednostspremenljivke
f
1 12 103 84 65 3
Strmo se dvigne nato polagoma pada.
X x
X X X
3. SREDNJA VREDNOST = MODUS - Mo ali MODALNA VREDNOST je tista vrednost, ki se največkrat ponovi. X: 2 5 6 V 8 10 11
Odgovor: u se modusa ne da določiti, MODUS JE NEDOLOČLJIV.
Modus imenjujemo tudi GOSTIŠČE:X: 2 3 5 5 5 6 7
Mo=5 X: 2 3 5 5 V 6 6 7 8
Mo1 = 55+6 Mo2 = 6 2 Mo = 5,50
X: 2 3 5 5 6 7 7 8 Mo1 = 5 Rezultate pustimo,določimoMo2 = 6 samo dva modusa, kajti 6 NI število,
ki se večkrat ponovi – kar pa ni res.Naloga:Osmošolci so reševali 12 nalog iz matematike. Spremenljivka X je število pravilno rešenih nalog. Izračunaj povprečno število pravilno rešenih nalog.X: 0 1 2 3 4 5 6 7 8 9 10 11 12 f: 3 7 10 18 29 36 42 30 22 9 6 3 1
SREDNJE VREDNOSTI V FREKVENČNI PORAZDELITVI Kumulativna frekvenca – pove nam koliko frekvenc je pred posameznim razredom (PRVI RAZRED JE VEDNO 0)Frekvenca – 7 ŠTUDENTOV JE PISALO OD 2-5 TOČK.
Vrednost spremenljivke
RAZRED
f F
2 - 5 7 06 - 9 10 7
10 - 13 15 17
Me =6+8
2= 7,00
M =216
1.201= 5,56
7
14 - 17 5 3218 - 21 2 37Skupaj 39 93
Zanima nas število točk!Odgovor: 37 učencev je pisalo manj kot 18 točk.
KADAR IMAMO PODATKE S KUMULATIVNO FREKVENCO – računamo ARITMETIČNO SREDINO.
Xo =sredina zadnjega razreda oz. razreda v katerem so najvišje vrednosti spremenljivkeXo = 18+21/2= 19,50i= 4∑F=0+7+17+32+37=93N=7+10+15+5+2 ali 2+37 =39 seštejemo vse frekvence ali pa k zadnji kumulativni prištejemo zadnjo frekvenco.M=19,50 – (4*93/39) = 19,50 – 9,54 = 9,96
Izračunamo še SUROVI MODUS – Mo: to je tisti razred, ki je najvišji, vendar ni natančen Mo, ker ne vemo kakšne so vrednosti znotraj razreda.Mo = (10+3)/2 =11,50
Pri EKSTREMNIH vrednostih ali rezultatih je bolj smiselno računati MEDIANO in NE POVPREČJE.Modus računamo tudi kadar imamo ATRIBUTIVNO SPREMENLJIVKO, kadar rečemo ''Največ je bilo moških… ali''Največ jih je prišlo iz tega kraja…''Izračunaj povprečno starost moških:i = 5
Računamo aritmetično sredino M=Xo-(i*∑F)/N in surovi modus . i=4∑F=44N=22Xo=povprečje zadnjega razreda, Xo=(46+49)/2=47,50Mo=Surovi modus=približek je povprečje razreda z najvišjo frekvenco, Mo=(42+45)/2=43,50M=Xo-(i*∑F) / NM=47,50 - (4*44) / 22 = 39,50 Odgovor: povprečje je 39,50, ocena surovega modusa je 43,50
SKUPNA TEHTANA ali PONDERIRANA ARITMETIČNA SREDINA
Y =(Ỳ1*f1+ Ỳ2*f2+ Ỳ3*f3+….)
vsota vseh zaposlenih(f1+f2+f3+f4+…)
Naloga: Povprečje mesečne neto plače na zaposleno osebo ter število zaposlenih po regijah Slovenije, 2001. Izračunaj povprečno plačo proučevanih regij.
= 53736/382=140,67Povprečna mesečna plača med proučevanimi regijami je 140,67 SIT.
MERE RAZPRŠENOSTI je natančen prikaz vrednosti, ker upošteva vse rezultate in v kakšnih intervalih so rezultati doseženi. MR – so bolj ali manj razpršene. Mere razpršenosti iz ranžirne vrste.Pet študentov po doseženih rezultatih…
X: 2 5 6 8 10
VARIACIJSKI RAZMIK – VR: nam pove razpon rezultatov oz. koliko vrednosti je možnih med min-vrednostjo in max-vrednostjo.
(+1) so NEZVEZNE SPREMENLJIVKE, to so tiste, ki zajemajo samo določene vrednosti X: 1 2 3X: 1 1,5 2 2,3 3Zvezne spremenljivke zajemajo vse vrednosti, tudi tiste z decimalnimi vejicami. 1 2
X: 2 5 6 8 10
M =315
= 6,20
VR = Xmax – X min (+1)
9
VR = 10 – 2 + 1 = 9,00Odgovor: v našem primeru je 9 možnih vrednosti.
Rezultatov je lahko veliko več. Večji je VR, večja je verjetnost razpršenosti. (razpon med 2….10 je pri 2=1,5 in pri 10,50), zato računamo VR z največ možnimi vrednostmi: VR=10,50-1,50=9,00
Katera je tista maksimalna vrednost, ki jo še lahko zaokrožimo navzgor v našem primeru? Odgovor za naš primer = 10,50.
Katera je tista minimalna vrednost, ki jo še lahko zaokrožimo navzdol v našem primeru? Odgovor za naš primer= 9,00.
ZANESLJIVA MERA RAZPRŠENOSTI ali OSNOVNA MERA RAZPRŠENOSTI ali VARIANCAVarianca je povprečje kvadratnih odklonov, vseh rezultatov, od aritmetične sredine.Z varianco računamo povprečje razpršenosti.
Varianca se NE interpretira temveč lahko izračunamo STANDARDNI ODKLON , ki nam primer bolj natančno pojasni in pove kje okoli aritmetična sredine je večina rezultatov.
c) Izračunamo standardni odklon.
= 2,71Večina rezultatov je za 2,71 nad (+)oz. pod (-)aritmetično sredino. Rezultat je +2,71.
Če k aritmetični sredini prištejemo standardni odklon dobimo ZGORNJO MEJO INTERVALOV in če od aritmetične sredine odštejemo standardni odklon dobimo SPODNJO MEJO INTERVALOV.
d) Izračunamo aritmetično sredino
e) Izračunaj in določi razpon oz. zgornjo in spodnjo mejo intervalov.Zgornja meja intervalov: 6,20+2,71=8,91Spodnja meja intervalov: 6,20-2,71=3,49
Odgovor: Večino rezultatov je v razponu med:3,49 < večino rezultatov >8,91
X: 2 5 6 8 10
Eden standardni odklon pomeni nad aritmetično sredino.
σ2 =
∑(X-M) 2 N
σ2 =
∑X 2 -((∑X) 2 /N) N
σ2 =
∑X 2 -((∑X) 2 /N) N
σ = σ2
M =315
= 6,20
10
Naloga: merimo zadovoljstvo delavcev in imamo podatke: Šolska ocena 3 je aritmetična sredina – M=3. Ker nam samo en podatek na pove veliko, dodamo še standardni odklon, ki nam pojasni kakšne rezultate smo dobili. Predvidevamo po Gausovi krivulji, da:
σ = 0 da so vsi dobili oceno 3,σ = 1 da so eni dobili oceno 4 in drugi oceno 2,σ = 2 da jih je nekaj dobilo oceno 5 na eni strani prav toliko 1 na drugi strani.
Naloga: Spremenljivka X je število let delovne dobe učiteljev neke šole. Izračunaj VR – variacijski razmik, σ 2-varianco in σ-standardni odklon.X: 9 6 11 18 4 2 23 1 10 11 21 5 8 3 25 16 14 = 187a) kvadriraš in izračunaš aritmetično sredino:
Kadar nimamo ranžirne vrste in imamo na razpolago razrede pa računamo varianco:
F=KUMULATIVA-vedno se začne z 0, nato seštevamo predhodno število z levim številom.FF=KUMULATIVA KUMULATIVNIH FREKVENC-vedno se začne z dvema zaporednima 0, nato seštevamo predhodno število z levim številom. Pove nam koliko kumulativnih frekvenc ej pred posameznim razredom (za enim nazaj).
UNIMUDALNA in ASIMETRIČNA V LEVOi=4N=89∑f=89∑F=283∑FF=430
=koren43,712 =6,61 Večina rezultatov je okoli +6,61.
= 41 – 10(+1)=31+1=32 VR=41,5-9,5=32
Izračunamo modalno vrednost ali MODUS-Mo (po najvišjem razredu). Mo=(26+29) / 2 =27,50
In kadar imamo podatke v … porazdelitvi izračunamo še ARITMETIČNO SREDINO:
M= 26,78
Naloga 5/2:Merili smo čas, ki so ga učenci porabili za prevod angleške povedi v slovenščino. Čas je izražen v sekundah.Izračunaj povprečni čas, ki so ga porabili za prevod, varianco in standardni odklon.
=koren370,93 =19,26 Večina rezultatov je okoli +19,26.
Variacijski razmik:
= 159 – 60(+1)=99+1=100 VR=159,5-59,5=100
Modus je:Mo=(100+109)/2=104,50
Aritmetična sredina je:Xo-IZRAČUNAŠ IZ ZADNJEGA RAZREDAXo=(150+159)/2=154,50
M=106,62
σ2 =
I 2* (∑FF+∑FF+∑F- (∑F) 2 /N)) N
σ2 =
10 2* (1289+1289+565 - (565) 2 /118)) 118
σ2 =100 * (1289+1289+565-2705,2966)
118
σ2 =100 * 4377034
118
σ2 =43770,34
118 =
370,93
σ = σ2
VR = Xmax – X min (+1)
M = Xo- I*∑FN
M = 154,50 -10*565
118
M = 154,50 - 47,88
13
KORELACIJA nam pove kakšna je povezanost med dvema spremenljivkama, torej kakšna je SMER povezanosti in MOČ-JAKOST-STOPNJA povezanosti.
SMER POVEZANOSTI je lahko:POZITIVNA NEGATIVNA
Kadar spremenljivke prve vrednosti naraščajo – naraščajo tudi vrednosti druge spremenljivke.Če narašča X, narašča tudi Y.Kadar gre za urejanje. Dve spremenljivki, kadar sta pozitivno povezani.
- večja kot je plača večja je kupna moč,- več dela ko opraviš, večja je plača
Kadar spremenljivke prve vrednosti naraščajo –vrednosti druge spremenljivke padajo.Če narašča X, Y pada.
- čas učenja narašča=napake se večajo.-
Kakšna je smer (grafikon) nam pove izračun Kakšna je jakost pa pogledamo lestvico.JAKOST od – do POVEZANOST0 - 0,20 Zanemarljiva ali naključna0,20 – 0,40 Šibka ali nizka0,40 – 0,70 Srednje močna0,70 – 0,90 Močna0,90 – 1,00 Popolna-1/+1In kako se rezultat KORELACIJE INTERPRETIRA?PEARSON-ov KORELACIJSKI KOEFICIENT – izračunamo ga kadar imamo dve numerični spremenljivki (npr. višina in telesna teža), ki sta medsebojno povezani.Spremeljivki X inY ne smemo nič urejati, ker imamo podatke točno za vsakega otroka posebej.
Višina X: 86 90 88 92 96 88 93 95 = 728Teža Y: 14 17 16 15 22 12 14 13 = 121a) števila med sabo pomnožimo za vsakega otoka posebej po višini in teži (86*14=1204….X*Y: 1204+1530+1408+1380+1920+1056+1302+1235=11.035b) kvadriramo X in seštejemo vsoto:X2: 7396 8100 7744 8464 9216 7744 8649 9025 = 66.338b) kvadriramo Y in seštejemo vsoto:Y2: 196 289 256 225 400 144 196 169 = 1..875∑x=728∑y=121∑xy=11.035∑x2=66.338∑y2=1.875N = 8
Kx = ∑x2-(∑x) 2
NKx=66.338-(7282/8)=66.338-66.248=90,00
Ky = ∑y2-(∑y) 2
NKy=1.875-(1212/8)=1.875-1.830=44,87
Kxy = ∑xy-∑x*∑y
NKxy=11.035-((728*121)/8)=11.035-11.011=24,00
rxy=. Kxy .
Kx*Ky. 24,00 . 90,00*44,87
. 24,00 .4038,30
24,0063,55
=0,38
Je pozitivna šibka ali nizka povezanost.
Naloga 6/2:Učenci so pri pouku dveh tujih jezikov pisali narek. Za vsakega učenca vemo, koliko napak je naredil pri nareku v angleškem jeziku(spremenljivka X) in koliko pri nareku v namškem jeziku (spremenljivka Y). izračunajte KORELACIJO med spremenljivkama.
Višina X: 2 7 10 0 1 18 5 15 6 1 = 65Teža Y: 5 9 5 2 0 21 10 11 6 3 = 72a) števila med sabo pomnožimo za vsakega otoka posebej po višini in teži (86*14=1204….X*Y: 10+63+50+0+0+378+50+165+36+3=755
14
b) kvadriramo X in seštejemo vsoto:X2: 4 49 100 0 1 324 25 225 36 1 = 765b) kvadriramo Y in seštejemo vsoto:Y2: 25 81 25 4 0 441 100 121 36 9 = 842∑x=65∑y=72∑xy=755∑x2=765∑y2=842N = 10
Je pozitivna močna povezanost.SPEARMAN-ov KORELACIJSKI KOEFICIENT ς-RO – izračunamo ga kadar imamo dva nevezana ranga. Izračunamo ga hitreje kot Pearsenov korelacijski koeficient.
ς=1- 6* Σd2
N(N2-1)KonstantiSpreminjata se samo d in N.
Naloga: moški in ženske razvrščajo posamezne predmete po priljubljenosti.Vrednost
spremenljivke= vrsta jezika
MOŠKI ŽENSKEd
(m-ž)d2
SLOVENSKI JEZIK 5 1 4 16TUJ JEZIK 11 3 8 64
MATEMATIKA 4 6 -2 4BIOLOGIJA 8 9 -1 1
ZGODOVINA 9 8 1 1ZEMLJEPIS 6 7 -1 1
LIKOVNA V. 1 5 -4 16ŠPORTNAV 3 10 -7 49
GLASBENA V. 7 4 3 9TEHNIČNA V. 2 11 -9 81
GOSPODINJSTVP 10 2 8 64Skupaj, N=11 66 66 0 306
V takem primeru je numerus 11 predmetov=število področij.
Iščemo razliko med rangoma, ki jo ima posamezno področje.
ς= 1-6* Σd2
N(N2-1)= 1-
6*30611(112-1)
= 1- (1836/1331) =1-1,38 = -0,38
Je negativna šibka povezanost.Vidimo, da gre pri večini predmetov za nasprotja.
Naloga 6/3:V dveh vzgojnih skupinah so otroci razvrščali igrače po priljubljenosti. Izračunajte korelacijo jmed razvrstitvijo, ki so jo naredili otroci v prvi skupini (spremenljivka X) in razvrstitvijo v drugi skupini (spremenljivka Y).
Naloga:Učitelj matematike je učence rangiral na osnovi lastnega znanja po njihovem znanju(=X) iz števila točk (=Y), ki so jih učenci zbrali na eksternem preverjanju znanja iz matematike.
Imamo rang torej samo numerične spremenljivke, kar pomeni, da moramo nekaj spremeniti. Numerične vrednosti v X lahko rangiramo, kadar imamo nižje št. točk od Y), zato naredimo rang-1, da dobimo 2 ranga (X in R) in nato računamo SPEARMAN-ov.KORELAC.KOEFICIENT.
.χ2-PREIZKUS = INFERENČNA STATISTIKA – pomeni posploševanje
Kadar uporabljamo ankete raziskav po vzorcu, ko imamo nekaj ljudi – anketirajo in posplošijo na celo množico. χ2- preizkus računamo, kadar imamo atributivne spremenljivke.
a) Obe spremenljivki med sabo povežemo in postavimo vprašanje. Npr.: Ali se med M in Ž pojavljajo razlike glede ukvarjanja s športom?
b) Raziskovalna hipoteza Ho: Med M in Ž se pojavljajo razlike glede ukvarjanja s športom.c) Med M in Ž ni razlik med ukvarjanjem s športom.
Ukvarjanje s športom
spremenljivka Malo Srednje Veliko Skupaj
M 10 20 50 80
Ž 90 90 50 230
Skupaj 100 110 100 310
Postavimo HIPOTEZO: Ho; M in Ž se enako ukvarjajo s športom.
Hipoteze: - če ničelno sprejmemo – raziskavo zavržemo,- če ničelno ne sprejmemo – z raziskavo nadaljujemo.
Pri raziskavi računamo:- ali stvarne frekvence – empirične =fE-dobimo dejanske odgovore - ali pričakovane frekv. – teoretične =fT-odgovori, ki naj bi jih dobili, če bi Ho (ničelna hipoteza) držala, da med M in Ž
ni razlik.
Izračunamo vse teoretične frekvence za obe spremenljivki posebej.
N=300
MALO-MOŠKI
Teoretična frekvenca za moške, ki se malo ukvarjajo s športom = 25,81
SREDNJE-MOŠKI
Teoretična frekvenca za moške, ki se srednje ukvarjajo s športom = 28,39
VELIKO-MOŠKI
fT= Fv*fkN
fT =80*100
310 = 25,81
fT =80*110
310 = 28,39
17
Teoretična frekvenca za moške, ki se veliko ukvarjajo s športom = 25,81
Vse teoretične frekvence za moške seštejemo:fT=25,81+28,39+25,81=80,01_________________________________________
MALO-ŽENSKE
Teoretična frekvenca za ženske, ki se malo ukvarjajo s športom = 74,19
SREDNJE- ŽENSKE
Teoretična frekvenca za ženske, ki se srednje ukvarjajo s športom = 81,61
VELIKO- ŽENSKETeoretična frekvenca za ženske, ki se veliko ukvarjajo s športom = 74,19
Vse teoretične frekvence za zenske seštejemo:fT=74,19+81,61+74,19=229,99In če seštejemo izračunani teoretični frekvenci za M+Ž = 80,01+229,99=310 – moramo dobiti isti rezultat, kar pomeni, da smo delali samo razporeditev po tabeli med spremenljivkama in izborom ukvarjanja s športom.
Da odgovorimo na našo hipotezo Ho – moramo izračunati χ2- preizkus, in sicer:
=(10-25,81)2
25,81+(20-28,39)2
28,39+(50-25,81)2
25,81+(90-74,19)2
74,19+(90-81,61)2
81,61+(50-74,19)2
74,19+=
=249,9625,81+
70,3928,39+
585,1625,81+
249,9674,19+
70,3981,61+
85,1674,19+
=
= 9,68+ 2,48+ 22,67+ 3,37+ 0,87+ 7,89 =
d) PROSTOSTNE STOPNJE nam povedo kako velika je tabela.v-vrstice,k-kolone
g=(2-1)*(3-1)=1*2=2
STOPNJA TVEGANJA NE SME BITI VEČJA OD 5 !!!!! Uporabljamo tri ravni tveganja:P= 0,05 * 100 = 5%P= 0,01 * 100 = 1%P= 0,001 * 100 = 0,1%
Odgovor: χ2=46,95 > χ2(g=2; P=0,001)=13,81.
Izračunali smo višji rezultat od postavljenega 5 (5,991), zato Ho-ZAVRŽEMO.VEDNO SE ODLOČIMO PRI 5% TVEGANJU.V tablice tabela c se postavimo v 2 (g=2) vrstico in poiščemo stopnjo tveganja tako, da vzamemo najbližji rezultat našemu dobljenemu tveganju-manj ko tvegamo bolje je . V našem primeru je to 13,82, kar pomeni, da Ho-zavržemo s tveganjem 0,1%.Pri 1% tveganju bi bil rezultat 9,210, ker je rezultat večji se nato odločimo za večje tveganje, to ja 0,1% oz. 13,82.
Primer, če bi dobili rezultat χ2=4,95 < χ 2 (g=2;P=0,05) =5,991
Ugotovimo, da ima izračunani rezultat pri 5% nižjo vrednost=zato Ho-SPREJMEMO.
fT =80*100
310 = 25,81
fT =230*100
310 = 74,19
fT =230*110
310 = 81,61
fT =230*100
310 = 74,19
χ2= (fE-fT) 2 fT
χ2= 46,95
g= (v-1)*(k-1)
18
V tem primeru nam ni potrebno nadaljnje gledati po tabeli in iskati približno vrednost za % tveganja.
Primer, če bi dobili rezultat χ2=6,50 > χ 2 (g=2;P=0,05) =5,991; Ho-ZAVRŽEMO s 5% tveganjem
Naloga:Ugotavljali smo ali so med različno starimi anketiranci priljubljene različne zvrsti filmov.
a) zapiši hipotezo neodvisnosti in ugotovi ali je v osnovni množici priljubljenost akcijskega filma odvisna od starosti anketirancev.
Skupaj (fK) 244 244,00 48,95 135 135,00 9,54 123 123,00 45,57 502a) Ho=priljubljenost akcijskega filma ni odvisna od starosti. UPOŠTEVATI V NAŠEM PROJEKTU!
Na vprašanje dobimo vedno odgovor :i=5, N=502
Izračunamo vse teoretične frekvence za obe spremenljivki (PRILJUBLJENOST* STAROST) posebej.
N=502ZELO PRILJUBLJEN, 5-9 let:
Teoretična frekvenca za priljubljenost akcijskega filma v starosti od 5 – 9 let = 48,61
ZELO PRILJUBLJEN, 10-14 let:
Teoretična frekvenca za priljubljenost akcijskega filma v starosti od 10 – 14 let = 43,75
In tako naprej izračunamo za vse frekvence (vrste in kolon), kontrola, če smo prav izračunali je, da vse rezultate izračunanih teoretičnih frekvenc seštejemo in dobimo numerus N=502.
Da pa χ2 –preizkus sploh lahko računamo morata biti izpolnjena dva pogoja. Oba pogoja se nanašata na numerične spremenljivke.
1. pogoj: nobena fT ne sme biti manjša od 1 in2. pogoj: 20% fT ne sme biti manjših od 5.
Kaj naredimo ko pogoja nista izpolnjena? Imamo 3 možnosti:1. Ne naredimo nič in samo predstavimo % oz. frekvence, ki so predstavljene v tabeli.2. Združimo kategoriji, če bi imeli lestvico in če bi premalo ljudi ne dalo neko oceno, takrat družimo kategorije.
X: 1 2 3 4 510 15 45 20 10 =25 45 =30
Pri tabeli združevanje ni zaželeno!
3. Uporabimo nadomestek za χ2 –preizkus, ki ga imenujemo KULLBACKOV 2Î PREIZKUS. Uporabimo ga kadarkoli, vendar ni tako natančen kot χ2 –preizkus.
LIKELIHOOD RATIO – to je identičen preizkus kot KULLBACKOV 2Î PREIZKUS.Izračun naše χ2 –preizkus naloge:
Odločimo se ali Ho-SPREJMEMO ali Ho-ZAVRNEMO. P=0,05; P= 0,01; P= 0,001.
g=(5-1)*(3-1)=4*2=8, v tablicah iščemo najbližjo vrednost v vrstici 8!!!Naš rezultat je 104,06 in je večji kot je v tabeli C, ki je pri 5% tveganju =15,51, nato pogledamo pri 1% tveganju, ki je =20,09, rezultat je še vedno večji, potem se odločimo za najbližji znesek tabele, to je pri 0,1% tveganju=26,12 ter napišemo: χ2=104,06> χ2(g=8; P=0,001)=26,12.
Odgovor: Vrednost χ2 –preizkus JE STATISTIČNO POMEMBNA na ravni P=0,001. Ho-ZAVRNEMO in s tveganjem 0,1% (P*100) trdimo, da je v osnovni množici priljubljenost akcijskega filma odvisna od anketirancev (udeležencev).
Primer odgovora, če bi pri isti nalogi dobili rezultat 10,40 : χ2=10,40> χ2(g=8; P=0,05)=15,51
Odgovor nam pove INTERPRETACIJO: Vrednost χ2 –preizkus NI STATISTIČNO POMEMBNA na ravni P=0,05. Ho-OBDRŽIMO in s tveganjem 5% trdimo, da NI v osnovni množici priljubljenost akcijskega filma odvisna od anketirancev (udeležencev).
INTERPRETIRAMO lahko tudi tako:
Na priljubljenost akcijskega filma starost udeležencev (anketirancev) NE vpliva STATISTIČNO POMEMBNO.aliMed različno starimi anketiranci NI STATISTIČNO POMEMBNIH RAZLIK glede priljubljenosti gledanja akcijskih filmov.
Če v naši nalogi izračunamo še odstotne deleže:(pazi % prikaži na eno decimalno vejico).
Odstotni deleži pa nam povejo komu je akcijski film bolj všeč in komu manj všeč.Sam χ2 –preizkus nam ne pove kaj dosti, χ2 –preizkus skupaj s %, pa nam povesta veliko več.
Odgovorna primer za prvo vrstico : V starosti od 5 - 9 let delež tistih anketirancev, ki ocenjujejo, da jim je akcijski film všeč narašča, medtem ko, delež anketirancev, ki ocenjujejo, da jim film ni všeč pa upada.
5% tveganje pomeni, da 5 % populacije izpade iz ugotovitev do katerih smo z izračuni prišli, torej se razdeli po Gausovi krivulji na levo stran 2,5 % in prav toliko, 2,5 %, na desno stran.V našem primeru pomeni, da se 5 % populacije ''to'' ne zadeva.
Če bi imeli 1% tveganje, bi porazdelitev pomenila 2 x 0,5 %.
χ2 –preizkus nam podatke posploši na osnovno množico, to pa velja samo takrat, če imamo slučajnostni oz. reprezentativni vzorec.
VZORCI RAZISKAV1. Vsako enoto, ki jo vzamemo v raziskavo ima enako možnosti, da jo zajamemo v raziskavo. Tako raziskavo
imenujemo SLUČAJNOSTNI VZOREC, ki ga zagotovimo ali z žrebom ali z računalnikom.
2. Kadar pa vse enote nimajo enake možnosti, da bi bile zajete v raziskavo to imenujemo NESLUČAJNOSTNI VZOREC, ki ga delimo na :
o PRILOŽNOSTNI VZOREC (izkoristimo tisto, kar nam ponuja priložnost) in o NAMENSKI VZOREC (izbiramo ljudi s točno določenim namenom).
Oba vzorca, tako priložnostni, kot namenski, nista nikoli tako reprezentativna kot je slučajnostni vzorec, sta le lažja za izračun.
Naloga: Učitelji, ki poučujejo različna predmetna področja so odgovarjali na vprašanje, ali jih je študij ustrezno usposobil za vodenje določenih interesnih dejavnosti.
Odločimo se ali Ho-SPREJMEMO ali Ho-ZAVRNEMO. P=0,05; P= 0,01; P= 0,001.Ker imamo rezultat večji od 5 – Ho-ZAVRNEMO in interpretiramo:
Med učitelji različnih predmetnih področij NI STATISTIČNO POMEMBNIH RAZLIK glede njihove usposobljenosti za vodenje interesnih dejavnosti.
Če bi imeli raziskovalni primer, da bi Ho-sprejeli bi interpretirali, da med učitelji različnih predmetnih področij SO STATISTIČNO POMEMBNE RAZLIKE glede njihove usposobljenosti za vodenje interesnih dejavnosti.
3.) g=(3-1)*(3-1)=2*2=4, v tablicah iščemo najbližjo vrednost v vrstici 4 !!!Naš rezultat je 50,02 in je večji kot je v tabeli C, ki je pri 5% tveganju =9,488, nato pogledamo pri 1% tveganju, ki je =13,28, rezultat je še vedno večji, potem se odločimo za najbližji znesek tabele, to je pri 0,1% tveganju=18,47 ter napišemo: χ2=50,02> χ2(g=4; P=0,001)=18,47.
Odgovor z interpretacijo: Vrednost χ2 –preizkus JE STATISTIČNO POMEMBNA na ravni P=0,001. Ho-ZAVRNEMO in s tveganjem 0,1% (P*100) trdimo (sprejmemo), da SE v osnovni množici med učitelji različnih predmetnih področij POJAVLJAJO STATISTIČNO POMEMBNE RAZLIKE glede njihove usposobljenosti za vodenje interesnih dejavnosti.
CROSSTABS - KRIŽNE TABELEso računalniški izpisi za χ2 –preizkus , ki se imenujejo SPSS=program za celotne družboslovne vede.Tabela 1: Case Processing Sumary (sestava preračunanih vsot)
Cases
Valid Missing Total
Vrednost spremenljivke= dve množeni spremenljivki
N Percent N Percent N Percent
A: Vrsta anketiranca*kakšno avtoriteto
predstavljajo učitelji 2.542 84,8 455 15,2 2.997 100,0
B: Vrsta anketiranca*kako spoštuješ
učitelje vaše šole 2.717 90,7 280 9,3 2.997 100,0A:Tabela 2: Crosstab Kakšno avtoriteto predstavljajo učitelji
Vrsta anketiranca Nič Malo Srednje VelikoZelo
veliko Total
Učenci Count - število 33 58 328 637 272 1.328
% within vrsta anketiranca 2,5 4,4 24,7 48,0 20,5 100,0
Starši Count - število 10 22 236 499 258 1.025
% within vrsta anketiranca 1,0 2,1 23,0 48,7 25,2 100,0
Učitelji Count - število 0 1 19 86 25 131
% within vrsta anketiranca 0,0 0,8 14,5 65,6 19,1 100,0
Ravnatelji Count - število 0 0 22 33 3 58
% within vrsta anketiranca 0,0 0,0 37,9 56,9 5,2 100,0
Total Count - število 43 81 605 1.255 558 2.542
% within vrsta anketiranca 1,7 3,2 23,8 49,4 22,0 100,0
Crosstab ( vrsta anketiranca*kakšno avtoriteto predstavljajo učitelji)
Pomembna je ta - druga tabela (frekvenca in %) in tabela spodaj.
χ2= (fE-fT) 2 fT
χ2= 50,02
g= (v-1)*(k-1)
22
Tabela 3: Chi-Square Test (=χ2 –preizkus)Vrednost
spremenljivkeValue df Asymp.Sig.
(2-sided)
Pearson Chi-Square 57,532a 12 ,000Likelihood Ratio 65,953 12 ,000Linear-by-Linear 9,814 1 ,002N of valid Cases 2.542
a. 4. cels (20%) have expected count less than 5. The minimum Expected count is ,98.
Pearson Chi-Square = Računalniški izračuna χ2 –preizkus.df=gAsymp.Sig.=stopnja tveganja-P, vejica spredaj pomeni, da damo spredaj 0, kar pomeni P=0,000 < 5 % in Ho-ZAVRNEMO.a. 4. cels (20%) have expected count less than 5. The minimum Expected count is ,98. = 20 % teoretičnih frekvenc je manjših od 5. Najnižja teoretična frekvenca = 0,98. Expected count is ,98 = teoretična frekvenca (izračunamo je, ker ni manjša od 0 % oz. je manjša od 5 %).
Primer interpretacije, ko imamo podatek za χ2 –preizkus = 57,532a:- če bi imeli dva osnovna pogoja izpolnjena in če eden ni izpolnjen do 5%-zavrnemo,- če postavimo Ho-v mnenjih ni razlik (da povežemo dve spremenljivki)
Odgovor z interpretacijo:.ali: Ho-ZAVRNEMO χ2=57,532> χ2(g=12; P=0,000) Med učenci, starši, učitelji in ravnatelji NI STATISTIČNO POMEMBNIH RAZLIK glede njihovega mnenja o tem, kakšno avtoriteto predstavljajo učitelji učencem..ali: Vrednost Cullbackovega 2Î-preizkusa je statistično pomembna na ravni P=0,000 2Î=65,953 > 2Î(g=12; P=0,000) Ho-ZAVRNEMO s tveganjem, manjšim od 0,1% trdimo, da SE v osnovni množici med učenci, starši, učitelji in ravnatelji POJAVLJAJO STATISTIČNO POMEMBNE razlike glede tega kakšno avtoriteto predstavljajo učitelji učencem.B:Tabela 4: Crosstab Koliko spoštuješ učitelje vaše šole
Vrsta anketiranca Nič Malo Srednje Veliko Zelo veliko Total
Učenci Count - število 32 47 176 573 500 1.328
% within vrsta anketiranca 2,5 3,5 13,3 43,1 37,7 100,1
Starši Count - število 3 7 132 527 488 1.157
% within vrsta anketiranca 0,3 0,7 12,9 51,4 47,6 112,9
Učitelji Count - število 0 2 27 115 30 174
% within vrsta anketiranca 0,0 1,5 20,6 87,8 22,9 132,8
Ravnatelji Count - število 0 0 18 34 6 58
% within vrsta anketiranca 0,0 0,0 31,0 58,6 10,3 100,0
Total Count - število 35 56 353 1.249 1.024 2.717
% within vrsta anketiranca 1,4 2,2 13,9 49,1 40,3 106,9
Crosstab ( vrsta anketiranca*koliko spoštuješ učitelje vaše šole)
Tabela 5: Chi-Square Test (=χ2 –preizkus)Vrednost
spremenljivkeValue df Asymp.Sig.
(2-sided)
Pearson Chi-Square 127,712a 12 ,000Likelihood Ratio 139,529 12 ,000Linear-by-Linear ,230 1 ,631N of valid Cases 2.717
a. 4. cels (20%) have expected count less than 5. The minimum Expected count is ,75.
PREIZKUS PRI NUMERIČNIH SPREMENLJIVKAH uporabimo Z-preizkus = T-test
Uporabimo ga vedno kadar imamo dve skupini (M,Ž). Z-preizkus temelji na primerjavi aritmetičnih sredin.Ugotavljamo ali se aritmetični sredini dveh osnovnih množic MED SABO STATISTIČNO POMEMBNO RAZLIKUJETA.Večji, kot je vzorec manj je statističnih razlik.
Zanima nas kakšna bo aritmetična sredina dveh osnovnih množic, to je aritmetična sredina Ž=Y in aritmetična sredina M=X.N=13
Kadar računamo aritmetično sredino pri vzorčenju
Kadar se podatki nanašajo na osnovno množico v vzorcu uporabimo sledeče oznake:M=P%= p%N= n.σ 2= s2
Varianca :
Pri vzorcih upoštevaj – 1!Posebej računamo varianco za X in posebej za Y.
PAZI! LOČITI JE POTREBNO ali je vzorec ali je osnovna množica: Če imamo osnovno množico samo računamo, če pa je vzorec je na osnovi podatkov potrebno izračunati osnovno množico, ko gre za posploševanje.
SE = ocena standardne napake, ki nam pove kakšna je razlika med vzorci: večja je ocena standardne napake manj so vzorci reprezantativni.
SE= =1,05
=
Rezultat Z-preizkus preverimo Ho, ki nam pove, da SE aritmetični sredini naših množic med sabo NE RAZLIKUJETA STATISTIČNO POMEMBNO.
Ho: Mx – My = 0 (6,30-7,85=-1,55) (-spremenimo v +=1,55)
|Z| ≥1,96 →Ho-ZAVRNEMO s 5% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|<1,96 →Ho-OBDRŽIMO (aritmetični sredini osnovnih možic se ne razlikuje statistično pomembno).|Z|≥2,58 →Ho-ZAVRNEMO z 1% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|≥3,29 →Ho-ZAVRNEMO z 0,1% tveganjem in trdimo, da se razlikujeta statistično pomembno.
Če je absolutna vrednost |Z| večja od 1,96 Ho-ZAVRNEMO(interpretiramo, da se razlikuje statistično pomembno).Če je absolutna vrednost |Z| manjša od 1,96 Ho-OBDRŽIMO interpretiramo, da se ne razlikuje statistično pomembno).
Odgovor z interpretacijo :|Z|=1,55<1,96; Ho-OBDRŽIMOPovprečno število točk, ki so jih zbrali učenci in povprečno število točk, ki so jih zbrale učenke se med sabo ne razlikujestatistično pomembno.
Naloga:V dveh vzorcih učencev osnovnih šol smo preverjali njihovo znanje o astronomiji (spremenljivka x je število točk na preizkusu znanja). Zbrali smo sledeče rezultate:
= 120 = 230
=25,13 =29,27.s1=3,20 .s2=5,60
Preizkusi ničelno hipotezo o razliki populacijskih aritmetičnih sredin.1.: Ho: M1 – M2 = 0 (predpostavljamo, da se statistični množici med sabo ne razlikujeta)
= =0,47
=
|Z|=8,81 ≥ 3,29; Ho-ZAVRNEMO in s tveganjem manjšim od 0,1% trdimo, da se aritmetični sredini osnovnih množic statistično pomembno razlikujeta. Naloga: KADAR IMAMO PODATKE V FREKVENČNI PORAZDELITVI
Z-preizkus nam da odgovor ali bomo Ho-sprejeli ali mo Ho-zavrnili, če je:|Z| ≥1,96→Ho-ZAVRNEMO s 5% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|<1,96 →Ho-OBDRŽIMO (aritmetični sredini osnovnih možic se ne razlikuje statistično pomembno).|Z|≥2,58 →Ho-ZAVRNEMO z 1% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|≥3,29 →Ho-ZAVRNEMO z 0,1% tveganjem in trdimo, da se razlikujeta statistično pomembno.
V našem primeru je rezultat: |Z|1,97>1,96; Ho-ZAVRNEMO. |Z|=1,97, kar pomeni, da je večji od 1,96 in Ho-ZAVRNEMO s 5% tveganjem in trdimo, da se aritmetični sredini osnovnih množic statistično pomembno razlikujeta.
Naloga: Imamo podatke o povprečni težiučencev za dva vzorca osnovnih šol. Preizkusi statistično pomembne razlike aritmetičnih sredin.
= 12 = 23
=52,45 kg =57,73 kg.s1=4,10 .s2=1,60
26
Preizkusi ničelno hipotezo o razliki populacijskih aritmetičnih sredin.1.: Ho: M1 – M2 = 0 (predpostavljamo, da se statistični množici med sabo ne razlikujeta)
= =1,23
= =-4,29 kg
|Z|=4,29 ≥ 3,29; Ho-ZAVRNEMO in s tveganjem manjšim od 0,1% trdimo, da se aritmetični sredini osnovnih množic statistično pomembno razlikujeta.
.
T-PREIZKUS. =uporaba za manjši vzorec. Med sabo primerjamo dve skupini z dvema aritmetičnima sredinama.
Levene test = F-preizkusImamo predpogoj, da lahko T-preizkus kadar se varianci osnovnih množic ne razlikujeta statistično pomembno med sabo. Predpostavimo Ho-varianci osnovnih množic se med sabo ne razlikujeta statistično pomembno.Ho: σ1
2 σ22 =0
Odgovor za to nam da LEVENE-PREIZKUS ali F-PREIZKUS. Zanima nas samo STOPNJA TVEGANJA.
Kadar dobimo rezultat višji od 5%, P=>0,05, trdimo, da se varianci osnovnih množic med sabo ne razlikujeta statistično pomembno – to pokažemo s poizkusom in Ho-OBDRŽIMO ter nadaljujemo z izračunom preizkusa.
Tabela 6: Group StatisticsVrednost
spremenljivke= V kolikšni meri vpliva na avtoriteto
učitelja:
Vrstaanketiranca
N MeanStd.
Deviation
Std.ErrorMean
A.:njegovo strokovno znanje učenci 1.526 4,09 ,832 ,021 starši 1.209 4,22 ,727 ,021B.: visoko postavljene zahteve glede znanja učencev učenci 1.513 3,65 ,911 ,023 starši 1.199 3,78 ,757 ,022C.: pravičnost pri ocenjevanju znanja učenci 1.523 3,78 1,105 ,028 starši 1.215 4,09 ,972 ,028
Interpretacije preverite v svojih izpiskih, ker nisem čisto sigurna v to, mislim pa, da gre nekako tako:
Interpretacija za mnenji med učenci in starši v kolikšni meri vpliva na avtoriteto učitelja – njegovo strokovno znanje:1. pogledam aritmetično sredino (tabela-6): učenci=4,09, starši=4,222.nato pogledam Levene's test (tabela-7) in, če je manjši od 0,5 gledam spodnjo vrsto, če ni, če je večji od 0,5, gledam naravnost po isti vrstici: Sig.=0,604, t=4,493 pomeni, da Ho-OBDRŽIMOInterpretiramo:Ob upoštevanju predpostavke o homogenosti varianc (F=0,269; P=0,604) je T-preizkus za neodvisne vzorce med učenci in starši pokazal statistično pomembne razlike glede tega, koliko na avtoriteto učitelja vpliva njegovo znanje in s tveganjem manjšim od 0,1 % trdimo, da je strokovno znanje učitelja pomembnejše, kot to ocenjujejo učenci.
Strokovno znanje učitelja (tabela-6) je za starše pomembnejše (4,22), kot za učence (4,09).
Interpretacija za mnenji med učenci in starši v kolikšni meri vpliva na avtoriteto učitelja – visoko postavljene zahteve glede znanja učencev:Učenci (tabela-6) = 3,65,Starši = 3,78.Stopnja tveganja = P = 0,000.Ho-ZAVRNEMO in dokažemo, da SE varianci osnovnih množic STATISTIČNO POMEMBNO RAZLIKUJETA. TO PA NI DOBRO – pomeni, da pogoj ni izpolnjen (Equal variances not assumed = -3,959.Interpretacija:Ker predpostavka o homogenosti varianc ni opravičena (ne gre za homogeni predpostavki) smo izračunali APROKSIATIVNI T-PREIZKUS za neodvisne vzorce, ki je med učenci in starši pokazal statistično pomembne razlike glede tega, koliko na avtoriteto učitelja vplivajo visoko postavljene zahteve glede znanja učencev.S tveganjem manjšim od 0,1 % trdimo, da so visoko postavljene zahteve glede znanja učencev pomembnejše staršem (3,78) kot pa učencem (3,65).
Interpretacija za mnenji med učenci in starši v kolikšni meri vpliva na avtoriteto učitelja – pravičnost pri ocenjevanju:1. pogledam aritmetično sredino (tabela-6): učenci=3,78, starši=4,092.nato pogledam Levene's test (tabela-7),: P=0,000; Ho-ZAVRNEMO in napišemo, DA SE STATISTIČNO POMEMBNO RAZLIKUJETA, to ni dobro, ker ni izpolnjen pogoj za izračun T-PREIZKUSA.
Varianci osnovnih množic SE razlikujeta in, F=22,952, Sig.=0,000, pomeni, da je manjši od 0,5%.
Interpretiramo:Ker predpostavka o homogenosti variance ni opravičena smo izračunali APROKSIATIVNI T-PREIZKUS, ki je med starši in učenci pokazal statistično pomembne razlike glede tega, koliko pravičnost pri ocenjevanju znanja vpliva na ocenjevanje učitelja.S tveganjem manjšim od 0,1 % ocenjujemo, da je pravičnost pri ocenjevanju znanja pomembnejša po mnenju staršev (aritmetična sredina = 4,09) kort pa pri učencih (aritmetična sredina = 3,78).
ANOVA je primerjava aritmetičnih sredin. Kadar imamo na razpolago več kot dve skupini, to je od 3 dalje = ENOSMERNA ANALIZA VARIANCE in kadar imamo na razpolago numerične spremenljivke , ki temeljijo na primerjavi aritmetičnih sredin.
28
Levene …..
ONEWAY - enosmerna analiza varianceDesciptives
V kolikšni meri vpliva na avtoriteto učitelja: N Mean Std. Std.