BLAŽIČ naloge statistika

Statistika proučuje množične pojave s kvantitativnimi metodami. Predmet proučevanja so množični pojavi = STATISTIČNA MNOŽICA – SM ali POPULACIJA (rojstva, smrti, prebivalstva, zaposlenost, izvoz, uvoz, inštitucije ali kaj drugega…) in je osnovni pojem na področju statistike. SM je sestavljena iz statističnih enot.

OPREDELJUJOČI POGOJ je opis statistične množice. Je del množičnega pojava, ki izpolnjuje pogoje, ki se nanašajo na vsebino, kraj in čas.

STVARNI OP -SOP KRAJEVNI OP - KOP ČASOVNI OP - ČOPKaj je statistična množica Kje se statistična množica nahaja Kdaj se statistična množica nahaja.Primer:Učenci 7. razreda OŠ v Ljubljani, v šolskem letu 2006/07.

Odgovor:SOP- učenci 7. razreda OŠ,KOP- v Ljubljani,ČOP- leto 2006/07.

STATISTIČNA ENOTA je (en) element statistične množice (pazi!!! Samo enega opredelimo). Je vsak posamezen pojav, ki sestavlja statistično množico:

Realne statistične enote (obstajajo v času in prostoru – kritični moment),Dogodki (smrt, rojstvo, nesreča) = časovni interval,Dogajanja (proizvodnja, nabava) = časovni interval.

Odgovor: Eden učenec.

Značilnosti oz. lastnosti SM so SPREMENLJIVKE oz. VARIABLE, ki so enote iste statistične množice in se med sabo razlikujejo. Delimo jih na:

- atributivne spremenljivke (nominalne in ordinalne) in na- numerične spremenljivke (intervalne in proporcionalne).

Lastnost mora iemti vsaj dve vrednoti, da je lahko spremenljivka.ATRIBUTIVNE SPREMENLJIVKE NUMERIČNE SPREMENLJIVKE

Pove nam natančno kakšna je spremenljivkaNOMINALNE

SPREMENLJIVKEORDINALNE

SPREMENLJIVKEINTERVALNE

SPREMENLJIVKERAZMERNOSTNE – PROPORCIONALNE SPREMENLJIVKE

Pove nam ali sta dve spremenljivki enaki

ali različni

Pove nam ali imata spremenljivki enako ali različno oceno in

ali ima enako ali različno znanje

Povemo razliko, za koliko je topleje ali hladneje. Ne moremo pa povedati za koliko je bolj toplo ali

bolj hladno 2x, 3x.

Povemo razmerja, ki se začnejo od 0 naprej.

Spol = ali sta istega spola ali različnega.

Kraj bivanja.

Šolska ocena – ni numerična

spremenljivka, ker ima v ozadju znanje, ki pa ga ne moremo

opredeliti.

Temperatura 0C-če bi imeli Kelvine, to ni

absolutna 0!

Skok v daljino. Eden skoč 3 m več od drugega – lako naredimo razmerja, ker

imamo absolutno 0.

enaki spremenljivki+različni spremenljivki.

enaki spremenljivki+različni spremenljivki+primerjava

enaki spremenljivki+različni spremenljivki+primerjava+razlika, ki NI absolutna 0

enaki spremenljivki+različni spremenljivki+primerjava+razlika+razmerja, ki IMA absolutno 0

Če je spremenljivka RAZMERNOSTNA, je tudi NOMINALNA, ORDINALNA in INTERVALNA.Vedno je potrebno povedati najvišjo skupino določitev. Vedno je potrebno napisati zakaj si se odločil za opredelitev.

Naloga:1. Za podatke, ki so navedeni spodaj določite statistično enoto in vrste spremenljivk.

Bruto domači proizvod občin v Sloveniji leta 2002.Statistična enota: ______________________________________________Nominalna spremenljivka: ______________________________________________Ordinalna spremenljivka: ______________________________________________Intervalna spremenljivka: ______________________________________________Razmernostna spremenljivka: ______________________________________________

1

Javna podjetja v Mestni občini Ljubljana dne 31.12.2002 po številu zaposlenih, višini Statistična enota:______________________________________________

Nominalna spremenljivka: ______________________________________________Ordinalna spremenljivka: ______________________________________________Intervalna spremenljivka: ______________________________________________Razmernostna spremenljivka: ______________________________________________Rojeni otroci v Postojni v letu 2000 po spolu in glede na starost matere.Statistična enota: ______________________________________________Nominalna spremenljivka: ______________________________________________Ordinalna spremenljivka: _____________________________________________Intervalna spremenljivka: ______________________________________________Razmernostna spremenljivka: ______________________________________________

2. določi ali je posamezna spremenljivka nominalna, ordinalna, intervalna ali razmernostna oz. proporcionalna

Oddaljenost med dvema krajema ____________________Starost ____________________Število otrok ____________________Cena knjige ____________________Država bivanja ____________________Število točk na preizkusu znanja ____________________Zadovoljnost ____________________Temperatura v oC ____________________

INTERPRETACIJA-ko podatke zberemo, jih dobimo kot neurejeno STATISTIČNO VRSTO uredimo jih po kraju, po opisnih spremenljivkah (stvarno) in po času.

STATISTIČNE VRSTE prikazujemo v:- strukturnih (%) in frekvenčnih (števila) tabelah in/ali- grafikonih. Le-ti so za prikaz številk iz tabel in lahko izbiramo med

● stolpci, ● strukturnimi krogi in ● linijskimi grafikoni.

Tabela je opisna in številčna ocena. Poznamo enostavne statistične tabele in sestavljene statistične tabele (dve statistični vrsti po isti spremenljivki).

Enostavne statistične tabele:država uvozZDANemčijaAvstrija

Sestavljene statistične tabele (dve statistični vrsti po isti spremenljivki).država uvoz IzvozZDANemčijaAvstrijaKombinacijske statistične tabele ( prikazujemo enote po dveh spremenljivkah hkrati).Opazujemo zaposlene po spolu in po kvalifikaciji.

SpolKvalifikacija Moški Ženski SkupajNKKVVKSVIŠJAVISOKASkupaj

2

Naloga:3. Interpretiraj podatke, prikazane v spodnjih tabelah.

Tabela 1: Frekvenčna in strukturna tabela odgovorov staršev in učiteljev na trditev, »Menim, da je številčna ocena bolj privlačna kot opisna.«, za vrsto anketirancev in stališče hkrati.

se strinjamse ne

strinjam ne vem skupaj f f% f f% f f% f f%

starši 1.707 55,9 996 32,6 351 11,5 3.054 100,0učitelji 49 16,2 229 75,6 25 8,3 303 100,0skupaj 1.756 52,3 1.225 36,5 376 11,2 3.357 100,0

Interpretacija: dvakrat imamo 100%, kar pomeni, da predstavljajo 1x starši celoto in 1x učitelji celoto, zato predstavimo tabelo z dvema strukturnima krogoma.Izmed anketiranih staršev se 55,9 % z mnenjem ''…'' strinja, 32,6 % se ne strinja, 11,5 pa je ostalo neopredeljenih.Dobri dve tretjini učiteljev (75,6 %) se z mnenjem ''…'' ne strinja, medtem ko se slaba tetina porazdeli na nestrinjanje 16,2 % in 8,3 % na ne vem.


se strinjamse ne

strinjam ne vem skupaj f f% f f% f f% f f%

starši 1.707 50,8 996 29,7 351 10,5 3.054 91,0učitelji 49 1,5 229 6,8 25 0,7 303 9,0skupaj 1.756 52,3 1.225 36,5 376 11,2 3.357 100,0

Interpretacija: 100% je samo enkrat, je kot celota, zato interpretiramo, da se izmed vseh anketirancev. Med sabo je potrebno primerjati obe skupini.Anketa je zajela 91 % staršev in 9 % učiteljev. Izmed vseh anketirancev se 50,8 % staršev strinja z mnenjem, da je številčna ocena bolj privlačna kot opisna, 29,7 % staršev se s tem ne strinja, medtem ko je 10,5 % staršev ostalo neopredeljenih.Izmed vseh anketiranih oseb je 1,5 % učiteljev, ki se z mnenjem strinja, 6,8 % se ne strinja in le peščica učiteljev (0,7 %) je ostalo neopredeljenih.

skupaj

se strinjam

53%

ne vem

11%

se ne strinjam

36%


se strinjam se ne strinjam ne vem skupaj f f% f f% f f% f f%

starši 1.707 97,2 996 81,3 351 93,4 3.054 91,0

3

starš i

se ne strinjam

33%

se strinjam

56%

ne vem

11%

učitelji

se ne strinjam

76%

se strinjam

16%

ne vem

8%

učitelji 49 2,8 229 18,7 25 6,6 303 9,0skupaj 1.756 100,0 1.225 100,0 376 100,0 3.357 100,0

Interpretacija: Posamezne statistične spremenljivke predstavljajo celoto (3 x 100%), zato tudi vsako posamezno interpretiramo.Med tistimi, ki se strinjajo z mnenjem '…' je 97,2 % staršev in 2,8 % učiteljev. Med tistimi, ki se ne strinjajo je 81,3 % staršev in 18,7 % učiteljev. Med neopredeljenimi z mnenjem je 93,4 % staršev in 6,6 % učiteljev.

Naredimo tri strukturne kroge, z dvemi polji, za vsako posamezno spremenljivko.

Naloga:4. Število zaposlenih po stopnji izobrazbe in spolu v trgovskem podjetju X, 2002.a) izračunaj izobrazbeno strukturo po spolu zaposlenih in izobrazbeno strukturo celotnega števila zaposlenih.b) izračunaj spolno strukturo posamezne stopnje izobrazbe zaposlenih in spolno strukturo celotnega števila zaposlenih.c) izračunaj strukturo zaposlenih hkrati po spolu in izobrazbi.d) v dveh strukturnih krogih prikaži strukturne odstotke moških in žensk po izobrazbi.e) rezultate pod a) in b) prikaži s strukturnimi stolpci.

Vrednost spremenljivke Stopnja izobrazbe = vrsta spola Srednja Višja Visoka Skupaj

Moški 175 150 60 385Ženske 80 120 40 240Skupaj 255 270 100 625

Naloga:5. Študenti in dijaki štipendisti po vrstah štipendij, 31.12.2000.

a) izračunaj strukturo posamezne vrste štipendije po vrstah štipendistov.b) izračunaj strukturo posamezne vrste štipendije po vrstah štipendij.c) izračunaj strukturo štipendistov hkrati po vrsti štipendistov in vrsti štipendij.d) v dveh strukturnih krogih prikaži strukturne odstotke vrst štipendistov po vrsti štipendij (tabela b).

UREJANJE NUMERIČNIH PODATKOVRanžirna vrsta – RANG: če opazujemo manjše število enot po numeričnih spremenljivkah, uredimo podatke po velikosti (npr. 10 zaposlenih po dohodku).

Ranžirna vrsta:X: 10 2 5 6 8 2 7 10

Nevezani rang - vsako število je drugačno:R: 1 2 3 4 5 6 7 8

Vezani rang - vsaj eno število se ponovi:R: 1,5 1,5 3 4 5 6 7,5 7,5

FREKVENČNA PORAZDELITEV –FP ali DISTRIBUCIJA. Če opazujemo večje število enot naredimo ureditev numeričnih podatkov sorodnih vrednosti, kjer so numerične spremenljivke združene v grupe imenovane – RAZREDI.

V vsakem razredu poznamo število enot, ki ima vrednost spremenljivke v ustreznem razredu, to število enot imenujemo – FREKVENCA - f. = število, ki nam pove kolikokrat se posamezna vrednost ponovi.

4

se s trinjam

učitelji

3%

starš i

97%

se ne strinjam

učitelji

19%

starši

81%

ne vem

starš i

93%

učitelji

7%

FREKVENČNA PORAZDELITEV INDIVIDUALNE VREDNOSTI SPREMENLJIVKENarediti moramo tabelo, števila uredimo po zaporedju, od najnižjega k najvišjemu in pod frekvenco vpišemo kolikokrat se posamezne vrednosti ponovijo:

X: 10 2 5 6 8 2 7 10

Vrednost spremenljivke

= X

f

2 25 16 17 18 110 2

FREKVENČNA PORAZDELITEV GRUPIRANE VREDNOSTI SPREMENLJIVKENarediti moramo tabelo, števila uredimo po grupah, od najnižje k najvišji, tako da pri prvi grupi določimo širino razreda- i in pod frekvenco vpišemo koliko števil – vrednosti spremenljivk je vključeno v posamezno grupo:X: 2 2. 5 6 7. 8 10 10

Vrednost Spremenljivke=RAZREDI

f

2 - 4 25 – 7 38 - 10 3- i =3

GAUSOVA KRIVULJAUNIMUDALNA (enovrhna) in SIMETRIČNA

UNIMUDALNA in ASIMETRIČNA V LEVO (v tisto smer kjer je bolj položna)

5


f

1 22 53 84 55 2

1 2 3 4 5Ocena 3 se največkrat ponov.Kolikor je 2 naj bi bilo tudi 4.Kolikor je 1 naj bi bilo tudi 5.


f

1 22 43 64 85 1

Dviga se polagoma nato kar naenkrat strmo pade.

UNIMUDALNA in ASIMETRIČNA V DESNO

BIMODALNA – ima dva vrha in ni potrebno gledati ali je simetrična ali je asimetrična.

POLIMODALNA – ima tri vrhe ali več in ne gledamo ali je simetrična ali je asimetrična.

SREDNJE VREDNOSTI 1. ARITMETIČNA SREDINA – M: iz podanih števil ranga izračunamo povprečje:

X: 10 2 6 5 8

M =∑XN

2. MEDIANA – Me ali CENTRALNA VREDNOST ali 2 KVARTIL : je najbolj natančna srednja vrednost, ker je odvisna od vsakega rezultata. Pomeni tudi četrtino in ji pravimo KVARTIL.

1 2 3 4Je vrednost, ki je v ranžirni vrsti točno na sredini.Najprej rang razvrstimo od najnižjega števila do najvišjega:

- če je liho število je točno na sredini je mediana, X: 2 5 6 8 10 Me = 6

- če pa je sodo število pa izračunamo Me tako, izračunamo povprečje med srednjima vrednositma.X: 2 5 6 V 8 10 11

M =10+2+6+5+8

5=

315

= 6,20

6

Vrednostspremenljivke

f

1 12 103 84 65 3

Strmo se dvigne nato polagoma pada.

X x

X X X

3. SREDNJA VREDNOST = MODUS - Mo ali MODALNA VREDNOST je tista vrednost, ki se največkrat ponovi. X: 2 5 6 V 8 10 11

Odgovor: u se modusa ne da določiti, MODUS JE NEDOLOČLJIV.

Modus imenjujemo tudi GOSTIŠČE:X: 2 3 5 5 5 6 7

Mo=5 X: 2 3 5 5 V 6 6 7 8

Mo1 = 55+6 Mo2 = 6 2 Mo = 5,50

X: 2 3 5 5 6 7 7 8 Mo1 = 5 Rezultate pustimo,določimoMo2 = 6 samo dva modusa, kajti 6 NI število,

ki se večkrat ponovi – kar pa ni res.Naloga:Osmošolci so reševali 12 nalog iz matematike. Spremenljivka X je število pravilno rešenih nalog. Izračunaj povprečno število pravilno rešenih nalog.X: 0 1 2 3 4 5 6 7 8 9 10 11 12 f: 3 7 10 18 29 36 42 30 22 9 6 3 1

Izračunamo frekvenco!

M =∑XfNf

Vrednost

∑f ∑X.fSpremenljivke

= X0 3 01 7 72 10 203 18 544 29 1165 36 1806 42 2527 30 2108 22 1769 9 8110 6 6011 3 3312 1 12

Skupaj 216 1.201

SREDNJE VREDNOSTI V FREKVENČNI PORAZDELITVI Kumulativna frekvenca – pove nam koliko frekvenc je pred posameznim razredom (PRVI RAZRED JE VEDNO 0)Frekvenca – 7 ŠTUDENTOV JE PISALO OD 2-5 TOČK.


RAZRED

f F

2 - 5 7 06 - 9 10 7

10 - 13 15 17

Me =6+8

2= 7,00

M =216

1.201= 5,56

7

14 - 17 5 3218 - 21 2 37Skupaj 39 93

Zanima nas število točk!Odgovor: 37 učencev je pisalo manj kot 18 točk.

KADAR IMAMO PODATKE S KUMULATIVNO FREKVENCO – računamo ARITMETIČNO SREDINO.

Xo =sredina zadnjega razreda oz. razreda v katerem so najvišje vrednosti spremenljivkeXo = 18+21/2= 19,50i= 4∑F=0+7+17+32+37=93N=7+10+15+5+2 ali 2+37 =39 seštejemo vse frekvence ali pa k zadnji kumulativni prištejemo zadnjo frekvenco.M=19,50 – (4*93/39) = 19,50 – 9,54 = 9,96

Izračunamo še SUROVI MODUS – Mo: to je tisti razred, ki je najvišji, vendar ni natančen Mo, ker ne vemo kakšne so vrednosti znotraj razreda.Mo = (10+3)/2 =11,50

Pri EKSTREMNIH vrednostih ali rezultatih je bolj smiselno računati MEDIANO in NE POVPREČJE.Modus računamo tudi kadar imamo ATRIBUTIVNO SPREMENLJIVKO, kadar rečemo ''Največ je bilo moških… ali''Največ jih je prišlo iz tega kraja…''Izračunaj povprečno starost moških:i = 5


RAZRED

f F

15 – 19 34 020 – 24 976 3425 - 29 2.770 1.01030 – 34 1.646 3.78035 - 39 683 5.426Skupaj 6.109 10.250

Xo=(35+39)/2=37,00i = 5N=6.109∑F= 683+5.426=6.109M= 37,00-((5*10.250)/6.109) = 37,00-8,39 = 28,61Mo= (25+29)/2 = 27,00 = Unimudalna in asimetrična v desno

Naloga:Imamo zbrane podatke o starosti udeležencev nekega tečaja angleškega jezika. Izračunaj povprečje in oceni ''Surovi modus''.


RAZREDI

f F

30 - 33 3 034 - 37 5 338 - 41 4 842 - 45 9 1246 - 49 1 21

M = Xo- i∑FN

M = Xo- i*∑FN

8

Skupaj 22 44

Računamo aritmetično sredino M=Xo-(i*∑F)/N in surovi modus . i=4∑F=44N=22Xo=povprečje zadnjega razreda, Xo=(46+49)/2=47,50Mo=Surovi modus=približek je povprečje razreda z najvišjo frekvenco, Mo=(42+45)/2=43,50M=Xo-(i*∑F) / NM=47,50 - (4*44) / 22 = 39,50 Odgovor: povprečje je 39,50, ocena surovega modusa je 43,50

SKUPNA TEHTANA ali PONDERIRANA ARITMETIČNA SREDINA

Y =(Ỳ1*f1+ Ỳ2*f2+ Ỳ3*f3+….)

vsota vseh zaposlenih(f1+f2+f3+f4+…)

Naloga: Povprečje mesečne neto plače na zaposleno osebo ter število zaposlenih po regijah Slovenije, 2001. Izračunaj povprečno plačo proučevanih regij.


= regije slovenije

Neto plačav 1000 SIT

Ỳj

Stevilo zaposlenihv 1000 fj

Ỳn*fn

Pomurska 118 36 4.248

Koroška 119 24 2.856

Zasavska 125 14 1.750

Osrednjeslovenska 152 207 31.464

Gorenjska 130 65 8.450

Obalno-kraška 138 36 4.968

Skupaj 782 382 53.736

Y= (118*36)+(119*24)+(125*14)+(152*207)+(130*65)+(138*36)36 + 24 + 14 + 207 + 65 + 36

= 53736/382=140,67Povprečna mesečna plača med proučevanimi regijami je 140,67 SIT.

MERE RAZPRŠENOSTI je natančen prikaz vrednosti, ker upošteva vse rezultate in v kakšnih intervalih so rezultati doseženi. MR – so bolj ali manj razpršene. Mere razpršenosti iz ranžirne vrste.Pet študentov po doseženih rezultatih…

X: 2 5 6 8 10

VARIACIJSKI RAZMIK – VR: nam pove razpon rezultatov oz. koliko vrednosti je možnih med min-vrednostjo in max-vrednostjo.

(+1) so NEZVEZNE SPREMENLJIVKE, to so tiste, ki zajemajo samo določene vrednosti X: 1 2 3X: 1 1,5 2 2,3 3Zvezne spremenljivke zajemajo vse vrednosti, tudi tiste z decimalnimi vejicami. 1 2

X: 2 5 6 8 10

M =315

= 6,20

VR = Xmax – X min (+1)

9

VR = 10 – 2 + 1 = 9,00Odgovor: v našem primeru je 9 možnih vrednosti.

Rezultatov je lahko veliko več. Večji je VR, večja je verjetnost razpršenosti. (razpon med 2….10 je pri 2=1,5 in pri 10,50), zato računamo VR z največ možnimi vrednostmi: VR=10,50-1,50=9,00

Katera je tista maksimalna vrednost, ki jo še lahko zaokrožimo navzgor v našem primeru? Odgovor za naš primer = 10,50.

Katera je tista minimalna vrednost, ki jo še lahko zaokrožimo navzdol v našem primeru? Odgovor za naš primer= 9,00.

ZANESLJIVA MERA RAZPRŠENOSTI ali OSNOVNA MERA RAZPRŠENOSTI ali VARIANCAVarianca je povprečje kvadratnih odklonov, vseh rezultatov, od aritmetične sredine.Z varianco računamo povprečje razpršenosti.

Sledi izračun za vsak X in za vsak M:

Naloga:X: 2 5 6 8 10 = 31

Postopek:a) kvadriramo vsote iz ranga.X2: 4 25 36 64 100 = 229b) izračunamo varianco.

N=5∑X2=229

(∑X) 2 31 2 N = 5 = 192,20

σ2 = 229,00-192,20 / 5 =7,36

Povprečje kvadratnih odklonov je 7,36.

Varianca se NE interpretira temveč lahko izračunamo STANDARDNI ODKLON , ki nam primer bolj natančno pojasni in pove kje okoli aritmetična sredine je večina rezultatov.

c) Izračunamo standardni odklon.

= 2,71Večina rezultatov je za 2,71 nad (+)oz. pod (-)aritmetično sredino. Rezultat je +2,71.

Če k aritmetični sredini prištejemo standardni odklon dobimo ZGORNJO MEJO INTERVALOV in če od aritmetične sredine odštejemo standardni odklon dobimo SPODNJO MEJO INTERVALOV.

d) Izračunamo aritmetično sredino

e) Izračunaj in določi razpon oz. zgornjo in spodnjo mejo intervalov.Zgornja meja intervalov: 6,20+2,71=8,91Spodnja meja intervalov: 6,20-2,71=3,49

Odgovor: Večino rezultatov je v razponu med:3,49 < večino rezultatov >8,91

X: 2 5 6 8 10

Eden standardni odklon pomeni nad aritmetično sredino.

σ2 =

∑(X-M) 2 N

σ2 =

∑X 2 -((∑X) 2 /N) N

σ2 =

∑X 2 -((∑X) 2 /N) N

σ = σ2

M =315

= 6,20

10

Naloga: merimo zadovoljstvo delavcev in imamo podatke: Šolska ocena 3 je aritmetična sredina – M=3. Ker nam samo en podatek na pove veliko, dodamo še standardni odklon, ki nam pojasni kakšne rezultate smo dobili. Predvidevamo po Gausovi krivulji, da:

σ = 0 da so vsi dobili oceno 3,σ = 1 da so eni dobili oceno 4 in drugi oceno 2,σ = 2 da jih je nekaj dobilo oceno 5 na eni strani prav toliko 1 na drugi strani.

Naloga: Spremenljivka X je število let delovne dobe učiteljev neke šole. Izračunaj VR – variacijski razmik, σ 2-varianco in σ-standardni odklon.X: 9 6 11 18 4 2 23 1 10 11 21 5 8 3 25 16 14 = 187a) kvadriraš in izračunaš aritmetično sredino:

X2: 81 36 121 324 16 4 529 1 100 121 441 25 64 9 625 256 196 = 2949

N=17∑X=187∑X2=2949M=2949/17=173,47

=52,47Povprečje kvadratnih odklonov je 52,47

Standardni odklon:

=koren52,472 =7,24 Večina rezultatov je +7,24.

Variacijski razmik:

= 25 – 1(+1)=24+1=25 VR=25,5-0,5=25

Najvišji in najnižji v rangu

Kadar nimamo ranžirne vrste in imamo na razpolago razrede pa računamo varianco:

F=KUMULATIVA-vedno se začne z 0, nato seštevamo predhodno število z levim številom.FF=KUMULATIVA KUMULATIVNIH FREKVENC-vedno se začne z dvema zaporednima 0, nato seštevamo predhodno število z levim številom. Pove nam koliko kumulativnih frekvenc ej pred posameznim razredom (za enim nazaj).


RAZREDI

f1 F FF

10 - 13 2 0 014 - 17 5 2 018 - 21 11 7 222 - 25 20 18 926 - 29 23 38 2730 - 33 14 61 6534 - 37 7 75 12638 - 41 7 82 201Skupaj 89 283 430

σ2 =∑X 2 -((∑X) 2 /N)

Nσ2 =

2.949-((187) 2 /17) 17

σ2 =

2.949-(2.057/17)17

σ = σ2


11

0

5

10

15

20

25

1 2 3 4 5 6 7 8

Niz1

UNIMUDALNA in ASIMETRIČNA V LEVOi=4N=89∑f=89∑F=283∑FF=430

=koren43,712 =6,61 Večina rezultatov je okoli +6,61.

= 41 – 10(+1)=31+1=32 VR=41,5-9,5=32

Izračunamo modalno vrednost ali MODUS-Mo (po najvišjem razredu). Mo=(26+29) / 2 =27,50

In kadar imamo podatke v … porazdelitvi izračunamo še ARITMETIČNO SREDINO:

M= 26,78

Naloga 5/2:Merili smo čas, ki so ga učenci porabili za prevod angleške povedi v slovenščino. Čas je izražen v sekundah.Izračunaj povprečni čas, ki so ga porabili za prevod, varianco in standardni odklon.


RAZREDI

f1 F FF

60 - 69 4 0 070 - 79 7 4 080 - 89 11 11 4

σ2 =

I 2* (∑FF+∑FF+∑F- (∑F) 2 /N)) N

σ2 =

4 2* (430+430+283 - (283) 2 /89)) 89

σ2 =16 * (430+430+283- 899,88)

89

σ2 =16 * 243,12

89

σ2 =3.889,92

89 =43,71

σ = σ2


M = Xo- i∑FN

M = 39,50 -4*283

89

12

90 - 99 19 22 15100 - 109 24 41 37110 - 119 22 65 78120 - 129 17 87 143130 - 139 10 104 230140 - 149 3 114 334150 - 159 1 117 448Skupaj 118 565 1289

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8 9 10

Niz1

UNIMUDALNA in ASIMETRIČNA V DESNO

i=10N=118∑F=565∑FF=1289Varianca:

Standardni odklon:

=koren370,93 =19,26 Večina rezultatov je okoli +19,26.

Variacijski razmik:

= 159 – 60(+1)=99+1=100 VR=159,5-59,5=100

Modus je:Mo=(100+109)/2=104,50

Aritmetična sredina je:Xo-IZRAČUNAŠ IZ ZADNJEGA RAZREDAXo=(150+159)/2=154,50

M=106,62

σ2 =

I 2* (∑FF+∑FF+∑F- (∑F) 2 /N)) N

σ2 =

10 2* (1289+1289+565 - (565) 2 /118)) 118

σ2 =100 * (1289+1289+565-2705,2966)

118

σ2 =100 * 4377034

118

σ2 =43770,34

118 =

370,93

σ = σ2


M = Xo- I*∑FN

M = 154,50 -10*565

118

M = 154,50 - 47,88

13

KORELACIJA nam pove kakšna je povezanost med dvema spremenljivkama, torej kakšna je SMER povezanosti in MOČ-JAKOST-STOPNJA povezanosti.

SMER POVEZANOSTI je lahko:POZITIVNA NEGATIVNA

Kadar spremenljivke prve vrednosti naraščajo – naraščajo tudi vrednosti druge spremenljivke.Če narašča X, narašča tudi Y.Kadar gre za urejanje. Dve spremenljivki, kadar sta pozitivno povezani.

- večja kot je plača večja je kupna moč,- več dela ko opraviš, večja je plača

Kadar spremenljivke prve vrednosti naraščajo –vrednosti druge spremenljivke padajo.Če narašča X, Y pada.

- čas učenja narašča=napake se večajo.-

Kakšna je smer (grafikon) nam pove izračun Kakšna je jakost pa pogledamo lestvico.JAKOST od – do POVEZANOST0 - 0,20 Zanemarljiva ali naključna0,20 – 0,40 Šibka ali nizka0,40 – 0,70 Srednje močna0,70 – 0,90 Močna0,90 – 1,00 Popolna-1/+1In kako se rezultat KORELACIJE INTERPRETIRA?PEARSON-ov KORELACIJSKI KOEFICIENT – izračunamo ga kadar imamo dve numerični spremenljivki (npr. višina in telesna teža), ki sta medsebojno povezani.Spremeljivki X inY ne smemo nič urejati, ker imamo podatke točno za vsakega otroka posebej.

Višina X: 86 90 88 92 96 88 93 95 = 728Teža Y: 14 17 16 15 22 12 14 13 = 121a) števila med sabo pomnožimo za vsakega otoka posebej po višini in teži (86*14=1204….X*Y: 1204+1530+1408+1380+1920+1056+1302+1235=11.035b) kvadriramo X in seštejemo vsoto:X2: 7396 8100 7744 8464 9216 7744 8649 9025 = 66.338b) kvadriramo Y in seštejemo vsoto:Y2: 196 289 256 225 400 144 196 169 = 1..875∑x=728∑y=121∑xy=11.035∑x2=66.338∑y2=1.875N = 8

Kx = ∑x2-(∑x) 2

NKx=66.338-(7282/8)=66.338-66.248=90,00

Ky = ∑y2-(∑y) 2

NKy=1.875-(1212/8)=1.875-1.830=44,87

Kxy = ∑xy-∑x*∑y

NKxy=11.035-((728*121)/8)=11.035-11.011=24,00

rxy=. Kxy .

Kx*Ky. 24,00 . 90,00*44,87

. 24,00 .4038,30

24,0063,55

=0,38

Je pozitivna šibka ali nizka povezanost.

Naloga 6/2:Učenci so pri pouku dveh tujih jezikov pisali narek. Za vsakega učenca vemo, koliko napak je naredil pri nareku v angleškem jeziku(spremenljivka X) in koliko pri nareku v namškem jeziku (spremenljivka Y). izračunajte KORELACIJO med spremenljivkama.

Višina X: 2 7 10 0 1 18 5 15 6 1 = 65Teža Y: 5 9 5 2 0 21 10 11 6 3 = 72a) števila med sabo pomnožimo za vsakega otoka posebej po višini in teži (86*14=1204….X*Y: 10+63+50+0+0+378+50+165+36+3=755

14

b) kvadriramo X in seštejemo vsoto:X2: 4 49 100 0 1 324 25 225 36 1 = 765b) kvadriramo Y in seštejemo vsoto:Y2: 25 81 25 4 0 441 100 121 36 9 = 842∑x=65∑y=72∑xy=755∑x2=765∑y2=842N = 10

Kx = ∑x2-(∑x) 2

NKx=765-(652/10)=765-422,50=342,50

Ky = ∑y2-(∑y) 2

NKy=842-(722/10)=842-518,40=323,60


NKxy=755-((65*72)/10)=755-468=287,00PEARSON-ov KORELACIJSKI KOEFICIENT

rxy=. Kxy .

Kx*Ky. 287,00 .

342,50*323,60. 287,00 .

110.833287,00332,92

=0,86

Je pozitivna močna povezanost.SPEARMAN-ov KORELACIJSKI KOEFICIENT ς-RO – izračunamo ga kadar imamo dva nevezana ranga. Izračunamo ga hitreje kot Pearsenov korelacijski koeficient.

ς=1- 6* Σd2

N(N2-1)KonstantiSpreminjata se samo d in N.

Naloga: moški in ženske razvrščajo posamezne predmete po priljubljenosti.Vrednost

spremenljivke= vrsta jezika

MOŠKI ŽENSKEd

(m-ž)d2

SLOVENSKI JEZIK 5 1 4 16TUJ JEZIK 11 3 8 64

MATEMATIKA 4 6 -2 4BIOLOGIJA 8 9 -1 1

ZGODOVINA 9 8 1 1ZEMLJEPIS 6 7 -1 1

LIKOVNA V. 1 5 -4 16ŠPORTNAV 3 10 -7 49

GLASBENA V. 7 4 3 9TEHNIČNA V. 2 11 -9 81

GOSPODINJSTVP 10 2 8 64Skupaj, N=11 66 66 0 306

V takem primeru je numerus 11 predmetov=število področij.

Iščemo razliko med rangoma, ki jo ima posamezno področje.

ς= 1-6* Σd2

N(N2-1)= 1-

6*30611(112-1)

= 1- (1836/1331) =1-1,38 = -0,38

Je negativna šibka povezanost.Vidimo, da gre pri večini predmetov za nasprotja.

Naloga 6/3:V dveh vzgojnih skupinah so otroci razvrščali igrače po priljubljenosti. Izračunajte korelacijo jmed razvrstitvijo, ki so jo naredili otroci v prvi skupini (spremenljivka X) in razvrstitvijo v drugi skupini (spremenljivka Y).

Vrednost STAROSTNA STAROSTNA SKUPINA

dd2

spremenljivke (X-Y)

15

=igrače A 1 7 -6 36B 2 8 -6 36C 3 4 -1 1D 4 6 -2 4E 5 5 0 0F 6 3 3 9G 7 1 6 36H 8 2 6 36

Skupaj, N=8 0 0 0 158

ς= 1-6* Σd2

N(N2-1)= 1-

6*1588(82-1)

= 1- (948/504) =1-1,88 = -0,88

Je pozitivna močna povezanost.

Naloga:Učitelj matematike je učence rangiral na osnovi lastnega znanja po njihovem znanju(=X) iz števila točk (=Y), ki so jih učenci zbrali na eksternem preverjanju znanja iz matematike.

Imamo rang torej samo numerične spremenljivke, kar pomeni, da moramo nekaj spremeniti. Numerične vrednosti v X lahko rangiramo, kadar imamo nižje št. točk od Y), zato naredimo rang-1, da dobimo 2 ranga (X in R) in nato računamo SPEARMAN-ov.KORELAC.KOEFICIENT.

X: 4 7 2 5 1 6 3 Y: 24 28 8 26 14 25 19a) naredimo rang po najnižje doseženih točkah (iz Y), t.j. prvi, drugi,tretji…R: 4 7 1 6 2 5 3d: 0 0 1 -1 -1 -1 0d2: 0 0 1 1 1 1 0 =4N=7 učencevd2=4

ς= 1-6* Σd2

N(N2-1)= 1-

6*47(72-1)

= 1- (24-42) =1-0,07 = -0,93

Je popolna pozitivna povezanost.

Naloga:Moški in ženske razvrščajo glasbene skupine po priljubljenosti:

Ker imamo dve numerični spremenljivki in vezani rang,( pomeni, da se dvakrat ponovi) – računamo PEARSON-ov KORELACIJSKI KOEFICIENT

∑x=29

Vrednost X

M

X2 Y

Ž

Y2

spremenljivke ∑X*Y

glas.skupina A 5 25 6 36 30B 6 36 5 25 30C 7 49 7 49 49D 4 16 3,5 12,25 14E 4 16 3,5 12,25 14F 1 1 1 1 1G 2 4 2 4 4

Skupaj: N=7 29 147 28 139,50 142

16

∑y=28∑xy=142∑x2=147∑y2=139,50N = 7

Kx = ∑x2-(∑x) 2

NKx=147-(292/7)=147-120,14=26,86

Ky = ∑y2-(∑y) 2

NKy=139,50-(282/7)=139,50-112=27,50


NKxy=142-((29*28)/7)=142-116=-26,00

rxy=. Kxy .

Kx*Ky-26,00 . 29*28

. -26,00 .812

-26,0028,49

=-0,91

Je negativna popolna povezanost.

.χ2-PREIZKUS = INFERENČNA STATISTIKA – pomeni posploševanje

Kadar uporabljamo ankete raziskav po vzorcu, ko imamo nekaj ljudi – anketirajo in posplošijo na celo množico. χ2- preizkus računamo, kadar imamo atributivne spremenljivke.

a) Obe spremenljivki med sabo povežemo in postavimo vprašanje. Npr.: Ali se med M in Ž pojavljajo razlike glede ukvarjanja s športom?

b) Raziskovalna hipoteza Ho: Med M in Ž se pojavljajo razlike glede ukvarjanja s športom.c) Med M in Ž ni razlik med ukvarjanjem s športom.

Ukvarjanje s športom

spremenljivka Malo Srednje Veliko Skupaj

M 10 20 50 80

Ž 90 90 50 230

Skupaj 100 110 100 310

Postavimo HIPOTEZO: Ho; M in Ž se enako ukvarjajo s športom.

Hipoteze: - če ničelno sprejmemo – raziskavo zavržemo,- če ničelno ne sprejmemo – z raziskavo nadaljujemo.

Pri raziskavi računamo:- ali stvarne frekvence – empirične =fE-dobimo dejanske odgovore - ali pričakovane frekv. – teoretične =fT-odgovori, ki naj bi jih dobili, če bi Ho (ničelna hipoteza) držala, da med M in Ž

ni razlik.

Izračunamo vse teoretične frekvence za obe spremenljivki posebej.

N=300

MALO-MOŠKI

Teoretična frekvenca za moške, ki se malo ukvarjajo s športom = 25,81

SREDNJE-MOŠKI

Teoretična frekvenca za moške, ki se srednje ukvarjajo s športom = 28,39

VELIKO-MOŠKI

fT= Fv*fkN

fT =80*100

310 = 25,81

fT =80*110

310 = 28,39

17

Teoretična frekvenca za moške, ki se veliko ukvarjajo s športom = 25,81

Vse teoretične frekvence za moške seštejemo:fT=25,81+28,39+25,81=80,01_________________________________________

MALO-ŽENSKE

Teoretična frekvenca za ženske, ki se malo ukvarjajo s športom = 74,19

SREDNJE- ŽENSKE

Teoretična frekvenca za ženske, ki se srednje ukvarjajo s športom = 81,61

VELIKO- ŽENSKETeoretična frekvenca za ženske, ki se veliko ukvarjajo s športom = 74,19

Vse teoretične frekvence za zenske seštejemo:fT=74,19+81,61+74,19=229,99In če seštejemo izračunani teoretični frekvenci za M+Ž = 80,01+229,99=310 – moramo dobiti isti rezultat, kar pomeni, da smo delali samo razporeditev po tabeli med spremenljivkama in izborom ukvarjanja s športom.

Da odgovorimo na našo hipotezo Ho – moramo izračunati χ2- preizkus, in sicer:

=(10-25,81)2

25,81+(20-28,39)2

28,39+(50-25,81)2

25,81+(90-74,19)2

74,19+(90-81,61)2

81,61+(50-74,19)2

74,19+=

=249,9625,81+

70,3928,39+

585,1625,81+

249,9674,19+

70,3981,61+

85,1674,19+

=

= 9,68+ 2,48+ 22,67+ 3,37+ 0,87+ 7,89 =

d) PROSTOSTNE STOPNJE nam povedo kako velika je tabela.v-vrstice,k-kolone

g=(2-1)*(3-1)=1*2=2

STOPNJA TVEGANJA NE SME BITI VEČJA OD 5 !!!!! Uporabljamo tri ravni tveganja:P= 0,05 * 100 = 5%P= 0,01 * 100 = 1%P= 0,001 * 100 = 0,1%

Odgovor: χ2=46,95 > χ2(g=2; P=0,001)=13,81.

Izračunali smo višji rezultat od postavljenega 5 (5,991), zato Ho-ZAVRŽEMO.VEDNO SE ODLOČIMO PRI 5% TVEGANJU.V tablice tabela c se postavimo v 2 (g=2) vrstico in poiščemo stopnjo tveganja tako, da vzamemo najbližji rezultat našemu dobljenemu tveganju-manj ko tvegamo bolje je . V našem primeru je to 13,82, kar pomeni, da Ho-zavržemo s tveganjem 0,1%.Pri 1% tveganju bi bil rezultat 9,210, ker je rezultat večji se nato odločimo za večje tveganje, to ja 0,1% oz. 13,82.

Primer, če bi dobili rezultat χ2=4,95 < χ 2 (g=2;P=0,05) =5,991

Ugotovimo, da ima izračunani rezultat pri 5% nižjo vrednost=zato Ho-SPREJMEMO.

fT =80*100

310 = 25,81

fT =230*100

310 = 74,19

fT =230*110

310 = 81,61

fT =230*100

310 = 74,19

χ2= (fE-fT) 2 fT

χ2= 46,95

g= (v-1)*(k-1)

18

V tem primeru nam ni potrebno nadaljnje gledati po tabeli in iskati približno vrednost za % tveganja.

Primer, če bi dobili rezultat χ2=6,50 > χ 2 (g=2;P=0,05) =5,991; Ho-ZAVRŽEMO s 5% tveganjem

Naloga:Ugotavljali smo ali so med različno starimi anketiranci priljubljene različne zvrsti filmov.

a) zapiši hipotezo neodvisnosti in ugotovi ali je v osnovni množici priljubljenost akcijskega filma odvisna od starosti anketirancev.

PRILJUBLJENOST AKCIJSKEGA FILMA


RAZREDI= starost

Zelo priljubljen

fv*fk

zelo priljublj.

(fE*fT) 2 fT

zeloprilj.

Srednje

fv*fk

srednje

prilj.

(fE*fT) 2 fT

srednjeprilj.

Neprilj.fv*fk

nepriljub.

(fE*fT) 2 fT

neprilj.

Skupaj

5 - 9 22 48,61 14,56 37 26,89 3,80 41 24,50 11,11 10010 - 14 19 43,75 14,00 30 24,20 1,39 41 22,05 16,28 9015 -19 45 40,34 0,54 22 22,32 0,00 16 20,34 0,92 8320 - 24 78 56,87 7,85 26 31,46 0,95 13 28,67 8,56 11725 - 29 80 54,44 12,00 20 30,12 3,40 12 27,44 8,69 112

Skupaj (fK) 244 244,00 48,95 135 135,00 9,54 123 123,00 45,57 502a) Ho=priljubljenost akcijskega filma ni odvisna od starosti. UPOŠTEVATI V NAŠEM PROJEKTU!

Na vprašanje dobimo vedno odgovor :i=5, N=502

Izračunamo vse teoretične frekvence za obe spremenljivki (PRILJUBLJENOST* STAROST) posebej.

N=502ZELO PRILJUBLJEN, 5-9 let:

Teoretična frekvenca za priljubljenost akcijskega filma v starosti od 5 – 9 let = 48,61

ZELO PRILJUBLJEN, 10-14 let:

Teoretična frekvenca za priljubljenost akcijskega filma v starosti od 10 – 14 let = 43,75

In tako naprej izračunamo za vse frekvence (vrste in kolon), kontrola, če smo prav izračunali je, da vse rezultate izračunanih teoretičnih frekvenc seštejemo in dobimo numerus N=502.

Da pa χ2 –preizkus sploh lahko računamo morata biti izpolnjena dva pogoja. Oba pogoja se nanašata na numerične spremenljivke.

1. pogoj: nobena fT ne sme biti manjša od 1 in2. pogoj: 20% fT ne sme biti manjših od 5.

Kaj naredimo ko pogoja nista izpolnjena? Imamo 3 možnosti:1. Ne naredimo nič in samo predstavimo % oz. frekvence, ki so predstavljene v tabeli.2. Združimo kategoriji, če bi imeli lestvico in če bi premalo ljudi ne dalo neko oceno, takrat družimo kategorije.

X: 1 2 3 4 510 15 45 20 10 =25 45 =30

Pri tabeli združevanje ni zaželeno!

3. Uporabimo nadomestek za χ2 –preizkus, ki ga imenujemo KULLBACKOV 2Î PREIZKUS. Uporabimo ga kadarkoli, vendar ni tako natančen kot χ2 –preizkus.

LIKELIHOOD RATIO – to je identičen preizkus kot KULLBACKOV 2Î PREIZKUS.Izračun naše χ2 –preizkus naloge:

fT= Fv*fkN

fT =100*244

502 = 48,61

fT =90*244

502 = 43,75

χ2= (fE-fT) 2 fT

19

=(22-48,61)2

48,61+(27-26,89)2

26,89+(41-24,50)2

24,50+(19-43,75)2

43,75+(30-24,20)2

24,20+(41-22,05)2

22,05+(45-40,34)2

40,34+(22-22,32)2

22,32+

(16-20,33)2

20,33+(78-56,87)2

56,87+(26-31,46)2

31,46+(13-28,67)2

28,67+(80-54,44)2

54,44+(20-30,12)2

30,12+(12-27,44)2

27,44+

= 14,57+ 3,80+ 11,11+ 14,00+ 1,39+ 16,28+ 0,54+ 0,00+ 0,92+ 7,85+ 0,95+8,56+ 12,00+ 3,40+ 8,69+ 12+ 3,40+

Odločimo se ali Ho-SPREJMEMO ali Ho-ZAVRNEMO. P=0,05; P= 0,01; P= 0,001.

g=(5-1)*(3-1)=4*2=8, v tablicah iščemo najbližjo vrednost v vrstici 8!!!Naš rezultat je 104,06 in je večji kot je v tabeli C, ki je pri 5% tveganju =15,51, nato pogledamo pri 1% tveganju, ki je =20,09, rezultat je še vedno večji, potem se odločimo za najbližji znesek tabele, to je pri 0,1% tveganju=26,12 ter napišemo: χ2=104,06> χ2(g=8; P=0,001)=26,12.

Odgovor: Vrednost χ2 –preizkus JE STATISTIČNO POMEMBNA na ravni P=0,001. Ho-ZAVRNEMO in s tveganjem 0,1% (P*100) trdimo, da je v osnovni množici priljubljenost akcijskega filma odvisna od anketirancev (udeležencev).

Primer odgovora, če bi pri isti nalogi dobili rezultat 10,40 : χ2=10,40> χ2(g=8; P=0,05)=15,51

Odgovor nam pove INTERPRETACIJO: Vrednost χ2 –preizkus NI STATISTIČNO POMEMBNA na ravni P=0,05. Ho-OBDRŽIMO in s tveganjem 5% trdimo, da NI v osnovni množici priljubljenost akcijskega filma odvisna od anketirancev (udeležencev).

INTERPRETIRAMO lahko tudi tako:

Na priljubljenost akcijskega filma starost udeležencev (anketirancev) NE vpliva STATISTIČNO POMEMBNO.aliMed različno starimi anketiranci NI STATISTIČNO POMEMBNIH RAZLIK glede priljubljenosti gledanja akcijskih filmov.

Če v naši nalogi izračunamo še odstotne deleže:(pazi % prikaži na eno decimalno vejico).

PRILJUBLJENOST AKCIJSKEGA FILMA


RAZREDI= starost

Zelo priljubljen

% Srednje % Nepriljubljen % Skupaj %

5 - 9 22 22,0 37 37,0 41 41,0 100 100,010 - 14 19 21,1 30 33,3 41 45,6 90 100,015 -19 45 54,2 22 26,5 16 19,3 83 100,020 - 24 78 66,7 26 22,2 13 11,1 117 100,025 - 29 80 71,4 20 17,9 12 10,7 112 100,0

Skupaj (fK) 244 48,6 135 26,9 123 24,5 502 100,0

Odstotni deleži pa nam povejo komu je akcijski film bolj všeč in komu manj všeč.Sam χ2 –preizkus nam ne pove kaj dosti, χ2 –preizkus skupaj s %, pa nam povesta veliko več.

Odgovorna primer za prvo vrstico : V starosti od 5 - 9 let delež tistih anketirancev, ki ocenjujejo, da jim je akcijski film všeč narašča, medtem ko, delež anketirancev, ki ocenjujejo, da jim film ni všeč pa upada.

STOPNJE TVEGANJAUnimudalna simetrična porazdelitev.

χ2= 104,06

g= (v-1)*(k-1)

20

2,5% 2,5%

5% tveganje pomeni, da 5 % populacije izpade iz ugotovitev do katerih smo z izračuni prišli, torej se razdeli po Gausovi krivulji na levo stran 2,5 % in prav toliko, 2,5 %, na desno stran.V našem primeru pomeni, da se 5 % populacije ''to'' ne zadeva.

Če bi imeli 1% tveganje, bi porazdelitev pomenila 2 x 0,5 %.

χ2 –preizkus nam podatke posploši na osnovno množico, to pa velja samo takrat, če imamo slučajnostni oz. reprezentativni vzorec.

VZORCI RAZISKAV1. Vsako enoto, ki jo vzamemo v raziskavo ima enako možnosti, da jo zajamemo v raziskavo. Tako raziskavo

imenujemo SLUČAJNOSTNI VZOREC, ki ga zagotovimo ali z žrebom ali z računalnikom.

2. Kadar pa vse enote nimajo enake možnosti, da bi bile zajete v raziskavo to imenujemo NESLUČAJNOSTNI VZOREC, ki ga delimo na :

o PRILOŽNOSTNI VZOREC (izkoristimo tisto, kar nam ponuja priložnost) in o NAMENSKI VZOREC (izbiramo ljudi s točno določenim namenom).

Oba vzorca, tako priložnostni, kot namenski, nista nikoli tako reprezentativna kot je slučajnostni vzorec, sta le lažja za izračun.

Naloga: Učitelji, ki poučujejo različna predmetna področja so odgovarjali na vprašanje, ali jih je študij ustrezno usposobil za vodenje določenih interesnih dejavnosti.

USPOSOBLJENOST ZA VODENJE INTERESNE DEJAVNOSTI

Vrednost spremenljivke= predmetno

področje

Ustrezno fv*fk

ustreznoχ2=

fE*fT) 2 fT

ustrezno

Delnoustrezno

fv*fk

delno ustrezno

χ2=fE*fT) 2

fT

delnoustrezno

Neustrezno

fv*fk

neustrezno

χ2=fE*fT) 2

fT

neustrezno

Skupaj

Naravoslovno 30 30,33 0,00 33 26,00 1,88 5 11,67 3,81 68Družboslovno 46 30,33 8,09 19 26,00 1,88 3 11,67 6,44 68Jezikoslovno 15 30,33 7,75 26 26,00 0,00 27 11,67 20,15 68Skupaj (fK) 91 91,00 15,85 78 78,00 3,77 35 35,00 30,40 204

!!! Če imamo več kot dve spremenljivki OBVEZNO postavi Ho-ničelno hipotezo.

Ho=usposobljenost za vodenje interesnih dejavnosti je odvisno od učiteljeve ustreznosti za delo..

1.): N=204

Izračunamo VSE TEORETIČNE FREKVENCE za obe spremenljivki (usposobljenost*predm. področje) posebej.

N=502

fT= Fv*fkN

21

fT =68*91204 = 30,33

fT =68*78204 = 26,00

fT =68*35204 = 11,67

NARAVOSLOVNO

fT =68*91204 = 30,33

fT =68*78204 = 26,00

fT =68*35204 = 11,67

DRUŽBOSLOVNO

fT =68*91204 = 30,33

fT =68*78204 = 26,00

fT =68*35204 = 11,67

JEZIKOSLOVNO

2.):

=(30-30,33)2

30,33+(33-26,00)2

26,00+(5-11,67)2

11,67+(46-30,33)2

30,33+(19-26,00)2

26,00+(3-11,67)2

11,67+(45-40,34)2

40,34+(15-30,33)2

30,33+(26-26,00)2

26,00+(27-11,68)2

11,68+=

= 0,00+ 1,88+ 3,81+ 8,09+ 1,88+ 6,44+ 7,75+ 0,00+ 20,15 =50,02

Odločimo se ali Ho-SPREJMEMO ali Ho-ZAVRNEMO. P=0,05; P= 0,01; P= 0,001.Ker imamo rezultat večji od 5 – Ho-ZAVRNEMO in interpretiramo:

Med učitelji različnih predmetnih področij NI STATISTIČNO POMEMBNIH RAZLIK glede njihove usposobljenosti za vodenje interesnih dejavnosti.

Če bi imeli raziskovalni primer, da bi Ho-sprejeli bi interpretirali, da med učitelji različnih predmetnih področij SO STATISTIČNO POMEMBNE RAZLIKE glede njihove usposobljenosti za vodenje interesnih dejavnosti.

3.) g=(3-1)*(3-1)=2*2=4, v tablicah iščemo najbližjo vrednost v vrstici 4 !!!Naš rezultat je 50,02 in je večji kot je v tabeli C, ki je pri 5% tveganju =9,488, nato pogledamo pri 1% tveganju, ki je =13,28, rezultat je še vedno večji, potem se odločimo za najbližji znesek tabele, to je pri 0,1% tveganju=18,47 ter napišemo: χ2=50,02> χ2(g=4; P=0,001)=18,47.

Odgovor z interpretacijo: Vrednost χ2 –preizkus JE STATISTIČNO POMEMBNA na ravni P=0,001. Ho-ZAVRNEMO in s tveganjem 0,1% (P*100) trdimo (sprejmemo), da SE v osnovni množici med učitelji različnih predmetnih področij POJAVLJAJO STATISTIČNO POMEMBNE RAZLIKE glede njihove usposobljenosti za vodenje interesnih dejavnosti.

CROSSTABS - KRIŽNE TABELEso računalniški izpisi za χ2 –preizkus , ki se imenujejo SPSS=program za celotne družboslovne vede.Tabela 1: Case Processing Sumary (sestava preračunanih vsot)

Cases

Valid Missing Total

Vrednost spremenljivke= dve množeni spremenljivki

N Percent N Percent N Percent

A: Vrsta anketiranca*kakšno avtoriteto

predstavljajo učitelji 2.542 84,8 455 15,2 2.997 100,0

B: Vrsta anketiranca*kako spoštuješ

učitelje vaše šole 2.717 90,7 280 9,3 2.997 100,0A:Tabela 2: Crosstab Kakšno avtoriteto predstavljajo učitelji

Vrsta anketiranca Nič Malo Srednje VelikoZelo

veliko Total

Učenci Count - število 33 58 328 637 272 1.328

% within vrsta anketiranca 2,5 4,4 24,7 48,0 20,5 100,0

Starši Count - število 10 22 236 499 258 1.025


Učitelji Count - število 0 1 19 86 25 131


Ravnatelji Count - število 0 0 22 33 3 58


Total Count - število 43 81 605 1.255 558 2.542


Crosstab ( vrsta anketiranca*kakšno avtoriteto predstavljajo učitelji)

Pomembna je ta - druga tabela (frekvenca in %) in tabela spodaj.

χ2= (fE-fT) 2 fT

χ2= 50,02

g= (v-1)*(k-1)

22

Tabela 3: Chi-Square Test (=χ2 –preizkus)Vrednost

spremenljivkeValue df Asymp.Sig.

(2-sided)

Pearson Chi-Square 57,532a 12 ,000Likelihood Ratio 65,953 12 ,000Linear-by-Linear 9,814 1 ,002N of valid Cases 2.542

a. 4. cels (20%) have expected count less than 5. The minimum Expected count is ,98.

Pearson Chi-Square = Računalniški izračuna χ2 –preizkus.df=gAsymp.Sig.=stopnja tveganja-P, vejica spredaj pomeni, da damo spredaj 0, kar pomeni P=0,000 < 5 % in Ho-ZAVRNEMO.a. 4. cels (20%) have expected count less than 5. The minimum Expected count is ,98. = 20 % teoretičnih frekvenc je manjših od 5. Najnižja teoretična frekvenca = 0,98. Expected count is ,98 = teoretična frekvenca (izračunamo je, ker ni manjša od 0 % oz. je manjša od 5 %).

Primer interpretacije, ko imamo podatek za χ2 –preizkus = 57,532a:- če bi imeli dva osnovna pogoja izpolnjena in če eden ni izpolnjen do 5%-zavrnemo,- če postavimo Ho-v mnenjih ni razlik (da povežemo dve spremenljivki)

Odgovor z interpretacijo:.ali: Ho-ZAVRNEMO χ2=57,532> χ2(g=12; P=0,000) Med učenci, starši, učitelji in ravnatelji NI STATISTIČNO POMEMBNIH RAZLIK glede njihovega mnenja o tem, kakšno avtoriteto predstavljajo učitelji učencem..ali: Vrednost Cullbackovega 2Î-preizkusa je statistično pomembna na ravni P=0,000 2Î=65,953 > 2Î(g=12; P=0,000) Ho-ZAVRNEMO s tveganjem, manjšim od 0,1% trdimo, da SE v osnovni množici med učenci, starši, učitelji in ravnatelji POJAVLJAJO STATISTIČNO POMEMBNE razlike glede tega kakšno avtoriteto predstavljajo učitelji učencem.B:Tabela 4: Crosstab Koliko spoštuješ učitelje vaše šole

Vrsta anketiranca Nič Malo Srednje Veliko Zelo veliko Total

Učenci Count - število 32 47 176 573 500 1.328


Starši Count - število 3 7 132 527 488 1.157


Učitelji Count - število 0 2 27 115 30 174


Ravnatelji Count - število 0 0 18 34 6 58


Total Count - število 35 56 353 1.249 1.024 2.717


Crosstab ( vrsta anketiranca*koliko spoštuješ učitelje vaše šole)

Tabela 5: Chi-Square Test (=χ2 –preizkus)Vrednost

spremenljivkeValue df Asymp.Sig.

(2-sided)

Pearson Chi-Square 127,712a 12 ,000Likelihood Ratio 139,529 12 ,000Linear-by-Linear ,230 1 ,631N of valid Cases 2.717

a. 4. cels (20%) have expected count less than 5. The minimum Expected count is ,75.

PREIZKUS PRI NUMERIČNIH SPREMENLJIVKAH uporabimo Z-preizkus = T-test

Uporabimo ga vedno kadar imamo dve skupini (M,Ž). Z-preizkus temelji na primerjavi aritmetičnih sredin.Ugotavljamo ali se aritmetični sredini dveh osnovnih množic MED SABO STATISTIČNO POMEMBNO RAZLIKUJETA.Večji, kot je vzorec manj je statističnih razlik.

Naloga: M=učenci=X: 7 9 3 10 5 8 7 2 4 6 9 10 2Ž=učenke=Y: 9 6 2 10 10 9 8 6 5 9 10 10 8

23

Zanima nas kakšna bo aritmetična sredina dveh osnovnih množic, to je aritmetična sredina Ž=Y in aritmetična sredina M=X.N=13

Kadar računamo aritmetično sredino pri vzorčenju

Kadar se podatki nanašajo na osnovno množico v vzorcu uporabimo sledeče oznake:M=P%= p%N= n.σ 2= s2

Varianca :

Pri vzorcih upoštevaj – 1!Posebej računamo varianco za X in posebej za Y.

PAZI! LOČITI JE POTREBNO ali je vzorec ali je osnovna množica: Če imamo osnovno množico samo računamo, če pa je vzorec je na osnovi podatkov potrebno izračunati osnovno množico, ko gre za posploševanje.

Z-preizkus

=Aritmetišna sredina 1. skupine

=Aritmetišna sredina 2. skupine

Mx =7+9+3+10+5+8+7+2+4+6+9+10+2

13=

8213

= 6,30

My =9+6+2+10+10+9+8+6+5+9+10+10+8

13=

10213

= 7,85

.sx2=

(49+81+9+100+25+64+49+4+16+36+81+100+4)-((82 2 )/13 13-1

=618-(6.724/ 13)

12618-517,23

12.sx

2= 100,77

12= 8,40

sy2=

(81+36+4+100+100+81+64+36+25+100+100+64)-((102 2 )/13 13-1

=872-(10.404/ 13)

12872-800,31

12.sy

2= 71,69

12= 5,97

24

SE = ocena standardne napake, ki nam pove kakšna je razlika med vzorci: večja je ocena standardne napake manj so vzorci reprezantativni.

SE= =1,05

=

Rezultat Z-preizkus preverimo Ho, ki nam pove, da SE aritmetični sredini naših množic med sabo NE RAZLIKUJETA STATISTIČNO POMEMBNO.

Ho: Mx – My = 0 (6,30-7,85=-1,55) (-spremenimo v +=1,55)

|Z| ≥1,96 →Ho-ZAVRNEMO s 5% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|<1,96 →Ho-OBDRŽIMO (aritmetični sredini osnovnih možic se ne razlikuje statistično pomembno).|Z|≥2,58 →Ho-ZAVRNEMO z 1% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|≥3,29 →Ho-ZAVRNEMO z 0,1% tveganjem in trdimo, da se razlikujeta statistično pomembno.

Če je absolutna vrednost |Z| večja od 1,96 Ho-ZAVRNEMO(interpretiramo, da se razlikuje statistično pomembno).Če je absolutna vrednost |Z| manjša od 1,96 Ho-OBDRŽIMO interpretiramo, da se ne razlikuje statistično pomembno).

Odgovor z interpretacijo :|Z|=1,55<1,96; Ho-OBDRŽIMOPovprečno število točk, ki so jih zbrali učenci in povprečno število točk, ki so jih zbrale učenke se med sabo ne razlikujestatistično pomembno.

Naloga:V dveh vzorcih učencev osnovnih šol smo preverjali njihovo znanje o astronomiji (spremenljivka x je število točk na preizkusu znanja). Zbrali smo sledeče rezultate:

= 120 = 230

=25,13 =29,27.s1=3,20 .s2=5,60

Preizkusi ničelno hipotezo o razliki populacijskih aritmetičnih sredin.1.: Ho: M1 – M2 = 0 (predpostavljamo, da se statistični množici med sabo ne razlikujeta)

= =0,47

=

|Z|=8,81 ≥ 3,29; Ho-ZAVRNEMO in s tveganjem manjšim od 0,1% trdimo, da se aritmetični sredini osnovnih množic statistično pomembno razlikujeta. Naloga: KADAR IMAMO PODATKE V FREKVENČNI PORAZDELITVI


RAZREDI

f1 F1 FF1 F2 F2 FF2

10 - 13 2 0 0 4 0 014 - 17 5 2 0 5 4 018 - 21 11 7 2 16 9 422 - 25 20 18 9 31 25 13

25

26 - 29 23 38 27 25 56 3830 - 33 14 61 65 12 81 9434 - 37 7 75 126 6 93 17538 - 41 7 82 201 2 99 268Skupaj 89 283 430 101 367 592

1. preizkus o razliki aritmetičnih sredinHo= da se aritmetični sredini osnovnih množic med sabo ne razlikujeta statistično pomembno.

2. naredimo izračun za potrditev Ho:Širina razreda: i=4

Sredina zadnjega razreda: Xo=

Numerus: N1=89 ali (7+82)N2=101 ali (2+99)

Aritmetična sredina 1. skupine: =39,50- =39,50-12,72=26,78

Aritmetična sredina 2. skupine: =39,50- =39,50-14,53=24,97

Varianca za f1=X1: =

=

= = =44,20

Varianca za f2=X2: = =

= = =34,79

Ocena standardne napake: = = = =0,92

Z-preizkus: = =1,97

Z-preizkus nam da odgovor ali bomo Ho-sprejeli ali mo Ho-zavrnili, če je:|Z| ≥1,96→Ho-ZAVRNEMO s 5% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|<1,96 →Ho-OBDRŽIMO (aritmetični sredini osnovnih možic se ne razlikuje statistično pomembno).|Z|≥2,58 →Ho-ZAVRNEMO z 1% tveganjem in trdimo, da se razlikujeta statistično pomembno.|Z|≥3,29 →Ho-ZAVRNEMO z 0,1% tveganjem in trdimo, da se razlikujeta statistično pomembno.

V našem primeru je rezultat: |Z|1,97>1,96; Ho-ZAVRNEMO. |Z|=1,97, kar pomeni, da je večji od 1,96 in Ho-ZAVRNEMO s 5% tveganjem in trdimo, da se aritmetični sredini osnovnih množic statistično pomembno razlikujeta.

Naloga: Imamo podatke o povprečni težiučencev za dva vzorca osnovnih šol. Preizkusi statistično pomembne razlike aritmetičnih sredin.

= 12 = 23

=52,45 kg =57,73 kg.s1=4,10 .s2=1,60

26

Preizkusi ničelno hipotezo o razliki populacijskih aritmetičnih sredin.1.: Ho: M1 – M2 = 0 (predpostavljamo, da se statistični množici med sabo ne razlikujeta)

= =1,23

= =-4,29 kg

|Z|=4,29 ≥ 3,29; Ho-ZAVRNEMO in s tveganjem manjšim od 0,1% trdimo, da se aritmetični sredini osnovnih množic statistično pomembno razlikujeta.

.

T-PREIZKUS. =uporaba za manjši vzorec. Med sabo primerjamo dve skupini z dvema aritmetičnima sredinama.

Levene test = F-preizkusImamo predpogoj, da lahko T-preizkus kadar se varianci osnovnih množic ne razlikujeta statistično pomembno med sabo. Predpostavimo Ho-varianci osnovnih množic se med sabo ne razlikujeta statistično pomembno.Ho: σ1

2 σ22 =0

Odgovor za to nam da LEVENE-PREIZKUS ali F-PREIZKUS. Zanima nas samo STOPNJA TVEGANJA.

Kadar dobimo rezultat višji od 5%, P=>0,05, trdimo, da se varianci osnovnih množic med sabo ne razlikujeta statistično pomembno – to pokažemo s poizkusom in Ho-OBDRŽIMO ter nadaljujemo z izračunom preizkusa.

Tabela 6: Group StatisticsVrednost

spremenljivke= V kolikšni meri vpliva na avtoriteto

učitelja:

Vrstaanketiranca

N MeanStd.

Deviation

Std.ErrorMean

A.:njegovo strokovno znanje učenci 1.526 4,09 ,832 ,021 starši 1.209 4,22 ,727 ,021B.: visoko postavljene zahteve glede znanja učencev učenci 1.513 3,65 ,911 ,023 starši 1.199 3,78 ,757 ,022C.: pravičnost pri ocenjevanju znanja učenci 1.523 3,78 1,105 ,028 starši 1.215 4,09 ,972 ,028

Mean=aritmetična sredinaStd. Deviation=standardni odklonStd. Error Mean=ocena standardne napake

Tabela 7: Insependent Sample Test -Izračunamo T-preizkus:

Levene's testfor

Equality ofVariances T-testfor Equality of Means

Vrednost

95%Confidence

spremenljivke Interval of the

Diference

27

= V kolikšni meri vpliva na

F Sig. t df

Sig. Mean Std.

Lower Upper

avtoriteto učitelja:(2-

tailed) Diference Error

Diference

A.:njegovo strokovno znanje

Equal variances

,269 ,604 4,493 2733 ,000 -,136 ,030 -,196 -0,077assumed

Equal variances

4,564 2707,166 ,000 -,136 ,030 -,195 -,078 not assumedB.: visoko postavljene zahteve glede znanja učencev

Equal variances assumed

60,616 0,000 3,876 2710 ,000 -,127 ,033 -,191 -,063

Equal variances not assumed

3,959 2704,038 ,000 -,127 ,032 -190 -,064

C.: pravičnost pri ocenjevanju znanja

Equal variancesassumed

22,952 0,000 7,672 2736 ,000 -,309 ,040 -,388 -,230

Equal variances not assumed

7,783 2710,214 ,000 -,309 ,040 -,387 -,231

Interpretacije preverite v svojih izpiskih, ker nisem čisto sigurna v to, mislim pa, da gre nekako tako:

Interpretacija za mnenji med učenci in starši v kolikšni meri vpliva na avtoriteto učitelja – njegovo strokovno znanje:1. pogledam aritmetično sredino (tabela-6): učenci=4,09, starši=4,222.nato pogledam Levene's test (tabela-7) in, če je manjši od 0,5 gledam spodnjo vrsto, če ni, če je večji od 0,5, gledam naravnost po isti vrstici: Sig.=0,604, t=4,493 pomeni, da Ho-OBDRŽIMOInterpretiramo:Ob upoštevanju predpostavke o homogenosti varianc (F=0,269; P=0,604) je T-preizkus za neodvisne vzorce med učenci in starši pokazal statistično pomembne razlike glede tega, koliko na avtoriteto učitelja vpliva njegovo znanje in s tveganjem manjšim od 0,1 % trdimo, da je strokovno znanje učitelja pomembnejše, kot to ocenjujejo učenci.

Strokovno znanje učitelja (tabela-6) je za starše pomembnejše (4,22), kot za učence (4,09).

Interpretacija za mnenji med učenci in starši v kolikšni meri vpliva na avtoriteto učitelja – visoko postavljene zahteve glede znanja učencev:Učenci (tabela-6) = 3,65,Starši = 3,78.Stopnja tveganja = P = 0,000.Ho-ZAVRNEMO in dokažemo, da SE varianci osnovnih množic STATISTIČNO POMEMBNO RAZLIKUJETA. TO PA NI DOBRO – pomeni, da pogoj ni izpolnjen (Equal variances not assumed = -3,959.Interpretacija:Ker predpostavka o homogenosti varianc ni opravičena (ne gre za homogeni predpostavki) smo izračunali APROKSIATIVNI T-PREIZKUS za neodvisne vzorce, ki je med učenci in starši pokazal statistično pomembne razlike glede tega, koliko na avtoriteto učitelja vplivajo visoko postavljene zahteve glede znanja učencev.S tveganjem manjšim od 0,1 % trdimo, da so visoko postavljene zahteve glede znanja učencev pomembnejše staršem (3,78) kot pa učencem (3,65).

Interpretacija za mnenji med učenci in starši v kolikšni meri vpliva na avtoriteto učitelja – pravičnost pri ocenjevanju:1. pogledam aritmetično sredino (tabela-6): učenci=3,78, starši=4,092.nato pogledam Levene's test (tabela-7),: P=0,000; Ho-ZAVRNEMO in napišemo, DA SE STATISTIČNO POMEMBNO RAZLIKUJETA, to ni dobro, ker ni izpolnjen pogoj za izračun T-PREIZKUSA.

Varianci osnovnih množic SE razlikujeta in, F=22,952, Sig.=0,000, pomeni, da je manjši od 0,5%.

Interpretiramo:Ker predpostavka o homogenosti variance ni opravičena smo izračunali APROKSIATIVNI T-PREIZKUS, ki je med starši in učenci pokazal statistično pomembne razlike glede tega, koliko pravičnost pri ocenjevanju znanja vpliva na ocenjevanje učitelja.S tveganjem manjšim od 0,1 % ocenjujemo, da je pravičnost pri ocenjevanju znanja pomembnejša po mnenju staršev (aritmetična sredina = 4,09) kort pa pri učencih (aritmetična sredina = 3,78).

ANOVA je primerjava aritmetičnih sredin. Kadar imamo na razpolago več kot dve skupini, to je od 3 dalje = ENOSMERNA ANALIZA VARIANCE in kadar imamo na razpolago numerične spremenljivke , ki temeljijo na primerjavi aritmetičnih sredin.

28

Levene …..

ONEWAY - enosmerna analiza varianceDesciptives

V kolikšni meri vpliva na avtoriteto učitelja: N Mean Std. Std.

95%ConfidenceInterval of the

Mean Minimum Mximum

Deviation ErrorLowerBound

UpperBound

učenci 1526 4,09 ,832 ,021 4,05 4,13 1 5

njegovo strokovno znanje starši 1209 4,22 ,727 ,021 4,18 4,26 1 5

učitelji 174 4,52 ,624 ,047 4,42 4,61 3 5

ravnatelji 59 4,51 ,504 ,066 4,38 4,64 4 5

Total 2968 4,18 ,783 ,014 4,15 4,2 1 5

učenci 1513 3,65 ,911 ,023 3,61 3,7 1 5

starši 1199 3,78 ,757 ,022 3,74 3,82 1 5

visoko postavljene zahteve učitelji 170 3,68 ,717 ,055 3,57 3,79 2 5

glede znanja učencev ravnatelji 59 3,78 ,618 ,080 3,62 3,94 3 5

Total 2941 3,71 ,837 ,015 3,68 3,74 1 5

Manjka še : Test of Homoheneity of variances, Robust Test of Equality of Means in Post Hoc Test.

29

BLAŽIČ naloge statistika

Documents