Kvanti feladatgyujt 2015 0810 - ESTIEM Wiki...3 I. Valószín űségszámítási alapok Műveletek eseményekkel, klasszikus valószín űség meghatározás 1. Határozza meg az alábbi
Post on 25-Jan-2020
0 Views
Preview:
Transcript
Budapesti Műszaki és Gazdaságtudományi Egyetem Gazdaság- és Társadalomtudományi Kar
Üzleti Tudományok Intézet
KVANTITATÍV MÓDSZEREK
Példatár a Vezetés és Szervezés, Pénzügy és Műszaki menedzser mesterszakok számára
Megoldásokkal
Árva Gábor Dr. Kövesi János
Erdei János Dr. Tóth Zsuzsanna Eszter
Budapest, 2015
2
Tartalomjegyzék I. Valószínűségszámítási alapok ................................................................................................ 3
Műveletek eseményekkel, klasszikus valószínűség meghatározás ........................................ 3 Feltételes valószínűség ........................................................................................................... 4 Teljes valószínűség tétele ....................................................................................................... 6 Bayes-tétel ............................................................................................................................ 10
Fa diagram ............................................................................................................................ 14
Események függetlensége .................................................................................................... 14 II. Valószínűségi változó. Elméleti eloszlások ......................................................................... 18
Binomiális eloszlás ............................................................................................................... 18
Poisson-eloszlás ................................................................................................................... 21
Exponenciális eloszlás .......................................................................................................... 24
Normális eloszlás ................................................................................................................. 27
III. Leíró statisztika .................................................................................................................. 32
IV. Becslés ............................................................................................................................... 40
V. Hipotézisvizsgálatok ........................................................................................................... 62
Nemparaméteres próbák ....................................................................................................... 62 Paraméteres próbák .............................................................................................................. 79
VI. Kétváltozós korreláció- és regresszióelemzés .................................................................... 98 VII. Döntéselmélet ................................................................................................................. 104
VIII. Rang-módszerek alkalmazása ....................................................................................... 120 IX. Felhasznált irodalmak ...................................................................................................... 142
3
I. Valószínűségszámítási alapok
Műveletek eseményekkel, klasszikus valószínűség meghatározás
1. Határozza meg az alábbi események valószínűségét!
Egy szabályos kockát egyszer feldobva páratlan számot kapunk: Számunkra kedvező eset, az 1, 3, és 5-ös dobás. A lehetséges kimenetek száma hat, s ezek mindegyike azonos valószínűségű. A klasszikus valószínűség-számítást alkalmazva: 3/6, azaz 1/2 a keresett valószínűség. Egy szabályos érmét kétszer feldobva legalább az egyik dobás fej: A kísérlet lehetséges kimenetelei: ii, fi, if és ff. Mindegyik eset azonos valószínűséggel következik be. Számunkra kedvező eset, 3, így a keresett valószínűség: 3/4. Egy jól megkevert, 52 lapos francia kártya csomagból vagy egy ászt, vagy a káró 10-est, vagy a pikk 2-est húzzuk ki: A csomagból egyenlő valószínűséggel húzzuk ki a lapokat. A számunkra kedvező esetek száma 6 (4 ász, a káró 10 és a pikk 2), így a keresett valószínűség: 6/52, azaz 3/26. Két szabályos kockával egyszerre dobva a kapott számok összege 7: Az összes lehetséges kimenetel 36. A számunkra kedvező esetek száma: 6 (1+6, 2+5, 3+4, 4+3, 5+2, 6+1). Annak valószínűsége tehát, hogy a dobott számok összege 7: 6/36 = 1/6. Pókernél öt lapot kiosztva póker-t (4 azonos kártya) vagy flush-t (5 azonos színű kártya) kapunk kézbe osztáskor. A klasszikus valószínűség-meghatározás módszerével a kedvező és az összes lehetséges esetek hányadosa adja a kérdéses valószínűségeket. Az összes lehetőség, ahogy egy 52
lapos francia kártya csomagból 5 lapot kiválaszthatunk
5
52 (52 alatt az 5), azaz
2.598.960 a kombinációk száma. Pókernél a kedvező esetek száma: 13 különböző figura van, az egyik fajtából egyszerre mind a négyet meg kell kapnunk. Ez 13 lehetőség. A maradék lapok közül (48 lap) bármelyiket kaphatjuk. Így a kedvező esetek száma: 13⋅48 = 624 kombinációban kaphatunk kézbe pókert. A póker valószínűsége: 624/2598960 = 0,00024.
Flush-nél a kedvező esetek száma:
5
13a kombinációk száma, ahogy 13 egyszínű lapból
5 lapot kaphatunk (ez 1287). Azonban bármelyik színből kaphatunk öt azonos színű lapot, így a kedvező esetek száma 4⋅1287 = 5148. A flush valószínűsége: 5148/2598960 = 0,001981. (Beleértve minden azonos színű lapkombinációt, azaz a pókerben külön megkülönböztetett royal flush-t is.)
2. Egy kísérlet során feldobunk egy érmét és egy kockát. Ha az A esemény az, hogy az
érme feldobásának eredménye „fej” lesz, B esemény pedig az, hogy a kockán levő szám „3 vagy 6” lesz, fogalmazza meg a következő események jelentését:
a) A : az érem feldobásának eredménye írás
b) B : a kockán lévő szám 1, 2, 4 vagy 5
4
c) A + B: vagy fejet dobunk az érmével, vagy 3-ast vagy 6-ost a kockán,
bármelyik bekövetkezhet, az A+B esemény teljesül
d) BA ⋅ : egyszerre teljesül, hogy az érmével fejet dobunk, a kockával pedig 3-ast
vagy az érmével fejet dobunk és a kockával 6-ost
e) )( BAP : annak a valószínűsége, hogy az eredmény egyszerre lesz fej és a
kockán pedig 1,2, 4 vagy 5.
f) )( BAP + : annak a valószínűsége, hogy az érmével írást dobunk vagy a
kockával 1, 2, 4 vagy 5-öt.
Feltételes valószínűség
1. Egy szállítmány 96%-a megfelel az előírásoknak, s ezek 75%-a első osztályú. Mekkora a valószínűsége annak, hogy egy találomra kiválasztott darab első osztályú?
Megoldás: A={a termék első osztályú} B={a termék megfelelő} P(A|B)=0,75; az előírásoknak megfelelő első osztályú termékek A szorzási szabály szerint: P(AB)=P(A|B)·P(B)=0,75·0,96=0,72, vagyis 72% annak a valószínűsége, hogy egy találomra kiválasztott darab első osztályú. 2. Ha nagyon sok kétgyermekes család közül véletlenszerűen választunk egyet, és
megtudjuk, hogy legalább az egyik gyermek leány, mekkora a valószínűsége annak, hogy van fiú is a családban?
Megoldás: Egy kétgyermekes családban négy egyenlő valószínűségű eset fordulhat elő a gyermekek nemét illetően, mivel mind az első, mind a második gyermek egyenlő valószínűséggel lehet leány vagy fiú:
� Leány-leány � Leány-fiú � Fiú-leány � Fiú-fiú
A esemény: az egyik gyermek leány B esemény: van fiú a családban Feladat, hogy az A teljesülése mellett vizsgáljuk a B esemény valószínűségét.
)(
)()(
AP
BAPABP
⋅=
Az (A·B) esemény a fenti 4 lehetőségből kétszer áll fenn, így P(A·B)=2/4=1/2=0,5
5
Az A esemény, vagyis hogy legalább 1 leány van a családban, a négy esetből háromszor teljesül: P(A)=3/4
3
2
6
4
3
4
2
1
4/3
2/1
)(
)()( ==⋅==⋅=
AP
BAPABP
Tehát 2/3 a valószínűsége annak, hogy van fiú a kétgyermekes családban, ha tudjuk, hogy legalább az egyik gyermek leány. 3. Egy telefonfülke előtt állunk és várjuk, hogy az előttünk beszélő befejezze a beszélgetést.
Az illető beszélgetési időtartama (τ) véletlen esemény, melyre érvényes a következő:
31)(t
etP−
−=<τ a) Határozzuk meg annak a valószínűségét, hogy a beszélgetés 3 percnél tovább tart! b) Mennyi annak a valószínűsége, hogy a beszélgetés további 3 percnél tovább tart, feltéve, hogy 3 percnél tovább tartott? c) Mennyi annak a valószínűsége, hogy a beszélgetés t+3 percnél tovább tart, feltéve, hogy t percnél tovább tartott?
Megoldás:
a) Az ellentett esemény valószínűségéből következtetve: ( ) 133
1
3 −−==≥ eeP τ
b) ( ) 1
33
3
6
3|6 −
−
−
==≥≥ e
e
eP ττ
c) ( ) 1
3
3
3
t|3 −
−
+−
==≥+≥ e
e
etP t
t
ττ
4. Egy kockát kétszer feldobnak. Mennyi a valószínűsége, hogy a dobott számok összege 7 lesz? Elvégzik az első dobást. Eredményül páros szám adódott (ezt közölték velünk). Mekkora a valószínűsége ezek után annak, hogy a két dobás összege 7 lesz? Melyik valószínűség a nagyobb?
Megoldás: Elsőre dobhatunk 6-féle értéket (1-6 között), és ugyanez igaz a második dobásra is. Így az összes dobáslehetőség száma: 36 (=n). Ebből a kedvező esetek száma, vagyis hogy a dobott számok összege 7 lesz: 1-6; 2-5; 3-4; 4-3; 5-2; 6-1; azaz összesen 6 ilyen eset van (=k). Így az
első kérdésre a válasz: 6
1
36
6 ==n
k
Az első dobás alapján kapott információ (páros lett az első dobás) a következő számpárok jönnek számításba: 2-i; 4-i; 6-i; ahol i a második feldobás eredményét mutatja, vagyis: i=1, 2, 3, 4, 5, 6. Így az összes lehetőség (=n) száma: 18. Az összes lehetőségen belül a kedvező esetek száma, vagyis, hogy a két dobás összege 7 lesz: 2-5; 4-3; 6-1, vagyis összesen 3 (=k).
Így a második kérdésre a válasz: 6
1
18
3 ==n
k
6
Látható, hogy az a közlés, hogy az első dobás eredménye páros szám lett, nem befolyásolta annak a valószínűségét, hogy a dobott számok összege 7 lesz. 5. Egy 32 lapos kártyacsomagból 4 lapot húzunk egymás után, visszatevés nélkül. Mennyi
a valószínűsége, hogy az első kettő király, a harmadik felső, a negyedik pedig ász? Megoldás: Legyen A1 az az esemény, hogy az első húzás eredménye király; A2 legyen az az esemény, hogy a második is király; A3 az, hogy a harmadik húzás eredménye felső, végül pedig, A4 legyen az az esemény, hogy a negyedik húzás eredménye ász. Visszatevés nélküli esetben:
4
32142131214321
1022,229
4
30
4
31
3
32
4
)(()(()()()(
−⋅=⋅⋅⋅=
=⋅⋅⋅⋅⋅⋅=⋅⋅⋅ AAAAPAAAPAAPAPAAAAP
6. Valamilyen vegyszerrel szúnyogirtást végeztek. Azt tapasztalták, hogy az első
permetezésnél a szúnyogok 80%-a elpusztult, az életben maradottakban azonban annyi ellenállóképesség fejlődött ki, hogy a második permetezés során már csak a szúnyogok 40%-a pusztult el. A harmadik irtás során a szúnyogok 20%-a pusztult már csak el. Mennyi a valószínűsége, hogy egy szúnyog három irtószer-alkalmazást túléli? Mekkora annak a valószínűsége, hogy egy szúnyog még két irtószer-alkalmazást túlél, feltéve, hogy az elsőt túlélte?
Megoldás: Legyen Ai az az esemény, hogy a szúnyog az i-edik irtást túléli. Így a következő valószínűségeket ismerjük:
2,0)( 1 =AP 6,0)( 12 =AAP 8,0)(( 213 =⋅ AAAP
Az első kérdésre a válasz, vagyis, hogy mennyi a valószínűsége annak, hogy egy szúnyog három irtószer alkalmazását túléli, a fenti három valószínűség szorzataként adódik:
096,08,06,02,0 =⋅⋅
48,02,0
096,0
)(
)())((
1
321132 ==⋅⋅=⋅
AP
AAAPAAAP
Teljes valószínűség tétele
1. Három urnában fehér és fekete golyók vannak elhelyezve. Az elsőben 2 fehér és 3 fekete; a másodikban 3 fehér és 4 fekete; a harmadikban 4 fehér és 5 fekete golyó van. A kísérlet abban áll, hogy véletlenszerűen kiválasztunk egy urnát: legyen 1/2, 1/3 és 1/6 rendre az első, a második és a harmadik urna kiválasztásának a valószínűsége. Ezután a kiválasztott urnából véletlenszerűen kihúzunk egy golyót úgy, hogy mindegyik golyó kihúzásának a valószínűsége egyenlő legyen. Mennyi annak a valószínűsége, hogy fehér golyót húzunk?
Megoldás: Legyen B1, B2, B3 annak a valószínűsége, hogy az első, a második és a harmadik urnát választjuk ki. A legyen az az esemény, hogy fehér golyót húzunk ki.
7
417,06
1
9
4
3
1
7
3
2
1
5
2)(
9/4)(
7/3)(
5/2)(
6/1)(
3/1)(
2/1)(
3
2
1
3
2
1
=⋅+⋅+⋅=
=
=
====
AP
BAP
BAP
BAP
BP
BP
BP
Tehát 41,7% a valószínűsége annak, hogy fehér golyót húzunk. 2. Két urnában golyók vannak. Az egyikben 5 fehér és 4 piros, a másikban 5 piros és 7
fehér. Az egyik urnából kiveszünk két golyót. Feltételezve, hogy a két urna közül egyenlő valószínűséggel választunk, mennyi a valószínűsége annak, hogy mindkét golyó fehér színű lesz? Ugyanilyen feltételek mellett, mennyi a valószínűsége annak, hogy a kihúzott két golyó közül legalább az egyik fehér lesz?
Megoldás: Legyen B1 az az esemény, hogy az első urnából húzunk, B2 pedig, hogy a másodikból. Az A esemény pedig jelentse azt, hogy mindkét golyó fehér.
Feltétel: 2
1)()( 21 == BPBP
277,08
4
9
5)( 1 =⋅=BAP , ugyanígy 318,0
11
6
12
7)( 2 =⋅=BAP
A teljes valószínűség tételét felhasználva: 2975,0318,02
1277,0
2
1)( =⋅+⋅=AP
Tehát 29,75% a valószínűsége annak, hogy mindkét kihúzott golyó fehér lesz. A második kérdés megválaszolásához C jelentse azt az eseményt, hogy a két golyó közül legalább egy fehér. A feltételes valószínűségek megállapításához az ellentétes eseményekből indulunk ki, vagyis megnézzük, hogy mi a valószínűsége az egyik, illetve a másik urna esetében, hogy egyik kiválasztott golyó sem lesz fehér (vagyis mindkettő piros lesz), és az eredményt kivonjuk egyből.
6
5
8
3
9
41)( 1 =⋅−=BCP , ugyanígy
33
28
11
4
12
51)( 2 =⋅−=BCP
A teljes valószínűség tételét felhasználva a keresett valószínűség:
841,033
28
2
1
6
5
2
1)( =⋅+⋅=CP
84,1% a valószínűsége annak, hogy a kihúzott golyók közül legalább az egyik fehér lesz.
8
3. Azonos fajta autórádió előlapokból két tételünk van. Az első tétel 26, a második 32 darabból áll. Mindkét tételben egy-egy hibás darab van. Az első tételből egy véletlenszerűen kiválasztott darabot átteszünk a másodikba. Ezután a második tételből választunk egyet találomra, és ezt megvizsgáljuk. Mi a valószínűsége annak, hogy ez a darab selejtes?
Megoldás: Jelentse A esemény azt, hogy a második tételből selejtest húzunk. Jelentse B1 azt, hogy az első tételből jót, B2 pedig azt, hogy hibásat tettünk át a másodikba. Ezeknek a valószínűségei:
26
1)(;
26
25)( 21 == BPBP
Ha B1 következett be, akkor a második tételben 33 darabból csak egy selejtes van, és az A
esemény feltételes valószínűsége:33
1)/( 1 =BAP ; ha viszont B2 következett be, akkor két
selejtes darab van a második tételben, így ebben az esetben a feltételes valószínűség:
33
2)( 2 =BAP .
Alkalmazzuk a teljes valószínűség tételét:
0314,026
1
33
2
26
25
33
1)()()()()( 2211 =⋅+⋅=⋅+⋅= BPBAPBPBAPAP
Vagyis 3,14% a valószínűsége annak, hogy a második tételből selejtest húzunk. 4. Mikrohullámú sütők forgótányérjának kísérleti gyártását végzik egy gyárban. Három
tétel mikrohullámú sütő készül el. Az első két tétel a teljes mennyiség egy-egy negyedét, a harmadik tétel pedig a felét adja. A minőségellenőrzés során kiderül, hogy az előírt működési óraszámot az első tétel 12%-a, a másodiknak 21%-a, a harmadiknak 28%-a éri el. Mennyi a valószínűsége annak, hogy egy találomra kiszemelt mikrohullámú sütő az előírt ideig működik?
Megoldás: A az az esemény, hogy a mikrohullámú sütő forgótányérja az előírt ideig üzemel. B1, B2 és B3 jelentse azt, hogy a kiválasztott darab az első, a második vagy a harmadik tételből való. A Bi események valószínűségei rendre:
2
1)(;
4
1)(;
4
1)( 321 === BPBPBP
Felírjuk az A eseménynek a Bi feltételek melletti valószínűségét, vagyis azt, hogy az egyes tételekből választott forgótányérok milyen valószínűséggel működnek a megfelelő ideig:
100/28)(;100/21)(;100/12)( 321 === BAPBAPBAP
9
A teljes valószínűség tételét alkalmazva:
%25,222225,0100
14
400
21
100
3
100
28
2
1
100
21
4
1
100
12
4
1)()()(
3
1
==++=⋅+⋅+⋅=⋅=∑=i
ii BPBAPAP
Vagyis 22,25% a valószínűsége annak, hogy hibátlan darabot választunk. 5. Egy műhelyben három műszakban termelnek azonos fajta árut. Egy napon az összes
termelt áruból az első műszakban 40%, a másodikban és a harmadikban 30-30% készült. Az első műszakban készült áruk 5%-a, a másodikban gyártottak 7%-a, a harmadikban termeltek 10%-a hibás. A három műszakban elkészült teljes mennyiségből a minőségellenőr találomra kiválaszt egy darabot, és megvizsgál. Mennyi a valószínűsége, hogy ez hibátlan?
Megoldás: Legyen A az az esemény, hogy a találomra kiválasztott darab hibátlan. B1, B2, és B3 pedig jelentse azt, hogy a kiválasztott darab az első, a második, illetve a harmadik műszakban került legyártásra. Ezen események valószínűsége:
4,0)( 1 =BP 3,0)( 2 =BP 3,0)( 3 =BP
Felírjuk az A eseménynek a Bi események melletti feltételes valószínűségeit: 95,005,01)( 1 =−=BAP 93,007,01)( 2 =−=BAP 9,01,01)( 3 =−=BAP
Végül alkalmazzuk a teljes valószínűség tételét: 929,09,03,093,03,095,04,0)( =⋅+⋅+⋅=AP
92,9% a valószínűsége annak, hogy kiválasztott darab hibátlan lesz. 6. Egy egyetemi évfolyamon végzett felmérésből tudjuk, hogy a női hallgatók 60%-a, a
férfi hallgatók 40%-a dohányzik. Valaki így okoskodik: „Ha egy személyt véletlenszerűen kiválasztunk, az a személy vagy nő, vagy férfi. A két esemény egymást kizárja. Annak a valószínűsége tehát, hogy a kiválasztott személy dohányzik, egyenlő a 0,6 és 0,4 valószínűségek összegével, tehát 1-gyel.” Hol a hiba?
Megoldás: A hiba ott van, hogy az adott 0,6 és 0,4 valószínűségek csak feltételes valószínűségek, mégpedig, ha A azt jelenti, hogy a kiválasztott személy dohányzik, B1 azt, hogy az illető nő, B2 pedig, hogy férfi, akkor:
6,0)( 1 =BAP és 4,0)( 2 =BAP , és az A valószínűségét a teljes valószínűség tétele mellett a
)()()()()( 2211 BPBAPBPBAPAP ⋅+⋅= képlet adja meg. A feladatmegoldó a B1 és B2
valószínűségekről feledkezett meg. 7. Egy irodában 3 munkatárs dolgozik párhuzamosan azonos típusú ügyiratok intézésén.
Az első naponta 10 aktával végez, a második napi 15, a harmadik napi 25 aktával. Az egyes munkatársaknál naponta átlagosan 0,3; 0,9; 0,5 db hibásan kezelt ügyirat található. Az összesített napi mennyiségből találomra kiveszünk egy aktát. Mekkora a valószínűsége, hogy az akta hibás?
10
Megoldás: A = {az akta hibás} B1 = az 1. munkatárs intézte B2 = a 2. munkatárs intézte B3 = a 3. munkatárs intézte P(B1) = 10/50 = 0,2 P(B2) = 15/50 = 0,3 P(B3) = 25/50 = 0,5 P(AB1) = 0,3/10 = 0,03 P(AB2) = 0,9/15 = 0,06 P(AB3) = 0,5/25 = 0,02 P(A) = 0,2⋅0,03 + 0,3⋅0,06 + 0,5⋅0,02 = 0,034 8. Három műszak azonos terméket gyárt. Egy adott napon az összes termékből az I.
műszakban 40%, a II. és III. műszakban 30-30% készült. A selejtarányok az egyes műszakokban: I. műszak = 5%, II. műszak = 7%, III. műszak = 10%. A napi termelésből a MEO egy darabot kiválaszt. Mekkora a valószínűsége, hogy az hibátlan?
Megoldás: Legyen P(A) annak a valószínűsége, hogy a vizsgált termék hibátlan.
4,0)( 1 =BP 3,0)( 2 =BP 3,0)( 3 =BP
95,0)( 1 =BAP 93,0)( 2 =BAP 90,0)( 3 =BAP
929,00903,093,03,095,04,0)( =⋅+⋅+⋅=AP , vagyis 92,9% a valószínűsége annak, hogy a kiválasztott darab hibátlan.
Bayes-tétel
1. 10 azonos alakú doboz közül az első 9-ben 4-4 golyó van, mégpedig 2 fehér és 2 kék. A tizedik dobozban 5 fehér és 1 kék golyó van. Az egyik találomra kiválasztott dobozból véletlenszerűen kiveszünk egy golyót. Mi a valószínűsége annak, hogy ez a tizedik dobozból való, ha a kivett golyó fehér?
Megoldás: Jelöljük A-val azt az eseményt, hogy fehéret húztunk. Bj-vel jelöljük azt, hogy a j-edik dobozból választottunk. Ezeknek a valószínűsége azonos: P(Bj)=1/10. Az A esemény Bj feltétel melletti feltételes valószínűségére a következő áll fenn: P(A/Bj)=1/2, ha j=1,2,3…9 P(A/B10)=5/6
32
5
65
29
65
)65
21
9(101
101
65
)()(
)()()(
10
1
101010 =
+=
+⋅
⋅=
⋅
⋅=∑
=j
jj BPBAP
BPBAPABP
Tehát 15,625% a valószínűsége annak, hogy egy fehér golyót éppen a 10. dobozból húzunk. Másik megoldás: Az A ismét az az esemény, hogy fehéret húzunk. B1 jelentse azt, hogy a kilenc egyforma közül húzunk (bármelyikből), B2 pedig jelentse azt, hogy a 10.-ből húzunk. Így P(B1)=9/10; P(B2)=1/10. P(A/ B1)=1/2, P(A/ B2)=5/6. Innentől a megoldás menete ugyanaz.
11
2. Egy forgácsoló üzemben elkészült munkadarabok 96%-a felel meg a súlyszabványnak. A minőségellenőrzés során az elkészült munkadarabok egy részét megvizsgálták, a súly szempontjából szabványos darabok 98%-a bizonyult alakra jónak, a nem szabványos súlyú darabokból pedig 5%-ot nyilvánítanak alakra jónak. Mennyi a valószínűsége annak, hogy egy darab, amely a minőségellenőrzésen alakra jónak bizonyult, megfelel a súlyszabványnak?
Megoldás: A az az esemény, hogy a munkadarab alakra jónak bizonyul. Legyen B1 az az esemény, hogy a vizsgált darab súlya szabványos, a B2 pedig, hogy a darab súlya nem szabványos. A feladatban adott valószínűségek:
05,0)(
98,0)(
04,0)(
96,0)(
2
1
2
1
=
===
BAP
BAP
BP
BP
A B1 esemény valószínűségét keressük az A esemény teljesülése esetén. Ezt a feltételes valószínűséget a Bayes-tétellel számoljuk ki:
998,004,005,096,098,0
09698,0
)()()()(
)()()(
2211
111 =
⋅+⋅⋅=
⋅+⋅⋅
=BPBAPBPBAP
BPBAPABP
Tehát 99,8% a valószínűsége annak, hogy a minőségellenőrzésen alakra jónak bizonyult darab súlya megfelel a szabványnak. 3. Egy biológiai kísérlet során 100 egyedet három – 20, 30 ill. 50 egyedből álló –
csoportokra osztanak. Az első csoport egyedeit gyenge, a másodikét közepes, a harmadikét erős hatóanyaggal oltják be. A csoportokat ezután külön tárolják. Az oltás hatására az első csoportból 3, a másodikból 10, a harmadikból pedig 39 megy keresztül valamilyen változáson. Ezután a csoportok elkülönítését megszüntetik. Ha az összes egyedből egyet találomra kiválasztunk és ennek vizsgálata azt mutatja, hogy nem ment keresztül változáson, akkor mennyi a valószínűsége annak, hogy a kiválasztott egyed a második csoportból való?
Megoldás: A az az esemény, hogy a kiválasztott egyed nem megy keresztül változáson. A Bj azt jelenti, hogy a kiválasztott egyed a j-edik csoportból való.
%67,4112
5
48
20
10050
5011
10030
32
10020
2017
10030
32
)()(
)()()(
50
11)(;
3
2)(;
20
17)(
100
50)(;
100
30)(;
100
20)(
3
1
222
321
321
===⋅+⋅+⋅
⋅=
⋅
⋅=
===
===
∑=j
jj BPBAP
BPBAPABP
BAPBAPBAP
BPBPBP
Tehát 41,67% annak a valószínűsége, hogy a kiválasztott egyed a második csoportból való.
12
4. Tudjuk, hogy egy gyakorlaton résztvevő 18 lövész négy csoportba sorolható úgy, hogy közülük öten 0,8, heten 0,7, négyen 0,6, és ketten 0,5 valószínűséggel találnak a céltáblára. Véletlenül meglátunk közülük egy lövészt, aki egy lövést ad le, de ez nem talál a céltáblára. Melyik csoporthoz tartozik a legnagyobb valószínűséggel a lövész, és mennyi ez a valószínűség?
Megoldás: A legyen az az esemény, hogy a lövész nem talál a céltáblára. A Bi esemény legyen az, hogy a lövész az i-edik csoportba tartozik:
18
5)( 1 =BP
18
7)( 2 =BP
18
4)( 3 =BP
18
2)( 4 =BP
Az A esemény Bi események melletti feltételes valószínűsége:
2,0)( 1 =BAP 3,0)( 2 =BAP 4,0)( 3 =BAP 5,0)( 4 =BAP
A Bi események A feltétel melletti feltételes valószínűségét Bayes tételével számoljuk ki.
∑=
⋅
⋅=
4
1
)()(
)()()/(
jjj
iii
BPBAP
BPBAPABP
E fenti valószínűségek (i=1, 2, 3, 4) közül a legnagyobbat keressük.
180
10
18
25,0)()(
180
16
18
44,0)()(
180
21
18
73,0)()(
180
10
18
52,0)()(
44
33
22
11
=⋅=⋅
=⋅=⋅
=⋅=⋅
=⋅=⋅
BPBAP
BPBAP
BPBAP
BPBAP
Azt kaptuk, hogy a másodiknak a legnagyobb a számlálója. Így a B2 eseménynek az A feltétel melletti feltételes valószínűsége:
19
7
57
21
18010
18016
18021
18010
18021
)()(
)()()( 4
1
222 ==
+++=
⋅
⋅=∑
=jjj BPBAP
BPBAPABP
Tehát a találomra kiválasztott lövész a legnagyobb valószínűséggel a második csoportból való, és ez a valószínűség: 7/19.
13
5. Egy üzemből kikerülő áru 75% valószínűséggel I. osztályú. A készterméket megvizsgálják. Annak valószínűsége, hogy a vizsgálat során az I. osztályú terméket nem I. osztályúnak minősítik 2%. Annak a valószínűsége, hogy egy nem I. osztályú terméket I. osztályúnak minősítenek 5%. Mekkora a valószínűsége annak, hogy egy olyan termék, amelyik egy vizsgálat során I. osztályú minősítést kapott, valóban I. osztályú?
Megoldás: A={a termék I.o. minősítést kap} B1={a termék I.o.} → P(B1)=0,75 P(A|B1)=0,98 B2={a termék nem I.o.}→ P(B2)=0,25 P(A|B2)=0,05
983,025,005,075,098,0
0,750,98A)|( 1 =
⋅+⋅⋅=BP , vagyis 98,3% a valószínűsége.
6. Egy folyóban bekövetkező halpusztulásért 3 ipari üzem lehet felelős. Tapasztalatok
szerint a mérgező anyag kibocsátásának valószínűsége az egyes üzemeknél: 20%, 50% és 30%. A mérések szerint az egyes üzemek szennyvízkibocsátása esetén a halpusztulás valószínűsége: 60%, 15% és 25%. Mennyi a halpusztulás valószínűsége? Mekkora bírságot rójon ki a 2 500 000 Ft-os halkárért a bíróság az egyes cégekre, ha nem ismert a szennyezés kibocsátója?
Megoldás: Bi={az i-edik üzemet terheli a felelősség} (A|Bi)={halpusztulás következett be, feltéve, hogy Bi volt a szennyező} P(B1)=0,2 P(B2)=0,5 P(B3)=0,3 P(A|B1)=0,6 P(A|B2)=0,15 P(A|B3)=0,25 A teljes valószínűség tétele alapján: P(A)=0,2·0,6+0,5·0,15+0,3·0,25=0,27
P(B1|A)= 1 11 3
i ii 1
P(A|B ) P(B ) 0,2 0,6P(B |A)= 0,44
0,27P(B |A) P(B )
=
∗ ∗= =∗∑
Ugyanígy: P(B2|A)=0,28 P(B3|A)=0,28 A 2 500 000 Ft-os halkáron ezekben az arányokban osztoznak: az első üzem 2500*0,44=1,1mFt-ot, a másik kettő pedig 700-700 ezer Ft-ot fizet.
14
Fa diagram
1. Egy multinacionális vállalat nagyszámú végzős hallgatót vesz fel minden évben, s az első évben különböző tréning ill. oktatási programokat szervez számukra. Az új belépők 30%-a egy általános menedzsment programon, 10%-a MBA programon és a többiek vállalati belső tréningeken vesznek részt. Az elmúlt tíz év adatait feldolgozva azt találták, hogy az MBA-re járók 60%-a, az általános menedzsment programon résztvevők 20%-a, míg a belső tréningeken résztvevőknek csak 5%-a került menedzseri pozícióba. a) Határozza meg annak a valószínűségét, hogy egy véletlenül kiválasztott belépő a következő tíz évben menedzseri beosztást kap! b) Határozza meg annak a valószínűségét, hogy egy már tíz éve a vállalatnál dolgozó menedzser MBA képzésre járt az első évben! a.) 100-ból 15 fő kap összesen menedzseri beosztást, 15% a valószínűsége. b.) A 15 menedzserből 6-an jártak MBA képzésre, 6/15 = 40% a valószínűsége, hogy MBA-re járt.
Események függetlensége
1. Ketten lőnek céltáblára. A találat valószínűsége az első személy esetében 0,7; a második esetében 0,6. A találatok egymástól függetlenek. Ha mindketten egy-egy lövést adnak le, mennyi a valószínűsége annak, hogy legalább egy találat van a céltáblán.
Megoldás: Legyen A az az esemény, hogy az első személy talál, és B jelentse azt, hogy a második találatot ér el. Az (A+B) esemény azt jelenti, hogy legalább egy találat van a céltáblán. Ennek a valószínűségére vagyunk kíváncsiak és felhasználjuk azt is, hogy az A és B események függetlenek:
88,042,03,1
6,07,06,07,0)()()()()()()()(
=−==⋅−+=⋅−+=⋅−+=+ BPAPBPAPBAPBPAPBAP
Tehát 0,88 a valószínűsége annak, hogy a céltáblán legalább egy találat van.
100 belépő
30 fő ált. men. program
10 fő MBA program
60 fő belső tréning
6 menedzser
24 beosztott
6 menedzser
4 beosztott
3 menedzser
57 beosztott
15
2. Két, egymástól függetlenül dolgozó szerszámgépen azonos fajta alkatrészeket gyártanak. Az első gépen 0,8, a második gépen 0,7 valószínűséggel kapunk első osztályú alkatrészeket, az ugyanazon a gépen gyártott alkatrészek is függetlenek egymástól. Az első gép gyártmányaiból 3, a második gép gyártmányaiból pedig 2 alkatrészt választunk találomra és megvizsgáljuk őket. Mennyi a valószínűsége annak, hogy mind az 5 első osztályú?
Megoldás: Legyen A a szóban forgó esemény. A függetlenség alapján
251,07,08,0)( 23 ≈⋅=AP Tehát 25,1% a valószínűsége annak, hogy a vizsgált alkatrészek mind első osztályúak. 3. Két dobozban golyók vannak, amelyek csak színeikben különböznek. Az első dobozban
5 fehér, 11 fekete és 8 piros, a másodikban 10 fehér, 8 fekete és 6 piros golyó van. Mindkét dobozból találomra kiveszünk egyet. Mennyi a valószínűsége annak, hogy a két kiválasztott golyó azonos színű?
Megoldás: Legyen A az az esemény, hogy a két kiválasztott golyó azonos színű. A két húzás egymástól független. Háromféle, egymást kizáró esemény összegeként adódik az A, mégpedig úgy, hogy vagy mindkét dobozból fehéret, vagy mindkét dobozból feketét, vagy mindkét dobozból pirosat húzunk. Így az A esemény valószínűsége:
32,024
6
24
8
24
8
24
11
24
10
24
5)( ≈⋅+⋅+⋅=AP
Tehát 32% annak a valószínűsége, hogy a két dobozból azonos színű golyót húzunk. 4. Három szabályos kockát dobunk fel egyszerre. Mennyi a valószínűsége annak, hogy
mindhárom kockán a felülre kerülő pontérték legalább öt? Megoldás: Jelöljük a vizsgált eseményt A-val. Egy kocka esetén az 5-ös és a 6-os dobás valószínűsége külön-külön 1/6. Ezek a lehetőségek egymást kizárják, így annak a valószínűsége, hogy egy kockával 5-öst vagy 6-ost dobunk a két esemény összegének a valószínűsége: 1/3. A három kockán kapott pontértékek egymástól függetlenek. Annak valószínűsége, hogy az A esemény következik be, azaz a kockák mindegyikén az 5-ös vagy 6-os pontértékek valamelyike kerül felülre, a független események szorzatára vonatkozó összefüggés alapján:
27
1
3
1)(
3
=
=AP , így 1/27 annak a valószínűsége, hogy legalább öt a felül látható pontérték
az egyes kockákon.
16
5. Frici és Gizi a következő feltételek mellett játszanak önálló játszmákat. Frici kezdi a játékot, és 0,3 valószínűséggel nyerhet az első játszmában. Ha nem nyeri meg az első játszmát, akkor Gizi következik és ebben a második játszmában 0,5 valószínűséggel győzhet. Ha győz, akkor a játéknak vége. Ha azonban Gizi veszít, akkor ismét Frici következik, és 0,2 valószínűséggel nyerheti meg a harmadik játszmát. Ha Frici a harmadik játszmában veszít, a játék döntetlenül ér véget. Melyik játékosnak van nagyobb esélye a győzelemre a játékban?
Megoldás: Jelöljük A-val azt az eseményt, hogy Frici nyeri a játékot, és B-vel azt az eseményt, hogy Gizi a győztes. Az egyes játszmák eredményeit független kísérletek eredményeinek tekintjük, így együttes bekövetkezésük valószínűsége az egyes események valószínűségének a szorzata. Ezek alapján A valószínűsége:
37,007,03,02,05,07,03,0)( =+=⋅⋅+=AP A B esemény úgy jön létre, hogy Frici az első játszmában veszít, Gizi pedig a másodikban győz. Ezek az események is függetlenek, és B valószínűségét így valószínűségeik szorzata adja:
35,05,07,0)( =⋅=BP Az A esemény valószínűsége nagyobb, mint a B-é, így a két játékos közül Frici esélye nagyobb a győzelemre. 6. Két kockával dobunk. Jelentse A azt az eseményt, hogy az első kockával párost dobunk,
B azt az eseményt, hogy a második kockával páratlant dobunk és C azt az eseményt, hogy mindkettővel párost, vagy mindkettővel páratlant dobunk. A, B és C események teljesen függetlenek-e?
Megoldás: Három (vagy több) esemény függetlenségéhez a páronkénti függetlenségen túl a teljes függetlenségnek, azaz a P(A·B·C) = P(A) P(B) P(C) összefüggésnek is teljesülnie kell.
A = {első kockán páros szám az eredmény} P(A) = 3/6 = 1/2 B = {második kockán páratlan az eredmény} P(B) = 3/6 = 1/2 C = {mindkettőn párost vagy mindkettőn páratlant dobunk} P(C) = 18/36 = 1/2
A·B = {az elsőn páros és a másodikon páratlan az eredmény} P(AB) = 9/36 = 1/4 A·C = {elsőn páros és a másodikon is páros} P(AC) = 9/36 = 1/4 B·C = {másodikon páratlan és az elsőn is páratlan} P(BC) = 9/36 = 1/4 A·B·C = {első páros, a második páratlan és mindkettő páros vagy páratlan} = {∅} P(ABC) = 0 P(AB) = P(A)·P(B) = 1/2·1/2 = 1/4 P(AC) = P(A)·P(C) = 1/2·1/2 = 1/4 P(BC) = P(B)·P(C) = 1/2·1/2 = 1/4 Tehát a páronkénti függetlenség teljesül, de a teljes függetlenség nem, P(ABC) = 0 ≠ P(A)·P(B)·P(C) = 1/8, így a három esemény nem független egymástól.
17
7. Az éves bérek vizsgálata során, egy felmérés eredményeként az alábbi adatokat kaptuk. Éves bér
< £6000 £6000 - £10000 > £10000 Összesen Férfi 30 50 80 160 Nő 50 50 40 140
Összesen 80 100 120 300
a) Tegyük fel, hogy a nem és az éves bér függetlenek egymástól. Határozza meg, s fa diagramon ábrázolja az egyes események valószínűségeit! 300 esetet feltételezve számolja ki az esetek várható számát! b) Határozza meg a valószínűségeket a függetlenség feltételezése nélkül, a tapasztalati adatoknak megfelelően! c) Vizsgálja meg a függetlenséget a függetlenség definícióját felhasználva!
Megoldás: a.) A1 = {férfi}, A 2 = {nő} B1 = {£6000-nál kisebb a fizetés} B2 = {£6000 és £10000 között van a fizetés} B3 = {£10000 felett van a fizetés} P(A1) = 160/300, P(A2) = 140/300 P(B1) = 80/300, P(B2) = 100/300, P(B3) = 120/300
b.) P(B1A1) = 30/300 = 0,1 P(B2A1) = 50/300 = 0,1667 P(B3A1) = 80/300 = 0,2667 P(B1A2) =50/300 = 0,1667 P(B2A2) = 50/300 = 0,1667 P(B3A2) = 40/300 = 0,1333 Látható, hogy a valószínűségek, illetve a számolt és a tényleges létszámok jelentősen eltérnek egymástól, ami azt valószínűsíti, hogy az a.) pontban feltett hipotézisünk (a függetlenség) nem igaz. c.) A1 és B1 függetlensége: P(A1B1) = 30/300 = 0,1 ≠ P(A1)·P(B1) = 160/300·80/300 = 32/225 A2 és B1 függetlensége: P(A2B1) = 5/30 = 0,1667 ≠ P(A2)·P(B1) = 7/15·4/15 = 28/225 és így tovább …
300 dolgozó
160 férfi
140 nő
42,67 fő < £6000, P(B1A1) = 0,1422
53,33 fő 6000-£10000, P(B2A1) = 0,1778
64,0 fő > £10000, P(B3A1) = 0,2133
37,33 fő < £6000, P(B1A2) = 0,1244
46,67 fő 6000-£10000, P(B2A2) = 0,1556
56,0 fő > £10000, P(B3A2) = 0,1867
18
Az előző feladathoz hasonlóan a teljes függetlenséghez az összes párt és az együttes bekövetkezéseket is vizsgálni kellene, de mint látható már az A1, B1 illetve az A2, B2 események sem függetlenek egymástól.
II. Valószínűségi változó. Elméleti eloszlások
Binomiális eloszlás
1. Valaki találomra kitölt egy totószelvényt. Mennyi a valószínűsége annak, hogy az első hét mérkőzéshez az 1, 2, x lehetőségek közül legalább 5 helyre egyest választ?
Megoldás: Legyen A az az esemény, hogy a szelvényt kitöltő egy mérkőzéshez 1-est ír.
3/23/111)(
3/1)(
=−=−==
==
pqAP
így
pAP
A ξ valószínűségi változó jelentse az n=7 db mérkőzéshez beírt egyesek számát.
( ) ( ) )7,...,1,0(3
2
3
1)(
77 =
=
===−
− kk
nqp
k
nkPp
kkkk
k ξ
Az az esemény, hogy az első hét mérkőzéshez legalább öt helyre 1-es kerül három, egymást kizáró esemény összegeként fogható fel: vagy öt, vagy hat, vagy hét helyre ír egyest a fogadó. Ezek a valószínűségek a binomiális eloszlás táblázatának segítségével (n=7; p=0,3 és 0,35 értékeit átlagolva (vagy egyszerűen a 0,35-höz tartozó értéket alapul véve); k=5,6,7) a következők:
0422,00004,0006,00358,0765 =++=++ ppp
Tehát kb. 4,22% a valószínűsége annak, hogy legalább öt helyre 1-es kerül. 2. Mennyi a valószínűsége annak, hogy ha egy családban 10 gyerek születik, akkor
közülük éppen öt fiú lesz? Megoldás: Annak az eseménynek a valószínűsége, hogy fiú születik legyen az A esemény.
2/1)( == pAp A leány születésének valószínűsége:
2/11)( ==−= qpAp A ξ valószínűségi változó jelentse az n=10 gyermek közül a fiúk számát. Annak az eseménynek a valószínűsége, hogy a ξ=5:
19
%61,242461,05 ==p (binomiális eloszlás táblázata: n=10, p=0,5, k=5)
3. Egy üzemben elektromos biztosítékokat gyártanak. A tapasztalat szerint átlagban ezek
15%-a hibás. Számítsuk ki annak a valószínűségét, hogy 10 darab véletlenszerűen kiválasztott biztosíték között
a) nincs selejtes, b) legalább egy selejtes van, c) nincs 1-nél több selejtes!
Megoldás: p=0,15 Annak a valószínűsége, hogy 10 kiválasztott darab között nem lesz selejtes: 0,1969 (táblázatban: p=0,15; n=10; k=0) Annak a valószínűsége, hogy 10 kiválasztott darab között legalább egy selejtes van (vagyis 1 vagy annál több): ezt úgy is értelmezhetjük, mint azt a valószínűséget, amely a 10 darab közötti 0 selejt ellentett eseménye: 1-0,1969=0,8031 Annak a valószínűsége, hogy nincs 1-nél több selejtes, vagyis 0 vagy 1 selejtes van a 10 között: 0,1969+0,3474=0,5443 (táblázat alapján p=0,15; n=10; k=0,1) 4. Fej vagy írás játékkal kapcsolatos két eseményt tekintünk. Az egyik esemény: négy
dobásból 3 fej, a másik: nyolc dobásból 5 fej. Állapítsuk meg, hogy melyik esemény valószínűsége nagyobb szabályos pénzdarab használata esetén!
Megoldás: Legyen A az az esemény, hogy négy dobásból 3 a fej, és B pedig, hogy nyolc dobásból 5 a fej. Egy dobás esetén a fej dobásának valószínűsége: p=1/2 P(A)=0,25 (táblázatból: p=0,5; n=4; k=3) P(B)=0,2188 Tehát nagyobb az esélye annak, hogy négy dobásból háromszor dobunk fejet, mint annak, hogy nyolc dobásból ötször. 5. Egy biztosító társaság egyetemistáknak kínál gépkocsi biztosításokat, s a korábbi évek
tapasztalatai szerint a biztosítottak 3%-a okozott balesetet. Feltételezve, hogy nem változtak meg a körülmények, mekkora a valószínűsége, hogy az adott biztosítónál szerződött 300 egyetemista közül legfeljebb 5 okoz balesetet ebben az évben?
Megoldás: A feladat binomiális eloszlás közelítése Poisson-eloszlással, mivel p elég kicsi, és n elég nagy. p=0,03 n=300 Így a Poisson-eloszlás paramétere: 903,0300 =⋅=⋅= pnλ Most már csak a Poisson táblázatból kell a megfelelő értékeket kikeresni: a legfeljebb 5 egyetemista okoz baleset, az azt jelenti, hogy vagy 0, vagy 1, vagy 2, vagy 3, vagy 4 vagy 5: p0+p1+p2+p3+p4+p5 = 0+0,001+0,005+0,015+0,033+0,060 = 0,114, vagyis 11,4% a valószínűsége annak, hogy a szerződött 300 egyetemista közül legfeljebb 5 okoz balesetet.
20
6. Tegyük fel, hogy korábbi évek tapasztalatai alapján egy ügynök általában minden 5. érdeklődőnek tud eladni egy adott terméket. Egy átlagos héten 20 érdeklődővel beszél. Mennyi a heti eladás várható értéke? Mekkora a heti eladás szórása? Az ügynök külön prémiumot kap, ha egy héten 8-nál több terméket ad el. Mekkora ennek a valószínűsége?
Megoldás: p=0,2
788,18,02,020)1()(
42,020)(
=⋅⋅=−⋅⋅=
=⋅=⋅=
ppnD
pnM
ξξ
A harmadik kérdés megválaszolásához a binomiális táblázatra van szükségünk: n=20, p=0,2; a k>8 valószínűségeket kell összeadnunk: p9+p10+p11+p12= 0,0074+0,002+0,0005+0,0001=0,01=1% (mivel az összes többi valószínűség a táblázatban 0). 7. Az UEFA szigorú előírásai alapján állít elő a Minőségi Bőr Kft. labdarugó labdákat 500
darabos tételekben. Az átadás-átvételi eljárás során két előírás szerint járhatunk el: a) két 10 darabos mintában egyetlen hibás darab sem lehet, b) három 20 darabos mintában mintánként legfeljebb 1 darab selejtes lehet. c) Melyik eljárást választaná az UEFA és melyiket a Minőségi Bőr Kft. helyében, ha a selejtarány várhatóan 5 %?
Megoldás: a) 5987,0)0( 0 === pP ξ � 0,59872=0,3584 � UEFA
b) 3585,0)0( 0 === pP ξ , 3774,0)1( 1 === pP ξ � p0+p1=0,7359 � 0,73593=0,4 � Kft.
8. Mekkora véletlen visszatevéses mintát kell vennünk 1% selejtet tartalmazó
terméktételből, ahhoz, hogy a mintába 95% valószínűséggel legalább egy selejtes termék is kerüljön?
Megoldás: ξ = a selejtes termékek száma P(ξ≥1)≥0,95 Vizsgáljuk az ellentett esemény valószínűségét: P(ξ<1)<0,05. Ez egyféleképpen teljesülhet, ha ξ=0, aminek a valószínűségét a binomiális eloszlás valószínűség-eloszlás függvényével
tudjuk kiszámítani: 05,099,001,00
00 <⋅⋅
= nn
p . Ebből n-t kifejezve n>298,07, azaz n=299.
9. Egy hagyományos repülőgépet négy egymástól független motor hajt. Hosszútávú
vizsgálatok azt mutatják, hogy egy motor repülés közbeni meghibásodásának valószínűsége 5%. A repülőgép még be tudja fejezni az utat, ha 3 motor működik. Mekkora a valószínűsége egy adott repülőúton, hogy
a) nem történik motor hiba? b) legfeljebb 1 motor hiba történik? c) motorhiba miatt lezuhan a gép?
21
Megoldás: a) n=4, k=0, p=0,05 � p0=0,8145 b) vagy 0 vagy 1 motorhiba történik: p0+p1=0,8145+0,1715=0,986 c) ez azt jelenti, hogy legalább 2 meghibásodás történik, vagyis vagy 2, vagy 3, vagy 4 meghibásodás áll elő: p2+p3+p4=0,0135+0,0005+0=0,014
Poisson-eloszlás
1. Kalácssütéskor 1 kg tésztába 30 szem mazsolát tesznek. Mennyi a valószínűsége, hogy egy 5 dkg-os szeletben kettőnél több mazsolaszem lesz? (Feltételezzük, hogy a mazsolák száma Poisson-eloszlást követ.)
Megoldás: Egy 5 dkg-os tésztába átlagosan 30/20, azaz 1,5 mazsolaszem (=λ) jut. Annak a valószínűségét, hogy a mazsolaszemek száma 2-nél nagyobb úgy fogjuk kiszámítani, hogy kikeressük a Poisson-eloszlás táblázatából, hogy mennyi a valószínűsége annak, hogy (k=) 0, 1 és 2 mazsola van benne, majd e valószínűségek összegét kivonjuk egyből: P=1-(0,223+0,334+0,251)=0,192 Tehát 19,2% a valószínűsége annak, hogy az 5 dkg-os szeletben kettőnél több mazsola van. 2. Egy nyomdai korrektúrában 400 oldalon átlagosan 400 sajtóhiba van. A tapasztalat
szerint egy anyagrészben lévő hibák számának eloszlása csak az anyagrész hosszától függ. Mennyi a valószínűsége annak, hogy egy találomra kiemelt oldalon legalább három sajtóhiba van?
Megoldás: A ξ valószínűségi változó az egy oldalon lévő sajtóhibák számát veszi fel. A ξ valószínűségi
változó Poisson-eloszlású, paramétere az egy oldalra eső hibák várható értéke: 1400
400==λ
Annak az eseménynek a valószínűségét, hogy egy oldalon legalább három sajtóhiba van, az ellentett események valószínűségei közötti összefüggéssel számítjuk ki. Háromnál kevesebb sajtóhiba egy kiszemelt oldalon úgy következhet be, hogy a ξ valószínűségi változó 0, 1 és 2 értéket veszi fel. Ezek az esetek kizárják egymást, így összegük valószínűsége: p0+p1+p2. Ezek a valószínűségek a Poisson-eloszlás táblázatból kikereshetők (λ=1, k=0, 1, 2) P(ξ≥3)=1-(p0+p1+p2)=1-(0,367+0,367+0,183)=0,083 3. Egy augusztusi éjszakán átlagosan 10 percenként észlelhető csillaghullás. Mennyi
annak a valószínűsége, hogy egy negyedóra alatt két csillaghullást látunk? (Feltételezzük, hogy a csillaghullások száma Poisson-eloszlást követ.)
Megoldás: Ha 10 percenként átlagosan 1 csillaghullás érzékelhető, akkor 15 percenként 1,5 lesz az átlagos csillaghullás, vagyis λ=1,5. Annak valószínűsége, hogy ezalatt az idő alatt két csillaghullást látunk: P=0,251 (táblázatból: λ=1,5; k=2)
22
4. Egy elektronikus műszer 1000 alkatrészből áll. Egy alkatrész a többitől függetlenül 0,001 valószínűséggel romlik el egy év alatt. Mennyi a valószínűsége annak, hogy legalább két alkatrész romlik el egy év alatt?
Megoldás: Tulajdonképpen binomiális eloszlással kellene számolnunk. Mivel azonban az alkatrészek száma (n=1000) elég nagy (n>30), a p=0,001 valószínűség pedig nagyon kicsi, így bevezetjük a 1001,01000 =⋅=⋅= pnλ paramétert, és a binomiális eloszlás tagjait a megfelelő Poisson-eloszlásból kapott tagokkal közelítjük. A legalább két alkatrész elromlási eseményének ellentettje, hogy kettőnél kevesebb alkatrész romlik el, vagyis hogy vagy 0, vagy 1 alkatrész romlik el. Ezek az esetek egymást kizárják, és összegük valószínűségét ezek valószínűségének összege adja:
734,0367,0367,010 =+=+ pp (Poisson-eloszlás táblázatból, λ=1, k=0,1)
Így a legalább két alkatrész meghibásodásának valószínűsége:
266,0734,01)(1 10 =−=+− pp
Tehát kb. 26,6% a valószínűsége annak, hogy a műszer alkatrészei közül legalább kettő elromlik egy év alatt. 5. Egy telefonközponthoz 600 előfizető tartozik. Tegyük fel, hogy 0,005 a valószínűsége
annak, hogy valamelyik előfizető egy meghatározott órában kapcsolást kér. Mennyi a valószínűsége annak, hogy abban az órában épp 4 előfizető kér vonalat?
Megoldás: Itt is binomiális eloszlással kellene számolnunk, de n=600 elég nagy és p=0,005 pedig elég kicsi ahhoz, hogy a binomiális eloszlást a Poisson-eloszlással közelítsük.
3005,0600 =⋅=⋅= pnλ
168,04 =p (Poisson-eloszlás táblázatból: λ=3, k=4) Tehát 16,8% a valószínűsége annak, hogy az adott órában éppen 4 előfizető kér kapcsolást. 6. Egy orsózógépen 100 munkaóra alatt átlagosan 3 szakadás következik be. Mennyi a
valószínűsége annak, hogy egy ilyen időtartam alatt a szakadások száma túllépi az átlagot? (A szakadások Poisson-eloszlás szerint következnek be.)
Megoldás: A vizsgált időtartam alatt bekövetkező szakadások száma legyen a ξ valószínűségi változó értéke. Ez Poisson-eloszlású, paramétere a vizsgált időtartam alatti szakadások átlagos száma, vagyis 3.
3)( == ξλ M
23
Itt is fordítva gondolkodunk. A kérdés az, hogy mi a valószínűsége, hogy 3-nál több szakadás következik be. Ennek ellentettjét könnyebb számolni, vagyis annak a valószínűségét keressük, hogy 3 vagy annál kevesebb szakadás következik be. A Poisson-eloszlás táblázatának segítségével már csak ki kell keresni az értékeket (λ=3; k=0, 1, 2, 3)
646,0224,0224,0149,0049,03210 =+++=+++ pppp
Így annak a valószínűsége, hogy 3-nál több szakadás következik be:
354,0646,01)3(1)3( =−=<−=≥ ξξ pp Vagyis 35,4% a valószínűsége annak, hogy a szakadások száma 100 óra alatt meghaladja a 3-at. 7. Egy készülék meghibásodásainak átlagos száma 10000 működési óra alatt 10.
Határozzuk meg annak a valószínűségét, hogy a készülék 200 működési óra alatt nem romlik el!
Megoldás:
10000 működési óra alatt 10 meghibásodás � 2,010000
10200)( =⋅== λξM
k=0-nál és λ=0,2-nél a táblázatból )0( =ξP =0,8187 8. Egy készülék szavatossági ideje egy év. A készülék 2000 darab azonos, különlegesen
megbízható elemet tartalmaz, amelyek a szavatossági idő alatt egymástól függetlenül 0,0005 valószínűséggel romlanak el. A szavatosság alapján a gyártó vállalat az egy éven belül bekövetkezett meghibásodások javítására esetenként a teljes ár 1/4 részét fizeti vissza. Ha a javítások száma az év során eléri az ötöt, akkor a gyártó vállalat a már kifizetett négy javítási költségen felül a teljes árat is visszafizeti. Számítsuk ki, hogy előreláthatólag az eredeti vételár hány százaléka marad a gyártó vállalatnál!
Mivel n elég nagy és p elég kicsi, így a binomiális eloszlást közelítjük a Poisson eloszlással.
10005,02000 =⋅=⋅= pnλ Táblázatból kikeressük a megfelelő pk értékeket:
pk Lehetséges bevétel p0=0,3679 +1 p1=0,3679 +3/4 p2=0,1839 +1/2 p3=0,0613 +1/4 p4=0,0153 0 p5=0,0031 -1
748,00031,0100613,041
1839,021
3679,043
13679,0)( =⋅−+⋅+⋅+⋅+⋅=ξM
Tehát a vállalat a szavatosságra kb. 25%-ot fordít.
24
9. 100 méter hosszú szövetanyagon átlagosan 5 hibát találtunk, s a mérések a szövethibák számát Poisson eloszlásúnak mutatták. 300 méter hosszú szövetet 4 méter hosszú terítékekre osztanak. Minden 4 méteres darabból egy-egy öltöny készül. A hibátlan öltönyt darabonként 40000 forintért árusítják, a szövethibásat 30000 forintért. Várhatóan hány hibátlan van a 300 méteres szövetvégből készült öltönyök között? Mennyi az öltönyök eladásából származó árbevétel?
Megoldás: Várhatóan hány hibátlan van a 300 méteres szövetvégből készült öltönyök között? (mennyi a valószínűsége, hogy 4 méter szövetben nem találunk szövethibát?) Jelölje a ξ valószínűségi változó a hibák számát a 4 méter szövetben. Először határozzuk meg eloszlás λ paraméterét.
( ) λξ === 2,0)4/100/(5M k=0
( ) %87,81!0
2,00 2,02,0
0
≈=== −− eeP ξ
A 300 méteres szövetvégből összesen 75 darab öltönyt lehet készíteni. A 75 darabból várhatóan 61 darab hibátlan öltöny készül. (75·0,8187) A hibátlan öltönyt darabonként 40000 forintért árusítják, a szövethibásat 30000 forintért. Mennyi az öltönyök eladásából származó árbevétel? Az árbevétel várhatóan: (61·40.000)+(14·30.000)=2.860.000 Ft
Exponenciális eloszlás
1. Bizonyos típusú izzólámpák tönkremeneteléig eltelt égési időtartam hosszát tekintsük valószínűségi változónak. Megállapították, hogy ez a valószínűségi változó exponenciális eloszlást követ, és szórása 1000 óra. Határozzuk meg a valószínűségi változó várható értékét! Számítsuk ki annak a valószínűségét, hogy egy kiválasztott izzólámpa 3000 órán belül nem megy tönkre!
Megoldás: Mivel a ξ valószínűségi változó várható értéke és szórása megegyezik (mivel exponenciális eloszlást követ), így:
óra
óraMD
1
1000
1
10001
)()(
=
===
λ
λξξ
Az az esemény, hogy egy izzólámpa 3000 órán belül nem megy tönkre, azt jelenti, hogy a ξ≥3000. Ennek valószínűsége:
25
05,0)1(1)3000(1)3000(1)3000( 330001000
1
≈=−−=−=<−=≥ −⋅−eeFPP ξξ
Tehát kb. 5% a valószínűsége annak, hogy egy izzólámpa legalább 3000 órán át hibátlanul világít. 2. Egy intézet külföldről rendel könyveket. Az ehhez szükséges devizára várni kell, a
tapasztalatok alapján ½ évet. A várakozási idő exponenciális eloszlású. Mennyi a valószínűsége annak, hogy az intézet egy negyedéven belül megkapja a könyveket?
Megoldás: Exponenciális esetben M(ξ)=1/λ=1/2, így λ=2.
39347,011)4
1( 2
1
4
12
=−=−=<−−
eeP ξ
Így közel 39% az esélye annak, hogy az intézet egy negyedéven belül megkapja a könyveket. 3. Egy szövőgép automatikusan megáll, ha legalább egy fonalszakadás történik. Legyen ξ
a gép megindulásától az első fonalszakadásig eltelt idő. A ξ-re tett megfigyelések szerint az exponenciális eloszlású, várható értéke 2,5 óra. Mekkora a valószínűsége annak, hogy egy munkanap alatt, amely 8 órából áll, a gép egyszer sem áll fonalszakadás miatt?
Megoldás: Exponenciális esetben M(ξ)=1/λ=2,5, így λ=0,4
0408,011)8(1)8( 2,384,0 ==+−=<−=≥ −⋅− eePP ξξ 4,08% a valószínűsége annak, hogy az adott munkanapon nem lesz fonalszakadás. 4. Egy szövőgép 400 szállal dolgozik. Az egyes szálak élettartama, tehát amíg el nem
szakad, exponenciális eloszlású, minden szálra ugyanazzal a λ=1/150 paraméterértékkel, és feltehető, hogy a szakadások egymástól függetlenek. Mennyi a valószínűsége annak, hogy a gép fonalszakadás miatt a megindulástól számított 3 órán belül megáll?
Megoldás: A ξi az i-edik szál élettartama. A gép akkor áll le, ha van olyan szál, amely 3 órán belül elszakad, azaz, ha ξ1, ξ2, …, ξ400 valószínűségi változók legkisebbike kisebb 3-nál. Jelöljük η-vel a ξ1, ξ2, …, ξ400 valószínűségi változók legkisebbikét: ),...,,min( 40021 ξξξη =
A feladatunk a P(η<3) valószínűség meghatározása. Ez a valószínűség így is felírható (felhasználva a szakadások egymástól való függetlenségét):
)3(...)3()3(1
)3,...,3,3(1)3),...,,(min(1)3(1)3(
40021
4002140021
≥⋅⋅≥⋅≥−==≥≥≥−=≥−=≥−=<
ξξξξξξξξξηη
PPP
PPPP
50
13
150
1
)3(1)3(−⋅−
==<−=≥ eePP ii ξξ
9993,09802,01)(1)3( 40040050
1
=−=−=<−
eP η A keresett esemény tehát majdnem biztosan (99,993% valószínűséggel) bekövetkezik.
26
5. Egy üzletbe átlagosan 30 vevő érkezik óránként. Mennyi annak a valószínűsége, hogy két egymás után érkező vevő ideje között eltelt idő 2 percnél több. Mennyi a valószínűsége, hogy ez az időtartam 3 percnél kevesebb? Mekkora a valószínűsége annak, hogy ez az időtartam 1 és 3 perc közé esik?
Megoldás: Az óránként beérkező vevők számát Poisson-eloszlásúnak tekintjük. Mivel 2 vevő beérkezése között eltelt idő átlagosan 2 perc, az exponenciális eloszlás paramétere: λ=1/2. A kérdéses valószínűségek:
1. 368,011)2(1)2( 122
1
==+−=<−=≥ −⋅−eePP ξξ
2. 7769,01)3(3
2
1
=−=<⋅−
eP ξ
3. 3834,011)31( 2
3
2
1
2
1
2
3
=−=+−−=≤≤−−−−
eeeeP ξ 6. Egy automatizált gépsor hibamentes működésének valószínűsége 120 működési órára
0,9. Tegyük fel, hogy a működési idő exponenciális eloszlású. Számítsa ki a λ meghibásodási rátát és a működési idő várható értékét, valamint annak a valószínűségét, hogy a gépsor a 150. és a 200. óra között meghibásodik.
Megoldás: A meghibásodási ráta, vagyis az eloszlás paramétere:
4
120120
1078,89,0ln120
9,01,011,0)120(9,0)120(19,0)120(−
⋅−⋅−
⋅=→=⋅−→=→=−→=→=−→=>
λλξ λλ eeFFP
11391078,8
11)(
4≈
⋅== −λ
ξM óra a működési idő várható értéke.
03765,0
11)150()200()200150( 2001078,81501078,81501078,82001078,8 4444
==−=+−−=−=<≤ ⋅⋅−⋅⋅−⋅⋅−⋅⋅− −−−−
eeeeFFP ξ
Így 3,765% annak a valószínűsége, hogy a gépsor a 150. és a 200. óra között meghibásodik. 7. Egy radioaktív anyag (sugárforrás) bomlási viszonyait vizsgáljuk. Legyen a
valószínűségi változó egy tetszőleges atom bomlásáig eltelt idő és annak valószínűsége, hogy az anyag egy tetszőleges atomja x éven belül elbomlik:
0x ha ,e1)x (P 2/x ⟩−=⟨ −ξ
Határozza meg a valószínűségi változó várható értékét, szórását, valamint a bomlás felezési idejét! Számítsa ki annak a valószínűségét, hogy egy tetszőleges atom túléli a 3 évet!
Megoldás: Az eloszlás paraméterét, λ-t, a fenti egyenletből kikövetkeztethetjük: 1/2
22/1
11)( ===
λξM )()( ξξ DM =
A bomlás felezési ideje: 3863,15,0ln2
5,05,01 2/2/ =→=−→=→=− −− xx
ee xx év
27
223,011)3(1)3( 2/3 =+−=<−=> −ePP ξξ , vagyis 22,3% a valószínűsége annak, hogy egy tetszőleges atom túléli a 3 évet. 8. Számítsa ki az F(x=1/λ) eloszlásfüggvény értéket! Megoldás:
6321,0111)( 11
=−=−=−= −⋅−⋅− eeexF x λλλ , vagyis 63,21%.
Normális eloszlás
1. Egy vállalatnál az alkalmazottak heti bére normális eloszlású $100 várható értékkel és $10 szórással. Mekkora a valószínűsége, hogy egy találomra kiválasztott dolgozó
a) 95 és 135 dollár között keres? b) 112,5 dollárnál többet keres? c) 80 dollárnál kevesebbet keres? d) Mekkora heti fizetést kap a legjobban kereső 20%-ba tartozó dolgozók közül, a
legkevesebbet kereső? Megoldás: a) 95 és 135 dollár között keres:
691212,0691462,0199975,0)5,0(1
)5,3()5,0()5,3()10
10095()
10100135
()95()135()13595(
=+−=Φ+−
−Φ=−Φ−Φ=−Φ−−Φ=−=<≤ FFP ξ
Tehát 69,12% annak a valószínűsége, hogy valaki 95 és 135 dollár között keres. b) 112,5 dollárnál többet keres:
10565,089435,01)25,1(1)10
1005,112(1)5,112(1)5,112( =−=Φ−=−Φ−=−=> FP ξ
Vagyis 10,56% a valószínűsége annak, hogy 112,5 dollárnál valaki többet keres. c) 80 dollárnál kevesebbet keres:
02275,097725,01)2()10
10080()80()80( =−=−Φ=−Φ==< FP ξ
Vagyis 2,275% a valószínűsége annak, hogy valaki 80 dollárnál kevesebbet keres. d) Mekkora heti fizetést kapnak a legjobban kereső 20%-ba tartozó dolgozók közül a legkevesebbet keresők?
2,0)( => xP ξ � 2,0)(1 =− xF � 8,0)( =xF � 8,0)10100
( =−Φ x� z=0,84�
10100
84,0−= x
� x=108,4 dollár felett keres a legjobban fizetett 20%.
28
2. Egy vizsgálat szerint a felnőtt korú férfiak testmagassága N(174cm; 7cm) eloszlást követ. Határozza meg annak a valószínűségét, hogy egy véletlenszerűen kiválasztott férfi testmagassága:
a) nagyobb, mint 190 cm, b) 170 és 185 cm közé esik, c) mekkora a testmagasság szórása, ha tudjuk, hogy a férfiak 5%-ának a
testmagassága 168 cm alatt van? Megoldás: a) nagyobb, mint 190 cm,
%13,1011304,0
988696,01)28,2(1)7
174190(1)190(1)190(1)190(
==
=−=Φ−=−Φ−=−=<−=≥ FPP ξξ
3. 170 és 185 cm közé esik,
%74,656574,0715661,01941792,0)57,0(1)57,1(
)57,0()57,1()7
174170()
7
174185()170()185()185170(
==+−=Φ+−Φ=
=−Φ−Φ=−Φ−−Φ=−=<≤ FFP ξ
4. mekkora a testmagasság szórása, ha tudjuk, hogy a férfiak 5%-ának a testmagassága 168
cm alatt van?
66,3174168
64,1
64,195,0)(05,0)(05,0)174168
(
05,0)168(
05,0)168(
=→−=−
−=→=Φ→=Φ→=−Φ
==<
σσ
σ
ξ
zzz
F
P
3. Egy termék élettartama N(13év; 1év) eloszlású.
a) Teljesíti-e az élettartam azt az elvárást, hogy a 11 évnél korábban meghibásodó termékek aránya legfeljebb 1% legyen?
b) Ha nem, akkor hogyan kell megváltoztatni a várható értéket, ill. a szórást, hogy teljesítsék az előírást?
c) Termékfejlesztés eredményeképpen egy új termék élettartama N(16év; 0,9év) eloszlással jellemezhető. Mekkora garanciális időt adjon a cég ahhoz, hogy a termékek legfeljebb 5%-a menjen tönkre a garancia alatt?
Megoldás: a) Teljesíti-e az élettartam azt az elvárást, hogy a 11 évnél korábban meghibásodó termékek
aránya legfeljebb 1% legyen?
29
%28,202275,097725,01)2(1)2()1
1311()11()11( ==−=Φ−=−Φ=−Φ==< FP ξ
Nem teljesíti az elvárást, hiszen a 11 évnél korábban meghibásodó termékek aránya 2,28%. b) Ha nem, akkor hogyan kell megváltoztatni a várható értéket, ill. a szórást, hogy teljesítsék
az előírást? (A várható értéknek nyilván nagyobbnak, a szórásnak pedig kisebbnek kell majd lennie.) Várható érték változtatása:
év
zzzFP
34,1334,21
11
34,299,0)(01,0)(01,0)1
11(01,0)11()11(
=→−=−
−=→=Φ→=Φ→=−Φ→==<
µµ
µξ
Szórás változtatása:
85,034,21311
01,0)1311
(
=→−=−
=−Φ
σσ
σ
c) Termékfejlesztés eredményeképpen egy új termék élettartama N(16év; 0,9év) eloszlással
jellemezhető. Mekkora garanciális időt adjon a cég ahhoz, hogy a termékek legfeljebb 5%-a menjen tönkre a garancia alatt?
évxx
zzz
xxFxP
52,1464,19,016
64,195,0)(05,0)(
05,0)9,016
(05,0)()(
=→−=−→−=→=Φ→=Φ
=−Φ→==<ξ
14,52 év garanciát kellene adnia a cégnek. 4. A munkapadról kikerülő termék hossza normális eloszlású valószínűségi változó µ=20cm és σ=0,2cm paraméterekkel. Mekkora annak a valószínűsége, hogy egy termék hossza 19,7 és 20,3 közé esik? Milyen pontosságot biztosíthatunk 0,95 valószínűséggel a munkadarabok hosszára?
Megoldás:
8664,0
933193,01933193,0)5,1()5,1()2,0
207,19()
2,0
203,20()3,207,19(
=
=+−=−Φ−Φ=−Φ−−Φ=<≤ ξP
Tegyük fel, hogy a munkadarabnak µ=20cm-es mérettől való eltérése x cm. Így a feltétel szerint:
30
392,096,12,0
975,0)2,0
(
95,01)2,0
(2)2,0
(1)2,0
(
)2,0
()2,0
()2,0
2020()
2,0
2020()2020(
=→=
=Φ
=−Φ⋅=Φ+−Φ=
=−Φ−Φ=−−Φ−−+Φ=+<≤−
xx
x
xxx
xxxxxxP ξ
Tehát 95%-os valószínűséggel állíthatjuk, hogy a hosszeltérés 4 mm-nél nem lesz nagyobb. 5. Valamely szolgáltató vállalathoz naponta beérkező megrendelések ξ száma a
tapasztalatok szerint közelítőleg normális eloszlásúnak tekinthető σ=10 szórással. Mekkora a megrendelések várható száma, ha tudjuk, hogy 1,0)20( =<ξP ?
Megoldás:
9,3229,110
20
9,0)10
20(
1,0)10
20()20(
=→=−
=−Φ
=−Φ=<
µµ
µ
µξP
A naponta beérkező megrendelések átlagos száma 33. 6. Bizonyos típusú rádiócsöveket, amelyeknek az élettartama normális eloszlású, µ=160 és σ=20 óra paraméterekkel, négyesével dobozokba csomagolnak. Mennyi a valószínűsége annak, hogy egy ilyen dobozban lévő 4 cső mindegyike 180 óránál tovább fog működni? Mennyi annak a valószínűsége, hogy a 4 cső közül kettőt kivéve, az egyik 180 óránál tovább fog működni a másik meg nem?
Megoldás: Annak a valószínűsége, hogy egy cső működési ideje 180 óránál nagyobb lesz:
158655,0841345,01)1(1)20
160180(1)180(1)180( =−=Φ−=−Φ−=<−=≥ ξξ PP
A két kérdésre adandó felelethez figyelembe kell venni, hogy a 4 cső között azok száma, amelyeknek a működési ideje 180 óránál nagyobb, binomiális eloszlású, ahol p=0,158655. Így a keresett valószínűségek a binomiális eloszlás táblázat segítségével könnyen meghatározhatók: Annak a valószínűsége, hogy a 4 cső mindegyike működik: 0,0005 (táblázatban p=0,15; n=4; k=4). Annak valószínűsége, hogy a 4 csőből 2-őt kivéve az egyik tovább működik, a másik meg nem: 0,255 (táblázatban p=0,15; n=2; k=1)
31
7. A Jólfizetünk Rt. új üzeménél megvizsgálták a dolgozók fizetését, s azt találták, hogy a fizetés N(135000Ft, 10000Ft) eloszlású. Legnagyobb versenytársuk közelben működő üzeménél azt tapasztalták, hogy 115 000 Ft-nál a dolgozók legfeljebb 1%-a kap kevesebbet. Teljesíti-e az új üzem ezt az elvárást? Ha nem, mekkora legyen a szórás ill. a várható érték hogy teljesítsék? A bérfejlesztés után megismételve a vizsgálatot a fizetések eloszlása N(140000Ft, 8000Ft). Legfeljebb mennyit keres a cégnél a legrosszabbul kereső 5%?
Megoldás:
02275,097725,01)2()10000
135000115000()115000()115000( =−=−Φ=−Φ==< FP ξ
Az új üzem nem teljesíti az elvárást, ugyanis a 115 000 Ft alatt keresők aránya meghaladja az 1%-ot, hiszen azok aránya 2,275%. Várható érték változtatása:
01,0)10000
115000()115000()115000( =
−Φ==< újFP
µξ � z=-2,34 �
10000
11500034,2 újµ−
=− �
µúj=138400Ft Szórás változtatása:
01,0)135000115000
()115000()115000( =−Φ==<új
FPσ
ξ � z=-2,34 �
újσ135000115000
34,2−=− �σúj=8547Ft
Legfeljebb mennyit keres a cégnél a legrosszabbul kereső 5%?
05,0)( =< xP ξ � 05,0)( =xF � 05,0)8000140000
( =−Φ x� z=-1,65�
8000140000
65,1−=− x
x=126800Ft, vagyis a legrosszabbul kereső 5% között 126800Ft-ot keres a legjobban fizetett alkalmazott.
8. Export konyak töltésénél az 510 ml alatti palackok aránya legfeljebb 3% lehet.
Megvizsgáltak egy n=20000 db-os tételt: x=532,4 ml, σ=6 ml. Határozzuk meg az optimális töltési szintet. Mekkora az adott tételnél a töltési veszteség értéke, ha á=1000 Ft/palack?
Megoldás:
)6
510()510(03,0)510(
µξ −Φ===< FP � z=-1,88 � µ=521,28 az optimális töltési szint.
A töltési veszteség mértéke: 22240020000)28,5214,532( =⋅− � 64,42628,521
222400= palacknyi
túltöltés, aminek a következménye 426640Ft töltési veszteség.
32
9. A bélszínrolót négyesével csomagolják tasakokba. A rolók súlya N(50gr., 5gr.) eloszlást követ. Mekkora a valószínűsége annak, hogy a tasak valamennyi rolója 55 grammnál nehezebb?
Megoldás: Első lépésben azt számoljuk ki, hogy mi a valószínűsége annak, hogy egyetlen darab bélszínroló súlya nagyobb, mint 55 gramm.
158655,0841345,01)1(1)5
5055(1)55(1)55( =−=Φ−=−Φ−=−=> FP ξ , vagyis 15,86%.
Annak a valószínűsége, hogy a csomagban mind a 4 rolónak a súlya nagyobb, mint 55 gramm, ennek a negyedik hatványa lesz:
0006336,0158655,0 4 = , vagyis mindösszesen 0,06336% a valószínűsége.
III. Leíró statisztika
1. A táblázat a Budapesti Értéktőzsde hivatalos indexének (BUX) száz napi záró értékéből számított hozamadatait tartalmazza. Készítse el az alábbi adatbázis részletes leíró statisztikai elemzését!
Napi hozamok
0,01896 0,00613 0,01091 -0,01742 0,01328 0,02415 0,00805 0,00754 0,0011 -0,00312
0,0846 0,00186 -0,00024 -0,02076 0,01011 0,00476 0,00611 -0,00015 0,03295 -0,00782
0,0529 0,0102 0,0081 -0,0567 0,02865 -0,01836 -0,01001 0,0146 0,01182 0,00729
-0,01877 0,00845 0,00448 0,00602 0,01818 0,00567 0,0018 0,01303 0,01192 0,00104
0,00121 0,01508 -0,00322 0,019 -0,01281 -0,00413 -0,00676 0,00611 0,02417 -0,00365
-0,01759 0,03565 0,02769 0,02964 -0,01967 0,00654 0,00272 -0,01123 0,0253 -0,01055
-0,01255 0,02841 0,04391 0,0581 -0,03858 0,00319 -0,00307 -0,00145 -0,00922 0,00016
0,01269 0,01359 -0,00271 -0,00041 0,02758 0,0008 0,00438 0,01244 0,0044 0,00709
0,00622 0,02758 -0,01226 0,0022 -0,00043 0,00483 0,01527 0,00432 0,02801 -0,00711
0,00248 0,03258 -0,01609 0,00087 0,02823 0,0143 0,01493 -0,00391 -0,01541 0,00524
Rangsor (oszloponként)
-0,0567 -0,01281 -0,00413 -0,00024 0,0022 0,00524 0,00754 0,01269 0,01896 0,02841
-0,03858 -0,01255 -0,00391 -0,00015 0,00248 0,00567 0,00805 0,01303 0,019 0,02865
-0,02076 -0,01226 -0,00365 0,00016 0,00272 0,00602 0,0081 0,01328 0,02415 0,02964
-0,01967 -0,01123 -0,00322 0,0008 0,00319 0,00611 0,00845 0,01359 0,02417 0,03258
-0,01877 -0,01055 -0,00312 0,00087 0,00432 0,00611 0,01011 0,0143 0,0253 0,03295
-0,01836 -0,01001 -0,00307 0,00104 0,00438 0,00613 0,0102 0,0146 0,02758 0,03565
-0,01759 -0,00922 -0,00271 0,0011 0,0044 0,00622 0,01091 0,01493 0,02758 0,04391
-0,01742 -0,00782 -0,00145 0,00121 0,00448 0,00654 0,01182 0,01508 0,02769 0,0529
-0,01609 -0,00711 -0,00043 0,0018 0,00476 0,00709 0,01192 0,01527 0,02801 0,0581
-0,01541 -0,00676 -0,00041 0,00186 0,00483 0,00729 0,01244 0,01818 0,02823 0,0846
33
Megoldás: Osztályok számának meghatározása (egy lehetséges módszer)
Nk >02 � 12827 =
0
minmax0 k
YYh
−= � 0202,002018,07
)05670,0(08460,00 ≈=−−=h
Gyakorisági táblázat
oszályközhosszúság f i gi fi' gi'
-0,0567 -0,0365 2 2,00% 2 0,02
-0,0365 -0,0163 6 6,00% 8 0,08
-0,0163 0,0039 36 36,00% 44 0,44
0,0039 0,0241 38 38,00% 82 0,82
0,0241 0,0443 15 15,00% 97 0,97
0,0443 0,0645 2 2,00% 99 0,99
0,0645 0,0847 1 1,00% 100 1
100 Kvartilisek meghatározása Az adatok egyenkénti ismeretéből kiindulva:
( )( ) 0031075,0)00312,0(00307,025,000312,0
25,2511004
1
1
4/1
−=−−−+−=
=+=
Q
s
Tehát ennél az értéknél az adatok ¼ része kisebb, ¾ része pedig nagyobb.
( )( ) 014525,00143,00146,075,00143,0
75,7511004
3
3
4/3
=−+=
=+=
Q
s
Ennél az értéknél az adatok ¾ része kisebb, ¼ része pedig nagyobb. Medián A medián nem más, mint a középső kvartilis:
( ) ( ) 005035,000483,000524,05,000483,0ˆ5,5011002
12/1 =−+=→=+= eMs
A medián a két középső érték átlaga:
005035,0)00524,000483,0(2
1 =+=Me
A medián becsülhető a gyakorisági táblázat alapján:
meme
me
me hf
fN
YeM
'1
0,2ˆ
−−+=
2' N
fme ≥
34
00709,00202,038
44500039,0ˆ =⋅−+=eM
Módusz A 4. osztály a modális osztály, mert ebben a legnagyobb a tapasztalati gyakoriság:
mofa
amo h
dd
dYoM
++= 0,
ˆ 1−−= momoa ffd 1+−= momof ffd
( ) ( ) 005516,00202,015383638
36380039,0ˆ =⋅
−+−−+=oM
Számtani átlag Az egyenként ismert adatokból számítva:
0066541,0100
66541,0
100
0846,0...)03858,0()0567,0( ==++−+−=x
A gyakorisági táblázatban szereplő információk alapján történő becslés:
007536,0100
7536,0
100
10746,020544,0...6)0264,0(2)0466,0( ==⋅+⋅++⋅−+⋅−=x
Osztály Alsó határ
Felső határ osztályközép
gyakoriság (fi) osztályközép *fi di=osztályközép-Xátl.becsült di2 fidi2
1. -0,0567 -0,0365 -0,0466 2 -0,0932 -0,054136 0,0029307 0,005861
2. -0,0365 -0,0163 -0,0264 6 -0,1584 -0,033936 0,0011517 0,00691
3. -0,0163 0,0039 -0,0062 36 -0,2232 -0,013736 0,0001887 0,006792
4. 0,0039 0,0241 0,014 38 0,532 0,006464 0,0000418 0,001588
5. 0,0241 0,0443 0,0342 15 0,513 0,026664 0,0007110 0,010665
6. 0,0443 0,0645 0,0544 2 0,1088 0,046864 0,0021962 0,004392
7. 0,0645 0,0847 0,0746 1 0,0746 0,067064 0,0044976 0,004498
összesen 100 0,7536 0,040706
A táblázat utolsó három oszlopa a tapasztalati szórás becsléséhez szolgáltat majd információt! Terjedelem
1413,0)0567,0(0846,0minmax =−−=−= YYR
Interkvartilis terjedelemmutató
0176325,0)0031075,0(014525,0135,0 =−−=−= QQR
Korrigált tapasztalati szórás Adatok egyenkénti ismeretéből kiindulva:
0188,099
0,0353111599
)0066541,0x(
99
d
99
)xx(
s
100
1j
2j
100
1j
2j
100
1j
2j
==−
==−
=∑∑∑
===∗
35
Korrigált tapasztalati szórás becslése gyakorisági táblázat alapján:
( )0,020277
99
0,040706
111
7
1
2
1
1
2
==−
=−
−=
∑
∑
∑
∑
=
=
=
=∗r
ii
iii
r
ii
r
iii
f
df
f
xxfs
Grafikus ábrázolás, hisztogram
Gyakorisági hisztogram
2
6
3638
15
2 1
0
5
10
15
20
25
30
35
40
1. 2. 3. 4. 5. 6. 7.
Osztály sorszáma
Tap
aszt
alat
i gya
koris
ág
Kumulált relatív gyakorisági hisztogram
0,020,08
0,44
0,82
0,97 0,99 1
0
0,2
0,4
0,6
0,8
1
1,2
1. 2. 3. 4. 5. 6. 7.
Osztály sorszáma
Kum
ulál
t rel
atív
gya
koris
ág
36
2. A 100 g-os Omnia kávé töltési folyamatának két különböző napon mért nettó tömegértékei az alábbiak (a mérések a gyártási folyamatot követve, sorrendben történtek, kb. 1/2 óra alatt, egy négymérleges Hesser gép 2.sz. mérlegének töltését figyelve):
egyik nap: 101,8 100,7 101,0 101,2 100,1 100,4 100,5 100,2 103,3 100,1 101,1 102,2 101,2 101,2 101,3 101,1 100,9 101,3 101,2 102,1 101,3 101,7 100,6 100,6 101,5 102,8 101,8 101,4 101,8 102,3 100,6 101,4 99,7 101,3 101,4 101,2 100,2 102,1 101,9 101,0 101,4 101,8 100,9 102,4 100,8 100,6 101,3 101,4 102,1 101,4 másik nap: 100,4 99,3 100,5 100,2 100,7 100,4 99,6 100,3 99,4 101,2 100,2 100,3 99,6 100,2 100,1 98,6 101,3 99,1 99,5 100,3 98,5 100,2 100,4 99,8 100,4 99,7 100,0 101,2 100,8 98,7 99,7 99,8 98,1 101,6 100,5 99,9 100,2 101,4 100,3 99,6 99,0 100,7 99,2 100,5 102,2 100,1 100,8 100,2 100,3 99,8 Végezze el a statisztikai-szakmai elemzést! Számítsa ki az eloszlás statisztikai paramétereit! Mekkora a valószínűsége a tűréshatárokon való kivülesésnek, ha az alsó tűréshatár 98g, a felső tűréshatár pedig 102g? Megoldás: leíró statisztikai ppt előadás végén. 3. Egy üdítőitalokat forgalmazó cég budapesti részlegénél dolgozó 26 értékesítési képviselő
2005. január havi teljesítménye (kiszállított mennyiség, ezer rekesz):
15,6 26,8 13,5 8,8 13,3 20,2 13,7 15,7 24,7 8,5 19,1 16,6 19,2 18,7 16,1 20,5 14,2 13,2 15,9 13,1 18,8 33,6 34,7 16,9 14,8 21,8
Számítsuk ki az átlagos teljesítményt, határozzuk meg a mediánt! Számítsuk ki az ismert szóródási mérőszámokat! Jellemezzük az eloszlás aszimmetriáját a Pearson-féle mutatóval!
Megoldás: Rangsor 8,5 8,8 13,1 13,2 13,3 13,5 13,7 14,2 14,8 15,6 15,7 15,9 16,1 16,6 16,9 18,7 18,8 19,1 19,2 20,2 20,5 21,8 24,7 26,8 33,6 34,7 A, Számítsuk ki az átlagos teljesítményt, határozzuk meg a mediánt! Átlagos teljesítmény meghatározása számtani átlaggal:
ezerN
xxxx n 18
26
7,346,33...8,85,8...21 =++++=+++
=
18 ezer rekesz az átlagos teljesítmény.
37
Medián: 16,1 16,6
16,352
Me+= =
16,35 ezer rekesznél többet teljesített az értékesítési képviselők fele, a másik fele kevesebbet. B, Számítsuk ki az ismert szóródási mérőszámokat! Terjedelem
2,265,87,34minmax =−=−= XXR Szórás
2128,626
)187,34()186,33(...)185,8( 222
=−+−++−=s
Korrigált tapasztalati szórás
335,625
)187,34()186,33(...)185,8( 222
=−+−++−=∗s
Átlagosan 6,335 ezer rekesszel tér el az egyes képviselők teljesítménye az átlagostól. Relatív szórás:
345157,0182128,6 ==V
Az egyes képviselők teljesítményének az átlagostól való átlagos eltérése 34,51%. Interkvartilis terjedelemmutató:
625,665,13275,20
275,20)2,205,20(25,02,20
25,20)126(43
65,13)5,137,13(75,05,13
75,6)126(41
132/1
3
4/3
1
4/1
=−=−==−⋅+=
=+⋅=
=−⋅+=
=+⋅=
QQR
Q
s
Q
s
Az értékesítési képviselők negyedének a teljesítménye 13,65 ezer rekesznél alacsonyabb, háromnegyedüké magasabb (Q1). Az értékesítési képviselők háromnegyedének teljesítménye 20,275 ezer rekesznél alacsonyabb, egynegyedüké magasabb (Q3). Az interkvartilis terjedelemmutató azt fejezi ki, hogy az értékesítési képviselők felének teljesítménye 6,625 ezer rekesznyi sávban helyezkedik el. C, Jellemezzük az eloszlás aszimmetriáját a Pearson-féle mutatószám segítségével!
38
79,021,6
)35,1618(3)(3 =−⋅=−⋅=s
MexP
Erősebb (de még mérsékelt) baloldali aszimmetria. D, Készítsünk gyakorisági sort, és becsüljük meg a móduszt!
02k N> , kb. 5 osztályt célszerű készíteni.
24,55
5,87,340 =−=h
Legyen 5,4 (kerekítéssel) az osztályköz-hosszúság!
Osztályhatár gyakoriság 8,5≤x<13,9 7 13,9≤x<19,3 12 19,3≤x<24,7 3 24,7≤x<30,1 2 30,1≤x<35,5 2 Összesen: 26
82,154,5)312()712(
7129,13ˆ =⋅
−+−−+=oM
Az értékesített mennyiségek a 15,82 ezer rekesz körül tömörülnek. 4. Minőségellenőrzés keretében vizsgálták egy adott típushoz tartozó elektromos habverők
élettartamát. A 120 megfigyelés eredménye:
Élettartam (év) Megfigyelések száma (db) 5,0≤x<5,5 8 5,5≤x<6,0 28 6,0≤x<6,5 50 6,5≤x<7,0 24 7,0≤x<7,5 10 Összesen 120
Ábrázoljuk a gyakorisági sort! Számítsuk ki a helyzeti középértékeket, az átlagot, a szórást, az aszimmetria egyik mérőszámát!
39
Megoldás: a) Ábrázoljuk a gyakorisági sort!
gyakorisági hisztogram
0
10
20
30
40
50
60
5,0-5,5 5,5-6,0 6,0-6,5 6,5-7,0 7,0-7,5
osztályok
meg
figye
lése
k sz
áma
b) Számítsuk ki a helyzeti középértékeket, az átlagot, a szórást, az aszimmetria egyik mérőszámát!
Élettartam (év) Megfigyelések száma (db) (gyakoriságok)
Kumulált gyakoriság
5,0≤x<5,5 8 8 5,5≤x<6,0 28 36 6,0≤x<6,5 50 86 6,5≤x<7,0 24 110 7,0≤x<7,5 10 120
Összesen 120
2 2
60 366 *0,5 6,24
5022
6 *0,5 6,2322 26
8*5,25 ... 10*7,256,25
120
8(5,25 6,25) ... 10*(7,25 6,25)0,508
1203*(6,25 6,24)
0,0590,508
Me
Mo
x
s
P
−= + =
= + =+
+ += =
− + + −= =
−= =
Enyhe bal oldali aszimmetria.
40
IV. Becslés
1. Egy nagyvállalat személyzeti osztályvezetője azt gyanítja, hogy különbség van a szellemi és a fizikai dolgozók betegség miatti hiányzása között. A gyanú kivizsgálására véletlenszerűen kiválasztott 45 fizikai és 38 szellemi foglalkozású dolgozót és megvizsgálta az elmúlt egy évben mennyit hiányoztak betegség miatt. A kapott eredményeket az alábbi táblázat mutatja. 90%-os megbízhatósági szinten becsüljük meg a betegség miatti hiányzás várható értékei közötti eltérést.
Fizikai Szellemi Mintaszám 45 38 Átlag 10,4 7,8 Szórás 12,8 5,5
Megoldás: két várható érték különbségének becslése ismeretlen elméleti szórás esetén, de a mintaszám mindkét mintában elég nagy, így a standard normális eloszlás táblázatot használjuk.
( ) ( ) α−=
σ+σ+−<µ<σ+σ−− αα 1nn
zxxnn
zxxP2
22
1
21
2/21d2
22
1
21
2/21
α = 10 % � zα/2 = 1,65
( ) ( ) α−=
++−<µ<+−− 1
385,5
458,12
65,18,74,10385,5
458,12
65,18,74,10P22
d
22
-0,876 < µd < 6,076 A hiányzások várható értékei közötti eltérés 90%-os valószínűséggel -0,876 nap és 6,076 nap között van. 2. Egy új fogászati érzéstelenítő kipróbálására egy rendelőben véletlenszerűen
kiválasztottak 10 pácienst. 5 a hagyományos érzéstelenítőt kapta, 5 az újat. Kezelés közben megkérték a pácienseket, hogy egy 0-tól 100-ig terjedő skálán értékeljék, hogy mennyire érzik kellemetlennek a kezelést. (A magasabb érték nagyobb kellemetlenséget mutat.) Az eredményeket az alábbi táblázat tartalmazza. Becsüljük meg a páciensek két csoportja közötti kellemetlenségi szint várható értékei különbségét 99%-os megbízhatósági szinten! (A kellemetlenségi szint normális eloszlással írható le, mindkét csoportban.)
Hagyományos Új Mintaszám 5 5 Átlag 60,33 32,21 Szórás 15,82 12,77
41
Megoldás: két várható érték különbségének becslése ismeretlen elméleti szórás esetén. Egyszerűsége miatt most az F-próbával vizsgáljuk, hogy az ismeretlen alapsokasági szórások tekinthetőek-e egyezőnek. Ehhez minden mintából számított mutató rendelkezésre áll: Hipotézispárunk:
220 : újrégiH σσ =
221 : újrégiH σσ >
A próbastatisztika: 535,177,12
82,152
2
==szF
A kritikus érték: Fkrit (DF1=4; DF2=4) = 16 Tekintve, hogy számított kritikusF F< , nincs okunk a nullhipotézist elvetni, azaz az alapsokasági
szórások egyezőségét fenntarthatjuk. Most következhet a várható értékek különbségének a becslése: sp
2 = [(5-1)15,822+ (5-1)12,772 ]/(5+5-2) = 206,67 α = 1 %, DF = n1+n2-2 = 8 � t0,995 = 3,355
( ) ( ) α−=
++−<µ<
+−− αα 1
n
1
n
1stxx
n
1
n
1stxxP
21
2p2/21d
21
2p2/21
( ) ( )
++−<<
+−−5
1
5
167,206355,321,3233,60
5
1
5
167,206355,321,3233,60 dµ
5,3012,285,3012,28 +<<− dµ
-2,38 < µd < 58,62 A két érzéstelenítő hatása közötti különbség várható értéke 99% valószínűséggel -2,38 és 58,62 között van. 3. Egy tv műsort néző 400 felnőttből és 600 fiatalból álló mintából az derült ki, hogy 100
felnőttnek és 300 fiatalnak tetszett a műsor. Becsüljük meg 95%-os szinten azon felnőtt és fiatal nézők arányának különbségét, akiknek tetszett a műsor!
Megoldás: két sokasági arány különbségének a becslése
( ) ( ) α−=
++−<−<+−− αα 1
n
qp
n
qpzppPP
n
qp
n
qpzppP
2
22
1
112/2121
2
22
1
112/21
α = 5 % � zα/2 = 1,96 1-es indexszel jelölve a fiatalok csoportját:
p1 = 300/600 = 1/2, q1 = 1/2, n1 = 600 2-es indexszel jelölve a felnőttek csoportját:
p2 = 100/400 = 1/4, q2 = 3/4, n2 = 400 Meg kell vizsgálni, hogy a minta kellően nagy-e a nagymintás intervallumbecsléshez:
42
1 11
1
2 22
2
p q 0,5 0,5p 2 0,5 2 0,5 0,41
n 600
p q 0,25 0,75p 2 0,25 2 0,25 0,43
n 400
∗± = ± = ±
∗± = ± = ±
Mivel egyik intervallum sem tartalmazza sem a 0-t, sem az 1-et, így rátérhetünk a konfidencia-intervallum szerkesztésére:
( ) ( )400
75,025,0
600
5,05,096,125,05,0PP
400
75,025,0
600
5,05,096,125,05,0 21
⋅+⋅+−<−<⋅+⋅−−
0,192 < P1-P2 < 0,308
Az adott tv műsor tetszési arányának fiatalok és felnőttek közötti különbsége 19,2% és 30,8% között van 95% valószínűséggel. Azaz ebben az esetben nagy valószínűséggel állíthatjuk, hogy a fiataloknak jobban tetszett a műsor, mint a felnőtteknek. 4. Egy urnában ismeretlen arányban piros és fehér golyók vannak. Az urnából 60 elemű
véletlen visszatevéses mintát véve, a golyók 70%-a bizonyult pirosnak. Határozzuk meg a piros golyók tényleges arányának 95 és 99%-os konfidencia intervallumát! Mekkora mintát kellene vennünk, hogy 95, ill. 99%-osan biztosak lehessünk abban, hogy a tényleges arány nem tér el több mint 5%-al a mintabeli aránytól?
Megoldás: sokasági arány becslése illetve mintaszám meghatározása
ααα −=
−+<<−− 1)1()1(
2/2/ n
ppzpP
n
ppzpP
p = 0,7 α = 5 % � zα/2 = 1,96
60
3,07,096,17,0P
60
3,07,096,17,0
⋅⋅+<<⋅⋅−
0,584 < P < 0,816 95%-os valószínűséggel a piros golyók aránya 58,4 és 81,6% között van. α = 1 % � zα/2 = 2,58
60
3,07,058,27,0P
60
3,07,058,27,0
⋅⋅+<<⋅⋅−
0,547 < P < 0,853 99%-os valószínűséggel a piros golyók aránya 54,7 és 85,3% között van (szélesebb intervallum!) A mintaszám meghatározása: ∆ = 0,05 p = 0,7
43
pqz
n2
2
∆= α
ε = 0,95-os megbízhatóság mellett: zα/2 = 1,96
3237,3223,07,005,096,1
n2
≈=⋅
=
Kb. 323 elemű mintát kellene venni, hogy 95%-os megbízhatósággal a tényleges arány a mintabeli aránytól 5%-kal többel ne térjen el. ε = 0,99 zα/2 = 2,58
5601,5593,07,005,058,2
n2
≈=⋅
=
Kb. 560 elemű mintát kellene venni, hogy 95%-os megbízhatósággal a tényleges arány a mintabeli aránytól 5%-kal többel ne térjen el.
5. Három hallgatói csoportot vizsgálunk. Az első csoportba azok a hallgatók kerültek, akik
a szüleikkel laknak, a másik csoportba pedig azok, akik kollégiumban, míg a harmadik csoportba azok kerültek, akik albérletben laknak. Az alábbi táblázat mutatja az egyes csoportokban megkérdezett hallgatók heti költéseit ezer Ft-ban.
Hallgató lakhelye
Heti költség (eFt)
Szülőknél 13, 18, 20, 20, 28, 30, 31, 40 Kollégiumban 25, 30, 30, 31, 33, 35, 38, 40, 40,
44, 50 Albérletben 40, 48, 50, 50, 52
Szerkesszünk konfidencia-intervallumot 5%-os szignifikancia szinten a kollégiumban és szülőknél lakók várható heti költéseinek különbségére! Szerkesszünk konfidencia-intervallumot 1%-os szignifikancia szinten a szülőknél és albérletben lakók várható heti költéseinek különbségére! Megoldás: Kiindulási helyzet: a sokasági szórások ismeretlenek és n1, n2, n3 < 30: 3-es indexszel jelöljük a szülőknél, 2-essel a kollégiumban, 1-essel az albérletben lakók számított jellemzőit. Egyszerűsége miatt most az F-próbával vizsgáljuk, hogy az ismeretlen alapsokasági szórások tekinthetőek-e egyezőnek (az F-próbát lásd a 6.3.2 fejezetben). Először az alap statisztikai mutatókat kell kiszámolnunk:
83 =n
112 =n
258
40...2018133 =++++=x
44
3611
50...3030252 =++++=x
77,87
)2540(...)2518()2513( 222
3 =−++−+−=∗s
24,710
)3650(...)3630()3625( 222
2 =−++−+−=∗s
Hipotézispárunk:
22
230 : σσ =H
22
231 : σσ >H
A próbastatisztika: 47,124,7
77,82
2
==szF
A kritikus érték: Fkrit (DF3=7; DF2=10) = 3,64 Tekintve, hogy számított kritikusF F< , nincs okunk a nullhipotézist elvetni, azaz az alapsokasági
szórások egyezőségét fenntarthatjuk. A kollégiumban és szülőknél lakók átlagos heti költéseinek különbségére készített konfidencia intervallum:
95,011
)()(11
)(32
22/3232
32
22/32 =
++−<−<
+−−
nnstxx
nnstxxP pp αα µµ
11,2)172118(975,0 ==−+=DFt
( ) ( )5,62
17
24,71077,87
2
11 22
23
222
2332 =⋅+⋅=
−+−+−
=nn
snsnsp
75,18)(25,3
673,311,211)(673,311,211
11
1
8
15,6211,2)2536()(
11
1
8
15,6211,2)2536(
32
32
32
<−<⋅+<−<⋅−
++−<−<
+−−
µµµµ
µµ
Vagyis a két várható érték különbsége 95%-os megbízhatósággal 3,25 eFt és 18,75 eFt között van, ami azt jelenti, hogy 95%-os megbízhatósággal várhatóan 3,25 és 18,75 eFt közötti összeggel költenek többet a kollégiumban lakók hetente. 1%-os konfidencia-intervallum az albérletben és a szülőknél lakók átlagos költéseinek különbségére: Egyszerűsége miatt most az F-próbával vizsgáljuk, hogy az ismeretlen alapsokasági szórások tekinthetőek-e egyezőnek (az F-próbát lásd a 6.3.2 fejezetben). Először az alap statisztikai mutatókat kell kiszámolnunk:
83 =n
45
258
40...2018133 =++++=x
77,87
)2540(...)2518()2513( 222
3 =−++−+−=∗s
51 =n
485
52505048401 =++++=x
69,44
)4852(...)4848()4840( 222
1 =−++−+−=∗s
Hipotézispárunk:
21
230 : σσ =H
21
231 : σσ >H
A próbastatisztika: 49,369,4
77,82
2
==szF
A kritikus érték: Fkrit (DF1=7; DF2=4) = 15 Tekintve, hogy számított kritikusF F< , nincs okunk a nullhipotézist elvetni, azaz az alapsokasági
szórások egyezőségét fenntarthatjuk. Az albérletben és szülőknél lakók átlagos heti költéseinek különbségére készített konfidencia intervallum:
99,011
)()(11
)(31
22/3131
31
22/31 =
++−<−<
+−−
nnstxx
nnstxxP pp αα µµ
( ) ( )
94,5611
69,4477,87
2
11 22
13
211
2332 =⋅+⋅=
−+−+−
=nn
snsnsp
106,3)11258(995,0 ==−+=DFt
(
++−<−<
+−−
31
22/3131
31
22/31
11)()(
11)
nnstxx
nnstxx pp αα µµ
++−<−<
+−−5
1
8
194,56106,3)2548()(
5
1
8
194,56106,3)2548( 31 µµ
36,36)(64,9
3,4106,323)(3,4106,323
31
31
<−<⋅+<−<⋅−
µµµµ
A két várható érték különbsége 99%-os megbízhatósággal 9,64 eFt és 36,36 eFt között van, ami azt jelenti, hogy 99%-os megbízhatósággal várhatóan 9,64 és 36,36 eFt közötti összeggel költenek többet a kollégiumban lakók hetente.
46
6. Egy speciális diéta hatásosságát vizsgálják. Ehhez minden vizsgálati személy testsúlyát megmérték a diéta előtt és után. A hipotetikus kísérlet eredménye 9 kísérleti személyen a következő táblázatban látható.
A vizsgált személy sorszáma
Testsúly a diéta előtt
Testsúly a diéta után
1 95 90 2 75 72 3 110 100 4 81 75 5 92 88 6 83 83 7 94 93 8 88 82 9 105 99
Becsüljük meg 90%-os megbízhatósággal a diéta előtti és utáni testsúly várható értékeinek különbségét! Páros mintáról van szó, hiszen ugyanazon diétában résztvevő személyek testsúlyát mérték meg a diéta megkezdése előtt és után. A diéta megkezdése előtt a 9 résztvevő testsúlyának átlaga:
44,919
105889483928111075951 =++++++++=x
A diéta után a 9 résztvevő testsúlyának átlaga:
88,869
99829383887510072902 =++++++++=x
A becsléshez szükséges konfidencia-intervallum:
( ) ( ) 9,022
2/212/21 =
+−<<−−
∗∗
n
stxx
n
stxxP d
dd
αα µ
Először képeznünk kell a különbségeket páronként, majd azok átlagát és szórását kell kiszámolnunk.
A vizsgált személy sorszáma
Testsúly a diéta előtt
Testsúly a diéta után
di
1 95 90 5 2 75 72 3 3 110 100 10 4 81 75 6 5 92 88 4 6 83 83 0 7 94 93 1 8 88 82 6 9 105 99 6
47
56,49
66104610351
1
=++++++++== ∑=
n
iid
nd
03,98
)56,46(...)56,43()56,45(
1
)( 2222
12
=−++−+−=−
−=∑
=∗
n
dds
n
ii
d
86,1)8()1( 95,02/ ===−= DFtnDFtα
A keresett konfidencia-intervallum tehát:
( ) ( )n
stxx
n
stxx d
dd
22
2/212/21
∗∗
+−<<−− αα µ
( ) ( )9
03,986,188,8644,91
9
03,986,188,8644,91 +−<<−− dµ
87,156,487,156,4 +<<− dµ
43,669,2 << dµ
A diéta megkezdése előtti és utáni várható testsúlyok különbsége 90%-os megbízhatósággal 2,69 kg és 6,43 kg között lesz. 7. Egy autóabroncsokat gyártó cég egy új típusú abroncs kopásállóságának ellenőrzése
érdekében 10 gépkocsira új abroncsokat szerelt, és 50000 km után megmérte a kopást. Az eredmények mm-ben: 1,2; 2; 1,7; 2,6; 1,1; 2,5; 2,3; 1,5; 2,1; 1,6 A régi típusú abroncs kopása – ugyanennyi úton ugyanezen 10 gépkocsi adatai alapján: 1,4; 2,1; 1,7; 2,9; 1,0; 3,4; 2,5; 1,7; 2,4; 2,0. A kopás mértékének eloszlása normálisnak tekinthető. 95%-os megbízhatósággal becsüljük meg a régi és új gumikkal elérhető kopások várható értékeinek különbségét!
Megoldás: Páros mintáról van szó, hiszen ugyanazon gépkocsik esetében mérték a régi és új típusú abroncsok kopását.
Kopás mértéke
Új Régi di
1,2 1,4 0,2
2 2,1 0,1
1,7 1,7 0
2,6 2,9 0,3
1,1 1 -0,1
2,5 3,4 0,9
2,3 2,5 0,2
1,5 1,7 0,2
2,1 2,4 0,3
1,6 2 0,4 A különbségek átlaga, és szórása:
48
mmújx 86,110
6,1...7,122,1)(1 =++++=
mmrégix 11,210
4,2...7,11,24,1)(2 =++++=
25,010
4,0...1,02,0 =+++=d
272,09
)25,04,0(...)25,01,0()25,02,0( 222
=−++−+−=∗ds
262,2)9()110( 975,02/ ===−= DFtDFtα
( ) ( ) 95,02
2/21
2
2/21 =
+−<<−−
n
stxx
n
stxxP d
dd
αα µ
( ) ( )10
272,0262,211,286,1
10
272,0262,211,286,1
22
+−<<−− dµ
d
d
0,25 0,01673 0,25 0,01673
0,266 0,23327
− − < µ < − +− < µ < −
95%-os megbízhatósággal a régi gumi és új gumi kopásának várható értéke közötti különbség 0,233mm és 0,2667 mm között van, vagyis az új gumi várhatóan e két érték közötti mértékkel kevesebbet kopik. 8. Egy közvélemény-kutató 1000 elemű, állítása szerint az ország teljes felnőtt lakosságát
reprezentáló FAE mintákkal dolgozik. Két – időben egymást két hónappal követő – közvélemény-kutatás eredménye szerint az egyik politikust a lakosság 62, illetve 68%-a tartotta rokonszenvesnek. 99%-os megbízhatósággal készítsünk becslést a rokonszenvüket kifejezők arányának különbségére! Ha felére kívánjuk csökkenteni a becslés hibáját, akkor mekkora mintát kellene vennünk?
Megoldás:
99,0)()()(2
22
1
11
22121
2
22
1
11
221 =
++−<−<+−−
n
qp
n
qpzppPP
n
qp
n
qpzppP αα
A mintákat akkor tekinthetjük kellően nagynak, ha az alábbi konfidencia-intervallumok nem tartalmazzák sem a 0-t, sem az 1-et.
1
111 2
n
qpp ±
2
222 2
n
qpp ±
62,01 =p 38,01 =q
68,02 =p 32,02 =q
031,062,01000
38,062,0262,02
1
111 ±=⋅±=±
n
qpp
49
029,068,01000
32,068,0268,02
2
222 ±=⋅±=±
n
qpp
Egyik intervallum sem tartalmazza sem a 0-t, sem az 1-et, így elég nagynak tekinthetőek a minták. α=1%, α/2=0,5%=0,005
58,2995,0 =z
A keresett intervallum:
1000
32,068,0
1000
38,062,058,2)68,062,0()(
1000
32,068,0
1000
38,062,058,2)68,062,0( 21
⋅+⋅+−<−<⋅+⋅−− PP
0213,058,2)06,0()(0213,058,2)06,0( 21 ⋅+−<−<⋅−− PP 055,0)06,0()(055,0)06,0( 21 +−<−<−− PP
005,0)(115,0 21 −<−<− PP Vagyis a két sokasági arány (rokonszenv mértéke) közötti különbség 99%-os megbízhatósággal 5% és 11,5% között van. A ∆ értéke 0,055, ha ezt felére kívánjuk csökkenteni, akkor az: 0,0275.
( ) 99,39884532,085,8801)32,068,038,062,0(0275,0
58,22
2211
2
221 =⋅=⋅+⋅
=+
∆== qpqp
znn α
Így közel 3989 elemű mintát kellene vennünk mindkét időszakban. 9. Az „A” márkájú villanykörtékből 150 elemű mintát véve az átlagos élettartam 1400
órának, a „B” márkájúból 200 elemű mintát véve az élettartama 1200 órának adódott. Tudjuk, hogy az „A” márkájú égő élettartamának szórása 120 óra, a „B” márkájúnak pedig 80 óra. Határozza meg az „A” és a „B” márkájú villanykörték átlagos élettartama közötti különbség 95%-os és 99%-os konfidencia-intervallumát!
Megoldás: Feladatunk a két sokaság várható értéke közötti különbség becslése. Mivel feltehető az élettartamok normális eloszlása, és az alapsokasági szórás is ismeretes, továbbá nagy mintával van dolgunk a jegyzet 5.3.6.a. pontjában megismert összefüggések használhatóak. Képletszerűen:
2 2 2 21 2 1 2
1 2 /2 D 1 2 /21 2 1 2
P (X X ) z (X X ) z 1n n n nα α
σ σ σ σ− − + < µ < − + + = − α
Ahol - 1X az első csoport, az „A” márkájú égők élettartamának mintabeli átlaga,
- 2X a második csoport, a „B” márkájú égők élettartamának mintabeli átlaga,
- /2zα az adott konfidenciaszinthez meghatározandó kritikus érték,
- 21σ az első csoport („A”) alapsokasági szórásnégyzete,
- 22σ a második csoport alapsokasági szórásnégyzete,
- 1n az első csoport mintaelemszáma,
- 2n a második csoport mintaelemszáma,
50
- Dµ a becsülni kívánt paraméter, a két csoport várható élettartama közötti különbség.
Következő feladatunk a kritikus z érték meghatározása. Mivel kétoldali becslést végzünk, a
/2zα értékeket keressük ki, ezek rendre 1,96 és 2,58 értékekre adódnak 95, illetve 99 %
konfidenciaszint esetében. Behelyettesítve a képletekbe rendre 95, majd 99%-os konfidenciaszinten azt kapjuk, hogy:
2 2 2 2(95%)D
2 2 2 2(99%)D
120 80 120 80P (1400 1200) 1,96 (1400 1200) 1,96 0,95
150 200 150 200
120 80 120 80P (1400 1200) 2,58 (1400 1200) 2,58 0,99
150 200 150 200
− − + < µ < − + + =
− − + < µ < − + + =
(95%)D
(99%)D
P 200 22,175 200 22,175 0,95
P 200 29,189 200 29,189 0,99
− < µ < + =
− < µ < + =
Innen a konfidencia-intervallum:
(95%)D
(99%)D
177,825 222,175
170,811 229,189
< µ <
< µ <
95%-os megbízhatósággal az „A” márkájú égők várhatóan 177,825 - 222,175 órával többet működnek, mint a „B” márkájú égők.
99%-os megbízhatósággal az „A” márkájú égők várhatóan 170,811-229,189 órával többet működnek, mint a „B” márkájú égők.
A két konfidencia-intervallum összehasonlításából az is látható, hogy a magasabb megbízhatóság szélesebb intervallumot eredményez. 10. Két autósiskolában vizsgálták, hogy a tanulók hány gyakorlati óra után tesznek sikeres
vizsgát. Az adatokat a következő tábla mutatja:
Aladár iskolája Balázs iskolája Mintaszám 44 62
Átlagos óraszám 28 24 Korrigált
tapasztalati szórás 6,2 5,4
Feltételezve a mintavételi eloszlás normalitását, adjon 95%-os becslést az autósiskolákban a sikeres vizsga letételéhez szükséges gyakorlati órák számának különbségére! Megoldás: A feladat ismét két sokaság várható értékének különbségét meghatározni. Most azonban nem ismertek az alapsokasági szórások, csak a minta korrigált tapasztalati szórása. Ezért most az 5.3.6.b fejezetben vázolt képleteket használjuk majd. Előtte azonban a szórásnégyzetek
51
egyenlőségét vizsgáljuk meg, hiszen a becslés alkalmazásának feltétele az alapsokasági szórások egyezősége. Egyszerűsége miatt most az F-próbával vizsgáljuk, hogy az ismeretlen alapsokasági szórások tekinthetőek-e egyezőnek (az F-próbát lásd a 6.3.2 fejezetben).
Hipotézispárunk: 2 2
0 A B
2 21 A B
H :
H :
σ = σ
σ > σ;
A kritikus érték: kritikusF 1,59≈ [ számláló nevezőDF 43;DF 61; 0,05; táblázatból]= = α =
Majd kalkuláljuk a próbastatisztikát: 2 2
1számított számított2 2
2
s 6,2F ,behelyettesítve F 1,318.
s 5,4
∗
∗= = = =
Tekintve, hogy számított kritikusF F< , nincs okunk a nullhipotézist elvetni, azaz az alapsokasági
szórások egyezőségét fenntarthatjuk. Ezután rátérhetünk a várható értékek különbségének becslésére: Képletszerűen:
( ) ( ) αµ αα −=
++−<<
+−− 1
1111
21
22/21
21
22/21 nn
stxxnn
stxxP pdp
Itt: - 1X az első csoport, Aladár iskolájában tanulók óraszámának átlaga,
- 2X a második csoport, Balázs iskolájában tanulók óraszámának átlaga,
- /2tα az adott konfidenciaszinthez meghatározandó Student-kritikus érték,
- 2Ps a becsülendő közös szórásnégyzet,
- 1n az első csoport mintaelemszáma,
- 2n a második csoport mintaelemszáma,
- Dµ a becsülni kívánt paraméter, a sikeres vizsga letételéhez szükséges órák számának
különbsége a két iskolában.
A képlet alkalmazásához még becsülni kell a közös szórásnégyzetet, 2Ps -t. 2 2 2 2
2 21 1 2 2P P
1 2
(n 1)s (n 1)s (44 1)6,2 (62 1)5,4s ,behelyettesítve : s 32,997
n n 2 44 62 2
∗ ∗− + − − + −= = =+ − + −
Szükséges lesz még továbbá a Student-féle eloszlás táblájából /2tα . A szabadságfok 104
(n1+n2-2), táblázatból az érték a megfelelő szignifikancia szinthez: /2tα =1,98.
Majd a kapott közös szórásnégyzetet behelyettesítjük az előző, Dµ -t kalkuláló képletbe:
( ) ( )
++−<<
+−−62
1
44
1997,3298,12428
62
1
44
1997,3298,12428 dµ
[ ]DP 4 2,242 4 2,242 0,95− < µ < + =
Tehát a keresett intervallum: D1,758 6,242< µ < .
Vagyis 95%-os megbízhatósággal az Aladár iskolájában tanulók óraszáma várhatóan 1,758-6,242 órával több, mint a Balázs iskolájában tanulók óraszáma.
52
11. 7 alkalmazás indításának időszükségletét hasonlították össze egy felső és egy
középkategóriás okostelefonon. Az eredmények az alábbi táblázatban láthatóak:
Az alkalmazás indításához szükséges idő [s] Alkalmazás Középkategóriás telefon Felsőkategóriás telefon 1. 5,6 4,5 2. 12,3 10,4 3. 20,6 23,4 4. 11,4 10 5. 13,4 12 6. 24,3 27,5 7. 4,2 3 Átlag 13,114 12,971
Adjon 95%-os konfidencia-intervallumot a két okostelefonon az alkalmazások megnyitásához szükséges idők közötti különbségre! (Tegye fel, hogy az eloszlások normálisak!) Mivel ugyanazon alkalmazások indításához szükséges időt hasonlítottuk össze, a két telefonon a mintaelemek egyértelműen megfeleltethetőek egymásnak, azaz páros mintával dolgozunk (5.3.7. fejezet). A becsléshez először meg kell határozni a páronkénti különbséget, célszerűen a középkategóriás telefonon mért értékekből vonjuk ki a felsőkategóriás telefonion mért értékeket.
Alkalmazás Különbség 1. 1,1 2. 1,9 3. -2,8 4. 1,4 5. 1,4 6. -3,2 7. 1,2
Ezután kalkuláljuk a páronkénti különbségek átlagát, majd a szórását.
n
ii 1
1 1d d ,azaz : d (1,1 1,9 ... 1,2) 0,143
n 7=
= = + + + =∑
ɶn
22 2i
2 i 1D
(d d)(1,1 0,143) ... (1,2 0,143)
s 4,686n 1 7 1
∗ =
−− + + −= = =
− −
∑
A konfidencia-intervallum képlete:
( ) ( ) αµ αα −=
+−<<−− 1
2
2/21
2
2/21 n
stxx
n
stxxP d
dd
Itt:
53
- 1X az első csoport, a középkategóriás telefonon az alkalmazások indításához
szükséges idők átlaga
- 2X a második csoport, a felsőkategóriás telefonon az alkalmazások indításához
szükséges idők átlaga
- /2tα az adott konfidenciaszinthez meghatározandó Student-kritikus érték,
- 2Ds∗ a páronkénti különbségek korrigált tapasztalati szórásnégyzete
- n mintaelemszám, a párok száma
- Dµ a becsülni kívánt paraméter, az alkalmazások indításához szükséges idő
különbsége a két vizsgált telefonon.
Meg kell határozni még a Student táblázatból a t értéket. A szabadságfok DF=n-1, ahol n a párok száma, DF=6 tehát, esetünkben. /2tα =2,447.
Majd behelyettesítünk a képletbe:
( ) ( ) 95,07
686,4447,2971,12114,13
7
686,4447,2971,12114,13 =
+−<<−− dP µ
638,1143,0638,1143,0 +<<− dµ
A keresett intervallum tehát: 781,1495,1 <<− dµ
12. Egy nagyváros 11 elővárosából való bejutás idejét vizsgáltuk meg autóval illetve
vonattal. Az eredmények a következő táblázatban szerepelnek. Bejutási idő
Előváros Autóval Vonattal 1. 51 44 2. 36 31 3. 21 22 4. 46 27 5. 16 14 6. 29 17 7. 31 28 8. 44 46 9. 11 12 10. 18 18 11. 24 23
Feltételezve az eljutási idők eloszlásának normalitását, adjon 90%-os megbízhatóságú konfidencia-intervallumot arra vonatkozólag, hogy várhatóan hány perccel számíthatunk hosszabb eljutási időre, ha autóval utazunk vonat helyett? Megoldás: Páros mintáról van szó, hiszen ugyanazon útvonalon vizsgáltuk az eljutás idejét autóval és vonattal, a mért adatok között tehát egyértelmű, kölcsönös megfeleltetés hozható létre. A konfidencia-intervallum megszerkesztéséhez mindenek előtt szükségünk van a páronként
54
különbségek meghatározására, méghozzá az autóval történő eljutás idejéből vonjuk ki a vonattal történő eljutási idejét: Képletszerűen: i i,autóval i,vonattald x y= − ; például a negyedik elővárosban: d4=46-27=19.
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. di 7 5 -1 19 2 12 3 -2 -1 0 1 Kiszámítjuk a páronkénti különbségek átlagát, majd korrigált tapasztalati szórásnégyzetét.
n
ii 1
1 1d d ,azaz : d (7 5 ... 1) 4,091
n 11=
= = + + + =∑
ɶn
22 2i
2 2i 1D
(d d)(7 4,091) ... (1 4,091)
s 6,44 41,4736n 1 11 1
∗ =
−− + + −= = = =
− −
∑
A konfidencia-intervallum képlete:
( ) ( ) αµ αα −=
+−<<−− 1
2
2/21
2
2/21 n
stxx
n
stxxP d
dd ,
/2tα =1,812 (DF=n-1, DF=10).
Behelyettesítve:
( ) ( ) 9,011
44,6812,1636,25727,29
11
44,6812,1636,25727,29
22
=
+−<<−− dP µ
Innen a keresett valószínűség: 832,6091,4832,6091,4 +<<− dµ
Az intervallum: 923,10741,2 <<− dµ
90%-os konfidenciaszinten tehát azt állíthatjuk, hogy -2,741 és 10,923 perc közötti idővel kell hosszabb utazásra számítani annak, aki autóval indul útnak. 13. Egy műanyagipari vállalat egy új fröccsöntő gépsort kíván beszerezni. A vásárlás előtt
összehasonlították a régi, lecserélni kívánt gép, és az új, beszerzendő berendezés által gyártott termékek selejtarányát. A régi berendezés által gyártott termékekből 150 elemű mintát véve, abban 6 hibás darabot találtak. Az új berendezés által gyártott termékekből akkora mintát vettek, hogy abban is pontosan 6 darab selejtes terméket találjanak. A hatodik selejtes termék a 240-ediknek kivett mintaelem volt. 5% szignifikancia szinten adjon becslést a régi és az új berendezés által gyártott termékek selejtarányának különbségére! Megvegye-e a minta alapján a vállalat az új berendezést?
Megoldás: A selejtarány összehasonlítását a két sokasági arány közötti különbség vizsgálatával végezzük, mivel számszerű becslést kívánunk adni a selejtarányok különbségére. (Megjegyzés: Ha a kérdés csak annyi volna, hogy alacsonyabb-e az új berendezés selejtaránya, akkor a vizsgálatot kétmintás aránypróbával végezhetnénk). Legyen az 1-es csoport a régi, a 2-es csoport az új berendezés által gyártott termékek csoportja. Adataink:
55
n1=150, ez a régi berendezés által gyártott termékekből vett minta elemszáma n2=240, ez az új berendezés által gyártott termékekből vett minta elemszáma k1=6, a régi berendezés által gyártott termékből vett mintában a selejtes darabok száma k2=6, ami az új berendezés által gyártott termékből vett mintában a selejtes darabok száma Szükségünk van még a sokasági arány becslésére, ezt a klasszikus valószínűség-számítás tétele alapján a kedvező eset osztva az összes esettel. p1=6/150=0,04: A régi berendezés selejtaránya, q1=1-p1 p2=6/240=0,025: Az új berendezés selejtaránya, q2=1-p2 Első feladatunk, hogy megvizsgáljuk, kellően nagyok-e a minták. Ehhez idézzük fel a jegyzet 5.3.8. pontjában bevezetett képletünket:
032,004,0150
96,004,0204,02
1
111 ±=⋅±=±
n
qpp
02,0025,0240
975,0025,02025,02
2
222 ±=⋅±=±
n
qpp
Mivel egyik intervallum sem tartalmazza sem a 0-t, sem az 1-et, alkalmazható a nagymintás intervallum-becslés. Képletünk a következő lesz:
1 1 2 2 1 1 2 21 2 /2 1 2 1 2 /2
1 2 1 2
p q p q p q p qP (p p ) z P P (p p ) z 1
n n n nα α
− − + < − < − + + = − α
Behelyettesítünk, /2zα =1,96 (táblázatból):
95,0240
975,0025,0
150
96,004,096,1)025,004,0()(
240
975,0025,0
150
96,004,096,1)025,004,0( 21 =
⋅+⋅+−<−<⋅+⋅−− PPP
A keresett valószínűség:
[ ]1 2P 0,015 0,037 P P 0,015 0,037 0,95− < − < − =
A konfidencia intervallum:
[ ]1 20,022 P P 0,052− < − <
A minta alapján nem hozható egyértelmű döntés a berendezés megvásárlásáról, lehetséges, hogy az új berendezés selejtaránya magasabb, mint a régié. Célszerű nagyobb mintán megismételni a vizsgálatot. 14. A mindennapos kerékpárhasználatot mérték fel a falvakban és a városokban. A
falvakban 650 személyt kérdeztek meg, akik közül 520 használta minden nap a kerékpárt. A 2400 városban megkérdezett válaszadó közül 960-an kerékpároztak minden nap. 99%-os konfidencia intervallumot szerkesztve adjon becslést a minden nap kerékpározók aránya közötti különbségre a falvakban és a városokban!
Megoldás: Legyen az 1-es csoport a faluban, 2-es a városban megkérdezettek csoportja. Adataink így: n1=650, ez a falvakban megkérdezettek száma
56
n2=2400, ez a városban megkérdezettek száma k1=520, azok száma, akik a falvakban minden nap használják a kerékpárt k2=960, azok száma, akik a városokban minden nap használják a kerékpárt Szükségünk van még a sokasági arány becslésére, ez a klasszikus valószínűség-számítás tétele alapján a kedvező eset osztva az összes esettel. p1=520/650=0,8: A falvakban minden nap kerékpározók száma, q1=1-p1 p2=960/2400=0,4: Minden nap kerékpározók száma a városokban., q2=1-p2 Először ismét ellenőrizzük, kellően nagy-e a minta a nagymintás konfidencia-intervallum szerkesztéséhez!
031,08,0650
2,08,028,02
1
111 ±=⋅±=±
n
qpp
02,04,02400
6,04,024,02
2
222 ±=⋅±=±
n
qpp
Egyik intervallum sem tartalmazza sem 0-t, sem az 1-et, így alkalmazható a nagymintás intervallum-szerkesztés. A konfidencia-intervallum képlete:
1 1 2 2 1 1 2 21 2 /2 1 2 1 2 /2
1 2 1 2
p q p q p q p qP (p p ) z P P (p p ) z 1
n n n nα α
− − + < − < − + + = − α
Behelyettesítve, majd meghatározva (táblázatból) /2zα =2,58:
99,02400
6,04,0
650
2,08,058,2)4,08,0()(
2400
6,04,0
650
2,08,058,2)4,08,0( 21 =
⋅+⋅+−<−<⋅+⋅−− PPP
A keresett valószínűség:
[ ]1 2P 0,4 0,048 P P 0,4 0,048 0,99− < − < − =
A konfidencia intervallum:
1 20,352 P P 0,448< − <
15. Egy 500 gramm töltősúlyú cukorkából 100 elemű mintát vettek. A minta adatai:
Töltősúly Gyakoriság x 480≤ 5 480 x 490< ≤ 20 490 x 500< ≤ 30 500 x 510< ≤ 24 510 x 520< ≤ 16 520 x< 5
a) Feltételezve a töltősúly normális eloszlását, legalább hány elemű mintát kell venni ahhoz, hogy a 490 grammos, vagy az annál kisebb töltősúlyú cukorkák arányát 1%-nál kisebb eltéréssel tudjuk becsülni, 99% megbízhatóság mellett? b) Hogyan változik a mintaszám, ha nem végzünk előzetes mintavételt?
57
c) Hogyan változik a mintaszám, ha korábbi tapasztalatokból tudjuk, hogy a 490 gramm töltősúlyt el nem érő cukorkák aránya 10%?
Megoldás:
a) Feladatunk a mintaszám meghatározása a sokasági arány becsléséhez.
Képletünk: qpz
n ⋅⋅
∆=
2
2α
ahol /2zα =2,58 táblázatból határozandó meg, ∆ a megengedett legnagyobb eltérés (most 1%),
p a mintából becsült sokasági arány, q pedig q=1-p. Becsüljük a mintából p-t, a kedvező esetet osztva az összes esettel: p=5+20/100=0,25. Ennek megfelelően q=1-p=1-0,25, azaz q=0,75.
Behelyettesítünk: 75,1248075,025,001,0
58,222
2 =⋅⋅
=⋅⋅
∆= qp
zn α db.
Azaz 12481 darabos mintát kell vennünk, ha 99%-os megbízhatósággal szeretnénk 1% eltéréssel megbecsülni a 490 grammnál kisebb töltősúlyú cukorkákat. b) Ha nem végzünk előzetes mintavételt, akkor a p=q=0,5 előzetes becslést alkalmazzuk a sokasági arány becslésére, hiszen ekkor p ismeretlen. A pq szorzat ekkor maximális, így a veendő mintaszám is felveszi maximális értékét, a valóságban ekkora minta tehát biztosan elegendő. Behelyettesítve:
166415,05,001,0
58,222
2 =⋅⋅
=⋅⋅
∆= qp
zn α db
Ha tehát nem végzünk előzetes mintavételt, körülbelül harmadával nagyobb mintát kell venni. c) Most p=0,1, q=0,9, így a keresett mintaszám:
59919,01,001,0
58,222
2 =⋅⋅
=⋅⋅
∆= qp
zn α db
Ha tehát tudjuk, hogy 10% a 490 gramm töltősúly alatti cukorkák száma, akkor 5991 darabos mintát (az eredetinek kevesebb, mint felét) kell venni.
16. Az A márkájú villanyborotva átlagos élettartama 1400 óra, az élettartam szórása pedig
120 óra. A B márkájú villanyborotva élettartama átlagosan 1200 óra, az élettartam szórása 80 óra. Mekkora mintát kell venni ahhoz, hogy 99%-os megbízhatósággal 20 óra eltéréssel tudjuk kimutatni a két villanyborotva élettartamának különbségét? Hogyan változik a minta elemszáma, ha a fenti adatokat egy 150, illetve 200 elemű mintából becsültük?
Megoldás: Feladatunk a két várható érték különbségére szolgáló becsléshez a mintanagyság meghatározása, úgy, hogy első esetben ismert az alapsokasági szórás. Képletszerűen:
58
( )22
2
221 BA
znn σσα +
∆==
/2zα táblázatból 2,58; ∆ a kimutatni kívánt eltérés nagysága, most 20 óra, Aσ és Bσ a
megfelelő alapsokasági szórások, 120 és 80 óra. Behelyettesítve:
( ) 1328,346)80120(20
58,2 222
22
2
221 =+
=+
∆== BA
znn σσα db, azaz 347 elemű mintát kell
venni. Ha a szórásokat a mintából becsültük, a képlet a következőképp módosul:
( )22
2
221
∗∗ +
∆== BA ss
tnn α
A megfelelő t értéket a 120 szabadságfokú Student-eloszlás táblázatból kikeresve, /2tα =2,617,
majd behelyettesítve adódik a következő összefüggés:
( ) 132,356)80120(20
617,2 2222
221
22
=+
=+
∆== ∗∗
BA sst
nn α db, azaz 357 darabos mintát
kell venni, a minta elemszáma nem változott lényegesen. Ennek magyarázata, hogy nagy mintaszámra a t-eloszlás jól közelíthető normális eloszlással, figyeljük meg, hogy a z és t értékek majdnem egyenlők. 17. A korábban tárgyalt fröccsöntő berendezés vásárlásával kapcsolatos példánk esetében
hány elemű mintát kell venni ahhoz, hogy a selejtarányban 2%-os eltérést az új berendezés javára kimutathassunk? (Feltételezzük, hogy a selejtarány 2%-os csökkentése a menedzsment kritériuma a beruházás megvalósításához). Ismeretes, hogy a régi gépsoron 150 gyártott termék közül 6 selejtest, míg az új gépsoron 240 gyártott termék közül 6 selejtest találtak. Legyen a szignifikancia szint 5%!
Megoldás: Feladatunk a két sokasági arány közötti különbség becsléséhez a mintanagyság meghatározása. Legyen az 1-es csoport a régi, a 2-es az új berendezésen gyártott termékek mintája. n1=150, ez a régi berendezés által gyártott termékekből vett minta elemszáma n2=240, ez az új berendezés által gyártott termékekből vett minta elemszáma k1=6, a régi berendezés által gyártott termékből vett mintában a selejtes darabok száma k2=6, ami az új berendezés által gyártott termékből vett mintában a selejtes darabok száma Szükségünk van még a sokasági arány becslésére, ez a klasszikus valószínűség-számítás tétele alapján a kedvező eset osztva az összes esettel. p1=6/150=0,04: A régi berendezés selejtaránya, q1=1-p1 p2=6/240=0,025: Az új berendezés selejtaránya, q2=1-p2 A képletünk:
( )2211
2
221 qpqp
znn +
∆== α
59
/2zα táblázatból 1,96; ∆ a kimutatni kívánt eltérés nagysága, most 2%, azaz 0,02.
Behelyettesítünk:
( ) 8911,602)975,0025,096,004,0(02,0
96,12
2211
2
221 =⋅+⋅
=+
∆== qpqp
znn α db, azaz 603
elemű mintát kell venni. (Emlékeztető: a korábbi feladatban nem tudtunk dönteni az adott minta-elemszám mellett arról, hogy valóban érdemes-e beruházni az új gép megvásárlásába. Látható, hogy a mintaszám növelésével hozható határozott döntés). 18. Egy útvonalon két légitársaság gépei repülnek. A Déli Légitársaság gépei állításuk
szerint 22%-ban késnek, míg az Északi Légitársaság gépeinek 27%-a ér későn célba. Egy, a két város között gyakran utazó üzletembernek hány járatot kell megfigyelnie, hogy a két társaság késve közlekedő gépeinek arányát 3%-os eltéréssel kimutathassa? ( 1%α = )
Megoldás: Adataink: p1=0,22: A Déli Légitársaság késett gépeinek aránya, q1=1-p1 p2=0,27: Az Északi Légitársaság késő gépeinek aránya., q2=1-p2
/2zα táblázatból 2,58; ∆ a kimutatni kívánt eltérés nagysága, most 3%, azaz 0,03.
Képletünk, majd behelyettesítés után:
( ) 9052,2726)73,027,078,022,0(03,0
58,22
2211
2
221 =⋅+⋅
=+
∆== qpqp
znn α db, azaz 2727
járatot kellene az üzletembernek megfigyelnie. 19. Egy élelmiszergyárban – többek között – 1kg-os darabos gyümölcskonzerveket
csomagolnak automata töltőgéppel. Korábbi felmérések szerint a töltősúly normális eloszlása feltételezhető. A napi termelés ellenőrzésére az első műszakban vettek egy 100 elemű FAE mintát, amelynek töltősúly szerinti megoszlása:
Doboz töltősúlya (g) Darab 980-990 6 990-1000 23 1000-1010 47 1010-1020 22 1020-1030 2 Összesen 100
Egy másik műszakban vettek egy 200 elemű mintát, ahol az átlagos töltősúly 1002,5 grammra adódott, a minta alapján számolt szórás 7,6 grammra adódott. 95%-os megbízhatósággal készítsünk becslést a két műszak várható töltősúlyainak különbségére! Mekkora mintára van szükség, ha az előző becslés pontosságát 99%-os megbízhatósági szinten kívánjuk garantálni? A második műszakban az 1000 gramm feletti töltések aránya 52%-os. Készítsünk 95%-os megbízhatósággal becslést a két műszak 1000 gramm feletti töltései arányának különbségére!
60
Mekkora mintára van szükségünk, ha az előző becslésnél a hibát harmadára kívánjuk csökkenteni? Megoldás: 95%-os megbízhatósággal készítsünk becslést a két műszak várható töltősúlyainak különbségére! A sokasági szórások nem ismertek, de mindkét műszakban a minta elemszáma > 30, így használhatjuk az alábbi képletet:
95,0)()()(2
22
1
21
2/21212
22
1
21
2/21 =
++−<−<+−−
nnzxx
nnzxxP
σσµµσσαα
Ehhez szükséges számítások:
Doboz töltősúlya (g) Osztályközép Darab 980-990 985 6 990-1000 995 23 1000-1010 1005 47 1010-1020 1015 22 1020-1030 1025 2 Összesen 100
gx 1,1004100
21025...2399569851 =⋅++⋅+⋅=
19,76100
2)1,10041025(...23)1,1004995(6)1,1004985( 222
1
2
≈⋅−++⋅−+⋅−=s
gx 5,10022 = 2
2 6,72
=s (Mivel a mintaszám kellően nagy (200), használható a mintabeli szórás az ismeretlen alapsokasági szórás helyett.)
2
22
1
21
2/21212
22
1
21
2/21 )()()(nn
zxxnn
zxxσσµµσσ
αα ++−<−<+−−
200
6,7
100
19,7696,1)5,10021,1004()(
200
6,7
100
19,7696,1)5,10021,1004(
2
21
2
++−<−<+−− µµ
025,196,16,1)(025,196,16,1 21 ⋅+<−<⋅− µµ
609,3)(409,0 21 <−<− µµ Vagyis a két műszakban töltött konzervek várható töltősúlya között különbség -0,409gramm és 3,609 gramm között van 95%-os megbízhatósággal a minták alapján. Mekkora mintára van szükség, ha az előző becslés pontosságát 99%-os megbízhatósági szinten kívánjuk garantálni?
58,2995,02 == zzα
61
( ) 91,220)6,719,76(025,196,1
58,2 2
2
22
21
2
221 =+
⋅=+
∆== σσαz
nn
221 elemű mintára lenne szükség mindkét műszakból. A második műszakban az 1000 gramm feletti töltések aránya 52%-os. Készítsünk 95%-os megbízhatósággal becslést a két műszak 1000 gramm feletti töltései arányának különbségére!
95,0)()()(2
22
1
11
22121
2
22
1
11
221 =
++−<−<+−−
n
qp
n
qpzppPP
n
qp
n
qpzppP αα
A mintákat akkor tekinthetjük kellően nagynak, ha az alábbi konfidencia-intervallumok nem tartalmazzák sem a 0-t, sem az 1-et.
1
111 2
n
qpp ±
2
222 2
n
qpp ±
71,01 =p 29,01 =q
52,02 =p 48,02 =q
091,071,0100
29,071,0271,02
1
111 ±=⋅±=±
n
qpp
071,052,0200
48,052,0252,02
2
222 ±=⋅±=±
n
qpp
Egyik intervallum sem tartalmazza sem a 0-t, sem az 1-et, így elég nagynak tekinthetőek a minták. α=5%, α/2=2,5%=0,025
96,1975,0 =z
A keresett intervallum:
200
48,052,0
100
29,071,096,1)52,071,0()(
200
48,052,0
100
29,071,096,1)52,071,0( 21
⋅+⋅+−<−<⋅+⋅−− PP
0575,096,119,0)(0575,096,119,0 21 ⋅+<−<⋅− PP
3027,0)(0773,0 21 <−< PP A minták alapján a két műszakban az 1000 gramm felett töltött konzervek arányának különbsége 7,73% és 30,27% között van. Mekkora mintára van szükségünk, ha az előző becslésnél a hibát harmadára kívánjuk csökkenteni?
1127,00575,096,1 =⋅=∆ , ennek harmada ∆új=0,037567
( ) 12404555,02722)48,052,029,071,0(037567,0
96,12
2211
2
221 ≈⋅=⋅+⋅
=+
∆== qpqp
znn α
Közel 1240 elemű mintára lenne szükség mindkét műszakból.
62
V. Hipotézisvizsgálatok
Nemparaméteres próbák
1. Egy gyógyszergyárban 25 elemű mintát véve, megvizsgálták a gyógyszerek hatóanyag-tartalmát [mg-ban]. A minta hatóanyag-tartalma (egész mg-ra kerekítve) a következő: 96, 101, 104, 102, 100, 101, 97, 99, 104, 101, 98, 97, 103, 102, 104, 100, 100, 99, 103, 101, 99, 100, 101, 97, 98. Leírható-e a hatóanyag-tartalom normális eloszlással? Teljesül-e az a feltétel, hogy a gyógyszerek átlagos hatóanyag-tartalma 100 mg?
Megoldás: Kolmogorov-próbával végzünk illeszkedés vizsgálatot, hiszen a 25 mintaelem még kis mintának számít, így a 2χ próba várhatóan kevéssé adna megbízható eredményt. Mivel e próba alkalmazásához az adatokat minél több osztályba célszerű sorolni, tekintsünk minden egyes mért értéket külön osztálynak. A gyakorisági táblázat:
Hatóanyag-tartalom Gyakoriság Fi (elméleti) FN (tapasztalati) Di (eltérés) 96 1 0,033625 0,04 0,006375 97 3 0,080757 0,16 0,079243 98 2 0,163543 0,24 0,076457 99 3 0,29116 0,36 0,06884 100 4 0,452242 0,52 0,067758 101 5 0,62172 0,72 0,09828 102 2 0,770350 0,8 0,02965 103 2 0,876976 0,88 0,003024 104 3 0,944083 1 0,055917
A hipotézisek felállításához szükség lenne még a várható érték és a szórás becslésére. A mintából számítva a minta-átlagot és a korrigált tapasztalati szórást becsülhetjük ezeket.
28,10025
1043...982973961
1
1 =⋅++⋅+⋅+⋅==∑
∑
=
=n
ii
n
iii
f
xfx
( )337,2
24
)28,100104(3...)28,10097(3)28,10096(1
1
222
1
1
2
=−⋅++−⋅+−⋅=−
−==
∑
∑
=
=∗r
ii
r
iii
f
xxfs
Ezek alapján a hipotézispárunk: H0: A gyógyszerek hatóanyag-tartalmának eloszlása N(100,28; 2,37) eloszlást követ H1: A gyógyszerek hatóanyag-tartalmának eloszlása nem N(100,28; 2,37) eloszlást követ Legyen 5%!α = Táblázatból meghatározva a kritikus értéket: kritikusD 0,264.= (n=25).
63
Számoljuk ki az elméleti eloszlásfüggvény értékeit, azaz, hogy az egyes osztályok felső határán milyen értéket venne fel az eloszlásfüggvény, ha valóban N(100,28; 2,337) eloszlásról van szó. Képletünk:
fi
i
xF(x ) ( )
− µ= Φσ
; itt iF(x )az elméleti eloszlásfüggvény az osztály felső határán, ix pedig
az osztály felső határa (táblázat harmadik oszlopa). 96 100,28
F(96) ( ) ( 1,831) 1 (1,831) 1 0,966375 0,0336252,337
−= Φ = Φ − = − Φ = − =
97 100,28F(97) ( ) ( 1,404) 1 (1,404) 1 0,919243 0,080757
2,337
−= Φ = Φ − = − Φ = − =
98 100,28F(98) ( ) ( 0,976) 1 (0,976) 1 0,836457 0,163543
2,337
−= Φ = Φ − = − Φ = − =
99 100,28F(99) ( ) ( 0,548) 1 (0,548) 1 0,70884 0,29116
2,337
−= Φ = Φ − = − Φ = − =
100 100,28F(100) ( ) ( 0,12) 1 (0,12) 1 0,547758 0,452242
2,337
−= Φ = Φ − = − Φ = − =
101 100,28F(101) ( ) (0,308) 0,62172
2,337
−= Φ = Φ =
102 100,28F(102) ( ) (0,736) 0,77035
2,337
−= Φ = Φ =
103 100,28F(103) ( ) (1,164) 0,876976
2,337
−= Φ = Φ =
104 100,28F(104) ( ) (1,592) 0,944083
2,337
−= Φ = Φ =
Ezután számoljuk a tapasztalati eloszlásfüggvény értékeit, ami nem más, mint a kumulált relatív gyakoriság (táblázat negyedik oszlopa).
ii
N ii 1
nF (x )
n=
=∑ , így az első osztályra: N 1
1F (x ) 0,04
25= = , a negyedikre:
N 4
1 3 2 3F (x ) 0,36
25
+ + += = , értelemszerűen a többi osztályra is hasonlóképp számolható.
Majd minden egyes osztályra képezzük a Di eltéréseket, a táblázat ötödik oszlopa:
i i N,iD F F= − , azaz az elméleti és a tapasztalati eloszlásfüggvények különbségének abszolúlt
értéke. Például a második osztályra: 2D 0,080757 0,16 0.079243= − =
Keressük meg a maximális Di értéket:
max iD max(d ) max(0,006375,...0,055917) 0,09828= = =
Majd ezt a maximális Di értéket összevetve a kritikus értékkel, döntünk a nullhipotézisről. Mivel: max krit ,D D< , hiszen 0,09828<0,264, az adott, 5 % szignifikancia szinten fenntartjuk a
nullhipotézist, a gyógyszerek hatóanyag-tartalma leírható N(100,28, 2,337) eloszlással. Ellenőrizzük azt az állítást, hogy a gyógyszerek hatóanyag-tartalma 100 mg! Ehhez egy egymintás t-próbát végzünk.
64
o
1
H : 100mg
H : 100mg
µ =µ ≠
(Mivel a gyakoriságokban nem látható jelentős eltolódás egyik irányban sem, érdemes kétoldali ellenhipotézist állítani) A kritikus érték DF=25-1 szabadságfok mellett: tkrit=2,064 Próbastatisztikánk:
sz *
xt
s n
− µ= behelyettesítve sz
100,28 100t 0,599
2,337 25
−= =
Mivel tsz<<tkrit a nullhipotézist 5% szigfifiknacia szinten elfogadjuk, a gyógyszerek hatóanyag-tartalmának várható értéke 100 mg. 2. Egy vasúti átjáróban 48 órán át vizsgálták az egy óra alatt áthaladó járművek számát,
egységjárműben kifejezve (egy egységjármű=egy személyautó. Az ennél nagyobb járművek nagyobb, a kisebbek kisebb, törtszámú egységjárműnek számítanak, szükségképp a megfigyelés eredménye lehet nem egész szám). Leírható-e az egy óra alatt áthaladó járművek száma normális eloszlással, 10% szignifikancia szinten? A megfigyelések eredményeit az alábbi tábla közli:
Áthaladó jármű
Gyakoriság
0 ej 20≤ ≤ 5 20 ej 40< ≤ 3 40 ej 60< ≤ 6 60 ej 80< ≤ 6 80 ej 100< ≤ 12 100 ej 120< ≤ 9 120 ej 140< ≤ 7
Megoldás: Feladatunk illeszkedésvizsgálat végzése, Kolmogorov próbával. A nullhipotézis felállításához most is szükség van a várható érték és az alapsokasági szórás becslésére a minta átlagából és korrigált tapasztalati szórásából, most az osztályközepekkel számolva ( ix∗ ).
8048
1307...506303105
1
1 =⋅++⋅+⋅+⋅==∑
∑
=
=n
ii
n
iii
f
xfx
( )131,37
47
)80130(7...)8030(3)8010(5
1
222
1
1
2
=−⋅++−⋅+−⋅=−
−==
∑
∑
=
=∗r
ii
r
iii
f
xxfs
Ezután már vázolhatjuk a hipotéziseinket: H0: A megfigyelt vasúti átjáróban áthaladó egységjárművek száma N(80, 37,131) eloszlást követ.
65
H1: A megfigyelt vasúti átjáróban áthaladó egységjárművek száma nem N(80, 37,131) eloszlást követ. Határozzuk meg a kritikus értéket is, mivel n>35, az alábbi képlettel:
177,048
)05,0ln(5,0)2/ln(5,0 =−=−=n
Dkrit
α
Ezután minden osztály felső határára meghatározzuk az elméleti eloszlásfüggvényt!
fi
i
xF(x ) ( )
− µ= Φσ
, ahol fix az osztály felső határa.
Rendre: 20 80
F(20) ( ) ( 1,616) 1 (1,616) 1 0,947384 0,05261637,131
−= Φ = Φ − = − Φ = − =
40 80F(40) ( ) ( 1,077) 1 (1,077) 1 0,859929 0,140071
37,131
−= Φ = Φ − = − Φ = − =
60 80F(60) ( ) ( 0,539) 1 (0,539) 1 0,705401 0,294599
37,131
−= Φ = Φ − = − Φ = − =
80 80F(80) ( ) (0) 0,5
37,131
−= Φ = Φ =
100 80F(100) ( ) (0,539) 0,705401
37,131
−= Φ = Φ =
120 80F(120) ( ) (1,077) 0,859929
37,131
−= Φ = Φ =
140 80F(140) ( ) (1,616) 0,947384
37,131
−= Φ = Φ =
Ezután meghatározzuk a tapasztalati eloszlásfüggvény értékét ugyanígy minden osztály felső határára. A tapasztalati eloszlásfüggvényt megint csak a kumulált relatív gyakorisággal (kedvező eset/összes eset) számoljuk).
Képletszerűen: i
iN i
i 1
nF (x )
n=
=∑
Behelyettesítve rendre:
N
5F (20) 0,104
48= = , N
8F (40) 0,167
48= = , N
14F (60) 0,2917
48= = , N
20F (800) 0,4167
48= =
N
32F (100) 0,667
48= = , N
41F (120) 0,854167
48= = , NF (140) 48 1= =
66
A könnyebb áttekinthetőség érdekében foglaljuk táblázatba az eddig kiszámolt értékeinket! Egységjármű Osztályközép
( ix∗ ) Gyakoriság Elméleti
eloszlás-függvény (Fi)
Tapasztalati eloszlás-függvény (Fn)
Eltérés (Di)
0 ej 20≤ ≤ 10 5 0,052616 0,104 0,051384 20 ej 40< ≤ 30 3 0,140071 0,167 0,026929 40 ej 60< ≤ 50 6 0,294599 0,2917 0,002899 60 ej 80< ≤ 70 6 0,5 0,4167 0,0833 80 ej 100< ≤ 90 12 0,705401 0,667 0,038401 100 ej 120< ≤ 110 9 0,859929 0,854167 0,005762 120 ej 140< ≤ 130 7 0,947384 1 0,052616 Majd minden egyes osztályra képezzük a Di eltéréseket (a táblázatunk hatodik oszlopa) Képletünk most is: i i N,iD F F= − , azaz az elméleti és a tapasztalati eloszlásfüggvények
különbségének abszolúlt értéke. Az első osztályra: 1D 0,052616 0,1104 0.051384= − = rendre így tovább, az utolsó
osztályban: 7D 0,947384 1 0,052616= − =
Keressük meg a maximális Di értéket:
max iD max(d ) max(0,051384,...0,052616) 0,0833= = = , a negyedik osztályban.
Vessük össze a talált maximális eltérést a kritikus értékkel! Mivel max krit ,D D< , hiszen
0,0833<0,177, 10%-os szignifikancia szinten nincs okunk a nullhipotézist elutasítani, azaz a megfigyelt vasúti átjáróban az egy óra alatt áthaladt egységjárművek száma valóban leírható N(80, 37,131) eloszlással. 3. Az egyik konfekcióipari vállalat a mérettáblázat kialakításához a nők testmagasságát
500 fős véletlen minta alapján vizsgálta: Magasság (cm) Nők száma (fő) 140-150 6 150-160 110 160-170 250 170-180 100 180-190 34 Összesen 500
Ellenőrizze, hogy a felnőtt nők testmagasságának eloszlása tekinthető-e normális eloszlású változónak!
67
Megoldás: A hipotézisek megfogalmazásához szükségünk van a minta alapján számított átlagra és szórásra.
Magasság (cm) Osztályközép Nők száma (fő) 140-150 145 6 150-160 155 110 160-170 165 250 170-180 175 100 180-190 185 34 Összesen 500
92,165500
34185...1101556145 =⋅++⋅+⋅=x
55,8
154,73500
34)92,165185(...110)92,165155(6)92,165145( 2222
≈
≈⋅−++⋅−+⋅−=
s
s
az adatok normális eloszlásúak N(165,92;8,55) paraméterrel.
az adatok nem normális eloszlásúak NN(165,92;8,55)paraméterrel.
A Kolmogorov-próba elvégzéséhez szükséges táblázat, amely tartalmazza a tapasztalati és elméleti eloszlásfüggvény értékeket az egyes osztályok felső határaihoz:
Osztályok fi [db]
Elméleti eloszlásfüggvény
értéke a felső határra
F(xif)
Tapasztalati eloszlásfüggvény értéke
a felső határra
Fn(xif)
|Di|
140-150 6 0,031443 0,012 0,019443
150-160 110 0,245097 0,232 0,013097
160-170 250 0,684386 0,732 0,047614
170-180 100 0,950529 0,932 0,018529
180-190 34 0,997599 1 0,002401
Összesen 500
A táblázatban szereplő értékek számítása: Az elméleti eloszlásfüggvény értékei az egyes osztályok felső határán:
031443,0968557,01)86,1(1)86,1(55,8
92,165150)150()( 1 =−=Φ−=−Φ=
−Φ== FxF f
68
245097,00,7549031)69,0(1)69,0(55,8
92,165160)160()( 2 =−=Φ−=−Φ=
−Φ== FxF f
684386,0)48,0(55,8
92,165170)170()( 3 =Φ=
−Φ== FxF f
950529,0)65,1(55,8
92,165180)180()( 4 =Φ=
−Φ== FxF f
997599,0)82,2(55,8
92,165190)190()( 5 =Φ=
−Φ== FxF f
A tapasztalati eloszlásfüggvény értékei az egyes osztályok felső határán (lényegében kumulált relatív gyakoriságokat számítunk, lásd Leíró statisztika):
∑=
=i
j
jifn n
nxF
1
)(
012,0500
6)( 1 ==fn xF
232,0500
1106)( 2 =+=fn xF
732,0500
2501106)( 3 =++=fn xF
932,0500
1002501106)( 4 =+++=fn xF
1500
341002501106)( 5 =++++=fn xF
A táblázat alapján az elméleti és a tapasztalati eloszlásfüggvény közötti legnagyobb abszolút eltérés:
0,047614max =D
A kritikus érték:
547,0,0500
05,0ln5,0)2/ln(5,0 =−=−=n
Dkrit
α (táblázatból, lásd képletgyűjtemény)
Mivel a Dmax < Dkrit a nullhipotézist elfogadjuk, a minta alapján nők testmagassága 5%-os szignifikancia szinten normális eloszlású N(165,92; 8,55) paraméterekkel.
69
4. Vizsgálja meg, hogy az alábbi pénzfeldobási kísérlet eredménye tekinthető-e véletlen sorozatnak!
(F = fej, I = írás)
F,F,I,I,F,F,F,I,I,F,F,F,F,I,I,F,I,F,F,I,I,F,F,F,I
Megoldás: sorozatpróba
FF |II |FFF| II | FFFF| II | F| I| FF| II | FFF| I
A sorozatok száma: r = 12
nI = 10, nF = 15
Mindkettő elég nagy, hogy a normális eloszlással való közelítést használjuk
H0: a fej és az írás váltakozása véletlenszerű
H1: a fej és az írás váltakozása nem véletlenszerű
1311015
15102 =++
⋅⋅=rµ
( )( ) ( ) 34,2
115101510
151015102151022
=−++
−−⋅⋅⋅⋅=rσ
α=0,05 zα/2 = 1,96, az elfogadási tartomány: -1,96 – 1,96
zr = (12-13)/2,34 = 0,43
A nullhipotézist 95%-os megbízhatósági szint mellett elfogadjuk, a fej és írás váltakozása véletlenszerű.
5. Tekinthető-e véletlenszerűnek az alábbi minta? (A medián alatti és feletti értékek véletlenszerűen váltakoznak.)
14,2 9,6 4,7 9,1 11,3 2,6 16 10,5 12,4 7,9 3,6 2,4
8,4 2,5 3,5 25,6 1,5 5,5 4,5 22,1 23,2 2,8 24,8 4,8
10,3 4,1 9,4 4,2 4,6 6,5
Megoldás: sorozatpróba alkalmazása
A medián értéke: 7,2
A mintavétel sorrendjében a medián alatti(A) és feletti(F) értékek sorozata:
F,F,A,F,F,A,F,F,F,F,A,A,F,A,A,F,A,A,A,F,F,A,F,A,F,A,F,A,A,A
A sorozatok száma: r = 18
nA = 15, nF = 15
Mindkettő elég nagy, hogy a normális eloszlással való közelítést használjuk
H0: a folyamat véletlenszerű
H1: a folyamat nem véletlenszerű
70
1611515
15152 =++
⋅⋅=rµ
( )( ) ( ) 7,2
115151515
151515152151522
=−++
−−⋅⋅⋅⋅=rσ
α=0,05 zα/2 = 1,96, az elfogadási tartomány: -1,96 – 1,96
zr = (18-16)/2,7 = 0,74
A nullhipotézist 95%-os megbízhatósági szint mellett elfogadjuk, a folyamat véletlenszerű.
6. A hétalvó Dórinak két macskája van, Kókusz és Mancsi. Mivel Dóri minden reggel elalszik, az egyik macska az ágyra felugorva hangos dorombolással ébreszti fel Őt. Dóri szeptemberben minden nap feljegyezte, hogy melyik macskája ébresztette fel őt. 5%-os szignifikancia szinten véletlenszerűnek tekinthető-e, hogy szeptemberben melyik macska ébresztette fel Dórit? Dóri feljegyzése arról, hogy melyik macska ébresztette őt: K M M M K K M K K M M M M K K M K M M K K K M K K M M K K K
Megoldás: sorozatpróba. Ho: A sorozat véletlenszerű H1: A sorozat nem véletlenszerű A megfigyelések száma (a hónap napjainak száma): n=30. Azon napok száma, amikor Kókusz ébresztette fel Dórit: n1=16 Azon napok száma, amikor Mancsi ébresztette fel Dórit: n2=14. A sorozatok száma: K | M M M | K K | M | K K |M M M M | K K | M | K | M M | K K K | M | K K | M M | K K K r=15. Az elfogadási tartomány meghatározása: Mivel /2z 1,96α = , így számított1,96 z 1,96− < < .
A normális eloszlással való számításhoz határozzuk meg a sorozatok várható értékét és szórását. Képleteink a következőek:
1 2r
1 2
2n n1
n nµ = +
+ illetve
( )( ) ( )
1 2 1 2 1 2r 2
1 2 1 2
2n n 2n n n n
n n n n 1
− −σ =
+ + −
Ha behelyettesítünk azt kapjuk, hogy:
933,1511416
141621
2
21
21 =++
⋅⋅=++
=nn
nnrµ
( )( ) ( )
6786,2)11416()1416(
)141614162(14162
1
222
212
21
212121 =−++
−−⋅⋅⋅⋅=−++
−−=nnnn
nnnnnnrσ
Ezután számolható a próbafüggvény:
rr
r
rz ,behelyettesítve
− µ=σ
r
15 15,933z 0,348
2,6786
−= = −
71
Ezután már csak a próbafüggvény értékét kell az elfogadási tartomány határaihoz viszonyítanunk: /2 r /2z z zα α− < < , hiszen 1,96 0,348 1,96− < − < , így 5% szignifikancia
szinten elfogadjuk a nullhipotézist, vagyis véletlenszerűnek tekinthető annak sorrendje, hogy melyik nap melyik macska ébresztette Dórit. 7. Egy baráti társaság minden vasárnap röplabdameccset játszik, amennyiben nem esik az
eső. Egy éven át feljegyezték, hogy milyen volt az időjárás a meccsek idején. N betűvel jelölték, amikor nem esett az eső (és így tudtak játszani) E betűvel, amikor az eső miatt nem tudtak játszani. Vizsgáljuk meg 1% szignifikancia szinten azt az állítást, hogy az egymást követő vasárnapokon véletlenszerűnek tekinthető-e az időjárás alakulása! Az eredmények: E E E N E E E N N N E E N E E N E E N N N N N N N E N N N N E N E N N N N N E N N E N E E N N E E E N E
Megoldás: A kérdés megválaszolásához ismét sorozatpróbát kell végeznünk. Ho: A sorozat, az időjárás alakulása véletlenszerű H1: A sorozat nem véletlenszerű A megfigyelések száma, n=52. Ebből azon napok száma, amikor nem esett az eső, n1=29, míg az esős napok száma, n2=23. A sorozatok száma, r=25. E E E | N | E E E | N N N | E E | N | E E | N | E E | N N N N N N N | E | N N N N | E | N | E | N N N N N | E | N N | E | N | E E | N N | E E E | N | E A kritikus érték, /2z 2,58α = , így az elfogadási tartomány: számított2.58 z 2,58− < < .
Az előző feladathoz hasonlóan számítható a sorozatok várható értéke és szórása:
1 2r
1 2
2n n1
n nµ = +
+,
( )( ) ( )
1 2 1 2 1 2r 2
1 2 1 2
2n n 2n n n n
n n n n 1
− −σ =
+ + −;
Behelyettesítünk:
6538,2612329
232921
2
21
21 =++
⋅⋅=++
=nn
nnrµ
( )( ) ( )
5215,3)12329()2329(
)232923292(23292
1
222
212
21
212121 =−++
−−⋅⋅⋅⋅⋅=−++
−−=nnnn
nnnnnnrσ
A próbastatisztika: rr
r
rz ,behelyettesítve
− µ=σ
r
25 26,6538z 0,4696
3,5215
−= = −
Ezután a próbafüggvény értékét kell az elfogadási tartomány határaihoz viszonyítanunk:
/2 r /2z z zα α− < < , hiszen 2,58 0,4696 2,58− < − < , Ez azt jelenti, hogy elfogadjuk a
nullhipotézist, az egymást követő vasárnapokon az időjárás alakulása 1 % szignifikancia szinten véletlenszerűnek tekinthető.
72
8. Egy nagyváros közlekedésbiztonsági osztálya szeretné megvizsgálni, hogy változott-e egy bizonyos balesettípusban okozott kár nagysága az új közlekedési szabályok bevezetése után. Egy forgalmas kereszteződés baleseti statisztikái közül véletlenszerűen kiválasztottak 10-et az új szabály bevezetése előtti, és 10-et az utána következő időszakból. Az egy balesetben okozott kár nagyságát az alábbi táblázat mutatja. Vizsgáljuk meg, hogy van-e változás a balesetben okozott kár nagyságát tekintve a szabály bevezetését követően!
Kár a szabály bevezetése előtt, [eFt] Kár a szabály bevezetése után, [eFt] 150 145 500 390 250 680 301 560 242 899 435 1250 100 290 402 963 716 180 200 550
Megoldás: Mann-Whitney U próba alkalmazása
A rendezett minta rangszámai (csoport: E=a bevezetés előtti kár, U=bevezetés utáni kár)
Érték 100 145 150 180 200 242 250 290 301 390
Csop. E U E U E E E U E U
Rangsz. 1 2 3 4 5 6 7 8 9 10
Érték 402 435 500 550 560 680 716 899 963 1250
Csop. E E E U U U E U U U
Rangsz. 11 12 13 14 15 16 17 18 19 20
A rangszámok összege mintánként:
RE = 84, RU = 126
H0: a két minta eloszlása azonos
H1: a bevezetést követően eltolódott az eloszlás az eredetitől valamelyik irányba (a középértékek nem egyenlők)
U érték kiszámolása:
71842
)110(101010 =−++⋅=U
Mindkét mintaszám 10, ami lehetővé teszi a normális eloszlással történő közelítést.
502
1010 =⋅=Uµ
73
17512
)11010(10102 =++⋅=Uσ
α=0,05 zα/2 = 1,96, az elfogadási tartomány: -1,96 – 1,96
zU = (71-50)/13,2 = 1,59
z értéke az elfogadási tartományba esik, 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, nincs változás az egy balesetben okozott kár nagyságának eloszlásában az új szabály bevezetésével.
9. Egy forgalmas teherpályaudvar közelében figyeljük az elhaladó vonatokat. Arra a kérdésre szeretnénk választ kapni, hogy van-e különbség a dízel és a villamos mozdonnyal húzott szerelvények hossza között? Legyen a szignifikancia-szint 5%! Megfigyeléseink eredményeit az alábbi tábla mutatja:
A vonat hossza (kocsi) Dízelmozdony 68 44 27 41 52 56 38 47 70 72 26 Villanymozdony 44 76 56 44 80 82 16 36 42 18 29 39 47 11 A kérdés megválaszolásához a Mann-Whintey próbát hívjuk segítségül. A két mintás t-próba ugyanis nem alkalmazható, mert nem tudjuk, hogy az eloszlás normális-e, illetve az alapsokasági szórásokról sincs ismeretünk. Hipotézispárunk: H0: F(x)=G(y), azaz a két minta azonos eloszlásból származik, nincs
tehát különbség a dízel és a villamos mozdonnyal továbbított vonatok hossza között.
H1: F(x)≠ G(y), a két minta nem tekinthető azonos eloszlásból származónak, különbség van a vonatok hossza között.
Legyen továbbá nx=11 a dízelmozdonnyal megfigyelt vonatok száma, ny=14 a villamos mozdonnyal megfigyelt szerelvények száma.
Egyesítve a két mintát, nagyság szerint növekvő sorrendbe rendezve a megfigyeléseket, meghatározzuk a rangszámokat. (Rsz. legyen a rangszám, Vh. a vonat hossza, M. a mozdony). Rsz. Vh. M. Rsz. Vh. M. Rsz. Vh. M. Rsz. Vh. M. Rsz. Vh. M. 1 11 V 6 29 V 11 42 V 15,5 47 D 21 70 D 2 16 V 7 36 V 13 44 D 17 52 D 22 72 D 3 18 V 8 38 D 13 44 V 18,5 56 D 23 76 V 4 26 D 9 39 V 13 44 V 18,5 56 V 24 80 V 5 27 D 10 41 D 15,5 47 V 20 68 D 25 82 V A rangszámok meghatározásánál a kapcsolt rangokra kell figyelnünk. A 44-es érték háromszor fordul elő, ezért a 12, 13, 14-es rangszám átlagát, a 13-ast rendeljük mindhárom 44-es értékhez. A 47-es és 56-os értékek kétszer fordulnak elő, így a 15 és 16 átlaga, a 15,5 lesz a 47 kocsis vonatok rangszáma, és a 18 és 19 átlaga, a 18,5 pedig az 56 kocsis szerelvények rangszáma. Meghatározzuk a rangszámok összegét; figyelni kell arra, hogy a kapcsolt rangszámokat annyiszor adjuk hozzá, ahányszor előfordulnak:
74
Rx(dízelmozdony)=4+5+8+10+13+15,5+17+18,5+20+21+22=154. Ry(villamosmozdony)=1+2+3+6+7+9+11+13+13+15,5+18,5+23+24+25=171. Ezután az U próbafüggvény (most x-re) már könnyen számolható:
661542
)111(111411
2
)1( =−++⋅=−++= xxx
yx Rnn
nnU
Mivel a minta mindkét megfigyelésben 10-nél több elemet tartalmaz, U mintavételi eloszlása közelítőleg normális.
772
1411
2=⋅== yx
U
nnµ
várható értékkel, valamint –a kapcsolt rangok miatt-
m3i i
2 1 2 i 1U 1 2
1 2 1 2
(k k )n n
n n 112 (n n )(n n 1)
=
− σ = + + −
+ + −
∑varianciával (figyeljünk az eltérő szórásképletre
kapcsolt rangok esetén)!. E képletben ki a k-adik kapcsolt rangszám előfordulásának gyakorisága, esetünkben a 13-as rangszám 3-szor, a 15,5-ös és a 18,5-ös rangszám kétszer fordul elő. Helyettesítsünk be!
9,332)11411)(1411(
)22()22()33(11411
12
1411 3332 =
−++−+−+−
−++⋅=Uσ
Majd végezetül a próbafüggvény: 6029,09,332
7766 −=−=z
Nincs más dolgunk, mint meghatározni a kritikus értéket, majd a számított értéket összevetni vele. 5% szignifikancia szinten az elfogadási tartomány: U1,96 z 1,96− < < , látható, hogy a
számított érték beleesik, így 5% szignifikancia szinten a nullhipotézist elfogadjuk, nincs különbség a dízel és a villamos mozdonnyal továbbított vonatok hossza között.
10. Egy csavargyárban minden elkészült 10.000 darabos tétel után egy maroknyi mintát vesznek. A vállalat azt kívánja megvizsgálni, hogy a két gépkezelő, Xavér és Yvonne által kivett minta nagysága -10%-os szignifikancia szinten- azonosnak tekinthető-e. A vizsgált időszakban Xavér 100.000 darab csavart gyártott, így 10-szer vett egy maroknyi mintát, Yvonne pedig 130.000 darab csavart készített, így 13-szor vett mintát. A kivett minta nagysága az alábbi táblázatban szerepel.
Xavér 50 64 81 36 48 54 45 88 59 56 Yvonne 40 47 84 44 41 38 58 66 42 51 67 46 69
Megoldás: Mivel nincs ismeretünk az alapsokaság eloszlásáról, célszerű Mann-Whitney próba segítségével vizsgálni a két sokaság helyzetét (a két mintás t-próba normális eloszlásra alkalmazható. Lehetőség van persze t-próbát is alkalmazni, ha illeszkedésvizsgálat segítségével meggyőződtünk a mintavételi eloszlás normalitásáról, illetve az ismeretlen
75
alapsokasági szórások egyezőségéről is, F-próbával. Lényegesen egyszerűbb tehát a Mann-Whitney próbát segítségül hívni). Hipotézispárunk: H0: F(x)=G(y), a két eloszlás azonos, a két gépkezelő által kivett maréknyi minta elemszáma azonosnak tekinthető. H1: F(x) G(y),≠ a két eloszlás helyzete nem azonos, a két gépkezelő által kivett maréknyi minta elemszámában különbség van. Egyesítjük a mintát, nagyság szerint növekvő sorrendbe rendezzük, majd hozzárendeljük a rangszámokat (Rsz=rangszám, db. a kivett minta darabszáma, Gk a gépkezelő).
Rsz. db Gk. Rsz. db Gk. Rsz. db Gk. Rsz. db Gk. 1 36 X 7 45 X 13 54 X 19 67 Y 2 38 Y 8 46 Y 14 56 X 20 69 Y 3 40 Y 9 47 Y 15 58 Y 21 81 X 4 41 Y 10 48 X 16 59 X 22 84 Y 5 42 Y 11 50 X 17 64 X 23 88 X 6 44 Y 12 51 Y 18 66 Y
Meghatározzuk a két sokaságra a rangszámok összegét: RX=1+7+10+11+13+14+16+17+21+23=133 RY=2+3+4+5+6+8+9+12+15+18+19+20+22=143 A próbafüggvényünk:
521332
)110(101310
2
)1( =−+⋅+⋅=−++= xxx
yx Rnn
nnU
Mindkét minta elemszáma eléri a 10-et, így U közelítőleg normális eloszlású, így megkeressük várható értékét és szórását.
652
1310
21 =⋅== yx
U
nnµ
26012
)11310(1310
12
)1(2 =++⋅⋅=++
= yxyxU
nnnnσ
Kalkulálva zu-t: U
U
U 52 65z 0,8062
260
− µ −= = = −σ
10%-os szignifikancia szinten az elfogadási tartomány: 64,164,1 +<<− szz . Mivel a számított
érték eleme e tartománynak, 10%-os szignifikancia szinten a nullhipotézist elfogadjuk, a Xavér és az Yvonne által kivett maroknyi minta azonos darabszámúnak tekinthető
76
11. Az amerikai elnökválasztások történetében 1869 óta lehet egyértelműen republikánus vagy demokrata elnökről beszélni. Az egyes időszakokban hatalomra jutott elnökök pártállása rendre:
1869-1945 1946- R R R R D R D R R R D D R R R D D D D R R D D R R D R R R D D R
Állapítsuk meg, hogy van-e valamilyen törvényszerűség a választások egymásutániságában az egész időszakban! Megoldás:
H0: a sorrend véletlenszerű
H1: a sorrend nem véletlenszerű, szabályszerűséget mutat (a megfigyelés-sorozat elemei vagy nem függetlenek, vagy nem azonos eloszlásúak)
Sorozatok száma: r=15 nR=19 nD=13 A normális eloszlással való közelítéshez határozzuk meg r várható értékét és szórását!
4375,1611319
131921
2=+
+⋅⋅=+
+=
DR
DRr nn
nnµ
64,2965,632768
228228
)11319()1319(
)131913192(13192
)1()(
)2(222
===−++
−−⋅⋅⋅⋅⋅=−++
−−=
DRDR
DRDRDRr nnnn
nnnnnnσ
A próbafüggvény értéke:
544,064,2
4375,1615 −=−=−
=r
rr
rz
σµ
5%-os szignifikancia szinten zα/2=±1,96 Mivel a próbafüggvény értéke az elfogadási tartományba esik, így H0-t elfogadjuk, ezen a szignifikancia szinten elfogadható a sorozat véletlenszerűsége.
77
12. A Gazdálkodási és menedzsment alapképzés két évfolyamáról egymástól függetlenül, véletlenszerűen kiválasztott 10-10 hallgató év végi görgetett tanulmányi átlaga a következő:
Hallgató sorszáma I. évfolyam átlaga II. évfolyam átlaga 1 2,7 4,1 2 4,0 3,3 3 3,5 4,7 4 4,2 3,6 5 3,8 3,9 6 2,9 2,3 7 4,3 4,4 8 3,4 4,5 9 3,2 2,4 10 4,6 3,7
Vizsgáljuk meg 1%-os szignifikancia szinten, hogy a hallgatók tanulmányi átlagának eloszlása azonos-e a két évfolyamon!
H0: nincs különbség a két évfolyam hallgatói által elért tanulmányi eredmények között (F(x)=G(x))
H1: µx ≠ µy (A két évfolyam hallgatói által elért tanulmányi eredmények várható értékei között van különbség)
Megoldás: n1=10 n2=10 Egyesítjük a mintát, és az elért eredmények rangsorát képezzük: 2,3 2,4 2,7 2,9 3,2 3,3 3,4 3,5 3,6 3,7 II. II. I. I. I. II. I. I. II. II. 1 2 3 4 5 6 7 8 9 10 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 I. II. I. II. I. I. II. II. I. II. 11 12 13 14 15 16 17 18 19 20 Meghatározzuk a rangszámok összegét mindkét szak esetére: RI: 3+4+5+7+8+11+13+15+16+19 = 101 RII: 1+2+6+9+10+12+14+17+18+20 = 109
541012
)110(101010
2
)1(1
11121 =−+⋅+⋅=−
++= R
nnnnU
Mivel a mindkét sokaságból kivett minta 10 elemű, így U1 eloszlása közelítőleg standard normális eloszlású:
502
1010
221 =⋅==
nnUµ 175
12
)11010(1010
12
)1( 21212 =++⋅⋅=++
=nnnn
Uσ
78
A próbafüggvény értéke:
302,0175
5054 =−=−
=U
UUz
σµ
1%-os szignifikancia szint mellett a kritikus értékek: z0,995=±2,58 H0-t elfogadjuk, mivel a számított érték az elfogadási tartományba esik, így a két évfolyam tanulmányi eredményeinek eloszlása, illetve azok középértéke egyezik 1%-os szignifikancia szinten.
79
Paraméteres próbák
1. A képviselőválasztás érvényességének feltétele, hogy a választópolgárok legalább 50%-a leadja a szavazatát. Egy adott városban a megüresedett képviselői helyre időközi választást írtak ki. A szavazás előtti héten megkérdezett 200 véletlenszerűen kiválasztott választópolgár közül 96 mondta, hogy elmegy szavazni. A felmérés alapján döntsük el, hogy 5%-os szignifikancia szinten lehet-e érvényes szavazásra számítani!
Megoldás: egymintás aránypróba
H0: P=0,5
H1: P<0,5 Nézzük meg, hogy a mintánk alapján teljesül-e a { } 10)1(,min 00 ≥− PnnP összefüggés:
{ } 10100)5,01(2005,0200min ≥=−⋅=⋅ Ennek megfelelően alkalmazható a nagymintás eljárás, és az alábbi próbafüggvény aszimptotikusan normális eloszlású.
57,0035,0
02,0
200
5,05,0
5,0200
96
)1( 00
0 −=−=⋅
−=
−−
=
n
PP
PpZsz
α=5% zα=-1,64 Mivel a számított érték az elfogadási tartományba esik, így 95%-os megbízhatósággal lehet érvényes szavazásra számítani.
2. A Felvillanyozzuk Kft. villanyégőket gyárt. A vevője akkor veszi át a beszállított tételt, ha
a hibaarány nem nagyobb, mint 1%. A napi termeléséből vett n = 2000 elemű mintában a hibás égők száma 24 db. A kivett minta alapján döntsük el, hogy 99%-os megbízhatósággal a vevő átveszi-e a tételt!
Megoldás: egymintás aránypróba
H0: P=0,01
H1: P>0,01 Nézzük meg, hogy a mintánk alapján teljesül-e a { } 10)1(,min 00 ≥− PnnP összefüggés:
{ } 1020)01,01(2000;01,02000min ≥=−⋅⋅ Ennek megfelelően alkalmazható a nagymintás eljárás, és az alábbi próbafüggvény aszimptotikusan normális eloszlású.
897,000223,0
002,0
2000
99,001,0
01,02000
24
)1( 00
0 ==⋅
−=
−−
=
n
PP
PpZsz
α=1%, zα=2,34
80
Mivel a számított érték az elfogadási tartományba esik, így 99%-os megbízhatósággal lehet a tétel elfogadására számítani. 3. Valamely terméket akkor vesz át a vevő, ha a selejtarány legfeljebb 2%-os. Egy nagyobb
szállítmányból vett 1000 db-ból álló mintában 26 db selejtes terméket találtak. Állítsa fel a hipotéziseket, és tesztelje az előírást 5%-os szignifikancia szinten! Hozzon döntést az átvételt illetően!
Megoldás: egymintás aránypróba
{ } 1020)02,01(1000;02,01000min ≥=−⋅⋅
02,0:0 =PH
02,0:1 >PH Kritikus érték: 65,195,0 =z , az elfogadási tartomány: zsz<1,65
Számított érték:
354,100443,0
006,0
0000196,0
006,0
1000
)02,01(02,0
02,0026,0
)1( 00
0 ===−−=
−−
=
n
PP
PpZ
Mivel 1,354<1,65, így a nullhipotézist elfogadjuk, a szállítmány átvehető, a tényleges selejtarány nem nagyobb szignifikánsan az előírás szerintinél. 4. Egy gyorséttermi akció célja, hogy hatására a vásárlók 20%-a vásárolja meg az adott
terméket. 350 vásárlót tartalmazó véletlen mintában 65-en megvásárolták a szóban forgó terméket. Ellenőrizzük, hogy sikeresnek tekinthető-e az akció 5%-os szignifikancia szinten!
Megoldás: egymintás aránypróba
186,0350
65 ==p 2,00 =P
Nagymintás próba alkalmazásának vizsgálata:
0 0min(nP ;n(1 P )) 10
min(350 0,2;350(1 0,2)) 10
min(70,280) 10
− ≥∗ − ≥
≥
Ezek ismeretében alkalmazhatjuk a nagymintás próbát:
00 : PPH =
00 : PPH <
Kritikus érték: α=0,05 � zα= –1,64 � elfogadási tartomány: zsz>zα Próbafüggvény értéke:
81
655,0
350
)2,01(2,0
2,0186,0
)1( 00
0 −=−−=
−−=
n
PP
PpZ
Mivel a számított érték nagyobb, mint a kritikus érték, így a nullhipotézist elfogadjuk, vagyis sikeresnek tekinthető az akció. 5. Egy plázából kifelé jövet véletlenszerűen megkérdeztek 500 főt, akik közül 347 nő volt és
153 férfi, hogy vásároltak-e. A nők közül 198-an, a férfiak közül 62-en válaszoltak igennel. 5%-os szignifikancia szinten állítható-e, hogy a nők nagyobb arányban vásárolnak, mint a férfiak?
Megoldás: kétmintás aránypróba
H0: Pnő=Pférfi
H1: Pnő>Pférfi
α=0,05 zα= 1,645 Elfogadási tartomány: zsz <1,645
571,0347
198 ==nőp 405,0153
62 ==férfip
52,0500
405,0153571,0347
21
2211 =⋅+⋅=++
=nn
pnpnp
48,052,011 =−=−= pq A próbastatisztika értéke:
423,30485,0
166,0
153
1
347
148,052,0
405,0571,0
11
21
21 ==
+⋅⋅
−=
+
−=
nnqp
ppzsz
Mivel zsz>1,645, ezért a H0 hipotézist 5%-os szignifikancia szinten elutasítjuk, vagyis állítható, hogy a nők nagyobb arányban vásárolnak. 6. Egy illatszerboltban 10 nap alatt változatlan minőségű és változatlan árú 460 db
szappant adtak el, ebből 138 db volt „Amo” márkájú. Miután az „Amo” szappan csomagolását megváltoztatták, újabb 10 napos megfigyelés szerint 400 eladott szappan között 160 db volt „Amo” márkájú. Állapítsa meg 1%-os szignifikancia szinten, hogy az új csomagolás növelte-e az „Amo” szappan piaci részesedését!
Megoldás: kétmintás aránypróba
210 : PPH =
210 : PPH <
3,0460
1381 ==p 4,0
400
1602 ==p
82
3465,0860
4,04003,0460
21
2211 =⋅+⋅=++=
nn
pnpnp
A próbafüggvény:
077,3
400
1
460
16535,03465,0
4,03,0
11
21
21 −=
+⋅⋅
−=
+
−=
nnqp
ppzsz
Kritikus érték: α=0,01 � zα= –2,34 � elfogadási tartomány: zsz>zα
Mivel a számított érték kisebb, mint a kritikus érték, így 1%-os szignifikancia szinten elutasítjuk a nullhipotézist, vagyis az új csomagolás növelte a szappan piaci részesedését. 7. Valamely bűncselekménytípus áldozataira vonatkozó rendőrségi feljegyzésekből vett
100-100 elemű véletlen minta adatai két egymást követő évben:
Év 60 évnél fiatalabbak aránya 2002 20% 2003 18%
Ellenőrizzük 5%-os szignifikancia szinten, hogy változott-e a 60 éven aluli áldozatok aránya!
Megoldás: kétmintás aránypróba
H0: P1=P2
H1: P1>P2
α=0,05 zα= 1,645 Elfogadási tartomány: zsz <1,645
2,01 =p 18,02 =p
19,0200
18,01002,0100
21
2211 =⋅+⋅=++
=nn
pnpnp
81,019,011 =−=−= pq A próbastatisztika értéke:
36,00555,0
02,0
100
1
100
181,019,0
18,02,0
11
21
21 ==
+⋅⋅
−=
+
−=
nnqp
ppzsz
Mivel zsz<1,645, ezért a H0 hipotézist 5%-os szignifikancia szinten elfogadjuk, vagyis nem állítható, hogy csökkent a 60 éven aluli áldozatok aránya.
83
8. Egy befektető a portfóliójában 2000 darab értékpapírt tart. Januárban 1120 darab, februárban 1200 darab értékpapíron tudott pozitív hozamot realizálni. 1%-os szignifikancia szinten igaz-e az az állítás, hogy januárról februárra nőtt a befektető portfóliójában azon értékpapírok aránya, amelyeken pozitív hozamot realizálhatott.
Megoldás: Kétmintás aránypróbát kell végezni (figyeljünk a feladat szövegének pontos értelmezésére, a kérdés a portfolióban a pozitív hozamú értékpapírok aránya és nem darabszáma, amit kétmintás t-próbával vizsgálhatnánk!). Adataink: p=1120/2000=0,56 (értelemszerűen kedvező eset/összes eset) a nyereséges
értékpapírok aránya januárban q=1200/2000=0,6, a nyereséges értékpapírok aránya februárban n1=n2=2000 a vizsgált értékpapírok darabszáma.
Hipotéziseink: 0
1
H : P Q
H : P Q
=<
.
Táblázatból a kritikus érték:kritz 2,33= − , így az elfogadási tartomány: számított2,33 z− < .
Képleteink most is:
1 2sz
1 2
p pz
1 1pq
n n
−=
+
, ahol 1 1 2 2
1 2
n p n pp
n n
+=+
és q 1 p= − -
Írjuk be az ismert adatainkat!
58,020002000
6,0200056,02000 =+
⋅+⋅=p , így q 1 0,58 0,42= − = , behelyettesíthetünk a
próbastatisztikába:
563,2
2000
1
2000
142,058,0
6,056,0 −=
+⋅
−=szz
Nincs más hátra, mint a számított és a kritikus érték egybevetése. Esetünkben számított kritz z< ,
ugyanis -2,563<-2,33. Ez azt jelenti, hogy az 1%-os szignifikancia szinten elutasítjuk a nullhipotézist, azaz az alternatív hipotézis elfogadása mellett azt állíthatjuk, hogy januárról februárra valóban nőtt a befektető portfóliójában a pozitív hozamú értékpapírok aránya. 9. Adott típusú hőmérsékletszabályozók minden egyes darabját – biztonsági okokból – a
gyártóműnél végellenőrzéskor, valamint a megrendelőnél átvételkor ellenőrzik. Az ellenőrzött méret előírása 120±3°C. A megrendelőtől számos reklamáció érkezett a leszállított szabályozók pontosságára vonatkozóan. A gyártómű azt tűzte ki feladatul, hogy megvizsgálja a megrendelő hitelesítő műszerét: nem mutat-e ez olyan pontatlanságot, amely a kapcsolási pontok eltérését okozhatja? A vizsgálat érdekében a gyártó és a megrendelő együttes vizsgálattal 40-40 darab véletlenszerűen kiválasztott szabályozó értékét műszereivel meghatározta.
84
A mérések eredményei a gyártó műszerén: CsCx gygy °=°= ∗ 54,1;8,119
A megrendelő műszerén: CsCx MM °=°= ∗ 17,1;2,121
A műszerek mérési pontossága (eltérése) okozhatja-e a reklamációban jelzett eltéréseket? (α=5%)
Megoldás: Az eltérés vizsgálatára két várható érték összehasonlítására vonatkozó statisztikai próbát kell végeznünk. Nem páros mintáról van szó, mivel nem ugyanazt a 40 darab szabályozót mérték meg a megrendelőnél és a gyártónál. Az alapsokaságok szórásai ismeretlenek, ezért a minták szórásaival kell majd dolgoznunk. Első körben F-próbát kell végeznünk: H0: σgy=σM
H1: σgy>σM
732,117,154,1
2
2
==szF
DFszámláló=39 DFnevező=39 Fkrit=1,69 Mivel Fsz>Fkrit, ezért a H0-t 95%-os megbízhatósági szinten elutasítjuk. Welch-próbával kell folytatnunk: a gyártómű szakmai hipotézise szerint a megrendelő szisztematikus hibával mér az övéhez képest, így a hipotézisek: H0: µgy=µM
H1: µgy<µM A Welch-próbánál a szabadságfokot külön számítással kell meghatározni:
366,005929,00342225,0
0342225,0
40
54,1
40
17,140
17,1
22
2
2
2*2
1
2*1
2
2*2
=+
=+
=+
=
ns
ns
ns
c
( ) ( )( ) ( ) ( ) 77,72
9,20
1521
402,039366,039
3939
111
11222
22
1
21 ==⋅+⋅
⋅=−⋅−+⋅−
−⋅−=
cncn
nnDF
A próbastatisztika:
578,40935,0
4,1
4054,1
4017,1
2,1218,11922
2
2*2
1
2*1
21 −=−=+
−=+
−=
n
s
n
s
xxt f
tkrit≈-1,67 Mivel a számított érték az elfogadási tartományon kívül esik, ezért 95%-os megbízhatósági szinten nem fogadjuk el a H0 hipotézist, vagyis a megrendelő szisztematikus hibával mér a gyártóhoz képest.
85
10. Kínai és japán turisták körében végeztek felmérést a fényképezési szokásaikról. A japán turisták egy nap alatt átlagosan 106 képet készítettek, 38,4 kép szórással. A kínai turisták 94 képet csináltak, 16,4 kép szórással. A vizsgálat során 61 japán és 41 kínai látogatót figyeltek meg. A készített képek eloszlása normális. 5%-os szignifikancia szinten feltehető-e, hogy a japán és a kínai turisták ugyanannyit fényképeznek?
Megoldás: Az első feladatunk, hogy megvizsgáljuk, azonos-e a két ismeretlen alapsokasági szórás, F-próbával. H0:
2 2japán kínaiσ = σ , H1: 2 2
japán kínaiσ > σ , a kritikus érték (DF=n-1, így a számláló szabadságfoka
60, a nevezőé 40) Fkrit=1,64.
Próbastatisztikánk: 2 2
japánszámított 2 2
kínai
s 38,4F 5,482
s 16,4
∗
∗= = = (figyeljünk arra, hogy mindig a nagyobb
korrigált tapasztalati szórás kerül a számlálóba!). Mivel krit számF F< , hiszen 1,69 5,482<< így az 5% szignifikancia szinten el kell utasítanunk a
nullhipotézist, az ismeretlen alapsokasági szórások nem egyenlők. Ezért a két mintás t-próba helyett a Welch próbát fogjuk használni a két várható érték összehasonlítására. Hipotézispárunk:
0 japán kínaiH : µ = µ ,
1 japán kínaiH = µ > µ
Képletszerűen a próbastatisztika: j k
f *2 *2j k
j k
x xt
s sn n
−=
+
, (a minta átlagából, korrigált tapasztalati
szórásából és elemszámából számolva), behelyettesítve:
f 22
106 94t 2,1646
16,438,461 41
−= =+
A kritikus érték meghatározásához még meg kell határoznunk a t-eloszlás szabadságfokát.
Ehhez szükségünk van a c tényezőre, képletszerűen:
*22
2*2 *21 2
1 2
sn
cs s
n n
=+
, ha behelyettesítünk,
2
2 2
16,441
c 0,2134538,4 16,4
61 41
= =+
.
86
Ezután a szabadságfok: ( ) ( )
( ) ( )( )1 2
221 2
n 1 n 1f
n 1 c n 1 1 c
− −=
− + − −, ami behelyettesítve az előbb számolt
c tényezőt, illetve a mintaszámokat, ( )( )
( ) ( )( )22
61 1 41 1f 87,336
61 1 0,21345 41 1 1 0,21345
− −= =
− + − −
Ez tehát a Student-eloszlás szabadságfoka. Táblázatból így megkeressük a kritikus értéket (egyoldali próba!), ami kritt 1,66≈ . Mivel krit számt t< , ugyanis 1,66<2,1646, így az 5%-os
szignifikancia szinten elvetjük a nullhipotézist, így tehát a japán turisták többet fényképeznek. [Megjegyzés: Mivel mindkét minta elemszáma nagyobb 40-nél, a kritikus t-értéket a normális eloszlással is közelíthetjük. Ekkor szintén a kritikusz 1,66≈ érétket kapjuk. ]
11. Az újságolvasási szokásokat vizsgálták a felsőfokú végzetséggel rendelkezők illetve nem
rendelkezők között, mindkét csoportból 25-25 elemű mintát véve. A felsőfokú végzetséggel rendelkezők napi átlag 24 percet töltöttek újságolvasással, 4 perc szórással. A felsőfokú végzetséggel nem rendelkezők naponta átlagosan 23 percet töltöttek újságolvasással, 9 perc szórással. Mindkét csoportban azt találták, hogy az újságolvasással töltött idő normális eloszlást követ. 1 %-os szignifikancia szinten feltehető-e, hogy a két csoportban azonos az újságolvasásra fordított idő?
Megoldás: Feladatunk a két várható érték összehasonlítása. Ez kétmintás t-próbával vagy Welch-próbával történhet. A kétmintás t-próba akkor alkalmazható, ha az alapsokasági szórások egyezőnek tekinthetőek, máskülönben a Welch-próba alkalmazandó. Legyen a továbbiakban az egyes csoport a felsőfokú végzettséggel rendelkezők, kettes csoport az ezzel nem rendelkezők csoportja. Nézzük az alapsokasági szórások egyezőségét! Ehhez az F-próbát hívjuk segítségül.
2 20 1 2
2 21 1 2
H :
H :
σ = σ
σ < σ
A kritikus érték, a szabadságfok mind a nevezőben, mind a számlálóban 24: kritF 2,66= .
Próbastatisztikánk: 2 2
2számított 2 2
1
s 9F 5,0625
s 4
∗
∗= = = (Figyeljünk arra, hogy a nagyobb mintabeli korrigált tapasztalati
szórás kerüljön a számlálóba!). Mivel krit számF F< , hiszen 2,66 5,0625< , el kell vetnünk a
nullhipotézist, 1%-os szignifikancia szinten a két alapsokasági szórás egyezése nem tételezhető fel. Így a kétmintás t-próba alkalmazásának feltételei sem állnak fenn, Welch-próbát kell alkalmazzunk.
Állítsuk fel hipotéziseinket! 0 1 2
1 1 2
H :
H :
µ = µµ ≠ µ
A próbafüggvény képlete: j k
f *2 *2j k
j k
x xt
s sn n
−=
+
, azaz f 2 2
24 23t 0,5077
4 925 25
−= =+
.
A kritikus értékhez határozzuk meg a szabadságfokot.
87
*22
2*2 *21 2
1 2
sn
cs s
n n
=+
, majd e tényező segítségével a szabadságfok
( ) ( )( ) ( )( )
1 222
1 2
n 1 n 1f
n 1 c n 1 1 c
− −=
− + − −.
Helyettesítsünk be! 2
2 2
925c 0,835
4 925 25
= =+
, ( )( )
( ) ( ) ( )22
25 1 25 1f 33,1286
25 1 0,835 25 1 1 0,835
− −= =
− + − −.
A kritikus értéket tehát a DF=33 szabadságfokú Student-eloszlás segítségével határozzuk meg (az egyszerűség kedvéért a táblázatból a 35-ös értéknél leolvasva), 1 % szignifikancia szinten.
kritt 2,724= . Mivel szám kritt t<< , 0,5077<<2,724, így 1 % szignifikancia szinten nincs okunk
a nullhipotézist elutasítani, azaz a felsőfokú végzetséggel rendelkezők és a felsőfokú végzetséggel nem rendelkezők körében az újságolvasására fordított idő egyenlő.
12. Négy, közkedvelt üdítőital töltési térfogatát vizsgáltuk. A megfigyelések eredményei:
Üdítő Ellenőrzött palackok
száma Töltési térfogat [ml]
Almás 6 498, 504, 506, 502, 498, 498 Barackos 4 500, 502, 504, 494 Citromos 6 504, 498, 502, 500, 499, 503 Dinnyés 8 495, 503, 496, 500, 504, 501, 502, 499
Ellenőrizzük 5%-os szignifikancia szinten, hogy a töltési térfogatok szórása egyenlő-e! Megoldás: Feladatunk az ismeretlen alapsokasági szórások összehasonlítása a mintából számított adatok alapján. Mivel a mintaszámok nem egyenlők, a Cochran-próba nem alkalmazható, helyette a Bartlett-próbát hívjuk segítségül. Hipotéziseink: H0: σA=σB=σC=σD
1H :a legnagyobb szórású különbözik
Definiáljuk: r r
2 *2j j j
j 1 j 1
1f n r, s (n 1)s
f= =
= − = −∑ ∑ , ahol r
jj 1
n=∑ az összes minta elemszáma, r a
csoportok száma, *2js pedig a j-edik csoport (osztály) mintából számított korrigált tapasztalati
szórása. Számítsuk ki a csoportok korrigált tapasztalati szórását, előtte azonban még szükségünk lesz a csoportok átlagaira is. Az általános képletek levezetése nélkül:
88
A
B
C
D
498 504 506 502 498 498X 501
6500 502 494 504
X 5004
504 498 502 500 499 503X 501
6495 503 496 500 504 501 502 499
X 5008
+ + + + += =
+ + += =
+ + + + += =
+ + + + + + += =
2 2 2 2 2 2
A
(498 501) (504 501) (506 501) (502 501) (498 501) (498 501)s 12,4
5∗ − + − + − + − + − + −= =
66,183
)500504()500494()500502()500500( 2222
=−+−+−+−=∗Bs
2 2 2 2 2 2
C
(504 501) (498 501) (502 501) (500 501) (499 501) (503 501)s 5,6
5∗ − + − + − + − + − + −= =
2 2 2 2
D
(495 500) (503 500) ... (502 500) (499 500)s 10,286
7∗ − + − + + − + −= =
Ezután az f és az s2 paraméter:
2 2
r
j jj 1
r2
j j jj 1
f n r, ahol n a j-edik osztály elemeinek száma, r az osztályok száma
1s (n 1)s , itt s a j-edik osztályban számolt korrigált tapasztalati szórás
f
=
∗ ∗
=
= −
= −
∑
∑
20424 =−=f
8991,10)286,1076,5566,834,25(20
12 =⋅+⋅+⋅+⋅=s
Definiáljuk továbbá a következő A paramétert!
r
j 1 j
1 1 1 1 1 1 1 1 1A 1 1 1,0918
3(r 1) n 1 f 3(4 1) 5 3 5 7 20=
= + − = + + + + − = − − − ∑
Innen a próbastatisztika:
[ ]
r2 2 *2
j jj 1
2,3026f lns (n 1) lns
A
2,302620ln10,8991 (5ln12,4 3ln18,66 5ln5,6 7 ln10,286 3,114
1,0918
=
χ = − − =
− + + + =
∑
5%-os szignifikancia szinten (figyeljünk rá, hogy itt kivételesen nem az / 2α értékhez keressük a kritikus értéket!) a kritikus 2χ érték, DF=r-1=3 (r a csoportok száma), azaz DF=3
szabadságfok mellett: 2χ krit=7,815
Egybevetve a számított és a kritikus értéket: 2 2szám kritχ < χ , hisz 3,114<7,815, így 5%
szignifikancia szinten fenntartjuk a nullhipotézist, az alapsokasági szórások, azaz a töltési térfogat ingadozása egyenlő.
89
13. Egy betongyárban 4 cementgyárból (A, B, C, D) vásárolnak cementet. A cement minőségét próbakockák gyártásával ellenőrzik. A beérkező „500-as cement” szállítmányokból mintát véve a próbakockák nyomószilárdság adatai [kg/cm2-ben] az alábbiak A szállító: 512, 716, 668, 726, 580
B szállító: 516, 664, 614, 586, 590 C szállító: 542, 684, 722, 600, 642 D szállító: 566, 744, 546, 610, 672.
Van-e különbség a szállítók között? Megoldás: Varianciaanalízis, előtte Cohran-próba (!) H0: σA=σB=σD=σC H1: legalább egy eltér α=5% n=5 f(DF)=4 r=4 gkrit=0,63
n átlag s* A 5 640,4 92,112 B 5 594,0 53,535 C 5 638,0 70,442 ,D 5 627,6 81,061
gszámított= 37,0061,81442,70535,53112,92
112,92... 2222
2
222
21
2max =
+++=
+++=
rsss
sg
H0-t 95%-os megbízhatósági szinten elfogadjuk. Mehetünk tovább a varianciaanalízisre. H0: µA=µB=µC=µD H1: legalább egy eltér
Négyzetösszeg neve
Négyzet-összegek
Szabad-ságfok
Szórás becslése
F érték p-érték
Csoportok közötti *
( )∑=
−r
i
ii xxn1
2 r-1 sk2 sk
2/sb2 p
Csoporton belüli **
( )∑∑= =
−r
i
n
j
iij
i
xx1 1
2 n-r sb2 - -
Teljes ( )∑∑= =
−r
i
n
jij
i
xx1 1
n-1 - - -
A csoportok közötti négyzetösszeg kiszámításához szükség van a főátlagra, ezt pedig a részátlagok segítségével könnyen előállítható, de súlyozni kell:
62520
6,6275638559454,6405 =⋅+⋅+⋅+⋅=x
A csoportok közötti négyzetösszeg:
90
( ) 6,6869)6256,627(5)625638(5)625594(5)6254,640(5 2222
1
2=−⋅+−⋅+−⋅+−⋅=−∑
=
r
i
ii xxn
A csoportokon belüli négyzetösszegek az egyes csoportokhoz tartozó szórások segítségével könnyen számítható, a szórás képlete:
1
)( 2
1
−
−=∑
=∗
n
xx
s
n
jiij
, a feladatunk, hogy a gyök alatt lévő tört számlálóját előállítsuk minden
csoport esetében a már kiszámolt szórások segítségével � )1()(22
1
−⋅=− ∗
=∑ nsxx
n
jiij
A beszállító csoporton belüli négyzetösszege így: 33938,5 B beszállító: 11464 C beszállító: 19848,3 D beszállító: 26283,5 Ez összesen: 91534,3 Minden rendelkezésre áll a táblázatunkhoz, és a végső próba elvégzéséhez:
Négyzetösszeg neve
Négyzet-összegek
Szabad-ságfok
Szórás becslése
F érték p-érték
Csoportok közötti *
6869,6 4-1=3 sk2=2289,9 sk
2/sb2=
0,4 p
Csoporton belüli **
91534,3 20-4=16 sb2=5720,9 - -
Teljes 98403,955 20-1=19 - - - α=5% DFszámláló=3 DFnevező=16 Fkrit=3,24 Mivel Fsz=0,4<Fkrit=3,24 � H0-t elfogadjuk 95%-os megbízhatósági szinten, azaz a beszállítóktól származó próbakockák minősége (nyomószilárdsági adatai) között nincs különbség. 14. Egy kutatás során azt vizsgálták, hogy az üzleti környezetet hogyan ítélik meg az egyes
vállalkozások vezetői. A kérdőíves vizsgálat során a vállalkozások mérete alapján 3 csoportba (A, B, C) sorolták a megkérdezett vezetőket, akik válaszait egy 100 pontos skálán értékelték. Az értékelési skálán kapott pontszámok normális eloszlásúnak tekinthetők. A vizsgálat során mindhárom kategóriában 8 vállalkozást kérdeztek meg.
91
Vállalkozás méret A. Kis- és mikrovállalkozások
B. Közepes vállalatok C. Nagyvállalatok
45 63 62 39 66 65 52 61 61 43 68 74 51 72 69 43 64 66 47 58 70 48 60 69
Átlag 46 64 67 Korrigált tap. szórás 4,375 4,567 4,342
Vizsgálja meg, hogy a vállalatméret szerinti csoportok között van-e eltérés a kapott pontszámok között! Megoldás: A példa kérdése az átlagpontszámok összevetésére irányul. Több mintáról, illetve mintán belüli csoportokról van szó, így a várható érték összehasonlítása egyszeres osztályozású variancia-analízissel végezhető el. A variancia, mint próba elvégzéséhez előfeltétel, a vizsgált jellemző normalitása, valamint az alapsokasági szórások egyezősége. Az előbbi feltételről szól a példa, az utóbbiról nem. Ezért a variancia-analízis elvégzése előtt a szórások egyezését is vizsgálni szükséges. Ehhez Cohran-próbát választhatunk, mivel a csoportokon belül a mintaelemek száma azonos. A példa megadta a csoportok átlagát és szórását, így azokat nem kell most kiszámolni. Cohran-próba H0: az elméleti szórások nem különböznek H1: a legnagyobb szórás (2. részminta, a B csoport) különbözik a többitől α=0,05 DF=n-1=8-1=7 r=3 gkr=0,68 smax*
2=20,857
gs
s s sr=
+ + +max
...
2
12
22 2
gsz=20,857/(19,143+20,857+18,857) =0,354 A számított g érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadjuk H0-t, vagyis az alapsokasági szórások megegyezőeknek tekinthetők. Variancia-analízis: H0: µA=µB =µC H1: legalább az egyik várható érték eltér a többitől
92
A főátlag: 59 pont Belső szórás:
( )∑∑= =
−r
i
n
j
iij
i
xx1 1
2
Ennek kiszámítását most a csoportok megadott szórásainak „visszafejtésével” végezzük el. ( ) ( ) ( ) ( ) 4124,342 4,567 4,3757)18()18()18( 2222*2*2* =++⋅=⋅−+⋅−+⋅−= CBA sssSSB
sb2= 412/(24-3) = 19,619
Külső szórás:
( )∑=
−r
i
ii xxn1
2
2064)5967(8)5964(8)5946(8 222 =−⋅+−⋅+−⋅=SSK sk
2= 2064/(3-1)= 1032 Az Fsz számított értéke: Fsz = sk
2/sb2 = 52,6
Az F eloszlás szerinti kritikus érték meghatározása: α=0,05 A számláló szabadságfoka: 3-1=2 A nevező szabadságfoka: 24-3=21 A kritikus érték: Fkr=3,47 Döntés: Mivel Fsz>>F kr, a H0 nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz az átlagok ill. legalább egy átlag szignifikánsan különbözik a többitől. (Itt ez értelemszerűen a kis- és mikrovállalkozások csoportja.) Vagyis az üzleti környezet megítélése a különböző méretű vállalkozások vezetői körében eltérőnek tekinthető. 15. Egy kisváros vasútállomásáról négy irányba indulnak félóránként a vonatok.
Annahegyre (A), Boglárkavárra (B), Csengevölgybe (C), és Dórafalvára (D). A délutáni csúcsidőszakban mind a négy irányba megvizsgáltak 5-5 vonatot, és feljegyezték az utasok számát. Az eredmények:
Célállomás Az utasok száma Átlag A 116 104 102 110 98 106 B 120 104 96 112 88 104 C 105 104 96 101 99 101 D 108 122 112 114 124 116 Összesen 106,75
Vizsgáljuk meg 5% szignifikancia-szinten, hogy a négy városba utazók száma tekinthető-e egyezőnek? Megoldás:
93
A feladatunk a sokaságok várható értékeinek összehasonlítása. Ehhez az egyszeres-osztályozású variancia-analízist használjuk. Ennek azonban az a feltétele, hogy az ismeretlen alapsokasági szórások egyenlők legyenek, így végezzünk el először egy Cochran-próbát ennek igazolására!
22220 : DCBAH σσσσ ===
1H :valamelyik alapsokasági szórás nem tekinthető a többivel egyezőnek.
Számítsuk a minták korrigált tapasztalatai szórásait!
( )n 2
ij i2 i 1
i
x xs s
n 1∗ ∗ =
−= =
−
∑, ahol ijx az i-edik csoport j-edik eleme, iX pedig az i-edik csoport
átlaga (lásd táblázat). A négy csoportban rendre:
071,74
)10698(...)106104()106116( 222
=−++−+−=∗As
649,124
)10488(...)104104()104120( 222
=−++−+−=∗Bs
674,34
)10199(...)101104()101105( 222
=−++−+−=∗Cs
782,64
)116124(...)116122()116108( 222
=−++−+−=∗Ds
A Cochran próba szabadságfoka, DF=n-1, ahol n az egy csoportban lévő minták elemszáma, most DF=4. Mivel 4 osztályunk van, az 5% szignifikancia szinthez tartozó táblából keressük ki a megfelelő értékét DF=4, r=4. gkrit. =0,63. Számoljuk a próbastatisztikát!
2max
2 2 2 2A B c D
sg
s s s s∗ ∗ ∗ ∗=+ + +
, így 2
szám 2 2 2 2
12,649g 0,5937
7,071 12,649 3,674 6,782= =
+ + +
Egybevetve a két értéket, azt tapasztaljuk, hogy szám kritg g< (0,5937<0,63), így a
nullhipotézist elfogadjuk, 5%-os szignifikancia-szinten az alapsokasági szórások egyenlőnek tekinthetőek. Rátérhetünk a variancia-analízisre.
0 A B C DH : µ = µ = µ = µ
H1: A várható értékek nem egyeznek Vegyük fel az ANOVA-táblát!
94
Négyzetösszeg
neve Négyzet-összegek
Szabad-ságfok
Szórás becslése
F érték p-érték
Csoportok közötti *
( )∑=
−r
i
ii xxn1
2
r-1 sk2 sk
2/sb2 p
Csoporton belüli **
( )∑∑= =
−r
i
n
j
iij
i
xx1 1
2
n-r sb2 - -
Teljes ( )∑∑= =
−r
i
n
jij
i
xx1 1
n-1 - - -
A csoportok közötti eltérés-négyzetösszeg, ahogyan a képletből is látható, a csoportátlagok négyzetes eltérése a főátlagtól, súlyozva a csoport elemszámával.
( ) ( )r r2 2
i ii ii 1 i 1
SSK n x x n x x= =
= − = −∑ ∑
Helyettesítsünk be! [ ] 75,633)75,106116()75,106101()75,106104()75,106106(5 2222 =−+−+−+−=SSK
(Figyeljünk arra, hogy nem a szórást számoljuk, hanem az átlagtól vett négyzetes eltérést, ezért nem osztunk le a minta elemszámával!).
Az SSB számításához érdemes a képlet jelentését átgondolni. ( )inr 2
iiji 1 j 1
x x= =
−∑∑ . Minden
mintaelem négyzetes eltérését vesszük a saját csoportátlagától, majd ezeket csoporton belül
összegezzük ( ( )in 2
iijj 1
x x=
−∑ tag), majd az így –külön-külön minden csoportban- kapott
négyzetösszegeket ismét összegezzük (r
i 1=∑ tag). Idézzük csak fel a csoporton belüli szórás
képletét!
( )n 2
ij ii 1
i
x xs
n 1∗ =
−=
−
∑, rendezzük át:
)1()(22
1
−=− ∗
=∑ nsxx i
n
iiij
Azaz a Cochran-próbához már kiszámolt korrigált tapasztalati szórás „visszafejtésével” megkapjuk SSB egy-egy tagját minden egyes csoportra. Nincs is más dolgunk, mint az így minden csoportban kiszámolt SSb-tagokat összegezni. Általános képletnek a következő írható fel:
∑∑∑=
∗
= =
−=−r
ii
r
i
n
jiij nsxx
i
11
2
1
)1()(2
95
Ha a csoportok elemszáma azonos, a képlet még tovább egyszerűsödik: r
2i i
i 1
SSB (n 1) s∗
=
= − ∑ !
A biztos számolás érdekében tekintsük át mégegyszer az egyenlet jobb oldalát. Vesszük a már korábban kiszámolt korrigált tapasztalati szórás négyzetét, súlyozzuk a csoport elemszámával minden egyes csoportra külön-külön, majd összegezzük az így kapott tagokat. Ez lesz SSB. Behelyettesítve nem is olyan bonyolult!
96,1077782,64674,34649,124071,74 2222 =⋅+⋅+⋅+⋅=SSB Azt is tudjuk, hogy az SST=SSB+SSK (Gazdaságstatisztika, részekre bontott sokaság). Így SST=633,75+1077,96=1711,71. Határozzuk meg a szabadságfokokat! DF(SSK)=r-1, ahol r a csoportok száma, így DF(SSK)=3. DF(SSB)=n-r, ahol n valamennyi megfigyelt egyed száma, r a csoportok száma, esetünkben DF(SSB)=20-4=16. DF(SST)=DF(SSK)+DF(SSB), vagy n-1, esetünkben DF(SST)=19. A szórást a szabadságfokok segítségével becsüljük, az a megfelelő négyzetösszeg és a szabadságfok hányados
( )r 2
ii2 i 1
k
n x x633,75
s 211,25r 1 3
=
−= = =
−
∑
( )inr 2
iiji 1 j 12
b
x x1077,96
s 67,3725n r 16
= =
−= = =
−
∑∑
Végezetül számítjuk a külső és a belső szórás becsléséből az F-értéket!
135,3325,67
25,2112
2
===b
ksz s
sF
A kritikus F érték táblázatból (a szabadságfok megegyezik a becslésnél számított szabadságfokkal): kritF 3,24= .
Mivel a számított érték (3,135) < a kritikus (3,24), az adott, 5%-os szignifikancia szinten elfogadjuk a nullhipotézist, a négy városba utazók várható száma azonosnak tekinthető.
Négyzetösszeg neve
Négyzet-összegek
Szabad-ságfok
Szórás becslése
F érték p-érték
Csoportok közötti
633,758 3 211,25 3,135 p
Csoporton belüli
1077,96 16 67,3725 - -
Teljes 1711,71 19 - - -
96
16. Három vérnyomáscsökkentő gyógyszer hatását vizsgálták. A különböző gyógyszerrel kezelt betegek vérnyomását egy héten keresztül minden nap megmérték. 1%-os szignifikancia szinten van-e különbség a gyógyszerek hatásossága között?
Gyógyszer H K SZe CS P SZo V Átlag Korr. tap.
szórás A 142 127 131 137 144 139 125 135 7,4162 B 137 146 121 136 125 148 146 137 10,6771 C 128 141 129 134 133 126 126 131 5,416
Megoldás: Feladat a várható értékek összehasonlítása, egyszeres osztályozású variancia-analízissel. Előtte azonban meggyőződünk róla, hogy az alapsokasági szórások valóban egyezőek-e. Az ehhez szükséges Cochran-próba:
2220 : CBAH σσσ ==
H1: valamely szórás lényegesen különbözik a többitől. 1%-os szignifikancia szinten a kritikus g érték: gkrit=0,77 (r az osztályok száma 3, a DF szabadságfok n-1, azaz 6).
Próbastatisztikánk: 2 2max
2 2 2 2 2 2A B c
s 10,6671g 0,5748
s s s 7,4162 10,6671 5,416∗ ∗ ∗= = =+ + + + +
Megvizsgálva a két értéket, azt tapasztaljuk, hogy szám kritg g< (0,5748<0,77), így a
nullhipotézist elfogadjuk, 1%-os szignifikancia-szinten, tehát az alapsokasági szórások egyenlőnek tekinthetőek. Rátérhetünk az ANOVA-próbára. Az ANOVA-próba hipotézispárja:
0 A B CH :µ = µ = µ ,
H1: Valamelyik várható érték lényegesen különbözik a többitől. r
2 2 2 2i i
i 1
SSB (n 1) s 6(7,4162 10,6771 5,416 ) 1190∗
=
= − = + + =∑ , ahol 2is∗ az i-edik osztály
elemeinek korrigált tapasztalati szórása. Határozzuk meg a főátlagot, ami nem más, mint a csoportátlagok súlyozott átlaga:
33,13421
1317137713571 =⋅+⋅+⋅=⋅
=∑
=
n
xn
x
r
jii
ahol in az i-edik osztály elemszáma, iX ugyanezen osztály elemeinek átlaga, n pedig
valamennyi elem száma.
( ) ( )r r2 2
i ii ii 1 i 1
2 2 2
SSK n x x n x x
7 (135 134,333) (137 134,333) (131 134,333) 130,666
= =
= − = − =
− + − + − =
∑ ∑,
97
Tudjuk, hogy SST=SSB+SSK, így SST=130,66+1190=1320,66 Szükségünk lesz még a szabadságfokokra: DF(SSK)=r-1, ahol r a csoportok száma, így DF(SSK)=2. DF(SSB)=n-r, ahol n valamennyi megfigyelt egyed száma, r a csoportok száma, esetünkben DF(SSB)=21-3=18. DF(SST)=DF(SSK)+DF(SSB), vagy n-1, esetünkben DF(SST)=20. A négyzetösszegek és a szabadságfokok hányadosa segítségével becsülhető a szórás.
( )r 2
ii2 i 1
k
n x x130,66
s 65,33r 1 2
=
−= = =
−
∑ és
( )inr 2
iiji 1 j 12
b
x x1190
s 66,111n r 18
= =
−= = =
−
∑∑
A számított F érték e két szórásbecslés hányadosa: 988,0111,66
33,652
2
===b
ksz
s
sF .
A kritikus F érték az előbb meghatározott szabadságfokok mellett: kritF 6,01= .
Mivel Fszám<<Fkrit, hiszen látható, hogy 0,988<<6,01, így az adott szignifikancia szinten a nullhipotézist elfogadjuk, a vérnyomáscsökkentő szerek között nincs különbség. A számolás eredménye összefoglalva az alábbi ANOVA táblázatban követhető nyomon:
Négyzetösszeg neve
Négyzet-összegek
Szabad-ságfok
Szórás becslése
F érték p-érték
Csoportok közötti
130,66 2 65,33 0,988 p
Csoporton belüli
1190 18 66,111 - -
Teljes 1320,66 20 - - -
98
VI. Kétváltozós korreláció- és regresszióelemzés
1. 9 kereskedelmi vállalatnál vizsgálták az árbevétel és az eredmény közötti kapcsolatot.
Árbevétel Eredmény millió Ft
440 12 469 14 518 14 644 21 750 25 890 35 999 44 1228 55 1262 50
Ismertek továbbá az alábbi részeredmények: Részeredmények
∑ yxdd 41118
∑ 2xd 789850
∑ 2yd 2188
( )2ˆ∑ − yy
47,5
( )2ˆ∑ − yy
2135,78
a) Írja fel a lineáris regressziófüggvényt és értelmezze a b1 paramétert! b) Számítsa ki és értelmezze a regressziós becslés relatív hibáját! c) Határozza meg, hogy a bruttó árbevétel hány százalékban magyarázza az eredmény
szóródását! d) Vizsgálja meg az eredmény árbevétel-rugalmasságát az átlagos szinten! Értelmezze
az eredményt! e) Adjon konfidenciaintervallumot 95%-os megbízhatósági szinten az 1000 millió Ft-os
árbevételhez tartozó eredmény nagyságára! f) Vizsgálja mindkét tanult módszerrel, hogy a regressziófüggvény szignifikáns-e!
Megoldások:
a) y=-11,65+0,052x az árbevétel 1 mFt-os növekedése átlagosan 0,052 mFt-al emeli az eredményt
b) se=2,605mFt Ve=0,087, átlagosan 8,7%-al térnek el a megfigyelt értékek a becsült értékektől
c) R2=97,8% d) El=1,39%, az árbevétel 1%-os megváltozása az átlagérték körül, 1,39%-os változást
okoz az eredményben. e) Pontbecslés y-ra: y=-11,65+0,052*1000 = 40,35mFt
t(7,0,975)=2,36 sy=2,605*Gyök(1/9+1+(1000-800)^2/789850) = 2,808 33,72<Y(1000)<46,98
99
f) H0: β1=0 H1: β1≠0 t=0,052/0,0029=17,93 t(7;0,975)=2,36 F=2135,78/(47,5/7)=314,75 F(1,7)= 5,59 A regressziófüggvény szignifikáns.
2. 10 elemű minta alapján vizsgálták a Suzuki Sedan 1.3GL típusú gépkocsik életkora és
eladási ára közötti kapcsolatot:
Életkor (év) 3 1 6 4 4 5 0 1 7 2
Eladási ár (ezer Ft) 1720 1800 1350 1600 1500 1550 2000 1750 1300 1700
a) Határozza meg a két ismérv kapcsolatát leíró lineáris regressziófüggvényt! b) Számítsa ki a kovarianciát, a lineáris korrelációs együtthatót, a regresszióbecslés
relatív hibáját! c) Tesztelje a regressziófüggvényt 5%-os szignifikanciaszinten! d) Becsülje meg a 8 éves gépkocsik eladási árát 95%-os megbízhatósági szinten!
Megoldások: xátl = 3,3 yátl = 1627 Σx2 = 157 Σy2 = 26875900 Σx = 33 Σy = 16270
xi yi dxi dyi dxi*dyi dxi2 dyi2 y becs. yi-ybecs
ei2
3 1720 -0,3 93 -27,9 0,09 8649 1653,4 66,58 4432,91 1800 -2,3 173 -397,9 5,29 29929 1829,3 -29,34 860,86 1350 2,7 -277 -747,9 7,29 76729 1389,5 -39,54 1563,44 1600 0,7 -27 -18,9 0,49 729 1565,5 34,54 1193,04 1500 0,7 -127 -88,9 0,49 16129 1565,5 -65,46 4285,05 1550 1,7 -77 -130,9 2,89 5929 1477,5 72,50 5256,30 2000 -3,3 373 -1230,9 10,89 139129 1917,3 82,70 6839,31 1750 -2,3 123 -282,9 5,29 15129 1829,3 -79,34 6294,87 1300 3,7 -327 -1209,9 13,69 106929 1301,6 -1,58 2,52 1700 -1,3 73 -94,9 1,69 5329 1741,4 -41,38 1712,3
33 16270 0 0 -4231 48,1 404610 -0,32 32440 a.) b1 = -4231/48,1 = -87,96 b0 = 1627+87,96·3,3 = 1917,3
xy 96,873,1917ˆ −= b.) Cxy= -423,1 r = -4231/gyök(48,1·404610) = -0,959
100
se = 63,68 eFt Ve = 0,039 c.) H0: β1 = 0 H1: β1 ≠ 0 DF = 8 α=5% tkrit = 2,31 Elf. Tartomány: -2,31 – 2,31 sb = 9,18 tsz = -87,96/9,18 = -9,58 H0-t elutasítjuk. d.) sy = 63,68·gyök(1,1+22,09/48,1) = 79,52 y8 = 1213,6 eFt 1213,6-2,31·79,52<Y8< 1213,6+2,31·79,52 (1030; 1397)eFt 3. Egy egyéni vállalkozó fő tevékenységi körében teherszállítással foglalkozik.
Munkájának elemzése során 10 véletlenszerűen kiválasztott fuvar alapján vizsgálta, hogy van-e összefüggés a szállítás időtartama és távolsága között. A megfigyelés eredménye az alábbi táblázatban található.
Szállítási távolság (km) (x)
4 4 2 10 19 20 16 20 25 30
Szállítási idő (perc) (y)
10 13 8 20 27 35 22 40 45 50
a) Határozza meg a két ismérv kapcsolatát leíró lineáris regressziófüggvényt! b) Számítsa ki a lineáris korrelációs együtthatót, a regresszióbecslés relatív hibáját,
valamint a becsült paraméterek standard hibáit! c) Számítsa ki a szállítási idő rugalmasságát átlagos szinten! d) Adjon 95%-os intervallumbecsést a β1 regressziós együtthatóra! e) Tesztelje a regressziófüggvényt 5%-os szignifikanciaszinten! f) Becsülje meg a 12 km távolságra történő szállítások átlagos idejét! (95%-os szinten)
Megoldások: xátl = 15 yátl = 27
101
x y dx dy dxdy dx2 dy2 ybecs e2
4 10 -11 -17 187 121 289 10,423 0,178929 4 13 -11 -14 154 121 196 10,423 6,640929 2 8 -13 -19 247 169 361 7,409 0,349281
10 20 -5 -7 35 25 49 19,465 0,286225 19 27 4 0 0 16 0 33,028 36,33678 20 35 5 8 40 25 64 34,535 0,216225 16 22 1 -5 -5 1 25 28,507 42,34105 20 40 5 13 65 25 169 34,535 29,86623 25 45 10 18 180 100 324 42,07 8,5849 30 50 15 23 345 225 529 49,605 0,156025
Szumma 1248 828 2006 124,9566
a.) b1 = 1248/828 = 1,507 b0 = 27-1,507*15 = 4,395
xy 507,1395,4ˆ += b.) r= 1248/gyök(828·2006)= 0,9683 se= gyök(124,9566/8)= 3,952
vagy SST = 2006, r2= 0,93771 � SSE = (1-0,93771)·2006 = 124,9565 � se = 3,952
Ve = 3,952/27 = 0,1464 sb0 = 2,41 sb1 = 0,137 c.) El(y|xátl) = 1,507·15/27 = 0,837 d.) DF = 8 , α= 5% , tα/2 = 2,31 1,507 – 2,31·0,137 < β1 < 1,507 + 2,31·0,137 1,19 < β1 < 1,82 e.) H0: β1 = 0 H1: β1 ≠ 0 DF = 8 α=5% tkrit = 2,31 Elf. Tartomány: -2,31 – 2,31 sb1 = 0,137 tsz = 1,507/0,137 = 11 H0-t elutasítjuk. f.) sy = 3,952·gyök(0,1+9/828) = 1,316
102
y12 = 22,48 perc 22,48-2,31·1,316<Y12< 22,48+2,31·1,316 (19,44; 25,52) perc 4. Egy farmer a felhasznált műtrágyafajták száma alapján szeretné előrejelezni a várható
termésmennyiséget.
Felhasznált műtrágya 1 2 4 5 6 8 10
Termés [t/ha] 2 3 4 7 12 10 7
Ismertek továbbá az alábbi részeredmények:
Részeredmények Cov(xy) 7,082 sx 2,95 sy 3,42
∑ 2xd 60,86
(megj.: a szórások korrigálatlan tapasztalati szórások) a) Határozza meg a két ismérv kapcsolatát leíró lineáris regressziófüggvény
paramétereit! b) Számítsa ki a lineáris korrelációs együtthatót és a determinációs együtthatót! c) Tesztelje a regressziófüggvényt 5%-os szignifikanciaszinten! d) Becsülje meg 7 fajta műtrágya alkalmazásával a termésmennyiséget 95%-os
megbízhatósági szinten! Megoldások: xátl = 5,14 yátl = 6,43 a.)
b1 = 7·7,082/60,857= 0,815 b0 = 6,43-0,815·5,14 = 2,241 b.) r= 7,082/gyök(8,7·11,7) = 0,702 R2 = 0,7022 = 0,493 c.) H0: β1 = 0 H1: β1 ≠ 0 DF = 5 α=5% tkrit = 2,57 Elf. Tartomány: -2,57 – 2,57 SSE = 7·11,7 (1- 0,493) = 41,5233 se= gyök(41,5233/5) = 2,88 sb1 = 2,88/gyök(60,86) = 0,37 tsz = 0,815/0,37 = 2,02 H0-t elfogadjuk, nem tér el szignifikánsan β1 értéke 0-tól. A modell nem releváns.
103
d.) bár a modell nem releváns, becsüljük meg a termésmennyiséget: 2 2
1y e n 2
1i 1
(x x)1 1 (7 5,14)s s 2,88
n 7 60,86(x x)
=
− −= ∗ + = ∗ +−∑
= 287,1447,088,2 =⋅
y7 = 7,95 t/ha
7,95-2,57·1,287 < Y7 < 7,95+2,57·1,287 (4,64; 11,26)
104
VII. Döntéselmélet
1. Adott az alábbi nyereség típusú döntési mátrix:
t1 t2 t3 t4
s1 100 60 -40 -20 s2 20 70 80 60 s3 40 60 200 60 s4 -10 20 20 70
Hogyan döntene bizonytalan körülmények között? Megoldás:
1. Wald-kritérium Minden egyes stratégiánál megkeressük a legrosszabb következményt. S1 � -40 S2 � 20 S3 � 40 S4� -10 E legrosszabb következmények közül a legkevésbé rosszat választjuk, vagyis s3-at. 2. Laplace-kritérium Minden egyes tényállapot bekövetkezéséhez ugyanakkora valószínűséget kapcsolunk. P(t1)= P(t2)= P(t3)= P(t4)= ¼=0,25 Kiszámítjuk minden egyes stratégiához kapcsolódóan a következmények várható értékét.
0,25704
120
4
120
4
110
4
1)(
0,90604
1200
4
160
4
140
4
1)(
5,57604
180
4
170
4
120
4
1)(
0,25204
140
4
160
4
1100
4
1)(
4
3
2
1
=⋅+⋅+⋅+⋅−=
=⋅+⋅+⋅+⋅=
=⋅+⋅+⋅+⋅=
=⋅−⋅−⋅+⋅=
sM
sM
sM
sM
Ezek közül a legnagyobb várható értékűt választjuk, azaz s3-at.
105
3. Savage-kritérium Elmaradó haszon mátrixot készítünk, majd a Wald-kritériumot alkalmazzuk.
t1 t2 t3 t4
s1 0 10 240 90 s2 80 0 120 10 s3 60 10 0 10 s4 110 50 180 0
Kiválasztjuk minden egyes stratégiánál a legrosszabb következményeket: S1 � 240 S2 � 120 S3 � 60 S4� 180
Majd ezek közül a legkevésbé rosszat választjuk, vagyis s3-at.
2. Egy vállalkozó automatizált gyártóberendezést kíván importálni. A gép megbízható
működéséhez – többek között – egy kritikus alkatrész hibátlan működése szükséges. A szállító ajánlata szerint a berendezéssel együtt vásárolt tartalék alkatrészek ára: 10.000€/db. Egy-egy alkatrész utólagos beszerzésének a költsége viszont: 35.000€/db. A szállító adatai szerint az eddig eladott berendezések üzemeltetése során egy adott berendezés esetén legfeljebb 3 meghibásodás fordult elő. a) Hány tartalék alkatrészt vásároljon a vásárló, ha nincs információja a berendezés
megbízhatóságáról? b) Hogyan alakul a vállalkozó döntése, ha megkapja az eddig eladott 231 db.
berendezésről készült alábbi meghibásodási statisztikát.
Meghibásodott alkatrészek száma 0 1 2 3 Berendezések száma 135 56 27 13
Megoldás: Döntési mátrix készítése. 4 tényállapotunk van: 0, 1, 2, vagy 3 meghibásodás fordul elő. A stratégiák: 0, 1, 2, vagy 3 tartalék alkatrészt vásárolunk. A következmények pedig az ezzel kapcsolatos költségek.
t0 t1 t2 t3
s0 0 35000 70000 105000 s1 10000 10000 45000 80000 s2 20000 20000 20000 55000 s3 30000 30000 30000 30000
106
1. Wald-kritérium Minden egyes stratégiánál megkeressük a legrosszabb következményt.
S0 � 105000 S1 � 80000 S2 � 55000 S3� 30000
E legrosszabb következmények közül a legkevésbé rosszat választjuk, vagyis s3-at. 2. Laplace-kritérium Minden egyes tényállapot bekövetkezéséhez ugyanakkora valószínűséget kapcsolunk. P(t0)= P(t1)= P(t2)= P(t3)= ¼=0,25 Kiszámítjuk minden egyes stratégiához kapcsolódóan a következmények várható értékét.
300003000041
3000041
3000041
3000041
)(
287505500041
2000041
2000041
2000041
)(
362508000041
4500041
1000041
1000041
)(
5250010500041
7000041
3500041
041
)(
3
2
1
0
=⋅+⋅+⋅+⋅=
=⋅+⋅+⋅+⋅=
=⋅+⋅+⋅+⋅=
=⋅+⋅+⋅+⋅=
sM
sM
sM
sM
Ezek közül a legkisebb várható értékűt választjuk (mivel költségekről van szó), azaz s2-t. 3. Savage-kritérium Elmaradó haszon mátrixot készítünk, majd a Wald-kritériumot alkalmazzuk.
t0 t1 t2 t3
s0 0 25000 50000 75000 s1 10000 0 25000 50000 s2 20000 10000 0 25000 s3 30000 20000 10000 0
Kiválasztjuk minden egyes stratégiánál a legrosszabb következményeket: S0 � 75000 S1 � 50000 S2 � 25000 S3� 30000 Majd ezek közül a legkevésbé rosszat választjuk, vagyis s2-őt.
b) kérdés A tényállapotok bekövetkezési valószínűségét illetően kapunk információkat: Így P(t0)=135/231=0,5844, P(t1)=56/231=0,2424, P(t2)=0,1168, P(t3)=0,0563 Ezen valószínűségek felhasználásával számítjuk az egyes cselekvési változatok várható kilátásait, majd a legjobbat, vagyis s1-et választjuk (megint azért, mert költségekről van szó):
107
30000300000563,0300001168,0300002424,0300005844,0)(
5,21968550000563,0200001168,0200002424,0200005844,0)(
18028800000563,0450001168,0100002424,0100005844,0)(
5,225711050000563,0700001168,0350002424,005844,0)(
3
2
1
0
=⋅+⋅+⋅+⋅==⋅+⋅+⋅+⋅=
=⋅+⋅+⋅+⋅==⋅+⋅+⋅+⋅=
sM
sM
sM
sM
3. Salvador elhatározta, hogy megtakarított pénzén motelt kíván építeni, de nem tudja
még, hogy 20, 30, 40, vagy 50 szobát rendezzen-e be. Az előrelátható költségek a következők: A szobaszámtól független évi költségek:
• Tereprendezés és közművesítés: 100000 peso • Feltételezik, hogy az építményeknek és közműveknek 10 évig kell tartaniuk, és a
fix költségeket is 10 év alatt írják le, így a kezdeti tereprendezés és közművesítés költségének egy évre jutó hányada: 10 000 peso.
• Javítási és karbantartási költségek (fix költségrész) évente: 1500 peso • Éjjeli őr évente (járulékos költségekkel): 6000 peso • Egy karbantartó évente (járulékos költségekkel): 8000 peso
A fix költségek évi összege: 25500 peso. A szobák számával arányos évi költségek:
20 30 40 50 Építés, közművesítés, a szobák bebútorozása. Egy szoba költsége 40 000 peso és 10 éven keresztül azonos összeget írnak le. Különböző szobaszámok esetén:
80 000 120 000 160 000 200 000
10 szobánként egy alkalmazott: egy alkalmazott évi költsége a járulékos költségekkel együtt 6000 peso
12 000 18 000 24 000 30 000
Karbantartás és javítások szobánként évi 150 peso
3000 4500 6000 7500
Tűzbiztosítás (szobánként évi 25 peso)
500 750 1000 1250
Összesen 95 500 143 250 191 000 238750
A kivett szobák R átlagos számával arányos évi költségek: 0 10 20 30 40 50 Mosás, takarítás: 5 peso/nap/szoba 0 18000 36000 54000 72000 90000 Villany, gáz, víz: 5 peso/nap/szoba 0 18000 36000 54000 72000 90000 összesen 0 36000 72000 108000 144000 180000 Szobabér, bevételek 0 10 20 30 40 50 Bevétel 0 219000 438000 657000 876000 1095000 Ezen számok alapján meghatározták az évi bevételt különböző R és S értékek esetén. A következő táblázat tartalmazza ezeket az értékeket.
108
Nyereség (ezer pesoban kifejezve) 0 10 20 30 40 50 S=20 -121 62 245 245 245 245 S=30 -168,75 14,25 197,25 380,25 380,25 380,25 S=40 -216,5 -33,5 149,5 332,5 515,5 515,5 S=50 -264,25 -81,25 101,75 284,75 467,75 650,75 Ebben a bizonytalan helyzetben Salvador milyen kritériumot válasszon?
Megoldás: Laplace kritériuma: e kritérium szerint Salvador 1/6 valószínűséget adna R különböző értékeinek (0, 10, 20, 30, 40, 50). Ilyen körülmények között S különböző értékei esetén az alábbi valószínű nyereségeket kapná:
Valószínű nyereség
S=20 153,5 S=30 197,25 S=40 210,5 S=50 193,25
E kritérium alapján Salvador nyilván az S=40 szobaszámot választaná. Az egyenlő valószínűség hipotézise azonban sok embernek nem felel meg, bár elég sokan megelégszenek ezzel. Wald kritériuma: a legóvatosabb magatartás követése, vagyis a táblázat minden sorából a legkisebb eredményt nézzük meg, és azt a sort választjuk, amelyben az előbbi értékek közül a legnagyobbat találjuk. Salvador esetében a következőt kapjuk.
Minimum érték S=20 -121 S=30 -168,75 S=40 -216,5 S=50 -264,25
Salvador az S=20 szobaszám választása esetén biztos lehet abban, hogy veszít többet 121 000 pesónál. Ez elég pesszimista kritérium… Hurwicz kritériuma: bevezet szubjektív módon egy α optimizmus együtthatót. Legyen valamely adott sorban a legkisebb szám a, a legnagyobb pedig A. Ebben az esetben
aAH ⋅−+⋅= )1( αα értéket kell minden sor számára meghatározni. Azt a sort választjuk, amelyik a legnagyobb H értéket adja. Látjuk, hogy ha α=0, akkor Wald kritériumához jutunk, ha viszont α=1, akkor a teljes optimizmus kritériumát kapjuk. Salvador kiszámította H értékeit az α együttható különböző értékei esetén:
α=0,1 α=0,2 α=0,5 α=0,8 α=0,9 S=20 -84,40 -47,8 62 171,8 208,4 S=30 -113,85 -58,95 105,75 270,45 325,35 S=40 -143,3 -70,10 149,50 369,10 442,30 S=50 -172,75 -81,25 193,25 467,75 559,25
109
Ebben a problémában a teljesen pesszimista magatartás S=20 választásához, a teljesen optimista magatartás pedig S=50 választásához vezet. Savage kritériuma: minden R érték esetén meghatározzuk a legkedvezőbb esetet, és kivonjuk az ennek megfelelő értéket az ezen állapotra vonatkozó oszlop minden egyes eleméből. Ez a számítás megadja a különbséget a tényleges választás eredménye és a természet szándékai ismeretében legkedvezőbb választás eredménye között. Ezt a különbséget nevezik regretnek. Példánkban -121-et kell kivonni az R=0 oszlopból és 62-t az R=10 oszlopból stb.
0 10 20 30 40 50 S=20 0 0 0 -135,25 -270,50 -405,75 S=30 -47,75 -47,75 -47,74 0 -135,25 -270,50 S=40 -95,50 -95,50 -95,50 -47,75 0 -135,25 S=50 -143,25 -143,25 -143,25 95,50 -47,75 0
A regretek minimális értéke ebben az esetben S különböző értékei esetén:
Minimum regret érték S=20 -405,75 S=30 -270,50 S=40 -135,25 S=50 -143,25
Látjuk, hogy S=40 választása esetén Salvador regretje nem lehet nagyobb 135,25-nél. A választás nehézsége: Salvador az alábbi megoldások közül választhat: a) Laplace kritériuma szerint 40 szobát épít. b) Wald kritériuma szerint csupán 20 szobát épít. c) Hurwicz kritériuma szerint 20 szobát épít, ha teljesen pesszimista, és 50-et, ha teljesen optimista d) Savage kritériuma szerint 40 szobát épít. Eddig tartott a feladat megoldása. Nézzünk egy picit a feladaton túl! A kritérium kiválasztása pontosan a szabadságnak az a magasabb formája, amelyet a gazdasági élet szereplőinél megtalálunk. Minden kritérium meg kell, hogy feleljen a döntést hozó szándékainak és jellemének. Amint azt a fenti példán láttuk, a kritérium kiválasztása meghatározza a döntést, és ez a döntés különbözhet attól, hogy melyik kritériumot választjuk. Salvador nem ment volna bele a vállalkozásba, ha nem lett volna valamilyen előzetes információja arról, hogy milyen esélye van a tervezett vállalkozás sikerének. Pontosabban: ismerte azt a tényt, hogy a meglévő motelekben az utóbbi években az alábbi átlagos keresletet figyelték meg: kereslet 0 10 20 30 40 50 Valószínűség 0,01 0,09 0,20 0,30 0,30 0,10
110
Ennek következtében sokkal több támpontja volt a választáshoz. Csupán ki kellett számítania a várható nyereséget mindegyik hipotézis esetében:
12,301)50(50
676,330)40(40
22,305)1,03,03,0(25,3802,025,19709,025,1401,075,168)30(30
87,224)1,03,03,02,0(24509,06201,0121)20(20
====
=++⋅+⋅+⋅+⋅−===+++⋅+⋅+⋅−==
ES
ES
ES
ES
Ezután összehasonlította a várható értékeket. Így a legelőnyösebb megoldásnak a 40 szobás motel építése tűnik. A kritérium kiválasztása: Amint láttuk, a kritérium kiválasztása a legnehezebb kérdés, de talán a legérdekesebb is. Ami bennünket illet, úgy véljük, hogy kellőképpen pontos információk hiányában a választásnál célszerű kiszámítani a tönkremenés és a siker esélyeit. Nevezzük α-nak annak a szubjektív valószínűségét, hogy rossz eredményeket érünk el, és γ-nak annak a szubjektív valószínűségét, hogy sikert érünk el. A közbenső helyzeteknek a valószínűsége β, és egész egyszerűen: 1=++ γβα Ilyen feltételek között, ha ΣP a balszerencsés eredmények összege, I a közbenső eredmények összege és S a kielégítő eredmények összege, az
p
S
n
I
m
P ∑∑∑ ⋅+⋅+⋅ γβα
súlyozott összeg minden hipotézis esetében a várható érték szubjektív becslése, ahol m, n és p a megfelelő eredmények száma, amelyek az egyes kategóriákban előfordulnak. Az alapprobléma annak meghatározása, hogy az egyes különböző eredményeket melyik osztályba soroljuk. Térjünk vissza az elején megadott jövedelemtáblázathoz! Az első megoldás az lehet, hogy balszerencsésnek veszünk minden olyan eredményt, amely veszteségnek felel meg, vagyis ahol a táblázatban negatív érték szerepel. Ezzel szemben azt
az ellenvetést lehet tenni, hogy mivel a súlyozott átlagot vesszük, m
P∑ egyenlő például abban
az esetben, amikor S=40, a következővel:
1252
5,335,216 −=+−
abban az esetben pedig, amikor S=30, a következővel egyenlő:
75,168−=∑m
P
Tehát az az intuitív elképzelésünk alakul ki, hogy az épített szobák számával együtt nő a kockázat. Ezért inkább a második megoldást választjuk, amely abból áll, hogy csupán a táblázat első oszlopának (R=0) eredményeit tekintjük balszerencsés eredményeknek, a kis nyereséget és kis veszteséget pedig egyenértékű eredményeknek vesszük. Ez a megoldás természetesen aszimmetria alapján oda vezet, hogy az R=50 maximális keresletnek megfelelő eredményeket tekintsük kielégítő eredményeknek. Így az alábbi eloszláshoz jutunk. Vegyünk egy konkrét példát, feltéve, hogy Salvador 10%-ra becsüli a tönkremenés valószínűségét, de nem mer nagyobb valószínűséget adni 20%-nál a siker elérésének.
111
0 10 20 30 40 50 S=20 S=30 S=40 S=50
Balszerencséseredmények Közbenső
eredmények
Kielégítőeredmények
0 10 20 30 40 50 S=20 S=30 S=40 S=50
Balszerencséseredmények Közbenső
eredmények
Kielégítőeredmények
α0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1 IV.
IV. IV.
IV. IV. IV.
IV. IV. IV. IV.
IV. IV. IV. IV. IV.
IV. IV. IV. IV. IV. IV.
IV. IV. IV. IV. IV. IV.
IV. IV. IV. IV. IV. IV.
IV.
IV. IV.
III. III. III. III. III. III. II. II. I.
III. III. III. II. II. II. I. I. I. I.
I.I. I. I. I.I.II. II. II. II. II.
α0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1 IV.
IV. IV.
IV. IV. IV.
IV. IV. IV. IV.
IV. IV. IV. IV. IV.
IV. IV. IV. IV. IV. IV.
IV. IV. IV. IV. IV. IV.
IV. IV. IV. IV. IV. IV.
IV.
IV. IV.
III. III. III. III. III. III. II. II. I.
III. III. III. II. II. II. I. I. I. I.
I.I. I. I. I.I.II. II. II. II. II.
Az ábrán a legelőnyösebb döntés térképe látható: minden döntést, amely 20, 30, 40, 50 szoba építésére vonatkozik, egy szám – I., II., III. és IV. ábrázolja. Minden (α,γ) becslés pár számára le lehet olvasni a legelőnyösebb döntést. Így α=0,1; γ=0,2, tehát β=0,7, és kiszámíthatjuk, hogy
8,2382,01
75,6507,0
475,46775,10125,81
1,01
5,264)50(
2,2502,01
5,5157,0
45,5155,3325,149,335
1,01
5,216)40(
3,2292,01
25,3807,0
425,38025,19725,14
1,01
75,168)30(
4,1762,01
2457,0
4245362
1,01
121)20(
=⋅+⋅++−+⋅−=
=⋅+⋅+++−+⋅−=
=⋅+⋅⋅+++⋅−=
=⋅+⋅⋅++⋅−=
ε
ε
ε
ε
Ez a második megoldás megfelelőnek látszik a balszerencsés eredmények kategóriájára, viszont hátránynak lehet tekinteni azt, hogy két különböző kategóriába sorolja a barátunk számára azonos hasznot hozó eredményeket. Salvador optimistább, ha 20 ügyfél elutasítására számít, mint ha 10 ügyfél elutasítására számít. Logikusabb lenne tehát egy harmadik megoldást alkalmazni, amelyben balszerencsés eseményeknek tekintjük azokat, amikor
112
egyetlen ügyfél sem jelentkezik, kedvező eseményeknek pedig azt vesszük, amikor mindegyik szoba megtelik. Az eloszlást ebben az esetben az alábbi ábra mutatja be:
S=50
S=40
S=30
S=20
50403020100
Balszerencsés eredmények
Közbensőeredmények
Kielégítőeredmények
S=50
S=40
S=30
S=20
50403020100
Balszerencsés eredmények
Közbensőeredmények
Kielégítőeredmények
4. Egy könyvesbolt vezetője arról kíván döntést hozni, hogy a legújabb krimi bestsellerből hány példányt rendeljen. A krimik korábbi eladási tapasztalatára építve úgy véli, hogy 18-20 közötti darabot fog tudni értékesíteni. Minden egyes példány 3 dollárjába kerül, és 4 dollárért értékesíti azokat. Ha egyes példányokat nem tud értékesíteni, akkor a 1 dollárt visszakap az el nem adott példányok visszaküldésével. Függetlenül attól, hogy hány darabot rendel a szállítási és a kezelési költség 5 dollár. Készítsen döntési mátrixot a keresletek és megrendelések lehetséges kombinációit illetően!
Megoldás: A döntési mátrix elkészítése (nyereségmátrix dollárban):
t18 t19 t20
s18 13 13 13 s19 11 14 14 s20 9 12 15
a) Hány példányszám mellett döntsön a könyvesbolt vezetője, ha nincs információja a
keresleti szintek bekövetkezési valószínűségeit illetően? Legyen az optimizmus együttható 0,6! Wald kritérium: minden cselekvési változathoz megnézzük a legrosszabb következményt, majd a legjobbat választjuk:
ti s18 13 s19 11 s20 9
Ezek közül a legjobb a 13, tehát 18 példányt rendel az újságos. Maximax kritérium: minden cselekvési változathoz megnézzük a legjobb következményt, majd a legjobbat választjuk:
113
ti s18 13 s19 14 s20 15
A maximax kritérium értelmében 20 példányt rendel. Savage kritérium: regretmátrix készítése, majd Wald kritérium alkalmazása:
t18 t19 t20
s18 0 1 2 s19 2 0 1 s20 4 2 0
Legrosszabb következmények:
ti s18 2 s19 2 s20 4
E kritérium szerint vagy 18 vagy 19 példányt rendel az újságos. Hurwicz-kritérium:
1313)6,01(136,0)( 18 =⋅−+⋅=sϕ
8,1211)6,01(146,0)( 19 =⋅−+⋅=sϕ 6,129)6,01(156,0)( 20 =⋅−+⋅=sϕ
A Hurwicz-kritérium értelmében 18 példányt rendel. Laplace-kritérium:
12)15129(3
1)(
13)141411(3
1)(
13)131313(3
1)(
20
19
18
=++=
=++=
=++=
sM
sM
sM
A Laplace-kritérium értelmében 18 vagy 19 példányt érdemes rendelnie.
114
b) Múltbeli eladások alapján a könyvesbolt vezetője az alábbi szubjektív becsléseire alapozott valószínűségeket rendelte az egyes keresleti szintekhez. Hogyan döntsön ezen információk birtokában?
Keresleti szint Valószínűség 18 0,4 19 0,35 20 0,25 1
55,111525,01235,094,0)(
8,121425,01435,0114,0)(
131325,01335,0134,0)(
20
19
18
=⋅+⋅+⋅==⋅+⋅+⋅==⋅+⋅+⋅=
sM
sM
sM
Ennek értelmében érdemes 18 példányt rendelnie.
c) A kereskedő úgy döntött, hogy csak akkor rendel krimit, ha várhatóan 20-at el tud adni belőle. (Ha nem, akkor más típusú könyveket rendel.) Keresleti szint megítélésére gyors felmérést szokott végezni az ismerősök között. Az ismerősök által adott előrejelzés az esetek 75%-ában jelezte helyesen előre 20 könyv eladását. 19 könyv keresleténél az ismerősök 15% valószínűséggel jeleztek 20 könyvet, 18 könyv keresleténél pedig 10% valószínűséggel. A rendelések hány %-ban fog a kereskedő krimit rendelni? Hosszútávon mekkora lesz az árbevétele a krimik eladásából?
Legyen S = az ismerősök 20-at jeleztek T1 = 18-at vesznek meg T2 = 19-et vesznek meg T3 = 20-at vesznek meg P(T1), P(T2),P(T3) b. részből ismert, rendre: 0,4; 0,35 és 0,25. Most tudjuk még, hogy ha 18-at vettek, akkor az ismerősök 20-at jeleztek, P(S|T1)=0,1, ha 19-et vettek, akkor az ismerősök 20-at jeleztek P(S|T2) = 0,15 és ha 20-at vettek, akkor az ismerősök 20-at jeleztek P(S|T3) = 0,75. Nekünk éppen a fordított valószínűségek kellenek. Előtte az esetek hány %-ában jeleznek 20-at a teljes valószínűség tétele értelmében: P(S) = 0,4·0,1+0,35·0,15+0,25*0,75 = 0,28 A Bayes-tétel felhasználásával: P(T1|S) = 0,1428 P(T2|S) = 0,1875 P(T3|S) = 0,6696 Ezekkel a valószínűségekkel a nyereség: M(NY) = 13,5792
115
5. Egy építőipari vállalat fontolóra vette, hogy korábban megvásárolt telkein 6 házat építene fel. A várostervezési bizottságnak azonban be kell nyújtania egy olyan előzetes tervet, amin a telken felépíteni kívánt ingatlanok pontos száma szerepel. Ráadásul valamennyi ingatlant hat hónapos intervallumon belül és egy időben fel kell építeni. A beruházó szempontjából nem lehetséges az ingatlanok egyidejű felépítése anélkül, hogy a kereslet nem lenne fix a felépíteni kívánt lakásokra. Ha a beruházó több ingatlant épít fel, mint amire kereslet mutatkozik, akkor az építési költség feléért tudja eladni a keresleten felüli házakat. Azokat a házakat, amelyekre kereslet mutatkozik az építési költség 1,3-szorosáért tudja eladni, ami 39mFt. Tételezzük fel, hogy a kereslet nem 0. Tételezzük fel, hogy kezdetben egy bizonytalan döntési helyzettel állunk szemben, és nem ismertek a keresletek, mint tényállapotok valószínűségei. Hány ingatlant kellene építenie a beruházónak? Tegyük fel, hogy az egyes tényállapotokat illetően a következő bekövetkezési valószínűségeket becsli a beruházó múltbeli tapasztalatok alapján: 0,1; 0,2; 0,4; 0,1; 0,1; 0,1. A kockázatos döntések osztályában alkalmazható kritériumok alapján válassza ki az optimális cselekvési stratégiát! A vállalatvezetés úgy döntött, hogy csak akkor kezdi meg az építkezést, ha várhatóan 4 db-ot el tud adni megépített lakásokból. A piackutató részlegük gyorsfelmérést végzett. A részleg által adott előrejelzés az esetek 72%-ában jelezte előre helyesen a 4db lakás eladását. A piackutató részleg 1db keresleténél 5%-ban jelezte a 4db eladását, 2db keresleténél 6%-ban, 3db keresleténél 10%-ban, 5 db keresleténél 4%-ban és 6db keresleténél 3%-ban. Mekkora valószínűséggel kezdi meg az építkezést? Hosszú távon mekkora profitja lesz lakások eladásából a vállalatnak?
Megoldás: Az építési költség 30mFt. Így azokat a házakat, amelyekre nem volt előzetes kereslet, 15mFt-ért tudja eladni. Először a döntési mátrixot kell elkészítenünk: A t1, t2, …, t6 tényállapotok azt mutatják, hogy 1, 2, …, 6 ház iránt van-e előzetesen kereslet. Az s1, s2, …, s6 cselekvési stratégiák pedig azt mutatják, hogy 1, 2, …, 6 ház építése mellett dönt a beruházó. t1 t2 t3 t4 t5 t6
s1 9 9 9 9 9 9 s2 -6 18 18 18 18 18 s3 -21 3 27 27 27 27 s4 -36 -12 12 36 36 36 s5 -51 -27 -3 21 45 45 s6 -66 -42 -18 6 30 54 Bizonytalan döntési helyzet:
116
Wald kritérium:
t1 t2 t3 t4 t5 t6s1 9 9 9 9 9 9s2 -6 18 18 18 18 18s3 -21 3 27 27 27 27s4 -36 -12 12 36 36 36s5 -51 -27 -3 21 45 45s6 -66 -43 -18 6 30 54
Maximax kritérium:
t1 t2 t3 t4 t5 t6s1 9 9 9 9 9 9s2 -6 18 18 18 18 18s3 -21 3 27 27 27 27s4 -36 -12 12 36 36 36s5 -51 -27 -3 21 45 45s6 -66 -42 -18 6 30 54
Savage kritérium: A regret mátrixra alkalmazott Wald kritérium: s3 stratégia
t1 t2 t3 t4 t5 t6s1 0 -9 -18 -27 -36 -45s2 -15 0 -9 -18 -27 -36s3 -30 -15 0 -9 -18 -27s4 -45 -30 -15 0 -9 -18s5 -60 -45 -30 -15 0 -9s6 -75 -60 -45 -30 -15 0
Hurwicz kritérium: (legyen az optimizmus együttható 0,85):
9915,0985,0)( 1 =⋅+⋅=sϕ
4,14)6(15,01885,0)( 2 =−⋅+⋅=sϕ
8,19)21(15,02785,0)( 3 =−⋅+⋅=sϕ
2,25)36(15,03685,0)( 4 =−⋅+⋅=sϕ
117
6,30)51(15,04585,0)( 5 =−⋅+⋅=sϕ
36)66(15,05485,0)( 6 =−⋅+⋅=sϕ
Ez alapján az s6 az optimális stratégia. Ha az optimizmus együttható 0,625-nél nagyobb, akkor az s6 stratégia lenne a nyerő, egyébként s1-et választja a döntéshozó.
54 (1 )( 66) 9
120 75
0,625
α ∗ + − α − ≥α ≥
α ≥
Laplace kritérium: Feltételezzük, hogy valamennyi tényállapot 1/6 valószínűséggel következik be. t1 t2 t3 t4 t5 t6
s1 9 9 9 9 9 9 s2 -6 18 18 18 18 18 s3 -21 3 27 27 27 27 s4 -36 -12 12 36 36 36 s5 -51 -27 -3 21 45 45 s6 -66 -42 -18 6 30 54
)(...)()( 621 tPtPtP ===
9)96(6
1)( 1 =⋅⋅=sM
14)6185(6
1)( 2 =−⋅⋅=sM
15)213274(6
1)( 3 =−+⋅⋅=sM
12)361212336(6
1)( 4 =−−+⋅⋅=sM
5)5127321245(6
1)( 5 =−−−+⋅⋅=sM
6)66421863054(6
1)( 6 −=−−−++⋅=sM
Mivel a legnagyobb várható értéke az s3 stratégia, így e kritérium értelmében ez a követendő cselekvés. Kockázatos döntések osztálya:
Keresleti szint Valószínűség 1 0,1 2 0,2 3 0,4 4 0,1 5 0,1 6 0,1
118
Maximum likelihood kritérium:
t1 t2 t3 t4 t5 t6s1 9 9 9 9 9 9s2 -6 18 18 18 18 18s3 -21 3 27 27 27 27s4 -36 -12 12 36 36 36s5 -51 -27 -3 21 45 45s6 -66 -42 -18 6 30 54
0,1 0,2 0,4 0,1 0,1 0,1
Várható érték kritérium:
2,361,051,041,034,022,011,0)( =⋅+⋅+⋅+⋅+⋅+⋅=tM Ehhez legközelebb a t3 tényállapot van. A megoldás menete ugyanaz, mint a maximum likelihood kritériumnál. Várható pénzérték kritérium:
9)( 1 =sM 6,15189,0)6(1,0)( 2 =⋅+−⋅=sM
4,17277,032,0)21(1,0)( 3 =⋅+⋅+−⋅=sM
6,9363,0124,0)12(2,0)36(1,0)( 4 =⋅+⋅+−⋅+−⋅=sM
6,0452,0211,0)3(4,0)27(2,0)51(1,0)( 5 −=⋅+⋅+−⋅+−⋅+−⋅=sM
2,13541,0301,061,0)18(4,0)42(2,0)66(1,0)( 6 −=⋅+⋅+⋅+−⋅+−⋅+−⋅=sM
A legnagyobb várható pénzértéke az s3 stratégiának van. Kockázatos döntés pótlólagos információk alapján: Z esemény: a piackutató 4db-ot jelez előre A priori valószínűségek Feltételes valószínűségek Posteriori valószínűségek
(Bayes-tétellel) 0,1 0,05
037,0136,0
05,01,0)( 1 =⋅=ztP
0,2 0,06 088,0
136,0
06,02,0)( 2 =⋅=ztP
0,4 0,1 294,0
136,0
4,01,0)( 3 =⋅=ztP
0,1 0,72 5294,0
136,0
72,01,0)( 4 =⋅=ztP
1,0)( 5 =tP 04,0)( 5 =tzP 029,0136,0
04,01,0)( 5 =⋅=ztP
1,0)( 6 =tP 03,0)( 6 =tzP 022,0136,0
03,01,0)( 6 =⋅=tzP
119
136,003,01,004,01,0721,01,04,006,02,005,01,0)( =⋅+⋅+⋅+⋅+⋅+⋅=zP
t1 t2 t3 t4 t5 t6s1 9 9 9 9 9 9s2 -6 18 18 18 18 18s3 -21 3 27 27 27 27s4 -36 -12 12 36 36 36s5 -51 -27 -3 21 45 45s6 -66 -42 -18 6 30 54
0,037 0,088 0,294 0,5294 0,029 0,022
056,2236581,012294,0)12(088,0)36(037,0)( 4 =⋅+⋅+−⋅+−⋅=sM 4 ház építése esetén várhatóan 22,056 mFt nyereségre tesz szert, amennyiben figyelembe vesszük a pótlólagos információkat.
120
VIII. Rangmódszerek alkalmazása
1. Kérjük, aláhúzással jelölje meg az alábbi tényezőpárosításokban, hogy melyik tényezőt tartja a kettő közül fontosabbnak egy feltételezett munkahely, vagy munkakör változtatás esetén.
Érdekes munkafeladatok (G) A jól végzett munka megbecsülése (K) Magas nyereségrészesedés (C) Jó viszony a vezetővel (F) Előmeneteli lehetőség (H) Érdekes munkafeladatok (G) Rendszeres prémium (B) Jó munkafeltételek (J) Ne kelljen nagyon keményen dolgozni (D) Jó viszony a munkatársakkal (E) Érdekes munkafeladatok (G) Jó munkafeltételek (J) A jól végzett munka megbecsülése (K) Jó viszony a vezetővel (F) Ne kelljen nagyon keményen dolgozni (D) Érdekes munkafeladatok (G) Rendszeres prémium (B) Magas nyereségrészesedés (C) Érdekes munkafeladatok (G) Magas nyereségrészesedés (C) Jó munkafeltételek (J) Jó viszony a vezetővel (F) Jó fizetés (A) Előmeneteli lehetőség (H) Érdekes munkafeladatok (G) Jó viszony a munkatársakkal (E) Rendszeres prémium (B) Érdekes munkafeladatok (G) Jó fizetés (A) Rendszeres prémium (B) Magas nyereségrészesedés (C) Jó fizetés (A) Jó fizetés (A) Ne kelljen nagyon keményen dolgozni (D) A jól végzett munka megbecsülése (K) Rendszeres prémium (B) Jó viszony a vezetővel (F) Előmeneteli lehetőség (H) Magas nyereségrészesedés (C) A jól végzett munka megbecsülése (K) Jó viszony a munkatársakkal (E) A jól végzett munka megbecsülése (K) Előmeneteli lehetőség (H) Jó munkafeltételek (J) Jó viszony a munkatársakkal (E) Előmeneteli lehetőség (H) Jó munkafeltételek (J) Jó viszony a munkatársakkal (E) Jó viszony a vezetővel (F) Rendszeres prémium (B) Ne kelljen nagyon keményen dolgozni (D) Rendszeres prémium (B) Rendszeres prémium (B) Jó viszony a munkatársakkal (E) Előmeneteli lehetőség (H) Rendszeres prémium (B) Jó munkafeltételek (J) Jó fizetés (A) Jó viszony a munkatársakkal (E) Magas nyereségrészesedés (C) Jó viszony a munkatársakkal (E) Jó viszony a vezetővel (F) A jól végzett munka megbecsülése (K) Ne kelljen nagyon keményen dolgozni (D) Jó fizetés (A) A jól végzett munka megbecsülése (K) Ne kelljen nagyon keményen dolgozni (D) Jó munkafeltételek (J) Előmeneteli lehetőség (H) Ne kelljen nagyon keményen dolgozni (D) Jó viszony a vezetővel (F) Ne kelljen nagyon keményen dolgozni (D) Jó viszony a munkatársakkal (E) Jó fizetés (A) Jó munkafeltételek (J) Jól végzett munka megbecsülése (K) Jó viszony a vezetővel (F) Érdekes munkafeladatok (G)
121
Jó munkafeltételek (J) Magas nyereségrészesedés (C) Jó fizetés (A) Jó viszony a vezetővel (F) Magas nyereségrészesedés (C) Ne kelljen nagyon keményen dolgozni (D) A jól végzett munka megbecsülése (K) Előmeneteli lehetőség (H) Magas nyereségrészesedés (C) Előmeneteli lehetőség (H) Érdekes munkafeladatok (G) Jó fizetés (A)
122
A
B C D E F G H J K a a2 p u
Jó fize-tés
Rend-szeres prémi-
um
Magas nyereségrészese-
dés
Ne kelljen nagyon kemé-nyen dol-
gozni
Jó viszony
a munka-társak-
kal
Jó viszony
a vezető-
vel
Érdekes munka-felada-
tok
Előme-neteli lehető-
ség
Jó munka-felté-telek
A jól végzett munka meg-
becsü-lése
A Jó fizetés
x
B Rendszeres prémium
x
C Magas nyereség-részesedés
x
D Ne kelljen nagyon keményen dolgozni
x
E Jó viszony a munkatársakkal
x
F Jó viszony a vezetővel
x
G Érdekes munkafeladatok
x
H Előmeneteli lehetőség
x
J Jó munkafeltételek
x
K A jól végzett munka
megbecsülése
x
Σ Összesen
123
2. Egy piackutató cég szeretné megállapítani, hogy nyolc különböző dvd lejátszó közül melyek elégítik ki a legjobban a vevők igényeit. E célból egy szakértői bizottság 9, a fogyasztó szempontjából lényeges jellemző szerint rangsorolja a fenti készülékeket. A kapott rangszámokat a következő táblázat tartalmazza. Hogyan lehetne egyesített rangsort készíteni, amely minden jellemzőt egybefoglalva egy általános minősítést tükröz?
Típus/jellemz ő 1. 2. 3. 4. 5. 6. 7. 8. 9. Ri
A 3 5 6 5 5 6 7 6 7 50
B 5 3 7 3 6 2 5 2 2 35
C 8 8 4 6 1 5 8 4 3 47
D 2 2 2 1 2 1 1 5 5 21
E 4 1 5 8 8 4 4 8 4 46
F 1 6 3 2 4 7 2 3 6 34
G 6 7 8 4 7 8 6 7 8 61
H 7 4 1 7 3 3 3 1 1 30
Megoldás: Először meg kell vizsgálni, hogy az egyes rangsorok csupán véletlenszerű ingadozást mutatnak, vagy szignifikáns összhang van a különböző szempontok szerint végzett rangsorolások között. Ha kimutatható ilyen összhang, akkor a rangszámok összegzése alapján készíthetünk egy olyan eredő rangsort, amely egy általános minősítést fog tükrözni. Az összhang vizsgálatára szolgál a Kendall-féle egyetértési együttható. W értékét úgy számíthatjuk, hogy a rangszámösszegek tényleges négyzetes eltéréseit elosztjuk a lehetséges maximális négyzetes eltérések összegével. Ez a hányados jellemző lesz az egyetértés vagy összhang mértékére. Ebben a példában nincs kötés, vagyis nincs rangszámegyezés.
max∆∆=W
12
)( 32
max
nnk −=∆ , esetünkben k (a döntéshozók száma) 9, n (rangsorolt
dolgok száma) 8.
5,402
)18(9
2
)1( =+⋅=+= nkR
340212
)88(9
12
)( 3232
max =−=−=∆ nnk
1146)5,4030(...)5,4047()5,4035()5,4050()( 22222
1
=−++−+−+−=−=∆ ∑=
n
ii RR
Az egyetértési együttható mértéke:
337,03402
1146
max
==∆
∆=W
Végezzük el a szignifikancia vizsgálatot! H0: nincs egyetértés, a rangszámok véletlenszerűen helyezkednek el H1: van egyetértés a rangsorolók között
124
2,21337,0)18(9)1(2 =⋅−⋅=−= Wnkszámχ
DF=n–1=8–1=7
067,142 =kritχ
Mivel 2
számχ > 2kritχ , így H0-t elvetjük, W értékében szignifikáns összhang mutatkozik.
Mindezek után elkészíthetjük a rangszámösszegek alapján az eredő rangsort, amely általános minősítést takar:
Típus Ri Eredő rangsor
A 50 7 B 35 4 C 47 6 D 21 1 E 46 5 F 34 3 G 61 8 H 30 2
Így a D, H, F, B, E, C, A, G típusú DVD lejátszók elégítik ki legjobban a vevők igényeit.
3. Egy textilgyárban a fonalcsévék homogén festésének minősítése a következőképpen történik. Az egyes festett csévéket, amelynek a színhomogenitását kell ellenőrizni 10-10 részcsévére bontják. Az így nyert részcsévéket 10 betanított és a célra alkalmas munkás értékeli színárnyalat szerint. Ha az egy csévéből származó részcsévék között az értékelők nem tudnak különbséget tenni, a festés homogénnek tekinthető és felhasználható. Ellenkező esetben selejtes a fonal. Az értékelés szemmel történik, az értékelők az eredményt rangsor formájában adják meg. A megegyező színárnyalatú részcsévék a rangszámuk átlagát kapják.
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Ri
A 5,5 6 4,5 5,5 2 8 2,5 7 5,5 4 50,5B 5,5 6 4,5 5,5 7 8 9,5 7 5,5 9 67,5C 5,5 6 9,5 5,5 7 8 6,5 7 5,5 4 64,5D 5,5 1 4,5 5,5 7 2 6,5 2,5 5,5 4 44E 5,5 6 4,5 5,5 7 5 2,5 2,5 5,5 4 48F 5,5 6 4,5 5,5 7 5 2,5 2,5 5,5 4 48G 5,5 2 4,5 5,5 2 2 6,5 2,5 5,5 4 40H 5,5 6 4,5 5,5 7 2 9,5 7 5,5 4 56,5I 5,5 6 4,5 5,5 7 5 6,5 7 5,5 9 61,5J 5,5 10 9,5 5,5 2 10 2,5 10 5,5 9 69,5
Ha szignifikáns a véleményegyezés a bírálók között, akkor feltehető, hogy az egyes részcsévék festése nem homogén. Ha a bírálók között nincs egyetértés, akkor a rangszámok csak a véletlen következtében ingadoznak, a festés tehát homogén. Vizsgálja meg, hogy homogénnek tekinthető-e a festés?
125
Megoldás: A megoldás során meghatározzuk a Kendall-féle egyetértési együtthatót, majd elvégezzük annak szignifikancia vizsgálatát. Most számolnunk kell rangszámegyezéssel, így a W számítása során figyelembe kell vennünk a kötéseket:
∑−−
∆=−∆
∆=
L
LknnkKW
)(12
1 32max
12
)( 3∑ −= d
ttL
552
)110(10
2
)1( =+⋅=+= nkR
5,965)555,69(...)555,64()555,67()555,50()( 22222
1
=−++−+−+−=−=∆ ∑=
n
ii RR
5,82)1010(12
1 31 =−=L
28)77(12
1 32 =−=L
[ ] 5,42)22()88(12
1 333 =−+−=L
5,82)1010(12
1 34 =−=L
[ ] 30)33()77(12
1 335 =−+−=L
[ ] 63)33(12
1 36 =⋅−=L
[ ] 5,10)22(2)44(12
1 337 =−+⋅−=L
[ ] 15)44()55(12
1 338 =−+−=L
5,82)1010(12
1 39 =−=L
[ ] 30)33()77(12
1 3310 =−+−=L
∑L
L =409,5
23,040958250
5,965
5,40910)1010(1012
15,965
)(12
1 3232max
=−
=⋅−−
=−−
∆=−∆
∆=∑
L
LknnkKW
126
W=0,23 az egyetértés mértékét mutatja. Meg kell, hogy állapítsuk, hogy ez az érték adott szignifikancia szinten mit jelent. Végezzük el a szignifikancia vizsgálatot 5%-os szignifikancia szinten! H0: A bírálók között nincs egyetértés (W 0-nál nagyobb értéke a véletlennek tulajdonítható) H1: A bírálók között egyetértés van (W 0-nál nagyobb értéke nem a véletlennek tulajdonítható)
7,2023,0)110(10)1(2 =⋅−⋅=−= Wnkszámχ
DF=9 9,162 =kritχ
Mivel 2számχ > 2
kritχ , így H0-t elvetjük, W értékében szignifikáns összhang mutatkozik. Így a
cséve festése az egyes bírálók szignifikáns egyetértése miatt nem tekinthető homogénnek. 4. Egy tíztagú team teammunka eredményeként kiérdemelt jutalmát, az eredményhez való
hozzájárulás arányában szeretné egymás között szétosztani. 7 kiválasztott teamtag rangsorolta a team tagjait és saját magát is. Az összegzett rangsort az alábbi táblázat tartalmazza. Hogyan lehetne eredő rangsort készíteni?
A B C D E F G R i
A 1 1 1 1 1 1 1 7
B 5 5 6 7 8 5 6 42
C 3 2 2 3 2 2 4 18
D 4 6 5 6 7 7 5 40
E 7 7 9 8 6 9 9 55
F 2 3 3 2 3 4 3 20
G 8 8 7 5 10 8 8 54
H 9 10 8 10 5 10 10 62
I 6 4 4 4 4 3 2 27
J 10 9 10 9 9 6 7 60
Megoldás: A teamtagok által készített rangsorok között az egyetértés mértékét a Kendall-féle egyetértési együtthatóval vizsgáljuk meg.
max∆∆=W
5,382
)110(72
)1( =+⋅=+= nkR
5,3428)5,3860(...)5,3818()5,3842()5,387()( 22222
1
=−++−+−+−=−=∆ ∑=
n
ii RR
5,404212
)1010(7
12
)( 3232
max =−=−=∆ nnk
85,05,4042
5,3428
max
==∆
∆=W
127
W szignifikancia vizsgálata: H0: A rangsorolók között nincs egyetértés (W 0-nál nagyobb értéke a véletlennek tulajdonítható) H1: A rangsorolók között egyetértés van (W 0-nál nagyobb értéke nem a véletlennek tulajdonítható)
55,5385,0)110(7)1(2 =⋅−⋅=−= Wnkszámχ
9,162 =kritχ
Mivel 2számχ > 2
kritχ , így H0-t elvetjük, W értékében szignifikáns összhang mutatkozik. Az
eredő rangsor: teamtag A B C D E F G H I J rangszámösszeg 7 42 18 40 55 20 54 62 27 601 eredő rangsor 1 6 2 5 8 3 7 10 4 9 A teamtagok eredő rangsora: A, C, F, I, D, B, G, E, J, H 5. Egy vállalat szociálpszichológiai vizsgálatot végeztetett 5 vezető beosztású műszaki
dolgozójával. A következő kérdésekre keressük a választ: a) Az egyéni döntések mennyiben térnek el a csoportdöntéstől? b) A csoportdöntés hogyan befolyásolja az egyéni döntést? c) Milyen a csoport hatékonysága az adott témacsoportban folytatott vita során? d) A csoporttevékenységet tekintve ki játssza az informális vezető szerepét?
A vizsgálat során 7 kiválasztott gyártmányt kellett rangsorolni előre megadott műszaki-gazdasági szempontok alapján. A gyártmányok kiválasztása úgy történt, hogy a hátrányok és előnyök közel azonosan legyenek, de az értékelésnél olyan szempontok is szerepet játszanak, amelyeket számszerűsíteni nem lehet. A vizsgálat menete: minden személy döntött a sorrendről (EED), közösen döntik el a sorrendet (CSD), a vita után minden személy egymástól függetlenül ismét rangsorolta a gyártmányokat (KED).
Kovács Kiss Nagy Szabó TóthCSD EED KED EED KED EED KED EED KED EED KED
A 1 6 2 2 1 1 1 7 1 3 3
B 2 1 1 4 2 3 3 2 3 2 2
C 3 3 3 7 7 2 2 1 2 5 5
D 4 2 4 6 6 4 4 4 5 7 7
E 5 5 5 1 3 7 7 6 7 1 1
F 6 7 7 3 4 6 6 5 6 4 4
G 7 4 6 5 5 5 5 3 4 6 6
a) Az egyéni döntések mennyiben térnek el a csoportdöntéstől?
Erre a kérdésre a Spearman-féle rangkorrelációs együttható számítása ad választ:
128
nn
dr
n
ii
s −−=∑
=3
1
261
Minden személyre ki kell számolni az EED-CSD különbséget és az alapján a rangkorrelációs együtthatót: Kovács Kiss Nagy Szabó Tóth A 5 25 1 1 0 0 6 36 2 4 B -1 1 2 4 1 1 0 0 0 0 C 0 0 4 16 -1 1 -2 4 2 4 D -2 4 2 4 0 0 0 0 3 9 E 0 0 -4 16 2 4 1 1 -4 16 F 1 1 -3 9 0 0 -1 1 -2 4 G -3 9 -2 4 -2 4 -4 16 -1 1 Σd2 40 54 10 58 38
286,077
4061
3=
−⋅−=kovácsr
036,077
5461
3=
−⋅−=kissr
822,077
1061
3=
−⋅−=nagyr
035,077
5861
3−=
−⋅−=szabór
322,077
3861
3=
−⋅−=tóthr
A rangkorrelációs együtthatók mértékéből az látszik, hogy Nagy döntése áll legközelebb a csoportos döntéshez. Részben még erre a kérdésre kapunk választ, ha megvizsgáljuk a csoportdöntések és a KED közötti korrelációs együtthatókat. Kovács Kiss Nagy Szabó Tóth A -1 1 0 0 0 0 0 0 -2 4 B 1 1 0 0 -1 1 -1 1 0 0 C 0 0 -4 16 1 1 1 1 -2 4 D 0 0 -2 4 0 0 -1 1 -3 9 E 0 0 -2 4 -2 4 -2 4 4 16 F -1 1 2 4 0 0 0 0 2 4 G 1 1 2 4 2 4 3 9 1 1 Σd2 4 32 10 16 38
93,077
461
3=
−⋅−=kovácsr
429,077
3261
3=
−⋅−=kissr
129
822,077
1061
3=
−⋅−=nagyr
715,077
1661
3=
−⋅−=szabór
322,077
3861
3=
−⋅−=tóthr
b) A csoportdöntés hogyan befolyásolja az egyéni döntést?
A csoportvita hatásának az egyéni döntésre való befolyását úgy állapíthatjuk meg, hogy az EED és a KED közötti rangkorrelációs együtthatókat kiszámítjuk, és ez alapján értékeljük az egyes egyéni döntések változását, majd ismét felállítjuk a szorossági sorrendet. Kovács Kiss Nagy Szabó Tóth A 4 16 1 1 0 6 36 0 B 0 0 2 4 0 -1 1 0 C 0 0 0 0 0 -1 1 D -2 4 0 0 0 -1 1 0 E 0 0 -2 4 0 -1 1 0 F 0 0 -1 1 0 -1 1 0 G -2 4 0 0 0 -1 1 0 Σd2 24 10 0 42 0
572,077
2461
3=
−⋅−=kovácsr
822,077
1061
3=
−⋅−=kissr
177
061
3=
−⋅−=nagyr
25,077
4261
3=
−⋅−=szabór
177
061
3=
−⋅−=tóthr
A csoportvita nem befolyásolta sem Nagy, sem Tóth döntéseit, a legnagyobb változás Szabó döntéseinél van.
c) Milyen a csoport hatékonysága az adott témacsoportban folytatott vita során? A csoportvita során tanúsított hatékonyságot a Kendall-féle egyetértési együttható segítségével lehet mérni. A jelölésünk a következő: WEED: a csoportban a megbeszélés előtti egyetértés WKED: a csoportvita utáni egyetértés WEED>WKED: a vita során az egyetértésben visszafejlődés van WEED≈WKED: nincs változás WEED<WKED: a vita során fejlődés tapasztalható, meg kell vizsgálni kinek a hatására
130
Ri(EED) Ri(KED) (Ri-Rátl)2EED (Ri-
Rátl)2KED
A 19 8 1 144 B 12 11 64 81 C 18 19 4 1 D 23 26 9 36 E 20 23 0 9 F 25 27 25 49 G 23 26 9 36 SZUM 112 356
KEDEED Rnk
R ==+⋅=+= 202
)17(5
2
)1(
70012
)77(5
12
)( 3232
max =−=−=∆ nnk
16,0700
112
max
==∆
∆=EEDW
51,0700
356
max
==∆
∆=KEDW
Tehát WEED<WKED: a vita során fejlődés tapasztalható, meg kell vizsgálni kinek a hatására Végezzük el a szignifikancia vizsgálatokat! H0: A rangsorolók között nincs egyetértés (WEEd és WKED 0-nál nagyobb értéke a véletlennek tulajdonítható) H1: A rangsorolók között egyetértés van (WEEd és WKED 0-nál nagyobb értéke nem a véletlennek tulajdonítható)
8,416,0)17(5)1()(2 =⋅−⋅=−= WnkEEDszámχ
6,122 =kritχ
Mivel 2számχ (EED) < 2
kritχ , így H0-t elfogadjuk, WEED értékében nem szignifikáns α=5%
mellett.
3,1551,0)17(5)1()(2 =⋅−⋅=−= WnkKEDszámχ
6,122 =kritχ
Mivel 2számχ (KED) > 2
kritχ , így H0-t elvetjük, WKED értékében szignifikáns α=5% mellett.
Azt látjuk, hogy a korrigált egyéni döntések alapján számított együttható 5%-os α mellett már szignifikáns, vagyis a vita során határozott egyetértés alakult ki, a csoportvita után az egyéni döntések határozottan közeledtek a csoportdöntéshez.
d) A csoporttevékenységet tekintve ki játssza az informális vezető szerepét? Amit eddig láttunk:
• Nagy és Tóth ragaszkodott előzetes egyéni véleményéhez
131
• Nagy egyéni, előzetes véleményét fejezte ki legjobban a csoportdöntés • Nagy hatására a többiek véleménye közeledett az elfogadott csoportdöntéshez, sőt
Kovács ezt a véleményt teljesen magáévá tette. • Tóth ugyan ragaszkodott előzetes egyéni véleményéhez, de ez semmilyen hatással
nem volt a többiekre, korrigált döntése leginkább eltér a többiekétől. Nézzük meg, hogy a csoportos döntés és a KED alapján számítható eredő rangsor milyen mértékben egyezik meg, vagyis a két rangsor Spearman-féle rangkorrelációs együtthatóját kell kiszámolni (a KED-ben van egy kötés, de hatása nem számottevő, így elhanyagoljuk). CSD KED di di
2
A 1 1 0 0 B 2 2 0 0 C 3 3 0 0 D 4 5,5 1,5 2,25 E 5 4 1 1 F 6 7 1 1 G 7 5,5 1,5 2,25
89,077
5,661
3=
−⋅−=−KEDCSDr
Végezzük el a rangkorrelációs együttható szignifikancia vizsgálatát 5%-os szignifikancia szinten!
H0: rCSD-KED=0 H1: rCSD-KED≠0
α=0,05, a kritikus értékek: tα/2=t0,975= ±2,571
365,489,01
589,0
1
222
=−
=−−=
sssz r
nrt
Elutasítjuk a nullhipotézist, a rangkorrelációs együttható értéke szignifikáns α=5% mellett.
6. Egy lóversenyen 10 ló versenyez. A verseny előtt a bukmékerirodai sorrend és a
végeredmény látható a következő táblázatban! Határozzuk meg és értelmezzük a két rangsor közötti kapcsolat szorosságát mérő rangkorrelációs együtthatót! Végezzük el az együttható szignifikancia vizsgálatát is 5%-os szignifikancia szinten!
132
Ló neve Verseny előtti esélyek Végeredmény Táltos 2 1 Pegazus 1 2 Fekete álom 3 3 Villám 7 4 Nyalka huszár 5 5 Robi 8 6 Záróra 4 7 Mézga Géza 6 8 Lumpen 9 9 Piszkos Fred 10 10
Megoldás: Először képeznünk kell a rangszámok különbségét!
Ló neve Verseny előtti esélyek
Végeredmény Rangszámok különbsége
(di)
di2
Táltos 2 1 1 1 Pegazus 1 2 -1 1 Fekete álom 3 3 0 0 Villám 7 4 3 9 Nyalka huszár 5 5 0 0 Robi 8 6 2 4 Záróra 4 7 -3 9 Mézga Géza 6 8 -2 4 Lumpen 9 9 0 0 Piszkos Fred 10 10 0 0
83,0990
1681
101000
2861
61
31
2
=−=−
⋅−=−
⋅−=
∑=
nn
dr
n
ii
s
Erős kapcsolat van a két rangsor között. Az együttható szignifikancia vizsgálata:
H0: rs=0 H1: rs≠0
α=0,05, a kritikus értékek: tα/2=t0,975 (DF=8)=±2,306
21,4071,583,083,01
883,0
1
222
≈⋅=−
=−−=
sssz r
nrt
Mivel a számított érték kívül esik az elfogadási tartományon, így a nullhipotézist elutasítjuk, a rangkorrelációs együttható használható a két változó közötti kapcsolat jellemzésére.
133
7. Bankok és szakosított hitelintézetek különböző jellemzők szerinti toplistája 2000-ben: Bank Mérlegfőösszeg Saját tőke Jegyzett tőke OTP Bank 1 1 4 Magyar Külkereskedelmi Bank 2 3 9 CIB Bank 3 4 5 Kereskedelmi és Hitelbank 4 9 2 ABN Ambro Bank 5 5 3 Magyar Fejlesztési Bank 6 2 1 Raiffeisen Bank 7 7 7 Postabank 8 6 6 Budapest Bank 9 10 8 Általános Értékforgalmi Bank 10 8 10
Határozza meg és értékelje a rangsorolási ismérvek közötti kapcsolat szorosságát! Végezze el az együtthatók szignifikancia vizsgálatát is 1%-os szignifikancia szinten! Alakítsuk ki a három szempont szerinti eredő rangsort is! Megoldás:
Bank Mérlegfőösszeg Saját tőke
di di2
OTP Bank 1 1 0 0 Magyar Külkereskedelmi Bank 2 3 -1 1 CIB Bank 3 4 -1 1 Kereskedelmi és Hitelbank 4 9 -5 25 ABN Ambro Bank 5 5 0 0 Magyar Fejlesztési Bank 6 2 4 16 Raiffeisen Bank 7 7 0 0 Postabank 8 6 2 4 Budapest Bank 9 10 -1 1 Általános Értékforgalmi Bank 10 8 2 4
685,0990
3121
101000
5261
61
31
2
=−=−
⋅−=−
⋅−=
∑=
nn
dr
n
ii
s
Közepesen erős kapcsolat van a két rangsor között. Az együttható szignifikancia vizsgálata:
H0: rs=0 H1: rs≠0
α=0,01, a kritikus értékek: tα/2=t0,995 (DF=8)=±3,355
6578,288,3685,0685,01
8685,0
1
222
≈⋅=−
=−−=
sssz r
nrt
134
Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist elfogadjuk, a rangkorrelációs együttható nem használható a két változó közötti kapcsolat jellemzésére.
Bank Mérlegfőösszeg Jegyzett tőke di di2
OTP Bank 1 4 -3 9 Magyar Külkereskedelmi Bank 2 9 -7 49 CIB Bank 3 5 -2 4 Kereskedelmi és Hitelbank 4 2 2 4 ABN Ambro Bank 5 3 2 4 Magyar Fejlesztési Bank 6 1 5 25 Raiffeisen Bank 7 7 0 0 Postabank 8 6 2 4 Budapest Bank 9 8 1 1 Általános Értékforgalmi Bank 10 10 0 0
394,0990
6001
101000
10061
61
31
2
=−=−
⋅−=−
⋅−=
∑=
nn
dr
n
ii
s
Gyenge kapcsolat van a két rangsor között. Az együttható szignifikancia vizsgálata:
H0: rs=0 H1: rs≠0
α=0,01, a kritikus értékek: tα/2=t0,995 (DF=8)=±3,355
212,1077,3394,0394,01
8394,0
1
222
≈⋅=−
=−−=
sssz r
nrt
Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist elfogadjuk, a rangkorrelációs együttható nem használható a két változó közötti kapcsolat jellemzésére.
Bank Saját tőke Jegyzett tőke di di2
OTP Bank 1 4 -3 9 Magyar Külkereskedelmi Bank 3 9 -6 36 CIB Bank 4 5 -1 1 Kereskedelmi és Hitelbank 9 2 7 49 ABN Ambro Bank 5 3 2 4 Magyar Fejlesztési Bank 2 1 1 1 Raiffeisen Bank 7 7 0 0 Postabank 6 6 0 0 Budapest Bank 10 8 2 4 Általános Értékforgalmi Bank 8 10 -2 4
n
2i
i 1s 3
6 d6 108 648
r 1 1 1 0,345n n 1000 10 990
=
⋅⋅= − = − = − ≈
− −
∑
135
Gyenge kapcsolat van a két rangsor között. Az együttható szignifikancia vizsgálata:
H0: rs=0 H1: rs≠0
α=0,01, a kritikus értékek: tα/2=t0,995 (DF=8)=±3,355
04,1013,3345,0345,01
8345,0
1
222
≈⋅⋅=−
=−−=
sssz r
nrt
Mivel a számított érték az elfogadási tartományba esik, így a nullhipotézist elfogadjuk, a rangkorrelációs együttható nem használható a két változó közötti kapcsolat jellemzésére. Kendall-féle rangkonkordencia együttható:
Bank Mérlegfőösszeg Saját tőke Jegyzett tőke Ri
OTP Bank 1 1 4 6 Magyar Külkereskedelmi Bank
2 3 9 14
CIB Bank 3 4 5 12 Kereskedelmi és Hitelbank 4 9 2 15 ABN Ambro Bank 5 5 3 13 Magyar Fejlesztési Bank 6 2 1 9 Raiffeisen Bank 7 7 7 21 Postabank 8 6 6 20 Budapest Bank 9 10 8 27 Általános Értékforgalmi Bank
10 8 10 28
5,162
)110(3
2
)1( =+⋅=+⋅= nkRj
5,482)5,1628(...)5,1612()5,1614()5,166()( 22222 =−++−+−+−=−=∆ ∑j
jj RR
65,08910
5790
)1010(3
5,48212
)(
123232
==−⋅
⋅=−⋅
∆⋅=∆∆=
nnkW
m
A három rangsor közötti kapcsolat szorossága közepes. A W együttható szignifikancia vizsgálata:
H0: W=0 H1: W>0
Három értékelési tényező alapján tíz komplex rendszert mérünk össze a Kendall módszerrel, vagyis k=3 rangsorunk van n=10 rendszerre, DF=9. A rangkonkordencia együttható W=0,65.
55,1765,093)1(2 =⋅⋅=−= Wnkχ A táblázatban DF=9 szabadságfoknál 1%-os szignifikancia szinten a kritikus küszöbszám: 21,7. Tényleges χ2-értékünk 17,55, ami kisebb a küszöbszámnál, ezért elfogadjuk a nullhipotézist, és W=0,65 értéket nem minősítjük szignifikánsnak.
136
8. A kereskedelemben kapható tejfölök minősítéséről szakértői véleményezés készült. A véleményezés szempontjai között szerepelt az ár, az érzékszervi minősítés, a különböző összetevők szerinti értékelés és a mikrobiológiai értékelés. A sokdimenziós értékelést a szakértőnk a páros összehasonlítás módszerével végezte el, amelynek eredményét az alábbi preferenciatáblázat foglalja össze:
Típus A B C D E A - 0 1 1 1 B 1 - 0 1 1 C 0 1 - 0 1 D 0 0 1 - 0 E 0 0 0 1 -
Számítsuk ki a konzisztencia mutatót! Határozzuk meg az egyéni következetesség szignifikanciáját! Transzformáljuk az eredményeket intervallumskálára!
Megoldás:
Típus A B C D E a r A - 0 1 1 1 3 1,5 B 1 - 0 1 1 3 1,5 C 0 1 - 0 1 2 3 D 0 0 1 - 0 1 4,5 E 0 0 0 1 - 1 4,5 Összesen 1 1 2 3 3 10
Rangszámegyezés van. A döntéshozó által elkövetett inkonzisztens triádok száma:
32
24
12
945
212
)12()1(2
=−⋅⋅=−−⋅−⋅= ∑annnd
4,055
721
241
33=
−−=
−−=
nn
dK
Közepes mértékű a szakértő következetessége. A szignifikancia-vizsgálat: n=5 � Képletgyűjtemény 53,1% a valószínűsége, hogy a d=3 körhármast véletlenül kaptuk. Mivel ennek a valószínűsége nem meggyőző, így egy olyan esettel állunk szemben, ahol az egyéni döntéshozóval érdemes megismételtetni a rangsorolást a páros összehasonlítás módszerével, vagy esetleg megfontolandó több döntéshozót bevonni. Súlyozás intervallumskálán
Típus A B C D E a p A - 0 1 1 1 3 0,7 B 1 - 0 1 1 3 0,7 C 0 1 - 0 1 2 0,5 D 0 0 1 - 0 1 0,3 E 0 0 0 1 - 1 0,3 Összesen 1 1 2 3 3 10
137
m=1
n
a
nm
map
5,02 +=⋅
+=
A p preferencia arányokat a standardizált normális eloszlás u értékeivé transzformáljuk, ezek az u értékek szerepelnek a táblázatunk utolsó oszlopában. Az u értékek jelentik egyúttal az intervallumskálánk skálaértékeit.
Típus A B C D E a p u Z A - 0 1 1 1 3 0,7 0,52 100 B 1 - 0 1 1 3 0,7 0,52 100 C 0 1 - 0 1 2 0,5 0 50 D 0 0 1 - 0 1 0,3 -0,52 0 E 0 0 0 1 - 1 0,3 -0,52 0 Összesen 1 1 2 3 3 10
100minmax
min⋅
−−
=ii
i
uu
uuZ
Azt látjuk, hogy a C típusú tejföl félúton helyezkedik el a skála két végpontján lévő (A és B, valamint D és E) tejfölökkel szemben. 9. A kereskedelemben kapható tejfölök minősítéséről szakértői véleményezés készült. A
véleményezés szempontjai között szerepelt az ár, az érzékszervi minősítés, a különböző összetevők szerinti értékelés és a mikrobiológiai értékelés. A sokdimenziós értékelést a 3 szakértő a páros összehasonlítás módszerével végezte el. A szakértők egyéni preferencia táblázata alapján elkészített aggregált preferenciatábla az alábbi:
Típus A B C D E A - 2 2 3 3 B 1 - 2 3 3 C 1 1 - 2 3 D 0 0 1 - 2 E 0 0 0 1 -
Számítsuk ki az egyetértési együtthatót, amelynek alapja a páros összehasonlítások módszere! Megoldás:
32
3
2=
=
m
10232
2345
!3!2
!5
2
5
2=
⋅⋅⋅⋅⋅=
⋅=
=
n
5∑ =γ
52∑ =γ
138
2010353522
2 =⋅+⋅−=
+−=Γ ∑ ∑
nmm γγ
33,01103
2021
22
2 =−⋅⋅=−
Γ=nm
ν
Látjuk, hogy a döntéshozók között nem túl erős véleményegyezés van. A bírálók együttes véleményére alapozott rangsor:
Típus A B C D E a r A - 2 2 3 3 10 1 B 1 - 2 3 3 9 2 C 1 1 - 2 3 7 3 D 0 0 1 - 2 3 4 E 0 0 0 1 - 1 5
10. Tegyük fel, hogy egy adott állásinterjúra jelentkező 10 jelöltet 4 vezető bírált, és a
bírálat eredményeképpen az alábbi rangsorok születtek
Vezetők A jelentkezők rangszámai A B C D E F G H I J
X 1 2,5 2,5 4 6 6 6 8 9,5 9,5 Y 3 3 3 1 7 5 6 9 9 9 Z 2 4,5 1 3 8,5 4,5 6 7 8,5 10 V 4 1 2 6 4 4 8 9,5 7 9,5
Számítsuk ki az egyetértés mértékét, végezzük el a szignifikancia vizsgálatot! Számítsuk ki az X és Y, valamint a Z és V vezetők rangsora közötti rangkorreláció mértékét, és végezzük el azok szignifikancia vizsgálatát is! (α=5%) Megoldás: Minden vezető által kialakított rangsorban van kötés, ezt majd figyelembe kell vennünk a W számításakor. k=4 n=10
Vezetők A jelentkezők rangszámai A B C D E F G H I J
X 1 2,5 2,5 4 6 6 6 8 9,5 9,5 Y 3 3 3 1 7 5 6 9 9 9 Z 2 4,5 1 3 8,5 4,5 6 7 8,5 10 V 4 1 2 6 4 4 8 9,5 7 9,5 Ri 10 11 8,5 14 25,5 19,5 26 33,5 34 38
222
)110(4
2
)1( =+⋅=+⋅= nkRi
139
1078)2238(...)225,8()2211()2210()( 22222 =−++−+−+−=−=∆ ∑j
jj RR
A korrekciós tényezők:
312
)33()22(2
12
)( 333
=−+−⋅=−
=∑
dX
ttL
412
)33(2
12
)( 33
=−⋅=−
=∑
dY
ttL
112
)22(2
12
)( 33
=−⋅=−
=∑
dZ
ttL
5,212
)33()22(
12
)( 333
=−+−=−
=∑
dV
ttL
5,105,2143 =+++=∑L
L
8435,01278
1078
5,104)1010(412
11078
)(12
1 3232
==⋅−−⋅⋅
=⋅−−⋅⋅
∆=∑
L
LknnkW
Erős véleményegyezés mutatkozik a vezetők között. Végezzük el a szignifikancia vizsgálatot!
H0: W=0 H1: W>0
Négy vezető tíz pályázót mérünk össze a Kendall módszerrel, vagyis k=4 rangsorunk van n=10 jelöltre, DF=9. A rangkonkordencia együttható W=0,8435
366,308435,094)1(2 =⋅⋅=−= Wnkχ A táblázatban DF=9 szabadságfoknál 5%-os szignifikancia szinten a kritikus küszöbszám: 16,919. Tényleges χ2-értékünk 30,366, ami nagyobb a küszöbszámnál, ezért elutasítjuk a nullhipotézist, és W=0,8435 értéket szignifikánsnak tekintjük. Számítsuk ki a rangkorrelációs együtthatókat! A kötéseket itt is figyelembe kell vennünk korrekciós tényezőként! Vezetők A jelentkezők rangszámai
A B C D E F G H I J X 1 2,5 2,5 4 6 6 6 8 9,5 9,5 Y 3 3 3 1 7 5 6 9 9 9 di -2 -0,5 -0,5 3 -1 1 0 -1 0,5 0,5
di2 4 0,25 0,25 9 1 1 0 1 0,25 0,25
140
892,0157159
141
8)1010(6
16)1010(
6
1
177)1010(6
1
2)(6
12)(
6
1
)()(6
1
33
3
33
23
=⋅
=
−−⋅
−−
−−−=
−−⋅
−−
−+−−=
∑
Yx
iiYx
s
TnnTnn
dTTnnr
3== Xx LT
4== YY LT Végezzük el a rangkorrelációs együttható szignifikancia vizsgálatát 5%-os szignifikancia szinten!
H0: rs=0 H1: rs≠0
α=0,05, a kritikus értékek: tα/2=t0,975= ±2,306
58,5892,01
8892,0
1
222
=−
=−−=
sssz r
nrt
Mivel a számított érték az elutasítási tartományba esik, így a nullhipotézist elutasítjuk, azaz a rangkorrelációs együttható különbözik 0-tól, valós kapcsolat van a két rangsor között.
Vezetők A jelentkezők rangszámai
A B C D E F G H I J Z 2 4,5 1 3 8,5 4,5 6 7 8,5 10
V 4 1 2 6 4 4 8 9,5 7 9,5
di -2 3,5 -1 -3 4,5 0,5 -2 -2,5 1,5 0,5
di2 4 12,25 1 9 20,25 0,25 4 6,25 2,25 0,25
632,0160163
102
5)1010(6
12)1010(
6
1
5,595,3)1010(6
1
2)(6
12)(
6
1
)()(6
1
33
3
33
23
=⋅
=
−−⋅
−−
−−−=
−−⋅
−−
−+−−=
∑
VZ
iiVZ
s
TnnTnn
dTTnnr
1== ZZ LT
5,2== VV LT
Közepes kapcsolat van a Z és a V vezető rangsora között. Végezzük el a rangkorrelációs együttható szignifikancia vizsgálatát 1%-os szignifikancia szinten!
141
H0: rs=0 H1: rs≠0
α=0,05, a kritikus értékek: tα/2=t0,975= ±2,306
3077,2632,01
8632,0
1
222
=−
=−−=
sssz r
nrt
Mivel a számított érték az elutasítási tartományba esik, így a nullhipotézist elutasítjuk, azaz a rangkorrelációs együttható különbözik 0-tól, valós kapcsolat van a két rangsor között.
142
IX. Felhasznált irodalmak
� Ay János – Kupcsik József: Általános statisztika példatár. Közgazdasági és Jogi
Könyvkiadó, Budapest, 1961 � Denkinger Géza: Valószínűségszámítási gyakorlatok, Tankönyvkiadó, Budapest,
1977 � Gáspár László – Temesi József: Lineáris programozási gyakorlatok, Nemzeti
Tankönyvkiadó Rt., Budapest, 1999 � Hunyadi László – Vita László: Statisztika közgazdászoknak. Központi Statisztikai
Hivatal, Budapest, 2002 � Juhász Györgyné – Sándorné Kriszt Éva: Statisztika II. távoktatással (főiskolai
jegyzet). Távoktatási Universitas Alapítvány, 2002 � Kaufmann, A. –Faure, R.: Bevezetés az operációkutatásba, Műszaki Könyvkiadó,
Budapest, 1969 � Kerékgyártó Györgyné – Mundruczó György – Sugár András: Statisztikai
módszerek és alkalmazásuk a gazdasági, üzleti elemzésekben. Aula kiadó, Budapest, 2001
� Kindler József – Papp Ottó: Komplex rendszerek vizsgálata, Műszaki Könyvkiadó, Budapest, 1977
� Korpás Attiláné dr. (szerk.): Általános statisztika II., Nemzeti Tankönyvkiadó, Budapest, 2002
� Sincich, T.: Statistics by Example, Fourth Edition, Dellen Publishing Company, San Fransisco, 1990
� Spiegel, M. R. : Statisztika, Elmélet és gyakorlat, Schaum-könyvek, Panem – McGraw-Hill, Budapest, 1995
� Solt György: Valószínűségszámítás. Műszaki Könyvkiadó, Budapest, 1973 � Szabó Gábor Csaba – Szűts István: Matematikai statisztika példatár I-II.,
Tankönyvkiadó, Budapest, 1987.
top related