Jan Rusinek 50 zadań ze statystyki matematycznej dla studentów ZARZĄDZANIA z rozwiązaniami UWAGA! Ten tekst jest w trakcie przygotowania i sprawdzania. Może zawierać blędy. Jest sukcesywnie poprawiany i umiesz- czany pod aktualną datą! Autor będzie wdzięczny za uwagi: [email protected]Obecna data 1.12.2018
95
Embed
zadań ze statystyki matematycznej dla studentów ... Wstęp Zbiorek ten zawiera zadania ze statystyki matematycznej wybra-ne z zadań przerabianych na zajęciach, zadań domowych
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Jan Rusinek
50zadań ze statystyki matematycznej dla
studentów
ZARZĄDZANIAz rozwiązaniami
UWAGA!
Ten tekst jest w trakcie przygotowania i sprawdzania.Może zawierać błędy. Jest sukcesywnie poprawiany i umiesz-czany pod aktualną datą! Autor będzie wdzięczny za uwagi:
Zbiorek ten zawiera zadania ze statystyki matematycznej wybra-ne z zadań przerabianych na zajęciach, zadań domowych i egzamina-cyjnych na studiach drugiego stopnia kierunku zarządzanie w Wyż-szej Szkole Menedżerskiej w Warszawie. Część rachunków jest wyko-nana przy pomocy darmowego programu calc z pakietu OpenOffice.W zadaniach, w których trzeba samodzielnie obliczać wartości śred-nie i wariancje, próbki są bardzo niewielkiej liczności. Oczywiście wpraktyce używa się znacznie większych próbek. Chodzi jednak o to,aby poznać metody, nie tracąc czasu na żmudne (nawet jeśli używamykomputera, to samo wpisanie danych z dużej próbki zajmuje sporoczasu) obliczenia.
Mam nadzieję, że zbiorek ten pomoże studentom w opanowaniutego przedmiotu i w przygotowaniu się do egzaminu.
4
WZORY I OZNACZENIAµ – wartość średniaσ – odchylenie standardowen – liczba próbk – liczba sukcesów w n próbachx = 1
n
∑n
i=1 xi – średnia z próby
s2 = 1n−1
∑n
i=1(xi − x)2 – wariancja z próby
s =√s2 – odchylenie standardowe z próby
s√n– błąd standardowy
u(p) – p-ty kwantyl rozkładu normalnego N(0, 1)t(p, j) – p-ty kwantyl rozkładu Studenta o j stopniach swobodyχ2(p, j) – p-ty kwantyl rozkładu χ2 o j stopniach swobodyF(p, i, j) – p-ty kwantyl rozkładu Snedecora o i, j stopniach swobodyDnobl – statystyka testowa dla rozkładu Kołmogorowadn(p) – p-ty kwantyl statystyki Dn Kołmogorowak(p, i, j) – wartość krytyczna rozkładu liczby seriiWzór na dystrybuantę rozkładu jednostajnego na przedziale [a; b].
F (x) =
{0 dla x < a,x−ab−a dla a ¬ x ¬ b,1 dla x > b.
5
A) PRZEDZIAŁY UFNOŚCI DLA ŚREDNIEJ
Model A1. Rozkład normalny, znane σ.
P = [x− l;x+ l], l = u(1− α2 )σ√n.
Model A2. Rozkład normalny, nieznane σ.
P = [x− l;x+ l], l = t(1− α2 , n− 1)s√n.
Model A3. Rozkład dowolny, nieznane σ, n 30.
P = [x− l;x+ l], l = u(1− α2 )s√n.
6
B) PRZEDZIAŁY UFNOŚCI DLA FRAKCJI ELEMENTÓWWYRÓŻNIONYCH
Model B1. Raczej duża próba (n 30).
P =[k
n− l;k
n+ l], l = u
(1− α2
)√ kn
(1− k
n
)n
.
UWAGA. Można też stosować nieco dokładniejszy, ale bardziej skomplikowanywzór
P =
[u(1− α2 )
2 + 2k
2(n+ u(1− α2 )2)− l;
u(1− α2 )2 + 2k
2(n+ u(1− α2 )2)+ l
], l =
u
√u(1−α2 )
2
4 + k(n−k)n
n+ u(1− α2 )2.
7
C) PRZEDZIAŁY UFNOŚCI DLA ODCHYLENIASTANDARDOWEGO
Model C1. Rozkład normalny.
P =
[s
√n− 1
χ2(1− α2 , n− 1); s
√n− 1
χ2(α2 , n− 1)
].
Model C2. Rozkład normalny, duża próba (n 30).
P =
[s√2(n− 1)
√2n− 3 + u(1− α2 )
;s√2(n− 1)
√2n− 3− u(1− α2 )
].
8
PRZEDZIAŁY UFNOŚCI DLA KWANTYLIPróba powinna być duża (n 30 Ustawiamy próbę w kolejności rosnącej: x1 ¬x2 ¬ · · · ¬ xn. Wtedy przedziąl ufności dla kwantyla rzędu p (0 < p < 1) napoziomie ufności 1− α wynosi
[xkl ;xkr
],
gdziekl = całkowite zaokrąglenie liczby np− u(1− α2 )
√np(1− p),
kr = całkowite zaokrąglenie liczby np+ u(1− α2 )√np(1− p).
W szczególności przedział ufności dla mediany wynosi[xkl ;xkr
],
gdzie
kl = całkowite zaokrąglenie liczby n2 −u(1−α2 )2
√n,
kr = całkowite zaokrąglenie liczby n2 +u(1−α2 )2
√n.
9
MINIMALNA LICZNOŚĆ PRÓBY
Model M1. Przy wyznaczaniu przedziału ufności [x− l;x+ l] dla wartościśredniej, rozkład normalny, znane σ.
n
(u(1− α2
)σ
l
)2.
Model M2. (Procedura Steina) Przy wyznaczaniu przedziału ufności[x− l;x+ l] dla wartości średniej, rozkład normalny nieznane σ.
n (t(1− α2 , n0 − 1
) s0l
)2 n0 − 1n0
+ 1,
gdzie n0 liczność wstępnej próby,
x0 =1n0
n0∑i=1
xi, s20 =
1n0 − 1
n0∑i=1
(xi − x0)2.
Po dodaniu n−n0 prób przedział ufności liczymy z wzoru: P = [x− l;x+ l],gdzie l = t
(1− α2 , n0 − 1
)s0√n.
Model M3. Przy wyznaczaniu przedziału ufności[kn− l; k
n+ l]dla frakcji
elementów wyróżnionych.
n u(1− α2 )
2
4l2.
10
TESTY ZGODNOŚCI
Test χ2
χ2obl =∑ (wartość zaobserwowana− wartość spodziewana)2
wartość spodziewana.
Hipotezę odrzucamy, jeśli
χ2obl > χ2(1− α, k − 1),
k – liczba składników w sumie.
Test Kołmogorowa
Sprawdzamy, czy próbki pochodzą z rozkładu o dystrybuancie F (x). Usta-wiamy próbki w ciąg niemalejący: x1, . . . xn. Statystyka testowa
Dnobl = supx∈IR
|Sn(x)− F (x)|,
gdzie
Sn(x) =
{0 dla x < x1,indla xi ¬ x < xi+1,
1 dla x xn.Hipotezę odrzucamy, jeśli
Dnobl > dn(1− α).
Test serii
Sprawdzamy, czy dwie próbki pochodzą z takego samego rozkładu. α - po-ziom istotności, i liczebność pierwszej, a j liczebność drugiej próbki. Dwie próbkiustawiamy we wspólny ciąg rosnący. Serią nazywamy podciąg kolejnych elemen-tów z tej samej próbki. K oznacza liczbę serii. Hipotezę odrzucamy, jeśli
K ¬ k(α, i, j).
11
PARAMETRYCZNE TESTY ISTOTNOŚCI DLA ŚREDNIEJ
Hipoteza µ = µ0, W zbiór krytyczny. Hipotezę odrzucamy, gdy g ∈W
Model D1. Rozkład normalny o znanym σ.
g = uobl =x− µ0σ
√n.
W = (−∞;−u(1− α)] dla hipotezy przeciwnej µ < µ0;W = [u(1− α);∞) dla hipotezy przeciwnej µ > µ0;W = (−∞;−u(1− α2 )] ∪ [u(1−
α2 );∞) dla hipotezy przeciwnej µ 6= µ0.
Model D2. Rozkład normalny o nieznanym σ, mała próba.
g = tobl =x− µ0s
√n.
W = (−∞;−t(1− α, n− 1)] dla hipotezy przeciwnej µ < µ0;W = [t(1− α, n− 1);∞) dla hipotezy przeciwnej µ > µ0;W = (−∞;−t(1− α2 , n−1)]∪ [t(1−
α2 , n−1);∞) dla hipotezy przeciwnej µ 6= µ0.
Model D3. Rozkład dowolny o nieznanym σ. Duża próba.
g = uobl =x− µ0s
√n.
W jak w modelu D1.
12
PARAMETRYCZNE TESTY ISTOTNOŚCI DLA WARIANCJI
Hipoteza σ = σ0, W zbiór krytyczny. Hipotezę odrzucamy, gdy g ∈W .
Model E1. Rozkład normalny o nieznanych µ i σ, n ¬ 50. Mając do dys-pozycji komputer można ten model stosować i do dużych n.
g = χ2obl =(n− 1)s2
σ20.
W = (0;χ2(α, n− 1)] dla hipotezy przeciwnej σ < σ0;W = [χ2(1− α, n− 1);∞) dla hipotezy przeciwnej σ > σ0;W = (0;χ2(α2 , n− 1)] ∪ [χ
Model H4 – rozkłady dowolne, nieznane σ1 i σ2 – duża próba, n1, n2 50.
16
g = uobl =x1 − x2√s21n1+s22n2
.
W = (−∞;−u(1− α)] dla hipotezy przeciwnej µ1 < µ2;W = [u(1− α);∞) dla hipotezy przeciwnej µ1 > µ2;W = (−∞;−u(1− α2 )] ∪ [u(1−
α2 );∞) dla hipotezy przeciwnej µ1 6= µ2.
17
HIPOTEZY O RÓWNOŚCI FRAKCJI ELEMENTÓWWYRÓŻNIONYCH W DWÓCH POPULACJACH
Model I1 – raczej duża próbka (n1, n2 50)
Stawiamy hipotezę p1 = p2.
Stosujemy statystykę
g = uobl =k1n1− k2n2√
k1+k2n1n2
(1− k1+k2
n1+n2
) .Gdy liczność próby nie jest dostatecznie duża stosujemy statystykę:
uobl =
(2 arc sin
√k1
n1− 2 arc sin
√k2
n2
)√n1n2
n1 + n2.
Zbiór krytyczny:W = (−∞;−u(1− α)] dla hipotezy przeciwnej p1 < p2;W = [u(1− α);∞) dla hipotezy przeciwnej p1 > p2;W = (−∞;−u(1 − α2 )] ∪ [u(1 −
α2 );∞) dla hipotezy przeciwnej p1 6= p2; gdzie
n1 i n2 liczności pierwszej i drugiej próbki, k1 i k2 liczby sukcesów w pierwszeji drugiej próbce.
18
TEST χ2 NIEZALEŻNOŚCI
χ2obl =∑ (wartość zaobserwowana− wartość spodziewana)2
wartość spodziewana.
Test odrzucamy, jeśli
χ2obl > χ2(1− α, (r − 1)(s− 1)),
gdzie r liczba wartości pierwszej cechy, a s liczba wartości drugiej cechy.
Współczynnik Cramera
V =
√χ2obl
n(m− 1),
gdzie m = min(r, s)
Współczynnik C Pearsona
C =
√χ2oblχ2obl + n
.
n liczba wszystkich danych w macierzy r × s.
19
Jak używać programu calc?
Będziemy posługiwać się tym programem do obliczanie wartościśredniej, wariancji, odchylenia standardowego oraz wynikających ztego dalszych rezultatów. Pokażemy to na przykładzie.
Zakładamy, że mamy dane empiryczne x1 = 7, x2 = 1, x3 = 5,x4 = 3, x5 = 5 oraz liczbę µ0 = 3. Mamy policzyć kolejno
x =1n
n∑k=1
xk,
s2 =1n− 1
n∑k=1
(xi − x)2,
s =√s2,
a następnie wstawić to do wzoru:
x− µ0s
√n.
Uruchamiamy program calc i wpisujemy dane np. w komórkachA1−A5.Daną µ0 możemy wpisać np w kolejnej komórce B1, a liczbę prób
(5) np. w komórce B2.
Warto wpisywać te dane w komórkach, a nie w ostatecznym wzo-rze, bo wtedy przy rozwiązywaniu następnego zadania opartego natym samym modelu, wystarczy zmienić dane bez konieczności zmianywzoru.
Wybieramy jakąć inną komórkę np. C1 i wpisujemy w niej wzór:
=ŚREDNIA(A1:A5)
Po zaakceptowaniu ukazuje się w tej komórce wynik 4.2.
Wybieramy następną komórkę powiedzmy C2 i wpisujemy w niejwzór
20
=WARIANCJA(A1:A5)
Po zatwierdzeniu ukazuje się w tej komórce wynik 5.2.
Wybieramy kolejną komórkę np. C3 i wpisujemy w niej wzór
=pierwiastek(c2)
Po zatwierdzeniu ukazuje się w tej komórce wynik 2.28 (w zależ-ności od tego jaką dokładność wybierzemy).
Wybieramy następną komórkę (np. C4) i wstawiamy w niej wzór(patrz rysunek)
=(C1-B1)*pierwiastek(B2)/C3
Zauważmy, że możemy wpisywać wzory zarówno małymi jak idużymi literami.
Po zaakceptowaniu otrzymamy już ostateczny wynik 1.1767.
Program calc zamiast tablic statystycznych
Większość danych potrzebnych do rozwiązywania zamieszczo-nych tu zadań zamiast z tablic, możemy wygenerować przy pomocy
21
programu calc. Niektóre są nieco inaczej zdefiniowane niż w tabli-cach statystycznych, dlatego podajemy dokładnie co trzeba zrobić,aby otrzymać dane zgodne z tablicami.
Ia) Dystrybuanta rozkładu normalnego
Aby wyznaczyć P (X < x), gdzie X jest zmienną o rozkładzieN(0, 1), a dana x jest umieszczona np. w komórce A1 wpisujemy wkomórce wyniku
=rozkład.normalny.s(a1)
Ib) Kwantyle rozkładu normalnego
Aby wyznaczyć kwantyl u(p) rozkładu normalnego N(0, 1) np.dla danej p umieszczonej w komórce B1 wpisujemy w komórce wyniku
=rozkład.normalny.s.odw(b1)
IIa) Dystrybuanta rozkładu t Studenta
Aby wyznaczyć P (X < x), gdzie X jest zmienną o rozkładzie tStudenta z n stopniami swobody, a dana x jest umieszczona np. wkomórce A1, a dana n w komórce B1 wpisujemy w komórce wyniku
=1-rozkład.t(a1;b1;1)
Program akceptuje tylko x-y dodatnie. Aby wyznaczyć P (X < x) dlax ujemnych wystarczy skorzystać z wzoru
P (X < x) = P (X > −x) = 1− P (X < −x).
IIb) Kwantyle rozkładu t Studenta
Aby wyznaczyć kwantyl t(p, n) rozkładu t Studenta dla danejp umieszczonej w komórce A1, danej n w komórce B1 wpisujemy wkomórce wyniku
=rozkład.t.odw(2*(1-a1);b1)
IIIa) Dystrybuanta rozkładu χ2
22
Aby wyznaczyć P (X < x), gdzie X jest zmienną o rozkładzieχ2 z n stopniami swobody, a dana x jest umieszczona np. w komórceA1, a dana n w komórce B1 wpisujemy w komórce wyniku
=1-rozkład.chi(a1;b1)
Gęstość rozkładu χ2(t) jest różna od zera tylko dla t dodatnich dla-tego wzór działa tylko dla x 0.IIIb) Kwantyle rozkładu χ2
Aby wyznaczyć kwantyl χ2(p, n) rozkładu χ2 dla danej p umiesz-czonej w komórce A1, danej n w komórce A2 wpisujemy w komórcewyniku
=rozkład.chi.odw(1-a1;a2)
IVa) Dystrybuanta rozkładu F Snedecora
Aby wyznaczyć P (X < x), gdzie X jest zmienną o rozkładzie FSnedecora z n, k stopniami swobody, dana x jest umieszczona np. wkomórce A1, a dana n w komórce B1, dana k w komórce C1 wpisujemyw komórce wyniku
=1-rozkład.f(a1;b1;c1)
IVb) Kwantyle rozkładu F Snedecora
Aby wyznaczyć kwantyl F(p, n, k) rozkładu F dla danej p umiesz-czonej w komórce B1, danej n w komórce B2 i danej k w komórce B3wpisujemy w komórce wyniku
=rozkład.f.odw(1-b1;b2;b3)
Korzystanie programu zamiast z tablic ma dodatkową zaletę, żemożemy znajdować wartości kwantyli dla nietypowych α, których niema w tablicach np. 0.03, 0.17 itp. W tablicach zwykle nie ma teżdystrybuant innych rozkładów niż normalny.
Możemy też włączyć te wzory do danego modelu otrzymującrozwiązanie w całości przy pomocy komputera. Odpowiedni przykładopiszemy przy rozwiązywaniu konkretnego zadania.
23
Zadania
24
ZADANIE 1. Dla zmiennej losowej X o rozkładzie jednostajnymna przedziale [−1; 3] znajdź a) P (X < 0), b) P (X > 2), c) takie c, żeP (X < c) = 0.95 = p, czyli p-ty kwantyl rozkładu jednostajnego naprzedziale [−1; 3].Rozwiązanie.
Dystrybuanta rozkładu jednostajnego na przedziale [−1; 3] jestrówna
F (x) =
0 dla x < −1,x+14 dla −1 ¬ x ¬ 3,1 dla x > 3.
Zatem a) P (X < 0) = F (0) = 14 ., b) P (X > 2) = 1 − P (X <2) = 1 − F (2) = 1 − 34 =
14 . c) Trzeba rozwiązać równanie P (X <
c) = 0.95, czyli c+14 = 0.95. Stąd c = 2.8.
25
ZADANIE 2. Przy pomocy tablic lub komputera znajdź dla zmien-nej X o rozkładzie normalnym standardowym N(0, 1) i α = 0.02: a)P (X > 2.3), b) P (X < −1.2), c) u(α), d) u(1− α), e) u(1− α2 ).Rozwiązanie.
a) i b) znajdujemy w tablicy 1 otrzymując: a) 1−0.9893 = 0.0107;b) 0.115 c), d) i e) można rozwiązać zarówno komputerem jak i przypomocy tablic. Otrzymamy c) u(0.02) = −2.05, d) u(0.98) = 2.05, e)u(0.99) = 2.33.
26
ZADANIE 3. Przy pomocy tablic lub komputera znajdź dla zmien-nej X rozkładzie t Studenta z n = 9 oraz α = 0.05: a) P (X > 1.3),b) P (X < −1.4), c) t(1− α, n), d) t(1− α2 , n),Rozwiązanie.
a) i b) najlepiej rozwiązać programem calc otrzymując: a) 1 −0.8870 = 0.1129; b) Musimy skorzystać z faktu, że t(−p, n) = 1 −t(p, n). Otrzymamy wynik 0.0.0975. c) t(0.95, 9) = 1.83,d) t(0.975, 9) = 2.26.
27
ZADANIE 4. Przy pomocy tablic lub komputera znajdź dla zmien-nej X o rozkładzie χ2 z n = 20 i α = 0.05: a) P (X < 20), b)P (X > 10), c) χ2(α, n), d) χ2(1− α, n) e) χ2(1− α2 , n).Rozwiązanie.
Dla a) i b) skorzystamy z programu calc. Otrzymamy dla a)wartość 0.542, a dla b) 1 − 0.0318 = 0.9682. Dla c) - e) można teżskorzystać z tablic mamy: c) χ2(0.05, 20) = 10.851, d) χ2(0.95, 20) =31.41, e) χ2(0.975, 20) = 34.17.
28
ZADANIE 5. Przy pomocy tablic lub komputera znajdź dla zmien-nej X o rozkładzie F z n = 8, k = 4, oraz dla α = 0.05: a) P (X > 3),b) P (X < 4), c) F(1− α, n, k), d) F(1− α2 , n, k).Rozwiązanie.
Dla a) i b) skorzystamy z programu calc otrzymując dla a) war-tość 0.8489, a dla b) wartość 1 − 0.9025 = 0.0975. c) F(0.95, 9, 4) =6.04, d) F(0.975, 9, 4) = 8.98.
29
ZADANIE 6. Przy pomocy programu calc znajdź dla próbkix1 = 1.31, x2 = 2.45, x3 = 3.45, x4 = −2.71: a) x, b) s2, c) s, d) błądstandardowy.
Rozwiązanie.
a) x = 1.125, b) s2 = 7.3009, c) s = 2.702, d) s√n= 1.351.
30
ZADANIE 7. Zaobserwowano, że waga noworodków w pewnymszpitalu ma rozkład normalny z wartością średnią 3.6 kg i odchy-leniem standardowym 0.26 kg. Jakie jest prawdopodobieństwo, żedziecko urodzone w tym szpitalu waży: a) więcej niż 4 kg?; b) mniejniż 3 kg?
Rozwiązanie.
a) a = 4, b =∞. Stąd c = 4−3.60.26 , d =∞. Zatem
P (4 < X) = 1− Φ(c) = 0.40.
b) a = −∞, b = 3, Stąd c = −∞, d = 3−3.60.26 = −2.31. Zatem
ZADANIE 8. Czas pracy żarówek produkowanych w pewnym za-kładzie ma rozkład normalny z wartością średnią 700 godzin i odchy-leniem standardowym 220 godzin. Jakie jest prawdopodobieństwo, żeżarówka zepsuje się przed upływem 500 godzin pracy?
Rozwiązanie.
Mamy µ = 700, σ = 220, a = −∞, b = 500. Stąd c = −∞,d = 500−700220 = −0.91. Zatem
ZADANIE 9. Plony zboża w gospodarstwach rolnych mają roz-kład normalny z wartością średnią 45 kwintali/ha i odchyleniem stan-dardowym 14 kwintali/ha. Jaki procent gospodarstw ma wydajnośćwiększą niż 50 kwintali z hektara?
Rozwiązanie.
Dane: µ = 45, σ = 14, a = 50, b = ∞. Stąd c = 50−4514 = 0.36,d =∞. Zatem
P (50 < X) = 1− Φ(.36) = 1− 0.64 = 0.36.
Odp. 36%.
33
ZADANIE 10. Wzrost żołnierzy ma rozkład normalny ze średnią177 cm i odchyleniem standardowym 13 cm. W jednostce wojskowejsłuży 1050 żołnierzy. Do kompanii honorowej zostanie wybranych 90najwyższych. Ile trzeba mieć wzrostu, aby zostać wybranym?
Rozwiązanie.
W tym zadaniu mamy dane prawdopodobieństwo P (X > a) =901050 = 0.086, a musimy wyznaczyć a. Mamy
0.086 = P (X > a) = 1− Φ(c),
gdzie c = a−17713 . Stąd Φ(c) = 0.914.W tablicach rozkładu normalne-go znajdujemy, że c = 1.35. Stąd mamy równanie
1.35 =a− 17713,
skąd a = 194.5.
Odp. Trzeba mieć co najmniej 194 cm wzrostu.
34
ZADANIE 11. Wiadomo, że maszyna do paczkowania cukru pa-kuje wg rozkładu normalnego z odchyleniem standardowym σ =2dkg. Nastawiono ją na 1 kg i przebadano losowo 10 torebek otrzymu-jąc rezultaty w dkg: 103, 96, 99, 97, 99, 100, 101, 95, 97, 99. Oszacujpunktowo i przedziałowo średnią wagę torebki na poziomie ufności1− α = 0.95.Rozwiązanie.
a) Oszacowanie punktowe:
Mamy x = 98.60, s = 2.41. Zatem błąd standardowy jest równys√n= 0.76.
Ponieważ odchylenie standardowe jest znane stosujemy modelA1, gdzie
l = u(1− α2 )σ√n.
W naszym przypadku l = 1.24 i
P = [97.36; 99.84].
35
ZADANIE 12. Rozwiąż poprzednie zadanie przy założeniu, żeodchylenie standardowe nie jest znane.
Rozwiązanie.
Tym razem stosujemy model A2, w którym
P = [x− l;x+ l],
l = t(1− α2 , n− 1)s√n.
W naszym przypadku n = 10, 1 − α2 = 0.975, t(0.975) = 2.26.Stąd l = 1.72, skąd
P = [96.88; 100.32].
36
ZADANIE 13. Pewien algorytm sortowania przetestowano na 9bazach danych losowo wymieszanych i uzyskano czasy sortowaniaw sekundach: 9, 13, 21, 7, 21, 14, 12, 21, 11. Oszacuj wartość średniąpunktowo i przedziałowo przyjmując, że rozkład jest normalny orazwspółczynnik ufności 1− α = 0.95.Rozwiązanie.
a) Oszacowanie punktowe:
Obliczamy wartość średnią i wariancję. Otrzymujemy
x = 14.33, s = 5.41.
Błąd standardowy jest równy s√9= 1.8.
b) Oszacowanie przedziałowe:
Ponieważ próba jest mała i odchylenie standardowe nie jest znanei rozkład jest normalny, stosujemy model A2.
l = t(1− α2 , n− 1)s√n.
W naszym przypadku znajdujemy t(0.975, 8) = 2.306. Stąd
l = 2.306 · 5.413= 4.16.
Zatem przedział ufności jest równy [10.18; 18.49].
37
ZADANIE 14. Pewna duża firma komputerowa chce ustalić śred-nią wielkość sprzedaży w ciągu dnia. Na podstawie danych z 3 mie-sięcy (78 dni) obliczono wartość x równą 2953 tys. zł. i odchyleniestandardowe empiryczne s = 1034 tys. zł. Oszacuj średnią wielkośćdziennej sprzedaży przy współczynniku ufności 1− α = 0.95.Rozwiązanie.
Ponieważ próbka jest duża, skorzystamy z modelu A3. Mamyα = 0.05, skąd 1−α2 = 0.975. Znajdujemy w tablicach u(1−
α2 ) = 1.96.
Stąd l = 1.96 · 1034√78= 229.5
OstatecznieP = [2723.5; 3182.5].
38
ZADANIE 15. Pan X kupił na loterii sto losów każdy po 2 złote.Za 7 z nich wygrał 10 zł., za 3 wygrał po 20 zł., a za jeden 50 zł.Zbuduj na poziomie 1 − α = 0.90 odpowiedni przedział ufności ispróbuj zinterpretować wynik.
Rozwiązanie.Oszacujemy średni wynik finansowy pana X. Pró-ba jest duża (n = 100), zastosujemy zatem model A3. W 89 =100 − 7 − 3 − 1 losach wynik był −2, w 7 losach 10 − 2 = 8, wtrzech 20− 2 = 18 oraz w jednym 50− 2 = 48. Stąd
Wynik można zinterpretować np. tak: Mimo, że śrdni wynik jestujemny są spore szanse wygranej.
39
ZADANIE 16. Trzysta wylosowanych rodzin z danej miejscowo-ści zapytano, czy posiadają w domu komputer. 121 rodzin odpowie-działo, że tak, w tym 91 rodzin ma komputer stacjonarny, a 42 ro-dziny laptop. Wyznacz przedziały ufności z 95%-ową wiarygodnościądla procentu rodzin: a) posiadających komputer; b) posiadającychkomputer stacjonarny; c) posiadających laptop; d) posiadających ikomputer stacjonarny i laptop.
Rozwiązanie.
Stosujemy model B1, czyli wzór
P =[k
n− l; kn+ l],
gdzie l = u(1− α2 )√
kn (1− kn )n .
Mamy n = 300. Znajdujemy w tablicach u(1− α2 ) = 1.96.W punkcie a) mamy k = 121, skąd k/n = 0.403 oraz l = 0.056.
ZatemP = [0.348; 0.459] = [34.8%; 45.9%].
W punkcie b) mamy k = 91, skąd k/n = 0.303 oraz l = 0.052.Zatem
P = [0.251; 0.355] = [25.1%; 35.5%].
W punkcie c) mamy k = 42, k/n = 0.14, l = 0.039. Stąd
P = [0.101; 0.179] = [10.1%; 17.9%].
W punkcie d) mamy k = 12 (dlaczego?), skąd k/n = 0.04 orazl = 0.022. Zatem
P = [0.018; 0.062] = [1.8%; 6.2%].
40
ZADANIE 17. Pewna firma cukiernicza zakupiła automat doprodukcji i porcjowania lodów. Nastawiono automat na 5 dkg i spraw-dzono na bardzo dokładnej wadze 9 losowo wybranych porcji otrzy-mując wyniki w dkg: 5.07, 5.08, 4.91, 4.95, 5.00, 5.09. 4.98, 4.95, 4.96.Zakładając, że rozkład jest normalny wyznacz przedziały ufności dlaodchylenia standardowego na poziomie ufności 1− α = 0.99.Rozwiązanie.
Stosujemy model C1. W tablicach rozkładu χ2 znajdujemy χ2(1−α2 , n− 1) = χ
Opiszemy krok po kroku jak można rozwiązać to zadanie całko-wicie przy użyciu pakietu calc
Wpisujemy w komórkach A1-A9 dane. Wpisujemy w komórce B2liczbę 0.99. Wpisujemy w komórce B3 liczbę 9. Wpisujemy w komórceC1
=średnia(a1:a9)
Wpisujemy w komórce C2
=pierwiastek(wariancja(a1:a9))
Wpisujemy w komórce C3
=rozkład.chi.odw(b1/2;8)
Wpisujemy w komórce C4
=rozkład.chi.odw(1-b1/2;8)
Wpisujemy w komórce C5
=c2*pierwiastek((b3-1)/c3)
41
To będzie lewy koniec przedziału.Wpisujemy w komórce D5
=c2*pierwiastek((b3-1)/c4)
To będzie prawy koniec przedziału.
42
ZADANIE 18. W celu sprawdzenia, czy automat do pakowaniamąki porcjuje precyzyjnie firma młynarska przed ewentualnym za-kupem zważyła 200 kilogramowych torebek mąki i otrzymała wy-niki w kg: x = 0.99 i odchylenie standardowe z próbki s = 0.077dkg. Wyznacz przedział ufności dla odchylenia standardowego przywspółczynniku ufności 1− α = 0.95.Rozwiązanie.
Dla dużej próby stosujemy nodel C2. Mamy u(1 − α2 ) = 1.96.Stąd
P =
[0.077
√398√
397 + 1.96;0.077
√398√
397− 1.96
]= [0.072; 0.083].
43
ZADANIE 19. Zważono na pewnej plantacji losowo 40 dyń otrzy-mując wyniki w kg: 12,6; 11.3; 18.4; 13.7; 11.2; 11.4; 18.5; 18.2; 21.5;11.7; 13.6; 14.8; 15.4; 14.2; 13.8; 12.6; 11.4; 17.8; 17.7; 19.5; 20.6; 21.5;22.5; 11.8; 15.5; 17.7; 16.1; 17.1; 13.2; 14.3; 17.8; 19.9; 13.3; 12.5; 16.6;16.2; 16.1; 17.8; 12.3; 14.4. Na poziomie ufności 1−α = 0.90 wyznaczprzedziały ufności: a) dla sredniej; b) dla mediany oraz pierwszego itrzeciego kwartyla.
Rozwiązanie. a) Stosujemy model A3. Wspomagając się ar-kuszem kalkulacyjnym i tablicami obliczamy x = 15.66. s = 3.18,1− α2 = 0.95, u(0.95) = 1.64. Stąd
ZADANIE 20. Mamy zważyć sztabkę złota. Chcemy. na pozio-mie ufności 0.95 otrzymać przedział ufności [x − l;x + l] z l = 0.01mg. Elektroniczna waga ma rozkład błędów normalny z odchyleniemstandardowym 0.02 mg. Ile niezależnych pomiarów trzeba wykonać?
Rozwiązanie.
Ponieważ odchylenie standardowe jest znane, stosujemy wzórM1. Z tablic kwantyli rozkładu normalnego znajdujemy u(1 − α2 ) =1.96. A więc
n >
(1.96 · 0.020.01
)2= 15.37.
Trzeba wykonać 16 pomiarów.
46
ZADANIE 21. Pewien program sortujący dane został przete-stowany na 7 losowo wybranych różnego rodzaju plikach długości1000000 rekordów, i otrzymano czas sortowania w sek. 111, 22, 33,42, 199, 77, 138. Ile jeszcze należy dodatkowo dokonać testów, abyotrzymać na poziomie ufności 1−α = 0.95 przedział ufności nie dłuż-szy niż 80 sek?. Zakładamy, że cecha ma rozkład normalny.
Trzeba jeszcze dodać 15− 7 = 8 dodatkowych pomiarów.
47
ZADANIE 22. Pewien informatyk skonstruował program rozpo-znający linie papilarne. Ile prób należy przeprowadzić, aby na pozio-mie ufności 1− α = 0.95 otrzymać przedział ufności długości 10%?Rozwiązanie.
Zastosujemy wzór M3. Mamy u(1 − α2 ) = 1.96, l =0.102 = 0.05.
Zatem
n 1.962
4 · 0.052= 384.2.
Trzeba wykonać 385 prób.
48
ZADANIE 23. Pewien sklep chce przeprowadzić badanie, jakiprocent klientów po raz drugi dokonuje zakupów w tym sklepie. Iluklientów powinien uwzględnić w badaniu aby na poziomie ufności1− α = 0.9 otrzymać przedział ufności długości 6%?Rozwiązanie.
Ponownie skorzystamy z wzoru M3. Mamy u(1 − α2 ) = 1.64.l = 0.03.
n 1.642
4 · 0.032= 747.11.
Powinien w badaniu uwzględnić 748 klientów.1
1Liczba 1.64 jako wartość kwantyla u(0.95) jest w tablicach podana w przy-bliżeniu. Dlatego, jeśli użyjemy do obliczeń programu calc to użyta zostanie jakou(0.95) dokładniejsza liczba 1.64485 i otrzymamy w tym zadaniu wynik 751.
49
ZADANIE 24. Rzucamy 20 razy kostką. Otrzymaliśmy wynikiotrzymane w tabelce:
liczba oczek 1 2 3 4 5 6liczba rzutów 0 2 7 5 3 3
Zweryfikuj hipotezę, że kość jest „uczciwa”, przyjmując α = 0.05.
Rozwiązanie.
Zastosujemy test χ2. Wartość spodziewana dla każdej liczby oczekto 206 = 3.33. W takim razie wartość statystyki testowej wynosi
χ2obl =(0− 3.33)2
3.33+(2− 3.33)2
3.33+(7− 3.33)2
3.33+
(5− 3.33)2
3.33+(3− 3.33)2
3.33+(3− 3.33)2
3.33= 8.8.
W tablicach kwantyli rozkładu χ2 lub przy pomocy komputeraznajdujemy χ2(0.95, 5) = 11.071.
Nie ma powodu odrzucania hipotezy, bo 8.8 < 11.071.
50
ZADANIE 25. Ruletka ma 4 równe pola: dwa czerwone, jednobiałe i jedno czarne. Uruchomiono ją 100 razy; 60 razy wypadło po-le czerwone, 29 razy białe i 11 razy czarne. Zweryfikuj hipotezę, żeruletka jest „uczciwa” przyjmując: a) α = 0.05 i b) α = 0.005.
Rozwiązanie.
Ponownie zastosujemy test χ2. Przy 100 losowaniach wartościspodziewane to: 50 razy pole czerwone i po 25 razy pole białe i poleczarne. Zatem statystyka testowa wynosi
χ2obl =(60− 50)2
50+(29− 25)2
25+(11− 25)2
25= 10.48.
W tablicach rozkładu χ2 lub przy pomocy komputera znajduje-my χ2(0.95, 2) = 5.991 oraz χ2(0.995, 2) = 10.597 Hipotezę odrzuca-my w punkcie a), a punkcie b) nie.
51
ZADANIE 26. Łucznik strzelał z łuku do tarczy o promieniu 10cm. W 10 próbach otrzymał następujące odległości od środka tarczy(z dokładnością 1cm): 4, 7, 8, 8, 0, 3, 2, 5, 7, 6. Zweryfikuj na poziomieistotności α = 0.05 hipotezę, że rozkład odległości trafień od środkatarczy jest jednostajny na przedziale [0; 10].
Rozwiązanie.
Stosujemy test Kołmogorowa. Rozkład jednostajny na przedziale[0; 10] ma dystrybuantę
Stąd maksimum=0.2. W tablicach rozkładu Kołmogorowa znaj-dujemy d10(0.95) = 0.409. Wartość statystyki testowej jest mniejsza.Hipotezy nie odrzucamy.
52
ZADANIE 27. Zważono losowo 9 paczek wysyłanych w pewnymurzędzie pocztowym i uzyskano wyniki w kg. 6.0, 1.5, 0.7, 2.5, 6.3,1.1, 2.2, 2.8, 1.1. Postaw hipotezę, że rozkład jest typu N(x, s) 2
i zweryfikuj ją na poziomie istotności α = 0.05.
Rozwiązanie.
Obliczając przy pomocy komputera mamy x = 1.52, s = 0, 70.stawiamy hipotezę, że próbka pochodzi z rozkładu N(1.52, 0.70). Sto-sujemy test Kołmogorowa. Tworzymy tabelkę:
2W zasadzie test Kołmogorowa powinno stosować się wtedy, gdy parametryrozkładu, z którym porównujemy próbkę są z góry dane.
53
ZADANIE 28. Próbka dała następujące wyniki 0, 0, 0, 0, 0, 6.Pokaż przy pomocy testu Kołmogorowa, że na poziomie istotnościα = 0.10 należy odrzucić hipotezę, że rozkład jest typu N(x, s).
Rozwiązanie.
Mamy x = 1, s = 2.45. Tworzymy tabelkę dla testu Kołmogoro-wa. Stawiamy hipotezę, że próbka pochodzi od rozkładu N(1, 0.245).
Dnobl jest równe 0.49. Natomiast d6(0.90) = 0.468. Zatem hipo-tezę odrzucamy.
54
ZADANIE 29. Rozważ próbę z poprzedniego zadania. Pokaż, żeprzy innym wyborze µ na tym samym poziomie istotności nie odrzu-cimy hipotezy, że rozkład jest typu N(µ, s).
Rozwiązanie.
Jeśli ustalimy średnią na przykład na 0.5, to test Kołmogorowada rezultat
Dnobl = 0.42. Natomiast d6(0.90) = 0.468. Zatem hipotezy nieodrzucamy.
55
ZADANIE 30. Jeszcze raz rozważ próbkę z poprzedniego zada-nia. Pokaż, że nie odrzucimy hipotezy na tym samym poziomie istot-ności, że rozkład jest jednostajny na przedziale [a; b] przy pewnymwyborze a i b.
Rozwiązanie.
Wybierzmy np. a = −6, b = 8. Wtedy
F (x) =
0 dla x < −6x+614 dla x ∈ [−6; 8]1 dla x > 8.
Zatem tabela do testu Kołmogorowa wygląda następująco:
Maksimum jest równe 0.43. Natomiast d6(0.90) = 0.468. Zatemhipotezy nie odrzucamy.
56
ZADANIE 31. Pewien sklep sprowadził jabłka tej samej odmianyod dwóch dostawców. Wybrał losowo po 7 jabłek z każdej dostawy izważył je. Otrzymał rezultaty w gramach: u pierwszego dostawcy 123,111, 134, 144, 122, 133, 145. U drugiego dostawcy 122, 133, 117, 129,137, 159, 161. Czy na poziomie istotności α = 0.05 można stwierdzić,że obaj dostawcy dają analogiczną ofertę?
Rozwiązanie.
Zastosujemy test serii. Ustawimy wszystkie wartości w ciąg ro-snący. Oznaczmy pierwszego dostawcę przez x, drugiego przez y.Otrzymamy tabelkę:
111 117 122 122 123 129 133 133 134 137 144 145 159 161x y x(y) y(x) x y x(y) y(x) x y x x y y
W dwóch przypadkach mamy te same wartości w obu próbkach,zatem serii może być najmniej 8, a najwięcej 10, w zależności od tegojak ustawimy próbki o tej samej wartości.
Znajdujemy w tablicy 8 k(0.05, 7, 7) = 4. Widzimy, że niezależ-nie od ustawienia kolejności takich samych wartości, mamy K > 4.Uznajemy, że obaj dostawcy mają podobną ofertę.
57
ZADANIE 32. Producent wag twierdzi, że jego wagi działająz odchyleniem standardowym 0.1 dkg. Aby sprawdzić, czy dostar-czone nam z hurtowni torebki cukru są kilogramowe, zważyliśmy 100losowo wybranych torebek i otrzymaliśmy wartość średnią 0.995 kg.Czy na poziomie istotności α = 0.05 możemy mieć do hurtownikazastrzeżenia?
Rozwiązanie.
Należy zastosować model D1. Stawiamy hipotezę µ = 100 prze-ciwko hipotezie µ < 100. Wartość statystyki testowej jest równa (poprzeliczeniu wszystkich danych na dekagramy)
uobl =99.5− 1000.1
· 10 = −5.
Zbiorem krytycznym jest przedział
(−∞;−u(0.95)] = (−∞;−1.64].
Wartość statystyki testowej należy do zbioru krytycznego (i to wy-raźnie!). Powinniśmy mieć poważne zastrzeżenia.
58
ZADANIE 33. Twórca programu obliczeniowego twierdzi, że je-go program rozwiązuje pewne równania różniczkowe na danym pro-cesorze w czasie około 2 sek. z odchyleniem standardowym 1 sek.Przetestowano go na 10 zadaniach z różnymi danymi początkowymii uzyskano czasy w sekundach: 0.8, 1.9, 2.3, 2.4, 2.4, 0.9, 3.5, 4.2, 2.4,2.9. Sprawdź na poziomie istotności α = 0.1 czy autor programu się„nie przechwala”.
Rozwiązanie.
Sposób I.
Zastosujemy test Kołmogorowa, aby się przekonać, że możemyrozkład uważać za normalny z parametrami zadeklarowanymi przeztwórcę programu, czyli typu N(2, 1).
Zatem Dnobl = 0.32, a d10(0.1) = 0.381. Ponieważ 0.32 < 0.381,hipotezy nie odrzucamy.
Sposób II.
Przyjmujemy, że rozkład jest normalny i stawiamy hipotezę µ =2 wobec hipotezy przeciwnej µ > 2. Stoujemy model D2. Wyliczamyx = 2.37, s = 1.04.
Statystyka testowa wynosi
tobl =2.37− 21.041
·√10 = 1.12.
59
Zbiór krytyczny jest równy
W = [t(0.9, 9);∞) = [1.38;∞).
Ponieważ tobl 6∈W hipotezy nie odrzucamy.
60
ZADANIE 34. Producent baterii twierdzi, że czas pracy bate-rii wynosi co najmniej 30 godzin. Przebadano 100 baterii i uzyskanośredni czas pracy 28 godzin i 20 minut i odchylenie standardowe 7godzin 25 minut. Na poziomie istotności α = 0.05 sprawdź czy pro-ducent ma rację.
Rozwiązanie.
Ponieważ próba jest duża stosujemy model D3. Po przeliczaniudanych na minuty mamy x = 1700, s = 445, µ0 = 1800. Stawiamyhipotezę µ = 1800 wobec hipotezy przeciwnej µ < 1800.
Wartość statystyki testowej wynosi
uobl =1700− 1800445
·√100 = −2.25.
Zbiór krytyczny jest równy
W = (−∞;−u(0.95)] = (−∞;−1.64].
Ponieważ uobl ∈W hipotezę odrzucamy. Producent nie ma racji.
61
ZADANIE 35. Jaki jest graniczny poziom istotności, przy któ-rym odrzucimy hipotezę w poprzednim zadaniu?
Rozwiązanie.
Wartość statystyki testowej wynosi −2.25. Trzeba znaleźć takie1 − α, że −u(1 − α) = −2.25, czyli obliczyć wartość dystrybuantystandardowego rozkładu normalnego w punkcie 2.25. Korzystając ztablic lub komputera otrzymujemy.
1− α = Φ(.) = ..
Zatem granicznym poziomem istotności jest α = 0.01222.
62
ZADANIE 36. Aby oszacować dokładność pomiarów wykony-wanych elektroniczną wagą sześciokrotnie zważono ten sam obiekti otrzymano wyniki (w gramach): 11.11, 11, 20, 11.10, 11.13, 11.12,11.21. Zakładając, że próbka pochodzi z rozkładu normalnego, napoziomie istotności 0.05 zweryfikuj hipotezę σ = 0.04 g. przeciwkohipotezie σ > 0.04 g.
Rozwiązanie.
Obliczamy x = 11, 145, s = 0, 04764.
Ponieważ rozkład cechy jest normalny, stosujemy model E1.
Statystka testowa wynosi
χ2obl =(n− 1)s2
σ20= 7.09,
a zbiór krytycznyW = [11.07;∞).
Wartość statystyki testowej nie należy do W . Hipotezy nie od-rzucamy.
63
ZADANIE 37. Dla danych z poprzedniego zadania wyznacz gra-niczny poziom istotności α, przy którym odrzucimy hipotezę.
Rozwiązanie.
Wartość statystyki testowej jest równa 7.09. Trzeba wyznaczyćtakie α, że χ2(1− α, 5) = 7.09, czyli wyznaczyć wartość dystrybuan-ty F rozkładu χ2 z 5 stopniami swobody w punkcie 7.09. Użyjemyprogramu calc i otrzymamy 1− α = 0.79, skąd α = 0.21.
64
ZADANIE 38. Aby zbadać dokładność pracy mikrometra zmie-rzono 60 razy grubość drutu i uzyskano empiryczne odchylenie stan-dardowe 0.05 mm. Przy założeniu, że rozkład błędów pomiaru jestnormalny zbadać na poziomie istotności α = 0.05 hipotezę, że mikro-metr mierzy z dokładnością 0.04 mm. Rozwiąż zadanie przy pomocymodeli E1 i E2.
Rozwiązanie.
Stawiamy hipotezę σ = 0.04 przeciwko hipotezie σ > 0.04.
Stosujemy model E1. Statystka testowa wynosi
χ2obl =(n− 1)s2
σ20= 92.19,
a zbiór krytycznyW = [χ2(0.95, 59);∞).
Wartość χ2(0.95, 59) obliczamy przy pomocy programu calc otrzy-mując wartość 77.93. Zatem
W = [77.93;∞).
Jak widać wartość statystyki testowej należy do zbioru krytycznego,a zatem hipotezę odrzucamy.
Stosujemy model E2. Statystyka testowa wynosi
uobl =
√118 · 0.0520.042
−√117 = 2.76,
a zbiór krytycznyW = [1.64;∞).
I przy tej metodzie hipotezę odrzucamy.
Przy obu metodach wyraźnie!
65
ZADANIE 39. Rzucamy 300 razy monetą. Orzeł wypadł 165 ra-zy. Na poziomie istotności α = 0.05 sprawdź hipotezę, że moneta jestsymetryczna.
Rozwiązanie.
Stosujemy model F1. Mamy p0 = 0.5, n = 300, k = 165. Stawia-my hipotezę p = 0.5 wobec hipotezy przeciwnej p 6= 0.5.Wartość statystyki testowej jest równa
uobl =k − np0√np0(1− p0)
= 1.73.
Natomiast zbiór krytyczny jest równy
(−∞;−1.96] ∪ [1.96;∞).
uobl 6∈W , zatem hipotezy nie odrzucamy.
66
ZADANIE 40. Wyznacz graniczny poziom istotności α, przy któ-rym odrzucimy hipotezę z poprzedniego zadania.
Rozwiązanie.
Trzeba znaleźć takie α, że u(1− α2 ) = 1.73, czyli obliczyć wartośćdystrybuanty Φ w punkcie 1.73. Otrzymujemy
1− α2 = 0.9582,
skąd α = 0.0836.
67
ZADANIE 41. Rozwiąż poprzednie dwa zadania przy pomocytestu zgodności χ2.
Rozwiązanie.
Orłów wypadło 165, a reszek 135, w obu wypadkach wartośćspodziewana to 150. Zatem wartość statystyki testowej jest równa
χ2obl =(165− 150)2
150+(135− 150)2
150= 3.
Liczba wyników n jest równa 2, zatem liczymy
χ2(0.95, 2− 1) = 3.841.
Ponieważ 3 < 3.841, hipotezy nie odrzucamy.
Aby wyznaczyć graniczny poziom istotności musimy policzyćwartość dystrybuanty rozkładu χ2 o jednym stopniu swobody w punk-cie 3. Najlepiej posłużyć się komputerem (np. programem calc, bow tablicach tego nie mamy). Otrzymujemy wartość 0.9167. Stąd α =0.0833.
Zauważmy, jak bardzo bliskie są wyniki przy obu metodach!
68
ZADANIE 42. Policzono pewnego dnia klientów internetowegosklepu i okazało się, że na 155 klientów, którzy wzięli udział w ankieciepodając płeć, 31 było kobietami. Na poziomie istotności α = 0.05zweryfikuj hipotezę, że procent klientów kobiet w tym sklepie wynosi25%.
Rozwiązanie.
Stosujemy model F1. Mamy p0 = 0.25, n = 155, k = 31. Stawia-my hipotezę p = 0.25 wobec hipotezy przeciwnej p 6= 0.25.Wartość statystyki testowej wynosi
uobl =k − np0√np0(1− p0)
= −1.44.
Zbiór krytyczny:
W = (−∞;−1.96] ∪ [1.96;∞).
Wartość −1.44 nie należy do zbioru krytycznego. Nie odrzucamy hi-potezy.
69
ZADANIE 43. Pewien sklep z odzieżą chce sprawdzić, czy rów-nież na terenie jego działalności potwierdzą się dane, że co najmniej90% klientów stanowią panie. Przez tydzień skrupulatnie liczono klien-tów i okazało się, że na 527 osób, pań było 450. Czy dane te przecząogólnej statystyce na poziomie istotności α = 0.05?
Rozwiązanie.
Ponownie trzeba zastosować model F1. Mamy p0 = 0.9, n = 527,k = 450. Stawiamy hipotezę p = 0.9 wobec hipotezy przeciwnej p <0.9 (dlaczego?).
Wartość statystyki testowej wynosi
uobl =k − np0√np0(1− p0)
= −3.53.
Zbiór krytyczny:W = (−∞;−1.64].
Wartość −3.53 należy do zbioru krytycznego. Odrzucamy hipotezę.
70
ZADANIE 44. Dwa narzędzia pomiarowe przebadano mierząc ni-mi po 20 razy pewien obiekt. Uzyskano następujące rezultaty: s1 =0.13, s2 = 0.20. Czy na poziomie istotności α = 0.05 można zakładać,że oba urządzenia mierzą jednakowo dokładnie?
Rozwiązanie.
Przyjmujemy hipotezę σ1 = σ2 wobec hipotezy przeciwnej σ1 6=σ2.
Stosujemy model G1. Ponieważ większa jest wariancja w drugiejpróbce, przyjmujemy statystykę
Fobl =s22s21= 2.37.
Zbiór krytyczny
W = F(1− α2 , 19, 19);∞) = [2.53;∞).
2.37 6∈W , hipotezy nie odrzucamy.
71
ZADANIE 45. Właściciel sklepu zauważył, że jego waga nie wa-ży dokładnie. Zważył 50 razy tę samą paczkę kilogramową cukru iotrzymał odchylenie standardowe 2 dkg. Oddał wagę do remontu,i po naprawie zważył ponownie 50 razy kilogram cukru otrzymującodchylenie standardowe 0.5 dkg. Czy może na poziomie istotnościα = 0.05 uznać naprawę za dobrą?
Rozwiązanie.
Zastosujemy model G1. Stawiamy hipotezę σ1 = σ2 wobec hipo-tezy przeciwnej σ1 > σ2. Statystyka testowa jest równa
Fobl =s21s22= 16.
Natomiast zbiór krytyczny jest równy
W = F(1− α, 49, 49);∞) = [1.61;∞).
Wartość statystyki testowej wyraźnie należy do zbioru krytycznego.Hipotezę o równości wariancji odrzucamy. Możemy stąd wywniosko-wać, że waga została porządnie naprawiona!
72
ZADANIE 46. W pewnej fabryce zmierzono średnice śrub nadwóch przyrządach pomiarowych od dwóch różnych dostawców uzy-skując wyniki w cm: 0.99, 0.97, 0.97, 1.00, 0.98, 0.99, oraz odpo-wiednio 1.06, 1.07, 1.03, 1.01, 1.08. Wiadomo, że pierwszy przyrządpomiarowy działa z dokładnością σ1 = 0.01 cm, a drugi przyrządz dokładnością σ2 = 0.02 cm. Zakładamy, że rozpatrywana cechadługości śrub ma rozkład normalny. Zweryfikuj na poziomie istotno-ści α = 0.05 hipotezę, że długości śrub u obu dostawców są takiesame.
Rozwiązanie.
Nasze dane n1 = 6, n2 = 5. Ponieważ znane są odchylenia stan-dardowe możemy zastosować model H1. Stawiamy hipotezę µ1 = µ2wobec hipotezy przeciwnej µ1 6= µ2. Obliczamy x1 = 0.9833, x2 =1.050. (odchyleń standardowych w tym modelu nie trzeba obliczać).Statystyka testowa jest równa
uobl =x1 − x2√σ21n21+ σ
22n22
= −6.78.
Zbiór krytyczny
W = (−∞;−1.96] ∪ [1.96;∞).
Hipotezę wyraźnie odrzucamy.
73
ZADANIE 47. Jaki jest graniczny poziom istotności, przy któ-rym odrzucimy hipotezę w poprzednim zadaniu?
Rozwiązanie.
Wartość statystyki testowej jest równa 6.78. Musimy zatem zna-leźć takie α, aby −u(1 − α2 ) = −6.78. Trzeba policzyć dystrybuantęΦ(.). Jest ona praktyczne równa 1 (największy argument w ta-blicach jest zwykle 3.5). Wartość ta policzona programem calc jestrówna 0.999999996. Stąd α = 0.000000007. Możemy zatem uznać, żehipotezę odrzucimy na każdym sensownym poziomie istotności.
74
ZADANIE 48. Rozwiąż zadanie 40 bez informacji o odchyleniachstandardowych.
Rozwiązanie.
Zadanie rozwiążemy w dwóch etapach. W pierwszym etapie spraw-dzimy, czy możemy przyjąć, że obie próby mają podobne odchyleniestandardowe. Dodatkowo obliczamy s1 = 0.01211, s2 = 0.02915.
Stosujemy model G1. Statystyka testowa jest równa
Fobl =s22s21= 5.8.
Zbiór krytyczny
W = [F(0.975, 5− 1, 6− 1);∞) = [7.39;∞).
Możemy uznać, że odchylenia standardowe są równe. Zatem wdrugim, głównym etapie stosujemy model H2.
tobl =x1 − x2√
(n1−1)s21+(n2−1)s22
n1+n2−2 · n1+n2n1n2
.
Wstawiając nasze dane otrzymujemy wartość −5.14. Zbiór krytycznyjest postaci
W = (−∞;−t(0.975, 9)] ∪ [t(0.975, 9);∞),
czyliW = (−∞;−2.26] ∪ [2.26;∞).
I w tym wypadku hipotezę wyraźnie odrzucamy.
75
ZADANIE 49. Zbadano płace 5 kobiet i 5 mężczyzn pracującychw pewnej firmie. Otrzymano dla kobiet dane (w złotych) 1700, 1300,1900, 1900, 3500, a dla mężczyzn 1600, 1700, 1800, 2700, 4500. Spraw-dzić na poziomie istotności α = 0.05, czy można stwierdzić, że płacekobiet są niższe w tej firmie niż mężczyzn. Zakładamy, że płace mająrozkłady normalne.
W etapie pierwszym sprawdzimy, czy oba odchylenia standardo-we możemy uznać za jednakowe. W zależności od tego do właściwegotestu wybierzemy model H2 lub H3.
ETAP 1.
Stawiamy hipotezę σ1 = σ2 wobec hipotezy przeciwnej σ1 6= σ2.Stosujemy model G1. Druga próbka ma większą wariancję, zatemnasza statystyka testowa jest równa
Fobl =s22s21= 2.11.
Natomiast zbiór krytyczny jest równy
W = [F(1− α2 , 5− 1, 5− 1);∞) = [9.6;∞).Nie odrzucamy hipotezy o równość odchyleń standardowych. Zatemw trzecim etapie zastosujemy model H2.
ETAP 2.
Stawiamy hipotezę µ1 = µ2 wobec hipotezy przeciwnej µ1 < µ2.Statystyka testowa jest równa
tobl =x1 − x2√
(n1−1)s21+(n2−1)s22
n1+n2−2 · n1+n2n1n2
.
Dla naszych danych otrzymujemy wynik −0.6. Zbiór krytycznyW = (−∞;−2.31] ∪ [2.31;∞).
Hipotezy nie odrzucamy. Przyjmujemy, że płace są podobne.
76
ZADANIE 50. W zakładzie z poprzedniego zadania odeszła zpracy kobieta zarabiająca 3500 złotych i do próby losowej wybranotylko poprzednie 4 kobiety. Rozwiąż poprzednie zadanie przy nowychdanych.
Rozwiązanie.
Teraz mamy n1 = 4, x1 = 1700, s1 = 282.84. Pozostałe dane bezzmian.
Test równości wariancji wypada teraz negatywnie, bo wartośćstatystyki testowej jest równa 18.66, natomiast zbiór krytyczny jestrówny W = [15.1;∞).Zatem w drugim etapie stosujemy model H3. Wartość statystyki
Cobl = −1.35, natomiast zbiór krytyczny W = (−∞;−2.8]∪ [2.8;∞).Widzimy, że Cobl 6∈W , zatem hipotezy nie odrzucamy.
77
ZADANIE 51. Policja przeprowadziła badania prędkości samo-chodów w pewnym niebezpiecznym miejscu na próbach liczności 200dla samochodów osobowych i ciężarowych i uzyskała wyniki: dla oso-bowych 101 km/h przy odchyleniu standardowym 7.8 km/h, a dla cię-żarowych 88 km/h przy odchyleniu standardowym 10.9 km/h. Zwery-fikuj na poziomie istotności α = 0.05 hipotezę, że samochody osobowew tym miejscu jeżdżą nie prędzej niż samochody ciężarowe.
Rozwiązanie.
Próbki są duże, stosujemy więc model H4. Mamy x1 = 101,s1 = 7.8, x2 = 88, s2 = 10.9, n1 = n2 = 200. Stawiamy hipotezęµ1 = µ2 wobec hipotezy µ1 > µ2.
Statystyka testowa dana jest wzorem
uobl =x1 − x2√s21n1+ s
22n2
.
W naszym wypadkuuobl = 13.72,
a zbiór krytyczny ma postać
W = [1.64;∞).
Hipotezę bardzo zdecydowanie odrzucamy.
78
ZADANIE 52. Do sklepu pewnego dnia przyszło: 180 kobiet, spo-śród których 88 dokonało zakupu, oraz 122 mężczyzn, spośród nich101 dokonało zakupu. Czy słuszna jest hipoteza, że procent osób do-konujących zakupu po wejściu do sklepu nie zależy od płci? Przyjmijα = 0.05.
uobl należy do zbioru krytycznego, hipotezę odrzucamy.
79
ZADANIE 53. Pewna firma niezadowolona z wielkości sprzedażypostanowiła zatrudnić agencję reklamową. Tabelka pokazuje średniątygodniową sprzedaż wybranych asortymentów (w tys. zł.) po zatrud-nieniu tej agencji. Czy słuszna jest hipoteza, że zatrudnienie agencjinie zmieniło wielkości sprzedaży. Zakładamy, że wszystkie próbki po-chodzą z rozkładu normalnego i przyjmujemy α = 0.05
wielkość sprzedaży przed 9 11 17 4 7 9wielkość sprzedaży po 21 21 18 5 9 19
Rozwiązanie.
Tworzymy nową zmienną Y = X2−X1. Mamy y1 = 12, y2 = 10,y3 = 1, y4 = 1, y5 = 2, y6 = 10. Mamy y = 6.00, s = 5.18. Testujemyhipotezę µ = 0 wobec hipotezy µ > 0.
Ponieważ próbka jest nieliczna, stosujemy model E2. Wartośćstatystyki wynosi 1.89, a zbiór krytycznyW = [2.02;∞). Hipotezy nieodrzucamy. Wynika z tego, że zatrudnienie agencji tylko nieznaczniepoprawiło sprzedaż.
80
ZADANIE 54. W pewnym niebezpiecznymmiejscu doszło w pew-nym miesiącu do 32 kolizji drogowych. Policja ustawiła tam ostrze-gawczy oświetlony znak. Po ustawieniu tego znaku w najbliższymmiesiącu doszło do 19 kolizji. Czy można uznać, że sytuacja się po-prawiła? Przyjmij α = 0.05.
Rozwiązanie.
Problem ten można próbować rozwiązać kilkoma sposobami. Popierwsze możemy zastosować model I1, ale nie będzie on w stu pro-centach dobry, bo próby nie są niezależne.
Można liczbę wypadków potraktować jako liczbę „sukcesów” wrozkładzie dwupunktowym np. obliczając liczbę godzin w miesią-cu (744) i przyjąć, że każdy wypadek zdarzył się w innej godzinie.Następnie rozważać zmienną k = k1 − k2 = 13 przyjąć hipotezęp = p0 = 0, wobec hipotezy p > 0 i zastosować model F1. Ale wewzorze na statystykę testową p0 musi być większe od zera.
Możemy rozumowanie poprawić tak. Możemy przyjąć, że mini-malna liczba kolizji zawsze będzie: np. 1 na 1000 godzin. I jako hipo-tezę zerową przyjąć p = 0.001 wobec hipotezy przeciwnej p > 0.001.Jeśli te dane: n = 744, k = 13, p0 = 0.0001 wstawimy do modeluF1, to wartość statystyki testowej wyjdzie 14.22, a zbiór krytycznybędzie równy W = [1.64;∞). Hipotezę zdecydowanie odrzucamy. Tooznacza, że sytuacja się wyraźnie poprawiła.
81
ZADANIE 55. Wyniki egzaminu ze statystyki studentów cho-dzących na wykłady (C) i niechodzących (N) w pewnej grupie wgrezultatów (zaliczony - ZAL i niezaliczony - NZAL) podane są w ta-belce
ZAL NZALN 2 102C 28 36
Zbadaj, czy hipoteza zaliczenie egzaminu jest niezależne od tegoczy student chodzi na zajęcia jest słuszna. Przyjmij α = 0.05.
Rozwiązanie.
Dodając dane w kolumnach i wierszach zapiszmy naszą tabelkęnastępująco