Top Banner
Rozklady zmiennych losowych Estymacja przedzialowa Statystyka matematyczna. Wyklad III. Estymacja przedzialowa Edward Kozlowski e-mail:[email protected] Edward Kozlowski Estymacja przedzialowa
23

Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Jan 11, 2017

Download

Documents

lecong
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Statystyka matematyczna. Wykład III.

Estymacja przedziałowa

Edward Kozłowski

e-mail:[email protected]

Edward Kozłowski Estymacja przedziałowa

Page 2: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Spis treści

1 Rozkłady zmiennych losowychRozkład χ2

Rozkład t-StudentaRozkład Fischera

2 Estymacja przedziałowaPrzedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancji σ2 i odchyleniastandardowego σ

Edward Kozłowski Estymacja przedziałowa

Page 3: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Rozkład χ2

Definicja 1.

Niech zmiwenne losowe Ui, i = 1, 2, ..., n mają rozkład normalnyN (0; 1), wtedy zmienna losowa

Xn =n∑i=1

U2i

ma rozkład χ2 o n stopniach swobody oraz oznaczamy jako Xn ∼ χ2 (n).

Funkcja gęstości

f (x, n) =

{1√

2nΓ(n2 )xn2−1e−

x2 , dla x > 0

0, dla x ¬ 0

gdzie gamma-funkcja Γ (·) jest dana wzorem

Γ (m) =

∞∫0

sm−1e−sds.

Edward Kozłowski Estymacja przedziałowa

Page 4: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Własności:

Wartoś oczekiwana zmiennej losowej Xn o rozkładzie χ2 (n) iwariancja wynoszą

EXn = n

V ar (Xn) = 2n

Zmienna losowa jest asymptotycznie zbieżna (według rozkładu)

Xn − n√2n

F−→ U dla n −→∞

gdzie zmienna losowa U ∼ N (0; 1). Zatem dla dośc dużego n mamyXn ∼ N

(n;√

2n). Powyższą aproksymację możemy stosowac dla

n ­ 30.

Edward Kozłowski Estymacja przedziałowa

Page 5: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Zastosowanie:Niech X1, ..., Xn oznacza n−elementowa próba której elementy sąpodporządkowane rozkładowi normalnemu N (µ, σ). Niech

S2 =1n

n∑i=1

(Xi − X

)2,

X =1n

n∑i=1

Xi.

Zmienna losowa

Yn =nS2

σ2

ma rozkład χ2 (n− 1) i nie zależy od X!!!

Edward Kozłowski Estymacja przedziałowa

Page 6: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Rozkład t-Studenta

Definicja 2.

Niech U oraz Xn będą niezależnymi zmiennymi losowymi o rozkładachU ∼ N (0; 1) oraz Xn ∼ χ2 (n) odpowiednio. Zmienna losowa

Tn =U√Xnn

ma rozkład t-Stunenta o n stopniach swobody, oznaczamy jakoTn ∼ t (n).

Funkcja gęstości jest dana wzorem

f (t, n) =Γ(n+1

2

)√nπΓ

(n2

) (1 +t2

n

)−n+12

Edward Kozłowski Estymacja przedziałowa

Page 7: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Własności:Dla n ­ 2 wartoś oczekiwana i wariancja zmiennej losowej Tn orozkładzie t (n) wynoszą

ETn = 0

V ar (Tn) =n

n− 2Dla n = 1 rozkład t-Studenta jest rozkładem Cauchy’ego, gdziefunkcja gęstości wynosi

f (t) =1π

11 + t2

Wartoś oczekiwana i wariancja w tym przypadku nie istnieją!!

lima−→+∞

a∫0

t

1 + t2dt = +∞

Zmienna losowa Tn jest asymptotycznie zbieżna (według rozkładu)do rozkładu normalnego N (0; 1), tzn.

TnF−→ U dla n −→∞

gdzie zmienna losowa U ∼ N (0; 1). Powyższą aproksymacjęmożemy stosowac dla n ­ 30.

Edward Kozłowski Estymacja przedziałowa

Page 8: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Zastosowanie:Niech n−elementowa próba X1, ..., Xn jest podporządkowana rozkładowinormalnemu N (µ, σ) oraz X i S2 oznaczają estymatory średniej iwariancji odpowiednio. Zmienna losowa postaci

Tn =X − µS

√n− 1

ma rozkład t-Studenta o n− 1 stopniach swobody (Tn ∼ t (n− 1)).

Edward Kozłowski Estymacja przedziałowa

Page 9: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Rozkład Fischera

Definicja 3.

Niech zmienne Xn oraz Xm mają rozkłady χ2 o n i m stopniachswobody odpowiednio( Xn ∼ χ2 (n), Xm ∼ χ2 (m)). Zmienna losowa

Vn,m =XnnXmm

ma rozkład Fischera o n i m stopniach swobody (oznaczamy jakoVn,m ∼ F (n,m)).

Funkcja gęstości jest dana wzorem

f (x, n,m) =

Γ(n+m2 )

Γ(n2 )Γ(m2 )nn2m

m2 x

n2 −1

(m+nx)n+m2

, dla x > 0,

0, dla x ¬ 0.

Edward Kozłowski Estymacja przedziałowa

Page 10: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Własności:

Wartość oczekiwana zmiennej losowej Vn,m

EVn,m =m

m− 2

dla m > 2.

Wariancja zmiennej losowej Vn,m

V ar (Vn,m) =2m2 (m+ n− 2)

n (m− 2)2 (m− 4)

dla m > 4.

Edward Kozłowski Estymacja przedziałowa

Page 11: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Zastosowanie:Niech n−elementowa próba X1, ..., Xn jest podporządkowana rozkładowinormalnemu N (µX , σ), natomiast m−elementowa próba Y1, ..., Ym jestpodporządkowana rozkładowi normalnemu N (µY , σ). Zmienne losoweX1, ..., Xn, Y1, ..., Ym są niezależne. Niech X i Y oznaczają estymatoryśrednich zmiennych losowych X i Y odpowiednio. Zmienna losowa

Vn,m =

1n−1

n∑i=1

(Xi − X

)21

m−1

n∑i=1

(Yi − Y

)2ma rozkład F (n− 1,m− 1).

Edward Kozłowski Estymacja przedziałowa

Page 12: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Estymacja przedziałowa

Metoda przedziałowa polega na określeniu przedziałów ufności dlanieznanych parametrów rozkładu.

Definicja 4.

Dla ustalonego poziomu ufności 1− α (poziomu istotności 0 < α < 1)przedziałem ufności parametru Θ nazywamy przedział (Θ1,Θ2) gdziekońce tego przedziału Θ1 = Θ1 (X1, ..., Xn) i Θ2 = Θ2 (X1, ..., Xn) sąfunkcjami próby losowej oraz spełniają warunek

P (Θ1 (X1, ..., Xn) < Θ < Θ2 (X1, ..., Xn)) = 1− α.

Widzimy że końce przedziału ufności są zmiennymi losowymi. Nieznanawartość parametru Θ może należeć do przedziału (Θ1,Θ2) lub tez nie!Dla różnych próbek losowych x1, ..., xn znajdujemy różne przedziałyufności.Stosunek przedziałów ufności które zawierają nieznany parametr Θ dowszystkich przedziałów skonstruowanych w oparciu o próby x1, ..., xnwynosi 1− α.

Edward Kozłowski Estymacja przedziałowa

Page 13: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Przykład 1.Dla poziomu ufności 1− α w oparciu o próbę losową X1, ..., Xn znaleźćprzedział ufności dla nieznanej wartości µ populacji, w której cecha Xma rozkład normalny N (µ, σ) oraz prametr σ jest znany.Z twierdzenia Lindeberga - Levy’ego zmienna losowa

X =X1 +X2 + ...+Xn

n

dąży do rozkładu N(µ, σ√

n

), natomiast statystyka

U =X − µσ

√n

ma rozkład normalny N (0, 1). Zadanie polega na wyznaczeniu kwantyliu1 i u2 tak aby spełniona była równość

P (u1 < U < u2) = F (u2)− F (u1) = 1− α.

Edward Kozłowski Estymacja przedziałowa

Page 14: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Przyjmuąc u2 = F−1 (1− α2) oraz u1 = F−1 (α1), gdzie α = α1 + α2,mamy

F (u2)− F (u1) = 1− α2 − α1 = 1− α

Rozwiązując nierówność

u1 <X − µσ

√n < u2

otrzymujemyX − u2

σ√n< µ < X − u1

σ√n.

Edward Kozłowski Estymacja przedziałowa

Page 15: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Uwaga.Wybierając dowolne α1, α2 tak aby była spełniona równośćα = α1 + α2 otrzymujemy różne przedziały ufności.Jeżeli α1 = α2 = α

2 , to dla rozkładu normalnego N (0, 1)mamy F−1

(1− α

2

)= −F−1

(α2

), stąd −u1 = u2. Zatem przedział

ufności jest postaci

X − u σ√n< µ < X + u

σ√n,

gdzie u = F−1(1− α

2

).

W przypadku, gdy α1 = α, to mamy

P (u < U) = 1− α.Rozwiązując nierówność

u <X − µσ

√n

otrzymujemy lewostronny przedział ufności

µ < X − u σ√n,

gdzie u = F−1 (α).Edward Kozłowski Estymacja przedziałowa

Page 16: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Uwaga cd.

W przypadku, gdy α2 = α, to

P (U < u) = 1− α.

Rozwiązując nierówność

X − µσ

√n < u

otrzymujemy prawostronny przedział ufności

X − u σ√n< µ,

gdzie u = F−1 (1− α).

Edward Kozłowski Estymacja przedziałowa

Page 17: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Przedziały ufności dla nieznanej wartości przeciętnej

* Cecha X ma rozkład normalny N (µ, σ), gdzie prametr µ jestnieznany, natomiast znane jest ochylenie standardowe σ. Dlapoziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedział ufności dlanieznanej wartości µ populacji wynosi (patrz przykład 1)

X − u σ√n< µ < X + u

σ√n,

gdzie u = F−1(1− α

2

).

Edward Kozłowski Estymacja przedziałowa

Page 18: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane oraz n < 100. Statystyka

Tn =X − µS

√n− 1

ma rozklad t-Studenta o n− 1 stopniach swobody, gdzie

X =1n

n∑i=1

Xi

S =

√√√√ 1n

n∑i=1

(Xi − X

)2Z tablic rozkładu t-Studenta na poziomie ufności 1− α odczytujemykwantyle rzędu 1− α

2 oraz α2 . Ponieważ rozkład t-Studenta jest

rozkładem symetrycznym, to

t∗ = t−1(α

2, n− 1

)= −t−1

(1− α

2, n− 1

),

gdzie t(x, n) oznacza dystrybuantę rozkladu t-Studenta o n stopniachswobody.

Edward Kozłowski Estymacja przedziałowa

Page 19: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Dla poziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedziałufności dla nieznanej wartości µ populacji wyznaczamy z równości

P

(−t∗ < X − µ

S

√n− 1 < t∗

)= 1− α.

Ostatecznie otrzymujemy

X − S t∗√n− 1

< µ < X + St∗√n− 1

.

Edward Kozłowski Estymacja przedziałowa

Page 20: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

* Cecha X ma dowolny rozkład o nieznanych wartości średniej µ iodchyleniu standardowym σ (σ <∞). Dla dużych populacji n ­ 100 ztwierdzenia Lindeberga - Levy’ego statystyka

U =X − µS1

√n

ma rozkład asymptotycznie zbieżny do N (0, 1), gdzie

S21 = 1

n−1

n∑i=1

(Xi − X

)2jest nieobciążonym estymatorem odchylenia

standardowego σ.Dla poziomu ufności 1− α w oparciu o próbę X1, ..., Xn przedziałufności dla nieznanej wartości µ populacji wynosi

X − u S1√n< µ < X + u

S1√n,

gdzie u = F−1(1− α

2

).

Edward Kozłowski Estymacja przedziałowa

Page 21: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Przedziały ufności dla nieznanej wariancji i odchyleniastandardowego

* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane. Dla próby o liczebności n ¬ 50 statystyka

χ2 =nS2

σ2

ma rozkład χ2 (chi-kwadrat) o n− 1 stopniach swobody. Z tablicrozkładu χ2 na poziomie ufności 1− α odczytujemy kwantyle rzędu1− α

2 oraz α2 i oznaczamy je jako χ2

(α2 , n− 1

), χ2

(1− α

2 , n− 1). Dla

poziomu istotności α w oparciu o próbę X1, ..., Xn przedział ufności dlanieznanej wariancji w populacji wyznaczamy z równości

P

(χ2(α

2, n− 1

)<nS2

σ2 < χ2(

1− α

2, n− 1

))= 1− α.

Edward Kozłowski Estymacja przedziałowa

Page 22: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

Ostatecznie, przedział ufności dla wariancji σ2 wynosi

nS2

χ2(1− α

2 , n− 1) < σ2 <

nS2

χ2(α2 , n− 1

) ,natomiast dla odchylenia standardowego σ

S√n√

χ2(1− α

2 , n− 1) < σ <

S√n√

χ2(α2 , n− 1

) .

Edward Kozłowski Estymacja przedziałowa

Page 23: Statystyka matematyczna. Wykład III. Estymacja przedziałowa

Rozkłady zmiennych losowychEstymacja przedziałowa

Przedziały ufności dla nieznanej wartości przeciętnej µPrzedziały ufności dla nieznanej wariancjiσ2 i odchylenia standardowegoσ

* Cecha X ma rozkład normalny N (µ, σ), gdzie prametry µ i σ sąnieznane. Dla próby o liczbności n ­ 50 statystyka

√2χ2 =

√2nS2

σ2 =S

σ

√2n

dąży do rozkładu normalnego N(√

2n− 3, 1). Zatem dla poziomu

istotności α w oparciu o próbę X1, ..., Xn przedział ufności dla nieznanejwariancji w populacji wyznaczamy z równości

P

(−u < S

σ

√2n−

√2n− 3 < u

)= 1− α,

gdzie u jest kwantylem rzędu 1− α2 dla rozkładu normalnego N (0, 1).

Ostatecznie przedział ufności dla odchylenia standardowego σ wynosi

S√

2n√2n− 3 + u

< σ <S√

2n√2n− 3− u

.

Edward Kozłowski Estymacja przedziałowa