Top Banner
Cao Hào Thi 74 Chươ ng 7 ƯỚ C LƯỢ NG CÁC THAM STHNG KÊ (Estimation) 7.1 KHÁI NIM CHUNG Xét mt tp hợ p chính gm N biến ngu nhiên X có hàm mt độ xác sut là f (x,θ); trong đó θ là các tham sthng kê ca tp hợ p chính. Thí d : Trong phân ph i nhthc: f x C n x x n x  ( , ) ( ) θ ρ ρ = 1   θ = ρ, θ [0 , 1] Trong phân ph i poisson f x e x x ( , ) ! θ λ λ =   θ = λ λ > 0 Trong phân ph i chun f x e x ( , ) ( ) θ πσ µ σ = 1 2 2 2 2 2   θ = (µ, σ 2 ) ; -< µ < +; 0 < σ 2 < + Gi {x 1, x 2 ,.... , x n } là mu ng u nhiên, cỡ mu n đượ c dùng l y ra ttp h ợ p chính tuân theo hàm mt độ xác sut f (x,θ).  đây dng ca hàm f xem như đã biết còn các tham s thng kê θ ca tp hợ p chính xem như chưa biết. Vn đề đặt ra ở chươ ng trình này là da vào các mu quan sát {x 1 ,x 2 ,...,x n } ta ướ c l ượ ng xem giá tr cthca θ bng bao nhiêu (bài toán đó gi ướ c lượ ng đim ) hoc ướ c lượ ng xem θ nm trong khong nào (bài toán ướ c lượ ng khong). 7.2 ƯỚ C LƯỢ NG ĐIM (Point Estimation) 7.2.1 Ướ c lượ ng và giá tr ướ c lượ ng (Estimator And Estimate) a) Ướ c l ượ ng (Estimator) và hàm ướ c l ượ ng - Là biến ngu nhiên hay các tham sthng kê ca mu đượ c dùng để ướ c l ượ ng các tham sthng kê chưa biết ca tp hợ p chính. - Ướ c lượ ng ca tham sthng kê θ ca tp hợ p chính đượ c ký hiu là θ ˆ  - Da vào mu {x 1 ,x 2 ...,x n } ngườ i ta lp ra Hàm θ ˆ = θ ˆ (x 1 ,x 2, ....,x n ) để ướ c lượ ng cho θ. θ ˆ  đượ c gi là hàm ướ c lượ ng ca θ hay gi tt là ướ c lượ ng ca θ.
15

ước lượng khoảng cho tham số thống kê

Apr 08, 2018

Download

Documents

TrangNguyen
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 1/15

Page 2: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 2/15

Cao Hào Thi 75

θ̂ chỉ phụ thuộc vào giá tr ị quan sát x1, x2, ... ,xn chứ không phụ thuộc vào các tham

số chưa biết θ của tập hợ p chính.

b)  Giá tr ị  ướ c l ượ ng (Estimate) hay còn g ọi là giá tr ị  ướ c l ượ ng đ i ể m (Point 

Estimate)

Là giá tr ị cụ thể của ướ c lượ ng θ̂ và đượ c xem như giá tr ị ướ c lượ ng của tham số thống

kê θ của tập hợ p chính.

Tham số thống kê và tập hợ pchính (Population Parameter)

Ướ c lượ ng (Estimation)Giá tr ị ướ c lượ ng

Estimate (Point estimate)

Số trung bình µ  X 

Phươ ng sai 2xσ   Sx

Độ lệch chuẩn σx  Sx 

Tỷ lệ p f ̂ 

7.2.2 Ướ c lượ ng không chệch: (Unbiased Estimators)

a)  Ướ c l ượ ng không chệ ch:

Ướ c lượ ng θ đượ c gọi là ướ c lượ ng không chệch của tham số thống kê θ nếu k ỳ vọng

của θ̂ là θ.

E ( θ̂ ) = θ 

Thí d ụ

 E(X ) = µ => X là ướ c lượ ng không chệch của µ 

E(Sx2) = 2

xσ => Sx2 là ướ c lượ ng không chệch cuả  2

xσ  

E ( f ̂) = p => f ̂ là ướ c lượ ng không chệch của p

b)  Độ chệ ch (The Bias)

Gọi θ̂ là ướ c lượ ng của θ: Bias( θ̂ ) = E ( θ̂ ) - θ 

Đối vớ i ướ c lượ ng không chệch ⇒ Bias = độ chệch = 0

c)  Ướ c l ượ ng hi ệ u quả t ố t nhấ t:

Gọi θ̂ 1 và θ̂ 2 là 2 ướ c lượ ng không chệch của θ dựa trên số lượ ng của mẫu quan sát

giống nhau.

o  θ̂ 1 đượ c gọi là hiệu quả hơ n θ̂ 2 nếu: Var ( θ̂ 1) < Var ( θ̂ 2)

o  Hiệu quả tươ ng đối giữa hai ướ c lượ ng là tỉ số giữa 2 phươ ng sai của chúng.

Hiệu quả tươ ng đối (Relative Efficency) =)ˆ(Var 

)ˆ(Var 

1

2

θ

θ 

Page 3: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 3/15

Cao Hào Thi 76

o  Nếu θ̂ là ướ c lượ ng không chệch của θ và nếu không có một ướ c lượ ng không

chệch nào có phươ ng sai nhỏ hơ n phươ ng sai của θ̂ thì θ̂  đuợ c gọi là ướ c lượ ng

tốt nhất (Best Estimator) hay θ̂ còn gọi là ướ c lượ ng không chệch có phươ ng sai

nhỏ nhất của θ (Minimum Variance Unbiased Estimator of θ)

θ2θ1

 

θ2

θ1

 

θˆ

1 : ướ c lượ ng không chệch của θ  θˆ

1 θˆ

2: ướ c lượ ng không chệch của θ 

θ̂ 2 : ướ c lượ ng chệch của θ  θ̂ 1 ướ c lượ ng hiệu quả hơ n θ̂ 2:

d)  Sai số bình phươ ng trung bình (Mean Squared Error - MSE)

Sai số bình phươ ng trung bình của ướ c lượ ng θ̂  đượ c định nghĩ a như sau: 

MSE( θ̂ ) = E [( θ̂ - θ)2]

Ngườ i ta chứng minh đượ c r ằng:

MSE ( θ̂ ) = Var( θ̂ ) + [θ - E ( θ̂ )]2

 

MSE ( θ̂ ) = Var ( θ̂ ) + [ Bias( θ̂ )]2 

Nếu θ̂ là ướ c lượ ng không chệch ta có: 

Bias( θ̂ ) = 0

⇒ MSE ( θ̂ ) = Var ( θ̂ )

e)  Ướ c l ượ ng nhấ t quán vữ ng (Consistent Estimators)

θ̂ n = θ̂ (x1, x2,... xn) gọi là ướ c lượ ng vững của θ nếu vớ i mọi ε > 0 ta có:

∞→ilim P( | θ̂ n - θ | ≤ ε) = 1

tức là dãy θ̂ n hội tụ theo xác suất tớ i θ khi n → ∞ 

Page 4: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 4/15

Cao Hào Thi 77

7.3  ƯỚ C LƯỢ NG KHOẢNG (Interval Estimation)

7.3.1 Khoảng tin cậy (Confidence Interval)

a)  Ướ c l ượ ng khoảng và giá tr ị  ướ c l ượ ng khoảng 

(Interval Estimator And Interval Estimate).

Ướ c lượ ng khoảng: Ướ c lượ ng khoảng đối vớ i tham số thống kê của tập hợ p chính θ 

là một quy tắc dựa trên thông tin của mẫu để xác định miền (Range) hay khoảng

(Interval) mà tham số θ hầu như nằm trong đó.

Gía tr ị ướ c lượ ng khoảng: là giá tr ị cụ thể của miền hay khoảng mà tham số θ nằm

trong đó.

b)  Khoảng tin cậy và độ tin cậy (Confidence Interval and Level of Confidence)

Gọi θ là tham số thống kê chưa biết. Giả sử dựa trên thông tin của mẫu ta có thể xác

định đượ c 2 biến ngẫu nhiên A và B sao cho

P (A < θ < B) = 1 - α vớ i 0 < α < 1

Nếu giá tr ị cụ thể của biến ngẫu nhiên A và B là a và b thì khoảng (a,b) từ a đến b

đượ c gọi là khoảng tin cậy của θ vớ i xác suất là (1 - α)

Xác suất (1 - α) đượ c gọi là độ tin cậy của khoảng.

Ghi chú:

o  Trong thực tế, độ tin cậy (1-α) do nhà thống kê chọn theo yêu cầu của mình,

thông thườ ng độ tin cậy đượ c chọn là 0,90; 0,95; 0,99...

o  α là xác suất sai lầm khi chọn khoảng tin cậy (a, b)

7.3.2  Khoảng tin cậy đối vớ i số trung bình của phân phối chuẩn trong trườ ng hợ pđã biết phươ ng sai của tập hợ p chính:

Nghĩ a là đi tìm ướ c lượ ng của µ trong N (µ, σx2) khi đã biến σx2 

a)  Đi ể m phần tr ăm gi ớ i hạn trên Z (Upper Percentage Cut Off Point)

Gọi Z là biến ngẫu nhiên chuẩn hóa và α là số bất k ỳ sao cho 0 < α < 1

Zα là điểm phần tr ăm giớ i hạn trên nếu.

P (Z > Zα ) = α 

Ghi chú: 

  P (Z > Zα) = F

Z(Z

α) = 1 - α 

Page 5: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 5/15

Page 6: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 6/15

Cao Hào Thi 79

Thí d ụ:

Giả sử tr ọng lượ ng của các học sinh lớ p 2 tuân theo phân phối chuẩn vớ i độ lệch chuẩn

1,2kg. Mẫu ngẫu nhiên gồm 25 học sinh có trung bình là 19,8kg. Tìm khoảng tin cậy 95%

đối vớ i tr ọng lượ ng trung bình của tất cả học sinh lớ p 2 trong 1 tr ườ ng.

Giải:

Ta có: 100 (1 - α) = 95 ⇒  α = 0,05

⇒ Zα/2 =Z0,025 

⇒ P(Z > Z0,025) = 0,025

P(Z < Z0,025) = FZ (Z0,025) = 1 - 0,025 = 0,975

Tra bảng ta có: Z0,025 = 1,96

Khoảng tin cậy 95% đối vớ i số trung bình tập chính µ sẽ là

x n 

x n 

x X − < < +α α σ  µ  σ / / 2 2

 

Vớ i X = 19,8 kg σx = 1,2 kg n = 25 Zα/2 = 1,96

Vậy : 19,33 < µ < 20,27

Ghi chú:

ε =n

Z x/ σα 2 : gọi là độ chính xác của ướ c lượ ng hay dung sai

X là trung tâm của khoảng tin cậy vớ i bề r ộng của khoảng tin cậy của µ là

W n 

x = =2

22α  σ ε / 

 

o  W càng nhỏ thì ướ c lượ ng càng chính xác ( ≡ ε càng nhỏ)

o  Vớ i xác suất α và cỡ mẫu nhỏ, σx càng lớ n thì W càng lớ n.

o  Vớ i α và σx cho tr ướ c, n càng lớ n thì W càng nhỏ.

o  Vớ i σx và n cho tr ướ c, (1 - α) càng lớ n thì W càng nhỏ 

n = 25 σx = 1.2 1-α = 0.99

n = 25

n = 64

n = 25

σx = 1.2

σx = 1.2

σx = 1.2

1-α = 0.95

1-α = 0.95

1-α = 0.95 

c)  Khoảng tin cậy của số trung bình µ trong t ập hợ p chính tr ườ ng hợ p cỡ mẫ u l ớ n.

Giả sử ta có mẫu vớ i cỡ mẫu là n đượ c lấy từ tập hợ p chính có số trung bình là µ.

Gọi X là số trung bình của mẫu và Sx là phươ ng sai của mẫu.

Page 7: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 7/15

Cao Hào Thi 80

Nếu n lớ n thì khoảng tin cậy vớ i xác suất 100(1-α) % đối vớ i µ đượ c xem đúng là:

x n 

x n 

X x − < < +α α µ / / 2 2

 

Ghi Chú:

o  Sự ướ c lượ ng này gần đúng ngay cả khi tập hợ p chính không theo phân phối

chuẩn.

o  Khi n lớ n ta có thể xem gần đúng Sx = σx 

7.3.3  Phân phối Stutent t:

Trong phần tr ướ c, ta đi tìm khoảng tin cậy của µ trong N (µ, σx2) khi đã biết σx

2 hoặc tìm

khoảng tin cậy của µ khi có mẫu lớ n.

Trong tr ườ ng hợ p không biết phươ ng sai σx

2

và cỡ mẫu không lớ n, để tìm khoảng tin cậycủa µ ta cần phải có một phân phối thích hợ p hơ n, đó là phân phối Student t.

a)  Phân phố i Student t 

Cho mẫu ngẫu nhiên vớ i cỡ n vớ i số trung bình của mẫu X và độ lệch chuẩn mẫu Sx;

mẫu đượ c lấy ra từ tập hợ p chính vớ i số trung bình là µ.

Biến ngẫu nhiên :

t x 

S n x 

=− µ 

 t tuân theo phân phối Student t vớ i độ tự do là n - 1

t

0

f(t)Phân phối chuẩn

Phân phối Student tvớ i độ tự do là 3

 

Biến ngẫu nhiên X đượ c gọi là tuân theo phân phối Studen t vớ i độ tự do ν nếu hàm mật

độ xác định có dạng.

f x 

x ( )

( )

( , )

( )

=+

−+

1

1

2 2

2 1

2

ϑ 

ϑ ϑ 

ϑ 

 

Page 8: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 8/15

Cao Hào Thi 81

b)  Đi ể m phần tr ăm gi ớ i hạn trên t ν,α:

Biến ngẫu nhiên tuân theo phân phối Student t vớ i độ tự do ν, đượ c ký hiệu là tν. tν ,α  là

điểm phần tr ăm giớ i hạn trên nếu:

P(tν > tν ,α ) = α 

Ngườ i ta lập bảng tính sẳn cho các giá tr ị diện tích ở dướ i đườ ng cong từ tν ,α  đến +∞ 

t

α

tυ,α0

f(tυ)

 

Tươ ng tự phần tr ăm trên ta có:

P(-tν ,α /2 < tν  < tν ,α /2) = 1 - α 

t

α/2 α/2

tυ,α/20

f(tυ)

−tυ,α/2 

7.3.4  Khoảng tin cậy đối vớ i số trung bình µ trong phân phối chuẩn khi chư a biếtphươ ng sai:

(Khoảng tin cậy của µ trong N(µ, σx2) khi chưa biết σx

Giả sử ta có mẫu ngẫu nhiên vớ i cỡ mẫu n từ phân phối chuẩn vớ i số trung bình là µ vàphươ ng sai σx

2 chưa biết. Nếu số trung bình mẫu là X và độ lệch chuẩn mẫu là Sx thì

khoảng tin cậy của số trung bình tập hợ p chính µ sẽ đượ c tính bở i .

n

Stx

n

Stx

x/,nx/,n 2121 α−α− +<µ<−  

Trong đó tn-1,α/2 là số có P(tn-1 > tn-1,α/2) =2

αvà tn-1 là biến ngẫu nhiên tuân theo phân phối

Student vớ i độ tự do là n - 1

Chứ ng minh:

Page 9: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 9/15

Cao Hào Thi 82

P(-tn-1,α/2 < tn-1 < tn-1,α/2) = 1 - α 

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ <

µ−<− α−α− 12121 /,n

x

/,n tn/S

XtP

α−=⎟⎟⎠⎞⎜⎜

⎝ ⎛  <µ−<− α−α− 1

2121

n

StXn

StPx/,nx/,n

 

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ +<µ<− α−α−

12121

n

StX

n

StXP

x/,nx/,n 

Thí d ụ: Mẫu ngẫu nhiên của tr ọng lượ ng 6 học sinh lớ p 2 có giá tr ị như sau:

18,6kg 18,4kg 19,2kg 20,8kg 19,4kg 20,5kg

Tìm khoảng tin cậy 90% đối vớ i số trung bình của tất cả học sinh lớ p 2. Gỉa sử r ằng phân

phối tr ọng lượ ng của tất cả học sinh lớ p 2 là phân phối chuẩn.

Giải: 

Tr ướ c hết ta phải tìm số trung bình mẫu X và phươ ng sai mẫu Sx

Số trung bình mẫu:

x n 

xi = ∑ = =1 1

6116 9 19 4833( . ) .

 

Phươ ng sai mẫu:

S n 

x nx x i 2 2

21

1= − ∑ −( ) 

=

1

52282 41 6 19 4833 0 962( . , , ) ,− × =

 

Độ lệch chuẩn: S x 

= =0 96 098, .  

Khoảng tin cậy 90% đối vớ i tr ọng lượ ng trung bình của tất cả học sinh lớ p 2 là:

x l 

n x 

n x n x  − < < +− −1 2 1 2, ,/ / α α µ 

 

X = 19,4833 , Sx = 0,98 , n = 6

i xi xi2

1 18,6 345,96

2 18,4 338,56

3 19,2 368,64

4 20,8 432,64

5 19,4 376,366 20,5 420,25

Tổn 116,9 2282,4

Page 10: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 10/15

Cao Hào Thi 83

100 (1-α) = 90 => α = 0,10 => α/2 = 0,05

Tra bảng ta có: tn-1,α/2 = t5,0.05 = 2.015

19 482 015 0 098

619 48

2 015 0 98

6

1867 20 29

.. .

.. .

. .

−×

< < +×

< <

µ 

µ  

Các khoảng tin cậy:

(18.89,4) (20.07,4)

(18.67,2) (20.29,2)

(18.45,0) (20.51,0)

(17.87,-2) (21.09,-

Khoảng tin cậy 99%

Khoảng tin cậy 95%

Khoảng tin cậy 90%

Khoảng tin cậy 80%

 

7.3.5  Khoảng tin cậy đối vớ i phươ ng sai của phân phối chuẩn σ2 

Nhắc lại, giả sử ta có mẫu ngẫu nhiên vớ i cỡ mẫu n đượ c lấy ra từ tập hợ p chính có phân

phối chuẩn N(µx,sx2) và gọi Sx

2 là phươ ng sai của mẫu.

Biến ngẫu nhiên2

22

,

)1(

x

xS n

σ 

χ  α γ 

−= sẽ tuân theo phân phối 2χ  vớ i độ tự do n - 1

a)  Đi ể m phần tr ăm gi ớ i hạn trên2

,α γ χ   

Biến ngẫu nhiên tuân theo phân phối 2χ  vớ i độ tự do γ đượ c ký hiệu 2

,α γ χ   

2

,α γ χ  là điểm phần tr ăm giớ i hạn trên nếu

  P( 2

γ χ  > 2

,α γ χ  ) = α 

α

χ2υ,α

 

Thí dụ: Tìm2

%5;6χ   

Page 11: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 11/15

Cao Hào Thi 84

P( 2

6χ  > 2

%5;6χ  ) = 5% ⇒  2

%5;6χ  = 12,59

Tươ ng tự ta có:

⎢⎢⎢⎢

−=<

=>

−2

1)(2

)(

2

2/1,

2

2

2/,

2

α χ χ 

α χ χ 

α γ γ 

α γ γ 

 

  α−=χ<χ<χ αγγα−γ 122

2221 )(P /,/,  

t

 

b)  Khoảng tin cậy của phươ ng sai phân phố i chuẩ n σ2:

Khoảng tin cậy vớ i xác suất 100 (1- α)% của σ2 là

2211

22

221

2 11

/,n

x

/,n

x

S)n(S)n(

α−−α− χ

−<σ<χ

− 

Trong đó 221 /,n α−χ là số có P( 2

γ χ  > 221 /,n α−χ ) = α/2

Trong đó  2211 /,n α−−χ là số có P( 2

γ χ  > 2211 /,n α−−χ ) = α/2

Và biến ngẫu nhiên 21−χn tuân theo phân phối 2χ vớ i độ tự do là n – 1

Chứng minh :

α−=χ<χ<χ αγγα−γ 122

2221 )(P /,/,  

α−=χ<χ<χ α−−α−− 1221

21

2211 )(P /,nn/,n  

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ χ<

σ

−<χ α−α−− 1

1 2212

22

211 /,n

x

x/,n

S)n(P

α−=⎟⎟

⎜⎜

⎝ 

⎛ 

χ

−<σ<

χ

α−−α−

111

2211

22

221

2

/,n

xx

/,n

x S)n(S)n(P

Thí dụ : Một mẫu ngẫu nhiên gồm 15 viên thuốc nhức đầu cho thấy độ lệch chuẩn trong

thành phần cấu tạo thuốc là 0,8. Tìm khoảng tin cậy 90% của phươ ng sai lô thuốc nói trên(thành phần trong lô thuốc tuân theo phân phối chuẩn)

α/2α/2

-χ2ν,1-α/2 χ2

ν,α/2

Page 12: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 12/15

Cao Hào Thi 85

Giải :

n = 15, 2xS = 0,82 = 0,64; α = 10%

Tra bảng 221 /,n α−χ = 68,232

%5;14 =χ   

Và 2211 /,n α−−χ = 57,62

%95;14 =χ   

Vậy:2

211

22

221

2 11

/,n

xx

/,n

x S)n(S)n(

α−−α− χ

−<σ<

χ

− 

⇔  0,378 < 2xσ < 1,364

⇔  0,61 < xσ < 1,17 

7.3.6  Ướ c lượ ng khoảng tin cậy của tham số thống kê p trong phân phối nhị thứ c

trong điều kiện cỡ mẫu lớ n :

Nhắc lại, gọi f là tỷ số của số lần thành công trong n phép thử độc lập:n

Xf  =  

X tuân theo phân phối chuẩn có - số trung bình µ = np

- Phươ ng sai : σ2 = np(1-p)

Ta có : E(f) = p f là ướ c lượ ng không chệch của p.

n

)p(pf 

−=σ

Khi cỡ mẫu đủ lớ n thì biến ngẫu nhiên chuẩn hóa Z =m/)p(p

pf 

1sẽ gần đúng có phân

phối chuẩn chuẩn hóa :

22 11f f  S

n

)f (f 

n

)p(p=

−≈

−=σ  

Khi đó biến ngẫu nhiên Z =n/)f (f 

pf 

1sẽ có phân phối chuẩn chuẩn hóa.

Khi Z tuân theo phân phối chuẩn chuẩn hóa, ta có:

P(-Zα/2 < Z < Zα/2) = 1 - α 

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛ <

−<− αα 1

122 // Z

n/)f (f 

pf ZP  

α−=⎟⎟⎠

⎞⎜⎜⎝ 

⎛  −+<<

−− αα 1

1122

n

)f (f Zf p

n

)f (f Zf P //

 

Khoảng tin cậy của p :

Gọi f là tỷ số số lần thành công quan sát đượ c trong phép thử đượ c rút từ tập hợ p chính cótỷ số số lần thành công là p. Nếu n lớ n thì khoảng tin cậy của p là:

Page 13: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 13/15

Cao Hào Thi 86

n

)f (f Zf p

n

)f (f Zf  //

−+<<

−− αα

1122  

Trong đó Zα/2 là số có P(Z > Zα/2) = α/2 (Z là biến ngẫu nhiên chẩn hóa)

Thí d ụ:

Một công ty đi nhận một lô hàng gồm vài ngàn sản phẩm. Ngườ i giám định lô hàng lấy

ngẫu nhiên 81 sản phẩm và nhận thấy 8 sản phẩm không đạt yêu cầu. Tìm khoảng tin cậy

90% của tỷ lệ số sản phẩm không đạt yêu cầu trong toàn bộ lô hàng.

Giải:

Ta có : α = 10% ⇒ tra bảng Zα/2 = Z5% = 1,645,

099,081

8===

n

X f  và

n

)f (f f 

−=σ

1= 0,033

Khoảng tin cậy 90% của p là :

0,099 -1,645*0,033 < p < 0,099 + 1,645*0,033

0,045 < p < 0,153

7.3.7  Ướ c lượ ng cỡ mẫu (Estimating the Sample Size)

Trong các phần tr ướ c, chúng ta đi tìm các ướ c lượ ng khoảng đối vớ i các tham số thống kê

θ (µx, σ2x, p …) của tập hợ p chính dựa trên các mẫu cho tr ướ c (nghĩ a là đã biết cỡ mẫu

n). Vớ i cách làm đó, ta có thể gặp những k ết quả không mong muốn là bề r ộng của

khoảng tin cậy w quá lớ n, có nghĩ a là độ chính xác của các ướ c lượ ng nhỏ (vì độ chính

xác hay dung sai = w/2 có giá tr ị lớ n).

w = 2ε

ε θ −ˆ θ ̂ ε θ  +ˆ

 

ε nói lên độ chính xác của ướ c lượ ng, nếu ε càng nhỏ thì θ̂ càng gần θ.

Trong thực tế thườ ng sai số cho phép ta ấn định độ chính xác ε (có nghĩ a là ấn định tr ướ cbề r ộng khoảng tin cậy w) từ đó tính toán chọn cỡ mẫu đủ lớ n để đảm bảo độ chính xác ε.

Để xác định cỡ mẫu ta cần các thông tin sau:

-  Định rõ độ tin cậy (1 - α), thườ ng là 90%, 95%, hay 99%.

-  Độ chính xác hay sai số cho phép ε hoặc bề r ộng khoảng tin cậy w.

-  Độ lệch chuẩn.

Cỡ mẫu n lớ n hay nhỏ phụ thuộc độ phân tán σ, sai số cho phép ε chứ không phụ thuộc

vào kích thướ c tập hợ p chính N.

Page 14: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 14/15

Cao Hào Thi 87

a.  C ỡ mẫ u đố i vớ i khoảng tin cậy của trung bình µ trong N( µ;σ2) vớ i σ2

bi ế t tr ướ c:

- +

w = 2ε

xx

n

Z  σ α  2/x

n

Z  σ α  2/x

 

x n 

x n 

x x − −

− < < +α α σ µ 

σ / / 2 2

 

hay : µ = X  ± 2ε vớ i ε =n

Z x/ σα 2  

Vớ i sai số cho phép ε cho tr ướ c, cỡ mẫu n đối vớ i ướ c lượ ng µ trong N(µ;σ

2

) vớ i σ

2

biếttr ướ c đượ c xác định bở i công thức:

2

22

2/

ε 

σ α  xZ n =  

Thí d ụ: 

Giả sử độ lệch chuẩn của các đườ ng ống thép đượ c sản xuất ra trong ngày ở một phân

xưở ng là 10 kg. Chúng ta muốn ướ c lượ ng trong lượ ng trung bình µ của các đườ ng ống

thép đượ c sản xuất ra trong ngày ở phân xưở ng đó vớ i độ chính xác ± 2,5kg và vớ i độ tin

cậy 95%. Tìm cỡ mẫu cần thiết cho sự ướ c lượ ng nói trên.

Giải:

Ta có: ε = 2,5kg, σ = 10 kg,

α = 5% ⇒ Zα/2 = Z0,025 = 1,96

Vậy: n = 5,615,2

10*96,12

22

=  

Cỡ mẫu n = 62 (ống thép).

b.  C ỡ mẫ u đố i vớ i khoảng tin cậy của trung bình µ trong N( µ;σ2) khi chư a bi ế t σ2:

 

Khoảng tin cậy của trung bình µ trong N(µ;σ2) khi chưa biết σ2: 

n

Stx

n

Stx

x/,nx/,n 2121 α−α− +<µ<−  

⇒  ε =n

S t  xn 2/,1 α −  ⇒ 

2

22

2/,1

ε 

α  xn S t n

−=  

Thí d ụ: 

Một nhà quản lý công ty may muốn ướ c lượ ng khoảng thờ i gian trung bình để một công

nhân hoàn thành một sản phẩm. Cô ta muốn ướ c lượ ng µ vớ i sai số ± 5 phút và vớ i độ tincậy 90%. Bở i vì cô ta chưa có khái niệm gì về giá tr ị độ lệch chuẩn σ của tập hợ p chính,

Page 15: ước lượng khoảng cho tham số thống kê

8/7/2019 ước lượng khoảng cho tham số thống kê

http://slidepdf.com/reader/full/uoc-luong-khoang-cho-tham-so-thong-ke 15/15

Cao Hào Thi 88

cô ta lấy mẫu đầu tiên vớ i cỡ mẫu n = 15 công nhân và nhận thấy Sx = 20 phút. Hỏi cỡ  mẫu bằng bao nhiêu để đạt đượ c khoảng tin cậy mong muốn.

Giải:

Ta có: ε = 5 phút, Sx = 20 phút,

α = 10% ⇒ tn-1,α/2 = t14;0,05 = 1,761

Vậy: n = 6,495

20*761,12

22

=  

Cỡ mẫu n = 50 (công nhân).

Ghi chú: sau khi có n = 50 ta phải tính lặp lại lần thứ 2 vớ i cỡ mẫu n = 50 (nghĩ a là tìm Sx

và tn-1,α/2 của mẫu mớ i). Tính lặp nhiều lần ta sẽ đượ c k ết quả hội tụ mong muốn.

c.  C ỡ mẫ u đố i vớ i khoảng tin cậy của p trong phân phố i nhị thứ c: 

Khoảng tin cậy của p trong phân phối nhị thức

n

f f Z f p

n

f f Z f 

)1()1(2/2/

−+<<

−− α α   

⇒  ε =n

f f Z 

)1(2/

−α    ⇒ 

2

2

2/ )1(

ε 

α  f f Z n

−=  

Thí d ụ: 

Một k ỹ sư kiểm tra chất lượ ng sản phẩm muốn tỷ lệ phế phẩm trong dây chuyền sản xuất

vớ i sai số ± 0,05 và độ tin cậy 95%. Trong lần lấy mẫu đầu tiên vớ i 25 sản phẩm ngườ i k ỹ 

sư nhận thấy có 4 phế phẩm. Hỏi cỡ mẫu bằng bao nhiêu để đạt đượ c khoảng tin cậymong muốn.

Giải:

Ta có: ε = 0,05, n = 25, f = 4/25 = 0,16

α = 5% ⇒ Zα/2 = Z0,025 = 1,96

Vậy: n = 5,20605,0

)16,01(*16,0*96,12

2

=−

 

Cỡ mẫu n = 207 (sản phẩm).

Ghi chú:

-  Sau khi có n = 207 ta phải tính lặp lại lần thứ 2 vớ i cỡ mẫu n = 207 (nghĩ a là tìm f của

mẫu mớ i và tính lại n).

-  Nếu ban đầu ta chưa biết cỡ mẫu bằng bao nhiêu ta có thể giả sử f = 0,5 để suy ra n và

thực hiện các bướ c lặp như trên. Tính lặp nhiều lần ta sẽ đượ c k ết quả hội tụ mong

muốn.