Cao Hào Thi 74 Chươ ng 7ƯỚ C LƯỢ NG CÁC THAM SỐ THỐNG KÊ (Estimation) 7.1KHÁI NIỆM CHUNG Xét một tập hợ p chính gồm N biến ngẫu nhiên X có hàm mật độ xác suất là f (x,θ); trong đó θ là các tham số thống kê của tập hợ p chính. Thí dụ: Trong phân ph ối nhị thức: f x Cnx x n x ( , ) ( ) θ ρ ρ = − − 1 ⇒θ = ρ, θ∈ [0 , 1] Trong phân ph ối poisson f xexx( , ) ! θ λ λ = ⇒θ = λλ > 0 Trong phân ph ối chuẩn f x ex( , ) ( ) θ πσ µσ = − − 1 2 2 2 2 2 ⇒θ = (µ, σ 2 ) ; -∞ < µ < +∞ ; 0 < σ 2 < +∞Gọi {x 1, x 2 ,.... , x n } là mẫu ng ẫu nhiên, cỡ mẫu n đượ c dùng l ấy ra từ tập h ợ p chính tuân theo hàm mật độ xác suất f (x,θ). Ởđây dạng của hàm f xem nhưđã biết còn các tham sốthống kê θ của tập hợ p chính xem như chưa biết. Vấn đềđặt ra ở chươ ng trình này là dựa vào các mẫu quan sát {x 1 ,x 2 ,...,x n } ta ướ c l ượ ng xem giá trị cụ thể của θ bằng bao nhiêu (bài toán đó gọi là ướ c lượ ng điểm ) hoặc ướ c lượ ng xem θ nằm trong khoảng nào (bài toán ướ c lượ ng khoảng). 7.2ƯỚ C LƯỢ NG ĐIỂM (Point Estimation) 7.2.1Ướ c lượ ng và giá trịướ c lượ ng (Estimator And Estimate) a)Ướ c lượ ng (Estimator) và hàm ướ c lượ ng-Là biến ngẫu nhiên hay các tham số thống kê của mẫu đượ c dùng đểướ c l ượ ng các tham số thống kê chưa biết của tập hợ p chính. -Ướ c lượ ng của tham số thống kê θ của tập hợ p chính đượ c ký hiệu là θ ˆ -Dựa vào mẫu {x 1 ,x 2 ...,x n } ngườ i ta lập ra Hàm θ ˆ = θ ˆ (x 1 ,x 2, ....,x n ) đểướ c lượ ng cho θ. θ ˆ đượ c gọi là hàm ướ c lượ ng của θ hay gọi tắt là ướ c lượ ng của θ.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
7.3.6 Ướ c lượ ng khoảng tin cậy của tham số thống kê p trong phân phối nhị thứ c
trong điều kiện cỡ mẫu lớ n :
Nhắc lại, gọi f là tỷ số của số lần thành công trong n phép thử độc lập:n
Xf =
X tuân theo phân phối chuẩn có - số trung bình µ = np
- Phươ ng sai : σ2 = np(1-p)
Ta có : E(f) = p f là ướ c lượ ng không chệch của p.
n
)p(pf
−=σ
1
Khi cỡ mẫu đủ lớ n thì biến ngẫu nhiên chuẩn hóa Z =m/)p(p
pf
−
−
1sẽ gần đúng có phân
phối chuẩn chuẩn hóa :
22 11f f S
n
)f (f
n
)p(p=
−≈
−=σ
Khi đó biến ngẫu nhiên Z =n/)f (f
pf
−
−
1sẽ có phân phối chuẩn chuẩn hóa.
Khi Z tuân theo phân phối chuẩn chuẩn hóa, ta có:
P(-Zα/2 < Z < Zα/2) = 1 - α
α−=⎟⎟⎠
⎞⎜⎜⎝
⎛ <
−
−<− αα 1
122 // Z
n/)f (f
pf ZP
α−=⎟⎟⎠
⎞⎜⎜⎝
⎛ −+<<
−− αα 1
1122
n
)f (f Zf p
n
)f (f Zf P //
Khoảng tin cậy của p :
Gọi f là tỷ số số lần thành công quan sát đượ c trong phép thử đượ c rút từ tập hợ p chính cótỷ số số lần thành công là p. Nếu n lớ n thì khoảng tin cậy của p là:
Trong đó Zα/2 là số có P(Z > Zα/2) = α/2 (Z là biến ngẫu nhiên chẩn hóa)
Thí d ụ:
Một công ty đi nhận một lô hàng gồm vài ngàn sản phẩm. Ngườ i giám định lô hàng lấy
ngẫu nhiên 81 sản phẩm và nhận thấy 8 sản phẩm không đạt yêu cầu. Tìm khoảng tin cậy
90% của tỷ lệ số sản phẩm không đạt yêu cầu trong toàn bộ lô hàng.
Giải:
Ta có : α = 10% ⇒ tra bảng Zα/2 = Z5% = 1,645,
099,081
8===
n
X f và
n
)f (f f
−=σ
1= 0,033
Khoảng tin cậy 90% của p là :
0,099 -1,645*0,033 < p < 0,099 + 1,645*0,033
0,045 < p < 0,153
7.3.7 Ướ c lượ ng cỡ mẫu (Estimating the Sample Size)
Trong các phần tr ướ c, chúng ta đi tìm các ướ c lượ ng khoảng đối vớ i các tham số thống kê
θ (µx, σ2x, p …) của tập hợ p chính dựa trên các mẫu cho tr ướ c (nghĩ a là đã biết cỡ mẫu
n). Vớ i cách làm đó, ta có thể gặp những k ết quả không mong muốn là bề r ộng của
khoảng tin cậy w quá lớ n, có nghĩ a là độ chính xác của các ướ c lượ ng nhỏ (vì độ chính
xác hay dung sai = w/2 có giá tr ị lớ n).
w = 2ε
ε θ −ˆ θ ̂ ε θ +ˆ
ε nói lên độ chính xác của ướ c lượ ng, nếu ε càng nhỏ thì θ̂ càng gần θ.
Trong thực tế thườ ng sai số cho phép ta ấn định độ chính xác ε (có nghĩ a là ấn định tr ướ cbề r ộng khoảng tin cậy w) từ đó tính toán chọn cỡ mẫu đủ lớ n để đảm bảo độ chính xác ε.
Để xác định cỡ mẫu ta cần các thông tin sau:
- Định rõ độ tin cậy (1 - α), thườ ng là 90%, 95%, hay 99%.
- Độ chính xác hay sai số cho phép ε hoặc bề r ộng khoảng tin cậy w.
- Độ lệch chuẩn.
Cỡ mẫu n lớ n hay nhỏ phụ thuộc độ phân tán σ, sai số cho phép ε chứ không phụ thuộc
a. C ỡ mẫ u đố i vớ i khoảng tin cậy của trung bình µ trong N( µ;σ2) vớ i σ2
bi ế t tr ướ c:
- +
w = 2ε
xx
n
Z σ α 2/x
n
Z σ α 2/x
x n
x n
x x − −
− < < +α α σ µ
σ / / 2 2
hay : µ = X ± 2ε vớ i ε =n
Z x/ σα 2
Vớ i sai số cho phép ε cho tr ướ c, cỡ mẫu n đối vớ i ướ c lượ ng µ trong N(µ;σ
2
) vớ i σ
2
biếttr ướ c đượ c xác định bở i công thức:
2
22
2/
ε
σ α xZ n =
Thí d ụ:
Giả sử độ lệch chuẩn của các đườ ng ống thép đượ c sản xuất ra trong ngày ở một phân
xưở ng là 10 kg. Chúng ta muốn ướ c lượ ng trong lượ ng trung bình µ của các đườ ng ống
thép đượ c sản xuất ra trong ngày ở phân xưở ng đó vớ i độ chính xác ± 2,5kg và vớ i độ tin
cậy 95%. Tìm cỡ mẫu cần thiết cho sự ướ c lượ ng nói trên.
Giải:
Ta có: ε = 2,5kg, σ = 10 kg,
α = 5% ⇒ Zα/2 = Z0,025 = 1,96
Vậy: n = 5,615,2
10*96,12
22
=
Cỡ mẫu n = 62 (ống thép).
b. C ỡ mẫ u đố i vớ i khoảng tin cậy của trung bình µ trong N( µ;σ2) khi chư a bi ế t σ2:
Khoảng tin cậy của trung bình µ trong N(µ;σ2) khi chưa biết σ2:
n
Stx
n
Stx
x/,nx/,n 2121 α−α− +<µ<−
⇒ ε =n
S t xn 2/,1 α − ⇒
2
22
2/,1
ε
α xn S t n
−=
Thí d ụ:
Một nhà quản lý công ty may muốn ướ c lượ ng khoảng thờ i gian trung bình để một công
nhân hoàn thành một sản phẩm. Cô ta muốn ướ c lượ ng µ vớ i sai số ± 5 phút và vớ i độ tincậy 90%. Bở i vì cô ta chưa có khái niệm gì về giá tr ị độ lệch chuẩn σ của tập hợ p chính,