Top Banner
TP.HCM , Ngày 21/11/2012 ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA BÁO CÁO BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ GVHD: Thầy Nguyễn Bá Thi Lớp: A10 - Nhóm: 4 Họ và tên MSSV Trần Thế Di Luân 51001859 (Nhóm trưởng) Trần Văn Long 21101926 Trần Quang Phước 21109028 Phùng Thế Trường 20704569 Trần Thanh Sáng 21102891 Nguyễn Văn Tiên 41103573 Nguyễn Thanh Nhàn 40901779 Nguyễn Hoàng Minh Quân 50902135
14

BTL xac suat.pdf

Feb 12, 2015

Download

Documents

Trần Luân
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: BTL xac suat.pdf

TP.HCM , Ngày 21/11/2012

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC BÁCH KHOA

BÁO CÁO BÀI TẬP LỚN

XÁC SUẤT THỐNG KÊ

GVHD: Thầy Nguyễn Bá Thi

Lớp: A10 - Nhóm: 4 Họ và tên MSSV

Trần Thế Di Luân 51001859 (Nhóm trưởng)

Trần Văn Long 21101926

Trần Quang Phước 21109028

Phùng Thế Trường 20704569

Trần Thanh Sáng 21102891

Nguyễn Văn Tiên 41103573

Nguyễn Thanh Nhàn 40901779

Nguyễn Hoàng Minh Quân 50902135

Page 2: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 2

Bài 1: Trong một thí nghiệm nghiên cứu ung thư, 162 con chuột được ghép khối u

và chia thành 4 nhóm. Mỗi nhóm được chiếu xạ với cường độ khác nhau. Bảng sau đây

cho kết quả thí nghiệm.

Mức

Kết quả 1 2 3 4

Hết khối u 10 32 37 32

Không hết 32 9 2 8

a) Với mức = 1%, hãy so sánh tỷ lệ chữa khỏi ung thư của 4 nhóm nói trên.

b) Với mức = 5%, hãy so sánh tỷ lệ chữa khỏi ung thư của 3 nhóm 2,3 và 4.

Bài làm

Nhận xét : Đây là bài toán kiểm định giả thiết về tỷ lệ.

Giả thiết Ho: Tỷ lệ chữa khỏi ung thư trong các nhóm là như nhau.

Thực hiện bài toán bằng Excel

a) Với α = 1%

- Nhập giá trị vào bảng tính :

- Tính c c t ng :

T ng hàng: chọn F4 và nhập =SUM(B4:E4),

d ng con trỏ kéo n t t đi n t ến .

T ng c t: chọn B6 và nhập =SUM(B4:B5),

d ng con trỏ kéo n t t đi n t B ến E .

T ng c ng: chọn F8 và nhập =SUM(F4:F5).

- Tính c c t n l thu t:

H t kh i u : chọn B12 và nhập =B6*$F$4/$F$8,

d ng con trỏ kéo n t t đi n t B1 ến E1 .

Không h t : chọn B13 và nhập =B6*$F$5/$F$8,

d ng con trỏ kéo n t t đi n t B1 ến E1 .

- p d ng hàm H T T :

Chọn B15 và nhập =CHITEST(B4:E5,B12:E13).

Ta s có được kết quả của P(X>X²).

Page 3: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 3

- Biện luận : P(X>X²) = 4,995e-12 < α = 0,01.

=> Bác bỏ giả thiết Ho.

- Kết luận: Tỉ lệ chữa khỏi ung thư của 4 nhóm là khác nhau.

b) Với α = %

- Nhập giá trị vào bảng tính :

- Tính c c t ng :

T ng hàng: chọn M4 và nhập =SUM(J4:L4),

d ng con trỏ kéo n t t đi n t M ến M5.

T ng c t: chọn J6 và nhập =SUM(J4:J5),

d ng con trỏ kéo n t t đi n t J ến L6.

T ng c ng: chọn M8 và nhập =SUM(M4:M5).

- Tính c c t n l thu t:

H t kh i u : chọn J12 và nhập =J6*$M$4/$M$8,

d ng con trỏ kéo n t t đi n t J1 ến L12.

Page 4: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 4

Không h t : chọn J13 và nhập =J6*$M$5/$F$8,

d ng con trỏ kéo n t t đi n t J1 ến L13.

- p d ng hàm H T T :

Chọn J15 và nhập =CHITEST(J4:L5,J12:L13).

Ta s có được kết quả của P(X>X²).

- Biện luận : P(X>X²) = 0,0810077 > α = 0,05.

=> Chấp nhận giả thiết Ho.

Kết luận: Tỉ lệ chữa khỏi ung thư của 3 nhóm 2,3,4 là như nhau.

Page 5: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 5

Bài 2: Một cơ quan khí tượng tiến hành so sánh nhiệt độ cao nhất trong ngày ở ba

l c địa Bắc Mỹ, châu Âu và châu . Các thành phố lớn trong mỗi l c địa được chọn ngẫu

nhiên và nhiệt độ cao nhất trong ngày 1/7/1996 được ghi lại như sau (đo bằng độ

Fahrenheit):

Bắc Mỹ: Chicago: 95 , Denver: 73 , Fairbanks: 73 , Kansas City : 96

Montreal: 70 , Miami: 87 , Pittsburgh : 85 , Seattle : 80

Châu Âu: Athens: 95 , Geneva : 72 , London : 77, Moscow : 86, Rome 88, Warsaw: 73

Châu : Bắc kinh: 93, Jerusalem : 88, New Delhi: 94 , Tokyo : 77, Hongkong: 90

Hãy so sánh nhiệt độ trung bình cao nhất trong ngày của ba châu l c nói trên. Mức ý nghĩa

5%

Bài làm

Nhận xét: Đây là bài toán phân tích phương sai một yếu tố

M c đích của s phân tích phương sai một yếu tố là đánh giá s ảnh hưởng của một

yếu tố(nhân tạo hay t nhiên) nào đó trên các giá trị quan sát.

*Giả thiết

H0: µ1= µ2=…µk <=> ”Các giá trị trung bình bằng nhau”

H1: µ1≠ µ2 <=> ”Có ít nhất hai giá trị trung bình khác nhau”

*Giá trị thống kê: F =

*Biện luận :

Nếu F < Fα (k -1; N-k) => Chấp nhận giả thiết H0.

- Nhập giá trị vào bảng tính :

-Vào Data /Data analysis, chọn Anova: Single Factor.

Page 6: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 6

Trên màn hình s hiện lên hộp thoại của Anova: Single Factor.

Ta nhận các thông số như hình bên dưới

-Phạm vi các biến số Y(Input Range):ta kéo chuột từ A3 tới ô C11

-Alpha: 0.05

-Group by: columns

-Tọa độ đầu ra (Output Range):kích chuột vào A13

Ta được kết quả như sau:

Page 7: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 7

Biện luận:

Ta thấy F = 0,880362 < F0,05 = F crit = 3.633723

Chấp nhận giả thuyết H0 ở mức 5%

Page 8: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 8

Bài 3: Tính tỉ số tương quan của Y đối với X, hệ số tương quan, hệ số xác định

của tập số liệu sau đây. Với mức ý nghĩa 5%, hãy kết luận v mối tương quan giữa X và Y

(Có phi tuyến không? Có tuyến tính không?). Tìm đường hồi quy của Y đối với X.

x 1,32 0,95 1,45 1,3 1,32 1,2 0,95 1,45 1,3

y 0,37 -0,70 0,55 0,35 0,3 0,32 -1,70 0,75 1,3

Bài làm

Nhận xét : Đây là bài toán phân tích tương quan.

(i) Phân tích tương quan tuyến tính.

Nhập giá trị vào bảng tính:

Thiết lập bảng Correlation.

- Vào Data /Data analysis , chọn Correlation.

Page 9: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 9

- Trong hộp thoại Correlation lần lượt ấn định:

Phạm vi đầu vào: Input Range, quét vùng (A3:B12).

Cách nhóm theo hang hay cột: Group By, chọn Columns (nhóm theo cột).

Chọn Labels in first row (nhãn dữ liệu ở hàng đầu).

Phạm vi đầu ra: Output Range, chọn ô D6.

- Nhấn OK, ta s có bảng kết quả sau:

- Ta tìm được hệ số tương quan r = 0,84043.

Và hệ số xác ịnh r2 = 0,70632.

* Giả thiết Ho : X và Y không có tương quan tuyến tính.

Ta có: T = 4,10307 với

Mà: c = 2,365.

2

2

1

r nT

r

Page 10: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 10

(c là phân vị mức α/ = 0.025 của phân bố Student với n – 2 = 7 bậc t do).

Vì |T| > c nên có cơ sở bác bỏ giả thiết Ho.

Vậy: Kết luận được X và Y có tương quan tuyến tính.

(ii) Phân tích tương quan phi tuyến.

(iii) phân tich hồi quy tuyến tính .

Giả thiết Ho : X và Y hồi quy tuyến tính.

- Vào Data /Data analysis, chọn Regression.

- Trong hộp thoại Regression lần lượt ấn định:

Phạm vi đầu vào: Input Y Range, quét vùng (B3:B12).

Input X Range, quét vùng (A3:A12).

Chọn Labels (thêm nhãn dữ liệu).

Phạm vi đầu ra: Output Range, chọn ô I3.

Chọn Line Fit Plots trong Residuals để v đường hồi quy.

Page 11: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 11

- Sau đó nhấn OK ta có kết quả :

- Kết luận : Đường hồi quy của Y đối với X là : Y=3,949351X-4,761189

Sai số tiêu chuẩn của đường hồi quy : 0,51

Ta thấy: F = 16,8 > c = 5,59

(tra bảng phân tố Fisher với bậc t do (1,7) ở mức α = 0,05)

Vậy: có hồi quy tuyến tính giữa Y với X.

-2

-1

0

1

2

1.32 0.95 1.45 1.3 1.32 1.2 0.95 1.45 1.3

Y

X

X Line Fit Plot

Y

Predicted Y

Page 12: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 12

Bài 4: Trên cơ sở tập số liệu sau đây hãy phân tích xem tỷ lệ đỗ loại giỏi có

ph thuộc vào trường phổ thông và ban hay không với α = 0,05. Ở đây z là tỷ lệ đỗ loại

giỏi (%); f là trường phổ thông số 1, 2, 3,4; g là ban (1 = ban A, 2 = Ban B)

stt z f g stt z f g

1 38 1 1 9 35 3 2

2 38 1 1 10 32 3 1

3 42 1 2 11 33 3 1

4 42 1 2 12 34 3 2

5 41 2 1 13 31 4 1

6 42 2 2 14 33 4 1

7 44 2 1 15 33 4 2

8 45 2 2 16 35 4 2

Bài làm

Nhận xét: Đây là bài toán phân tích phương sai hai yếu tố có lặp

S phân tích này nhằm đánh giá s ảnh hưởng của hai yếu tố trên các giá trị quan sát

Yij(i=1, 2…r: yếu tố A; j= 1 ,2…c: yếu tố B).

*Giả thiết:

H0: µ1= µ2=…µk <=> ”Các giá trị trung bình bằng nhau”

H1: µ1≠ µ2 <=> ”Ít nhất hai giá trị trung bình khác nhau”

*Giá trị thống kê:

FR =

và FC =

*Biện luận:

Nếu FR < Fα[b-1,(k-1)(b-1)] => chấp nhận H0(yếu tố A)

Nếu FC < Fα[b-1,(k-1)(b-1)] => chấp nhận H0(yếu tố B)

Ta giả thiết H01: yếu tố Ban không ảnh hưởng đến tỷ lệ đỗ loại giỏi của trường.

Ta giả thiết H02: yếu tố trường phổ thông không ảnh hưởng đến tỷ lệ đỗ loại giỏi của

trường đó.

Nhập giá trị vào bảng tính:

Page 13: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 13

Vào Data /Data analysis,

Chọn Anova: Two-Factor With Replication => s hiện lên hộp thoại

Trên màn hình s hiện lên hộp thoại của Anova: Two-Factor With Replication

Ta nhập vào các thông số như hình bên dưới

-Phạm vi của biến số Y(Input Range):ta kéo chuột từ ô A3 tới ô E7

-Tọa độ đầu ra (Output Range):kích chuột vào ô G3

Ta được kết quả như sau:

Page 14: BTL xac suat.pdf

Xác suất thống kê Thầy: Nguyễn Bá Thi

Trang 14

Biện luận:

Ta thấy FR = 11,571429 > F0.05 = 5,317655 => Bác bỏ giả thiết H01

FC = 55,380952 > F0.05 =4,066181=> Bác bỏ giả thiết H02

Vậy cả 2 yếu tố Ban và trường phổ thông đ u ảnh hưởng đến tỷ lệ đỗ loại giỏi của các

trường.