BÁO CÁO MÔN XÁC SUẤT THỐNG KÊ

27 519 3
BÁO CÁO MÔN XÁC SUẤT THỐNG KÊ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA BÁO CÁO MÔN XÁC SUẤT THỐNG KÊ GVHD: PGS.TS NGUYỄN ĐÌNH HUY NHÓM : 8 THÁNG 8/2012 BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ Người viết Bùi Công Huy Cường Mã số sinh viên 41100438 Nhóm 8 Giảng viên hướng dẫn PGS.TS Nguyễn Đình Huy DANH SÁCH THÀNH VIÊN NHÓM 8 STT Họ và tên Mã số sinh viên 1 Phan Nhật Anh 81100126 2 Nguyễn Quốc Bảo 81100229 3 Hoàng Hải Bình K1100283 4 Bùi Công Huy Cường ( nhóm trưởng ) 41100438 5 Nguyễn Công Danh 81100495 6 Trần Văn Duy 21000501 7 Vũ Quang Đạt 41100770 8 Võ Văn Đồng 41100839 9 Nguyễn Du Phúc Hảo 81101012 10 Đỗ Quang Hưng 81101465 Phan Nhật Anh . MSSV 81100126 Bài số 8 1. Trình bày lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 Sách BT XSTK 2012 (N.Đ.HUY). 2. Đo đường kính X và chiều cao Y của 20 cây ta thu được số liệu sau: X 2,3 2,5 2,6 3,1 3,4 3,7 7,3 Y 7 8 4 4 6 6 14 X 3,9 4 4,1 4,1 4,2 4,4 Y 12 8 5 7 8 7 X 4,7 5,1 5,5 5,8 6,2 6,9 6,9 Y 9 10 13 7 11 11 16 a) Tìm đường hồi quy của Y đối với X. b) Tính sai số tiêu chuẩn của đường hồi quy. c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X. 3. Một công ty muốn mở rộng việc bán sản phẩm sang 3 thị trường nước ngoài. Để đánh giá xem thị phần mà công ty có thể chiếm lĩnh được tại ba thị trường đó so với các đối thủ cạnh tranh có khác nhau hay không người ta đã thủ nghiệm thị trường bằng cách bán thử sản phẩm cho 150 khách hàng tiềm năng tại mỗi thị trường và thu được kết quả sau: Thị trường A B C Công ty 55 38 24 Đối thủ cạnh tranh 1 28 30 21 Đối thủ cạnh tranh 2 20 18 31 Các đối thủ khác 47 64 74 Hãy tìm P-value để kiểm định xem cơ cấu của ba thị trường trên có khác nhau hay không. 4.Người ta tiến hành đo mực nước sông tại một số địa điểm thuộc tỉnh X trong cùng một ngày (số lần đo không giống nhau) và thu được bảng số liệu sau đây: Thời điểm đo Địa điểm đo F1 F2 F3 F4 1 2 3 4 5 6 7 5,5 5,6 5,8 5,9 6,0 6,7 7,2 4,9 5,1 6,5 5,4 6,1 4,6 4,8 5,8 5,1 6,2 7,1 4,5 6,2 4,8 4,8 6,5 6,8 Với mức ý nghĩa  = 2%.Mực nước sông trung bình/ngày của các điểm nói trên có thực sự khác nhau không? 5. Với mức ý nghĩa  = 5%. So sánh chi phí cho ba loại dịch vụ ở ba thành phố khác nhau bằng phương phương phân tích phương sai trên cơ sở bảng số liệu sau đây: Thành phố Loại dịch vụ I II III I II III 61 58 68 52 51 64 69 61 79 Các con số trong ô là chi phí trung bình cho 1 lần dịch vụ (đơn vị: 1000đ) BÀI 1: Trình bày lại ví dụ 3.4 trang 207 và ví dụ 4.2 trang 216 Giáo Trình XSTK 216. Ví dụ 3.4: Hiệu suất phần trăm (%) của một phản ứng hóa học được nghiên cứu theo 3 yếu tố pH (A), nhiệt độ (B) và chất xúc tác (C) được trình bày trong bảng sau: Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phẩn ứng ? BÀI LÀM 1/ Cơ sở lí thuyết: Phân tích phương sai ba yếu tố: - Sự phân tích này được dùng để đánh giá về sự ảnh hưởng của 3 yếu tố trên các giá trị quan sát G (yếu tố A:i=1 r, yếu tố B: j=1 r, yếu tố C: k=1 r) - Mô hình: khi nghiên cứu ảnh hưởng của 2 yếu tố, mỗi yếu tố có n mức thì người ta dùng mô hình hình vuông la tinh n  n. Ví dụ: B C D A C D A B D A B C A B C D - Mô hình vuông la tinh 3 yếu tố được trình bày như sau: yếu tố C (T k : vd T 1 = Y111+Y421+Y331+Y241) Yếu tố A Yếu tố B B1 B2 B3 B4 T i… A1 C1 Y 111 C2 Y 122 C3 Y 133 C4 Y 144 T 1 A2 C2 Y 212 C3 Y 223 C4 Y 234 C1 Y 241 T 2 A3 C3 Y 313 C4 Y 324 C1 Y 331 C2 Y 342 T 3 A4 C4 Y 414 C1 Y 421 C2 Y 412 C3 Y 443 T 4 T .j. T .1. T .2. T .3. T .4. Yếu tố A Yếu tố B B1 B2 B3 B4 A1 C1 9 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 - Bảng Anova Trắc nghiệm: Giả thiết H 0 : μ 1 = μ 2 = …μ k  “Các giá trị trung bình bằng nhau” H 1 : μ i ≠ μ j  “Có ít nhất 2 giá trị trung bình khác nhau” Giá trị thống kê: . G và . G Biện luận: Nếu . G (chấp nhận H 0 (yếu tố A) ) Nếu . G (chấp nhận H 0 (yếu tố B) ) Nếu . G (chấp nhận H 0 (yếu tố C) ) 2/ Áp dụng Excel: Nhập dữ liệu vào bảng : Thiết lập các biểu thức và tính các giá trị thống kê Tính Ti: Chọn ô B7 và nhập biểu thức = SUM(B2:E2) Chọn ô C7 và nhập biểu thức = SUM(B3:E3) Chọn ô D7 và nhập biểu thức = SUM(B4:E4) Chọn ô E7 và nhập biểu thức = SUM(B5:E5) Tính Tj: Chọn ô b8 và nhập biểu thức =SUM(B2:B5) Dùng con trỏ kéo kí hiệu từ điền từ ô B8 đến ô E8 Tính Tk: Chọn ô B9 và nhập biểu thức = SUM(B2, C5,D4,E3) Chọn ô C9 và nhập biểu thức = SUM(B3, C2,D5,E4) Chọn ô D9 và nhập biểu thức = SUM(B4, C3,D2,E5) Chọn ô E9 và nhập biểu thức = SUM(B5, C4,D3,E2) Tính T: Chọn ô B10 và nhập biểu thức =SUM(B2:E5) Tính các giá trị của ô G: Chọn ô G và nhập biểu thức =SUMSQ(B7:E7) Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9 Nguồn sai số Bậc tự do Tổng số bình phươg Bình phương trung bình Giá trị thống kê Yếu tố A (hàng) r-1 SSR=    r i i r TT r 1 2 2 2 MSR= 1r SSR F R = MSE MSR Yếu tố B (cột) r-1 SSC=    r i j r T T r 1 2 2 2 MSC= 1r SSC F C = MSE MSC Yếu tố C r-1 SSF=    r i k r TT r 1 2 2 2 MSF= 1r SSF F= MSE MSF Sai số (r-1)(r-2) SSE=SST- (SSF+SSR+SSC) MSE= )2)(1(  rr SSE Tổng cộng (r 2 -1) SST= r T Y ijk 2 2 2   Chọn ô G10 và nhập biểu thức =POWER(B10,2) Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5) Tính các giá trị SSR, SSC,SST, SSE Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2) Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến I9  Giá trị SSE Chọn ô I10 và nhập biểu thức =I1 SUM(I7:I9)  Tính các giá trị MSR, MSC, MSF và MSE  Các giá trị MSR, MSC, MSF Chọn ô K7 cà nhập biểu thức I7/(4-1) Dùng con trỏ kéo kí hiệu tự điền tứ ô K7 đến ô K9  Giá trị MSE Chọn ô K10 và nhập biểu thức =I10/(4-1)*(4-2)  Tính các giá trị và F Chọn ô M7 và nhập biểu thức =K7/0.3958 Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến M9 Kết quả và biện luận: FR=3.106< F 0.05 (3.6)= 4.76, nên chấp nhận H 0 (pH) FC=11.95> F 0.05 (3.6)= 4.76 ,nên bác bỏ H 0 (nhiệt độ) F=30.05> F 0.05 (3.6)= 4.76, nên bác bỏ H 0 (chất xúc tác)  Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất Ví dụ 4.2: Người ta dùng ba mức nhiệt độ gồm 105, 120, 135 o C kết hợp với ba khoảng thời gian là 15, 30, 60 phút để thực hiện một phản ứng tổng hợp. Các hiệu suất của các phản ứng (%) được trình bày trong bảng sau : Thời gian (phút) Nhiệt độ ( o C) Hiệu suất (%) X1 X2 Y 15 105 1,87 30 105 2,02 60 105 3,28 15 120 3,05 30 120 4,07 60 120 5,54 15 135 5,03 30 135 6,45 60 135 7,26 Hãy cho biết yếu tố nhiệt độ và/hoặc yếu tố thời gian có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp? Nếu có thì với điều kiện nhiệt độ 115 o C trong vòng 50 phút, hiệu suất phản ứng sẽ là bao nhiêu? BÀI LÀM 1/ Cơ sở lý thuyết: Đây là một bài toán hồi quy tuyến tính đa tham số, trong đó, Y (hiệu suất) liên quan đến hai biến số X1 (thời gian), X2 ( nhiệt độ). Sau khi tìm các giá trị thống kê, ta sẽ có hai phần trắc nghiệm hồi quy gồm : - Trắc nghiệm t: so sánh giá trị t với giá trị t 0,05 , bậc tự do là γ = N-k-1 (k là số biến) (tra bảng Student) Kiểm định các giả thuyết: H 0 : “ Các hệ số hồi quy không có ý nghĩa” H 1 :”Có ít nhất vài hệ số hồi quy có ý nghĩa” - Trắc nghiệm F: so sánh giá trị F với giá trị F 0,05 , bậc tự do là n 1 =1, n 2 =N-k-1 (tra bảng Fisher) Kiểm định các giả thuyết: H 0 : “Phương trình hồi quy không thích hợp” H 1 : “Phương trình hồi quy thích hợp” 2/ Áp dụng Excel: Nhập bảng dữ liệu: Dữ liệu bắt buộc phải được nhập theo cột. Sử dụng công cụ Regression: Vào Data > Data Analysis. Chọn mục Regression Trong cửa sổ Regression, nhập vào các dữ liệu sau: Input Y range (phạm vi biến số Y) Input X range (phạm vi biến số X) Labels (nhãn dữ liệu) Confidence Level (mức tin cậy) Ouput Range (tọa độ đầu ra) Một vài tùy chọn khác: Line Fit Plots ( đường hồi quy), Residual Plots ( biểu thức sai số) 1. Phương trình hồi quy của Y theo X1 Phương trình hồi quy : Y = 2.7367 +0.04454X1 (R 2 =0.2139, S=1.8112); N=9; k=1; t 0 =t Stat(Intercept)=2.129 < t 0,05 (7)=2.365 (hay P value=0.0708 > α=0.05) =>Chấp nhận giả thiết H 0. t 1 =t Stat(X1)=1.3802< t 0,05 (7)=2.365 (hay P value=0.2099>α=0.05) =>Chấp nhận giả thiết H 0. F=1.9049<F 0,05 (1.7)=5.59 (hay F S =Significance F=0.2099>α=0.05) =>Chấp nhận giả thiết H 0 Vậy các hệ số của phương trình hồi quy Y = 2.7367 +0.04454X1 đều không có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này không thích hợp. Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất phản ứng tổng hợp 2. Phương trình hồi quy của Y theo X2 [...]... =>Bác bỏ giả thiết H0 Vậy các hệ số của phương trình hồi quy Y = -12.7 + 0.0445X1 + 0.1286X2 đều có ý nghĩa thống kê Nói cách khác, phương trình hồi quy này thích hợp Kết luận: Cả hai yếu tố nhiệt độ và thời gian cùng đồng thời liên quan tuyến tính với hiệu suất phản ứng tổng hợp  Để dự đốn hiệu suất của phản ứng bằng phương pháp hồi quy Y = -12.7 + 0.0445X1 + 0.1286X2 , ta thay các giá trị X1, X2, thì... đường hồi quy c) Tính tỷ số F để kiểm định giả thiết có hồi quy tuyến tính giữa Y với X Bài làm  Nhận xét : Đây là bài tốn phân tích hồi quy tuyến tính  Trắc nghiệm thống kê: Đối với một phương trình hồi quy, YX = B0 + BX, ý nghĩa thống kê của các số Bi (B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính chất thích hợp của phương trình Yx = f(x) được đánh giá bằng trắc nghiệm... nghiệm: +Giả thiết: H0: 1  2  k  ”Các giá trị trung bình bằng nhau” H1: i   j  ”Ít nhất có hai giá trị trung bình khác nhau” +Giá trị thống kê: F  MSF MSE +Biện luận: Nếu FBác bỏ giả thiết H0 Vậy các hệ số của phương trình hồi quy Y = -11.1411 +0.12856X2 đều có ý nghĩa thống kê Nói cách khác, phương trình hồi quy này thích hợp Kết luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất phản ứng tổng hợp 3 Phương trình hồi quy của Y theo X1 và X2 Phương trình hồi quy : Y = -12.7 + 0.0445X1 + 0.1286X2 (R2=0.9777; S=0.3297);... chỉ tính F theo u cầu đề bài Giả thiết Ho : X và Y hồi quy tuyến tính  Trắc nghiệm F Giả thiết: H0: B i=0 “Phương trình hồi quy khơng thích hợp” H0: Bi ≠ 0 “Phương trình hồi quy thích hợp” Giá trị thống kê: F= Phân bố Fischer v1=1, v2=N-2  Kết luận: Nếu F chấp nhận giả thiết H0 Thực hiện bằng Excel - Thiết lập bảng tính Regression: - Nhập dữ liệu vơ bảng tính : - Sau đó vào Data /Data... 52 51 64 69 61 79 Các con số trong ô là chi phí trung bình cho 1 lần dòch vụ (đơn vò: 1000đ) Bài làm  Nhận xét:đây là bài tốn phân tích phương sai hai yếu tố khơng lặp 1/ Cơ sở lý thuyết: Khái niệm thống kê Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan sát Yij (i=1.2…r: yếu tố A; j=1.2…c: yếu tố B) Yếu tố B Yếu tố A Tổng cộng Trung bình 1 2 … c 1 Y11 Y12 … Y1c Y1 Y1... 6,0 6,1 6,2 6,5 6 6,7 7,1 6,8 7 7,2 Với mức ý nghóa  = 2% Mực nước sông trung bình/ngày của các điểm nói trên có thực sự khác nhau không? Giải  Nhận xét: phân tích phương sai một yếu tố Khái niệm thống kê: +Phép phân tích phương sai được dùng trong các trắc nghiệm để so sánh các giá trị trung bình của hai hay nhiều mẫu được lấy từ các phân số.Đây có thể được xem như phần mở rộng của trắc nghiệm t . TRƯỜNG ĐẠI HỌC BÁCH KHOA BÁO CÁO MÔN XÁC SUẤT THỐNG KÊ GVHD: PGS.TS NGUYỄN ĐÌNH HUY NHÓM : 8 THÁNG 8/2012 BÀI TẬP LỚN MÔN XÁC SUẤT THỐNG KÊ Người viết Bùi Công Huy Cường. là bài toán phân tích hồi quy tuyến tính  Trắc nghiệm thống kê: Đối với một phương trình hồi quy, Y X = B 0 + BX, ý nghĩa thống kê của các số B i (B 0 hay B) được đánh giá bằng trắc. +0.04454X1 đều không có ý nghĩa thống kê. Nói cách khác, phương trình hồi quy này không thích hợp. Kết luận: Yếu tố thời gian không có liên quan tuyến tính với hiệu suất phản ứng tổng hợp 2. Phương

Ngày đăng: 17/05/2015, 11:24

Tài liệu cùng người dùng

Tài liệu liên quan