Kiểm định giả thiết thống kê Ôn thi xác xuất thống kê đại học Y dược Tp.HCM

118 1.7K 0
Kiểm định giả thiết thống kê Ôn thi xác xuất thống kê đại học Y dược Tp.HCM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Kiểm định giả thiết thống kê Ôn thi xác xuất thống kê đại học Y dược Tp.HCM Kiểm định giả thiết thống kê Ôn thi xác xuất thống kê đại học Y dược Tp.HCM Kiểm định giả thiết thống kê Ôn thi xác xuất thống kê đại học Y dược Tp.HCM Kiểm định giả thiết thống kê Ôn thi xác xuất thống kê đại học Y dược Tp.HCM Kiểm định giả thiết thống kê Ôn thi xác xuất thống kê đại học Y dược Tp.HCM

KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ TS CHU VĂN THỌ Trưởng Bộ môn Toán Đại Học Y Dược Tp HCM A-MỞ ĐẦU Tỉ lệ bị bệânh A dân số p = 0,2 Một chương trình điều trị bệnh A tiến hành Sau hoàn tất chương trình điều trị, chọn ngẫu nhiên mẫu 100 người dân số khám thấy có 12 người bị bệnh A Vấn đề đặt sau thực chương trình điều trị, tỉ lệ bị bệnh A dân số có thực c p = 0,2 không ? Sau hoàn tất chương trình điều trị, gọi tỉ lệ bị bệnh A dân số p' mẫu khảo sát F = 0,12 Đặt giả thiết thống kê là: Chương trình điều trị không làm thay đổi tỉ lệ bị bệnh A dân số, nghóa khác biệt p' p ý nghóa thống kê Có thể kết luận giả thiết thống kê đưa có phù hợp với thực tiễn hay không, tức tương thích với kiện quan sát hay không cách kiểm định giả thiết Mục đích kiểm định giả thiết giúp ta đến kết luận liên quan đến dân số từ việc khảo sát mẫu ngẫu nhiên lấy từ dân số Giả thiết thống kê kiểm định, thường phát biểu dạng "không có khác biệt", gọi "giả thiết không" (null hypothesis) ký hiệu H Trường hợp bác bỏ giả thiết H0 , ta chấp nhận giả thiết gọi "giả thiết đối " (alternative hypothesis) ký hiệu H A Trong thí dụ trên, giả thiết H0 : "p' = p" giả thiết H A là: "p' ≠ p" Ta cần kiểm định giả thiết H0 Giả thiết H0 liên quan đến dân số ta vào mẫu ngẫu nhiên lấy từ dân số để kết luận H0 Do có hai khả xảy ra: 1) H0 (nghóa thực p' = p), ta bác bỏ H0 , chấp nhận HA 2) H0 sai (nghóa thực p' ≠ p), ta chấp nhận H0 Sai lầm trường hợp gọi sai lầm loại I sai lầm trường hợp gọi sai lầm loại II Hai sai lầm có tính đối kháng, tức muốn hạn chế khả sai lấm loại I lại tăng khả sai lầm loại II ngược lại Nếu tăng kích thước mẫu lên hạn chế khả sai lầm hai loại, đồng thời làm tăng chi phí khó khăn Mức ý nghóa hay ngưỡng sai lầm: Quy tắc kiểm định giả thiết đặt cho xác suất sai lầm loại I không vượt số α nhỏ Xác suất sai lầm loại I = P(bác bỏ H0 / H0 đúng) ≤ α Khi α gọi mức ý nghóa ngưỡng sai lầm Xác suất sai lầm loại II = P(chấp nhận H0 / H0 sai) ≤ β Nguyên lý biến cố có xác suất nhỏ : "Nếu biến cố A có xác suất không vượt số α nhỏ xem biến cố A không xảy lần thử " Giả sử biến cố A có xác suất 0,01, tức trung bình 100 lần thử khả có lần biến cố A xảy Quy tắc kiểm định giả thiết: Để kiểm định H0 , xét mẫu X1 , X , , X n độc lập lấy ngẫu nhiên từ dân số Căn vào mẫu ta có thống kê T(X1 , X , , X n ) Giả sử H0 đúng, ta biết phân phối xác suất T(X1 , X , , X n ) (nhö T(X1 , X , , X n ) có phân phối Chuẩn, phân phối Student, phân phối Fisher, phân phối  , ) Khi ta tìm tα cho P( T(X1 , X , , X n )  t  / H0 đúng) = α (α nhỏ) Ta đưa quy tắc kiểm định sau: -Nếu T(X1 , X , , X n )  t  bác bỏ giả thiết H0 -Neáu T(X1 , X , , X n )  t  chấp nhận H0 Theo nguyên lý biến cố có xác suất nhỏ, P( T(X1 , X , , X n )  t  / H0 đúng) = α (α nhỏ) nên coi biến cố " T(X1 , X , , X n )  t  / H0 đúng" không xảy lần thử Khi bác bỏ H0 mà H0 đúng, ngưỡng sai lầm α Tuy nhiên chấp nhận H0 mà H0 sai, ngưỡng sai lầm β H0 sai ta phân phối xác suất thống kê T(X1 , X , , X n ) Ta nhận thấy α tăng β giảm ngược lại B- BÀI TOÁN KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ BÀI 1- SO SÁNH HAI TỈ LỆ SO SÁNH HAI TỈ LỆ KHI CÓ TỈ LỆ THỰC NGHIỆM VÀ TỈ LỆ DÂN SỐ Trong dân số D, tỉ lệ có đặc tính A p Sau thực giải pháp nhằm thay đổi tỉ lệ có đặc tính A, gọi tỉ lệ có có đặc tính A dân số p’ Ta muốn so sánh p p’ Đặt giả thiết H0 : p' = p Xét mẫu X1 , X , , X n độc lập, lấy từ dân số Xi ~ B(1; p), Xi có giá trị X p(1  p) Theo định lý giới hạn trung tâm, 0,1 < p < 0,9 , np  n(1 - p)  5, ta có F =  i ~ N(p; ) Suy ra: Fp p(1  p) n n ~ N(0;1) n THỰC HIỆN PHÉP KIỂM U VỚI 0,1 < p < 0,9 ; np  n(1-p)  : Đặt giả thiết H0 : p' = p HA : p' ≠ p Nếu H0 U = Fp p(1  p) n ~ N(0,1) -Nếu U >1,96 (hoặc 2,58) bác bỏ H0, chấp nhận HA, ngưỡng sai lầm  = 0,05 (hoặc  = 0,01) -Nếu U  1,96 (hoặc 2,58) chấp nhận H0 Thí dụ : Trong dây chuyền sản xuất thuốc viên có 20% viên không đạt tiêu chuẩn Một cải tiến thực sản xuất thử 100 viên thấy có 12 viên không đạt tiêu chuẩn Cải tiến có làm thay đổi tỉ lệ viên không đạt tiêu chuẩn không ? Giải : F = 0,12 ; p = 0, ; n = 100 thỏa điều kiện 0,1 < p < 0,9 ; np  vaø n(1-p)  Đặt giả thiết H0 : p' = p HA : p' ≠ p Nếu H0 U = F  p p(1  p) n Ta coù U = F  p p(1  p) n ~ N(0,1) = -2 Vì U >1,96 nên bác bỏ H0, chấp nhận HA, ngưỡng sai lầm  = 0,05 Sự cải tiến làm thay đổi tỉ lệ viên không đạt tiêu chuẩn, ngưỡng sai lầm  = 0,05 Chú ý: Nếu đặt vấn đề cải tiến có làm giảm tỉ lệ viên không đạt tiêu chuẩn không ? Trong trường hợp dùng phép kiểm U 1-đuôi THỰC HIỆN PHÉP KIỂM U 1-ĐUÔI VỚI ĐIỀU KIEÄN 0,1 < p < 0,9 ; np  n(1-p)  : Đặt giả thiết H0 : p' = p HA : p' < p Nếu H0 U = F  p p(1  p) n ~ N(0,1) - Neáu U < -1,64 (hoặc U < -2,33) bác bỏ H0, chấp nhận HA, ngưỡng sai lầm  = 0,05 (hoặc  = 0,01) - Nếu U  -1,64 (hoặc U  -2,33) chấp nhận H0 Thí dụ 14: Một loại thuốc an thần thử nghiệm 10 người bệnh loạn thần kinh chức cách kiểm tra điểm trả lời trắc nghiệm người bệnh vào giai đoạn trước sau uống thuốc Kết quan sát: X i : 22 18 17 19 22 12 14 11 19 Yi : 19 11 14 17 23 11 15 19 11 Thuoác an thần có làm tăng điểm trả lời trắc nghiệm người bệnh không ? Giải: Đặt d i = X i - Yi (i =1,2, , n=10) Đặt giả thiết H0 : 1 = 2 HA : 1 ≠ 2 Theo giả thiết H0 , ta coù T = d ~ Student(n -1= 9) Sd n n Tính: d  n  d i = X - Y = -1,3 ; Sd  n  (d i  d ) n 1 = 20,68 ; T = d = -0,9 Vì T > -t 0,05 (9) = -2,62 nên Sd n chấp nhận H0 Thuốc an thần không làm tăng điểm trả lời trắc nghiệm người bệnh Thí dụ 15: Thử nghiệm chế độ ăn kiêng, kèm thể dục nhằm làm giảm cholesterol 12 người Kết quan sát trước sau thử nghiệm chế độ ăn kiêng, kèm thể dục: X i : 201 231 221 260 228 237 326 235 240 267 284 201 Yi : 200 236 216 233 224 216 296 195 207 247 210 209 Chế độ ăn kiêng, kèm thể dục có làm giảm cholesterol không ? Giải: Ñaët d i = X i - Yi (i =1,2, ,n =12) Ta coù: X = 244,25 > Y = 224,083 Đặt giả thiết H0 : 1 = 2 HA : 1 > 2 n d Theo giả thiết H0 , ta có T = ~ Student(n -1 =11) Tính: d   d i = X - Y = 20,167 ; Sd n n n Sd2   (d i  d ) n 1 = 535,06 ; T = d = 3,613 Vì T > t 0,05 (11)= 3,106 nên bác bỏ H0, chấp nhận HA , ngưỡng Sd n sai lầm  = 0,01 Chế độ ăn kiêng, kèm thể dục có làm giảm cholesterol, ngưỡng sai lầm  = 0,01 Thí dụ 16: Một loại thuốc tăng lực thí nghiệm chuột để thử độ tăng lực Chuột cho chạy đến kiệt sức đo thời gian (phút) vào giai đoạn trước sau uống thuốc Kết quan sát: X i : 34 46 30 24 40 44 Yi : 46 56 28 34 56 64 Thuốc tăng lực có làm thay đổi thời gian chạy trung bình đến kiệt sức không ? Thuốc tăng lực có thực làm tăng lực không ? Giải: a) Đặt d i = X i - Yi (i =1,2, ,n = 6) Đặt giả thiết H0 : 1 = 2 HA : 1 ≠ 2 Theo giả thiết H0 , ta coù T = d ~ Student(n -1 = 5) Sd n n Tính: d  n  d i = X - Y = -11; Sd  n  (d i  d ) n 1 = 55,6 ; T = d = - 3,613 Sd n Vì T > t 0,05 (5) = 2,57 nên bác bỏ H0, chấp nhận HA , ngưỡng sai lầm  = 0,05 Thời gian chạy trung bình trước sau uống thuốc tăng lực có khác nhau, ngưỡng sai lầm  = 0,05 b) Ta coù: X = 36,333 < Y = 47,333 Đặt giả thiết H0 : 1 = 2 HA : 1 < 2 Vì T < -t 0,05 (5) = -2,57 nên bác bỏ H0, chấp nhận HA , ngưỡng sai lầm  = 0,025 Thuốc tăng lực thực làm tăng lực, ngưỡng sai lầm  = 0,025 BÀI 5- SO SÁNH NHIỀU PHƯƠNG SAI 1.MỞ ĐẦU Phương sai đại lượng biểu thị độ phân tán số liệu quan sát chung quanh số trung bình Phương sai lớn có nghóa độ phân tán số liệu quan sát lớn độ xác trình thu thập số liệu Phương sai nhỏ có nghóa độ phân tán số liệu quan sát độ xác tương đối cao Vì việc so sánh độ xác thường thực qua việc so sánh phương sai SO SÁNH HAI PHƯƠNG SAI KHI CÓ HAI PHƯƠNG SAI THỰC NGHIỆM 2.1.ĐẶT VẤN ĐỀ: Mẫu X1 , X , , X n1 độc lập, có trung bình mẫu X phương sai mẫu S1 , lấy từ dân số ( n  1)S12  Xi ~ N(1 ,  ) Ta coù: Z1 = ~ (n1 -1) 12 2 Maãu Y1 , Y2 , , Yn độc lập, có trung bình mẫu Y phương sai mẫu S , lấy từ dân số ñoù (n  1)S 22 Yi ~ N( ,  ) Ta coù: Z2 = ~  (n2 -1) 2 2 Z1 2 S  Khi đó: F = n  = 2 ~ Fisher (n1 -1 ; n2 -1) Do S 1 Z2 n 1 Ta muốn so sánh hai phương sai 12  22 S12 1 =  F = ~ Fisher (n1 -1 ; n2 -1) S2 2 2.2.PHÉP KIỂM F (FISHER) Đặt giả thiết H0 : 12 =  22 HA :  22 ≠  22 S12 Theo giả thiết H0 , ta có F = ~ Phân phối Fisher F (n1 -1 ; n2 -1) S2 - Neáu F > F  ( n1  1; n  1) bác bỏ H0, chấp nhận HA , ngưỡng sai lầm  = 0,05 (hoặc  = 0,01) - Neáu F  F  ( n1  1; n  1) chấp nhận H0 Chú ý: Trong bảng số Fisher F(n;m), ứng với  = 0,05 hay  = 0,01, ta có giá trị F  >1 S12 2 P(F > F  ) =  Do giá trị F = ta phải có S1 > S2 đểù F >1 S2 Thí dụ1: Hai phương pháp định phân K+ máu thực nhiều lần mẫu thử Phương pháp I thực 25 lần, có S12 =1,75 Phương pháp II thực 20 lần, có S 22 = 0,69 Hãy so sánh độ xác hai phương pháp Giải: Muốn so sánh độ xác hai phương pháp ta so sánh hai phương sai 12  22 Đặt giả thiết H0 : 12 =  22 HA : 12 ≠  22 S12 Theo giả thiết H0 , ta có F = ~ F (n1 -1 = 24; n2 -1=19) S2 S12 Tính F = = 2,536 Vì F > F 0,05 (24;19) = 2,11 nên bác bỏ H0, chấp nhận HA , ngưỡng sai lầm  = 0,05 S2 Độ xác hai phương pháp khác nhau, ngưỡng sai lầm  = 0,05 Chú ý: Trong trường hợp 12  22 chưa biết, n ≤ 30, trước so sánh 1 2 , ta phải so sánh 12  22 (Mục 5: So sánh trung bình có trung bình thực nghiệm độc lập với 12  22 chưa biết, n ≤ 30) Thí dụ2: Hai nhóm chuột nuôi theo chế độ cao thấp protein ngày thứ 28 đến ngày thứ 84 Kết quan sát cân nặng: Nhóm ăn theo chế độ cao protein X i : 134 146 104 119 124 161 107 83 113 129 97 123 Nhóm ăn theo chế độ thấp protein Yi : 70 118 101 85 107 132 94 Cân nặng trung bình chuột có khác nuôi theo hai chế độ cao thấp protein không? Giải: Trong trường hợp 12  22 chưa biết, n ≤ 30, trước so sánh 1 2 , ta phải so sánh 12  22 Đặt giả thiết H0 : 12 =  22 HA : 12 ≠  22 S12 S12 2 Theo giả thiết H0, ta có F = ~ F (n1 -1 =11; n2 -1= 6) Tính: S1 = 457,454 , S = 425,333 , F = = 1,075 S2 S2 Vì F < F 0,05 (11; 6) = 4,03 nên chấp nhận H0 Hai phương sai 12  22 khác ý nghóa Thí dụ 3: Khảo sát tác dụng chất A số sinh học thỏ Kết quan sát: Lô thỏ uống thuốc A : 0,8 1,3 1,2 0,9 1,3 Lô thỏ không uống thuốc A : 0,7 0,9 0,8 Kết luận ? Giải: Trong trường hợp 12  22 chưa biết, n ≤ 30, trước so sánh 1 2 , ta phải so sánh 12  22 Đặt giả thiết H0 : 12 =  22 HA : 12 ≠  22 S12 S12 2 Theo giả thiết H0, ta có F = ~ F (n1 -1 = 4; n2 -1= 2) Tính: S1 = 0,055 , S = 0,01 , F = = 5,5 S2 S2 Vì F < F 0,05 (4;2) =19,3 nên chấp nhận H0 Hai phương sai 12  22 khác ý nghóa SO SÁNH NHIỀU PHƯƠNG SAI KHI CÓ NHIỀU PHƯƠNG SAI THỰC NGHIỆM 3.1.ĐẶT VẤN ĐỀ Xét n mẫu độc lập: Mẫu thứ có cỡ mẫu n1 , có phương sai thực nghiệm S12 , lấy từ dân số có phân phối chuẩn N( 1 , 12 ) Mẫu thứ có cỡ mẫu n , có phương sai thực nghiệm S 22 , lấy từ dân số có phân phối chuẩn N( 2 ,  22 ) Mẫu thứ n có cỡ mẫu n n , có phương sai thực nghiệm S 2n lấy từ dân số có phân phối chuẩn N( n ,  2n ) Ta muốn so sánh n phương sai 12 ,  22 , ,  2n 3.2.PHÉP KIỂM BARTLETT Đặt giả thiết H0 : 12 =  22 = =  2n HA : 12 ,  22 , ,  2n không Đặt: 1  n1  , 2  n  , , n  n n  độ tự 1S12    n S 2n Goïi:     i , S  1    n i 1 n  n  B  2,303  log S    i log Si2 i 1   ,  C  1 1 n     3(n  1)   i1  i  Theo giaû thiết H0 , BARTLETT chứng minh biến ngẫu nhieân B ~  (n -1) C B >   (n -1) bác bỏ H0 , chấp nhận HA , ngưỡng sai lầm  = 0,05 (hoặc  = 0,01) C B - Nếu    (n -1) chấp nhận H0 C - Nếu Thí dụ 4: Điều tra lượng cholesterol nhóm người bệnh T , T , T , T Kết quan sát: Nhóm người bệnh T1 T2 T3 T4 ni i  n i  1,72 1,6 1,97 Si2 Hãy so sánh phương sai 12 ,  22 , 32 ,  24 2,37 Giải : Đặt giả thiết H0 : 12 =  22 = 32 =  24 HA : 12 ,  22 , 32 ,  24 không 1S12    n S 2n Tính: n = ,     i = 23 , S  =1,99     i 1 n n   n  1 n  2      = 1,077   B  2,303  log S    i log Si  = 0,278 , C   3(n  1)   i1  i  i 1   B B Theo giả thiết H0 , ta có ~  (n -1 = 3) Vì = 0,258 <  0,05 (3) =7,8 nên chấp nhận H0 C C Các phương sai 12 ,  22 , 32 ,  24 khác ý nghóa 3.3 PHÉP KIỂM COCHRAN Chú ý: Dùng phép kiểm COCHRAN n1  n1  n   n n Khi độ tự 1 = 2 = =  n = m Đặt giả thieát H0 : 12 =  22 = =  2n HA: 12 ,  22 , ,  2n không   max S12 , ,S2n Theo giả thiết H0 , ta có G = ~ G (m ; n) S i - Neáu G > G  (m ; n) bác bỏ H0 , chấp nhận HA , ngưỡng sai lầm  = 0,05 (hoặc  = 0,01) - Nếu G  G  (m ; n) chấp nhận H0 Thí dụ 4: Điều tra lượng cholesterol nhóm người bệnh T , T , T , T Kết quan sát: Nhóm người beänh T1 T2 T3 9 ni 8 i  n i  1,687 1,562 1,613 Si2 Hãy so sánh phương sai 12 ,  22 , 32 ,  24 T4 1,581 Giải : Đặt giả thiết H0 : 12 =  22 = 32 =  24 HA : 12 ,  22 , 32 ,  24 khoâng baèng     max S12 , ,S2n max S12 , ,S2n 1,687 Theo giả thiết H0 , ta có G = ~ G(m=8 ; n=4) Tính G = = = 0,261 2 S S , 443 i i Vì G < G 0,05 (8;4) = 0,5175 nên chấp nhận H0 Các phương sai 12 ,  22 , 32 ,  24 khaùc ý nghóa TS CHU VĂN THỌ Trưởng Bộ môn Toán Đại Học Y Dược Tp HCM

Ngày đăng: 02/09/2016, 17:12

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan