Giáo trình: Chương 8:Kiểm địn giả thuyết thống kê

16 1.5K 7
Giáo trình: Chương 8:Kiểm địn giả thuyết thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Giáo trình: Chương 8:Kiểm địn giả thuyết thống kê

Chương KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ (Tests of Hypotheses) Thông thường tham số θ chưa biết tập hợp ta đưa nhiều giả thuyết θ Vấn đề đặt làm kiểm định giả thuyết thích hợp với số liệu mẫu quan sát (x1, x2, …, xn ) 8.1 NHỮNG KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ 8.1.1 Giả thuyết thống kê ( Statistical Hypothesis) Là giả sử hay phát biểu đúng, sai liên quan đến tham số hay nhiều tập hợp 8.1.2 Giả thuyết không (giả thuyết đơn) giả thuyết ngược lại (đối thuyết) (Null Hypothesis & Alternative Hypothesis) Giả thuyết không: giả sử mà ta muốn kiếm định thường ký hiệu Ho Giả thuyết ngược lại: Việc bác bỏ giả thuyết không dẫn đến việc chấp nhận giả thuyết ngược lại Giả thuyết ngược lại thường ký hiệu H1 Ví dụ Kiếm định giả thuyết Với H1: θ < θo Kiếm định giả thuyết Với 8.1.3 Ho: θ ≤ θo θ = θo H1: θ > θo Kiếm định giả thuyết Với Ho: θ ≥ θo θ = θo Ho: θ = θo H1: θ ≠ θo Các loại sai lầm việc kiểm định giả thuyết thống kê Việc kiểm định giả thuyết thống kê phạm phải loại sai lầm a) Sai lầm loại I (type I error) Là loại sai lầm mà phạm phải việc bác bỏ giả thuyết Ho Ho Xác suất việc bác bỏ Ho Ho xác suất sai lầm loại I ký hiệu α α = P ( bác bỏ Ho / Ho đúng) = P(type I error) α : gọi mức ý nghĩa ( level of significance) α = 0,05; 0,01 ; 0,001 … Cao Hào Thi 89 b) Sai lầm II (type II error) Là loai sai lầm mà phạm phải không bác bỏ giả thuyết Ho Ho sai Xác suất việc không bác bỏ Ho Ho sai xác suất sai lầm loại II ký hiệu β β = P (không bác bỏ Ho /Ho sai) = P(type II error) Quyết định giả thuyết không Ho Bản chất Ho Không bác bỏ (chấp nhận ) Bác bỏ 8.1.4 Ho Quyết định Prob = 1- α P (không bác bỏ Ho / Ho) = 1-α Ho sai Sai lầm loại II Prob = β Sai lầm loại I Prob = α (α = mức ý nghĩa kiểm định) Quyết định Prob = - β (1 - β: lực kiểm định) Miền bác bỏ miền chấp nhận ( Rejection Region & Acceptance Region ) Tất giá trị có đại lượng thống kê kiểm định chia làm miền: miền bác bỏ miền chấp nhận ™ Miền bác bỏ miền chứa giá trị làm cho giả thuyết Ho bị bác bỏ ™ Miền chấp nhận miền chứa giá trị giúp cho giả thuyết Ho không bị bác bỏ Trong thực tế Ho khơng bị bác bỏ nghĩa chấp nhận Giá trị chia đôi hai miền gọi giá trị giới hạn (Critical value) 8.1.5 Kiểm định đầu kiểm định đầu (one – tailed test & two – tailed test) a) Kiểm định đầu Khi giả thuyết ngược lại H1 có tính chất phía (one – sided) việc kiểm định gọi kiểm định đầu Ho: θ ≤ θo hay H1: θ > θo Ho: θ ≥ θo H1: θ < θo b) Kiểm định hai đầu: Khi giả thuyết ngược lại H1 có tính chất phía (two – sided) việc kiểm định gọi kiểm định đầu Ho: θ = θo H1: θ ≠ θo Cao Hào Thi 90 8.2 CÁC BƯỚC CỦA VIỆC KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ: Gồm bước: Bước 1: Thành lập giả thuyết Ho Ví dụ: Ho: θ = θo Ho: θ ≤ θo Ho: θ ≥ θo Bước 2: Thành lập giả thuyết H1 Ví dụ: H1: θ < θo H1: θ > θo H1: θ ≠ θo Bước 3: Xác định mức ý nghĩa α Bước 4: Chọn tham số thống kê thích hợp cho việc kiếm định xác định miền bác bỏ, miền chấp nhận giá trị giới hạn Bước 5: Tính toán giá trị tham số thống kê việc kiểm định dựa số hiệu mẫu ngẫu nhiên Bước 6: Ra định: Nếu giá trị tính tốn rơi vào miền bác bỏ Ho định bác bỏ Ho Ngược lại chấp nhận Ho 8.3 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA PHÂN PHỐI CHUẨN N(µ,σ2) KHI Đà BIẾT σ2 Cho ( x1, x2 , …, xn) mẫu ngẫu nhiên cỡ n lấy từ tập họp tuân theo phân phối chuẩn N (µ,σ2 ) σ2 biết 8.3.1 Trường hợp Ho : µ = µo hay µ ≥ µo H1 : µ < µo Zα Bác bỏ H0 Cao Hào Thi Không bác bỏ H0 91 Miền bác bỏ R: Bác bỏ Ho Ztt = 8.3.2 X − µ0 σ/ n < - Zα Trường hợp 2: Ho : µ = µo hay µ ≤ µo H1 : µ > µo α Zα Bác bỏ H0 Không bác bỏ H0 Miền bác bỏ R: Bác bỏ Ho Ztt = 8.3.3 X − µ0 σ/ n > Zα Trường hợp 3: Ho : µ = µ H1 : µ ≠ µ α/2 α/2 -Zα/2 Bác bỏ H0 Không bác bỏ H0 Zα/2 Bác bỏ H0 Miền bác bỏ R: Bác bỏ Ho Ztt < - Z α / Ztt > Z α / Với : Ztt = X − µ0 σ/ n Thí dụ Trong nhà máy bánh kẹo, máy tự động sản xuất sô cô la với trọng lượng qui định 250g Biết trọng lượng sô la sản xuất có phân bố chuẩn N(µ,52) Trong ngày phân kiểm tra kỹ thuật chọn mẫu ngẫu nhiên gồm 16 sô cô la tính trọng lượng trung bình chúng 244g Có thể khẳng Cao Hào Thi 92 định máy tự động sản xuất sô cô la có trọng lượng nhỏ qui định khơng? Với mức ý nghĩa α=0,05 kiểm định giả thuyết thống kê tương ứng Giải 1/ Ho : µ = 250g 2/ H1 : µ < 250g 3/ α = 0,05 4/ Z α = Z 0, 05 = 16,45 5/ Z tt = X − µ0 σ/ n = ⇒ - Z α = -1,645 246 − 250 / 16 = −4,8 σ = 52 ⇒ σ = n = 16 X = 244g , µ = 250g 6/ Ztt = -4,8 < - Z 0,05 = -1,645 Ra định: Bác bỏ giả thuyết Ho mức ý nghĩa 5% Nghĩa là: máy tự động sản xuất sơ la có trọng lượng nhỏ qui định ⇒ Phải điều chỉnh lại máy Thí dụ Một máy khoan dây chuyền sản xuất dùng để khoan lỗ thép Khi máy khoan hoạt động chức thiết kế đường kính lỗ khoan tuân theo phân phối chuẩn với số trung bình inches độ lệch chuẩn 0,06 inches Trong q trình kiểm tra định kỳ xem máy khoan có hoạt động hay không, người ta lấy đo ngẫu nhiên lỗ khoan Giả sử độ lệch chuẩn không thay đổi Mẫu ngẫu nhiên gồm lỗ khoan cho ta đường kính trung bình mẫu 1,95 inches Kiểm định giả thuyết Ho : số trung bình tập hợp inches Với H1 : số trung bình tập hợp khác inches Trong trình kiểm định dùn α = 5% Giải: 1/ Ho : µ = µ0 = 2/ H1 : µ ≠ 3/ α = 0,05 4/ Z α / = Z 0,025 = 1,96 ⇒ - Z α / = −1,96 5/ X = 1,95; Z tt = X − µ0 σ/ n µ0 =2; σ = 0,06; = 1,95 − 0,06 / n=9 = −2,50 6/ Ta có : Ztt < - Z α / = −1,96 Ra định : Bác bỏ giả thuyết Ho mức ý nghĩa 5% ⇒ Máy hoạt động không chức thiết kế Cao Hào Thi 93 8.4 KIỂM ĐỊNH GIÁ TRỊ TRUNG BÌNH µ CỦA PHÂN PHỐI CHUẨN N(µ,σ2) KHI CHƯA BIẾT σ2 Giả sử ta có mẫu ngẫu nhiên cỡ mẫu n lấy từ tập hợp tuân theo phân phối chuẩn có số trung bình µ Gọi X Sx số trung bình độ lệch chuẩn mẫu, ta có trường hợp kiểm định µ với mức ý nghĩa α 8.4.1 Trường hợp 1: Ho : µ = µo hay µ ≥ µo H1 : µ < µo Miền bác bỏ R : Bác bỏ Ho tn-1 < tn-1,α Với tn-1= 8.4.2 X − µ0 , tn-1 tuân theo phân phối Student t với độ tự n-1 σx / n Trường hợp 2: Ho : µ = µo hay µ ≤ µo H1 : µ > µo Miền bác bỏ R: Bác bỏ Ho tn-1 > tn-1,α 8.4.3 Trường hợp 3: Ho : µ = µ H1 : µ ≠ µ Miền bác bỏ R: Bác bỏ Ho tn-1 > tn-1,α/2 Hay tn-1 < - tn-1,α/2 α α t*n-1,α t*n-1,α Không bác bỏ H0 Bác bỏ H0 Bác bỏ H0 α/2 α/2 -t*n-1,α/2 Bác bỏ H0 Cao Hào Thi Không bác bỏ H0 t*n-1,α/2 Không bác bỏ H0 Bác bỏ H0 94 Thí dụ Nhà quản lý cửa hàng bán lẻ nhận thấy số lượng hàng bán trung bình tháng 12 cao 20% so với tháng 11 Theo dõi sổ sách sáu cửa hàng (được chọn cách ngẫu nhiên) nhà quản lý nhận thấy phần trăm độ tăng trung bình lượng hàng bán cửa hàng tháng 12 sau: 19,2%; 18,4%; 19,8%; 20,2%; 20,4% 19,0% Giả sử phần trăm độ tăng trung bình lượng hàng bán tất cửa hàng hệ thống bán lẻ tuân theo phân phối chuẩn Kiểm định giả thuyết phần trăm độ tăng trung bình lượng hàng bán tháng 12 20% so với tháng 11 với α = 10% Giải: Ho : µ = µ0 = 20 Giả thuyết: H1 : µ ≠ 20 Ta có: α = 10% tn-1, α/2 = t5, 0.05 = 2,015 = -t5 , 0.05 = -2,015 -tn-1, α/2 Xác định X Sx X= ∑ xi n = 117 = 19,5 Sx2 = 0,588 tn-1 = ⇒ Sx = 0,588 = 0,767 x − µ0 19,5 − 20 = Sx / n 0,767 / = −1,597 tn-1, α/2 < tn-1 < tn-1, α/2 Ra định: -2,015 < -1,597 < 2,015 ⇒ Chấp nhận giả thuyết Ho (Những kiện từ mẫu không đủ mạnh để bác bỏ Ho) 8.5 KIỂM ĐỊNH PHƯƠNG SAI CỦA PHÂN PHỐI CHUẨN N(µ,σ2) Giả sử ta có mẫu ngẫu nhiên cỡ mẫu n lấy từ tập hợp tuân theo phân phối chuẩn có phương sai σ2 Gọi S2x phương sai mẫu, ta có trường hợp kiểm định σ2 với mức ý nhĩa α 8.5.1 Trường hợp 1: Ho : σ2 = σ02 hay Ho : σ2 ≥ σ02 H : σ2 < σ0 R : Bác bỏ Ho χ2n-1 < χ2n-1,1-α Với χ n2−1 = Cao Hào Thi (n − 1) S x2 σ 02 χ2n-1 tuân theo phân phối X2 với độ tự n-1 95 8.5.2 Trường hợp 2: Ho : σ2 = σ02 hay Ho : σ2 ≤ σ02 H : σ2 > σ0 R : Bác bỏ Ho χ2n-1 > χ2n-1,α 8.5.3 Trường hợp 3: Ho : σ2 = σ02 H : σ2 ≠ σ0 R : Bác bỏ Ho χ2n-1 > χ2n-1,α/2 hay χ2n-1 < χ2n-1,1-α/2 Thí dụ Để thỏa mãn tiêu chuẩn ấn định hợp đồng phương sai hàm lượng chất bẩn lò hàng hố chất khơng vượt q 4% Lấy ngẫu nhiên 20 lơ hàng ta có phương sai hàm lượng chất bẩn lô hàng mẫu 5,62% Kiểm định giả thuyết phương sai hàm lượng chất bẩn tất lô hàng không 4% với α =10% Giả sử tập hợp tuân theo phân phối chuẩn Giải: Ho : σ2 ≤ σ02 = Giả thuyết: H : σ2 > R : Bác bỏ Ho χ2n-1 > Ta có: α = 0,1, S2x = 5,62, χ n-1 = n = 20 → χ2n-1,α = χ219,0,1 = 27,20 n = 20, σ20 =4 (n − 1)σ x2 Ra định: σ = 19 * 5,62 = 26,695 Vì χ2n-1 =26,695 < χ2n-1,α =27,20 ⇒ Khơng bác bỏ Ho mức α =10% 8.6 KIỂM ĐỊNH GIÁ TRỊ TỶ SỐ P CỦA TẬP HỢP CHÍNH TRONG ĐIỀU KIỆN CỠ MẪU LỚN: Gọi P tỉ số số lần thành cơng tập hợp f tỉ số số lần thành công n phép thử Khi cỡ mẫu n lớn, biến ngẫu nhiên chuẩn hóa ∑ = f −p p(1 − p) / n gần có phân phối chuẩn hóa Ta có trường hợp p với mức ý nghĩa α Cao Hào Thi 96 8.6.1 Trường hợp 1: Ho : P = P0 hay Ho : P ≥ P0 H1 : P < P0 R : Bác bỏ Ho Ztt < - Zα Với Z = 8.6.2 f −p p (1 − p) / n , Z ∼ N (0,1) Trường hợp 2: Ho : P = P0 hay Ho : P ≤ P0 H1 : P > P0 R : Bác bỏ Ho Z > Zα 8.6.3 Trường hợp 3: Ho : P = P0 H1 : P ≠ P0 R : Bác bỏ Ho Z > Zα/2 Hay Z < -Zα/2 Thí dụ Lấy ý kiến 199 giảng viên việc day học theo lối tín có 104 giảng viên đồng ý Kiếm định với mức giả thuyết cho có nửa số giảng viên trường Bách khoa đồng ý dạy theo lối tín Giải Gọi P tỉ lệ số giảng viên trường Đại học Bách Khoa đồng ý dạy theo lối tín Giả thuyết: Ho : P = Po =0,5 H1 : P ≠ 0,5 Zα/2 = Z0,05 = 1,645 α = 10% -Zα/2 = -Z0,05 = -1,645 n =199, Po = 0,5 ⇒ Z= f − p0 p (1 − p ) / n Ra định: f= = 104 = 0,523 199 0,523 − 0,50 0,50 * 0,50 / 199 = 0,65 -Zα/2 < Z < Zα/2 -1,645 < 0,65 < 1,645 ⇒ Không bác bỏ Ho Cao Hào Thi 97 Thí dụ Cũng ví dụ trên, kiếm định giả thuyết số giảng viên đồng ý nửa số giảng viên trường Giải: Giả thuyết: Ho : P ≥ Po = 0,5 H1 : P < 0,5 Zα = Z0,1 = 1,28 ⇒ -Zα = -1,28 Ra định: Z = 0,65 > -Zα = 1,28 ⇒ Không bác bỏ Ho 8.7 KIỂM ĐỊNH GIẢ THUYẾT VỀ QUY LUẬT PHÂN PHỐI LÝ THUYẾT 8.7.1 Kiểm định tính phù hợp (A Goddness-of-Fit Test) Giả sử ta có mẫu ngẫu nhiên với cỡ mẫu n Mỗi giá trị quan sát mẫu ngẫu nhiên xếp vào K lớp Gọi số phần tư lớp thứ i Oi với i = 1,2, …,K Trong việc kiểm định tính phù hợp ta có: Ho : Xác suất giá trị quan sát rơi vào lớp thứ i = Pi (i =1,2, … k) H1 : Xác suất giá trị quan sát rơi vào lớp thứ i ≠ Pi R : Bác bỏ Ho χ2k-1 > χ2k-1,α k Với : χ k2−1 = ∑ i =1 (Oi − Ei ) Ei Ei : Kỳ vọng số phần tử lớp thứ i Với giả thuyết Ho ta có: Ei = n*Pi χ k-1 tuân theo phân phối χ với độ tự k-1 Ví dụ Một công ty chất đốt dựa vào kinh nghiệm q khứ cho đến cuối mùa đơng có 80% lượng khách hàng trả đầy đủ tiền 10% trả chậm tháng, 6% trả chậm tháng 4% trả châm tháng Đến cuối mùa đông để kiểm định lại điều này, Cty lấy ngẫu nhiên mẫu gồm 400 khách hàng nhận thấy có 287 khách hàng trả ngay, 49 trả chậm tháng, 30 trả chậm tháng 34 trả chậm tháng Hỏi kinh nhiệm khứ áp dựng cho mùa đông năm không? Kiểm định với mức ý nghĩa 5% Giải Ho : Xác suất lượng khách hàng trả tiền mùa đông phù hợp với số liệu khứ Nghĩa xác suất tương ứng với loại khách hàng là: P1 = 0,8, P2 = 0,1, P3 = 0,06, P4 = 0,04 H1 : P1 ≠ 0,8, P2 ≠ 0,1, P3 ≠ 0,06, P4 ≠ 0,04 α = 0,05 , k = ⇒ χ2k-1,α = χ23,0,05 = 7,81 Cao Hào Thi 98 Dưới giả thuyết Ho, kỳ vọng số khách hàng loại từ tổng số 400 khách hàng: E1 = 400 * 0,8 = 320 E2 = 400 * 0,1 = 40 E3 = 400 * 0,06 = 24 E4 = 400 * 0,04 = 16 Ta có: Số tháng trả chậm >2 Tổng Số khách hàng dựa vào mẫu quan sát Oi 287 49 30 34 400 Xác suất Pi 0,8 0,1 0,06 0,04 Kỳ vọng số khách hàng loại Ei 320 40 24 16 400 (O i − E i ) (287 − 320) (49 − 40) (30 − 24) (34 − 16) = + + + ∑ Ei 320 40 24 16 i =1 χ2k-1 = χ2k-1 =227,187 Ra định: Vì χ2k-1 > χ2k-1,α ⇒ Bác bỏ Ho Nghĩa áp dụng kinh nghiệm khứ vào năm Số lượng khách hàng trả chậm năm nhiều năm trước 8.7.2 Kiểm định giả thuyết qui luật phân phối lý thuyết Trong việc kiểm định giả thuyết tính phù hợp số liệu quan sát với qui luật phân phối lý thuyết ta có: Ho : Số liệu quan sát tuân theo qui luật phân phối lý thuyết H1 : Số liệu quan sát không tuân theo qui luật phân phối lý thuyết Cách tìm miền bác bỏ R kiểm định χ2 Chia n số liệu quan sát làm K khoảng Gọi Oi số phần tử mẫu quan sát nằm khoảng i (i=1,2, …, K) Gọi Ei kỳ vọng số phần tư nằm khoảng i (Ei tính dựa vào qui luật phân phối lý thuyết) Ei = n Pi Pi = xác suất phần tử nằm khoảng i Tính χ χ2k-1 = (O i − E i ) ∑ Ei i =1 χ2 gần tuân theo phân phối Chi Squared với độ tự ν, ν = k -r -1 r : số tham số cần phải ước lượng Cao Hào Thi 99 Với phân phối chuẩn r = Với phân phối Poisson r = Tìm miền bác bỏ R Nếu χ2 > χ2ν,α ta bác bỏ giả thuyết Ho Nghĩa số liệu quan sát không tuân theo qui luật phân phối lý thuyết định → Đi tìm qui luật phân phối lý thuyết khác Ví dụ : Kiểm định phân phối chuẩn Để đo lường chất lượng lô sản phẩm, người ta lấy đo 200 chi tiết cho kết sau: Các lớp 54,795 54,805 54,815 54,825 54,835 54,845 54,855 54,865 Số chi tiết quan sát Oi 54,80 54,81 54,82 54,83 54,84 54,85 54,86 54,87 14 33 47 45 33 15 54,805 54,815 54,825 54,835 54,845 54,855 54,865 54,875 n = 200 Vấn đề đặt số liệu quan sát có tuân theo phân phối chuẩn không? Giải: Giả thuyết: Ho : Các số liệu quan sát tuân theo phân phối chuẩn H1 : Các số liệu quan sát không tuân theo phân phối chuẩn Tính Ei Ei = n * pI x −µ⎞ ⎛x −µ Với Pi = P(xi < x < xi+1) = P⎜ i < Z < i +1 ⎟ σ ⎠ ⎝ σ Ở lấy µ = X = 54,835 (số trung bình mẫu) σ = Sx = 0,016 (độ lệch mẫu) Ví dụ: Tính P1 , E1 P1 = P (54,795 < X < 54,805) = P ( 54,795 − 54,835 54,805 − 54,835 ) -Zα =... 244g Có thể khẳng Cao Hào Thi 92 định máy tự động sản xuất sơ la có trọng lượng nhỏ qui định không? Với mức ý nghĩa α=0,05 kiểm định giả thuyết thống kê tương ứng Giải 1/ Ho : µ = 250g 2/ H1 : µ

Ngày đăng: 28/08/2012, 15:58

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan