PHÂN PHỐI MẪU (Sampling Distributions) pptx

23 801 4
PHÂN PHỐI MẪU (Sampling Distributions) pptx

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

PHÂN PHỐI MẪU (Sampling Distributions) I. GIỚI THIỆU Phân phối (PP) mẫu là chìa khóa để hiểu được các suy luận thống kê. Việc hiểu biết PPXS nhằm hai mục đích: 1 Tìm lời giải cho các câu hỏi về xác suất của các số thống kê của mẫu 2 Cung cấp nền tảng lý thuyết cần thiết cho việc đưa ra những suy luận thống kê đúng đắn. PP mẫu nhằm vào mục đích thứ nhất. Định nghĩa PP. của tất cả các giá trị được xem là các số thống kê (statistics) tính được từ các mẫu (samples) có cùng kích thước mẫu (sample size) rút ngẫu nhiên từ cùng một dân số, được gọi là PP. mẫu của số thống kê đó. Các bước thiết lập PP. mẫu + Từ một dân số hữu hạn có kích thước N, rút ngẫu nhiên tất cả các mẫu (có thể rút được) có kích thước n. + Tính số thống kê có liên quan cho từng mẫu + Lập bảng phân phối tần số cho các số thống kê tính được này. Đặc điểm quan trọng 03 điều cần được biết về 1 PP. mẫu: số trung bình, phương sai, và dạng hàm số. Việc thiết lập PP. mẫu theo 3 bước nói trên sẽ trở nên rất khó khăn với dân số có kích thước lớn, và trở nên bất khả thi khi gặp dân số vô hạn. Cách tốt nhất để giải quyết 2 vấn đề này là dùng các lý thuyết toán học để tính gần đúng PP. mẫu của 1 số thống kê. II. PP. (CỦA SỐ) TRUNG BÌNH MẪU (Distribution of the Sample Mean) Thí dụ dẫn nhập Giả sử có 1 dân số có kích thước N = 5 (tuổi của 5 đứa trẻ điều trị ngoại trú tại PKSK Tâm Thần Quận) với x 1 = 6, x 2 = 8, x 3 = 10, x 4 = 12, x 5 = 14. Số trung bình (dân số): 10 5 50     i x  Phương sai (dân số):   8 5 40 2 2     N x i   Phương sai:   10 4 40 1 2 2      N x S i  (tính cách khác) Thiết lập PP. mẫu của số trung bình mẫu, x, dựa trên kích thước mẫu n = 2 rút ra từ dân số này. Rút tất cả các mẫu có thể rút được với n = 2 từ dân số này theo cách “để lại” (with replacement), nghĩa là rút ra xem kết quả xong thì trả lại vào dân số; tổng số mẫu rút được bằng N n = 25 RÚT LẦN 2 6 8 10 12 14 6 6, 6 8, 6 10, 6 12, 6 14, 6 RÚT (6) (7) (8) (9) (10) 8 6, 8 8, 8 10, 8 12, 8 14, 8 LẦN (7) (8) (9) (10) (11) 10 6, 10 8, 10 10, 10 12, 10 14, 10 1 (8) (9) (10) (11) (12) 12 6, 12 8, 12 10, 12 12, 12 14, 12 (9) (10) (11) (12) (13) 14 6, 14 8, 14 10, 14 12, 14 14, 14 (10) (11) (12) (13) (14) (Số trong ngoặc là số trung bình, x ) Lập bảng phân phối tần số của x x Tần số Tần số tương đối 6 1 1/25 7 8 9 10 11 12 13 14 2 3 4 5 4 3 2 1 2/25 3/25 4/25 5/25 4/25 3/25 2/25 1/25 Tổng 25 25/25 Dạng hàm số của PP. dân số: Phân phối đơn đều Dạng hàm số của PP. trung bình mẫu: phân phối dạng bình thường f ( x ) 6 7 8 9 10 11 12 13 14 x Tính thông số của PP. Trung bình mẫu i n x x 6 7 8 14 250 10 25 25 N           số trung bình của PP. trung bình mẫu bằng số trung bình của dân số gốc 2 2 2 2 i 2 x n x (x ) (6 10) (7 10) (14 10) 25 N             = 100 4 25  Phương sai của PP. mẫu không bằng phương sai dân số, mà bằng phương sai dân số chia cho kích thước mẫu 2 2 x 8 4 n 2      Căn số bậc 2 của phương sai của PP. mẫu, 2 x n    , được gọi là sai số chuẩn của số trung bình, hoặc gọi đơn giản là sai số chuẩn (standard error). Đặc điểm của PP. Trung bình mẫu Khi lấy mẫu theo cách “để lại” hoặc lấy mẫu từ 1 dân số vô hạn 1. Từ một dân số phân phối bình thường, PP. Trung bình mẫu có những đặc điểm sau: + PP. của x sẽ bình thường + Số trung bình, x  , của phân phối x sẽ bằng với số trung bình của dân số, , mà từ đó các mẫu được rút ra. + Phương sai, 2 x  , của phân phối x sẽ bằng phương sai của dân số chia cho kích thước mẫu. 2. Từ một dân số phân phối không bình thường Lý thuyết giới hạn trung tâm (Central Limit Theorem) Cho một dân số có dạng hàm số không bình thường với số trung bình là  và phương sai hữu hạn  2 , phân phối mẫu của x (là các số trung bình tính được từ các mẫu có kích thước n từ dân số này) sẽ có số trung bình x  =  và phương sai 2 x  =  2 / n và sẽ phân phối gần như bình thường khi kích thước mẫu lớn. Trong thực tiễn, kích thước mẫu bằng 30 được xem là đủ lớn. Nói chung, PP. Trung bình mẫu càng gần với bình thường hơn khi kích thước mẫu càng lớn. Lấy mẫu “Không để lại” (without replacement) Trong hầu hết các tình huống thực tế, việc lấy mẫu nhất thiết phải được thực hiện với 1 dân số hữu hạn và PP. Trung bình mẫu trong những điều kiện này cũng có phần nào thay đổi. Với thí dụ dẫn nhập, nếu việc lấy mẫu được tiến hành theo cách “không để lại” và không quan tâm đến thứ tự được rút ra của các giá trị (trong các mẫu), thì chỉ có 10 mẫu ( 5 C 2 ). Số trung bình của phân phối x: i x N n x 7 8 9 13 100 10 C 10 10           Số trung bình của PP. mẫu cũng bằng với số trung bình dân số. Phương sai của PP. mẫu 2 i 2 x x N n (x ) 30 3 C 10        Phương sai của PP. Trung bình mẫu, 2 x  , không bằng 4 2 8 2  n  mà bằng [...]... / n Phân phối trung bình mẫu là phân phối bình thường 2 Khi việc lấy mẫu được thực hiện trên 1 dân số phân phối không bình thường với phương sai biết trước: a Số trung bình b Sai số chuẩn x =   x   / n khi n / N  0,05  c x  ( / n ) Nn N 1 Phân phối trung bình mẫu là phân phối gần như bình thường Thí dụ áp dụng Giả sử người ta biết được rằng chiều dài hộp sọ của 1 dân số người phân phối. .. trung bình mẫu) + Rút tất cả các mẫu (có thể rút được) có n = 150 từ dân số ˆ + Tính tỉ lệ mẫu (sample proportion) p cho tất cả các mẫu trên ˆ + Lập phân phối mẫu cho các p đã tính được này Đặc điểm của PP Tỉ lệ mẫu: khi cỡ mẫu lớn, PP Tỉ lệ mẫu phân phối gần như bình thường (theo lý thuyết giới hạn trung tâm) Số trung bình của phân phối,  p bằng trung ˆ bình cộng của tất cả các tỉ lệ mẫu) , sẽ bằng... cả các mẫu (có thể rút được) có n2 = 15 từ dân số 2 + Tính trung bình cho tất cả các mẫu trên + Lấy hiệu của từng cặp số trung bình mẫu (1 từ dân số 1, và 1 từ dân số 2) + Lập phân phối mẫu cho các hiệu đã tính được này Đặc điểm của PP hiệu 2 trung bình mẫu + Phân phối bình thường  + Số trung bình x1  x 2 = 1 – 2 2 x1  x 2 = 2 1  + Sai số chuẩn 2 1 2   n n Thí dụ trên cho thấy phân phối hiệu... để tìm thấy 1 mẫu có n = 10 (rút ra từ dân số này) có số trung bình, x , lớn hơn 190 là bao nhiêu? + Mẫu khảo sát này (n = 10) chỉ là một trong rất nhiều mẫu có n = 10 rút ra từ dân số, như vậy số trung bình của nó sẽ là 1 trong rất nhiều x cấu tạo nên phân phối trung bình mẫu ((phát xuất từ dân số này) + Dân số khảo sát phân phối gần như bình thường, như vậy PP Trung bình mẫu cũng phân phối gần như... có các biến số nhị phân với tỉ lệ (đặc điểm được quan tâm) lần lượt là thì phân phối hiệu của 2 tỉ lệ mẫu p1  p 2 sẽ ˆ ˆ p1 và p 2 phân phối gần như bình thường với : Số trung bình : p ˆ 1 Sai số chuẩn:   ˆ p2 ˆ ˆ p1  p 2   pp 1 2 p1 (1  p1 ) p 2 (1  p 2 )  n1 n2 khi n1 và n2 lớn ˆ ˆ Thiết lập phân phối mẫu của p1  p 2 + Rút tất cả các mẫu (có thể rút được) có kích thước mẫu là n1 từ dân... thước mẫu lớn để có thể chuyển từ PP nhị phân sang PP bình thường Tiêu chuẩn thường được áp dụng là khi cả np và n(1 – p) đều > 5 (Với n = 150 và p của dân số bằng 0,08: np (150 x 0,08) = 12, và nq (150 x 0,92) = 138 đều lớn hơn 5) V PHÂN PHỐI HIỆU 2 TỈ LỆ MẪU (Distribution of the Difference between Two Sample Proportions) Đặc điểm của phân phối hiệu 2 tỉ lệ mẫu: Nếu 2 mẫu độc lập có kích thước mẫu n1... 1 2 3 (Nếu kích thước mẫu lớn, lý thuyết giới hạn trung tâm sẽ được áp dụng và x sẽ phân phối gần như bình thường) N n được gọi là yếu tố điều chỉnh dân số hữu hạn (finite population N 1 Yếu tố correction) và có thể được bỏ qua khi kích thước mẫu tương đối nhỏ so với dân số (n / N  0,05) TÓM TẮT PHÂN PHỐI TRUNG BÌNH MẪU 1 Khi việc lấy mẫu được thực hiện trên 1 dân số phân phối bình thường với phương... cả các mẫu (có thể rút được) có kích thước mẫu là n1 từ dân số 1 Rút tất cả các mẫu (có thể rút được) có kích thước mẫu là n2 từ dân số 2 + Tính tỉ lệ mẫu cho tất cả các mẫu trên + Lấy hiệu của từng cặp tỉ lệ mẫu (1 từ dân số 1, và từ dân số 2) + Lập phân phối mẫu cho các hiệu đã tính được này Xác suất của hiệu 2 tỉ lệ mẫu được tính bằng z ˆ ˆ  p1  p 2    p1  p 2  p1 1  p1  p 2 1  p 2... cong phân phối bình thường chuẩn ở bên trái của –1,73 bằng 0,0375 Nếu không có sự khác nhau giữa hai số trung bình dân số, xác suất để tìm thấy hiệu của 2 số trung bình mẫu lớn bằng hoặc lớn hơn 13 là 0,0375 Lấy mẫu từ các dân số PP bình thường Tiến trình tính toán nói trên vẫn đúng khi 2 mẫu có kích thước khác nhau n1  n2, và khi phương sai dân số khác nhau 1  2 Lấy mẫu từ các dân số phân phối. .. thường hoặc không biết dạng phân phối: Lấy mẫu lớn để áp dụng lý thuyết giới hạn trung tâm IV PHÂN PHỐI TỈ LỆ MẪU (Distribution of the Sample Proportion) Thí dụ chứng minh: Giả sử trong một dân số có 8% số người bị mù màu (p = 0,08) Nếu chọn ngẫu nhiên 150 người từ dân số này thì xác suất để có được tỉ lệ mù màu (của mẫu) lớn bằng hoặc lớn hơn 0,15 là bao nhiêu ˆ Thiết lập PP mẫu của p (Cách tiến hành . Tính tỉ lệ mẫu (sample proportion) p ˆ cho tất cả các mẫu trên. + Lập phân phối mẫu cho các p ˆ đã tính được này. Đặc điểm của PP. Tỉ lệ mẫu: khi cỡ mẫu lớn, PP. Tỉ lệ mẫu phân phối gần như. TẮT PHÂN PHỐI TRUNG BÌNH MẪU 1. Khi việc lấy mẫu được thực hiện trên 1 dân số phân phối bình thường với phương sai biết trước: a.  x =  b. x / n    c. Phân phối trung bình mẫu. rất nhiều x cấu tạo nên phân phối trung bình mẫu ((phát xuất từ dân số này) + Dân số khảo sát phân phối gần như bình thường, như vậy PP. Trung bình mẫu cũng phân phối gần như bình thường

Ngày đăng: 26/07/2014, 12:21

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan