ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT - BÀI TOÁN ƯỚC LƯỢNG doc

17 3.3K 41
ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT - BÀI TOÁN ƯỚC LƯỢNG doc

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 Chương 5. ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT 5.1. Bài toán ước lượng Trong phần này sẽ đề cập đến việc suy luận các đặc trưng của tổng thể dựa trên các đặc trưng của mẫu. Các đặc trưng của tổng thể có thể là giá trị trung bình, phương sai hoặc tỷ lệ các đơn vị của tổng thể có một tính chất nào đó. Vấn đề đặt ra là ước lượng các đặc trưng của tổng thể (chưa biết) từ các đặc trưng của mẫu dữ liệu thu thập được. 1. Các vấn đề liên quan đến bài toán ước lượng Có hai loại ước lượng là ước lượng điểm và ước lượng khoảng.  Ước lượng điểm là phương pháp dùng một tham số thống kê mẫu đơn lẻ để ước lượng về giá trị thật của tham số tổng thể. Các tham số đặc trưng Mẫu Tổng thể Trung bình ̅ Tỷ lệ ̂ Phương sai Do các tham số đặc trưng của tổng thể được ước lượng thông qua một mẫu được chọn nên khi thay đổi từ mẫu này sang mẫu khác sẽ dẫn đến các tham số đặc trưng của tổng thể cũng thay đổi. Vì vậy, trong trường hợp trung bình của tổng thể nếu dùng một giá trị trung bình mẫu của một mẫu cụ thể để ước lượng điểm về trung bình tổng thể sẽ kém tin cậy hơn so với khi vận dụng quy luật phân phối của trung bình mẫu vào quá trình ước lượng trung bình tổng thể qua phương pháp ước lượng khoảng.  Ước lượng khoảng là phương pháp dựa vào dữ liệu của mẫu, với một độ tin cậy cho trước, xác định khoảng giá trị mà đặc trưng của tổng thể có thể rơi vào. Một cách tổng quát, gọi là đặc trưng của tổng thể cần ước lượng. Giả sử, dựa vào mẫu quan sát tìm được hai biến ngẫu nhiên và sao cho ( < < ) = 1− . Gọi , lần lượt là các giá trị cụ thể của và . Khoảng ( , )được gọi là khoảng ước lượng với độ tin cậy ( 1− ) ∗100%của , hay nói một cách ngắn gọn là khoảng tin cậy ( 1− ) ∗100%của . 2. Ước lượng trung bình tổng thể A. Ước lượng trung bình một tổng thể a. Biết phương sai của tổng thể Giả sử có mẫu quan sát được chọn ngẫu nhiên từ tổng thể phân phối chuẩn có phương sai đã biết. Gọi là trung bình mẫu, khoảng tin cậy ( 1− ) ∗100%của trung bình tổng thể được xác định bởi 2 − / ∗ √ < < + / ∗ √ Với có phân phối chuẩn. Ví dụ: Một công ty muốn ước lượng số tài liệu (trang) được chuyển bằng fax trong một ngày. Kết quả thu thập từ 15 ngày cho thấy trung bình một ngày có 267 trang tài liệu được chuyển bằng fax. Theo kinh nghiệm từ các văn phòng tương tự thì độ lệch chuẩn là 32 trang. Giả sử số trang tài liệu chuyển bằng fax trong một ngày có phân phối chuẩn với độ tin cậy 95%, ta ước lượng − / ∗ √ < < + / ∗ √ Với = 267, = 32, = 15, / = . = 1. 96 ta có 250.8055 < < 283.1945. Như vậy với độ tin cậy 95%, số lượng tài liệu chuyển trung bình một ngày được ước lượng từ 251 đến 284 trang. Nhận xét:  Với một độ tin cậy và kích thước mẫu không đổi, nếu độ lệch chuẩn càng lớn thì khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp.  Với một độ tin cậy và độ lệch chuẩn không đổi, nếu kích thước mẫu càng lớn thì khoảng ước lượng càng hẹp, tức là độ chính xác của ước lượng càng cao.  Với độ lệch chuẩn và kích thước mẫu không đổi, nếu độ tin cậy càng cao thì khoảng ước lượng càng rộng, tức là độ chính xác của ước lượng càng thấp. b. Chưa biết phương sai của tổng thể Trong thực tế, ta thường không biết phương sai của tổng thể. Trong trường hợp này ta vẫn giả định tổng thể có phân phối chuẩn, khoảng tin cậy ( 1− ) 100% trung bình tổng thể được xác định như sau: − , / ∗ √ < < + , / ∗ √ Với có phân phối Student với bậc tự do ( −1 ) . Ví dụ: Công ty điện thoại ở một thành phố muốn ước lượng thời giant rung bình của các cuộc điện đàm đường dài vào những ngày cuối tuần. Mẫu ngẫu nhiên 20 cuộc gọi đường dài vào những ngày cuối tuần cho thấy thời gian điện đàm trung bình là 14.8 phút, độ lệch chuẩn là 5.6 phút. Như vậy với độ tin cậy 95%, thời gian trung bình của cuộc điện đàm đường dài được xác định như sau: − , / ∗ √ < < + , / ∗ √ 3 Với = 14. 8; = 5.6; = 20, , / = , . = 2. 093 ta có 12.1792 < < 17 .4208 Nghĩa là với độ tin cậy 95%, thời gian trung bình của một cuộc điện đàm đường dài vào cuối tuần được ước lượng khoảng từ 12.1792 đến 17.4208 phút. Lưu ý: Trong trường hợp mẫu lớn ( ≥30), ta có thể dùng phân phối chuẩn thay cho phân phối Student, kể cả trong trường hợp tổng thể có phân phối chuẩn. Ví dụ: Một trường đại học thực hiện nghiên cứu về số giờ tự học của sinh viên trong một tuần. Chọn ngẫu nhiên 200 sinh viên cho thấy số giờ tự học trong tuần tính trung bình là 18.36 giờ, độ lệch chuẩn là 3.92 giờ. Như vậy với độ tin cậy 95%, số giờ tự học trung bình của sinh viên ở trường này được ước lượng là: − / ∗ √ < < + / ∗ √ Với = 18. 36; =3.92; = 200; / = . = 1. 96 ta có 17.8168 < < 18 .9032 Nghĩa là với độ tin cậy 95%, số giờ tự học trung bình trong tuần của sinh viên được ước lượng từ 17.8168 đến 18.9032 giờ. B. Ước lượng sự khác biệt giữa hai trung bình tổng thể Trong nhiều trường hợp, ta có thể quan tâm đến khác biệt giữa trung bình hai tổng thể, chẳng hạn như khác biệt về doanh số trung bình trong tuần từ hai phương pháp trưng bày hàng hóa, chào hàng hóa khác nhau, hoặc sự khác biệt giữa năng suất cây trồng do sử dụng hai loại phân bón khác nhau… Phương pháp so sánh trung bình hai tổng thể phụ thuộc vào cách thức lấy mẫu: mẫu phối hợp từng cặp (mẫu phụ thuộc) hoặc mẫu độc lập. a. Mẫu phối hợp từng cặp Ở phương pháp này, các đơn vị mẫu được chọn từng cặp, từ hai tổng thể. Thông thường mẫu phối hợp từng cặp thường bao gồm các trường hợp sau đây: - So sánh trước và sau, chẳng hạn mẫu thứ nhất là doanh số bán trước khi thực hiện khuyến mãi, mẫu thứ hai là doanh số sau khi thực hiện khuyến mãi. Ở đây mẫu phối hợp từng cặp theo nghĩa là doanh số trước và sau khi khuyến mãi được thu thập từ cùng một cửa hàng. - So sánh các đơn vị ở cùng một đặc điểm nào đó, chẳng hạn mẫu thứ nhất là tiền lương của nhân viên nam ở công ty Y, mẫu thứ hai là tiền lương của nhân viên nữ ở công ty Y, hai nhân viên nam và nữ được xem là giống nhau về năng lực và kinh nghiệm. Ở đây, mẫu phối hợp từng cặp theo nghĩa là cả hai nhân viên nam và nữ được xem là có nang lực và kinh nghiệm như nhau. 4 - So sánh giữa các đơn vị phối hợp từng cặp theo không gian, chẳng hạn mẫu thứ nhất là doanh số của loại nước giải khát nhãn hiệu A ở cửa hàng; ở mẫu thứ hai là doanh số bán hàng của loại nước giải khát nhãn hiệu B ở cửa hàng đó. Ở đây, mẫu phối hợp từng cặp theo nghĩa là cả hai doanh số của hai nhãn hiệu A và B đều được thu thập từ cùng một cửa hàng. - So sánh giữa các đơn vị phối hợp từng cặp theo thời gian, chẳng hạn mẫu thứ nhất là doanh số của nhà hàng X ở một tuần lễ nào đó, mẫu thứ hai là doanh số của nhà hàng Y trong cùng một tuần lễ đó. Ở đây mẫu phối hợp từng cặp theo nghĩa từng cặp doanh số được thu thập trong cùng một tuần lễ. Giả sử có các cặp quan sát ( , )lấy ngẫu nhiên từ hai tổng thể và . Gọi , lần lượt là trung bình của tổng thể , ; ̅ là trung bình của khác biệt; là độ lệch tiêu chuẩn của khác biệt. Với khoảng tin cậy ( 1− ) 100% của − được xác định như sau: ̅ − , / ∗ √ < − < ̅ + , / ∗ √ Với có phân phối Student với bậc tự do ( −1 ) . Ví dụ: Công ty điện lực thực hiện các biện pháp khuyến khích tiết kiệm điện. Lượng điện tiêu thụ ghi nhận ở 12 hộ gia đình trước và sau khi có các biện pháp khuyến khích tiết kiệm ddieemnj như sau: Hộ gia đình Lượng điện tiêu thụ trước và sau khi khuyến khích tiết kiệm điện (KWh) Độ lệch = − Bình phương độ lệch − ̅ Trước Sau 1 73 69 4 0.340278 2 50 54 -4 55.00694 3 83 82 1 5.840278 4 78 67 11 57.50694 5 56 60 -4 55.00694 6 74 73 1 5.840278 7 74 75 -1 19.50694 8 87 78 9 31.17361 9 69 64 5 2.506944 10 72 72 0 11.67361 11 77 70 7 12.84028 12 75 63 12 73.67361 Tổng 41 330.9167 Vậy ta có ̅ = = 3.4167; = . =30.08333↔ = 5.4848. 5 Giả sử rằng các khác biệt giữa lượng điện trước và sau khi khuyến khích tiết kiệm điện có phân phối chuẩn, khoảng itn cậy 95% của − là ̅ − , / ∗ √ < − < ̅ + , / ∗ √ Với = 12; ̅ = 3. 4167; = 5.4848; , / = , . = 2. 201 ta có −0.0682 < − < 6 .9016 Như vậy, khoảng tin cậy 95% của khác biệt giữa lượng điện tiêu thụ trung bình trước và sau khi khuyến khích tiết kiệm được ước lượng từ -0.0682 KWh đến 6.9016 KWh. Khoảng ước lượng này bao gồm trị số 0, do vậy có thể tin rằng lượng điện tiêu thụ trung bình trước và sau khi thực hiện các biện pháp khuyến khích tiết kiệm là bằng nhau. b. Mẫu độc lập Gọi , là các mẫu được chọn ngẫu nhiên độc lập từ hai tổng thể phân phối chuẩn và ; , là trung bình của hai tổng thể và ; , là phương sai của hai tổng thể và ; , là trung bình của hai mẫu. Khoảng tin cậy ( 1− ) 100% của − được xác định như sau: ( − ) − / ∗ + < − < ( − ) + / ∗ + Với có phân phối chuẩn. Ví dụ: Một công ty đang xem xét kế hoạch tiết giảm chi phí sản xuất thông qua việc xây dựng một dây chuyền sản xuất mới nhằm rút ngắn thời gian sản xuất sản phẩm. Ở dây chuyền sản xuất mới 40 sản phẩm được sản xuất với thời gian trung bình 46.5 phút/sản phẩm, độ lệch tiêu chuẩn là 8 phút. Với dây chuyền sản xuất, 38 sản phẩm được sản xuất với thời gian trung bình 51.2 phút/sản phẩm, độ lệch chuẩn 9.5 phút. Hãy ước lượng khoảng tin cậy 95% cho khác biệt về thời gian sản xuất giữa dây chuyền sản xuất mới và cũ. Ta có = 46. 5 = 8 = 40 / = . = 1. 96 = 51.2 = 9. 5 = 38 Ta có khoảng tin cậy 95% sự khác biệt về thời gian sản xuất trung bình giữa dây chuyền sản xuất mới và cũ là 6 ( 46.5−51.2 ) −1.96∗ 8 40 + 9.5 38 < − < ( 46.5−51.2 ) +1.96∗ 8 40 + 9.5 38 −8.6077 < − < −0.7923 Khoảng tin cậy 95% tính được chỉ là các giá trị âm, không bao gồm giá trị 0. Do vậy có thể nói rằng dây chuyền sản xuất mới có thời gian sản xuất ngắn hơn. Với độ tin cậy 95%, ta ước lượng dây chuyền sản xuất mới rút ngắn thời giant rung bình sản xuất một sản phẩm trong khoảng từ 0.7923 phút đến 8.6077 phút. 3. Ước lượng tỷ lệ tổng thể Trong nghiên cứu, ta quan tâm đến tỷ lệ các đơn vị có một tính chất nào đó trong tổng thể, như tỷ lệ khách hàng sử dụng một loại sản phẩm nào đó, tỷ lệ phế phẩm trong sản xuất… Khi đó ta thực hiện ước lượng cho kiểm định của tổng thể. A. Ước lượng tỷ lệ Giả sử mẫu ngẫu nhiên có quan sát; ̂ là tỷ lệ các quan sát có tính chất nào đó. Với mẫu lớn ≥ 40, khoảng tin cậy ( 1− ) ∗100% của tỷ lệ các quan sát có tính chất trong tổng thể được xác định bởi: ̂ − / ̂(1− ̂) < < ̂ + / ̂(1− ̂) Với là phân phối chuẩn. Nhận xét: Khi càng lớn thì khoảng ước lượng càng hẹp, tức độ chính xác của ước lượng càng cao. Ví dụ: Một nghiên cứu được thực hiện nhằm ước lượng thị phần của sản phẩm nội địa (do các công ty trong nước sản xuất) đối với mặt hàng bánh kẹo. Kết quả điều tra ngẫu nhiên 100 khách hàng cho thấy có 34 người dùng sản phẩm nội địa. Như vậy với độ tin cậy 95%, tỷ lệ khách hàng sử dụng sản phẩm bánh kẹo nội địa được ước lượng là: ̂ − / ̂(1− ̂) < < ̂ + / ̂(1− ̂) Với ̂ = 0.34; = 100; / = . =1.96 ta có: 0.2472 < < 0.4328 7 Nghĩa là với độ tin cậy 95%, thị phần bánh kẹo nội địa được ước lượng từ 24.72% đến 43.28%. B. Ước lượng sự khác biệt giữa tỷ lệ hai tổng thể. Giả sử ta có hai mẫu , được chọn ngẫu nhiên độc lập từ hai tổng thể và ; , lần lượt là tỷ lệ các đơn vị có tính chất trong tổng thể; ̂ , ̂ lần lượt là tỷ lệ các đơn vị có tính chất trong mẫu. Với mẫu lớn , ≥ 40, khoảng tin cậy ( 1− ) ∗100%của − được xác định như sau: ̂ − ̂ − / ̂ (1− ̂ ) + ̂ (1− ̂ ) < − < ̂ − ̂ + / ̂ (1− ̂ ) + ̂ (1− ̂ ) Ví dụ: Kết quả điều tra từ mẫu ngẫu nhiên 1000 người ở mỗi thành phố cho thấy năm 2008. Tỷ lệ thất nghiệp ở thành phố H là 7.5%, ở thành phố K là 7.2%. Hãy ước lượng khoảng tin cậy 99% cho sự khác biệt về tỷ lệ thất nghiệp giữa hai thành phố. Ta có ̂ = 0.075; ̂ = 0.072; = = 1000; / = . = 2. 575thay vào công thức ̂ − ̂ − / ̂ (1− ̂ ) + ̂ (1− ̂ ) < − < ̂ − ̂ + / ̂ (1− ̂ ) + ̂ (1− ̂ ) → −0.027 < − < 0.033 Với độ tin cậy 99%, có thể nói rằng tỷ lệ thất nghiệp ở thành phố H ở trong khoảng thấp hơn 2.7% đến cao hơn 3.3% so với thành phố K. Với khoảng tin cậy này ta có thể tin rằng tỷ lệ thất nghiệp ở hai thành phố là bằng nhau (khoảng tin cậy chứa trị số 0 cho thấy dấu hiệu về sự bằng nhau giữa hai tỷ lệ tổng thể). Lưu ý: Đôi khi ta quan tâm đến việc ước lượng khoảng tin cậy chỉ một bên, chẳng hạn muốn ước lượng giới hạn trên mà với độ tin cậy 95% thì trung bình tổng thể không lớn hơn giới hạn đó; nghĩa là ta muốn ước lượng khoảng tin cậy bên phải, giới hạn dưới của khoảng tin cậy trong trường hợp này xem như −∞. Tương tự, có thể t among muốn ước lượng giới hạn dưới với độ tin cậy 99% thì trung bình tổng thể không thể nhỏ hơn giới hạn đó; nghĩa là, ta mong muốn ước lượng khoảng tin cậy bên trái và giới hạn trên của khoảng tin cậy xem như +∞. 8 Vì đây là ước lượng một bên nên thay những giá trị / , , / lần lượt bằng các giá trị , , . Ví dụ: Với độ tin cậy 95% một công ty muốn ước lượng giới hạn trên cho lượng sản phẩm sản xuất trung bình hàng ngày. Mẫu ngẫu nhiên 48 ngày cho thấy = 1260 sản phẩm, độ lệch chuẩn = 325 sản phẩm. Khoảng tin cậy bên phải của ước lượng sản phẩm sản xuất trung bình hàng ngày được ước lượng như sau: −∞ < < + ∗ √ → −∞ < < 1260+1.645∗ 325 √ 48 → −∞ < < 1337.17 Như vậy, với độ tin cậy 95% ta ước lượng mức sản xuất trung bình hàng ngày không vượt quá 1338 sản phẩm. 4. Xác định cỡ mẫu cho bài toán ước lượng a. Đối với trung bình tổng thể Giả sử ta có mẫu quan sát được chọn ngẫu nhiên tư tổng thể phân phối chuẩn có phương sai . Khoảng tin cậy ( 1− ) ∗100%của trung bình tổng thể được xác định bởi − / ∗ √ < < + / ∗ √ Gọi là sai số ước lượng được xác định bằng nửa chiều rộng của khoảng tin cậy nên = / ∗ √ → = / ∗ Ví dụ: Sử dụng các số liệu của ví dụ ước lượng trung bình tổng thể trong trường hợp đã biết phương sai ở trên. Ước lượng số lượng tài liệu chuyển bằng fax trong một ngày với độ tin cậy 99%, = 10trang. Kích thước mẫu phải là bao nhiêu để thỏa mãn điều kiện này? Ta có / = . = 2. 575; = 10; =32 thì = / ∗ = 67. 89 Như vậy cần phải thu thập số liệu ít nhất trong 68 ngày. b. Đối với tỷ lệ tổng thể Tương tự, ta xác định kích thước mẫu tối thiểu như sau: = / ∗ ̂ ∗(1− ̂) Do ̂ ∗(1− ̂) ≤ nên ta có thể sử dụng công thức 9 = / 4 Ví dụ: Sử dụng các số liệu của ví dụ ước lượng tỷ lệ của tổng thể. Ước lượng thị phần của sản phẩm bánh kẹo nội địa với độ tin cậy 99% với sai số ước lượng là 3%. Kích thước mẫu phải là bao nhiêu để thỏa mãn điều kiện này? Ta có / = . = 2. 575; = 0.03nên = / 4 = 1841.84 Như vậy cần phải điều tra 1842 người. 5.2. Bài toán kiểm định Bên cạnh việc ước lượng, các đặc trưng của tổng thể còn có thể được suy diễn từ dữ liệu mẫu thông qua phương pháp kiểm định giả thuyết. Kiểm định giả thuyết là dựa vào mẫu dữ liệu thu thập được để đưa ra các kết luận “bác bỏ” hay “chưa có cơ sở để bác bỏ” về các giả thuyết của tổng thể. Ví dụ: Những chi tiết về sản phẩm (trọng lượng, đường kính…) đã biết trước hoặc được quy định theo tiêu chuẩn kỹ thuật. Lấy mẫu sản phẩm để kết luận xem, những chi tiết hoặc tiêu chuẩn kỹ thuật này được thực hiện trong toàn bộ sản phẩm sản xuất hay không. Hay sau một thời gian thực hiện các biện pháp marketing (quảng cáo, khuyến mãi…) công ty muốn đánh giá xem thị phần, doanh số có gì thay đổi so với trước hay có đạt được mục tiêu đã đặt ra hay không. 1. Các vấn đề liên quan đến bài toán kiểm định a. Đặt giả thuyết Giả sử dấu hiệu nghiên cứu trong tổng thể có thể xem như biến ngẫu nhiên . Nếu chưa biết dạng phân phối xác suất của nó, song cơ sở để giả thuyết rằng phân phối theo một quy luật nào đó, người ta đưa ra giả thuyết: “biến ngẫu nhiên phân phối theo quy luật ”. Cũng có trường hợp dạng phân phối xác suất của đã biết song tham số đặc trưng của nó lại chưa biết, nếu có cơ sở để giả thuyết rằng giá trị của tham số bằng ( là hằng số đã biết), người ta đưa ra giả thuyết = . Khi nghiên cứu hai hay nhiều biến ngẫu nhiên độc lập thuộc các tổng thể khác nhau hay thuộc cùng một tổng thể, thường phải xét xem chúng độc lập hay phụ thuộc nhau, các tham số đặc trưng của chúng có bằng nhau hay không… Nếu chưa biết một cách chắc chắn song có cơ sở để nhận định về các vấn đề đó cũng có thể đưa ra các giả thuyết tương ứng. Từ đó có thể đưa ra định nghĩa sau: Định nghĩa: Giả thuyết thống kê là giả thuyết về dạng phân phối xác suất của biến ngẫu nhiên, về các tham số đặc trưng của biến ngẫu nhiên hoặc về tính độc lập của các biến ngẫu nhiên. 10 Giả thuyết thống kê đưa ra được ký hiệu là và được gọi là giả thuyết gốc. Khi đưa ra một giả thuyết thống kê, người ta còn nghiên cứu kèm theo nó mệnh đề mâu thuẫn với nó, gọi là giả thuyết đối và ký hiệu là . Để khi giả thuyết bị bác bỏ thì thừa nhận giả thuyết đối . Khi đó và tạo nên cặp giả thuyết thống kê. Chẳng hạn, ta nghiên cứu nhu cầu thị trường về một loại hàng hóa nào đó. Ta có thể đưa ra các cặp giả thuyết thống kê sau:  : Nhu cầu của thị trường phân phối theo quy luật chuẩn; : Nhu cầu của thị trường không phân phối theo quy luật chuẩn.  : Nhu cầu trung bình về loại hàng hóa này là = 1000đơn vị/ tháng; Lúc đó các giả thuyết đối tương ứng của nó có thể là: : > 1000; : < 1000; : ≠ 1000.  : Nhu cầu của thị trường và thu nhập của khách hàng độc lập với nhau; : Nhu cầu của thị trường và thu nhập của khách hàng phụ thuộc nhau… Trong thực tế, người ta còn phân biệt các giả thuyết chứa đựng một mệnh đề hoặc nhiều mệnh đề. Giả thuyết đơn là giả thuyết chỉ chứa đựng một mệnh đề. Chẳng hạn, nếu là tham số của quy luật chuẩn và ta đưa ra giả thuyết : = 5 thì đó là giả thuyết đơn. Giả thuyết kép là giả thuyết chứa đựng một số hữu hạn hoặc vô hạn các giả thuyết đơn. Chẳng hạn giả thuyết : > 5 bao gồm một số vô hạn các giả thuyết đơn dạng : = , trong đó là mọi số lớn hơn 5. Việc kiểm định giả thuyết kép thường khá phức tạp, do đó ở đây ta chỉ hạn chế ở việc nghiên cứu trường hợp giả thuyết gốc là giả thuyết đơn. Vì các giả thuyết thống kê có thể đúng hoặc sai nên cần kiểm định, tức là tìm ra kết luận về tính thừa nhận được hay không thừa nhận được của giả thuyết đó. Việc kiểm định này gọi là kiểm định thống kê, vì nó dựa vào thông tin thực nghiệm của mẫu để kết luận. Phương pháp chung để kiểm định một giả thuyết thống kê như sau: Trước hết giả sử đúng, từ đó dựa vào thông tin của mẫu rút ra từ tổng thể tìm được một biến cố nào đó, sao cho xác suất xảy ra biến cố bằng bé đến mức có thể, tức là có thể coi không xảy ra trong một phép thử về biến cố này. Lúc đó trên một mẫu cụ thể thực hiện một phép thử đối với biến cố , nếu xảy ra, điều đó chứng tỏ sai và bác bỏ nó; còn nếu không xảy ra thì ta chưa có cơ sở để bác bỏ . Khi một mẫu được chọn ra từ một tổng thể, các thông tin của mẫu có thể nói lên đặc điểm của tổng thể đó hoặc cũng có thể dùng để đánh giá sự phỏng đoán hoặc một giả thuyết đã được giả định. Ví dụ: - Một nhà sản xuất kẹo cho rằng trung bình mỗi hộp (0,5kg) có khoảng 82 viên kẹo. Ðể kiểm tra điều này, ngẫu nhiên những hộp kẹo được chọn ra để kiểm tra, đếm và tính toán. [...]... , Vậy giả thuyết H0 là tham số của tổng thể thì bằng với giá trị 0 cụ thể nào đó trong trường hợp giả thuyết có giá trị đơn, nghĩa làì H0: = 0 (kiểm định hai phía), hoặc giả thuyết là một dãy của giá trị, lúc đó H0: 0 hay H0: 0 (kiểm định một phía) Đối thuyết H1: Giả thuyết H1 là kết quả ngược lại của giả thuyết H0 Nếu giả thuyết H0 đúng thì giả thuyết H1 sai và ngược lại Vậy cặp giả thuyết H0 và H1... trường hợp kiểm định như sau: - Trong trường hợp kiểm định dạng hai phía (Two-tail test): : = : ≠ - Trong trường hợp kiểm định dạng một phía (One- tail test): : ≥ : ≤ hoặc : < : > b Mức ý nghĩa và các loại sai lầm Sai lầm loại I Là sai lầm của việc bác bỏ giả thuyết H0 khi giả thuyết này đúng ở mức ý nghĩa nào đó của kiểm định, nghĩa là nếu quyết định xác suất bác bỏ giả thuyết H0 khi giả thuyết này... chuẩn và kiểm định giả thuyết về được thực hiện như sau: Kiểm định hai phía Giá trị kiểm định : = : ≠ ứ ý = | | ( với )/ là giá trị cho trước Quy tắc quyết định: Bác bỏ ở mức ý nghĩa : ≥ : < Kiểm định một phía hoặc ứ ý ứ = | | ( )/ nếu > : ≤ : > ý / với là giá trị cho trước Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu > 4 Kiểm định giả thuyết về sự khác biệt hai trung bình tổng thể 4.1 Kiểm định. .. và mẫu ≥ , đã biết hoặc chưa biết phương sai : = : ≠ với là giá trị cho trước ứ ý Kiểm định giả thuyết về trung bình của tổng thể được thực hiện như sau: 2.1 Trường hợp mẫu lớn Kiểm định hai phía Giá trị kiểm định = | ̅ /√ | > (nếu trong trường hợp chưa biết Quy tắc quyết định: Bác bỏ ở mức ý nghĩa nếu / thì thay bởi ) Nhận xét: Ta nhận thấy sự liên hệ giữa ước lượng và kiểm định giả thuyết: Giả thuyết. . .- - - Một nhà sản xuất nước giải khát muốn kiểm tra giả định về tỉ lệ lượng tạp chất có trong thành phẩm nhiều nhất là 0,5% Ngẫu nhiên những chai và lon nước giải khát được chọn ra để kiểm tra một cách cẩn thận về tỉ lệ tạp chất này Một quản trị Marketing muốn kiểm tra giả định doanh thu của công ty tăng trung bình ít nhất 5% sau đợt quảng cáo Ông ta kiểm tra giả định bằng cách liệt... ( 1- ) Sai lầm loại II Ngược lại sai lầm loại I là sai lầm loại II là loại sai lầm của việc chấp nhận giả thuyết H0 khi giả thuyết này sai Nếu xác suất của việc quyết định chấp nhận một giả thuyết H 0 sai được ký hiệu là thì xác suất để bác bỏ giả thuyết này là ( 1- Những quyết định dựa trên giả thuyết H0 được tóm tắt như sau: Ví dụ: Lượng tạp chất có trong thành phẩm ta xét Sai lầm lọai I: - Giả thuyết. .. đến người tiêu dùng Sai lầm lọai II: - Giả thuyết H0: Lượng tạp chất nhiều nhất là 0,5% - Thực chất lượng tạp chất có trong nước giải khát ít nhất là 0,5%, có nghĩa là giả thuyết H0 sai Nhưng qua kiểm định ta lại chấp nhận giả thuyết này, vậy ta đã mắc phải sai lầm lọai II: chấp nhận một giả thuyết sai Ðiều này cho ta kết luận rằng tỉ lệ tạp chất có trong nước giải khát nhiều nhất là 0,5% − c Giá trị... cặp Giá trị kiểm định Giả sử ta có các cặp quan sát ( , ) lấy ngẫu nhiên từ hai tổng thể ( , ), ( , ), … , ( , ) Gọi ̅, , lần lượt là trung bình của và ; là trung bình và độ lệch tiêu chuẩn của Giả sử rằng phân phối của các khác biệt giữa : : − = − ≠ Kiểm định hai phía ứ ý giả thuyết = thì ta đặt = 0 Kiểm định giả thuyết về sự khác biệt giữa Giá trị kiểm định = | /√ | , và khác biệt ( và : − ) trong... phía; mức ý nghĩa trường hợp kiểm định một phía = trong 4.3 Giả định phương sai tổng thể bằng nhau Giả định hai tổng thể có mẫu nhỏ Gọi Kiểm định giả thuyết áp dụng thuận tiện trong trường hợp ( − 1) +( − 1) −2 là giá trị ước lượng cho phương sai chung của cả hai tổng thể Kiểm định hai phía Giá trị kiểm định = : : | = − − ứ ý | = ≠ + với là giá trị cho trước Quy tắc quyết định: Bác bỏ ở mức ý nghĩa... tổng thể và = | : : Kiểm định một phía Giá trị kiểm định = | với ), có là giá trị cho trong đó ( ), có , , là giá trị cho trước (khi muốn kiểm định | : : − − ứ ý Quy tắc quyết định: Bác bỏ trước ( với ), / và phương sai , mẫu được chọn ngẫu nhiên có cỡ mẫu có thể khác nhau về kích thước) − = − ≠ ứ ý thì ta đặt = 0 Kiểm định hai phía Giá trị kiểm định ≤ > ( , mẫu được chọn ngẫu nhiên có cỡ mẫu và phương . H 1 : Giả thuyết H 1 là kết quả ngược lại của giả thuyết H 0 . Nếu giả thuyết H 0 đúng thì giả thuyết H 1 sai và ngược lại. Vậy cặp giả thuyết H 0 và H 1 được thể hiện trong các trường hợp kiểm định. H 1 : Giả thuyết H 1 là kết quả ngược lại của giả thuyết H 0 . Nếu giả thuyết H 0 đúng thì giả thuyết H 1 sai và ngược lại. Vậy cặp giả thuyết H 0 và H 1 được thể hiện trong các trường hợp kiểm định. H 1 : Giả thuyết H 1 là kết quả ngược lại của giả thuyết H 0 . Nếu giả thuyết H 0 đúng thì giả thuyết H 1 sai và ngược lại. Vậy cặp giả thuyết H 0 và H 1 được thể hiện trong các trường hợp kiểm định

Ngày đăng: 13/08/2014, 08:21

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan