Bài tập lớn xác suất thống kê

39 718 0
Bài tập lớn xác suất thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài tập lớn xác suất thống kê

Trường đại học Bách Khoa TPHCM KHOA KHOA HỌC ỨNG DỤNG -oOo - BÀI TẬP LỚN XÁC XUẤT THỐNG KÊ Nhóm 10 GVHD: PGS-TS NGUYỄN ĐÌNH HUY NHÓM : 10 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Câu 1: Trình bày lại ví dụ 3.4 trang 161 ví dụ 4.2 trang 171 Giáo Trình XSTK 2009 Ví dụ 3.4 Hiệu suất phần trăm (%) phản ứng hóa học nghiên cứu theo ba yếu tố: pH (A), nhiệt độ (B) chất xúc tác (C) trình bày bảng sau: Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 C2 14 C3 16 C4 12 A2 C2 12 C3 15 C4 12 C1 10 A3 C3 13 C4 14 C1 11 C2 14 A4 C4 10 C1 11 C2 13 C3 13 Hãy đánh giá ảnh hưởng yếu tố hiệu suất phản ứng Bài làm: Dạng toán: PHÂN TÍCH PHƯƠNG SAI BA YẾU TỐ Cơ sở lý thuyết: Sự phân tích dùng để đánh giá ảnh hưởng ba yếu tố giá trị quan sát G (i = 1, r: yếu tố A; j = 1, r: yếu tố B: k = 1, r: yếu tố C) Mô hình: Khi nghiên cứu ảnh hưởng hai yếu tố, yếu tố có n mức, người ta dùng mô hình vuông la tinh n×n Ví dụ mô hình vuông la tinh 4×4: B C D A C D A B D A B C A B C D 2 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Mô hình vuông la tinh ba yếu tố trình bày sau: Yếu tố C (T k Ví dụ: T = Y111 + Y421 + Y331 + Y241) Yếu tố B Yếu tố A B1 B2 B3 B4 A1 C1 Y111 C2 Y122 C3 Y133 C4 Y144 T1 A2 C2 Y212 C3 Y223 C4 Y234 C1 Y241 T2 A3 C3 Y313 C4 Y324 C1 Y331 C2 Y342 T3 A4 C4 Y414 C1 Y421 C2 Y432 C3 Y443 T4 T.i T.1 T.2 T.3 T.4 Bảng ANOVA: Nguồn sai số Yếu tố A (Hàng) Yếu tố B (Cột) Bậc tự Bình phương trung bình Giá trị thống kê SSR MSR= (r − 1) MSR FR= MSE T − r r SSC MSC= (r − 1) MSC FC= MSE T 2k T − ∑ r r k = SSF = SSF MSF= (r − 1) MSF F= MSE SSE = SST – SSE MSE= (r − 1)( r − 2) Tổng số bình phương Ti T ∑ − SSR = i =1 r r r (r-1) r (r-1) SSC = ∑ T 2j j =1 r Yếu tố C (r-1) Sai số (r-1)(r-2) Tổng cộng (SSF + SSR + SSC) (r -1) SST = ∑∑∑ Yij2k − i j r T r2 3 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Trắc nghiệm ∗ Giả thiết: H0: μ1 = μ2 = = μk ⇔ “Các giá trị trung bình nhau” H1: μi ≠ μj ⇔ “Có hai giá trị trung bình khác nhau” ∗ Giá trị thống kê: G G ∗ Biện luận: Nếu G (chấp nhận H0 (đối với yếu tố A)) Nếu G (chấp nhận H0 (đối với yếu tố B)) Nếu G (chấp nhận H0 (đối với yếu tố C)) Phần mềm: Microsoft Excel 2010 Chương trình: Phương pháp giải toán Excel 2010: Giả thiết H0: pH ảnh hưởng đến hiệu suất phản ứng Giả thiết H0: Nhiệt độ ảnh hưởng đến hiệu suất phản ứng Giả thiết H0: Chất xúc tác ảnh hưởng đến hiệu suất phản ứng  Bước 1: Nhập liệu vào bảng tính:  Bước 2: Thiết lập biểu thức tính giá trị thống kê: ∗ Tính giá trị Ti…,Tj T k ,T… - Các giá trị Ti - - Chọn ô B7 nhập biểu thức =SUM(B2:E2) Chọn ô C7 nhập biểu thức =SUM(B3:E3) Chọn ô D7 nhập biểu thức =SUM(B4:E4) Chọn ô E7 nhập biểu thức =SUM(B5:E5) Các giá trị T.j Chọn ô B8 nhập =SUM(B2:B5) Dùng trỏ kéo kí hiệu tự điền từ ô B8 tới ô E8 Các giá trị T k Chọn ô B9 nhập biểu thức =SUM(B2,C5,D4,E3) Chọn ô C9 nhập biểu thức =SUM(B3,C2,D5,E4) 4 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 ∗ ∗ ∗ ∗ Chọn ô D9 nhập biểu thức =SUM(B4,C3,D2,E5) Chọn ô E9 nhập biểu thức =SUM(B5,C4,D3,E2) Giá trị T Chọn ô B10 nhập biểu thức =SUM(B2:E5) Tính giá trị G G -Các giá trị G G Chọn ô B10 nhập biểu thức =SUMSQ(B7:E7) Dùng trỏ kéo kí hiệu tự điền từ ô G7 tới G9 -giá trị G Chọn ô G10 nhập biểu thức =POWER(B10,2) -giá trị G Chọn ô G11 nhập biểu thức =SUMSQ(B2:E5) Tính giá trị SSR SSC SSF SST SSE -Các giá trị SSR SSC SSF Chọn ô I7 nhập biểu thức =G7/4-39601/POWER(4,2) Dùng trỏ kéo kí hiệu tự điền từ ô I7 tới I9 -Giá trị SST Chọn ô I11 nhập biểu thức =G11-G10/POWER(4,2) -Giá trị SSE Chọn ô I10 nhập biểu thức =I11-SUM(J7:I9) Tính giá trị MSR MSC MSF MSE -Các giá trị MSR MSC MSF Chọn ô K7 nhập biểu thức =K7/(4-1) Dùng trỏ kéo kí hiệu tự điền từ ô K7 tới ô K9 -Giá trị MSE Chọn ô K10 nhập biểu thức =I10/((4-1)*(4-2)) Tính giá trị G F Chọn ô M7 nhập biểu thức =K7/0.3958 Dùng trỏ kéo kí hiệu tự điền từ ô M7 tới ô M9  Bước 3: Kết biện luận FR = 3.10 < F0.05(3,6) = 4.76 ⇒ chấp nhận Ho (pH) 5 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 FC = 11.95 > F0.05(3,6) = 4.76 ⇒ bác bỏ Ho (nhiệt độ) F = 30.05 > F0.05 (3,6)=4.76 ⇒ bác bỏ Ho (chất xúc tác) Vậy có nhiệt chất xúc tác gây ảnh hưởng đến hiệu suất Ví dụ 4.2 Người ta dùng ba mức nhiệt độ gồm 105, 120 135 0C kết hợp với ba khoảng thời gian 15, 30, 60 phút để thực phản ứng tổng hợp Các hiệu suất phản ứng (%) trình bày bảng sau đây: 6 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Thời gian (phút) X1 Nhiệt độ (0C) X2 Hiệu suất (%) Y 15 105 1.87 30 105 2.02 60 105 3.28 15 120 3.05 30 120 4.07 60 120 5.54 15 135 5.03 30 135 6.45 60 135 7.26 Hãy cho biết yếu tố nhiệt độ thời gian/ yếu tố thời gian có liên quan tuyến tính với hiệu suất phản ứng tổng hợp? Nếu có điều kiện nhiệt độ 115 0C vòng 50 phút hiệu suất phản ứng bao nhiêu? Bài làm: Dạng toán: HỒI QUY TUYẾN TÍNH ĐA THAM SỐ Cơ sở lý thuyết: Trong phương trình hồi quy tuyến tính đa tham số, biến số phụ thuộc Y có liên quan đến k biến số độc lập Xi (I = 1,2, ,k) thay có hồi quy tuyến tính đơn giản Phương trình tổng quát: Ŷx0,x1, ,xk = B0 + B1X1 +B2X2 + + BkXk 7 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Bảng ANOVA: Nguồn sai số Bậc tự Tổng số bình phương Bình phương trung bình Giá trị thống kê Hồi quy K SSR SSR MSR= k MSR F= MSE MSE = SSE ( N − k − 1) Sai số N-k-1 SSE Tổng cộng N-1 SST = SSR + SSE Giá trị thống kê: Giá trị R-bình phương: Giá trị R2 hiệu chỉnh (Adjusted R Square) R2 = SSR kF = SST ( N − k − 1) + kF ( R ≥ 0,81 tốt) Giá trị R2 hiệu chỉnh (Adjusted R Square) Rii2 = ( N − 1) R − k k (1 − R ) = R2 − N − k −1 ( N − k − 1) ( Rii trở nên âm hay không xác định R2 hay N nhỏ) Độ lệch chuẩn: S= SSE ( N − k − 1) ( S ≤ 0,30 tốt) Trắc nghiệm thống kê: - Trong trắc nghiệm t: H0: βi = “Các hệ số hồi quy ý nghĩa” H1: βi ≠ “Có vài hệ số hồi quy có ý nghĩa” Bậc tự giá trị t: γ = N – k – t= - Bi − β i S n2 ; Sn2 = Trong trắc nghiệm F: 8 S2 ∑ ( X i − X )2 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 H0: βi = “Phương trình hồi quy không thích hợp” H1: βi ≠ “Phương trình hồi quy thích hợp với vài hệ số Bi” Bậc tự giá trị F: v1 = 1, v2 = N – k – Phần mềm: Micsrosoft Excel 2010 Chương trình: Regression Phương pháp giải toán Excel 2010  Bước 1:Nhập liệu vào bảng tính: Dữ kiệu thiết phải nhập theo cột:  Bước : Nếu menu Tools chưa có mục Data Analysis , tiến hành cài Analysis ToolPak sau : Chọn File/Option/Add-Ins/Data Analysis Tool Pak /Go…/ Analysis Tool Pak /OK… hình : 9 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012  a) b) c) - Bước 3: Sử dụng “Regression” Nhấp đơn lệnh Tools lệnh Data Analysis Chọn chương trình Regression hộp thoại Data Analysis nhấn nút OK Trong hộp Regression, ấn định chi tiết: Phạm vi biến số Y (Input Y Range) Phạm vi biến số X (Input X Range) Nhãn liệu (Labels) Mức tin cậy (Confidence Level) Tọa độ đầu (Output Range) Và số tùy chọn khác đường hồi quy (Line Fit Plots), biểu thức sai số (residuals plots ) 10 10 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 +) Tổng bình phương nhân tố ký hiệu SSF (viết tắt chữ Sum of Squares for Factor) tính theo công thức sau: SSF = = k ∑ n i ( xi − x ) i =1 T12 n1 + T22 T2 T +L+ k − n2 nk n +) Tổng bình phương sai số ký hiệu SSE (viết tắt chữ Sumof Squares for the Error) tính theo công thức: SSE = = n1 i =1 n1 ∑ i =1 = n2 nk 2 ∑ ( x i1 − x ) + ∑ ( x i2 − x2 ) + L + ∑ ( x ik − x k ) x2i1 − T12 n1 +  i =1 n2 ∑ i =1 x2i2 − T12 i =1 T22 n2 Tk2 +L+ nk ∑ i =1 x2ik − Tk2 nk  ∑∑ x2ij −  n1 + L + nk ÷÷   Từ công thức ta thấy SST = SSF + SSE + Trung bình bình phương nhân tố, ký hiệu MSF (viết tắt chữ Mean Square for Factor) tính công thức: MSF = SSF k −1 + k – gọi bậc tự nhân tố Trung bình bình phương sai số, ký hiệu MSE (viết tắt chữ Mean Square for Error) tính công thức: MSE = SSE n−k n – k gọi bậc tự sai số + Tỷ số F tính công thức F= MSF MSE Các kết nói trình bày bảng sau gọi ANOVA (viết tắt chữ Analysis of Variance: phân tích phương sai) Bảng ANOVA Nguồn Tổng bình phương Bậc tự 25 25 Trung bình bình phương Tỷ số F BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Nhân tố SSF k–1 MSF Sai số SSE n–k MSE SST n–1 Tổng số MSF/MSE Người ta chứng minh giả thiết H o tỷ số F F= MSF MSE có phân bố Fisher với bậc tự (k – 1, n – k) Thành thử giả thiết Ho bị bác bỏ mức ý nghĩa α phân bố Fisher với bậc tự (k – 1, n – k) Trong bảng IV, k – gọi bậc tự mẫu số Phần mềm: Micsrosoft Excel 2010 Chương trình: ANOVA: Single Factor, CHITEST Phương pháp giải toán Excel 2010 Giả thiết H0: Phân bố thu nhập hai nhóm tuổi  Bước 1: Nhập bảng liệu :  Bước 2: Áp dụng “ANOVA: Single Factor” a) Nhấp đơn lện Tools lệnh Data Analysis b) Chọn chương trình ANOVA: Single Factor hộp thoại Data Analysis c) - nhấp nút OK Trong hộp thoại ANOVA: Single Factor, ấn định: Phạm vi đầu vào (Input Range) Cách xếp theo hàng hay theo cột (Group By) Nhãn liệu (Labels in First Row/ Column) 26 26 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012  Kết biện luận: F = 0.28559 < F0.02 =7.638422 ⇒ Chấp nhận giả thiết H0 Vậy phân bố thu nhập hai nhóm tuổi số công nhân lành nghề giống Câu 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ phân loại theo thu nhập hàng năm tuổi họ Kết thu sau: Tuổi Thu nhập 27 27 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Dưới 40 Từ 40 đến 54 Trên 54 Dưới 100 000 $ 18 11 Từ 100 000 $ - 399 599 $ 19 12 Trên 400 000 $ 17 Với mức ý nghĩa 1%, kiểm định giả thiết cho tuổi mức thu nhập quan hệ với Bài làm: Dạng toán: KIỂM ĐỊNH TÍNH ĐỘC LẬP Cơ sở lý thuyết: Giả sử ta quan tâm tới dấu hiệu cá thể tập hợp C Dấu hiệu nói chung thay đổi từ cá thể sang cá thể khác Nếu dấu hiệu biểu thị số, hay nói cách khác gán số đo cho dấu hiệu lên cá thể, ta nói dấu hiệu biến lượng dấu hiệu định lượng Chẳng hạn cad thể người biến lượng chiều cao, lượng, tuổi nhiên thực tế có dấu hiệu đo đạc để biểu diễn số Chẳng hạn màu tóc, màu mắt người, cảm giác hạnh phúc, yêu thích phim Đó dấu hiệu không đo đạc Ta gọi dấu hiệu định tính Trong mục ta xét toán kiểm tra tính độc lập hai dấu hiệu Trước hết, xét toán kiểm định tính độc lập dấu hiệu định tính A B Ta chia dấu hiệu A làm r mức độ A1, A2, , Ar, chia đặc tính B làm k mức độ B1, B2, , Bk Xét mẫu ngẫu nhiên gồm n cá thể Mỗi cá thể mang dấu hiệu A mức Ai mang dấu hiệu B mức B j Giả sử nij số cá thể có dấu hiệu Ai Bj Các số liệu nij ghi bảng sau gọi bảng liên hợp dấu hiệu (Contingency Table) A B A1 A2 … Ar Tổng B1 B2 Bk Tổng n11 n21 … nr1 n01 n12 n22 … nr2 n02 … … … … n1k n2k … nrk n0k n10 n20 … nr0 n Trong ký hiệu pij xác suất để cá thể chọn ngẫu nhiên mang dấu hiệu A i Bj ; pjo poj tương ứng xác suất để cá thể mang dấu hiệu Ai Bj Nếu giả thiết Ho “Hai dấu hiệu A B độc lập” có hệ thức sau: pij = pio.poj 28 28 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Các xác suất pio poj ước lượng n ˆ p io ≈ io , n n oj ˆ poj ≈ n 29 29 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Do Ho n io noj ˆ ˆ ˆ p ij ≈ p io p oj = n2 , số cá thể có đồng thời dấu hiệu Ai Bj xấp xỉ nion oj ˆ nij = npij = n ˆ n Các số ij gọi tần số lý thuyết (TSLT), số n ij gọi tần số quan sát (TSQS) Khoảng cách TSLT TSQS đo đại lượng sau: ˆ (n ij − n ij )2 T= ˆ n ij j =1 i = k r ∑∑ Người ta chứng minh n lớn TSLT không nhỏ T có phân bố xấp xỉ phân bố χ2 với bậc tự (k–1).(r–1) Thành thử H o bị bác bỏ mức ý nghĩa α T > c, c phân vị mức α phân bố χ2 với (k–1).(r–1) bậc tự Chú ý Ta có thức sau thuận lợi tính toán thực hành:  T = n  ∑ n2ij  − 1 n io noj  Trong trường hợp k = r = (bảng liên hợp có hai dòng, hai cột) n T= n11 n12 n21 n22 n01n02n10n20 n11 n12 n21 n22 = n11n22 − n21 n22  n11 n12   ÷ n ÷ n định thức ma trận  21 22  Phần mềm: Micsrosoft Excel 2010 Chương trình: CHITEST, CHIINV Phương pháp giải toán Excel 2010 Giả thiết H0: tuổi mức thu nhập có quan hệ với 30 30 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012  Bước 1: Nhập liệu vào bảng  Bước 2: Tính tổng cột , tổng hàng Chọn ô B6 nhập biểu thức =SUM(B3:B5) Dùng trỏ kéo kí hiệu tự điền từ ô B6 đến ô D6 Chọn ô E3 nhập biểu thức =SUM(B2:D2) Dùng trỏ kéo kí hiệu tự điền từ ô E3 đến ô E6  Bước 3: Tính liệu kỳ vọng γ ij theo công thức: γ ij = Tổng hàng * Tổng cột i /n Chọn ô B12 nhập biểu thức = =B$6*$E3/$E$6 Dùng trỏ kéo kí hiệu tự điền từ ô B12 đến ô D14 31 31 j BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012  Bước 4: Tính xác suất P(X > χ2 ) : ta dùng hàm CHITEST Chọn ô B16 nhập biểu thức =CHITEST(B3:D5,B12:D14) ta kết P(X > χ2 ) = 0.14375984 2(0.05) χ 2(0.05) (3−1)(3−1) = χ  Bước 5: Tính ta dùng hàm CHIINV Chọn ô B17 nhập biểu thức =CHIINV(0.01,4) ta kết 2(0.01) χ 2(0.01) (3−1)(3−1) = χ = 13.27670414  Bước 6: Tính χ ta dụng hàm CHIINV Chọn ô B18 nhập công thức: =CHIINV(B16,4) Ta kết χ = 6.854861111 Kết luận: χ 02 < χ 0.02 ⇒Bác bỏ giả thiết H0 Vậy tuổi mức thu nhập quan hệ với Câu 5: Với mức ý nghĩa α = 5%, Hãy phân tích tình hình kinh doanh số ngành nghề quận nội thành sở số liệu doanh thu số mặt hàng sau: Ngành nghề kinh doanh Điện lạnh VLXD Dịch vụ tin học Khu vực kinh doanh Q1 Q2 Q3 Q4 2.5:2.7:2.0:3.0 0.6:10.4 1.2:1.0:9.8:1.8 3.1:3.5:2.7 15.0 2.0:2.2:1.8 2.0:2.4 9.5:9.3:9.1 1.2:1.3:1.2 5.0:5.4 19.5:17.5 5.0:4.8:5.2 Bài làm: Dạng toán: PHÂN TÍCH PHƯƠNG SAI HAI NHÂN TỐ (CÓ LẶP) Cơ sở lý thuyết: Giả sử quan tâm tới nhân tố A B Nhân tố A xem xét mức A 1, A2, Ar, nhân tố B xem xét nước B1, B2, Bc Gọi Xjk ĐLNN đo lường hiệu việc tác động mức Aj Bk lên cá thể 32 32 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Giả sử x1jk, x2jk, , xnjk mẫu kích thước njk rút từ tập hợp giá trị X jk Ta gọi mẫu (j, k) Ta đưa số ký hiệu sau: x jk : trung bình mẫu (j, k) n jo = nok = n= c ∑ n jk k =1 r ∑ n jk j=1 ∑ n jo = ∑ nok j x jo = xok = k ∑ n jk x jk ∑∑ xijk k = n jo i k n jo trung bình mức Aj ∑ n jk x jk ∑∑ xijk j = nok i j n ok x = trung bình chung = = = trung bình mức Bk ∑∑∑ x jk n x ok Ta có bảng sau ghi kết tính toán trên: A B A1 A2 Aj Ar Trung bình cột Bk B1 B2 Bk Bc Trung bình dòng Aj x11 x12 x1k x10 x22 x2c x20 xj1 xj2 xjc xj0 x r1 x r2 x1c x21 xrc x ro x o1 x o2 x oc x x2k xjk x rk + Tổng bình phương chung, ký hiệu SST, tính theo công thức sau: SST = c r n jk ∑∑∑ ( x ijk − x ) k =1 j=1 i =1 + Tổng bình phương cho nhân tố A, ký hiệu SSF A tính theo công thức 33 33 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 sau: SSFB = c ∑ nok ( xok − x ) k =1 + Tổng bình phương sai số, ký hiệu SSE, tính theo công thức SSF = c r n jk ∑∑∑ ( xijk − x−jk2 ) k =1 j=1 i =1 + Tổng bình phương tương tác (Sum of Squares for Interaction) ký hiệu SSI, tính theo công thức SSI = C r ∑∑ ( x jk − x jo − xko + x ) k =1 j=1 + Trung bình bình phương nhân tố A, ký hiệu MSFA’ tính công thức: MSFA = SSFA r −1 r – gọi bậc tự A số mức A trừ + Trung bình bình phương nhân tố B, ký hiệu MSF B’ tính công thức MSFB = SSFB c −1 c – gọi bậc tự B số mức B trừ + Trung bình bình phương sai số, ký hiệu MSE, tính MSE = SSE n − cr n – cr gọi bậc tự sai số + Trung bình bình phương tương tác, ký hiệu MSI, tính MSI = SSI (c − 1)( r − 1) (c – 1) (r – 1) gọi bậc tự tương tác Chú ý rằng: (r – 1) + (c – 1) + (c – 1) (r – 1) + n – rc = n – = bậc tự tổng cộng + Tỷ số F cho nhân tố A, ký hiệu FA tính sau FA = MSFA MSE Tương tự tỷ số F cho nhân tố B, FB tính 34 34 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 FB = MSFB MSE tỷ số F cho tương tác A B, ký hiệu FAB tính bởi: FAB = MSI MSE Với mức ý nghĩa α cho ta ký hiệu f (u, v) phân vị mức α phân bố Fisher với bậc tự (u, v) Ta có quy tắc định sau: + Nếu FA > f (r – 1, n – cr) ta bác bỏ giả thiết HoA : “Các mức A , Ar có hiệu trung bình nhau” + Nếu FB > f (c – 1, n – cr) ta bác bỏ giả thiết: HB o : “Các mức B1, B2, Bc có hiệu trung bình nhau” Nếu FAB > f ((r – 1)(c – 1), n – rc) Ta bác bỏ giả thiết: HoAB : “Có tương tác A B” Trên thực hành tính toán thực sau: Giả sử Tjk tổng giá trị mẫu (j, k) Ký hiệu c r  Tjk , Tok = Tjk  Tjo =  k =1 j=1  c r  n = n , n = n jk jo jk ok  k =1 j=1  T =  n = A= ∑ ∑ ∑ ∑ ∑ Tjo = ∑ Tok = ∑∑∑ xijk ∑ n jo = ∑ nok ∑∑∑ x2ijk (3) Ta có đẳng thức sau: SST = A − SSFA = r T2 n Tjo ∑ n jo j=1 (4) − T2 n (5) 35 35 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 SSFB = c T2 ∑ nokok − T2 n c Tjk k =1 SSE = A − r (6) ∑∑ n jk k =1 j=1 (7) SSI = SST − SSFA − SSFB − SSE (8) Đặc biệt tất mẫu njk = m với j, k thì: n jo = cm, nok = rm r SSFA = ∑ Tjo2 j=1 cm − T2 n − T2 n (5’) r SSFB = ∑ Tok2 k =1 rm (6’) SSE = A − ∑∑ Tjk2 k j m Phần mềm: Microsoft Excel 2010 Chương trình: Anova: Two-Factor With Replication Phương pháp giải toán Excel 2010: Giả thiết H0: Doanh thu theo ngành nghề kinh doanh là khác Giả thiết H0:Doanh thu khu vực kinh doanh khác Giả thiết H0:Không có tương tác khu vực kinh doanh ngành nghề kinh doanh  Bước 1: Nhập liệu vào bảng: 36 36 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012  Bước 2: Áp dụng “Anova: Two-Factor With Replication” a) Nhấp đơn lệnh Tools lệnh Data Analysis b) Chọn chương trình Anova: Two-Factor With Replication hộp thoại Data Analysis nhấp nút OK c) Trong hộp thoại ANOVA: Two-Factor With Replication ấn định chi tiết: - Phạm vi đầu vào (Input Range) - Nhãn liệu (Labels in First Row/Column) - Ngưỡng tin cậy (Alpha) - Phạm vi đầu (Output Range) 37 37 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Kết quả biện luận: Yếu tố hàng (mẫu): F = 2.8929 < F–crit = 5.2479 → chấp nhận giả thiết H0 ⇒ Doanh thu của các cửa hàng không phụ thuộc vào ngành nghề Yếu tốc cột: F = 0.8189 < F–crit = 4.3771 → chấp nhận giả thiết H0 ⇒Doanh thu của các cửa hàng không phụ thuộc vào khu vực kinh doanh 38 38 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Ảnh hưởng: F = 0.6498 < F–crit = 3.3507 → chấp nhận giả thiết H0 ⇒ Không có sự tương tác (ảnh hưởng) giữa khu vực kinh doanh và ngành nghề kinh doanh 39 39 [...]... đó ký hiệu pij là xác suất để một cá thể chọn ngẫu nhiên mang dấu hiệu A i và Bj ; pjo và poj tương ứng là xác suất để cá thể mang dấu hiệu Ai và Bj Nếu giả thiết Ho “Hai dấu hiệu A và B độc lập” chúng ta có hệ thức sau: pij = pio.poj 28 28 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Các xác suất pio và poj được ước lượng bởi n ˆ p io ≈ io , n n oj ˆ poj ≈ n 29 29 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Do đó Ho... -11,14 + 0,13X2 đều có ý nghĩa thống kê Nói một cách khác, phương trình hồi quy này thích hợp 14 14 2 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Kết Luận: Yếu tố nhiệt độ có liên quan tuyến tính với hiệu suất của phản ứng tổng hợp µ Phương trình hồi quy Y X , X = f ( X 1 , X 2 ) 1 2 Yµ X1 , X 2 = -12,70 + 0,04X + 0.13X (R2 = 0,97; S = 0,33) 1 2 15 15 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 −5 t0 = 11,528 > t0,05... X = 2,73 + 0.04X1 đều không có ý nghĩa thống kê Nói một cách khác, phương trình hồi quy này không thích hợp 12 12 i BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Kết Luận: Yếu tố thời gian không liên quan tuyến tính tới hiệu suất của phản ứng tổng hợp µ Phương trình hồi quy: Y X = f ( X 2 ) 2 Yµ X 2 = 2,73 + 0.04X 2 (R2 = 0,76; S = 0,99) 13 13 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 2 t0 = 3,418 > t0,05 = 2,365 (... (residuals plots ) 21 21 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Ta được bảng kết quả sau: Kết luận: µ a) Đường hồi quy của Y đối với X: Y X = −1.739476701 + 1.547892012 X b) Sai số tiêu chuẩn 0.289645139 c) Tỷ số F = 12.6367483 Tra bảng phân phối Fisher với bậc tự do (3,4) ở mức 5% bằng cách nhập hàm c = FINV(0.05,1,7) ta được giá trị c = 5.591447851 22 22 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Vì F > c nên ta... Column) 26 26 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012  Kết quả và biện luận: F = 0.28559 < F0.02 =7.638422 ⇒ Chấp nhận giả thiết H0 Vậy phân bố thu nhập giữa hai nhóm tuổi này trong số các công nhân lành nghề là giống nhau Câu 4: Một nhóm gồm 105 nhà doanh nghiệp Mỹ được phân loại căn cứ theo thu nhập hàng năm và tuổi của họ Kết quả thu được như sau: Tuổi Thu nhập 27 27 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Dưới...BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Phương trình hồi quy Yµ X1 = f ( X 1 ) Yµ X1 = 2,73 + 0,04X 1 (R2 = 0,21; S = 1.81) 11 11 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 2 t0 = 2,19 < t0,05 = 2,365 ( hay PV = 0,071 > α = 0,05) ⇒ Chấp nhận giả thiết H0 t1 = 1,38 < t0,05 = 2,365 ( hay PV... phương trung bình Giá trị thống kê MSR = SSR MSR F = MSE MSE = SSE/(N - 2) BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 GIÁ TRỊ THỐNG KÊ: Gía trị R-bình phương (R-square): R= SSR SST (100R2: % của biến đổi trên Y đượcgiải thích bởi X) Độ lệch chuẩn (Standard Error) S= 1 n ∑ (Yi − Y 'i )2 N − 2 i =1 (Sự phân tán của dữ liện càng ít thì giá trị của S càng gần zero) Trắc nghiệm thống kê: µ Đối với một phương trình... “Hệ số hồi quy không thích hợp” H0: βi ≠ 0 “Hệ số hồi quy thích hợp” 19 19 = B S n2 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 - Giá trị thống kê: F= MSR MSE Phân bố Fischer v1 = 1, v2 = N – 2 - Biện luận: Nếu F < Fα (N - 2) ⇒ chấp nhận giả thiết H0 3 Phần mềm: Micsrosoft Excel 2010 4 Chương trình: Regression 5 Phương pháp giải bài toán trên Excel 2010 Gỉa thiết H0 : Hệ số góc α của đường thẳng hồi quy của Y... < F0,05 = 5,140 (hay FS = 1,112 10 ⇒ bác bỏ giả thiết H0 16 16 −5 < α = 0,05) BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Vậy cả 2 hệ số -12.70 (B 0); 0,04 (B1) và 0,13(B2) của phương trình hồi quy Yµ X1 , X 2 = -12,70 + 0,04X + 0,13X đều có ý nghĩa thống kê Nói một cách khác, 1 2 phương trình hồi quy này thích hợp Kết luận: Hiệu suất của phản ứng tổng hợp có liên quan tuyến tính với cả hai yếu tố là thời gian... dữ liệu kỳ vọng γ ij theo công thức: γ ij = Tổng hàng * Tổng cột i /n Chọn ô B12 và nhập biểu thức = =B$6*$E3/$E$6 Dùng con trỏ kéo kí hiệu tự điền từ ô B12 đến ô D14 31 31 j BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012  Bước 4: Tính xác suất P(X > χ2 ) : ta dùng hàm CHITEST Chọn ô B16 và nhập biểu thức =CHITEST(B3:D5,B12:D14) ta được kết quả là P(X > χ2 ) = 0.14375984 2(0.05) χ 2(0.05) (3−1)(3−1) = χ 4  Bước ... thức sau: pij = pio.poj 28 28 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Các xác suất pio poj ước lượng n ˆ p io ≈ io , n n oj ˆ poj ≈ n 29 29 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Do Ho n io noj ˆ ˆ ˆ p... (residuals plots ) 10 10 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 Phương trình hồi quy Yµ X1 = f ( X ) Yµ X1 = 2,73 + 0,04X (R2 = 0,21; S = 1.81) 11 11 BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 t0 = 2,19 < t0,05... i =1 i 18 18 i Bình phương trung bình Giá trị thống kê MSR = SSR MSR F = MSE MSE = SSE/(N - 2) BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ 2012 GIÁ TRỊ THỐNG KÊ: Gía trị R-bình phương (R-square): R= SSR SST

Ngày đăng: 12/03/2016, 14:25

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan