EXCEL TRONG THỐNG KÊ

45 33 0
  • Loading ...
1/45 trang

Thông tin tài liệu

Ngày đăng: 14/04/2018, 15:10

MS – EXCEL TRONG THỐNG Nhóm • • • • • • • • • • Vũ Cao Ân Quan Ứng Biêu Lê Anh Dũng Lê Thị Mỹ Hiền Bùi Phương Lan Thái Chí Luân Nguyễn Phan Duy Nguyên Đặng Hải Thành Phan Thương Ngô Hồng Phong 60700108 60700152 60700417 60700785 60701224 60701404 60701633 60702198 60702428 60601761 Bài Một nghiên cứu tiến hành thành phố công nghiệp X để xác định tỉ lệ người làm xe máy, xe đạp xe buýt.Việc điều tra tiến hành hai nhóm Kết sau: Với mức ý nghĩa α=5%, nhận định xem có khác cấu sử dụng phương tiện giao thơng làm nhóm công nhân nam nữ hay không? CƠ SỞ LÝ THUYẾT • Giả sử ta có k tập hợp H1, H2,…Hk Gọi πi = (pi1, pi2, …, pir ) phân bố A = (A1, A2, …, Ar ) tập hợp Hi với A gồm r tính trạng • Ta muốn kiểm định giả thuyết sau H0: π1 = π2 = … = πk ( phân bố tập hợp Hi ) CƠ SỞ LÝ THUYẾT Chú ý H0 tương đương với hệ đẳng thức sau: p11 = p21 = …= pk1 p12 = p22 = …= pk2 p1i = p2i = …= pki p1r = p2r = …= pkr • Từ tập hợp chính, ta chọn mẫu ngẫu nhiên Mẫu ngẫu nhiên từ tập gọi mẫu ngẫu nhiên thứ i (i = 1, 2, …, k) Mẫu Tính trạng … J … K Tổng số A1 n11 n12 … n1j … n1k n10 A2 n21 n22 … n2j … n2k n20 … … … … … … … … Ai ni1 ni2 … nij … nik ni0 … … … … … … … Ar nri nr2 … nrj … nrk nr0 Tổng số n01 n02 … n0j … n0k n k n i0 = ∑ n ij j=1 r n 0j = ∑ n ij i =1 CƠ SỞ LÝ THUYẾT TSLT : n = n p = * ij * 0j i n 0j n i0 n TSQS : n ij k r T = ∑∑ j=1 i =1 (n ij − n *ij ) n * ij (TSQS − TSLT) =∑ TSLT Nếu H0 TSLT không nhỏ T có phân bố xấp xỉ phân bố χ2 với (k-1)(r-1) bậc tự Miền bác bỏ có dạng T > c , c tìm từ điều kiện P{T > c} = α Vậy c phân vị mức α phân bố χ2 với (k-1)(r-1) bậc tự CƠ SỞ LÝ THUYẾT Trong MS-EXCEL có hàm CHITEST: r c χ2 = ∑∑ i =1 j=1 (Oij − E ij ) E ij Oij : tần số thực nghiệm ô thuôc hàng i cột j Eij : tần số lý thuyết ô thuộc hàng i với cột j, r: số hàng c: số cột Xác suất P(X > χ2 ) với bậc tự DF = (r - 1)(c – 1) • P(X > χ2 ) ≥ α ⇒ chấp nhận giả thiết Ho • P(X > χ2 ) < α ⇒ loại bỏ giả thiết Ho THUẬT TOÁN Nữ Nam Tổng Xe máy 25 75 100 Xe buýt 100 120 220 Xe đạp 125 205 330 LÍ THUYẾT Nữ 38,46154 84,61538 126,9231 Nam 61,53846 135,3846 203,0769 Giá trị “P” 0,002189 Tổng 250 400 650 CƠ SỞ LÝ THUYẾT • X,Y hai ĐLNN Nếu Y có quan hệ tuyến tính theo X, ta nói Y có hồi quy tuyến tính theo X y = β + βx • Đây phương trình hồi quy tuyến tính Y theo X ∀ β0 , β: Hệ số hồi quy lý thuyết (trong X biến độc lập, Y biến phụ thuộc) CƠ SỞ LÝ THUYẾT Một mẫu kích thước n đồng thời X, Y có dạng bảng số liệu sau đây, gọi bảng tương quan mẫu Y y1 y2 … yh ni x1 n 11 n 12 … n 1h n1 x2 n 21 n 22 … n 2h n2 … … … … … … xk n k1 n k2 … n kh nk mj m1 m2 … mh ∑=n X Yx i = ( Y/X = x i ) = ni h ∑n j=1 ij y i trung bình mẫu Y X = xi ∀i = 1, k CƠ SỞ LÝ THUYẾT Phương trình hồi quy tuyến tính • Bài tốn đặt ước lượng hệ số hồi quy lý thuyết β0 , β mẫu quan sát (x1, y1) ,…, (xn, yn) • Dựa vào phương pháp bình phương cực tiểu, ta tìm giá trị ước lượng tương ứng B0 B • Đuờng hồi quy tuyến tính mẫu Y theo X có phương trình y = B0 + Bx gần với đường hồi quy mẫu Y theo X nhất, cho (B, B0) điểm cực tiểu hàm: k Q( B, B0 ) = ∑ ni [Yxi − ( Bxi + B0 )] i =1 • Ý nghĩa: Dự báo giá trị Y biết X = x0 CƠ SỞ LÝ THUYẾT Biểu diễn điểm (xi ,Y xi )lên mặt phẳng tọa độ nối điểm (xi ,Y xi ) (xi +1 ,Y xi+1 ) đoạn thẳng (i = 1, k − 1) , ta đường gấp khúc, gọi đường hồi quy mẫu Y theo X Phương trình hồi quy mẫu Y theo X y = B0 + Bx Trong đó: xy − x y B = 2 sX B0 = y − a x CƠ SỞ LÝ THUYẾT BẢNG ANOVA Nguồn sai Bậc số tự Hồi quy Sai số Tổng cộng N-2 N-1 Tổng số bình phương SSR = ∑ (Yi − Y ) ' SSE = ∑ (Yi − Yi ) ' SST = ∑ (Y − Y) i = SSR + SSE Bình phương trung bình Giá trị thống MSR=SSR MSR F= MSE MSE = SSE N−2 CƠ SỞ LÝ THUYẾT Trắc nghiệm t • Giả thuyết: H0: βI = “Hệ số hồi quy khơng có ý nghĩa” H : βi ≠ “Hệ số hồi quy có ý nghĩa” • Giá trị thống kê: t= Bi − β i S n = B S2n S S2n = (X − X ) ∑ i • Phân bố Student γ = N - • Biện luận: Nếu t < t α (N-2) => Chấp nhận giả thuyết H0 CƠ SỞ LÝ THUYẾT Trắc nghiệm F • Giả thuyết: H0: βI = H : βi ≠ “Phương trình hồi quy khơng thích hợp” “Phương trình hồi quy thích hợp” • Giá trị thống kê: MSR F= MSE • Phân bố Fischer ν1 = 1, ν2 = N - • Biện luận: Nếu F < F α (1, N-2) => Chấp nhận giả thuyết H0 CƠ SỞ LÝ THUYẾT Ngoài việc ước lượng hệ số hồi quy, ta quan tâm đến ước lượng σ2 , σ2 số đo phân tán Y xung quanh đường thẳng hồi quy Ước lượng σ2 đuợc cho theo công thức sau: s 2Y.X n = (y − Bx − B ) ∑ i i n − i =1 Dạng khác công thức là: s 2Y.X = y ∑ − B∑ xy − B0 ∑ y n−2 sY.X gọi sai số tiêu chuẩn đường thẳng hồi quy Nó biểu thị cho số đo độ phân tán đám mây điểm (xi, yi) xung quanh đường thẳng hồi quy THUẬT TOÁN - Nhập bảng số liệu hình vẽ - Chọn Tools/ Data Analysis/ Regression Sai số tiêu chuẩn Bo B • t0 = 3,35 > t0,05 = 2,365 ⇒ Bác bỏ giả thiết Ho • t1 = 3,55 > t0,05 = 2,365 ⇒ Bác bỏ giả thiết Ho • F = 12,637 > F0,05 = 5,590 (hay Fs = 0,0062 < α = 0,05) ⇒ Bác bỏ giả thiết Ho Vậy hai hệ số -1,74 (B0) 1,55 (B) phương trình hồi quy Y = -1,74 + 1,55X có ý nghĩa thống Nói cách khác, phương trình hồi quy thích hợp ⇒ Có hồi quy tuyến tính Y theo X Thuật tốn tính sai số tiêu chuẩn n = 11 ∑ y = 0,88 ∑ y = 1,8856 ∑ xy = 1,7193 B = 1,548 B0 = −1,739 2 y − B ∑ xy − B0 ∑ y 1,8856 − 1,548 *1,7193 + 1,739 * 0,88 ∑ sY X = = = 0,0838 n−2 11 − ⇒ sY X = 0,0838 = 0,2895 ≈ 0,29 KẾT LUẬN  Đường hồi quy: y = 1,55x – 1,74  Sai số tiêu chuẩn đường hồi quy: 0,29  F = 12,64  X Y có mối quan hệ tuyến tính với ... điều kiện P{T > c} = α Vậy c phân vị mức α phân bố χ2 với (k-1)(r-1) bậc tự CƠ SỞ LÝ THUYẾT Trong MS -EXCEL có hàm CHITEST: r c χ2 = ∑∑ i =1 j=1 (Oij − E ij ) E ij Oij : tần số thực nghiệm ô thuôc... n-k SSE = SST - SSF k Tổng cộng k n-1 n SST = ∑∑ Yn2 − i =1 j=1 Bình phương trung bình Giá trị thống kê SSF MSF = k −1 MSF F= MSE SSE MSE = n−k T2 n CƠ SỞ LÝ THUYẾT MSF Nếu giả thiết H0 tỷ số F... X y = β + βx • Đây phương trình hồi quy tuyến tính Y theo X ∀ β0 , β: Hệ số hồi quy lý thuyết (trong X biến độc lập, Y biến phụ thuộc)
- Xem thêm -

Xem thêm: EXCEL TRONG THỐNG KÊ, EXCEL TRONG THỐNG KÊ

Gợi ý tài liệu liên quan cho bạn

Nhận lời giải ngay chưa đến 10 phút Đăng bài tập ngay