Bài giảng kiểm định thống kê phân tích dữ liệu với SPSS hồ thanh trí

46 1.4K 4
Bài giảng kiểm định thống kê phân tích dữ liệu với SPSS   hồ thanh trí

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

KIỂM ĐỊNH THỐNG KÊ PHÂN TÍCH DỮ LIỆU VỚI SPSS Hồ Thanh Trí THỐNG KÊ SUY DIỄN • Mục tiêu: Dùng tham số mẫu để ước lượng tham số đám đông • Phương pháp: Dùng phương pháp kiểm định thống kê để kiểm nghiệm giả thuyết tổng thể Giả thuyết nghiên cứu • H0: Giả thuyết không (null hypothesis) – mô tả tượng lúc bình thường, dạng cấu trúc mang dấu (=, ≥, ≤) • HR: Giả thuyết thay (alternative hypothesis) mô tả tình trạng ngược lại H0, dạng cấu trúc dấu (≠,>, Nếu loại bỏ H0  có chứng cho HR GIẢ THUYẾT NGHIÊN CỨU (Hypothesis) • Giả thuyết mối quan hệ hay tương quan hai hay nhiều biến H0: Hai (nhiều) biến khảo sát độc lập với (không có) H1: Tồn mối quan hệ tương quan (nhiều) biến • Giả thuyết giá trị trung bình H0: Giá trị trung bình nhiều mẫu ngang (không có khác biệt) H1: Tồn khác biệt giá trị trung bình (nhiều) biến • Giả thuyết phương sai H0: Phương sai (nhiều) mẫu ngang H1: Phương sai (nhiều) mẫu không ngang Giả thuyết nghiên cứu Nguyên tắc kiểm định SPSS: Dựa vào mức ý nghĩa kiểm định (xác xuất sai lầm loại 1) (Significance level), viết tắt Sig • Nếu Sig ≥  : từ chối giả thuyết HR (chấp nhận H0) • Nếu Sig <  : chấp nhận giả thuyết HR (từ chối H0) Chú ý:  = 0.05 (trong khoa học kinh tế) THỐNG KÊ SUY DIỄN • Kiểm định mối quan hệ hai biến định tính: kiểm định mối quan hệ hai biến chéo Sử dụng kiểm định Chi bình phương • Kiểm định khác hai giá trị trung bình Kiểm định Student’s t cho hai mẫu độc lập (Independent samples t test) Kiểm định Student’s t cho cặp mẫu (Paired samples ttest) Phân tích phương sai yếu tố (One-way ANOVA) THANG ĐO Phương pháp kiểm định Biến độc lập Biến phụ thuộc Định danh Định danh Chi bình phương Thứ bậc Thứ bậc Chi bình phương Giá trị số Định lượng One Sample T-Test Định tính (2 nhóm) Định lượng Independent Sample T-Test So sánh biến Định lượng cặp tương ứng Pair Sample T-Test Định tính (3 nhóm trở lên) Định lượng One – way ANOVA Định lượng Định lượng Hồi quy đơn (SLR) Tương quan Định lượng trở lên Định lượng Hồi quy bội (MLR) Tương quan Ghi Hồi quy đơn dummy Dữ liệu thứ cấp (phi tuyến) THANG ĐO Phương pháp kiểm định Biến độc lập Biến phụ thuộc Định lượng Định tính Định lượng Định tính (n biến) Định lượng ANOVA n chiều Định tính (n biến) Định lượng MLR + Dumy + hỗ tương Hồi quy bội (MLR) + Dummy Định lượng (1 hay nhiều biến) Định tính Định lượng MLR + Dumy + hỗ tương Định lượng (1 hay nhiều biến) Định tính (1 hay nhiều biến) Định lượng (1 hay nhiều biến) MVR + Dumy + hỗ tương Định lượng (1 hay nhiều biến) Định tính (1 hay nhiều biến) Định tính (2 lựa chọn) Binary Logictic Ghi ANCOVA Hoặc MLR + Dumy (MANCOVA) MANCOVA ANCOVA Hồi quy giá trị xác suất Các bước kiểm định giả thuyết nghiên cứu • Thiết lập giả thuyết cần kiểm định • Chọn mức ý nghĩa mong muốn • Chọn phép kiểm định thích hợp tính giá trị thống kê kiểm định (giá trị xác xuất p hay mức nghĩa Sig.) • So sánh giá trị p với mức nghĩa a = 0.05 để định • Diễn giải kết kiểm định giả thuyết nghiên cứu 1-KIỂM ĐỊNH MỐI QUAN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH • 5.PHÂN TÍCH LIÊN HỆ GIỮA BIẾN NGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN KẾT QUẢ ĐỊNH LƯỢNG: PHÂN TÍCH PHƯƠNG SAI • Mục tiêu phân tích phương sai ANOVA (Analysis of Variance) so sánh trung bình nhiều tổng thể dựa giá trị trung bình mẫu quan sát từ tổng thể này, thông qua kiểm định giả thuyết để kết luận trung bình tổng thể • Trong thực tiễn, dùng ANOVA công cụ để phân tích ảnh hưởng yếu tố nguyên nhân đến kết đó, gọi phân tích phương sai yếu tố (One-way ANOVA); việc xem xét ảnh hưởng hai yếu tố nguyên nhân đến yếu tố kết gọi phân tích phương sai yếu tố (Two-way ANOVA) • Phân tích phương sai mở rộng kiểm định independentSamples T-Test (biến định tính có lựa chọn trở lên) • Khi thực ANOVA, yếu tố nguyên nhân phải biến định tính, ký hiệu biến xi, yếu tố kết (biến phụ thuộc) thường biến định lượng, ký hiệu biến y 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Một số giả định phân tích phương sai yếu tố: Các nhóm so sánh phải độc lập chọn cách ngẫu nhiên Các nhóm so sánh phải có phân phối chuẩn cỡ mẫu phải đủ lớn để xem tiệm cận phân phối chuẩn Các nhóm có phương sai Từ biến phân loại X, chia tổng thể thành k nhóm độc lập, nhóm có n1 quan sát, nhóm có n2 quan sát, nhóm k có nk quan sát Chú ý, n = n1 + n2 + + nk • Giả thuyết H0 nhóm (tổng thể) có trung bình nhau: • H0: µ1 = µ2 =… = µi = µk; đó, µi trung bình nhóm thứ i Giả thuyết đối H1 : có hai trung bình khác 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Các bước tiến hành kiểm định: Bước 1: Tổng biến thiên nhóm SSG (between-group sums of squares) là: Bước 2: Tổng biến thiên nội nhóm SSW (withingroup sums of squares) là: Bước 3: Tổng biến thiên nhóm nhóm SST (total sum of squares): 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Loại biến Tổng biến Bậc tự Trung bình biến thiên thiên thiên Giữa SSG k–1 MSG = SSG/(k – nhóm Nội nhóm 1) SSW n–k MSW = SSW/(n – k) Tổng SST n–1 F MSG/MSW 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Quy tắc bác bỏ H0 giá trị thống kê F lớn giá trị tới hạn Fk-1, Khi sử dụng SPSS, quy tắc bác bỏ H0 giá trị p-value (sig.) nhỏ mức ý nghĩa kiểm định α Bây giờ, kiểm định ảnh hưởng nhóm dân tộc khác lên thu nhập Trong SPSS, ta thao tát sau: Analyze > Compares means > One – way ANOVA > đưa biến thunhap vào ô Dependent List đưa biến dantoc vào ô Factor > nhấn Options > nhấp chọn Descriptive Homogeneity of variance test (kiểm định phương sai đồng nhất, nghĩa nhóm có phương sai theo giả thuyết ANOVA) n-k,α 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) • Bảng Descriptives trình bày thống kê mô tả biến thunhap theo nhóm dân tộc • Bảng Test of Homogeneity of variances kiểm định phương sai nhóm Vì giá trị sig = 801 > 05 (α = 5%) nên chấp nhận giả thuyết H0: bốn phương sai • Bảng ANOVA cho thấy sig = 958 > 0.05 nên chấp nhận giả thuyết H0 : giá trị trung bình 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) • Một ví dụ khác, phân tích “yếu tố nguyên nhân” tham gia đoàn/hội (biến doanhoi) có ảnh hưởng đến tửu lượng (biến tuuluong) SV hay không? Để trả lời câu hỏi này, cần so sánh giá trị trung bình biến tuuluong theo hai nhóm: SV tham gia đoàn/hội SV không tham gia đoàn/hội kiểm định có hay khác biệt cách có ý nghĩa thống kê hai nhóm 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Test of Homogeneity of Variances 33-point drinking scale Levene Statistic df1 3.629 df2 Từ bảng Test of Homogeneity of Variance, ta thấy Sig = 058 > 0.05  chấp nhận H0: phương sai đồng  thỏa mãn giả thuyết phân tích ANOVA Sig 241 058 ANOVA So ly bia uong duoc Sum of Squares Mean Square df Between Groups 1838.084 Within Groups 9097.134 241 10935.218 242 Total F 1838.084 48.694 37.747 Sig .000 Từ bảng ANOVA, ta thấy Sig = 000 < 0.05  bác bỏ giả thuyết H0: trung bình hai tổng thể  nghĩa là, có khác biệt có ý nghĩa thống kê nhóm SV có tham gia đoàn/hội với nhóm SV không tham gia đoan/hội tửu lượng 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Bây giờ, phân tích “yếu tố nguyên nhân” sinh viên năm thứ nhất, thứ hai, thứ ba năm cuối (biến namhoc) có ảnh hưởng đến tửu lượng hay không? Như vậy, cần so sánh giá trị trung bình biến tuuluong theo nhóm SV kiểm định có hay khác biệt có ý nghĩa thống kê nhóm 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Descriptives So ly bia uong duoc 95% Confidence Interval for Mean N Std Std Mean Deviation Error Lower Bound Upper Bound Minimu Maxim m um Nam thu nhat 40 18.98 6.923 1.095 16.76 21.19 31 Nam thu hai 65 21.17 6.544 812 19.55 22.79 33 Nam thu ba 75 19.45 6.287 726 18.01 20.90 32 Nam thu tu 63 16.65 6.641 837 14.98 18.32 29 243 19.11 6.722 431 18.26 19.96 33 Total 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Test of Homogeneity of Variances So ly bia uong duoc Levene Statistic df1 df2 Sig .058 239 981 ANOVA So ly bia uong duoc Between Groups Within Groups Total Sum of Squares df Mean Square F Sig 666.201 222.067 5.168 002 10269.018 239 42.967 10935.218 242 Chúng ta bác bỏ giả thuyết H0: trung bình nhóm sig = 0.002 Nghĩa có khác biệt có ý nghĩa thống kê tửu lượng nhóm SV phân theo năm học Giá trị Sig = 0.981 > 0.05 (xem bảng Test of Homogeneity of Variances) nói phương sai tửu lượng nhóm SV không khác biệt cách có ý nghĩa thống kê Kết phân tích ANOVA sử dụng tốt Tuy nhiên, bảng chưa cho biết khác biệt cặp nhóm SV Chúng ta cần thực kiểm định hậu ANOVA, với phương pháp kiểm định bonferroni scheffe 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) CÁC LOẠI KIỂM ĐỊNH Multiple Comparisons Dependent Variable:So ly bia uong duoc Scheffe Bonferroni (I) Dang hoc nam thu Nam thu nhat Nam thu hai (J) Dang hoc nam thu Nam thu hai Nam thu ba Nam thu tu Nam thu nhat Nam thu ba Nam thu ba Nam thu tu Nam thu nhat Nam thu tu Nam thu hai Nam thu tu Nam thu nhat Nam thu hai Nam thu hai Nam thu ba Nam thu hai Nam thu ba Nam thu tu Nam thu nhat Nam thu ba Nam thu ba Nam thu tu Nam thu nhat Nam thu tu Nam thu hai Nam thu tu Nam thu nhat Nam thu nhat Nam thu hai Nam thu ba Mean Difference (I-J) Std Error -2.194 1.317 -.478 1.283 2.324 1.325 2.194 1.317 1.716 1.111 * 4.518 1.159 478 1.283 -1.716 1.111 2.803 1.120 -2.324 1.325 -4.518* 1.159 -2.803 1.120 -2.194 1.317 -.478 1.283 2.324 1.325 2.194 1.317 1.716 1.111 * 4.518 1.159 478 1.283 -1.716 1.111 2.803 1.120 -2.324 1.325 -4.518* 1.159 -2.803 1.120 95% Confidence Interval Sig .429 987 382 429 498 002 987 498 103 382 002 103 582 1.000 484 582 742 001 1.000 742 078 484 001 078 Lower Bound Upper Bound -5.90 1.51 -4.09 3.14 -1.41 6.06 -1.51 5.90 -1.41 4.84 1.26 7.78 -3.14 4.09 -4.84 1.41 -.35 5.96 -6.06 1.41 -7.78 -1.26 -5.96 35 -5.70 1.31 -3.89 2.94 -1.20 5.85 -1.31 5.70 -1.24 4.67 1.44 7.60 -2.94 3.89 -4.67 1.24 -.18 5.78 -5.85 1.20 -7.60 -1.44 -5.78 18 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Cả phương pháp bonferroni scheffe cho thấy khác biệt có ý nghĩa trị trung bình nhóm SV năm thứ hai SV năm thứ tư, nhóm khác không [...]... TỔNG THỂ (1 biến định lượng) Các bước kiểm định giả thuyết nghiên cứu: • Thiết lập giả thuyết cần kiểm định • Chọn mức ý nghĩa mong muốn • Chọn phép kiểm định thích hợp và tính giá trị thống kê kiểm định của nó (giá trị xác xuất p hay mức nghĩa Sig.) • So sánh giá trị p với mức ý nghĩa = 0.05 để ra quyết định • Diễn giải kết quả kiểm định giả thuyết nghiên cứu KIỂM ĐỊNH THAM SỐ TRUNG BÌNH (Analyze > Compare... Dữ liệu định lượng (liên tục) Dữ liệu của hai nhóm phải tuân theo quy luật phân phối chuẩn KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ (Analyze > Compare Means > Independent Sample T Test) KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Nếu Sig trong kiểm định phương sai < 0,05 thì phương sai của 2 mẫu không bằng nhau,ta dùng kết quả kiểm định t ở dòng thứ 2 KIỂM ĐỊNH... KIỂM ĐỊNH MỐI QUAN HỆ GIỮA HAI BIẾN ĐỊNH TÍNH Các đại lượng thống kê trong kiểm định χ2 • Cramer (V) : độ mạnh của mối liên hệ 0 ≤ V ≤ 1 • Hệ số liên hợp (C) : 0≤C≤1 • Lamda (λ) : 0≤λ≤1 • Gamma (γ): -1 ≤ γ ≤ 1 KIỂM ĐỊNH MỐI QUAN HỆ GIỮA 2 BIẾN ĐỊNH TÍNH (Analyze > Descriptive Statistics > Crosstabs) KIỂM ĐỊNH MỐI QUAN HỆ GIỮA 2 BIẾN ĐỊNH TÍNH 2-KIỂM ĐỊNH GIẢ THUYẾT VỀ TRUNG BÌNH TỔNG THỂ (1 biến định. .. dụ:euro0608) KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ 4-SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP(Analyze => Compare Means => Pair Sample T-Test) • Đây là loại kiểm định dùng cho 2 nhóm tổng thể có liên hệ với nhau Dữ liệu của mẫu thu thập ở dạng thang đo định lượng • Quá trình kiểm định sẽ bắt đầu với việc tính toán chênh lệch giá trị trên từng cặp quan sát bằng phép trừ Sau đó kiểm nghiệm... dùng ANOVA như là một công cụ để phân tích ảnh hưởng của một yếu tố nguyên nhân đến một kết quả nào đó, gọi là phân tích phương sai một yếu tố (One-way ANOVA); việc xem xét ảnh hưởng của hai yếu tố nguyên nhân đến một yếu tố kết quả nào đó gọi là phân tích phương sai 2 yếu tố (Two-way ANOVA) • Phân tích phương sai là sự mở rộng của kiểm định independentSamples T-Test (biến định tính có 3 sự lựa chọn trở... 6 6 10 6 8 20 8 8 SO SÁNH 2 BIẾN PHỐI HỢP TỪNG CẶP 5.PHÂN TÍCH LIÊN HỆ GIỮA BIẾN NGUYÊN NHÂN ĐỊNH TÍNH VÀ BIẾN KẾT QUẢ ĐỊNH LƯỢNG: PHÂN TÍCH PHƯƠNG SAI • Mục tiêu của phân tích phương sai ANOVA (Analysis of Variance) là so sánh trung bình của nhiều tổng thể dựa trên các giá trị trung bình của các mẫu quan sát từ các tổng thể này, và thông qua kiểm định giả thuyết để kết luận về sự bằng nhau giữa các... nhân phải là biến định tính, ký hiệu là biến xi, yếu tố kết quả (biến phụ thuộc) thường là biến định lượng, ký hiệu là biến y 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Một số giả định đối với phân tích phương sai một yếu tố: Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem như tiệm cận phân phối chuẩn... SSW n–k MSW = SSW/(n – k) Tổng SST n–1 F MSG/MSW 5.PHÂN TÍCH PHƯƠNG SAI MỘT YẾU TỐ(ONE WAY- ANOVA) Quy tắc bác bỏ H0 là nếu giá trị thống kê F lớn hơn giá trị tới hạn Fk-1, Khi sử dụng SPSS, quy tắc bác bỏ H0 là giá trị p-value (sig.) nhỏ hơn mức ý nghĩa kiểm định α Bây giờ, chúng ta kiểm định ảnh hưởng của 4 nhóm dân tộc khác nhau lên thu nhập Trong SPSS, ta thao tát như sau: Analyze > Compares means... Test) KIỂM ĐỊNH THAM SỐ TRUNG BÌNH (Analyze > Compare Means > One - Sample T Test) 3-KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Trong nhiều trường hợp cần so sánh trị trung bình về một chỉ tiêu nghiên cứu nào đó giữa hai đối tượng bạn quan tâm Bạn có 2 biến tham gia trong một phép kiểm định trung bình: 1 biến định lượng và 1 biến định tính dùng để chia nhóm ra để tính, bạn sử dụng kiểm. .. variances not assumed) Nếu p-value (sig.) > α  Chấp nhận Ho  Lựa chọn kiểm nghiệm t so sánh trung bình mẫu với điều kiện phương sai ngang bằng (Equal variances assumed) KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ • KIỂM ĐỊNH GIẢ THUYẾT VỀ SỰ KHÁC BIỆT CỦA 2 TRUNG BÌNH TỔNG THỂ Ước lượng tham số trung bình: • Dữ liệu: định lượng (liên tục) • Độ tin cậy (1-mức ý nghĩa) So sánh trung

Ngày đăng: 20/05/2016, 22:10

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan