Phân tích dữ liệu bằng SPSS

74 1.2K 16
Phân tích dữ liệu bằng SPSS

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Phân tích liệu SPSS CHƯƠNG 1: KHÁI QUÁT VỀ QUI TRÌNH NGHIÊN CỨU – XỮ LÝ THÔNG TIN VÀ MỘT SỐ LÝ THUYẾT THỐNG KÊ CƠ BẢN SỬ DỤNG TRONG PHÂN TÍCH THÔNG TIN Qui trình nghiên cứu Thông thường qui trình nghiên cứu bao gồm bước: - Bước 1: Xác đònh vấn đề cần nghiên cứu - Bước 2: Xác đònh loại thông tin cần thu thập nguồn cung cấp thông tin - Bước 3: Chọn mẫu nghiên cứu - Bước 4: Thiết kế nghiên cứu xác đònh phương pháp thu thập thông tin - Bước 5: Thiết kế bảng câu hỏi - Bước 6: Thu thập liệu - Bước 7: Xử lý, phân tích diễn giải liệu xữ lý - Bước 8: Trình bày báo cáo kết Xữ lý thông tin nghiên cứu thực đòa Có hai dạng thông tin nghiên cứu cần thu thập, loại thứ thông tin thứ cấp và loại thứ hai thông tin sơ cấp - Thông tin thứ cấp thông tin hữu nguồn tài liệu đăng tải, thông tin tổ chức thành bảng biểu, đồ thò Loại thông tin người nghiên cứu việc sử dụng diễn giải theo nhu cầu nghiên cứu mà không cần phải trãi qua trình xữ lý phức tạp đòi hỏi hỗ trợ phần mềm phân tích xữ lý thông tin chuyên dụng - Thông tin sơ cấp thông tin chưa hữu, muốn có thông tin đòi hỏi nhà nghiên cứu phải thực qui trình nghiên cứu với nhiều bước trình bày Trong nghiên cứu thu thập thông tin sơ cấp tồn hai dạng nghiên cứu yếu nghiên cứu đònh tính nghiên cứu đònh lượng Thông tin nghiên cứu đònh tính ý nghóa mặt thống kê, trình phân tích xữ lý dừng chổ tập hợp, phân nhóm ý kiến quan điểm khác biệt không đòi hỏi nhiều hỗ trợ công cụ kiến thức thống kê Ngược lại với thông tin nghiên cứu đònh lượng lại đòi hỏi nhiều kỷ kiến thức phân tích thống kê để tổ chức phân tích Phần mềm SPSS công cụ hữu hiệu cho việc xữ lý phân tích thông tin nghiên cứu đònh lượng Biên soạn: Đào Hoài Nam Phân tích liệu SPSS Trong nghiên cứu đònh lượng, liệu ban đầu thu thập từ trường liệu thô, chưa thể tiến hành phân tích diễn giải liệu dạng thô mà đòi hỏi phải tiến hành bước xữ lý phân tích cần thiết từ mã hóa, kiểm tra, hiệu đính, nhập liệu đến tạo bảng biểu cho liệu thực phân tích thống kê tương thích Nhiệm vụ tổng quát việc xữ lý – phân tích liệu chuyển mẫu liệu quan sát thô mà ta tiến hành mã hóa kiểm tra thành số thống kê có ý nghóa cho việc diễn giải kết nghiên cứu Toàn công việc xữ lý – phân tích phức tạp đòi hỏi cần phải có máy tính phần mềm chuyên dụng hỗ trợ Qui trình xữ lý số liệu Trong qui trình nghiên cứu đònh lượng Việc xữ lý liệu ta nhận bảng câu hỏi vấn Qui trình xữ lý số liệu bao gồm bước sau: - Bước 1: Kiểm tra, hiệu chỉnh trả lời bảng câu hỏi - Bước 2: Mã hóa câu trả lời bảng câu hỏi - Bước 3: Nhập liệu mã hóa vào máy tính - Bước 4: Xác đònh lỗi sở liệu làm liệu - Bước 5: Tạo bảng cho liệu tiến hành phân tích thống kê Hai giai đoạn bước chuẩn bò cho việc phân tích máy tính sau Giai đoạn nhập liệu mã hóa vào máy tính Quá trình nhập liệu dẫn đến sai xót bước phải thực trước tiến hành phân tích liệu phải làm liệu nhập vào máy Một số lý thuyết thống kê 4.1 Các tham số thống kê đo lường độ tập trung hay hội tụ liệu (central tendency measurement) - Giá trò trung bình (Mean): Là giá trò trung bình số học biến, tính tổng giá trò quan sát chia cho số quan sát Đây dạng công cụ thường dùng cho dạng đo khoảng cách tỷ lệ Giá trò trung bình có đặc điểm chòu tác động giá trò quan sát, thang đo nhạy cảm thay đổi giá trò quan sát Giá trò trung bình tính công thức sau: Biên soạn: Đào Hoài Nam Phân tích liệu SPSS n X = ∑x i =1 i n - Trung vò (Median): Là số nằm (nếu lượng quan sát số lẽ) giá trò trung bình hai quan sát nằm (nếu số lượng quan sát số chẳn) dãy quan sát xắp xếp theo thứ tự từ nhỏ đến lớn Đây dạng công cụ thống kê thường dùng để đo lường mức độ tập trung dạng liệu thang đo thứ tự, có đặc điểm không bò ảnh hưởng giá trò đầu mút dãy phân phối, thích hợp để phân tích liệu có chênh lệch lớn giá trò hay đầu mút dãy phân phối - Mode: Là giá trò có tần suất xuất lớn tập hợp số đo, dạng thường dùng dạng liệu thang biểu danh Giống trung vò, mode không bò ảnh hưởng giá trò đầu mút dãy phân phối 4.2 Các tham số thống kê đo lường mức độ phân tán liệu (Dispersion), Khảo sát hai nhóm số sau:: Nhóm 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 Nhóm 2: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, Ta thấy số kích thướt mẫu hai nhóm nhau, giá trò đo lường mức độ tập trung liệu mean, media, mode Tuy nhiên hai liệu hoàn toàn khác Nhóm liệu biến đổi nhiều nhóm 2, điều có nghóa giá trò nhóm phân tán hơn, giá trò quan sát nằm xa giá trò trung bình mẫu nhóm Đo lường độ phân tán cho biết khác biệt hai nhóm liệu Có số công cụ đo lường độ phân tán liệu như: - Phương sai (Variance): Dùng để đo lường mức độ phân tán tập giá trò quan sát xung quanh giá trò trung bình tập quan sát Phương sai trung bình bình phương sai lệch giá trò quan sát giá trò trung bình quan sát Người ta dùng phương sai để đo lường tính đại diện giá trò trung bình tương ứng, tham số trung bình có phương sai tương ứng lớn giá trò thông tin hay tính đại diện giá trò trung bình nhỏ Phương sai mẫu tính công thức sau: Biên soạn: Đào Hoài Nam Phân tích liệu SPSS n S2 = ∑ (x i =1 i − x)2 n −1 - Độ lệch chuẩn (Standard deviation): Một công cụ khác dùng để đo lường độ phân tán liệu xung quanh giá trò trung bình Độ lệch chuẩn bật hai phương sai Vì phương sai trung bình bình phương sai lệch giá trò quan sát từ giá trò trung bình, việc khảo sát phương sai thường cho giá trò lớn, sử dụng phương sai gặp khó khăn việc diễn giải kết Sử dụng độ lệch chuẩn giúp dễ dàng cho việc diễn giải kết sai biệt đưa sát với liệu gốc - Khoảng biến thiên (Range): Là khoảng cách giá trò quan sát nhỏ đến giá trò quan sát lớn - Sai số trung bình mẫu (Standard Error of Mean) Được dùng để đo lường khác biệt giá trò trung bình mẫu nghiên cứu so với mẫu nghiên cứu khác điều kiện có phân phối Nó dùng để so sánh giá trò trung bình quan sát với giá trò ban đầu (giả thuyết) Và ta kết luận hai giá trò khác tỷ số khác biệt standard error of mean nằm khoảng (-2,+2) Công thức tính sai số trung bình mẫu: Sx = 4.3 S n Khoảng ước lượng (Confident interval) Là ước lượng xác đònh khoảng giá trò đặc trưng tổng thể rơi vào Dựa vào liệu mẫu, với độ tin cậy cho trước ta xác đònh giá trò đại diện cho đám đông nằm khoảng ước lượng Ví dụ gọi x mức thu nhập trung bình đám đông cần ước lượng Với độ tin cậy khoảng sát nghiên cứu 95% (nghóa ước lượng có lượng sai số chấp nhận 5%) Dựa vào mẫu quan sát ta xác đònh hai giá trò thu nhập a b cho xác suất để thu nhập trung bình đám đông x rơi vào khoảng a b (a, b) 95% Lúc ta diễn giải Biên soạn: Đào Hoài Nam Phân tích liệu SPSS với độ xác 95% (hay chấp nhận 5% sai số) ta biết thu nhập trung bình đám đông nghiên cứu nằm khoảng (a, b) Công thức tính khoảng ước lượng: E = X ± tα , n −1 Hoặc: SX n E= p ± tα,n-1 Sp Với p tỷ lệ % tần suất xuất giá trò quan sát 4.4 Kiểm nghiệm giả thuyết (Hypothesis testing) Bên cạnh việc ước lượng đặc trưng tổng thể, liệu mẫu thu thập được dùng để đánh giá xem giả thuyết tổng thể hay sai Ta gọi kiểm nghiệm giả thuyết Nói cách khác kiểm nghiệm giả thuyết dựa vào thông tin mẫu để đưa kết luận bác bỏ hay chấp nhận giả thuyết tổng thể Ví dụ: Sau thời gian thực chương trình, biện pháp marketing (quảng cáo, khuyến mãi,…) công ty muốn đánh giá xem thò phần, doanh số có thay đổi so với trước không, hay có đạt mục tiêu đề không Hoặc công ty muốn tìm hiểu xem sở thích người tiêu dùng kiểu dáng, màu sắc, mùi vò khác sản phẩm cuả công ty Họ thích đặc biệt kiểu dáng đó, màu sắc đó, hay kiểu dáng, màu sắc khác ưa thích Phương pháp kiểm nghiệm giả thuyết giúp giải yêu cầu Để kiểm nghiệm giả thuyết ta phải xây dựng giả thuyết Giả thuyết hình thành gọi giả thuyết H0 xem ta có đủ để kết luận khác Nếu giả thuyết H0 không phải có giả thuyết khác H0 gọi H1 Một số giả thuyết thường gặp phân tích: _oOo _ Biên soạn: Đào Hoài Nam Phân tích liệu SPSS CHƯƠNG 2: GIỚI THIỆU VỀ PHẦN MỂM SPSS Là phần mềm chuyên dụng xữ lý thông tin sơ cấp (thông tin thu thập trực tiếp từ đối tượng nghiên cứu (người trả lời bảng câu hỏi) thông qua bảng câu hỏi thiết kế sẳn Thông tin xữ lý thông tin đònh lượng (có ý nghóa mặt thống kê) Phần mềm SPSS có tất dạng hình: Màn hình quản lý liệu (data view): Là nơi lưu trữ liệu nghiên cứu với cấu trúc sở liệu bao gồm cột, hàng ô giao cột hàng - Cột (Column): Đại diện cho biến quan sát Mỗi cột chứa đựng tất câu trả lời câu hỏi thiết kế bảng câu hỏi - Hàng (Row): Đại diện cho trường hợp quan sát (người trả lời), Ta vấn người (tùy thuộc vào kích thước mẫu) ta có nhiêu hàng Mỗi hàng chứa đựng tất câu trả lời (thông tin) đối tượng nghiên cứu - Ô giao cột hàng (cell): Chứa đựng kết trả lời tương ứng với câu hỏi cần khảo sát (biến) đối tượng trả lời cụ thể (trường hợp quan sát) Màn hình quản lý biến (variables view): Là nơi quản lý biến với thông số liên quan đến biến Trong hình hàng hình quản lý biến, cột thể thông số liên quan đến biến - Tên biến (name): Là tên đại diện cho biến, tên biến hiễn thò đầu cột hình liệu - Loại biến (type): Thể dạng liệu thể biến Dạng số, dạng chuỗi - Số lượng số hiễn thò cho giá trò (Width): Giá trò dạng số phép hiễn thò số - Số lượng số sau dấu phẩy hiễn thò (Decimals) - Nhãn biến (label): Tên biến thể tóm tắc ký hiệu, nhãn biến cho phép nêu rõ ý nghóa biến - Giá trò biến (Values): Cho phép khai báo giá trò biến với ý nghóa cụ thể (nhãn giá trò) Biên soạn: Đào Hoài Nam Phân tích liệu SPSS - Giá trò khuyết (Missing): Do thiết kế bảng câu hỏi có số giá trò mang tính chất quản lý, ý nghóa phân tích, để loại bỏ biến ta cần khai báo giá trò khuyết (user missing) SPSS mặc đònh giá trò khuyến (system missing) dấu chấm tự động loại bỏ giá trò khỏi phân tích thống kê - Kích thướt cột (columns): Cho phép khai báo độ rộng cột - Ví trí (align): Vò trí hiễn thò giá trò cột (phải, trái, giữa) - Dạng thang đo (measures): Hiễn thò dạng thang đo giá trò biến Màn hình hiễn thò kết (output): Các phép phân tích thống kê cho kết bảng biểu, đồi thò kết kiểm nghiệm, kết truy xuất hình, lưu giữ tập tin khác (có đuôi SPO) Màn hình cho phép ta xem lưu giữ kết phân tích Màn hình cú pháp (syntax): Màn hình cho phép ta xem lưu trữ cú pháp lệnh phân tích Các cú pháp lưu trữ sử dụng lại mà không cần thao tác lệnh phân tích lại Khái quát phân tích liệu 5.1 Kiểm tra liệu (Data Screening) Một thực tế luôn gặp phải người làm công tác phân tích xử lý số liệu không lúc mà không gặp vấn đề liệu tay họ, số xuất lỗi nhập máy, lỗi mã hóa, lỗi chọn mẫu chất lượng vấn, tất lỗi thường dẫn đến khác thường tính đại diện liệu thu thập Trong nghiên cứu qui mô lớn, công việc kiểm tra liệu tốn nhiều công sức thời gian việc phân tích tóm tắc liệu Do gần nhiệm vụ người phân tích liệu phải tiến hành kiểm tra liệu nhằm xác đònh lỗi liệu đồng thời kiểm tra xem tính tương thích liệu so với giả thuyết yêu cầu cho phân tích thống kê sau  Xác đònh giá trò vượt trội (Outliers) giá trò lỗi (Roque values) Có nhiều cách để xác đònh giá trò vợt trội giá trò lỗi Tuy nhiên điều quan trọng xác đònh xem giá trò vượt trội có phải giá trò lỗi hay không hay bất thường mẫu nghiên cứu: Biên soạn: Đào Hoài Nam Phân tích liệu SPSS - Sử dụng công cụ bảng phân bổ tần xuất việc để đếm số lần xuất giá trò riêng biệt, giúp ta tìm giá trò lỗi giá trò mã hóa sai sót không mong đợi (ví dụ biến giới tính có hai giá trò mã hóa tương ứng với giới tính nam nữ khảo sát ta phát giá trò khác với giá trò mã hóa 2) Ngoài công cụ cho phép ta nhận giá trò khuyết (Missing values) lại xuất giá trò hợp lệ (Valid value) - Đôi việc xác đònh giá trò vượt trội xác đònh cách tốt ta khảo sát hai hay nhiều biến lúc Đối với biến dạng biểu danh (nominal) thứ tự (ordinal) sử dụng công cụ bảng chéo ta xác đònh kết hợp phi lý hai nhiều biến, ví dụ người chưa tiêu dùng sản phẩm A lại tham gia đưa ý kiến mức độ thỏa mãn tiêu dùng sản phẩm A 5.2 Thống kê mô tả (Descriptive Statistics) Đây xem phần cốt lõi thường gặp việc phân tích xử lý số liệu Tuy nhiên trước bắt tay vào việc mô tả liệu (đo lường độ tập trung hay phân tán, tỷ lệ %, mối quan hệ biến …), cần thiết phải nắm loại biến khảo sát (loại thang đo biến) hay nói cách khác ta phải nắm ý nghóa giá trò biến Đối với biến đònh danh thứ tự (nominal ordinal) phép tính toán số học giá trò trung bình ý nghóa thống kê, đặc biệt biến đònh danh so sánh giá trò biến vô nghóa Ngược lại biến đònh lượng thang đo khoảng cách thang đo tỷ lệ (Interval Ratio) so sánh hay tính toán số học đề có ý nghóa phân tích thống kê 5.3 Kiểm nghiệm so sánh trung bình mẫu (Tests for Comparing Means) Trong phân tích thống kê người ta thường sử dụng phép kiểm nghiệm kiểm nghiệm giả thuyết giá trò trung bình biến đònh lượng, thống kê cung cấp cho ta công cụ kiểm nghiệm t (T-Test) hay kiểm nghiệm Z (Z-test)  Kiểm nghiệm t cho mẫu, cặp mẫu hai mẫu ngẫu nhiên độc lập Ta có ba dạng kiểm nghiệm t cho việc so sánh giá trò trung bình mẫu Việc sử dụng dạng tùy thuộc vào vấn đề ta tiến hành so sánh Biên soạn: Đào Hoài Nam Phân tích liệu SPSS - Sử dụng kiểm nghiệm t cho hai mẫu ngẫu nhiên độc lập (Independent Samples T Test) phương pháp nhằm mục đích kiểm nghiệm so sánh giá trò trung bình biến riêng biệt theo nhóm có khác biệt hay không giá trò trung bình biến riêng biệt theo nhóm khác Với giả thuyết ban đầu H cho giá trò trung bình hai nhóm Ví dụ ta kiểm nghiệm thu nhập trung bình (biến thu nhập) theo hai nhóm giới tinh nam giới tính nữ (biến giới tính sử dụng để chia giá trò quan sát biến thu nhập thành hai nhóm) - Công cụ kiểm nghiệm t cho cặp mẫu (Paired-Samples T Test) sử dụng để kiểm nghiệm có hay không giá trò trung bình khác biệt cặp quan sát khác giá trò Với giả thuyết ban đầu H cho giá trò trung bình khác biệt Ví dụ kiểm nghiệm khác biệt điểm thi môn học hai nhóm sinh viên có tham gia tham gia chương trình phụ đạo - Công cụ kiểm nghiệm t mẫu (One-Sample T Test) để kiểm nghiệm có hay không giá trò trung bình biến khác biệt với giá trò giả đònh từ trước Với giả thuyết ban đầu H cho giá trò trung bình kiểm nghiệm với giá trò giả thuyết đưa  Phân tích phương sai chiều (One-Way ANOVA) Phân tích phương sai dạng mở rộng phương pháp kiểm nghiệm t hai mẫu ngẫu nhiên độc lập (Independent-Samples T Test), sử dụng để kiểm nghiệm cho nhiều hai nhóm Phương pháp phân tích khảo sát biến thiên trung bình mẫu mối liên hệ với phân táng quan sát nhóm Với giả thuyết ban đầu H0 cho giá trò trung bình 5.4 Kiểm nghiệm mối quan hệ (Testing Relationships) Kiểm nghiệm mối quan hệ hai biến kiểm nghiệm mối tương quan với cường độ tương quan chiều tương quan biến sờ liệu - Trong kiểm nghiệm mối quan hệ hai biến, ta sử dụng kiểm nghiệm Chi-bình phương để kiểm nghiệm giả thuyết ban đầu cho hai biến thể bảng chéo (biến cột biến hàng) mối quan hệ với (độc lập với nhau) Biên soạn: Đào Hoài Nam Phân tích liệu SPSS - Trong kiểm nghiệm tương quan biến ta sử dụng kiểm nghiệm F kiểm nghiệm giả thuyết ban đầu cho biến khảo sát tương quan với (hệ số tương quan R = 0) o0o Biên soạn: Đào Hoài Nam 10 Phân tích liệu SPSS Công thức tính t: Với phương sai hợp Với phương sai riêng biệt x1 − x t= t= 1  S  +   n1 n2  p x1 − x  S12 S 22    + n n   Với: (n1 − 1) S 12 + ( n − 1) S 22 S = n1 + n − 2 P Với xi: Giá trò trung bình nhóm i ni: Số quan sát nhóm i Si: Phương sai mẫu nhóm i Bật tự kiểmnghiệm phương sai hợp df= (n1 + n2 – 2) Bật tự kiểmnghiệm phương sai riêng biệt bằng: df = ( S12 ( S12 n1 + S 22 n2 )2 ( S 22 n1 ) n2 ) + n1 − n2 −1 7.4 Kiểm nghiệm t theo cặp mẫu Đây dạng kiểm nghiệp dùng cho hai biến mẫu có liên hệ với nhau, liệu dạng thang khoảng cách tỷ lệ Nó tính toán khác biệt giá trò hai biến cho trường hợp kiểm nghiệm xem giá trò trung bình khác biệt có khác hay không Giả thuyết ban đầu đưa giá trò trung bình khác biệt Và ta loại bỏ giả thuyết trường hợp kiểm nghiệm cho kết Sig nhỏ mức ý nghóa (0.05) Lợi điểm việc sử dụng kiểm nghiệm T theo cặp ta loại trừ yếu tố tác động bên vào nhóm thử Ví dụ ta khảo sát ưa thích Biên soạn: Đào Hoài Nam 60 Phân tích liệu SPSS hai loại nước hoa chuẩn bò tung thò trường Kết kiểm nghiệp nhóm mẫu cho thông tin xác thực ưa thích mùi vò hai loại nước hoa này, đồng thời tập trung vào khác biệt tư nhiên hai loại nước hoa Nếu ta tiến hành so sánh hai nhóm mẫu độc lập với cho kết khác biệt tác nhân khác với thân khác biệt hai loại nước hoa khác biệt người, nhận thức, kinh nghiệm yếu tô bên khác Phương pháp thích ứng cho việc kiểm nghiệm sản phẩm Phương pháp kiểm nghiệm giả thuyết cho khác biệt hai trung bình mẫu không Ta từ chối giả thuyết mức ý nghóa ta (significante) nhỏ mức ý nghóa (thường 5%) Điều kiện yêu cầu cho loại kiểm nghiệm kích cở hai mẫu so sánh phải Các quang sát cho bên so sánh phải thực điều kiện giống Các khác biệt từ giá trò trung bình hai mẫu phải phân phối chuẩn số lượng mẫu đủ lớn để xấp xỉ phân phối chuẩn Phương sai biến ngang không ngang (có thể kiểm nghiệm qua phép kiểm nghiệm phương sai Levene) Để thực việc so sánh ta vào Compare means\Paired-samples ttest… Từ Menus ta hộp thoại hình 6-17: Hình 6-17 Chọn hai biến ta cần so sánh cách di chuyển vệt đen đến lần lược hai biến cần quan sát, di chuyển biến cần quan sát vào hộp thoại Paired Variables nút mũi tên Paired-samples t test cho ta kết mối tương quan hai biến quan sát Cho biết liệu hai biến có tương quan với hay không, độ tương quan chiều tương quan (thể bảng Paired samples correlation) Biên soạn: Đào Hoài Nam 61 Phân tích liệu SPSS Các giả đònh phải thỏa mãn dùng kiểm nghiệm cặp mẫu quan sát cặp phải thực điều kiện Những khác biệt giá trò trung bình phải có phân phối chuẩn Phương sai biến ngang không Đối với kiểm nghiệm t cặp mẫu, SPSS tính toán giá trò khác biệt hai bến quan sát tiến hành kiểm nghiệm giá trò trung bình khác biệt có hay không Trong kiểm nghiệm hai mẫu độc lập đề cập phần trước SPSS chia giá trò biến đơn thành hai nhóm dựa biến kiểm soát sau tiến hành so sánh trung bình biến đơn hai nhóm với Đối với kiểm nghiệm cặp, giá trò trung bình giá trò hai biến so sánh với Kiểm nghiệm loại sử dụng để kiểm nghiệm xem trung bình hai đo lường khác biệt hay ngang nhau, hay nói cách khác kiểm nghiệm xem có hay không trung bình giá trò khác biệt hai biến trường hợp quan sát khác Để tiến hành kiểm nghiệm t theo cặp đòi hỏi hai biến kiểm nghiệm phải số lượng mẫu quan sát có kiểu đo lường đơn vò đo lường Công thức tin giá trò kiểm nghiệm t theo cặp tính sau: Trung bình sai biệt hai biến kiểm nghiệm t = SD n Với SD: Độ lệch tiêu chuẩn sai biệt n : Số lượng quan sát (mẫu) 8.5 Phân tích phương sai chiều (One way ANOVA) Các phép so sánh đề cập phần cho phép ta so sánh trung bình hai tổng thể dựa mẫu cặp phối hợp hai mẫu độc lập Trong phần phương pháp kiểm đònh mở rộng cho trường hợp so sánh trung bình nhiều tổng thể xây dựng việc xem xét biến thiên (phương sai) giá trò quan sát nội nhóm (mẫu) nhóm (mẫu) với Ở ta đề cập đến phân tích phương sai yếu tố trường hợp có yếu tố (biến kiểm soát) xem xét nhằm xác đònh ảnh hưởng đến yếu tố khác Yếu tố xem xét ảnh hưởng dùng để phân loại quan sát thành nhóm nhỏ khác Biên soạn: Đào Hoài Nam 62 Phân tích liệu SPSS Một cách tổng quát, giả sử ta có k nhóm (mẫu) n 1, n2, …, nk quan sát chọn ngẫu nhiên độc lậo từ k tổng thể (n 1, n2, …, nk khác kích thước) Gọi µ1, µ2, …, µk trung bình k tổng thể, xij quan sát thứ j nhóm thứ i Ta mô tả quan sát k nhóm sau: Nhóm … K X11 X21 … XK1 X12 X22 … XK2 … … … … X1n1 X2n2 … XKnK Với giả đònh tổng thể có phân phối chuẩn, có phương sai nhau, sai số độc lập với nhau, phân tích phương sai yếu tố kiểm nghiệm giả thuyết ban đầu sau: H0: µ1 = µ2 = … = µk Ta thấy việc so sánh giá trò trung bình, phân tích phương sai nghe sai sót Tuy nhiên việc phân tích phương sai dựa thông số thống kê F, với F tỷ số biến thiên trung bình nhóm biến thiên quan sát nội nhóm: Biến thiên trung bình nhóm F= Biến thiên giá trò quan sát nội nhóm Nếu giá trò trung bình nhóm khác biệt nhiều, đặc biệt mối quan hệ với biến thiên nội nhóm, giá trò F thu lớn giả thuyết H0: µ1 = µ2 = … = µk bò từ chối Và ta quan sát việc phân tích phương sai yếu tố cho hai nhóm kết thống kê F tính bình phương kết thống kê t kiểm nghiệm t cho hai mẫu độc lập  Các bước phân tích phương sai yếu tố để kiểm nghiệm ngang giá trò trung bình k tổng thể Phân tích phương sai yếu tố để kiểm nghiệm giả thuyết H 0: µ1 = µ2 = … = µk tiến hành thông qua bước sau: Biên soạn: Đào Hoài Nam 63 Phân tích liệu SPSS Bước 1: Tính giá trò trung bình xi cho nhóm x chung cho tất nhóm ni ∑x xi = i =1 ij (i = 1,2, , k ) ni k ni i =1 j =1 ∑ ∑x x= ij n Hoặc k ∑ n x x= i i =1 i n k ( n = ∑ ni ) i =1 Bước 2: Tính đại lượng thể biến thiên nội nhóm (SSW) nhóm (SSG) Gọi SS đại lượng thể biến thiên nội nhóm, ta có: ni SS i = ∑ ( xij − xi ) j =1 Ta co ùtổng cộng biến thiên nội nhóm là: Nói cách đơn giản SSW tổng bình phương chênh lệch k ni SSW = SS1 + SS + + SS k = ∑∑ ( xij − xi ) i =1 j =1 quan sát với trung bình nhóm mà quan sát thuộc (within-groups sum of squares) SSW biến thiên không yếu tố kiểm soát (yếu tố dùng để phân chia nhóm) gây Đại lượng thể biến thiên nhóm (between-groups sum of squares) tính công thức: ni SSG = ∑ ni ( xi − x ) i =1 SSG thể biến thiên khác nhóm, tức biến thiên yếu tố kiểm soát gây Gọi STT tổng bình phương chênh lệch quan sát với trung bình tất quan sát ta có: k ni SST = ∑∑ ( xij − x ) i =1 j =1 Biên soạn: Đào Hoài Nam 64 Phân tích liệu SPSS Đã chứng mính SST = SSW + SSG công thức sở phương pháp phân tích phương sai yếu tố với biến thiên quan sát so với giá trò trung bình tổng cộng biến thiên giải thích yếu tố kiểm soát (SSG) biến thiên yếu tố khác yếu tố kiểm soát SSW Bước 3: Tính ước lượng cho phương sai chung k tổng thể, MSW MSG, cách cia SSW SSG cho số bật tự tương ứng, ta có: SSW MSW= (Within-groups mean square) n-k SSG MSG= (Between-groups mean square) k-1 Tỷ số dùng để kiểm nghiệm giả thuyết H0 Nếu H0 đúng, nghóa trung bình k tổng thể tỷ số MSG/MSW gần với giá trò Ngược lại, trung bình k tổng thể không nhau, MSG lớn MSW, tỷ số MSG/MSW lớn Mức độ lớn xem “đủ lớn” (tuỳ thuộc vào độ tin cậy) để ta bác bỏ H Bước với việc tính gia trò kiểm đònh F lý giải điều Biên soạn: Đào Hoài Nam 65 Phân tích liệu SPSS Bước 4: Tính giá trò kiểm đònh F: MSG F= MSW Ta bác bỏ H0 mức ý nghóa ∝ (thường 0.05), giá trò p-value nhỏ mức ý nghóa, tương ứng với tỷ số F=MSG/MSW lớn F k-1, n-k, ∝, với Fk-1, n-k, ∝ có phân phối F với k-1 n-k bật tự tương ứng tử mẫu số Kết phân tích phương sai yếu tố thường thể dạng bảng sau: Biến thiên (Variance) Tổng chệnh lệch bình phương Bật tự (df) (Sum of squares) Giữa nhóm Trung bình chênh lệch bình phươngPhương sai Giá trò kiểm đònh Pvalue Sig (Mean square) SSG k-1 MSG=SSG/k-1 SSW n-k MSW=SSW/n-k SST n-1 F=MSG/ MSW (Between Groups) Trong nội nhóm (Within Groups) Tổng công (Total)  So sánh cặp trung bình tổng thể Một đònh khác biệt tồn giá trò trung bìnhbác bỏ H0, hiễn nhiên nảy sinh câu hỏi trung bình tổng thể khác nhau, tổng thể có trung bình lơn nhỏ Để trả lời câu hỏi SPSS cung cấp kiểm nghiệm post hoc range Biên soạn: Đào Hoài Nam 66 Phân tích liệu SPSS pairwise multiple comparisons đònh giá trò trung bình khác biệt Range tests xác đònh nhóm giá trò trung bình đồng không tồn khác biệt giá trò trung bình Kiểm nghiệm Pairwise multiple comparisons kiểm nghiệm khác biệt cặp giá trò trung bình đưa ma trận đánh dấu hoa thò nhóm giá trò trung bình có khác biệt đáng kể mức độ tin cậy 5% Đối với giả thuyết cân phương sai chấp nhận (thông qua kiểm nghiệm Levene) ta có phương pháp kiểm nghiệm thống kê sau để so sánh trung bình mẫu: - The least significant difference (LSD) phép kiểm nghiệm tương đương với việc sử dụng phương pháp kiểm nghiệm t riêng biệt cho toàn cặp biến Yếu điểm phương pháp không chỉnh lý độ tin cậy cho tương thich với việc kiểm nghiệm cho nhiều so sánh lúc Do dẫn đến độ tin cậy không cao Các kiểm nghiệm khác tham khảo sau loại bỏ yếu điểm cách điều chỉnh độ tin cậy cho so sánh nhiều thành phần - Phương pháp kiểm nghiệp Bonferroni Tukey’s honestly significant difference sử dụng cho hầu hết kiểm nghiệm so sánh đa bội Kiểm nghiệm Sidak’s t test sử dụng tương tư phương pháp Bonferroni nhiên cung cấp giới hạn chặt chẻ Khi tiến hành kiểm nghiệm số lượng lớn cặp trung bình Tukey’s honestly significant difference test có tác động mạnh Bonferroni test Và ngược lại Bonferroni thích hợp cho kiểm nghiệm có số lượng cặp so sánh - Hochberg’s GT2 giống Tukey’s honestly significant difference test thông thường Tukey’s test có tác dụng tốt Gabriel’s pairwise comparisons test giống Hochberg’s GT2 thường sử dụng kích cở mẫu kiểm nghiệm có sai biệt lớn - Phương pháp kiểm nghiệm Dunnett’s pairwise dùng để so sánh giá trò trung bình mẫu với gía trò trung bình cụ thể lấy từ tập mẫu so sánh Thông thường mặc đònh nhóm mẫu cuối làm nhóm kiển soát, ta lựa chọn nhóm đâu tiêu làm nhóm kiểm soát, lúc giá trò trung bình nhóm tong biến độc lập so sánh với giá trò trung bình nhóm nhóm sau biến độc lập - Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa hai bước kiểm nghiệm Đầu tiên tiến hành kiểm nghiệm có hay không toàn giá trò Biên soạn: Đào Hoài Nam 67 Phân tích liệu SPSS trung bình ngang hay không Nếu toàn giá trò trung bình không ngang sau bước thứ hai kiểm nghiệm khác biệt nhóm nhỏ với nhau, để tìm nhóm thật khác biệt không khác biệt giá trò trung bình Tuy nhiên việc kiểm nghiệm không nên thực trường hợp kích cở mẫu nhóm không ngang - Thông thường kích thước mẫu không ngang nhóm Bonferroni Scheffé hai phương pháp kiểm nghiệm lựa chọn phương pháp Tukey - Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s b tương tự nhiên sử dụng phương pháp - Kiểm nghiệm Waller-Duncan t sử dụng kích thước mẫu không - Phương pháp kiểm nghiệm Scheffé cho phép kết hợp tuyến tính giá trò trung bình kiểm nghiệm, không so sánh cặp Chính kết kiểm nghiệm Scheffé thường thận trọng phương pháp kiểm nghiệm khác , đòi hỏi khác biệt lớn giá trò trung bình quan sát để bảo đảm tính thật khác biệt phép kiểm nghiệm Đối với trường hợp giả thuyết cân phương sai mẫu không chấp nhận ta sử dụng phương pháp kiểm nghiệm sau để tiến hành so sánh giá trò trung bình nhóm:Tamhane’s T2, Dunnett’s T3, Games-Howell, Dunnett’s C Ví dụ nông nghiệp người ta muốn biết ngũ cốc phát triển sử dụng loại phân bón khác Nhà nghiên cứu muốn biết liệu tất loại phân bón có ảnh hưởng ngang đến phát triển ngu cốc hay vài loại phân bón có tác dụng tốt vài loại khác Để kiểm nghiệm điều người ta dùng ANOVA đề kiểm nghiệm tốc độ phát triển trung bình (có thể lượng ngũ cốc thu hoạch, chiều cao cây, số lượng trái trung bình thu hoạch được, …) giá trò trung bình sử dụng thống kê ANOVA thông thường kiểm nghiệm số lượng mẫu lớn hai, số lượng mẫu ta dùng phương pháp tương đối đơn giãn kiểm nghiệm t hai mẫu đề cập phần ANOVA sử dụng rộng rãi thực tế ta gặp nhiều trường hợp đòi hỏi ta phải Biên soạn: Đào Hoài Nam 68 Phân tích liệu SPSS kiểm nghiệm nhiều mẫu lúc Chú ý ta kiểm nghiệp theo cặp phương pháp kiểm nghiệm t hai mẫu lần kiểm nghiệm độ sai lệch 5% (tuỳ thuộc vào mức tin cậy mà ta mong muốn) Do kiểm nghiệm tất cặp mẫu tỷ lệ sai sót tăng lên theo lần Do ANOVA cho phep1 ta kiểm nghiệm tất mẫu mức độ sai sót 5% kiểm nghiệm lần Để thực kiểm nghiệm ANOVA, liệu đòi hỏi phải thỏa mãn số giả thuyết sau: - Các mẫu kiểm nghiệm phải độc lập mang tính ngẫu nhiên - Các mẫu sử dụng kiểm nghiệm phải có phân phối chuẩn kích thước mẫu đủ lớn để xem gần phân phối chuẩn - Phương sai mẫu phải ngang băng (có thể kiểm nghiệp điều phép kiểm nghiệm phương sai Levene Nếu mẫu nghiên cứu ta không thỏa mãn điều kiện ta cò thể dùng phép kiểm nghiện phi tham số (nonparametric) như phép kiểm nghiệm Kruskal-Wallis Ví dụ minh họa: Các nhà chế biến phân phôí Coffee thò trường Hoa Kỳ đối mặt với tình hình bất ổn giá hạt Coffee Trong năm giá hạt coffee trội xụt từ $1.40 pound (0.373 kg) lên $2.50/pound sau lại tụt xuống $2.03/pound Người ta xác đònh bất ổn giá coffee tình hình hoạt động thân nhà chế biến phân phối coffee yếu tố khác quan trọng vấn đề hạn hán Brazil, Brazil sản xuất 30% sản lượng coffee giới, thò trường coffee nhạy cảm với biến chuyển thời tiết (nguy hạn hán) Brazil Để tạo ổn đònh cho hoạt động nhà phân phối Coffee muốn loại bỏ mặt hàng Coffee Brazil khỏi cấu hàng hóa Tuy hiên trước thực đònh có cân nhắc liệu loại bỏ mặt hàng Coffee Brazil có làm giảm doanh số công ty hay không Vì công ty thuê công ty nghiên cứu Marketing tiến hành kiểm nghiệm thông kê ưa thích mùi vò coffee khách hành tiêu dùng Coffee thò trường Công ty tiến hành khảo sát dựa ba nhóm khách hàng lựa chọn ngẫu nhiên bao gồm nhóm khách hàng chuyên tiêu dùng Coffee Brazil, Nhóm khách hàng chuyên tiêu dùng Coffee Colombia nhóm khách hàng tiêu dùng Coffee Châu Phi (đây loại Coffee tiêu dùng chủ yếu Biên soạn: Đào Hoài Nam 69 Phân tích liệu SPSS công ty) Chú ý công ty loại trừ nhóm khách hành vừa tiêu dùng nhiều loại coffee khác nhau, để bảo đảm tính độc lập mẫu chọn, nghiên cứu mùi vò nên đòi hỏi chọn khách hàng có gu tiêu dùng riêng biệt Ở công ty muốn xác đònh xem liệâu có khác biệt mức độ ưa thích ba loại coffee (Sẽ cho khách hành thử ba loại coffee khảo sát đánh giá mức độ ưa thích ba loại Coffee) hay có khác khác bao loại Coffe ba nhóm khách hàng Dựa vào kết phân tích ANOVA cho ta biết liệu mức độ ưa thích trung bình ba nhóm khách hàng giống hay khác loại coffee Sau dùng phương pháp kiểm nghiệp Post Hoc để xác đònh khác biệt nhóm khách hàng loại coffee thử Sau dùng ANOVA khảo sát khác biệt mẫu Nếu ta có đủ sở để kết luận khác biệt mẫu Ta kết thúc công việc (việc loại bỏ coffee brazil không gây ảnh hưởng đến doanh số, người tiêu dùng chuyển sang coffee comlobia châu Phi cách dễ dàng) Tuy nhiên ta loại bỏ giã thuyết ngang nhóm Ta phải xác đònh tiếp khác biệt mẫu kiểm nghiệm Chúng ta cần phải xác đònh hướng độ lớn khác biệt cách so sánh khác biệt mẫu với (người tiêu dùng coffee brazil thích coffee comlombia coffe châu Phi, người tiêu dùng coffee brazil đánh giá coffee brazil ngang với coffee colombia, mức độ ưa thích coffee châu Phi thấp để giảm thiểu doanh số bán coffee brazil loại bỏ mặt hàng công ty nên tăng lượng coffee comlombia tiêu thụ thò trường) công cụ thống kê kiểm nghiệp Post Hoc cho phép ta thực công việc Phân tích phương sai chiều tiến trình phân tích phương sai chiều cho biến đònh lượng phụ thuộc với yếu tồ đơn lẻ hay gọi biến độc lập Phân tích phương sai (ANOVA) dùng để kiểm nghiệm giả thuyết cho tất giá trò trung bình ngang Kỷ thuật dạng mở rộng kiểm nghiệm T hai mẫu Để xác đònh khác biệt giá trò trung bình muốn biết giá trò trung bình khác biệt Một đònh khác biệt tồn giá trò trung bình, kiểm nghiệm post hoc range pairwise multiple comparisons đònh giá trò trung bình khác biệt Range tests xác đònh nhóm giá trò trung bình đồng không tồn khác biệt giá trò trung bình Kiểm Biên soạn: Đào Hoài Nam 70 Phân tích liệu SPSS nghiệm Pairwise multiple comparisons kiểm nghiệm khác biệt cặp giá trò trung bình đưa ma trận đánh dấu hoa thò nhóm giá trò trung bình có khác biệt đáng kể mức độ tin cậy 5% Đối với giả thuyết cân phương sai chấp nhận (thông qua kiểm nghiệm Levene) ta có phương pháp kiểm nghiệm thống kê sau để so sánh trung bình mẫu: - The least significant difference (LSD) phép kiểm nghiệm tương đương với việc sử dụng phương pháp kiểm nghiệm t riêng biệt cho toàn cặp biến Yếu điểm phương pháp không chỉnh lý độ tin cậy cho tương thich với việc kiểm nghiệm cho nhiều so sánh lúc Do dẫn đến độ tin cậy không cao Các kiểm nghiệm khác tham khảo sau loại bỏ yếu điểm cách điều chỉnh độ tin cậy cho so sánh nhiều thành phần - Phương pháp kiểm nghiệp Bonferroni Tukey’s honestly significant difference sử dụng cho hầu hết kiểm nghiệm so sánh đa bội Kiểm nghiệm Sidak’s t test sử dụng tương tư phương pháp Bonferroni nhiên cung cấp giới hạn chặt chẻ Khi tiến hành kiểm nghiệm số lượng lớn cặp trung bình Tukey’s honestly significant difference test có tác động mạnh Bonferroni test Và ngược lại Bonferroni thích hợp cho kiểm nghiệm có số lượng cặp so sánh - Hochberg’s GT2 giống Tukey’s honestly significant difference test thông thường Tukey’s test có tác dụng tốt Gabriel’s pairwise comparisons test giống Hochberg’s GT2 thường sử dụng kích cở mẫu kiểm nghiệm có sai biệt lớn - Phương pháp kiểm nghiệm Dunnett’s pairwise dùng để so sánh giá trò trung bình mẫu với gía trò trung bình cụ thể lấy từ tập mẫu so sánh Thông thường mặc đònh nhóm mẫu cuối làm nhóm kiển soát, ta lựa chọn nhóm đâu tiêu làm nhóm kiểm soát, lúc giá trò trung bình nhóm tong biến độc lập so sánh với giá trò trung bình nhóm nhóm sau biến độc lập - Ryan, Einot, Gabriel, and Welsch (R-E-G-W) đưa hai bước kiểm nghiệm Đầu tiên tiến hành kiểm nghiệm có hay không toàn giá trò trung bình ngang hay không Nếu toàn giá trò trung bình không ngang sau bước thứ hai kiểm nghiệm Biên soạn: Đào Hoài Nam 71 Phân tích liệu SPSS khác biệt nhóm nhỏ với nhau, để tìm nhóm thật khác biệt không khác biệt giá trò trung bình Tuy nhiên việc kiểm nghiệm không nên thực trường hợp kích cở mẫu nhóm không ngang - Thông thường kích thước mẫu không ngang nhóm Bonferroni Scheffé hai phương pháp kiểm nghiệm lựa chọn phương pháp Tukey - Duncan’s multiple range test, Student-Newman-Keuls (S-N-K), and Tukey’s b tương tự nhiên sử dụng phương pháp - Kiểm nghiệm Waller-Duncan t sử dụng kích thước mẫu không - Phương pháp kiểm nghiệm Scheffé cho phép kết hợp tuyến tính giá trò trung bình kiểm nghiệm, không so sánh cặp Chính kết kiểm nghiệm Scheffé thường thận trọng phương pháp kiểm nghiệm khác , đòi hỏi khác biệt lớn giá trò trung bình quan sát để bảo đảm tính thật khác biệt phép kiểm nghiệm Đối với trường hợp giả thuyết cân phương sai mẫu không chấp nhận ta sử dụng phương pháp kiểm nghiệm sau để tiến hành so sánh giá trò trung bình nhóm:Tamhane’s T2, Dunnett’s T3, Games-Howell, Dunnett’s C Biên soạn: Đào Hoài Nam 72 Phân tích liệu SPSS Để thực phép kiểm nghiệm ANOVA ta vào Comapre means\One-Way ANOVA… từ menus để truy xuất hộp thoại hình 6-18 Di chuyển vệt tối đến biến đònh lượng cần so sánh, chuyển sang hộp thoại Dependent List Lựa biến kiểm soát tức biến độc lập (yêu cầu phải có ba giá trò trở lên biến kiểm soát này) chuyển biến kiểm soát vào hộp thoại Factor, Biến kiểm soát cho phép ta phân giá trò trung bình theo nhóm để kiểm nghiệm Thao tác đến cho phép ta đưa kết luận liệu trung bình nhóm có hay không Hình 6-18 Để tiến hành kiểm nghiệp so sánh khác biệt nhóm với ta lựa chọn công cụ Post Hoc ta có hộp thoại hình 6-19 lựa chọn phương pháp kiểm nghiệm thích hợp Hinh 6-19 Biên soạn: Đào Hoài Nam 73 Phân tích liệu SPSS Lựa chọn công cụ Options cho ta hộp thoại hình 6-20 Để xác đònh loại loại thông kê môâ tả (Descriptive) tính đồng phương sai, công cụ để tính hệ số thống kê Levene để kiểm nghiệm ngang phương sai nhóm (việc tính toán đònh đến lưa chon phương pháp kiểm nghiệp phần Post Hoc Công cụ Means Plot dùng để hiển thò đồ thò giá tri trung bình nhóm Công cụ Missing Values dùng để kiểm soát giá trò khuyết Hình 6-20 - Exclude cases analysis by analysis: Những trường hợp có giá trò khuyết biến phụ thuộc biến kiểm soát không đưa vào kiểm nghiệm Ngoài trường hợp có giá trò quan sát nằm bên chuổi xác đònh cho biến kiểm soát không sử dụng - Exclude cases listwise Những trường hợp có giá trò khuyết Cases biến điều khiển biến phụ thuộc đưa không đưa kiểm nghiệm bò loại trừ khỏi trình kiểm nghiệm phân tích Các giả đònh phải thỏa mãn dùng phân tích ANOVA chiều - Các mẫu liệu phải độc lập, ngẫu nhiên lấy từ tổng thể phân phối chuẩn - Trong tổng thể phương sai mẫu liệu phải (điều kiểm nghiệm qua thông kê Levene’s homogeneity-ofvariance - Biên soạn: Đào Hoài Nam 74 [...]... biến được lựa chọn để tách dữ liệu (hiễn thò trong hộp Groups Based On list), và việc tách này mang tính chất tổ chức lại dữ liệu thành những nhóm nhỏ do đó khi tiến hành phân tích dữ liệu các phân tích dựa trên sự phân tách và được thể hiện một các riêng biệt giữa các nhóm phân tách Biên soạn: Đào Hoài Nam 25 Phân tích dữ liệu bằng SPSS Chú ý sau ki tiến hành phân tích trên sự phân tách, để trở lại trạng... đựng giá trò riêng biệt của tập dữ liệu mà nó bao hàm từ trước (trước khi tiến hành hợp nhất) và các Biên soạn: Đào Hoài Nam 31 Phân tích dữ liệu bằng SPSS trường hợp này sẽ có giá trò khuyết trong các biến chứa đựng trong tập tin thứ hai mà ta sẽ hợp nhất _o0o Biên soạn: Đào Hoài Nam 32 Phân tích dữ liệu bằng SPSS CHƯƠNG 6: XỮ LÝ VÀ PHÂN TÍCH DỮ LIỆU 1 Kiểm tra dữ liệu (Explore) Công việc đầu tiên... màn hình dữ liệu của SPSS Hình 5-6 Hình 5-7 Hình 5-8 Biên soạn: Đào Hoài Nam 24 Phân tích dữ liệu bằng SPSS 4 Tách tập dữ liệu (Split File) Công cụ Split File cho phép tách dữ liệu trong tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt và sau khi thực hiện lệnh Split file này các phân tích xữ lý thống kê sẽ cho ta các kết quả thống kê đã được thực hiện riêng biệt theo từng nhóm nhỏ dữ liệu này... dấu bằng vết đen) Hình 5-12 Biên soạn: Đào Hoài Nam 27 Phân tích dữ liệu bằng SPSS Công cụ If dùng để xác đònh các điều kiện nếu có khi thực hiện lệnh Count, (giống như công cụ if trong phần recode đã đưọc đề cập ở trên) 7 Hợp nhất các tập dữ liệu (Merge files) SPSS cho phép ta hợp các dữ liệu quan sát từ trong một tập dữ liệu bên ngoài vào tập dữ liệu đang sử dụng Hoặc hợp các biến mới trong tập dữ liệu. .. list - Chọn Compare groups: Các dữ liệu phân tích sẽ được tách theo các giá trò của biến được lựa chọn để tách dữ liệu (hiễn thò trong hộp Groups Based On list), và việc tách này mang tính chất so sánh do đó khi tiến hành phân tích dữ liệu các phân tích dựa trên sự phân tách này những vẫn được thể hiện trên cùng một bảng - Chọn Organize output by groups: Các dữ liệu phân tích sẽ được tách theo các giá... việc phân tích sau này Ta cũng có thể nhập liệu từ các phần mềm khác như Excel, Fox, … và sau đó chuyển vào trong SPSS _oOo _ Biên soạn: Đào Hoài Nam 18 Phân tích dữ liệu bằng SPSS CHƯƠNG 5: CÁC PHÉP BIẾN ĐỔI VÀ THAO TÁC TRÊN TẬP DỮ LIỆU 1 Mã hóa lại (Recode) Recode là công cụ dùng để mã hóa lại các giá trò trong một biến thành các giá trò mã hóa mới phù hợp với đòi hỏi của quá trình phân tích dữ liệu. .. 30 Phân tích dữ liệu bằng SPSS phải bảo đảm trước khi tiến hành hợp nhất biến giữa hai tập dữ liệu này là ta phải xắp xếp dữ liệu trong hai biến khóa của hai tập dữ liệu theo thứ tự từ nhỏ đến lớn - Các biến có tên giống nhau trong tập tin đang hoạt động vào tập tin bên ngoài sẽ bò loại trừ khỏi tập tin mới được tạo Từ tập dữ liệu đang thao tác ta mở công cụ Data/Merge Files/Adds Variables từ menu, SPSS. .. vào các bước mô tả hay các phân tích thông kê phức tạp sau này là tiến hành xem xét dữ liệu một cách cẩn thận SPSS cung cấp cho công cụ Explore để xem xét và kiểm tra dữ liệu: - Phát hiện các sai sót - Nhận dạng dữ liệu để tìm phương pháp phân tích thích hợp và chuẩn bò cho việc kiểm tra giả thuyết Để nhận dạng và phát hiện sai sót trong dữ liệu, ta có ba cách hiễn thò dữ liệu như sau - Biểu đồ Histogram... liệu bên ngoài vào tập dữ liệu đang hoạt động Cả hai đều tạo ra một tập dữ liệu mới có thể chứa tất cả các quan sát được hợp lại hoặc tất cả các biến đưọc hợp tùy theo ta chọn Add Cases hay Add Variables 7.1 Thêm vào các quan sát (Add Cases) Công cụ Add Cases cho phép ta hợp dữ liệu trong tập dữ liệu đang hoạt động với dữ liệu trong một tập dữ liệu bên ngoài, với điều kiện tập dữ liệu đó phải chứa các... Biên soạn: Đào Hoài Nam 28 Phân tích dữ liệu bằng SPSS Hộp thoại Read File cho phép ta lựa chọn tập dữ liệu sẽ được hợp với tập dữ liệu đang hoạt động (working file) Nhấn Open để xác nhận việc lựa chọn này Sau khi lựa chọn xong tập dữ sẽ được kết hợp, ta sẽ có một hộp thoại mới như hình 5-14: Hình 5-14  Unpaired Variables: liệt kê các biến không giống nhau giữa hai tập dữ liệu đang được tiến hành hợp .. .Phân tích liệu SPSS Trong nghiên cứu đònh lượng, liệu ban đầu thu thập từ trường liệu thô, chưa thể tiến hành phân tích diễn giải liệu dạng thô mà đòi hỏi phải tiến hành bước xữ lý phân tích. .. Đào Hoài Nam 32 Phân tích liệu SPSS CHƯƠNG 6: XỮ LÝ VÀ PHÂN TÍCH DỮ LIỆU Kiểm tra liệu (Explore) Công việc quan trọng cần phải thực cách cẩn thận trước vào bước mô tả hay phân tích thông kê phức... Các liệu phân tích tách theo giá trò biến lựa chọn để tách liệu (hiễn thò hộp Groups Based On list), việc tách mang tính chất tổ chức lại liệu thành nhóm nhỏ tiến hành phân tích liệu phân tích

Ngày đăng: 11/11/2015, 12:03

Từ khóa liên quan

Mục lục

  • Nhóm 1: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11

  • Nhóm 2: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8

    • Dưới 18 1

    • 19 đến 30 2

    • 31 đến 40 3

    • 41 đến 50 4

    • Trên 50 5

    • Ericson 1

    • Nokia 3

    • Phân loại biến theo kiểu dữ liệu:

      • 1. Mã hóa lại (Recode)

      • Recode là công cụ dùng để mã hóa lại các giá trò trong một biến thành các giá trò mã hóa mới phù hợp với đòi hỏi của quá trình phân tích dữ liệu. Ví dụ đối với câu hỏi nguồn gốc nhận biết quảng cáo của sản phẩm X, người trả lời có thể trả lời cụ thể trên báo Sài Gòn, Tuổi Trẻ, Tạp chí Sức Khỏe và Đời sống, Trên đài HTV7, Trên đài VTV3, … Có thể ban đầu các nguồn quảng cáo được mã hóa một cách riêng biệt. Tuy nhiên do nhu cầu xữ lý sau này, người nghiên cứu muốn nhóm các giá trò được mã hóa riêng biệt này thành ba loại nguồn quảng cáo chính là Báo, Tạp Chí và Tivi. Công cụ Recode cho phép ta đònh lại các giá trò riêng biệt về nguồn quảng cáo ban đầu thành ba nguồn quảng cáo chung là Báo, Tivi và tạp chí.

      • SPSS cung cấp cho ta hai loại Recode là Recode trên cùng một biến (Recode into same variables) và recode vào biến khác (Recode into different variable).

        • Hình 5-1

        • 1.2. Mã hóa lại vào một biến khác (Recode into different variables)

          • Hình 5-6

          • Hình 5-9

            • Hình 5-10

            • 2. Lập bảng phân bố tần suất cho biến một trả lời (Frequencies)

              • Hình 6-4

              • Hình 6-6

              • 4. Lập bảng nhiều chiều cho các biến một trả lời (Crosstabs)

                • Hình 6-10

                • Hình 6-11

                  • Chọn tất cả những biến sơ cấp liên quan đến một câu hỏi nhiều trả lời ở hộp thoại Set Definition bên trái chuyển sang hộp thoại Variables in Set bên phải, ví dụ ta có 10 biến đơn chứa đựng các nhãn hiệu được nhận biết, ta phải chọn tất cả 10 biến này từ hộp thoại Set Definition và chuyển sang hộp thoại Variable in Set. Sau đó chỉ đònh cách mã hóa các biến đó (dichotomy hay category); dãy giá trò mã hóa (Range …Through) xác đònh khoảng biến thiên cho các giá trò trong biến gộp; xác đònh tên và gán nhãn cho biến gộp. Sau đó ấn thanh Add để đưa tên nhóm vừa xác đònh vào hộp Multi Response Sets. Sau khi tiến hành khai báo biến gộp xong mọi sử lý phân tích các biến nhiều trả lời sẽ được tiến hành trên các biến gộp đã được khai báo trong Multi Response Sets.

                  • Hình 6-13

                  • Hình 6-16

                  • Hình 6-17

Tài liệu cùng người dùng

Tài liệu liên quan