PHƯƠNG PHÁP XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU NGHIÊN CỨU

12 3.8K 12
PHƯƠNG PHÁP XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU NGHIÊN CỨU

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 PHƯƠNG PHÁP XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU NGHIÊN CỨU TS.BS Võ Bảo Dũng Xử lý phân tích số liệu hay liệu nghiên cứu bước nghiên cứu, bao gồm xác định vấn đề nghiên cứu; thu thập số liệu; xử lý số liệu; phân tích số liệu báo cáo kết Xác định rõ vấn đề nghiên cứu giúp việc thu thập số liệu nhanh chóng xác Để có sở phân tích số liệu tốt trình thu thập số liệu phải xác định trước yêu cầu phân tích để thu thập đủ số liệu mong muốn Điều cốt lõi phân tích số liệu suy diễn thống kê, nghĩa mở rộng hiểu biết từ mẫu ngẫu nhiên thành hiểu biết tổng thể, hay gọi suy diễn quy nạp Muốn có suy diễn phải phân tích số liệu dựa vào test thống kê để đảm bảo độ tin cậy suy diễn Bản thân số liệu số liệu thô, qua xử lý phân tích trở thành thông tin sau trở thành tri thức Đây điều mà tất nghiên cứu mong muốn Trong khuôn khổ viết này, tác giả muốn trình bày với người đọc số khái niệm kỹ thuật xử lý phân tích số liệu Bên cạnh đó, tác giả giới thiệu số thao tác xử lý số liệu phần mềm SPSS, phần mềm xử lý thông kê sử dụng nhiều Xử lý số liệu nghiên cứu Ngày nay, hầu hết nghiên cứu xử lý số liệu phần mềm máy tính Do vậy, việc xử lý số liệu phải qua bước sau: - Mã hóa số liệu: Các số liệu định tính (biến định tính) cần chuyển đổi (mã hóa) thành số Các số liệu định lượng không cần mã hóa - Nhập liệu: Số liệu nhập lưu trữ vào file liệu Cần phải thiết kế khung file số liệu thuận tiện cho việc nhập liệu - Hiệu chỉnh: Là kiểm tra phát sai sót trình nhập số liệu từ bảng số liệu ghi tay vào file số liệu máy tính Phân loại số liệu (biến số) nghiên cứu Có loại biến số hầu hết nghiên cứu đố biến số định tính biến số định lượng - Biến định tính: loại biến số phản ảnh tính chất, Có thể biểu diễn dạng định danh (ví dụ: nam/nữ) hay thứ bậc (tốt/khá/trung bình/yếu)…Đối với loại biến số ta không tính giá trị trung bình số liệu - Biến định lượng: Thường biểu diễn số Các số dạng biến thiên liên tục (ví dụ: huyết áp bệnh nhân theo thời gian) rời rạc (ví dụ: chiều cao, cân nặng người bệnh lúc vào viện) Dạng biến cho phép tính giá trị trung bình biến Cần lưu ý tất biến định lượng phải có đơn vị tính (mmHg, mmol/L, mg%, Kg…) Một số nguyên tắc chọn test thống kê phân tích số liệu nghiên cứu Khi chọn test thống kê cần cân nhắc yếu tố sau: - Mục tiêu nghiên cứu: Đo lường khác hay mối tương quan biến số - Số nhóm nghiên cứu: nhóm, hai nhóm hay nhóm - Cỡ mẫu nghiên cứu: nhỏ hay lớn - Bản chất số liệu, loại biến số: định tính hay định lượng - Phân bố mẫu: phân bố chuẩn hay không chuẩn - Loại quan sát: mẫu độc lập hay ghép cặp Có loại test thống kê test tham số (parametric test) test phi tham số (non-parametric test) Test tham số dùng cho nghiên cứu có cỡ mẫu lớn (> 30), phân bố quần thể phân bố chuẩn, thường dùng với biến định lượng, test thường dùng t test, ANOVA, tương quan Pearson, hồi quy tuyến tính… Test phi tham số áp dụng cho mẫu nghiên cứu lớn nhỏ, phân bố quần thể có phân bố không chuẩn, dùng cho biến danh mục thứ hạng (định tính), test thường dùng Fisher test, Median test, χ test, Kruskal-Wallis one way ANOVA test, tương quan thứ hạng Spearman… Phân tích số liệu nghiên cứu 4.1 Mô tả biến số - Tỷ lệ: biến định tính Từ tỷ lệ ước lượng từ mẫu quần thể nghiên cứu với phép ước lượng điểm, ước lượng khoảng kiểm định giả thuyết cho tỷ lệ cuả nhóm hay nhiều nhóm - Giá trị trung bình (X), trung vị , độ lệch chuẩn (SD), giá trị lớn nhất, giá trị nhỏ nhất: biến định lượng Tương tự với biến định tính, từ giá trị trung bình mẫu ước lượng điểm, ước lượng khoảng giá trị quần thể 4.2 Phân tích khác biệt - So sánh tỷ lệ - So sánh tỷ lệ - So sánh giá trị trung bình - So sánh giá trị trung bình 4.3 Phân tích mối liên quan biến số - Tương quan biến định tính: + Tỷ suất chênh mắc (POR: Prevalence Odd Ratio): nghiên cứu ngang 3 + Tỷ suất chênh OR: nghiên cứu bệnh chứng không ghép cặp + Nguy tương đối RR (Relative Risk): nghiên cứu tập - Tương quan biến định lượng: + Hệ số tương quan r + Phương trình hồi quy tuyến tính: Y = a + bX - Tương quan biến định tính trở lên: phân tích tầng - Tương quan hồi quy tuyến tính bội Phân tích số liệu với phần mềm SPSS: Một số thao tác CÁCH THỨC TIẾN HÀNH LỆNH FREQUENCIES (Tính tần số) Sau mở file liệu, vào menu Analyze  Descriptive Statistics  Frequencies Màn hình xuất hộp thoại sau: Vẽ biểu đồ Chọn biến muốn tính tần số (biến Place V1) cách click chuột vào tên biến đưa sang khung Variable(s) Click Ok Trường hợp muốn vẽ biểu đồ thực thêm bước trước click Ok Để vẽ biểu đồ click chuột vào ô Charts… Chọn dạng biểu đồ Chart type, chọn giá trị thể biểu đồ số đếm (frequencies) hay phần trăm (percentages) Click Continue để trở lại hộp thoại Frequencies  Ok để thực lệnh TÍNH TRỊ TRUNG BÌNH (2 CÁCH) CÁCH DÙNG LỆNH FREQUENCY Vào menu Analyze  Descriptive Statistics  Frequencies Đưa biến cần tính trị trung bình vào ô variables bước phần trước Click chọn thẻ Statistic, mở hộp thoại, click chọn thông số cần thiết: Ý nghĩa số thông số thông dụng: Mean: trung bình cộng Sum: tổng cộng (cộng tất giá tị tập liệu quan sát) Std Deviation: độ lệch chuẩn Minimum: giá trị nhỏ Maximum: giá trị lớn S.E mean: sai số chuẩn ước lượng trị trung bình CÁCH DÙNG LỆNH DESCRIPTIVES (Tính điểm trung bình) Vào menu Analyze  Descriptive Statistics  Descriptives…, xuất hộp thoại Chọn hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung Variable(s) Click vào ô Options… để xuất hộp thoại Descriptive Options Chọn đại lượng thống kê muốn tính toán cách click vào ô vuông cần thiết Chọn cách xếp kết tính toán theo thứ tự danh sách biến (Variable list), thứ tự Alphabetic nhãn biến, thứ tự tăng dần (Ascending list), thứ tự giảm dần (Descending list) Click Continue để trở hộp thoại Descriptive  Ok để thực lệnh CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO (CROSSTABULATION) Phân tích bảng chéo dùng để kiểm định mối quan hệ biến định tính với cách dùng kiểm định Chi – bình phương (Chi-square) Cách thức tiến hành với SPSS sau: Vào menu Analyze  Descriptive Statistics  Crosstabs…, Xuất hộp thoại sau: Chọn đưa biến vào khung Row(s) (dòng) Column(s) (cột) Layer of (đối với trường hợp biến) Click vào ô Statistics, xuất hộp thoại sau: Chọn kiểm định cần thiết Trong trường hợp ta dùng kiểm định Chi – bình phương (Chi-square) - Các kiểm định ô Norminal dùng để kiểm định mối liên hệ biến biểu danh - Các kiểm định ô Ordinal dùng để kiểm định mối liên hệ biến thứ tự Click vào continue để trở lại hộp thoại Crosstabs  Click vào ô Cells, hộp thoại sau xuất hiện: Ở ô Counts tần số chọn Observed (thể quan sát) Trong trường hợp muốn thể tần số mong đợi chọn Expected Chọn cách thể phần trăm theo dòng hay theo cột ô Percentages Click Continue để trở lại hộp thoại Crosstabs  Ok để thực lệnh CÁCH ĐỌC KẾT QUẢ KIỂM ĐỊNH Khi thực kiểm định, ta có giả thuyết H0: mối quan hệ biến H1: có mối quan hệ biến Để kết luận chấp nhận hay bác bỏ giả thuyết H0, ta dùng kiểm định phù hợp Dựa vào giá trị P (p-value) (SPSS viết tắt p-value sig.) để kết luận chấp nhận hay bác bỏ giả thuyết H0 p-value (sig.) ≤ α (mức ý nghĩa)  bác bỏ giả thuyết H0 Có nghĩa có mối quan hệ có ý nghĩa biến cần kiểm định p-value (sig.) > α (mức ý nghĩa)  chấp nhận H0 Không có mối quan hệ biến cần kiểm định ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG Hàng bảng Chi-square tests thể giá trị P Chi-Square Tests Value df Asymp Sig (2-sided) p-value 16.217 a 039 18.708 017 Linear-by-Linear Association 202 653 N of Valid Cases 511 Pearson Chi-Square Likelihood Ratio a cells (44.4%) have expected count less than The minimum expected count is 1.69 Cuối bảng Chi-Square tests SPSS đưa dòng thông báo cho biết % số ô có tần suất mong đợi Kiểm định Chi-bình phương có ý nghĩa số quan sát đủ lớn, có 20% số ô bảng chéo có tần số lý thuyết nhỏ giá trị chi-bình phương không đáng tin cậy Trong ví dụ có đến 44.4% số ô có tần số mong đợi 5, biện pháp cho trường hợp ta gom biểu biến lại để tăng số quan sát nhóm 9 CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH CỦA TỔNG THỂ ĐỘC LẬP (Independent Samples T-test) Vào menu Analyze  Compare Means  Independent-samples T-test Chọn biến định lượng cần kiểm định trị trung bình đưa vào khung Test Variable(s) Chọn biến định tính chia số quan sát thành nhóm mẫu để so sánh nhóm với đưa vào khung Grouping Variable Chọn Define Groups… để nhập mã số nhóm Click Continue để trở lại hộp thoại  Click Ok để thực lệnh 10 Trong kiểm định Independent-samples T-test, ta cần dựa vào kết kiểm định phương sai tổng thể (kiểm định Levene) Phương sai diễn tả mức độ đồng không đồng (độ phân tán) liệu quan sát Independent Samples Test A.Cleanliness and comfort of room Levene's Test for Equality of F Variances t-test for Equality of Means Equal Equal variances variances not assumed assumed 138 Sig .710 t -3.066 -3.040 df 509 448.100 Sig (2-tailed) 002 003 -.231 -.231 075 076 95% Confidence Interval Lower -.379 -.380 of the Difference -.083 -.082 Mean Difference Std Error Difference Upper Nếu giá trị Sig kiểm định Levene (kiểm định F) < 0.05 phương sai tổng thể khác nhau, ta sử dụng kết kiểm định t dòng Equal variances not assumed Nếu Sig ≥ 0.05 phương sai tổng thể không khác nhau, ta sử dụng kết kiểm định t dòng Equal variances assumed Trong VD Sig kiểm định F = 0.71 > 0.05  chấp nhận giả thuyết H0 khác phương sai tổng thể  sử dụng kết dòng Equal variances assumed Nếu Sig kiểm định t ≤ α (mức ý nghĩa)  có phác biệt có ý nghĩa trung bình tổng thể Nếu Sig > α (mức ý nghĩa)  khác biệt có ý nghĩa trung bình tổng thể Trong VD sig = 0.002 < 0.05  có khác biệt có ý nghĩa trung bình tổng thể 11 CÁCH THỨC TIẾN HÀNH PHÂN TÍCH PHƯƠNG SAI (ANOVA – Analysis of Variance) Phân tích phương sai ANOVA phương pháp so sánh trị trung bình nhóm trở lên Có kỹ thuật phân tích phương sai: ANOVA yếu tố (một biến yếu tố để phân loại quan sát thành nhóm khác nhau) ANOVA nhiều yếu tố(2 hay nhiều biến để phân loại) Ở phần thực hành đề cập đến phân tích phương sai yếu tố (One-way ANOVA) Một số giả định phân tích phương sai yếu tố: - Các nhóm so sánh phải độc lập chọn cách ngẫu nhiên - Các nhóm so sánh phải có phân phối chuẩn cỡ mẫu phải đủ lớn để xem tiệm cận phân phối chuẩn - Phương sai nhóm so sánh phải đồng Từ menu Analyze  Compare Means  One-Way ANOVA, xuất hộp thoại sau: kỹ thuật dùng để kiểm định sâu ANOVA Đưa biến định lượng (trị trung bình) vào khung Dependent list Đưa biến phân loại xác định nhóm cần so sánh với vào khung Factor Click vào nút Option để mở hộp thoại One-Way ANOVA Options Trong hộp thoại One-way ANOVA Options: - Click chọn ô Descriptive để tính đại lượng thống kê mô tả (tính trị trung bình) theo nhóm so sánh - Click chọn ô Homogeneity of variance test để kiểm định phương sai nhóm (thực kiểm định Levene) 12 Click chọn Continue để trở lại hộp thoại ban đầu  click Ok để thực lệnh Dựa vào kết kiểm định ANOVA, H0 chấp nhận kết luận khác biệt có ý nghĩa nhóm với Nếu H0 bị bác bỏ  có khác biệt có ý nghĩa nhóm  trở lại hộp thoại One – way ANOVA để thực kiểm định sâu ANOVA nhằm xác định cụ thể trung bình nhóm khác với nhóm nào, nghĩa tìm xem khác biệt nhóm xảy đâu Tuy nhiên thực kiểm định ANOVA sâu ANOVA lúc với Dựa vào chấp nhận hay bác bỏ giả thuyết H0 để quan tâm hay không quan tâm đến kết kiểm định sâu ANOVA Tài liệu tham khảo: Đỗ Hàm (2009), Phương pháp luận nghiên cứu khoa học y học, Trường Đại học Y khoa Thái Nguyên Phạm Văn Hiền (2009), Phương pháp tiếp cận nghiên cứu khoa học, http://pgo.hcmuaf.edu.vn/pvhien Nguyễn Văn Hộ, Nguyễn Đăng Bình (2004), Phương pháp luận nghiên cứu khoa học, Đại học Thái Nguyên Đinh Thanh Huề (2004), Phương pháp nghiên cứu khoa học, Trường Đại học Y Huế Hoàng Trọng, Chu Nguyễn Mộng Ngọc (2008), Phân tích liệu nghiên cứu với SPSS, Trường Đại học Kinh tế TP Hồ Chí Minh Nguyễn Văn Tuấn (2009), Phương pháp nghiên cứu khoa học giáo dục, Trường Đại học SPKT TPHCM

Ngày đăng: 25/07/2016, 01:40

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan