ÔN TẬP Phân tích thống kê

46 298 0
ÔN TẬP Phân tích thống kê

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BÀI 1: EPIDATA NÂNG CAO BÀI 2: CHIẾN LƯỢC PHÂN TÍCH VÀ TRÌNH BÀY CHIẾN LƯỢC PHÂN TÍCH VÀ TRÌNH BÀY SỐ LIỆU SỐ LIỆU BÀI 3: TÌM KIẾM, QUẢN LÝ & TRÍCH DẪN TÀI LIỆU NGHIÊN CỨU BẰNG ENDNOTE BÀI 4: PHƯƠNG PHÁP CHỌN MẪU - XÁC ĐỊNH CỠ MẪU BÀI 5: PHÂN TÍCH NGHIÊN CỨU BỆNH CHỨNG + ĐOÀN HỆ BÀI 7a: PHÂN TÍCH THỐNG KÊ TRONG NC CẮT NGANG ỨNG DỤNG CHO PHÂN TÍCH NC BỆNH CHỨNG BÀI 7B. QUẢN LÝ & BIÊN TẬP SỐ LIỆU

BÀI 1: EPIDATA NÂNG CAO - Ths HuỳnhNgọc VânAnh A Khắc phục lỗi thường gặp Không xếp Align Fields Quét khối từ BS Đặt tên biến theo Automatic Field Names File Options/ Create data file/ First word in question is filed name/ Ok Chọn Align Fields lại Kiểu liệu không đầy đủ Mở file qes bổ sung Nhãn biến có ký tự đặc biệt Mở file qes bỏ ký tự Tên biến tựđộng thay đổi Mở file qes sửa lại tên biến Xóa biến mà chưa xóa ràng buộc kiện Hiện thông báo lỗi, chọn “yes” để coi thơng báo Tìm hàng 30, 31, 32, 33… thông báo lỗi chỉnh sửa Chỉ lưu file chk, không lưu báo lỗi Đánh câu lệnh sai Hiện thơng báo lỗi, chọn “yes” để coi thơng báo Tìm hàng sửa lại tả“type comment allfields red” Chỉ lưu file chk, không lưu báo lỗi Dữ liệu khơng hiển thị nhãn mã hóa Nhấn F9 để coi mã hóa nhập mã hóa (Error: Illegal entry) Lỗi chương trình Tắt khởi động lại Epidata B Tùy chọn nhảy câu TH 1: Nếu b1=0 bỏ qua biến b2  Ở vị trí Jump biến b1: 0>b3a TH 2: Nếu b4=0 dừng nhập liệu Ở vị trí Jump biến b4: 0>WRITE TH 3: Giả sử muốn Epidata tự động nhập số vào trường bị nhảy vào Edit vị trí trường muốn nhảy gõ: JUMPS RESET V9 END TH 4: Nếu a7 “nghề nghiệp khác” (a7  6) bỏ qua biến a7k Cách 1: Ở vị trí Jump biến a7: > a8, > a8, > a8, > a8, > a8 Cách 2: Ở vị trí Edit biến a7: if a7 < then go to a8 endif C Ràng buộc khác: Topofscreen, Autosave, Key Unique Topofscreen: ‒ Dùng để dịch chuyển trường số liệu lên để dễ dàng nhập liệu sang trang ‒ Chọn biến trang mới, vào Edit gõ chữ: topofscreen Autosave: ‒ Epidata tự động save sau nhập xong record ‒ Chọn biến nhập liệu, vào Edit gõ chữ: Autosave Key Unique: ‒ Dùng để khóa trường nhập liệu, giúp nhập liệu khơng bị trùng ‒ Thường dùng cho biến id ‒ Cần trường khóa sử dụng gộp số liệu ‒ Đến trường cần khóa, vào Edit gõ: Key Unique D Gộp số liệu: Append, Merge Append (dọc): ‒ Giữ nguyên số biến, tăng số lượng record ‒ Mỗi lần gộp tối đa data ‒ Data in/out  Append/Merge • First data: Chọn (File rec)người thứ • Second data: Chọn liệu người thứ • OK  • Chọn nơi lưu đặt tên file • Append  Merge (ngang): ‒ Giữ nguyên record, tăng số lượng biến ‒ Mỗi lần gộp tối đa data ‒ Data in/out  Append/Merge • First data: Chọn liệu người thứ • Second data: Chọn liệu người thứ • OK  • Chọn nơi lưu đặt tên file • Merge  chọn trường khóa E Nhập số liệu đôi: Double Entry (Tạo thêm file y chang, có thêm ký hiệu double) ‒ Dùng để kiểm tra sai sót q trình nhập liệu ‒ Nhập số liệu lần dựa số liệu nhập lần Tools/ Prepare Double Entry Verification       Chọn file rec chứa số liệu nhập lần File name: Đặt tên file nhập lần (nên để mặc định) Data file label: Nhãn liệu Ignore textfields in double entry: Không so liệu Text lần nhập liệu Match records by fields: chọn trường mã số để đốichiếu Thông báo tạo xong file nhập đôi/ OK BÀI 2: CHIẾN LƯỢC PHÂN TÍCH VÀ TRÌNH BÀY CHIẾN LƯỢC PHÂN TÍCH VÀ TRÌNH BÀY SỐ LIỆU SỐ LIỆU - Ths Huỳnh Ngọc Vân Anh Các bước phân tích số liệu: Biên tập số liệu - Làm số liệu - Phân loại BS - Rút gọn số liệu Thống mô tả - BS định lượng - BS định tính - Thống mơ tả phân tầng Thống phân tích Các kiểm định: - t, Anova - Mann-Whitney - Kruskal Wallis - Chi bình phương, Số đo kết hợp: OR, RR, PR Biên tập số liệu a Làm số liệu: - Phân loại BS xem phân phối BS: • BS định tính (BS phân loại): lập bảng phân phối tần suất • BS định lượng: xem phạm vi số liệu, tổ chức đồ/ biểu đồ hình hộp - Kiểm tra tính định BS: • BS định tính: bảng chéo • BS định lượng: phân tán đồ - Xử trí số liệu bất thường: • Đối chiếu với tài liệu gốc • Số liệu bất thường KHƠNG có khả xảy nhập giá trị missing • Số liệu bất thường có khả xảy giữ ngun giá trị BS - NC bệnh chứng: kiểm tra phân phối riêng biệt nhóm bệnh khơng bệnh b Phân loại BS: - BS kết (hậu quả): BS phụ thuộc, mô tả vấn đề NC - BS phơi nhiễm (nguyên nhân): BS độc lập cần xem xét mlq hay ước lượng tác động lên BS kết - BS gây nhiễu: BS làm biến dạng mối quan hệ BS kết với BS phơi nhiễm - BS tương tác, trung gian: BS làm thay đổi tác động BS phơi nhiễm lên BS kết c Rút gọn số liệu: Phân nhóm BS dựa vào loại BS - BS phơi nhiễm: thường dựa vào mqh liều lượng đáp ứng nhóm không phơi nhiễm nên để riêng - BS liên tục: nên phân nhóm dựa vào nghiên cứu trước (tổng quan y văn) - BS gây nhiễu, tương tác: nên rút gọn số liệu thành đến nhóm phân thành nhiều nhóm BS gây nhiễu mạnh Thống môtả a Thống mô tả đơn biến: Biến định lượng Biến định tính Phân phối bình thường Phânphối khơng bình thường Thống mơ tả • Tần suất • Tỷ lệ% • Tần suất • Trung bình • Độ lệch chuẩn • Trung vị • Khoảng tứ phân vị Đồ thị, biểu đồ • Hình • Hình bánh • Tổ chức đồ • Đa giác tần suất • Biểu đồ hình hộp b Thống mô tả phân tầng theo BS phụ thuộc: - NC đồn hệ, cắt ngang: trình bày tỷ lệ % theo BS phơi nhiễm (hàng) - NC bệnh chứng: trình bày tỷ lệ % theo BS phụ thuộc (cột: nhóm bệnh/ k bệnh) - NC can thiệp: trình bày tỷ lệ % theo BS can thiệp c Hình thức trình bày bảng: - Có tựa ngắn gọn rõ ràng - Đặt tên cho hàng cột - Trình bày tổng số bảng (hàng hay cột phân tầng) - Định nghĩa ký hiệu chữ viết tắt bảng - Ghi nguồn số liệu bảng (nếu trích dẫn) Lưu ý:- BS nhị giá: trình bày giá trị tiêu biểu - BS danh định: giá trị xếp theo tần suất (Tăng dần/ giảm dần) - BS thứ tự: dùng % tích lũy (cont.) để nhận xét - BS định lượng: phải ghi đơn vị đo lường BS Thống phân tích: a Phân tích đơn biến: - Cung cấp thơng tin hữu ích số liệu - Cho biết khái niệm ban đầu BS có liên quan mạnh đến biến kết - Mức độ thay đổi ước lượng thô so với ước lượng hiệu chỉnh Các bước tiến hành: - Lập bảng x để so sánh mức độ phơi nhiễm với nhóm kiểm định phù hợp - Xem xét ước lượng tác động có theo khuynh hướng khơng? - Tìm chứng tăng giảm nguy theo mức độ phơi nhiễm tăng dần (test for trend) b Lựa chọn kiểm định phù hợp: Biến độc lập Biến phụ thuộc Nhị giá Danh định, Thứ tự Định lượng, đa biến/ thứ tự Định lượng có phân phối bình thường T-test Anova Hồi quy tuyến tính (KTC có ý nghĩa k chứa 0) Định lượng có phân phối KHƠNG bình thường MannWhitney Kruskal Wallis TQ Spearman Chi bình phương HQ.Logistic/Poisso n (KTC có ý nghĩa k chứa 1) Nhị giá Chi bình phương c Hình thức trình bày bảng: + NC Bệnh chứng: OR=ab/cd - Trị số OR phải ghi hàng biến giá trị quan tâm (Biến phơi nhiễm quan tâm: hàng trên, Biến phơi nhiễm quan tâm: hàng dưới) - Lý giải: Có mlq tiêm BCG với mắc bệnh phong với p3 biến nhiễu  Xem: + Giá trị p có ý nghĩa k? + KTC 95% có ý nghĩa k? + Pt y=A+b1x1+b2x2+ +bn e Phân tích tương tác: có loại tương tác − Tương tác BS gây nhiễu − Tương tác BS gây nhiễu BS phơi nhiễm − Tương tác BS phơi nhiễm quan tâm  Có thể xem xét tác động BS phương pháp phân tầng cổ điển MantelHaenszel Nếu có nhiều yếu tố tác động mơ hình hồi quy đa biến công cụ phù hợp để khử tác động BS lên biến kết Những trở ngại phân tích: - Xác định (Đọc y văn, nghiên cứu thử) thừa thiếu BS trình thu thập số liệu, chia nhóm số liệu khơng phù hợp - Không phân biệt thống mô tả (ước lượng: sum, tab) thống phân tích (kiểm định TK) - Sử dụng kiểm định không phù hợp (phải xem phân phối bt hay phân phối lệch) - Chưa hiểu rõ ý nghĩa giá trị p, ước lượng điểm ước lượng khoảng - Chưa phân biệt yếu tố gây nhiễu, tương tác - Cố gắng tìm kiếm mối liên quan khơng thích hợp với mục tiêu nghiên cứu BÀI 3: TÌM KIẾM, QUẢN LÝ & TRÍCH DẪN TÀI LIỆU NGHIÊN CỨU BẰNG ENDNOTE - Thái Thanh Trúc Trình bày TLTK Các kiểu trích dẫn Đánh số thứ tự văn để tham chiếu đến tài liệu tham khảo Sau liệt tài liệu tham khảo theo thứ tự sử dụng (Vancouver) Viết họ/tên tác giả, năm xuất số trang trích dẫn để tham chiếu đến tài liệu tham khảo (Harvard) Trích dẫn theo cách Việt Nam – Trong viết, trích dẫn số – Tài liệu tham khảo tiếng Việt trước, tài liệu tham khảo tiếng Anh, Pháp… sau – Tác giả người Việt Nam: xếp theo thứ tự A, B, C theo tên, không đảo tên lên trước họ – Tác giả người nước ngoài: xếp thứ tự A, B, C theo họ – Tài liệu khơng có tên tác giả: xếp theo A, B, C theo từ quan phát hành Endnote • Tạo quản lý thư viện, tài liệu tham khảo, báo tồn văn cách có hệ thống • Trích dẫn tài liệu theo qui cách khác Có thể chỉnh sửa qui cách cho phù hợp • Truy cập thư viện 100 trường đại học giới  Tìm download NC tồn văn QUẢN LÝ CHỈ MỤC • Tạo thư viện mới: Mở Endnote – File → New → Tìm nơi lưu → Đặt tên thư viện (thamkhao.enl) • Tạo nhóm mục (group set): Click phải lên My Groups → Create Group Set → nhập Bai doc them • Tạo mục: Click phải lên Bai doc them → Create Group → nhập vào Tap chi Lưu ý: khơng dùng tiếng Việt có dấu để đặt tên NHẬP TLTK ĐỂ QUẢN LÝ • Nhập thủ công Endnote: Tất tài liệu tiếng Việt; tất trang web • Tìm từ chức Search báo Endnote • Tìm download Endnote trực tiếp từ tạp chí/ thư viện • Import từ file văn (text) Chọn kiểu thể – Annotated/ – Havard/ – Vancouver/ – VietnamE Một số lỗi sai thường gặp – Tài liệu tiếng Việt:• Dư dấu chấm, dấu phẩy cuối tên tác giả • Nhiều tác giả dòng • Có chữ vie phần Language – Tài liệu tiếng Anh:• Khơng có chữ eng phần Language • Khơng cài đặt chọn VietnamE thể  Nếu chưa thấy danh sách chọn Selectg Another Style tìm (VietnamE) QUẢN LÝ TÀI NGUYÊN • Chọn Cowling → click chuột phải → File Attachments → Open file • Chọn Yuan → click chuột phải → File Attachments → Open file “Gắn kẹp” • Chọn Parrott → Click chuột phải → File Attachments → Attach File… → Tìm chọn file Parrott2000.pdf TRÍCH DẪN TÀI LIỆU • Mở viết 5_baiviet.doc • Chọn tác giả tương ứng Endnote • Trong viết (Word), chọn Endnote → Insert Selected Citation • Chọn VietnamE mục Style Các quy tắc trình bày tài liệu tham khảo – Sách, luận án, báo cáo • Tên tác giả quan phát hành • Năm xuất bản: đặt ngoặc đơn • Tên sách, luận án, báo cáo: in nghiêng • Nhà xuất • Nơi xuất • Số tái • Các số trang: tiếng Việt tr.20-30; tiếng Anh pp.20-30 Endnote Sách • Reference type: book • Author: Nguyễn Hữu Đống Đào Thanh Hằng (Mỗi tác giả dòng) • Year: 1997 • Title: Đột biến – sở lý luận ứng dụng • City: Hà Nội • Publisher: NXB Nơng Nghiệp • Pages: tr 45-60 • Notes: Đống VD: Nguyễn Hữu Đống, Đào Thanh Hằng (1997) Đột biến – sở lý luận ứng dụng NXB Nông nghiệp Hà Nội, tr.45-60 30 Institude of Economies (1998), Analysis of Expenditure Pattern of Urban Households in Vietnam, Department of Economics – Research report, Hanoi, pp.345-350 Các quy tắc trình bày tài liệu tham khảo Endnote – Bài báo/tạp chí, đăng/ sách • Tên tác giả quan phát hành • Năm xuất bản: đặt ngoặc đơn • Tên báo: khơng in nghiêng để “ ” • Tên tạp chí tên sách: in nghiêng • Nhà xuất • Số tái • Nơi xuất • Tập • Số: đặt ngoặc đơn • Số trang: tiếng Việt tr.20-30; tiếng Anh pp.20-30 Tạp chí • Reference type: Journal Article • Author: Trần Thiện Trung • Year: 2002 • Title: Điều trị viêm dày – tá trang H pylory • Journal: Tạp chí y học • Volume: tập • Issue: • Pages: tr 13-18 • Original Publication: Đại học Y dược TP.HCM • Notes: Trung 44 Trần Thiện Trung (2002) “Điều trị… H.pylory” Tạp chí Y học, DHYD Tp.HCM, tập (8), tr.13-18 Luận văn / luận án • Reference type: Thesis • Author: Bùi Chí Thương • Year: 2004 • Title: Kết điều trị… BVPS Từ Dũ • City: TP.HCM • University: Đại học Y dược TP.HCM • Number of Pages: tr 15-21 • Thesis type: Luận văn tốt nghiệp bác sĩ nội trú • Notes: Thương Báo cáo • Reference type: Report • Author: Institute of Economies • Year: 1998 • Title: Analysis of… in Vietnam • City: Hanoi • Institution: Department of Economics • Pages: pp 345-350 • Type: Research Report • Language: eng • Notes: Institute – Trang web • Tên tác giả (hoặc quan chủ quản khơng có tác giả cụ thể) • Năm đăng tải: đặt ngoặc đơn • Tên viết: in nghiêng • Cơ quan chủ quản (nếu có tác giả cụ thể) • Đường dẫn đến trang web (URL) • Ngày truy cập Trang web • Reference type: web page • Author: WHO (hoặc World Health Organization) • Year: 2007 • Title: How to conduct a big survey • Access Date: accessed on (truy cập ngày) 20 Oct 2009 • URL: http://www.who.int/survey_info.html • Language: eng • Notes: WHO • Publisher: (nếu có) WHO (2007), How to conduct a big survey, http://www.who.int/survey_info.html, accessed on 20 Oct 2009 Các số đo thử nghiệm lâm sàng Các bước tiến hành phân tích NC thử nghiệm LS Thống mô tả số liệu theo nhóm NC Kiểm định mlq nhóm NC Lượng hoá mối liên quan số đo dịch tễ: OR, RR, RRR, ARR, NNT Intention to treat (ITT) vs Per protocol (PP) Đa số RCT sử dụng ITT phương pháp phân tích vì: • Cân yếu tố tiên lượng từ phân nhóm ngẫu nhiên ban đầu • Cho ước lượng khơng chệch tác dụng điều trị • Thừa nhận khơng tn thủ đề cương, phản ánh tình lâm sàng thực tế Thử nghiệm thực địa – Thử nghiệm người chưa có bệnh – Đánh giá dự phòng bệnh phổ biến hay trầm trọng Can thiệp cộng đồng – Biện pháp can thiệp áp dụng cho cộng đồng BÀI 7a: PHÂN TÍCH THỐNG TRONG NC CẮT NGANG - Thái Thanh Trúc • Thống mơ tả Biến định tính – Tần số – Tỉ lệ phần trăm – Tỉ lệ phần trăm cộng dồn (với biến thứ tự) – Khoảng tin cậy 95% tab1 CácBiếnSố – Vd: tab1 gioi nghenghiep ci prop BiếnNhịGiá – Vd: ci prop ungthu Biến định lượng Cách 1: hist biếnsố, norm freq – Vd: hist tlsosinh, norm freq → Bình thường có dạng hình chng Cách 2: pnorm biếnsố # Normal probability plot – Vd: pnorm tlsosinh → Bình thường đường (đậm nhạt) trùng Cách 3: qnorm biếnsố # Quantiles of normal distribution plot – Vd: qnorm tlsosinh → Bình thường đường (đậm nhạt) trùng Cách 4: swilk biếnsố # Shapiro Wilk test – Vd: swilk tlsosinh, norm freq → Bình thường p > 0,05 → Kiểm định nhạy, nên hạn chế dùng • Nếu số liệu có phân phối khơng bình thường (lệch) xem gợi ý cách biến đổi sliệu gladder biến số, freq – Vd: gladder tlsosinh, freq – Phân phối bình thường → TB ± Độ lệch chuẩn, max - – Phân phối khơng bình thường → Trung vị (Khoảng tứ vị), max - – Khoảng tin cậy 95% sum CácBiếnSố, d – Vd: sum tuoi bmi ci mean BiếnĐịnhLượng – Vd: ci mean bmi • Kiểm định thống Kết định tính – Kiểm định Z mẫu prtesti n pmẫu pgiả thuyết prtest biếnnhịgiá = pgiả thuyết – Kiểm định Z hai mẫu prtesti n1 p1 n2 p2 prtesti biếnnhịgiá = biếnnhịgiá Kết định lượng – Kiểm định có tham số • Kiểm định t mẫu ttesti n1 m1 sd2 mgiả thuyết ttest biếnđịnhlượng = mgiả thuyết • Kiểm định t hai mẫu – Bắt cặp ttest biếntrước = biếnsau – Kiểm định Chi bình phương – Kiểm định xác Fisher • Khi ≥ 20% số có vọng trị 20% giá trị vọng trị 25%”] + Dù khơng có vọng trị 10%): gây nhiễu → báo cáo OR tính Giới (ORkếthợp) ORthơ ≈ ORkếthợp( 0.05 → OR nhóm huyết áp bình thường nhóm huyết áp tăng → không tương tác Sự khác biệt ORthô ORkết hợp = (28.87 – 27.19)/27.19 = 0.062 ≈ 6,2% → yếu tố tăng huyết áp xuất không làm thay đổi đáng kể mối quan hệ sinh non nhẹ cân ( Tuổi …19 , 20 , 21… Nhóm tuổi Vị thành niên / già… Khi quan tâm đến việc lí giải nguyên nhân – kết + BS mô tả/ đo lường vấn đề, kết NC  BS phụ thuộc (dependent variable) + BS mô tả/ đo lường yếu tố nguyên nhân, gây nên vấn đề NC  BS độc lập (independent variable) • Mã hóa số liệu – Tên biến số + + + + + + Không bắt đầu số Không chứa khoảng trắng ký tự đặc biệt $%^&#@!*()+ Khơng dùng tiếng Việt có dấu Ngắn gọn, súc tích Đồng Theo cụm – Nhãn biến số + + + + Ngắn gọn, súc tích Có thể khơng dùng tồn câu hỏi Kèm theo đơn vị đo lường Có thể sử dụng tiếng Việt có dấu Ví dụ Câu hỏi: Anh/chị thường tìm thơng tin HIV/AIDS từ nguồn nào? -» Nhãn biến: Nguồn thông tin HIV/AIDS – Giá trị + + + + Biến nhị giá: & Biến danh định, thứ tự: 1, 2, 3, Biến định lượng: số cụ thể Giá trị khuyết/từ chối trả lời: 9, 99, 999, 9999 – Nhãn giá trị + + + + Ngắn gọn, súc tích Có thể khơng dùng tồn tùy chọn trả lời Không cần đơn vị đo lường Có thể sử dụng tiếng Việt có dấu • QUẢN LÝ VÀ BIÊN TẬP SỐ LIỆU Mở nhập số liệu: File  Open  Chọn file liệu Stata (.dta)  Open – Tại thời điểm, Stata mở số liệu – Nếu mở sliệu thay đổi sliệu bị (khỏi nhớ) mở tiếp sliệu – Dùng lệnh: use c:\data\cesd.dta, clear – Xem thư mục làm việc: pwd – Chuyển đổi thư mục: cd c:\data – Mở số liệu: use cesd.dta, clear * Tùy chọn clear để xóa hết liệu có nhớ • Mở file Excel: File  Import  Excel spreadsheet (*.xls; *.xlsx) Xem cấu trúc số liệu • Mơ tả số liệu: describe – Khi kết nhiều, Stata hiển thị đủ khung hình  Bấm vào “more” spacebar để tiếp tục xem – Bỏ chức “more”: set more off, permanently + + + + + + + + + obs : Số quan sát vars : Số biến số Size : Kích thước file Variable name : Tên biến số Storage type : Loại liệu Display format : hình thức hiển thị Value label : Nhãn giá trị Variable label : Nhãn biến số Sorted by : Sắp xếp liệu theo codebook – Biến định lượng + + + + + + + Range : Phạm vi Unique values : Các giá trị Units : Đơn vị thể mức độ xác Missing : Số số liệu bị khuyết Mean : Trung bình Std Dev : Độ lệch chuẩn Percentiles : Bách phân vị – Biến định tính + + + + + + + Range : Phạm vi Unique values : Các giá trị Units : Đơn vị thể mức độ xác Missing : Số số liệu bị khuyết Freq : Tần số Numeric : Giá trị biến Label : Nhãn giá trị browse Tools  Value labels  Hide all value labels Tìm kiếm chỉnh sửa số liệu Biên tập số liệu edit edit BiếnSố – Điều kiện + + + + + + + if if if if if if if if a2==1 : Giới nam (a2 qui định Nam) age

Ngày đăng: 22/10/2018, 10:08

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan