Tài liệu hướng dẫnthống kê y học sử dụng SPSS, LÊ ĐỘNG NHẬT LAM

30 1.4K 3
Tài liệu hướng dẫnthống kê y học sử dụng SPSS, LÊ ĐỘNG NHẬT LAM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tài liệu hướng dẫn thống kê y học sử dụng SPSS SPSS Theo dõi kiện (Survival analysis) Lê Đông Nhật Nam Lời nói đầu “Thời gian sáng suốt, biết kiên nhẫn đợi thời gian trả lời” Lời nói đầy tính triết lý ông Nguyễn Hùng Trương (1926-2005) chủ nhà sách Khai Trí, thư gửi độc giả nhỏ tuổi tờ Thiếu Nhi tuần báo vào năm 1972 Khi đọc báo học trò lớp 9, nhiên câu nói ám ảnh nay; đồng thời sống quanh chứng minh câu nói tuyệt đối Nhiều để nhận quy luật ta phải nhìn ngược khứ theo dõi khoảng thời gian đủ để quy luật biểu rõ ràng Thời gian ngắn, ví dụ giảng đường đại học, tiết học nhàm chán cần 15 phút đủ cho số sinh viên rơi rụng gần hết; có thời gian dài, chí hàng chục năm cho thấy quy luật xác suất tử vong bệnh lý hay nguy đó; mà nghiên cứu cắt ngang nhìn Trong tài liệu làm quen với phương pháp thống kê phân tích xác suất xảy kiện theo thời gian, có tên Kaplan Meier Khi sinh viên, tên gọi thực bí hiểm, tiếc phải nói đa số giáo trình thống kê thủ phạm làm tăng bí ẩn cho phương pháp sử dụng thuật ngữ khó hiểu, công thức hàm số… Vì phương pháp nằm tay nhà khoa học chuyên nghiệp, ứng dụng vào công trình mang tầm vóc vĩ mô nên sinh viên có hội thực hành đời, đến ngày đụng phải thiết kế nghiên cứu cohort, longitudinal, nghiên cứu sinh nhận quên lý thuyết cách thực Kaplan Meier Chính tài liệu này, Bs Khả Nhi sử dụng cách tiếp cận hoàn toàn khác, không đặt nặng lý thuyết toán học, thực dụng nhiều, cho phép bạn xuất kết quả, hiểu biện luận kết cách nhanh Cuối bạn thấy phương pháp Kaplan Meier không bí hiểm khó bạn nghĩ, tên gọi khác lạ gây ảo giác độ phức tạp; thực quy trình dựa bạn biết, lý thuyết xác suất, test phi tham số Wilcoxon, thống kê mô tả, biểu đồ Scatter plot hồi quy logistic Điểm đặc biệt tài liệu chỗ hoàn toàn dựa lập trình cú pháp lệnh SPSS thay thao tác thủ công giao diện Đây thử nghiệm nhằm giải phóng bạn khỏi nút bấm hộp thoại, bước làm quen với SPSS Syntax vốn thú vị tiện lợi nhiều Chúc bạn thành công Quy ước trình bày Trong tài liệu làm quen với nhân vật Bác sĩ Nguyễn Văn Thái Bác sĩ Thái cao thủ thống kê y học giang hồ Anh ta xuất trước vấn đề khó khăn, nhằm đưa câu trả lời xác ôn lại cho bạn kiến thức chuyên sâu lý thuyết thống kê Tuy nhiên BS Thái lại bận rộn nên không đủ thời gian vào cách thực chi tiết Anh ta hay trình bày lý thuyết túy sử dụng nhiều công thức toán học nên không gần gũi với sinh viên gây không trở ngại cho bạn vốn dị ứng với thống kê … Bác sĩ Lê Ngọc Khả Nhi Khả Nhi nữ bác sĩ trẻ dễ thương sử dụng thành thạo SPSS Như tên gọi mình, BS Nhi có tính cách hồn nhiên ngây thơ trẻ con, cô có khuynh hướng đơn giản hóa tối đa vấn đề Khả Nhi hướng dẫn bạn sử dụng SPSS qua bước cụ thể, chia sẻ mẹo vặt, thủ thuật để giúp bạn đến kết nhanh dễ dàng Sinh viên Trần Quốc Bảo Bảo sinh viên y khoa năm thứ sáu bắt đầu làm quen với nghiên cứu khoa học Đây cậu sinh viên tò mò đặt nhiều câu hỏi liên quan đến thống kê Mặc dù đế tài Bảo thực đơn giản, đồng hành với cậu ta, bạn có hội tích lũy cho nhiều kinh nghiệm công việc phân tích số liệu thiết kế nghiên cứu Tình thí dụ Streptococcus pneumoniae Moraxella catarrhalis Nhiễm khuẩn đường hô hấp trẻ sơ sinh Haemophilus influenzae Staphylococcus aureus tuần tuổi Lấy mẫu dịch tiết hầu họng Nuôi cấy, phân lập chủng vi khuẩn (hình vẽ) 12 24 36 Theo dõi 36 tháng bệnh viêm phổi, viêm phế quản Một bác sĩ khoa hô hấp Nhi thực nghiên cứu nhằm kiểm tra mối liên hệ tình trạng nhiễm khuẩn hô hấp giai đoạn sơ sinh khởi phát bệnh viêm phế quản – phổi năm đầu đời trẻ em Nghiên cứu thực 145 bệnh nhi Tại thời điểm tuần tuổi, bé kiểm tra tình trạng nhiễm khuẩn xâm lấn đường hô hấp cách phân lập vi khuẩn từ dịch tiết hầu họng Những em bé theo dõi tái khám 36 tháng nhằm ghi nhận biến cố viêm phổi viêm phế quản Sau hoàn tất số liệu, phải dùng phương pháp thống kê để trả lời cho câu hỏi nghiên cứu đặt ban đầu ? Bảo thân mến, trường hợp điển hình nghiên cứu theo dõi kiện khoảng thời gian kéo dài Với thiết kế ta áp dụng số phương pháp đặc thù, bao gồm biểu đồ Kaplan-Meier mô hình hồi quy Cox M Paul Meier (1924-2011) Nhà toán học người Mỹ, đồng tác giả với Edward L Kaplan lập phương pháp phi tham số phân tích xác suất kiện theo thời gian Kaplan, E L.; Meier, P (1958) "Nonparametric estimation from incomplete observations" J Amer Statist Assn 53 (282): 457–481 C David Roxbee Cox (sinh năm 1924) Thiết lập mô hình hồi quy tỉ lệ nguy năm 1972 nhằm dự báo nguy phát sinh kiện thời điểm định Đồng tác giả với Mantel phương pháp Logrank nhằm so sánh phân phối xác suất kiện phân nhóm Mô tả 2° Tại thời điểm t bất kì, tiên đoán kiện xảy (không xảy ra) hay không ? Với xác suất ? Câu hỏi giúp ta dự báo khả xảy kiện cho trường hợp nào, dựa vào thời điểm đưa dự đoán Dự đoán cho phép ta kết luận đối tượng an toàn hay gặp nguy hiểm, giúp đưa định nới lỏng hay tăng cường cảnh giác trường hợp Hai câu hỏi Thời gian biến số thú vị, cho phép hiểu quy luật, chế mà nghiên cứu cắt ngang quan sát xác Phân tích kiện thực chất phân tích biến số thời gian, hay cụ thể hơn, thời gian trước kiện phát sinh E Thời gian T Xác suất xảy ? Trước hết, ta nhìn vấn đề cách đơn giản có thể, toán gồm biến số: Để trả lời câu hỏi thứ đơn giản, ta xác định khoảng thời gian theo dõi xảy kiện trường hợp thực thống kê mô tả Biến số thứ thời gian (T), biến định lượng liên tục, giá trị nhỏ = tính thời điểm bắt đầu theo dõi giá trị cao tính đến thời điểm chấm dứt nghiên cứu Câu hỏi thứ trả lời theo nhiều cách, chất hàm số với kết xác suất xảy (hay chưa xảy ra) kiện E biến số thời gian Biến số thứ kiện (E) , ví dụ khởi phát bệnh viêm phổi , biến số định tính nhị phân nhận giá trị: kiện xảy (=1) chưa xảy (=0) Thông thường kiện mang ý nghĩa xấu, tiêu cực (chính ta muốn dự báo xảy ra) Trong y khoa, nghiên cứu kiện tập trung vào loại kiện xấu, ví dụ: xuất biến chứng (suy thận, sản giật, tai biến mạch não…), khởi phát bệnh lý (lao, di ung thư ), bệnh trở nặng (đau thắt ngực, phù, hen kịch phát, tăng huyết áp…), tử vong Khác với nhiều tài liệu thống kê y học dịch sát nghĩa thuật ngữ cách kì cục «thời gian sống», tài liệu bạn không thấy nhắc đến chuyện sống hay chết, mà xét đến khái niệm kiện, biến cố nói chung Nghiên cứu theo dõi kiện y khoa thường đặt câu hỏi chính: 1° Khoảng thời gian trung bình tính đến lúc kiện E phát sinh ? (Hay: để kiện xảy ?) Câu hỏi cho phép đặt mốc thời điểm nhằm nâng cao cảnh giác, chuẩn bị đối phó, xử trí kiện Về lý thuyết ta sử dụng hàm số : + Hàm phân phối tích lũy cho biết xác suất cá thể ĐÃ phát sinh kiện thời điểm t + Hàm Survival cho biết xác suất « không xảy kiện » thời điểm t + Hàm Nguy hàm Nguy tích lũy cho biết xác suất phát sinh biến cố thời điểm t Dù công thức toán bí hiểm, nên để trình bày kết theo cách trực quan, tác giả dùng hình vẽ biểu đồ, biểu đồ có đặc điểm chung: trục tung xác suất, trục hoành thời gian Biểu đồ thông dụng dựa theo phương pháp Kaplan Meier (1958) Sau để cung cấp thông tin chi tiết hơn, ta trình bày phân phối xác suất số cột mốc định, dạng bảng Mục đích tài liệu trình bày lại lý thuyết hàm phân phối xác suất Chúng nhắm đến mục đích giản dị dẫn dắt bạn thực thành công phân tích theo dõi kiện SPSS hiểu kết máy tính xuất Nếu tò mò muốn tìm hiểu sâu lý thuyết, bạn tìm đọc tài liệu giáo sư tên tuổi lĩnh vực này, ví dụ giảng GS Nguyễn Văn Tuấn 3 Quy trình phân tích kiện SPSS 3.1 Bảng thống kê mô tả kiện Có tới quy trình khác chức Survival analysis, Chọn ? Kích hoạt quy trình lập bảng phân phối tần suất kiện giao diện SPSS Quy trình 1: Life Table SPSS để phân tích kiện, chất thống kê mô tả định lượng biến số E T Tuy nhiên không cho phép kiểm tra giả định hay dự báo Life table cho phép: +Thiết lập bảng thống kê mô tả trạng thái kiện E số thời điểm định trình theo dõi +Vẽ biểu đồ trực quan Kaplan-Meier Người sử dụng quy định việc phân chia mốc thời điểm Quy trình không bao gồm chức kiểm định, so sánh Tuy nhiên bảng mô tả lại quan trọng; biểu đồ trực quan chưa đủ, y văn biểu đồ Kaplan Meier kèm với bảng mô tả rút gọn gắn với trục hoành (như hình bên) 3 Quy trình phân tích kiện SPSS 3.2 Quy trình Kaplan-Meier Quy trình thứ để phân tích kiện mang tên KaplanMeier dựa phương pháp tác giả Quy trình kích hoạt từ giao diện SPSS hình bên Cấu trúc bên giống quy trình hồi quy logistic mà ta biết Quy trình Kaplan-Meier phép thống kê mô tả, nhiên cho phép làm nhiều công việc so với Life table, bao gồm: + Mô tả khái quát tần suất phát sinh kiện phân nhóm F=1 F=0 + Lập bảng Survival table mô tả tỉ lệ tích lũy trường hợp an toàn phân nhóm F (bảng chi tiết bảng Life table, tập trung xét yếu tố an toàn (E=0) nguy (E=1) + Thống kê mô tả biến số thời gian T, cho biết giá trị trung bình, trung vị thời gian trước xảy kiện E, cho thấy khác biệt T phân nhóm F=1 F=0 Không mô tả đơn thuần, quy trình Kaplan Meier thực so sánh thời gian T mean phân nhóm, phương pháp khác nhau: (1) Log-rank test Mantel-Cox (2) Phương pháp Breslow (3) Phương pháp Tarone-Ware Cho phép kết luận ý nghĩa thống kê khác biệt Tmean F=0 F=1 + Chức quan trọng quy trình Kaplan-Meier vẽ biểu đồ Kaplan-Meier cho phép khảo sát trực quan xác suất tích lũy trạng thái An toàn (Survival) Nguy (Hazard) theo thời gian Hình vẽ thiếu cho nghiên cứu theo dõi kiện + Quy trình cho phép lưu kết hàm Survival sai số chuẩn cho trường hợp Kết ích lợi muốn xác định khoảng tin cậy cho xác suất an toàn (phải tính thủ công) Ghi chú: Quy trình Kaplan Meier cho phép ta trả lời hầu hết câu hỏi nghiên cứu bản, nhiên tập trung mô tả so sánh dựa số liệu có sẵn chưa không cho phép dự báo cho quần thể tổng quát Để làm việc ta cần tiến hành thêm quy trình hồi quy Cox (xem trang tiếp theo) 3 Quy trình phân tích kiện SPSS 3.3 Mô hình Cox Mô hình COX Vấn đề phức tạp chút có thêm hay nhiều yếu tố phụ can thiệp vào quy luật phân phối xác suất tự nhiên kiện E theo thời gian Nhưng yếu tố lại giúp ta trả lời câu hỏi hấp dẫn nhiều VÍ dụ ta khảo sát tác động yếu tố nguy làm gia tăng xác suất xảy kiện E, yếu tố bảo vệ giúp kéo dài thời gian an toàn tránh khỏi kiện E Các yếu tố : + Yếu tố nguy » (F), ví dụ tình trạng nhiễm khuẩn xâm lấn đường hô hấp sơ sinh Đây biến định tính nhị phân + Hiệp biến số C (Covariate) yếu tố định lượng liên tục + Đặc tính hay điều kiện can thiệp X, biến định tính phân nhóm … E T F X C Nếu bạn đọc qua tài liệu hồi quy logistic cho biến nhị phân tác giả, nhận thấy toán mô hình hồi quy logistic Mục đích mô hình dự báo xác suất xảy kiện E mô hình với biến độc lập F,X,C Trong nghiên cứu theo dõi kiện, mô hình hồi quy logistic có tên mô hình Cox Trong tài liệu nói sơ lược thao tác SPSS để lập mô hình Cox diễn giải kết quả, cho trường hợp đơn giản gồm biến số độc lập (Nhiễm khuẩn hô hấp sơ sinh) Nếu bạn gặp trường hợp phức tạp với nhiều biến số, dành thời gian đọc lại tài liệu hồi quy logistic, mô hình Cox đơn giản hồi quy Logistic mà Kích hoạt quy trình hồi quy Cox giao diện SPSS Cấu trúc bên giống quy trình hồi quy logistic mà ta biết Quy trình hồi quy Cox SPSS cho phép: +Thiết lập mô hình hồi quy Cox nhằm dự báo xác suất phát sinh kiện E, với biến số thời gian (T) hay nhiều biến số độc lập khác (yếu tố định tính hay hiệp biến số) + Kiểm tra ý nghĩa thống kê yếu tố dự báo, tính tỉ số nguy (Odds-ratio) + Sao lưu kết dự báo cho trường hợp + Vẽ biểu đồ Kaplan Meier dựa vào giá trị dự báo + Lập bảng phân phối tần số cho xác suất nguy (Hazard) an toàn (Survival) tích lũy thời điểm Như quy trình hồi quy Cox xuất số kết giống quy trình Kaplan Meier, thực chúng không thay cho nhau, Cox mang ý nghĩa dự báo Kaplan Meier mang ý nghĩa mô tả - so sánh Ngoài trái ngược với K.M, quy trình Cox tập trung vào nguy (Hazard) Survival Quy trình Cox không bao gồm test Log-rank thống kê mô tả thời gian Kaplan Meier 3.4 Tóm tắt quy trình phân tích kiện SPSS Thời gian Thống kê mô tả Tần suất kiện So sánh phương pháp Log-rank Thiết lập mô hình hồi qui Cox Vẽ biểu đồ Kaplan Meier Đã xảy Chưa xảy Nguy Tổng quát cho phân nhóm Giữa phân nhóm Chứa biến số độc lập, hiệp biến số… Biểu diễn xác suất an toàn Nguy SPSS cho phép phân tích kiện theo thời gian thông qua quy trình: a) Life Table: giải bước cách ngắn gọn dạng bảng phần bước (so sánh phương pháp Wilcoxon (Gehan)) b) Kaplan Meier: Giải bước chi tiết tập trung vào xác suất an toàn (Survival), toàn bước (bằng kiểm định Log-rank có hay trọng số) bước c) Cox model: Giải bước bước tập trung vào xác suất nguy Thực chất quy trình hồi quy logistic ta biết Cả quy trình cho phép vẽ biểu đồ Kaplan-Meier theo dạng khác nhau: Dạng quy ước: khảo sát Xác suất an toàn tích lũy theo thời gian, dùng để khảo sát an toàn (E chưa xảy ra) Dạng Nguy cơ: Xác suất tích lũy xảy kiện E, dùng để khảo sát nguy Dạng logarit: Hàm survival dạng logarit theo thời gian Ưu điểm SPSS: + Phân tích sâu hiệu quả, kết hợp phương pháp so sánh khác + Thiết lập mô hình Cox theo nhiều quy trình tự động hay thủ công, chức lưu, Bootstrap Hạn chế SPSS: + Hình vẽ thô sơ, cần tốn nhiều công sức để chỉnh sửa + Không thể khoảng tin cậy biểu đồ (phải dùng syntax làm thủ công khó khăn) + Nhiều chức chồng lắp quy trình, tốn tài nguyên máy tính rối mắt phân tích kết Lời khuyên: + Hạn chế sử dụng thao tác thủ công, thay vào nên dùng Syntax để tiết kiệm thời gian tối đa, thực thủ công bước (Mô hình Cox) có nhiều biến số chỉnh sửa hình vẽ Tài liệu sử dụng Syntax cho phép thi hành tự động tất bước lúc Trong hoàn cảnh khẩn cấp bạn dùng Syntax Tạo bảng số liệu Ý nghĩa biến số Thời gian theo dõi E Biến định tính nhị phân kiện E nhận giá trị: E=0 kiện chưa xảy (vd: phát sinh viêm phổi) E=1 kiện có xảy F Biến định tính, nhị phân để yếu tố phân loại Ví dụ đây: F= tình trạng nhiễm khuẩn hô hấp giai đoạn sơ sinh F=0: chưa xảy ra, F=1: có xảy T Chỉ thời gian theo dõi; biến kiểu số, định lượng, liên tục Giá trị T tính từ thời điểm bắt đầu theo dõi kết thúc theo dõi T F Yếu tố điều kiện E Phát sinh kiện Có trường hợp : T1 1) Hết thời gian theo dõi, kiện E chưa xảy ra: T = Tmax, E=0 T2 T3 2) Bệnh nhân bị theo dõi, kiện E xem chưa xảy (Censored): T=T2, E=0 E T max A Nếu bạn muốn sử dụng gói syntax để phân tích tự động, tạo file liệu gồm biến số T, E, F với ý nghĩa Bạn không cần dán nhãn (label) syntax làm giúp bạn chuyện B Nếu bạn muốn làm thủ công, đặt tên biến, dán label tùy ý thích Sau bạn nhập số liệu… 5.2 Phân tích nội dung syntax Nội dung Syntax Giải thích * Mô hình Cox Khối lệnh thứ 4: BOOTSTRAP /SAMPLING METHOD=STRATIFIED(STRATA=F ) /VARIABLES INPUT=E T F /CRITERIA CILEVEL=95 CITYPE=BCA NSAMPLES=1000 /MISSING USERMISSING=EXCLUDE COXREG T /STATUS=E(1) /PATTERN BY F /CONTRAST (F)=Indicator(1) /METHOD=ENTER F /PRINT=CI(95) CORR BASELINE /CRITERIA=PIN(.05) POUT(.10) ITERATE(20) Tương ứng với mô hình hồi quy logistic Cox với Bootstrap nhằm dự báo xác suất xảy kiện E dựa vào hay nhiều yếu tố dự báo Tương ứng với quy trình Cox regression giao diện SPSS Trong thí dụ phân tích mô hình Cox trước mục tiêu nghiên cứu khảo sát mối liên hệ yếu tố F kiện E Nếu bạn cần phân tích kiện theo thời gian không cần làm mô hình Cox, cần vẽ biểu đồ Kaplan Meier đú Mô hình Cox (mô hình tỉ lệ nguy cơ) phương pháp hồi qui giáo sư Cox lập vào năm 1972, nhằm dự báo nguy phát sinh kiện thời điểm định, dựa liệu theo dõi quần thể, với giả định yếu tố dự báo (biến số độc lập) bất biến theo thời gian Khái niệm gần giống với mô hình hồi qui logistic mà ta biết Mô hình hồi qui Cox biểu diễn dạng hàm số xác suất tích lũy (cumulativesurvival function), hay: tỉ lệ trường hợp chưa phát sinh kiện tính đến thời điểm định Trên thực tế, mô hình Cox thường diễn giải khái niệm “xác suất nguy cơ” Để lập mô hình Cox, cần có: (1) Một biến số định tính nhị phân E trạng thái (có kiện),(2) biến số định lượng liên tục thời gian T để thời gian tính từ bắt đầu theo dõi kiện xảy ra, (3) Một hay nhiều yếu tố dự báo (hay gọi tham số, biến số độc lập, đồng biến số) tùy chọn Vì chất mô hình Cox hồi quy logistic phương pháp phức tạp, nên giới hạn tài liệu bàn hết tình khó khăn Thí dụ xét có biến độc lập F (Nhiễm khuẩn hô hấp sơ sinh), nên cấu trúc syntax bạn thấy Khi có nhiều biến hơn, bạn phải chọn lọc để có mô hình tối ưu phương pháp tiến triển hay thoái triển Xin đọc lại tài liệu hồi quy logistic để biết thêm chi tiết 5.2 Phân tích nội dung syntax Nội dung Syntax Giải thích Khối lệnh thứ 5: * Vẽ biểu đồ Kaplan-Meier so sánh phân nhóm Log-rank test KM T BY F /STATUS=E(1) /PRINT TABLE MEAN /PERCENTILES /PLOT SURVIVAL OMS HAZARD LOGSURV /TEST LOGRANK BRESLOW TARONE /COMPARE OVERALL POOLED Tương ứng với quy trình Kaplan Meierbằng giao diện SPSS Tương ứng với quy trình Kaplan Meier, cho phép thực hiện: + Mô tả hàm số xác suất tích lũy (An toàn, nguy cơ, log-survival) dạng bảng + Vẽ biểu đồ Kaplan Meier hình thức trực quan cho hàm số nói + Thực test Log-rank, Breslow Tarone để so sánh phân nhóm : F=0 F=1 Trong thí dụ thực kaplan Meier cho phân nhóm (BY F) mục tiêu nghiên cứu khảo sát mối liên hệ yếu tố F kiện E Nếu bạn cần phân tích kiện theo thời gian cần vẽ biểu đồ Kaplan Meiercho T đú Hàm Survival 1- Survival Log (Survival) Hàm nguy (Hazard) 5.2 Phân tích nội dung syntax Nội dung Syntax Giải thích Khối lệnh thứ 6: *6 Vẽ biểu đồ Kaplan-Meier kèm khoảng tin cậy 95% km T /status=E(1) /print = none /save survival(S) SE(S_SE) compute VAR = S_SE**2/(S**2*(ln(S))**2) compute CL =ln(-ln(S)) - 1.96*sqrt(VAR) compute CU =ln(-ln(S)) + 1.96*sqrt(VAR) compute SL = exp(-exp(CU)) compute SU = exp(-exp(CL)) VARIABLE LABELS S "Xác suất kiện không xảy ra" EXECUTE GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=T S SL SU MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE BEGIN GPL SOURCE: s=userSource(id("graphdataset")) DATA: T=col(source(s), name("T")) DATA: S=col(source(s), name("S")) DATA: SL=col(source(s), name("SL")) DATA: SU=col(source(s), name("SU")) GUIDE: axis(dim(1), label("Thời gian khảo sát")) GUIDE: axis(dim(2), label("Xác suất kiện không xảy ra")) TRANS: T_S=eval("Xác suất ước tính") TRANS: T_SL=eval("Ngưỡng dưới") TRANS: T_SU=eval("Ngưỡng trên") ELEMENT: point(position(T*S), color.exterior(T_S)) ELEMENT: point(position(T*SL), color.exterior(T_SL)) ELEMENT: point(position(T*SU), color.exterior(T_SU)) END GPL DELETE VARIABLES S S_SE VAR CL CU SL SU Phần không bắt buộc, tác giả tạo thêm để vẽ biểu đồ Kaplan Meier kèm theo khoảng tin cậy 95% hàm xác suất, chức không hỗ trợ quy trình KM mặc định SPSS Đầu tiên ta chạy lại quy trình Kaplan Meier với biến số thời gian T, chạy « ngầm » không xuất kết Mục đích gán giá trị hàm xác suất an toàn tích lũy (Survival) cho biến S, kèm theo sai số chuẩn SE Từ ta tính: SL = ngưỡng SU = Ngưỡng hàm Survival Sau ta sử dụng lệnh GGRAPH để vẽ biểu đồ Kaplan Meier cho lúc hàm số: S, SL SU Có thể bạn ngạc nhiên thấy kết xuất không giống biểu đồ Kaplan Meier thống, xin bạn yên tâm, chất biểu đồ Kaplan Meier biểu đồ điểm phân tán (scatter plot), chẳng qua người ta sử dụng hình thức kết nối bậc thang (Step interpolation line) từ điểm sang điểm khác mà Các bạn làm việc dễ dàng Chart Editor SPSS 5.2 Phân tích nội dung syntax Nội dung Syntax * Vẽ biểu đồ Kaplan-Meier có CI95% cho phân nhóm COMPUTE filter_$=(F=1) VARIABLE LABELS filter_$ 'Viemphoi=0 (FILTER)' VALUE LABELS filter_$ 'Not Selected' 'Selected' FORMATS filter_$ (f1.0) FILTER BY filter_$ EXECUTE Giải thích Khối lệnh thứ 7: Tương tự với phần trước, phần nhằm mục đích vẽ biểu đồ Kaplan Meier cho phân nhóm riêng biệt F=0 F=1, kèm theo CI95% km T /status=E(1) /print = none /save survival(S1) SE(S_SE1) compute VAR1 = S_SE1**2/(S1**2*(ln(S1))**2) compute CL1 =ln(-ln(S1)) - 1.96*sqrt(VAR1) compute CU1 =ln(-ln(S1)) + 1.96*sqrt(VAR1) compute SL1 = exp(-exp(CU1)) compute SU1 = exp(-exp(CL1)) EXECUTE Để làm việc ta dùng lệnh Filter để chọn riêng trường hợp có F=1 F=0 COMPUTE filter_$=(F=0) VARIABLE LABELS filter_$ 'Viemphoi=0 (FILTER)' VALUE LABELS filter_$ 'Not Selected' 'Selected' FORMATS filter_$ (f1.0) FILTER BY filter_$ EXECUTE Cuối ta vẽ biểu đồ Scatter plot cho hàm số, phân nhóm gồm hàm: S, SL SU km T /status=E(1) /print = none /save survival(S0) SE(S_SE0) compute VAR0 = S_SE0**2/(S0**2*(ln(S0))**2) compute CL0 =ln(-ln(S0)) - 1.96*sqrt(VAR0) compute CU0 =ln(-ln(S0)) + 1.96*sqrt(VAR0) compute SL0 = exp(-exp(CU0)) compute SU0 = exp(-exp(CL0)) EXECUTE DELETE VARIABLES filter_$ GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=T S1 SL1 SU1 S0 SL0 SU0 MISSING=VARIABLEWISE REPORTMISSING=YES /GRAPHSPEC SOURCE=INLINE BEGIN GPL SOURCE: s=userSource(id("graphdataset")) DATA: T=col(source(s), name("T")) DATA: S1=col(source(s), name("S1")) DATA: SL1=col(source(s), name("SL1")) DATA: SU1=col(source(s), name("SU1")) DATA: S0=col(source(s), name("S0")) DATA: SL0=col(source(s), name("SL0")) DATA: SU0=col(source(s), name("SU0")) GUIDE: axis(dim(1), label("Thời gian khảo sát")) GUIDE: axis(dim(2), label("Survival function")) SCALE: cat(aesthetic(aesthetic.color.exterior), aestheticMissing(color.black)) TRANS: T_S1=eval("Xác suất nhóm có nguy cơ") TRANS: T_SL1=eval("Ngưỡng nhóm có nguy cơ") TRANS: T_SU1=eval("Ngưỡng nhóm có nguy cơ") TRANS: T_S0=eval("Xác suất nhóm chứng") TRANS: T_SL0=eval("Ngưỡng nhóm chứng") TRANS: T_SU0=eval("Ngưỡng nhóm chứng") ELEMENT: point(position(T*SL1), color.exterior(T_SL1)) ELEMENT: point(position(T*S1), color.exterior(T_S1)) ELEMENT: point(position(T*SU1), color.exterior(T_SU1)) ELEMENT: point(position(T*SL0), color.exterior(T_SL0)) ELEMENT: point(position(T*S0), color.exterior(T_S0)) ELEMENT: point(position(T*SU0), color.exterior(T_SU0)) END GPL DELETE VARIABLES S1 S_SE1 VAR1 CL1 CU1 SL1 SU1 DELETE VARIABLES S0 S_SE0 VAR0 CL0 CU0 SL0 SU0 Sau ứng với trường hợp ta lặp lại quy trình Kaplan Meier, lưu biến số ảo để tính ngưỡng hàm Survival Diễn giải kết 6.1 Bảng phân phối tần suất kiện a b c d e f g h i j k l a Mốc thời gian : Ở tác giả chia thời gian Tmax=36 khoảng = tháng b Số trường hợp (bệnh nhi) vòng theo dõi thời điểm xét (các trường hợp xảy kiện theo dõi) bị trừ bớt c Số trường hợp bị theo dõi khoảng thời gian xét Vào thời điểm Tmax= tháng 36, trường hợp chưa khởi phát kiện xem theo dõi d Số trường hợp vòng « nguy » (chưa xảy viêm phổi) số lại sau trừ cho trường hợp xảy kiện: (d= b-e) e Số trường hợp xảy kiện (khởi phát viêm phổi ) f Tỉ lệ xảy kiện: f= e/b g Tỉ lệ an toàn hay chưa xảy kiện: g= d/b h Tỉ lệ an toàn tích lũy thời điểm xét i Sai số chuẩn (h) j Mật độ xác suất k Sai số chuẩn (j) l Tỉ lệ nguy m Sai số (l) b d e Những giá trị cần thiết để lập bảng mô tả phía biểu đồ KaplanMeier m Diễn giải kết 6.2 Mô tả thời gian Có phát sinh kiện Chưa phát sinh kiện Bảng Case Processing Summary trình bày thống kê mô tả khái quát tần suất kiện xảy phân nhóm F=0 F=1 (không có có nhiễm khuẩn hô hấp sơ sinh) Bảng cho phép so sánh tần suất phát sinh kiện (Event = khởi phát bệnh viêm phổi) phân nhóm : có nhiễm khuẩn hô hấp Bảng chia thành cột : N of Events = tần suất xảy kiện (khởi phát viêm phổi) Censored (N %) = số lượng tỉ lệ trường hợp chưa xảy kiện Theo bảng kết này, nhóm có nhiễm khuẩn hô hấp có nguy khởi phát viêm phổi cao (45 sv 38 kiện), trái lại nhóm nhiễm khuẩn có may lớn thoát khỏi kiện viêm phổi (55.3% sv 25%) Nếu dựa vào bảng mô tả khái quát này, ta hình dung khuynh hướng kiện, bệnh viêm phổi có liên quan tới đặc tính nhiễm khuẩn hô hấp Means and Medians for Survival Time Meana Median 95% Confidence Interval 95% Confidence Interval Yếu tố điều kiện Estimate Std Error Lower Bound Upper Bound Estimate Std Error Lower Bound Upper Bound Không 31,329 ,754 29,851 32,808 Có 27,233 1,267 24,751 29,716 30,000 1,936 26,204 33,796 Overall 29,634 ,706 28,251 31,018 33,000 1,338 30,378 35,622 a Estimation is limited to the largest survival time if it is censored Bảng Means and Medians for Survival time khảo sát biến số thời gian phân nhóm F=0 F=1 (không có nhiễm khuẩn hô hấp) Ta ý: khoảng tin cậy 95% T hàng (Không Có) Nếu CI95% nhóm không có hoàn toàn tách biệt, ta khẳng định có khác biệt giá trị T phân nhóm Kết cho phép ta kết luận theo trực giác yếu tố nhiễm khuẩn hô hấp (F=1) thúc đẩy kiện viêm phổi khởi phát SỚM (27,3 tuần so với 31,3 tuần) Tuy nhiên kết không cho phép kết luận xác suất xảy kiện (hay chưa xảy ra) thời điểm định Diễn giải kết 6.3 So sánh Log-rank test Overall Comparisons Chi-Square df Sig Log Rank (Mantel-Cox) 12,793 ,000 Breslow (Generalized Wilcoxon) 11,182 ,001 Tarone-Ware 11,950 ,001 Test of equality of survival distributions for the different levels of Yếu tố điều kiện Bảng so sánh tổng quát (Overall Comparisons) trình bày kết kiểm định “tổng quát” (omnibus test), nhằm kiểm tra giả thuyết có tương đồng Thời gian trước kiện xảy (survival time) phân nhóm Hay nói cách khác, chúng cho phép kiểm tra liệu kiện E có thực xảy sớm phân nhóm F=1 hay không ? Phủ nhận giả thuyết đồng nghĩa với việc khẳng định có khác biệt ý nghĩa thời gian trước kiện (hay thời gian « an toàn ») Ghi chú: Kiểm định Log-rank dùng để so sánh hàm xác suất tích lũy Đây biện pháp phi tham số, cho phép kiểm tra giả thuyết phân nhóm có xác suất tích lũy S(t) Test Log-rank ước tính số χ2 χ2 = (𝐸 − 𝐸′) 𝑉 Với E tổng số trường hợp phát sinh kiện phân nhóm (ví dụ phân nhóm 1), E’ giá trị ước tính E với giả định phân nhóm có xác suất nguy Nếu χ2 > χ2 1,α ta kết luận có khác biệt ý nghĩa xác suất mắc bệnh phân nhóm Test Log Rank (của Mantel–Cox) đặt trọng số cho thời điểm Phương pháp Breslow (Wilcoxon tổng quát) đặt trọng số cho thời điểm số trường hợp có nguy (đang theo dõi, kiện chưa xảy ra) tương ứng Kiểm định Tarone–Ware đặt trọng số cho thời điểm bậc số trường hợp vòng nguy (chưa khởi phát kiện) tương ứng Trong trường hợp có mâu thuẫn kết phương pháp ta nên chọn báo cáo kết kiểm định Log-rank, phương pháp mạnh đa số trường hợp Tuy nhiên, phương pháp có kết tương đồng : giá trị p < 0.05 ; ta kết luận : Có khác biệt ý nghĩa khoảng thời gian trước khởi phát viêm phổi phân nhóm Hoặc rõ ràng : bệnh viêm phổi khởi phát sớm cách có ý nghĩa thống kê em bé có tượng nhiễm khuẩn xâm lấn ường hô hấp thời điểm, so với em không bị nhiễm trùng hô hấp Diễn giải kết 6.4 Biểu đồ Kaplan-Meier Đây biểu đồ Kaplan-Meier, cách trình bày trực quan kết phân tích kiện, trục hoành biểu thị cho thời gian tính tháng trước phát sinh kiện (bệnh viêm phổi) Trục tung biểu diễn xác suất tích lũy trạng thái « không xảy kiện » (hay an toàn), xác suất giảm dần theo thời gian (cho thấy nguy tăng dần cho thời điểm), đường cong tương ứng phân nhóm (màu xanh lam lục) Đây biểu đồ Xác suất xảy kiện, biến thể (đối xứng gương) biểu đồ Kaplan-Meier kinh điển Biểu đồ thường sử dụng để nhấn mạnh khái niệm nguy « an toàn», thường biến chứng hay bệnh lý Biểu đồ Kaplan Meier kinh điển trái lại trọng khái niệm « sống sót » nên thường sử dụng cho nghiên cứu mà kiện tử vong Tuy khác hình thức, biểu đồ dẫn đến kết luận, bệnh viêm phổi khởi phát sớm phân nhóm có nhiễm khuẩn hô hấp sơ sinh so với nhóm không nhiễm khuẩn Chú ý: Cả quy trình Kaplan Meier Cox-regression cho phép vẽ biểu đồ Kaplan Meier, kết cần báo cáo, nhiên cách trình bày trực quan, cho phép nhìn thấy khác biệt phân nhóm, chưa cho phép mô tả xác tuyệt đối ảnh hưởng yếu tố F lên việc phát sinh kiện E Câu hỏi giải đáp thông qua mô hình Cox Vì kết cuối phải bao gồm biểu đồ (trực quan) mô hình Cox (Định lượng) Diễn giải kết 6.5 Mô hình Cox Case Processing Summary Unweighted Weightedb N Percent N Percent Cases available in Eventa 83 57,2% 83 57,2% analysis Censored 62 42,8% 62 42,8% Total 145 100,0% 145 100,0% 0,0% 0,0% 0,0% 0,0% 145 100,0% Cases dropped Cases with missing values Cases with negative time Censored cases before the earliest event in a stratum Total Total a Dependent Variable: Thời gian khảo sát b Weighted by: $bootstrap_weight Yếu tố điều Frequency (1) 0=Không 97325 1=Có 68700 a Category variable: Yếu tố điều kiện (F) Số trường hợp tỉ lệ % Chưa phát sinh kiện (an toàn) Số trường hợp tỉ lệ % Dữ liệu thiếu sót sai Bảng Case Processing Summary tóm tắt thông tin chung quần thể khảo sát tổng kết kiện : Cho biết số trường hợp có phát sinh kiện (khởi phát viêm phổi), số trường hợp an toàn (censored) tính đến hết thời gian theo dõi, trường hợp liệu bị thiếu sai Giá trị F=1 chọn để phân tích tương phản Categorical Variable Codingsa kiệnb Số trường hợp tỉ lệ % Đã phát sinh kiện Qui tắc mã hóa (bắt cặp giá trị F số tương phản) Indicator = tương đương F=1 (nhóm nguy cơ) Indicator = tương đương F=0 (nhóm chứng) b Indicator Parameter Coding Bảng Categorical Variable Codings cho biết qui tắc mã hóa biến số yếu tố dự báo (F) mô tả tần suất loại giá trị, bảng cho phép kiểm tra lại lần cuối cấu hình tương phản (first/last) mà ta chọn, đây: đặc tính tương phản cần khảo sát (so với đặc tính chuẩn) mang giá trị (có nhiễm khuẩn hô hấp), giá trị F=0 (không nhiễm khuẩn) có vai trò nhóm chứng Diễn giải kết 6.5 Mô hình Cox B0 Block 0: Omnibus Tests of Model Coefficients -2 Log Likelihood 768,706 Block 1: B1 Omnibus Tests of Model Coefficientsa -2 Log Likelihood 756,928 Overall (score) Change From Previous Step Change From Previous Block Chi-square df Sig Chi-square df Sig Chi-square df Sig 12,377 ,000 11,779 ,001 11,779 ,001 a Beginning Block Number Method = Enter Block 0: Beginning Block : Khối mô hình khảo sát điều kiện chưa có biến số dự báo đưa vào mô hình (mô hình tối giản, chứa số) Block 1: Bắt đầu đưa biến số dự báo (F) vào mô hình, có biến số nên Method = Enter (cưỡng bức) Khi có nhiều biến số dự báo, bạn nên chọn phương pháp tự động = Backward (thoái triển) làm thủ công qua nhiều Block, bạn thấy Block 2,3,4… Ở Block, SPSS trình bày giá trị kiểm định tổng quát cho tỉ số -2LL bảng (Omnibus Tests of Model Coefficients), bao gồm giá trị -2LL mô hình thay đổi so với mô hình cũ (−2 Log Likelihood = tỉ số logarit : Xem tài liệu mô hình hồi quy Logistic để hiểu ý nghĩa tỉ số này), đơn giản tiêu chuẩn để đánh giá mức độ phù hợp liệu mô hình so sánh mô hình cũ (giữa Block) với -2LL có chất giống “sum of square” phân tích ANOVA Khi đưa biến số dự báo (đồng thời, hay tuần tự) vào mô hình giá trị hệ số giảm dần Trong thí dụ này: Block (mô hình có chứa F) có -2LL = 756,9 nhỏ 768,7 Sự khác biệt có ý nghĩa thống kê (p[...]...5 Sử dụng Syntax Giới thiệu Khác với những tài liệu trước đ y, lần n y các bạn sẽ không được chỉ dẫn sử dụng thao tác thủ công trên SPSS, nhưng được (hay bị) sử dụng Syntax (lập trình cú pháp lệnh) trong toàn bộ 3 quy trình : Life table, Kaplan-Meier và hồi quy Cox Ưu điểm của Syntax: - Cho phép thi hành tự động nhiều quy trình liên tiếp cùng một lúc Chỉ cần nhấn... lệnh trong SPSS, bạn chỉ có thể sử dụng bộ syntax với điều kiện thiết kế nghiên cứu của bạn đang làm phải giống y hệt như thí dụ trong tài liệu n y (Chỉ bao gồm 3 biến số T,E,F) Tác giả đã cố gắng khái quát hóa tối đa khi viết syntax để nó có thể áp dụng cho hầu hết trường hợp tổng quát, chỉ cần bạn đặt tên biến đúng và nhập giá trị đúng Dĩ nhiên bạn cũng có thể tận dụng bộ Syntax để tự học về cú pháp... không x y ra sự kiện » (hay an toàn), xác suất n y giảm dần theo thời gian (cho th y nguy cơ tăng dần cho từng thời điểm), 2 đường cong tương ứng 2 phân nhóm (màu xanh lam và lục) Đ y là biểu đồ Xác suất x y ra sự kiện, một biến thể (đối xứng gương) của biểu đồ Kaplan-Meier kinh điển Biểu đồ n y thường sử dụng để nhấn mạnh về khái niệm nguy cơ hơn là « an toàn», thường là một biến chứng hay bệnh lý... kiện x y ra, và (3) Một hay nhiều y u tố dự báo (hay còn gọi là tham số, biến số độc lập, đồng biến số) t y chọn Vì bản chất của mô hình Cox là hồi quy logistic và đ y là phương pháp phức tạp, nên trong giới hạn của tài liệu n y không thể bàn hết về những tình huống khó khăn của nó Thí dụ chúng ta đang xét chỉ có 1 biến độc lập là F (Nhiễm khuẩn hô hấp sơ sinh), nên cấu trúc syntax như bạn đã th y Khi... table bằng giao diện SPSS T BY F (0 1) : thực hiện quy trình cho 2 phân nhóm riêng biệt (F= y u tố có nhiễm trùng hô hấp) Nếu bạn chỉ muốn phân tích cho quần thể chung và không xét đến phân nhóm, chỉ cần bỏ phần sau : BY F(0 1) Bạn cũng có thể thay F bằng 1 biến số chỉ y u tố khác t y ý /INTERVAL=THRU 36 BY 6 Dòng lệnh n y quy định cách chia các mốc thời gian Trong thí dụ n y, tác giả chia Tmax = 36 tháng... nặng,…) Exp(B) gần với 1.0 nghĩa là y u tố dự báo vô nghĩa (không có/hoặc ít có vai trò trong mô hình dự báo), có hiện diện X vẫn không làm thay đổi xác suất x y ra sự kiện Y) Exp(B) > 1 tức là y u tố X làm tăng xác suất phát sinh sự kiện (vai trò nguy cơ), Exp(B) càng lớn thì nguy cơ càng cao, vai trò ảnh hưởng của y u tố càng mạnh Exp(B) < 1 cho th y yếu tố X làm giảm nguy cơ phát sinh sự kiện (vai trò... dài 6 tháng Như v y bảng phân phối sẽ có 6 hàng tương ứng với thời điểm tháng thứ 6,12,18,24,30,36 Trong nghiên cứu của riêng bạn, bạn cần thay đổi 2 giá trị n y trước khi ch y syntax Ví dụ thời gian theo dõi = 12 tháng, và bạn muốn làm thống kê cho mỗi tháng, lệnh trên sẽ được đổi thảnh: /INTERVAL=THRU 12 BY 1 /STATUS=E(1) Dòng lệnh n y quy định giá trị của trạng thái « sự kiện E có x y ra »: E=1 /PRINT=TABLE... logistic mà ta đã biết, trong đó : xác suất nguy cơ phát sinh sự kiện được biểu diễn bằng : 𝐻 𝑡 = 𝐵𝑜 𝑡 𝐸𝑥𝑝(𝐵1 𝑥1 + 𝐵2 𝑥2 + ⋯ 𝐵𝑖𝑋𝑖) H(t) là hàm số nguy cơ ước tính xác suất x y ra sự kiện, 𝐵0 𝑡 là một hàm số nguy cơ cơ bản (hằng số của mô hình khi nó không bao gồm bất cứ y u tố nguy cơ x nào, x là biến dự báo hay y u tố nguy cơ Trong thí dụ đơn giản n y chỉ có 1 biến số X=F (nhiễm trùng hô hấp) Kết... lệnh và công dụng của từng lệnh, tác giả đã đóng gói và dán nhãn cho từng quy trình riêng biệt Sau khi thi hành tự động, bạn chuyển qua chương 6 để biết cách diễn giải kết quả 5 1 5.1 Cách ch y Syntax Tải file syntax có tên « Kaplan Meier syntax.SPS » từ Google drive của tác giả về m y của bạn https://drive.google.com/file/d/0B1vaOU1uB8DPbU9kT1EtRjlzdGc/view?usp=sharing 2 Tạo bảng số liệu với cấu... trong vòng « nguy cơ » (chưa x y ra viêm phổi) là số còn lại sau khi trừ cho những trường hợp đã x y ra sự kiện: (d= b-e) e Số trường hợp đã x y ra sự kiện (khởi phát viêm phổi ) f Tỉ lệ đã x y ra sự kiện: f= e/b g Tỉ lệ an toàn hay chưa x y ra sự kiện: g= d/b h Tỉ lệ an toàn tích l y tại thời điểm đang xét i Sai số chuẩn của (h) j Mật độ xác suất k Sai số chuẩn của (j) l Tỉ lệ nguy cơ m Sai số của ... tích lũy cho biết xác su t cá thể ĐÃ phát sinh kiện thời điểm t + Hàm Survival cho biết xác su t « không xảy kiện » thời điểm t + Hàm Nguy hàm Nguy tích lũy cho biết xác su t phát sinh biến cố... 5.2 Phân tích nội dung syntax Nội dung Syntax Giải thích * Bảng tần su t kiện (Survival table) Khối lệnh thứ : Survival table SURVIVAL TABLE=T BY F(0 1) /INTERVAL=THRU 36 BY /STATUS=E(1) /PRINT=TABLE... name("SL")) DATA: SU= col(source(s), name( "SU" )) GUIDE: axis(dim(1), label("Thời gian khảo sát")) GUIDE: axis(dim(2), label("Xác su t kiện không xảy ra")) TRANS: T_S=eval("Xác su t ước tính") TRANS:

Ngày đăng: 22/03/2016, 22:37

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan