Bài giảng hồi quy logistic

10 386 0
Bài giảng hồi quy logistic

Đang tải... (xem toàn văn)

Thông tin tài liệu

BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Mục tiêu • Dịch tễ Thống kê Nâng cao • Hồi quy logistics • Lê Thị Kim Ánh BM Dịch tễ-Thống kê 3/5/2012 • Trình bày nguyên lý hồi quy logistic Trình bày bước xây dựng mô hình hồi quy logistic Kiểm soát vấn đề thực hồi quy logistic Thực phân tích SPSS phiên giải kết 3/5/2012 Ví dụ Nguyên lý hồi quy logistics 3/5/2012 3/5/2012 Ví dụ (tt) Ví dụ Tuyến tính? Tuyến tính? 3/5/2012 3/5/2012 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Hồi quy logistics Vấn đề • Giá trị trục tung – y: từ đến • Giá trị ước lượng theo hồi quy tuyến tính nằm giá trị ý nghĩa • Sai số phân phối chuẩn • Hồi quy logistic sử dụng biến phụ thuộc biến nhị giá – Được đo lường bằng: • Nguy (risk), • Số chênh (odds), • Tỷ số số chênh (odds ratio) – Các đo lường có miền xác định: risk(0,1), Odds(0,+α) • Khi đó, mô hình y = a + bx – với miền xác định y (-α; +α) không thích hợp để sử dụng 3/5/2012 Hồi quy logistics (tt) Hồi quy logistics (tt) Tình trạng bệnh • Vấn đề: biến đổi đo lường biến phụ thuộc để có miền xác định (-α; +α) • Sử dụng thuật toán logit – Logit = ln(θ/1- θ) – Như vậy: miền xác định logit (-α; +α) 3/5/2012 3/5/2012 Bệnh phong Không có bệnh phong Tổng Có chủng ngừa Tổng a Không chủng ngừa b c d c+d a+c b+d N a+b Theo lý thuyết, Odds tính sau : Odds nhóm bệnh = tỷ lệ có chủng ngừa nhóm bệnh/tỷ lệ không chủng ngừa nhóm bệnh = (a/a+b)/(b/a+b) = 3/5/2012 p/(1-p) 10 Hồi quy logistics (tt) Hồi quy logistics (tt) • Như vậy: • Sử dụng thuật toán logit – Logit = ln(θ/1- θ) • Odds x = là: • Như vậy: • Odds x = là: – Logit = ln(Odds) = ln[p/(1 - p)] = a + bx  Tính toán OR • Vậy OR tính: 3/5/2012 11 3/5/2012 12 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Như • Hồi quy logistics: – Dùng cho biến phụ thuộc biến nhị giá – Giúp xác định: Hồi quy logistics SPSS Biến độc lập biến nhị giá • Số chênh • Tỷ số số chênh • Tỷ lệ hiệu chỉnh 3/5/2012 13 3/5/2012 Tính tỷ số số chênh OR 14 Kết hồi quy logistics • Đo lường mức độ tác động chủng ngừa BCG bệnh phong • Kết 1: Omnibus Test of Model Coefficients – Giả thuyết Ho: việc đưa biến độc lập vào mô hình ý nghĩa – Đối thuyết Ha: việc đưa biến độc lập vào mô hình có ý nghĩa – Bảng 2x2 – Hồi quy logistics • Đơn biến: biến độc lập • Kết phần Block Omnibus Tests of Model Coefficients Step 3/5/2012 15 Step Block Model Chi-square 84.352 84.352 84.352 df 1 Sig .000 000 000 3/5/2012 Kết hồi quy logistics (tt) 16 Phiên giải nào? Variables in the Equation Step a bcg Constant B -1.490 -.933 S.E .180 081 Wald 68.221 131.286 df 1 Sig .000 000 Exp(B) 225 393 95.0% C.I.for EXP(B) Lower Upper 158 321 a Variable(s) entered on step 1: bcg • ln(odds) = - 0.933 – 1.49 x chủng ngừa BCG • Như • OR=0.089/0.393 = 0.225 • Người tiêm chủng BCG có nguy mắc bệnh phong vào khoảng 22,5% so với người không tiêm BCG ln(Odds) = 0.933 – 1.49 x = - 0.933  Odds=0.393 ln(Odds) = 0.933 – 1.49 x = - 2.423  Odds=0.089 Hiểu nào? 3/5/2012 17 3/5/2012 18 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Phiên giải • Suy luận tỷ lệ từ giá trị Odds tính – Odds = 0.393  p = 0.393/1.393 = 0.282  mô hình giúp tiên đoán: 28.2% người không chủng ngừa BCG mắc bệnh phong – Odds = 0.089  p = 0.089/1.089 = 0.082  mô hình giúp tiên đoán: 8.2% người có chủng ngừa BCG mắc bệnh phong 3/5/2012 19 Hồi quy logistics SPSS Biến độc lập biến thứ bậc 3/5/2012 Tính tỷ số số chênh (1) 20 Tính tỷ số số chênh (1) • Đo lường mối liên quan bệnh phong tuổi • Giả định tính khuynh hướng tuổi: khác biệt lớp tuổi kế cận giống nhau: • Mô hình: y = logit = ln(Odds) = ln[p/(1 - p)] = α + βx + ε • Khi – OR nhóm tuổi 15-24 so với nhóm 1-14 là: • OR = Oddsx=1/Oddsx=0 = eα + β/eα = eβ – OR nhóm tuổi 25-24 so với 15-24 là: • OR = Oddsx=2/Oddsx=1 = eα + 2β/eα + β = eβ 3/5/2012 21 3/5/2012 Phiên giải kết 22 Phiên giải kết (tt) Variables in the Equation Step a nhtuoi Constant B 380 -2.669 S.E .049 194 Wald 59.253 189.407 df 1 Sig .000 000 Exp(B) 1.463 069 95.0% C.I.for EXP(B) Lower Upper 1.328 1.612 a Variable(s) entered on step 1: nhtuoi • So với nhóm tuổi nhỏ hơn, nhóm tuổi lớn kề bên bị nguy bị bệnh phong tăng gấp 1.463 lần e0.76 = 2.138 3/5/2012 23 3/5/2012 24 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Kết Tính tỷ số số chênh (2) Variables in the Equation • Đo lường mối liên quan bệnh phong tuổi • Không giả định tính khuynh hướng tuổi: B Step a y = logit = ln(Odds) = ln[p/(1 - p)] = α + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + ε 271 308 251 217 187 df 1 1 Sig .000 407 737 000 000 000 Exp(B) 1.252 1.109 2.723 4.073 120 95.0% C.I.for EXP(B) Lower Upper 736 607 1.664 2.663 2.128 2.026 4.458 6.230 • OR nhóm tuổi 15/24 nhóm tuổi 24/34 ý nghĩa thống kê (hay hệ số hồi quy B nhóm ý nghĩa) • Biến giả (dummy variables): chọn indicator để define categorical covariates 25 3/5/2012 26 Tương tự biến thứ bậc Hồi quy logistics SPSS Biến độc lập biến danh định 3/5/2012 224 103 1.002 1.404 -2.122 Wald 66.632 687 112 15.877 41.971 128.612 a Variable(s) entered on step 1: nhtuoi – x=0 (không nằm nhóm tuổi x) – x=1 (nằm nhóm tuổi x) 3/5/2012 nhtuoi nhtuoi(1) nhtuoi(2) nhtuoi(3) nhtuoi(4) Constant S.E Không có giả định tính khuynh hướng 27 3/5/2012 28 Kết Variables in the Equation Step a Hồi quy logistics SPSS Biến độc lập biến định lượng cholesterol Constant B 007 -3.538 S.E .003 687 Wald 5.225 26.531 df 1 Sig .022 000 Exp(B) 1.007 029 95.0% C.I.for EXP(B) Lower Upper 1.001 1.013 a Variable(s) entered on step 1: cholesterol • Với mg% cholesterol cao hơn, nguy bệnh mạch vành tăng lên 1.007 lần  ??? • OR người có cholesterol 210 so với 200 nào? – Odd210 = e- 3.538 + 0.007x210 – Odd200 = e- 3.538 + 0.007x200 • OR = e0.007(210-200) = exp(0.07)=1.072 3/5/2012 29 3/5/2012 30 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Mô hình • Biến phụ thuộc: bệnh phong • Biến độc lập: chủng ngừa BCG Hồi quy logistics đa biến Nhiều biến độc lập mô hình 3/5/2012 31 3/5/2012 Biến thứ Xem xét • Tuổi có phải yếu tố gây nhiễu/tương tác hay không? – Phân tầng – Hồi quy logistics 3/5/2012 33 • • • • • Thay đổi hệ số hồi quy Thay đổi OR hiệu chỉnh OR thô Thay đổi -2loglikelihood Giá trị p biến thứ Kết kiểm định Hosmer-Lemeshow 3/5/2012 Xem xét (tt) 34 Xem xét (tt) • Thay đổi hệ số hồi quy (B) • Thay đổi OR hiệu chỉnh OR thô: – B mô hình 1: -1.49 – B mô hình 2: -1.194 – Tỷ số hệ số hồi quy: 1.194/1.49 = 0.80 (thay đổi nhiều) – “Nhiều”? Thay đổi >1% 3/5/2012 32 – OR thô (crude): 0.225 – OR hiệu chỉnh: 0.303 – Thay đổi: – (0.303-0.225)/0.303= 0.257 – Thay đổi >10% 35 3/5/2012 36 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Xem xét (tt) Xem xét (tt) • -2loglikelihood • Giá trị p biến thứ 3: – Mô hình cũ: 1176.663 – Mô hình mới: 1152.028 – Thay đổi 1176.663-1152.028=24.635 – Thay đổi df = 2-1=1 – Χ2(24.635,1) 3/5/2012 – p=0.000 (p 0.05  Mô hình phù hợp 3/5/2012 39 Giới có phải nhiễu/tương tác? 3/5/2012 40 Đưa biến tương tác vào mô hình • Lưu ý: – Phải có biến gốc • Nếu không biến nhiễu, có phải tương tác không? 3/5/2012 41 3/5/2012 42 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Kết Học vấn nhiễu/tương tác? • Xem xét giá trị p tương tác 3/5/2012 43 3/5/2012 Học vấn nhiễu/tương tác? 3/5/2012 44 Tiếp xúc phong u, phong củ 45 3/5/2012 46 Mô hình đa biến logit = ln(p/1-p) = α + β1x1 + β2x2 + β3x3 + … + ε • x1, x2, …, xn biến độc lập Đưa nhiều biến vào mô hình Variables in the Equation Step a bcg nhtuoi Constant B -1.194 245 -1.849 S.E .191 051 214 Wald 38.913 23.166 74.487 df 1 Sig .000 000 000 Exp(B) 303 1.278 157 95.0% C.I.for EXP(B) Lower Upper 208 441 1.157 1.412 a Variable(s) entered on step 1: bcg, nhtuoi logit = ln(Odds) = - 1.849 – 1.194 x chủng ngừa BCG + 0.245 x nhóm tuổi 3/5/2012 47 3/5/2012 48 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Đưa biến số vào mô hình Đưa biến số vào mô hình (tt) • Enter: Kết cho mô hình bao gồm tất biến lựa chọn • Forward: đưa dần biến độc lập vào mô hình giữ chúng lại biến có ý nghĩa thống kê 3/5/2012 49 • Backward: đưa toàn biến độc lập vào mô hình sau bỏ dần biến ý nghĩa thống kê • Stepwise: kết hợp phương pháp forward backward, bước phương pháp tính toán để đưa vào loại biến độc lập sau có xuất biến khác 3/5/2012 Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ 3/5/2012 51 Kết 3/5/2012 Mô hình: tuổi, học vấn, tiếp xúc phong u, phong củ 3/5/2012 53 50 52 Kết 3/5/2012 54 BM Thống kê Y tế - Trường ĐH Y tế Công Cộng Có nên đưa biến giới vào không? Vấn đề đưa biến số vào mô hình • Mô hình giải thích hay mô hình tiên đoán? • Mô hình giải thích: – Đưa biến độc lập vào mô hình, bổ sung biến khác – Đưa tất biến độc lập vào mô hình, cho bậc tự mô hình

Ngày đăng: 16/11/2016, 15:41

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan