Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)

77 256 0
Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)Các thuật toán phân lớp dữ liệu và ứng dụng xây dựng hệ thống hỏi đáp tự động về một số bệnh thường gặp (LV thạc sĩ)

i ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG NGUYỄN DUY DŨNG Các thuật toán phân lớp liệu ứng dụng xây dựng hệ thống hỏi đáp tự động số bệnh thường gặp LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên 2015 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ii LỜI CAM ĐOAN Tôi xin cam đoan luận văn kết nghiên cứu riêng Các số liệu, kết nêu luận văn trung thực Được tác giả cho phép tham khảo sử dụng tài liệu đăng tải tác phẩm, tạp chí trang web theo danh mục tài liệu tham khảo luận văn Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iii LỜI CẢM ƠN Tôi xin gửi lời cảm ơn trân trọng sâu sắc đến thầy giáo PGS.TS Đồn Văn Ban – thầy tận tình giúp đỡ, hướng dẫn cho tơi suốt q trình học tập nghiên cứu, thực đề tài Tôi xin gửi lời biết ơn chân thành đến quý Thầy giáo, cô giáo Viện Công nghệ thông tin quý Thầy cô trường Đại học Công nghệ thông tin & truyền thơng Đại học Thái Ngun tận tình giảng dạy, trang bị cho kiến thức quý báu suốt q trình học tập trường Tơi xin gửi lời biết ơn chân thành đến Ban giám hiệu, phòng ban trường Cao đẳng Y tế Thanh Hóa tạo điều kiện cho tơi tham gia lớp học Tôi xin gửi lời biết ơn chân thành đến quan Bắc Trung Bộ giúp đỡ hỗ trợ cho tơi tham gia khóa học Tơi xin cảm ơn, chia sẻ niềm vui với gia đình, bạn bè đồng nghiệp y bác sĩ anh chị em lớp Cao học K12G trường Đại học Công nghệ thông tin & truyền thông Đại học Thái Nguyên, người bên tôi, giúp đỡ tạo điều kiện thuận lợi tơi học tập, nghiên cứu, hồn thành luận văn Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iv MỤC LỤC LỜI CAM ĐOAN i MỤC LỤC iv DANH MỤC CÁC CHỮ VIẾT TẮT vi DANH MỤC BẢNG BIỂU vi DANH MỤC CÁC HÌNH vi ĐỐI TƯỢNG PHẠM VI NGHIÊN CỨU 2 PHƯƠNG PHÁP NGHIÊN CỨU HƯỚNG NGHIÊN CỨU CỦA ĐỀ TÀI BỐ CỤC LUẬN VĂN Ý NGHĨA KHOA HỌC CỦA ĐỀ TÀI Chương Giới thiệu hệ thống hỏi đáp 1.1 Hệ thống hỏiđáp tự động 1.2 Phân loại hệ thống hỏi đáp tự động 1.2.1 Phân loại theo miền ứng dụng 1.2.2 Phân loại theo khả trả lời câu hỏi 1.2.3 Phân loại theo hướng tiếp cận 1.3 Cơ sở tri thức máy suy diễn 1.3.1 Cơ sở tri thức 1.3.1.1 Khái niệm hệ sở tri thức 1.3.1.2 Hệ phân loại tri thức 1.3.1.3 Các phương pháp biểu diễn tri thức 10 1.3.2 Máy suy diễn 15 1.4 Kiến trúc hệ thống hỏiđáp 18 1.4.1 Giao diện người dùng 19 1.4.2 Phân tích câu hỏi 19 1.4.3 Tìm kiếm liệu 19 1.4.4 Rút trích câu trả lời 20 1.4.5 Xác minh câu trả lời 20 1.5 Kết chương 20 Chương Kỹ thuật phân lớp liệu khai phá liệu 21 2.1 2.2 2.3 2.4 Khai phá liệu phát tri thức 21 Khai phá luật kết hợp 24 Phân lớp, phân cụm liệu 25 Cây định 29 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn v 2.5 Các thuật toán phân lớp liệu phổ biến 30 2.5.1 Thuật toán định ID3 30 2.5.2 Thuật toán C4.5 33 2.5.3 Thuật toán SVM 36 2.5.4 Thuật toán phân lớp K người láng giềng gần 36 2.6 Các vấn đề liên quan đến phân lớp liệu 37 2.6.1 Chuẩn bị liệu cho việc phân lớp 37 2.6.2 So sánh mơ hình phân lớp 38 2.6.3 Các phương pháp đánh giá độ xác mơ hình phân lớp 39 2.7 Kết chương 40 Chương Xây dựng hệ thống hỏi đáp tự động số bệnh thương gặp 41 3.1 Các loại bệnh thường gặp 41 3.1.1 Bệnh lao 41 3.1.2 Viêm phổi 46 3.2 Xây dựng sở luật (KB) 52 3.3 Xây dựng chế suy diễn để khai thác, tìm câu trả lời 56 3.4 Thiết kế hệ thống hỏi đáp 59 3.5 Cài đặt thử nghiệm hệ thống hỏi đáp 60 3.5.1 Môi trường phát triển hệ thống 60 3.5.2 Cấu trúc thành phần để triển khai hệ thống 60 3.5.3 Cài đặt chương trình 61 3.5.4 Thử nghiệm hệ thống 61 3.5.4.1 Chức khai phá liệu 61 3.5.4.2 Giao diện chẩn đoán bệnh 62 3.5.4.3 Danh mục triệu chứng bệnh thông thường 64 KẾT LUẬN HƯỚNG PHÁT TRIỂN .65 DANH MỤC TÀI LIỆU THAM KHẢO 66 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vi DANH MỤC CÁC CHỮ VIẾT TẮT Chữ viết tắt Tiếng anh Tiếng việt Q&A Question Answering Hỏi - đápsở liệu CSDL DANH MỤC BẢNG BIỂU Tên bảng Trang Bảng 3.2a Bảng liệu da rám nắng 52 Bảng 3.2b Phân hoạch 54 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vii DANH MỤC CÁC HÌNH Hình 1.1 Xu hướng nghiên cứu Q&A Hình 1.2 Mơ hình đồ thị biểu diễn tri thức nhờ mạng ngữ nghĩa 11 Hình 1.3 Mơ hình đồ thị thêm vào nút cung biểu diễn tri thức nhờ mạng NN 12 Hình 1.4 Mơ hình biểu diễn tri thức nhờ ba liên hợp O.A.V .14 Hình 1.5 Hệ thống tìm kiếm thông tin .18 Hình 1.6 Kiến trúc hệ thống hỏi đáp .19 Hình 2.1 Quá trình phát tri thức 21 Hình 2.2 Phân lớp liệu .26 Hình 2.3 Phân cụm liệu 28 Hình 2.4 Siêu phẳng h phân chia liệu huấn luyện thành lớp + – với khoảng cách biên lớn Các biên gần h vector hỗ trợ (Support Vector – khoanh tròn) 36 Hình 2.5 Ước lượng độ xác mơ hình phân lớp với phương pháp holdout 39 Hình 3.1 Phân hoạch thuộc tính 54 Hình 3.2 Phân hoạch thuộc tính 55 Hình 3.3 Mơ hình kiến trúc hệ thống 59 Hình 3.4 Giao diện khai phá liệu .61 Hình 3.5 Chẩn đốn bệnh hệ thống 62 Hình 3.6 Chẩn đốn 62 Hình 3.7 Giao diện câu hỏi hệ thống 63 Hình 3.8 Giao diện kết chẩn đoán .63 Hình 3.9 Giao diện hỗ trợ hệ thống 64 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn viii Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ĐẶT VẤN ĐỀ Ngày với phát triển mạnh mẽ khoa học kỹ thuật từ lý thuyết đến ứng dụng, người ta cố gắng đưa công nghệ thông tin vào ngành nghề như: khoa học kỹ thuật, giáo dục, y tế, v.v, lĩnh vực y tế ngày nhiều người quan tâm Các nhà nghiên cứu hệ thống hỏi đáp bắt đầu khai thác web nguồn liệu cho việc tìm kiếm câu trả lời Phân tích câu hỏi phần kiến trúc chung hệ thống hỏi đáp, có nhiệm vụ tìm thơng tin cần thiết làm đầu vào cho trình xử lý phần sau (trích chọn tài liệu, trích xuất câu trả lời, v.v) Vì vậy,việc phân tích câu hỏi có vai trò quan trọng, ảnh hưởng trực tiếp đến hoạt động tồn hệ thống Nếu phân tích câu hỏi khơng tốt khơng thể tìm câu trả lời Hệ thống hỏi - đáp tự động công cụ hữu hiệu phục vụ cho nhu cầu tìm kiếm trao đổi thơng tin ngày cao người, hệ thống hỏi đáp có nhiều dạng câu hỏi như: Câu hỏi dạng định nghĩa (What), câu hỏi nơi chốn (Where), câu hỏi (How), câu hỏi đúng/sai (Yes/No) Nhưng hệ thống hỏi - đáp (Yes/No) lại quan tâm vài năm gần Như vậy,việc xây dựng hệ thống hỏi - đáp (Yes/No) nhu cầu cần thiết Hướng tới mục tiêu này, muốn xây dựng mơ hình hệ thống hỏi - đáp tự động (Yes/No) nhằm phục vụ cho lĩnh vực cụ thể hỗ trợ việc chẩn đoán khuyến nghị điều trị bệnhthông thường sống Trong sống ngày, có nhiều loại bệnh thường xuyên đe dọa đến sức khỏe người Thường loại bệnh xuất phát từ triệu chứng, biết Cho nên yêu cầu người cần có hệ thống hỏi - đáp giúp họ chẩn đoán bệnh giúp họ hướng giải để đảm bảo sức khỏe cho Như vậy, mục tiêu đề tài tìm hiểu tri thức y khoa loại bệnh thông thường, thu thập tri thức để xây dựng hệ thống hỏi đáp Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn nhằm hổ trợ chẩn đoán phân loại bệnh thường gặp, cho người sử dụng lời khuyên hữu ích việc phòng điều trị bệnh Nhận thấy tính thiết thực vấn đề gợi ý giảng viên hướng dẫn, chọn đề tài “Các thuật toán phân lớp liệu ứng dụng xây dựng hệ thống hỏi đáp tự động số bệnh thường gặp" ĐỐI TƯỢNG PHẠM VI NGHIÊN CỨU - Nghiên cứu kỹ thuật phân lớp liệu khai phá liệu - Tìm hiểu bệnh thường gặp xây dựng sở tri thức biểu bệnh dựa sở liệu thu thập Bệnh viện Đa khoa tỉnh Thanh Hóa để phân lớp loại bệnh PHƯƠNG PHÁP NGHIÊN CỨU  Phương pháp nghiên cứu lý thuyết: Nghiên cứu qua tài liệu, sách, sách điện tử, báo, thông tin tài liệu website tài liệu liên quan công nghệ liên quan, tổng hợp tài liệu, phân tích thiết kế hệ thống thơng tin theo quy trình xây dựng ứng dụng phần mềm  Phương pháp nghiên cứu thực nghiệm: Phân tích trạng yêu cầu thực tế toán xây dựng bước phân tích hệ thống để hỗ trợ việc lập trình, xây dựng ứng dụng,vận dụng vấn đề nghiên cứu mã hóa thơng tin tiến trình xây dựng hệ thống, đánh giá kết đạt HƯỚNG NGHIÊN CỨU CỦA ĐỀ TÀI - Nghiên cứu phương pháp phân lớp liệu KPDL, thuật toán liên quan đến quy nạp định, tìm hiểu ngơn ngữ mã lệnh siêu tìm kiếm - Tìm hiểu hệ thống hỏi đáp tự động, ứng dụng công nghệ tri thức hỗ trợ phục vụ chẩn đoán đưa khuyến nghị điều trị số bệnh thường gặp BỐ CỤC LUẬN VĂN Sau phần mở đầu, nội dung luận văn chia thành chương: Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 55 Vchiều cao = (T(thấp, rám), T(thấp, không rám)) = (1/8,2/8) Cân nặng Vcân nặng = (T(nhẹ, rám), T(nhẹ, không rám)) = (1/8, 1/8) Vcân nặng = (T(vừa phải, rám), T(vừa phải, không rám)) = (1/8, 2/8) Vcân nặng = (T(nặng, rám), T(nặng, không rám)) = (1/8, 2/8) Dùng thuốc Vdùng thuốc = (T(không, rám), T(không, không rám)) = (3/8, 2/8) Vdùng thuốc = (T(có, rám), T(có, khơng rám)) = (0/8, 3/8) Tính Gain cho thuộc tính: Thay vào cơng thức tính Gain(S, màu tóc) =entrpy(s) - [ (= 0.454 Tính Gain (S, màu tóc) = 0.454 Theo cách tính tương tự trên, ta tính được: Gain (S, Chiều cao) = 0.265712127384098 Gain (S, Cân nặng) = 0.204434002924965 Gain (S, Dùng thuốc) = 0.347589891390797 Như vậy, thuộc tính “Màu tóc” thuộc tính có số Gain lớn nên chọn thuộc tính phân hoạch Vì thuộc tính “Màu tóc” chọn làm nhãn cho nút gốc, ba nhánh tạo với tên là: “Đen”, “Bạc” “Râm” Màu tóc Số hóa Trung tâm Học liệu – ĐHTN Đen (1,2,4,8) Bạc(5) (rám) http://www.lrc.tnu.edu.vn Râm (3,6,7) (Khơng rám) 56 Hình 3.1 Phân hoạch thuộc tính Bước cần phân hoạch tập P1 = (1,2,4,8) Phân hoạch tập P1 Bảng 3.2b Phân hoạch TT Chiều cao Cân nặng Dùng thuốc? Kết Tầm thước Nhẹ Không Bị rám Cao Vừa phải Có Khơng Thấp Vừa phải Khơng Bị rám Thấp Nhẹ Có Khơng Tính vector đặc trưng: Chiều cao: Vchiều cao = (T (tầm thước, rám), T (tầm thước, không rám)) = (1/4, 0/4) Vchiều cao = (T (thấp, rám), T (thấp, không rám)) = (1/4, 1/4) Vchiều cao = (T (cao, rám), T (cao, không rám)) = (0/4, 1/4) Cân nặng: Vcân nặng = (T (nhẹ, rám), T (nhẹ, không rám)) = (1/4, 1/4) Vcân nặng = (T (vừa phải, rám), T (vừa phải, không rám)) = (1/4, 1/4) Dùng thuốc: Vdùng thuốc = (T (có, rám), T (khơng, rám) = (0/4, 2/4) Vdùng thuốc = (T (không, rám), T (không, không rám)) = (2/4,0/4) Chọn thuộc tính Dùng thuốc làm thuộc tính phân hoạch Dùng thuốc Số hóa Trung tâm Học liệu – ĐHTN Có (2.8) Khơng rám http://www.lrc.tnu.edu.vn Khơng (1,4) (rám) 57 Kết dạng sau: Màu tóc Đen (1,2,4,8) (Dùng thuốc) Có (2,8) Khơng rám) Bạc (5) (rám) Râm(3,6,7) (Khơng rám) khơng (1,4) (rám) Hình 3.2 Phân hoạch thuộc tính Từ định danh ta suy luật sau: Tóc bạc  Rám Tóc râm  Khơng bị rám (Tóc đen, có dùng thuốc)  Khơng rám (Tóc đen, khơng dùng thuốc)  Rám 3.3 Xây dựng chế suy diễn để khai thác, tìm câu trả lời Trong đề tài ta chọn phương pháp suy diễn lùi, để đưa kết luận B ta thử tìm tất luật có dạng Horn: A1^ ^ An → B Để có B, ta cần chứng minh A1, , An (các kết luận thêm vào tập kết luận) Quá trình xác định Ai diễn tương tự B Nếu đến lúc tìm thấy Aio khơng thể dẫn xuất từ giả thiết ta quay lui sang luật khác sinh B lại tiếp tục q trình Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 58 Nếu khơng tìm Aio (nghĩa Ai dẫn xuất từ giả thiết) trình dẫn xuất B thành công Để thực trình quay lui, ta sử dụng hai tập có cấu trúc ngăn xếp GOAL VET: GOAL tập lưu mệnh đề cần phải chứng minh đến thời điểm xét VET tập lưu luật sử dụng để chứng minh đích (kể đích trung gian) Đầu vào: Tập mệnh đề giả thiết cho GT = {g1, g2, g3, …, gn} Tập luật RULE = {r1, r2, r3, …, rm} Tập mệnh đề kết luật KL = {q1, q2, q3, …, qk} Đầu ra: Kết luận thành công hay không thành công Giải thuật: Sử dụng cấu trúc Goal Vet dạng Stack GOAL: Là tập lưu mệnh đề cần phải chứng minh đến thời điểm xét VET: Là tập chứa luật sử dụng để chứng minh đích (kể đích trung gian) If (KL  GT) Then { Exit (“Thành công”); } Else { (1) GOAL = ; VET = ; CMđược = True; For q  KL Do GOAL= GOAL  (q,0); Repeat Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 59 { (2) (f, i)  Get (GOAL); //Lấy cặp (f, i) từ GOAL If (f  GT) Then { (3) Tìm_luật (f, i, RULE, j); // Tìm luật rj: leftj  f If (j  m) Then { VET = VET  (f, j); For t  leftj \ GT Do GOAL = GOAL  (t, 0); } Else { (4) back = True; // Biến dùng để quay lui While (f  KL and back) { (5) Repeat { (g, k)  Get (VET); // Lấy luật rk: leftk  g từ VET để quay lui đến luật khác mà  g GOAL = GOAL \ leftk; } Until (f  leftk); Tìm_luật (g, k, RULE, s); // Tìm luật rs: lefts  g If (s  m) Then Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 60 { For each tlefts\GT Do GOAL = GOAL  (t, 0); VET = VET  (g, s); back = False; } Else f = g; } (5) If (f  KL and back) then CMđược = False; } (4) } (3) } (2) Until (GOAL =  or not (CMđược); If (CMđược) Then Exit (“thành công”) Else Exit (“Không thành công”); } (1) Trong giải thuật ta sử dụng thủ tục: Tim_luat (f,I,RULE,k) để tìm xem có luật rk kể từ luật thứ i+1 trở mà suy f (rk: leftk  f) Nếu khơng có luật thi qui ước lấy k = m+1 3.4 Thiết kế hệ thống hỏi đáp Các tri thức thu thập từ chuyên gia - bác sỹ, tri thức thu thập từ bệnh án, giảng viên chuyên ngành, tài liệu y khoa từ internet Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 61 Đầu vào hệ thống tập loại bệnh, triệu chứng, lời khuyến nghị điều trị tương ứng cho loại bệnh, lời khuyên bác sỹ Thông qua chế suy diễn, áp dụng tất luật suy diễn kết quả, sau kết hợp kết đầu hiển thị kết cuối lên giao diện người sử dụng cho người dùng cuối Hệ chuyên gia Internet Tài liệu, sách, báo CSDL bệnh án Thu thập tri thức Cơ sở liệu bệnh (Database) Cshap SQL Sever 2012 Tạo tập luật Cơ sở tri thức (Knowledge base) Máy suy diễn (inference engine) Giao diện người sử dùng Người Sử dụng Chuyên gia QT hệ thống Hình 3.3 Mơ hình kiến trúc hệ thống 3.5 Cài đặt thử nghiệm hệ thống hỏi đáp 3.5.1 Môi trường phát triển hệ thống Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 62 Hệ thống hỏi đáp trợ giúp phục vụ cho việc hỗ trợ chẩn đoán loại bệnhthường gặp cộng đồng, phát triển môi trường máy đơn sử dụng ngôn ngữ lập trình CShap, tơi thực thơng qua: Hệ điều hành: Windows XP/ Win7 Công cụ phát triển: CShap (.NET Framework 4.0) Công cụ soạn thảo: Microsoft Office 2007 Cơ sở liệu quan hệ: SQL Server 2012 3.5.2 Cấu trúc thành phần để triển khai hệ thống Hệ thống triển khai thành phần sau: Thu thập thông tin lĩnh vực bệnhthông thường (tri thức) Từ sở liệu bệnh án Từ chuyên gia bác sĩ Từ Internet Từ tài liệu, sách báo y khoa Cở sở liệu bệnh (dữ liệu thô) Tổ chức sở liệu theo mơ hình quan hệ (dạng bảng) Tạo tập luật (Cây định) Dùng thuật toán ID3 xây dựng định từ liệu thô Từ định cho ta tập luật Cơ sở tri thức Hệ suy diễn tìm câu trả lời từ sở tri thức Giao tiếp người sử dụng hệ thống Thao tác tìm kiếm câu trả lời chẩn đoán bệnh: Người sử dụng khởi động hệ thống trả lời câu hỏi dạng Yes/ No Hệ thống suy diễn dựa sở luật từ sở tri thức Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 63 Trả kết cho người dùng thông tin bệnh Thao tác bổ sung cập nhật tri thức Chuyên gia bổ sung liệu từ nguồn cập nhật Xây dựng luật thay đổi luật tương ứng Người quản trị hệ thống cập nhật luật vào sở tri thức 3.5.3 Cài đặt chương trình Từ mơ hình kiến trúc hệ thống (Hình 3.3), hệ trợ giúp gồm phần lớn: Phần 1: Thu thập liệu từ nguồn khác (bệnh án, tri thức từ chuyên gia, bác sĩ, v.v) Dữ liệu từ loại bệnh, triệu chứng bệnh nhân, khuyến nghị điều trị Phần minh họa thông qua chức hỏi đáp dạng Yes/No Phần 2: Cơ sở tri thức thành phần hệ trợ giúp gồm: Các triệu chứng, loại bệnh, khuyến nghị điều trị thu thập từ phần mã hóa thành tập liệu làm tảng cho việc xây dựng sở luật cho suy diễn Cơ sở luật thành phần khơng thể thiếu định nói chung hệ trợ giúp nói riêng Nó thành phần quan trọng để chuẩn bị cho phần suy diễn hệsở luật minh họa qua chức “Nhập liệu” Phần 3: Cơ chế suy diễn, từ sở tri thức thu nhận phần qua suy diễn hệ trợ giúp định cho kết chuẩn đoán Kết chẩn đoán hiển thị qua giao diện người sử dụng, bệnh nhân biết thông tin bệnh đồng thời biết lời khuyến nghị điều trị tương ứng với bệnh tật Phần biễu diễn qua chức “Chẩn đoán bệnh” 3.5.4 Thử nghiệm hệ thống 3.5.4.1 Chức khai phá liệu Nhận liệu đầu vào bảng liệu, giải thuật ID3 (xem Hình 3.4) Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 64 Hình 3.4 Giao diện khai phá liệu 3.5.4.2 Giao diện chẩn đoán bệnh Từ triệu chứng đầu vào, thơng qua mơ hình hệ thống trợ giúp gồm nhiều sở luật, chế suy diễn để đưa kết qủa chẩn đoán với lời khuyến nghị điều trị kèm theo việc chẩn đoán Giao diện chẩn đoán bệnh hệ thống thể qua hình (xem Hình 3.5): Hình 3.5 Chẩn đốn bệnh hệ thống Khi người dung vào hệ thống để chẩn đoán bệnh qua giao diện hệ thống Hệ trợ giúp yêu cầu người dùng chọn loại bệnh phần ComboBox mà muốn chẩn đốn, hệ trợ giúp đưa loại bệnhhệ thống Ngồi người dùng nhập thêm loại bệnh thơng thường khác (xem Hình 3.6) Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 65 Hình 3.6 Chẩn đoán Khi người dùng chọn chẩn đoán, hệ thống đưa câu hỏi cho người dùng chọn dạng YES/NO (“Có” / “khơng”) (xem Hình 3.7): Hình 3.7 Giao diện câu hỏi hệ thống Người dùng tiếp tục trả lời chuỗi câu hỏi hệ thống đưa ra, hệ thống nhận câu trả lời mà thỏa với luật hệ thống dừng trả lời kết (xem Hình 3.8) Ngược lại hệ thống báo khơng chẩn đốn (nghĩa hệ thống đưa hết tất câu hỏi hệ thống mà người dùng trả lời khơng thỏa với luật hệ thống) Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 66 Hình 3.8 Giao diện kết chẩn đốn Hình 3.9 Giao diện hỗ trợ hệ thống Trong giao diện người dùng xem lời khuyến nghị điều trị chăm sóc bệnh, tổng quan bệnh, lời khuyên bác sỹ tương ứng với kết hệ thống chẩn đốn Thơng qua Button tương ứng (xem Hình 3.9): Nút button “Khuyến nghị điều trị chăm sóc” Nút button “Tổng quan” Nút button “Lời khuyên bác sĩ” 3.5.4.3 Danh mục triệu chứng bệnh thông thường Hệ trợ giúp cho phép người dùng nhập, thêm, sữa, xóa Các câu hỏi (triệu chứng) liên quan đến bệnh thông thườngsở luật thành phẩn quan trọng hệ định nói chung hệ suy diễn nói riêng Cơ sở luật thực chất tập luật suy diễn IF- THEN, tập phát biểu triệu chứng, nguyên nhân gây bệnh Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 67 KẾT LUẬN HƯỚNG PHÁT TRIỂN Q trình phân tích tốn cụ thể, chi tiết Vận dụng vấn đề suy diễn hệ thống, cụ thể ứng dụng suy diễn tiến suy diễn lùi xây dựng hệ trợ giúp chẩn đoán loại bệnhthơng thường  Luận văn trình bày số phương pháp khai phá liệu dựa vào phân lớp ứng dụng vào hệ thống chẩn đoán bệnh  Trình bày chi tiết thuật tốn định, ID3, C4.5 áp dụng phân loại bệnh thường gặp để hỗ trợ chẩn đoán bệnhXây dựng hệ thống hỏi đáp hỗ trợ chẩn đoán bệnh thường gặp Hạn chế: Trong luận văn thiết kế liệu mang tính demo, chưa xây chương trình phức tạp với sở liệu lớn, chưa áp dụng nhiều kỹ thuật khai phá khác làm tăng độ xác cao Hướng phát triển: Nghiên cứu kỹ thuật phân lớp phát triển phần mềm đa chức tập hợp đầy đủ kiến thức y khoa giúp cho trình học tập, nghiên cứu thay phần nhỏ bác sỹ giúp cho người dùng hiểu biết nhận định xác tình trạng sức khỏe Mở rộng phạm vi chẩn đoán cho tất loại bệnh phức tạp Nâng cấp hệ trợ giúp thêm phần loại bệnh trẻ em, loại bệnh người già, loại bệnh đàn ông, v.v Nâng cao tốc độ thực hệ trợ giúp cách xây dựng thuật toán tối ưu hơn, để hệ thống chạy Internet Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 68 DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Hữu Hồng (1996), Hướng dẫn sử dụng thuốc thiết yếu để điều trị số bệnh thường gặp cộng đồng, Hà Nội [2] Nguyễn Thanh Thủy (2007), Trí tuệ nhân tạo – Các phương pháp giải vấn đề kỹ thuật xử lý tri thức Nhà xuất giáo dục, Hà Nội [3] Chu Văn Tường, Nguyễn Công Khanh, Trần Quy, Lê Nam Trà, Cao Quốc Việt (1996), Cấp cứu nhi khoa Nhà xuất y học, Hà Nội Tiếng Anh [4] Mark A Greenwood, Robert Gaizauskas, et al (2003), The University of Sheffield’s TREC 2003 Q&A Experiments, In Proceedings of the 12th Text REtrieval Conference [5] Mark A Greenwood and Horacio Saggion (2004),”A Pattern Based Approach to Answering Factoid, List and Definition Questions”, In Proceedings of the 7th RIAO Conference (RIAO 2004) [6] Morgan Kaufman (2002), Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers [7] Ian Roberts and Robert Gaizauskas (2004),”Evaluating Passage Retrieval Approaches for Question Answering”, In Proceedings of 26th European Conference on Information Retrieval (ECIR’04) [8] Jiawei Han and Micheline Kamber (2002), Data Mining Concepts and Techniques, University of Illinois, Morgan Kaufmann Publishers [9] The Morgan Kaufmann Series in Data Management Systems, Jim Gray Datamining-Concepts and Techniques, Chapter 7-Classification and Prediction Series Editor Morgan Kaufmann Publishers, August 2000 [10] Jaiwei Han and Micheline Kamber, Data Mining: Comcepts and Techniques (2001), ISBN 1-55860-489-8 Trang web [11] http://www.suckhoedoisong.vn Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 69 [12] http://home.dei.polimi.it/matteucc/Clustering/tutorial_html/index.html [13] http://suckhoe.24h.com.vn/ Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ... Các thuật tốn phân lớp liệu ứng dụng xây dựng hệ thống hỏi đáp tự động số bệnh thường gặp" ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU - Nghiên cứu kỹ thuật phân lớp liệu khai phá liệu - Tìm hiểu bệnh thường. .. thao, v.v) Xây dựng hệ thống hỏi đáp miền đóng coi tốn dễ so với xây dựng hệ thống hỏi đáp miền mở sử dụng tri thức miền (thường ontology miền cụ thể) Hệ thống hỏi đáp Miền đóng Miền mở Dữ liệu có... bệnh ,và đưa khuyến nghị điều trị loại bệnh thơng thường Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn Chương Giới thiệu hệ thống hỏi đáp 1.1 Hệ thống hỏi – đáp tự động Hệ thống hỏi

Ngày đăng: 03/11/2017, 14:02

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan