Nghiên cứu mỗi quan hệ giữa phụ thuộc hàm và bảng quyết định trong chẩn đoán bệnh

165 103 0
Nghiên cứu mỗi quan hệ giữa phụ thuộc hàm và bảng quyết định trong chẩn đoán bệnh

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG CHỬ THỊ QUỲNH HOA NGHIÊN CỨU MỐI QUAN HỆ GIỮA PHỤ THUỘC HÀM VÀ BẢNG QUYẾT ĐỊNH TRONG CHẨN ĐOÁN BỆNH LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn LỜI CẢM ƠN Em xin chân thành bày tỏ lòng biết ơn sâu sắc đến TS Lê Văn Phùng, người thầy hết lòng giúp đỡ tạo điều kiện tốt để em hoàn thành luận văn Em xin chân thành cảm ơn toàn thể Thầy, cô công tác Viện CNTT Trường Đại học Công Nghệ Thông Tin Truyền Thông - Đại Học Thái Ngun ln tận tình bảo, giúp đỡ, tạo điều kiện truyền đạt kiến thức cho em suốt trình học tập thực luận văn Xin chân thành cảm ơn Ban Giám Hiệu Trường THPT Định Hóa, gia đình, bạn bè đồng nghiệp không ngừng quan tâm, động viên, giúp đỡ tạo điều kiện tốt cho suốt thời gian học tập thực luận văn Mặc dù cố gắng nhiều, thời gian có hạn thân hạn chế định nên luận văn khơng tránh khỏi thiếu sót Em mong nhận ý kiến phê bình, góp ý Hội đồng bảo vệ luận văn, thầy cô giáo đồng nghiệp để luận văn hoàn chỉnh Thái Nguyên, ngày 09 tháng 05 năm 2015 Học viên Chử Thị Quỳnh Hoa Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn LỜI CAM ĐOAN Tôi xin cam đoan luận văn sản phẩm tổng hợp nghiên cứu Trong luận văn có sử dụng số định nghĩa, bổ đề, hệ quả, thuật tốn lấy từ nguồn tài liệu có trích dẫn tên tài liệu tên tác giả rõ ràng nêu phần tài liệu tham khảo Tôi xin chịu trách nhiệm sản phẩm nghiên cứu Học viên Chử Thị Quỳnh Hoa Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn i MỤC LỤC Lời cam đoan MỤC LỤC i Danh mục thuật ngữ iv Danh mục ký hiệu, từ viết tắt v Danh sách bảng vii Danh sách hình vẽ viii MỞ ĐẦU Chương TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ BÀI TOÁN CHẨN ĐOÁN BỆNH 1.1 Các khái niệm hệ thông tin tập thô 1.1.1 Hệ thông tin 1.1.2 Tập thô 1.1.3 Bảng định 1.1.4 Cơ sở liệu quan hệ 10 1.1.5 Tập rút gọn lõi 12 1.1.6 Luật định 14 1.2 Khai phá liệu 15 1.2.1 Khai phá liệu phát tri thức 15 1.2.2 Các chức khai phá liệu 17 1.2.3 Các hệ thống khai phá liệu kiến trúc tổng quát chúng 18 1.2.4 Các loại liệu khai phá 22 1.2.5 Khai phá liệu theo hướng tiếp cận tập thô 22 1.3 Bài toán chẩn đoán bệnh 23 1.3.1 Vai trò phương pháp chẩn đốn lâm sàng y học 23 1.3.2 Giá trị thực tiễn việc xác định quan hệ phụ thuộc hàm bảng định chẩn đoán bệnh 24 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ii 1.4 Kết luận chương 26 Chương MỐI QUAN HỆ GIỮA PHỤ THUỘC HÀM VÀ BẢNG QUYẾT ĐỊNH THEO HƯỚNG TIẾP CẬN TẬP THÔ 27 2.1 Xác định phụ thuộc hàm từ bảng định 27 2.1.1 Thuộc tính rút gọn thuật tốn tìm chúng 27 2.1.2 Thuật tốn tìm họ tất tập rút gọn bảng định 36 2.1.3 Tập lõi bảng định 38 2.1.4 Thuật toán xác định phụ thuộc hàm từ bảng định 42 2.2 Xây dựng bảng định từ tập phụ thuộc hàm 44 2.2.1 Sự phụ thuộc thuộc tính bảng định 44 2.2.2 Một số thuật toán liên quan đến phụ thuộc hàm 45 2.2.3 Thuật toán xây dựng bảng định từ tập phụ thuộc hàm 50 2.3 Kết luận chương 54 Chương CHƯƠNG TRÌNH THỬ NGHIỆM 55 3.1 Bài toán chẩn đoán bệnh cúm 55 3.1.1 Yêu cầu nghiệp vụ 55 3.1.2 Yêu cầu công nghệ 57 3.2 Thiết kế chương trình 57 3.2.1 Thiết kế sở liệu 57 3.2.2 Thiết kế xử lý 59 3.2.3 Thiết kế mơ-đun lược đồ chương trình 60 3.3 Cài đặt thực chương trình 63 3.3.1 Các chức chương trình 63 3.3.2 Hệ thống liệu đầu vào 64 3.3.3 Hệ thống giao diện 65 3.3.4 Kết thử nghiệm chương trình đánh giá 67 3.4 Kết luận chương 71 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iii KẾT LUẬN 72 Tài liệu tham khảo 73 PHỤ LỤC 75 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iv Danh mục thuật ngữ Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh Tập thô Rough Set Hệ thông tin Information System Bảng định Decision Table Quan hệ không phân biệt Indiscernibility Relation Quan hệ dung sai Tolerance Relation Xấp xỉ Lower Approximation Xấp xỉ Upper Approximation Rút gọn thuộc tính Attribute Reduction Tập rút gọn Reduct Tập lõi Core Ma trận phân biệt Indiscernibility Matrix Hàm phân biệt Indiscernibility Function Luật định Decision Rule Quan hệ Relation Sơ đồ quan hệ Relation Schema Phụ thuộc hàm Functional Dependency Khóa, phản khóa Key, Antikey Tập tối thiểu thuộc tính a Minimal set of the attribute a Họ tập tối thiểu thuộc tính Family of all minimal sets of attribute a a Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn v Danh mục ký hiệu, từ viết tắt Ký hiệu, từ viết tắt Diễn giải S  U , A  Hệ thông tin T  U ,C  D  Bảng định U Số đối tượng C Số thuộc tính điều kiện bảng định A Số thuộc tính hệ thơng tin u a  Giá trị đối tượng u thuộc tính a IND  B  Quan hệ B  không phân biệt u B Lớp tương đương chứa u quan hệ IND  B  U/B Phân hoạch U sinh tập thuộc tính B  B (u) Hàm định suy rộng đối tượng u B BX B  xấp xỉ X BX B  xấp xỉ X BN B  X  B - miền biên X POS B  D  B  miền dương D PRED  C  Họ tất tập rút gọn Pawlak PCORE  C  Tập lõi dựa miền dương HCORE  C  Tập lõi dựa entropy Shannon có điều kiện SCORE  C  Tập lõi dựa ma trận phân biệt ECORE  C  Tập lõi dựa entropy Liang có điều kiện MCORE  C  Tập lõi dựa metric Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vi CSDL Cơ sở liệu SĐQH Sơ đồ quan hệ PTH Phụ thuộc hàm Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vii Danh sách bảng Bảng 1.1 Bảng liệu bệnh cúm Bảng 1.2 Bảng thông tin bệnh cúm Bảng 1.3 Bảng định Bảng 1.4 Bảng định bệnh cúm 14 Bảng 2.1 Bảng định Ví dụ 2.1 30 Bảng 2.2 Bảng định bệnh cúm Ví dụ 2.2 32 69 M d  {Onlanh, Chongmat, Metmoi, Dauhong, Chaynuocmui, Nghetmui, Non, Tieuchay}, {Daudau, Thannhiet, Onlanh, Chongmat, Metmoi, Dauhong, Chaynuocmui, Nghetmui, Tieuchay}, {Dauhong, Chaynuocmui, Non, Tieuchay}, , {Onlanh, Ho, Dauhong, Chaynuocmui, Non}, {Dauco, Onlanh, Chongmat, Chaynuocmui } Bước 3: Áp dụng bước thuật tốn 2.13 tìm tập khóa tối thiểu từ tập phản khóa tính tập K từ tập K 1 K 1  Md  K  {{d},{Dauco, Thannhiet, Onlanh, Nghetmui},{Daudau, Thannhiet, Onlanh, Nghetmui}, {Daudau, Dauco, Thannhiet, Onlanh}, {Daudau, Thannhiet, Onlanh, Ho}, {Dauco, Thannhiet, Onlanh, Ho}  Bước 4: Họ tất tập rút gọn bảng định T là: PRED  C    d  {{Dauco, Thannhiet, Onlanh, Nghetmui},{Daudau, K  Thannhiet, Onlanh, Nghetmui}, {Daudau, Dauco, Thannhiet, Onlanh}, {Daudau, Thannhiet, Onlanh, Ho}, {Dauco, Thannhiet, Onlanh, Ho} + Thực thuật toán 2.9 thu phụ thuộc hàm sau: Dauco, Thannhiet, Onlanh, Nghetmui → Cúm Daudau, Thannhiet, Onlanh, Nghetmui → Cúm Daudau, Dauco, Thannhiet, Onlanh → Cúm Daudau, Thannhiet, Onlanh, Ho → Cúm Dauco, Thannhiet, Onlanh, Ho → Cúm Chương trình thử nghiệm toán chẩn đoán lâm sàng bệnh cúm sở liệu gồm có 50 bệnh nhân, tạo sinh luật chẩn đoán bệnh thu phụ thuộc hàm sau: Dauco, Thannhiet, Onlanh, Nghetmui → Cúm Daudau, Thannhiet, Onlanh, Nghetmui → Cúm Daudau, Dauco, Thannhiet, Onlanh → Cúm Daudau, Thannhiet, Onlanh, Ho → Cúm Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 70 Dauco, Thannhiet, Onlanh, Ho → Cúm Kết thúc chương trình thu tri thức phát sở liệu biểu diễn dạng luật định (các luật chẩn đoán bệnh) xây dựng từ phụ thuộc hàm sau: If (Dauco = có) and (Thannhiet = cao) and (Onlanh = có) and (Nghetmui = có) then Cum = có If (Daudau = có) and (Thannhiet = cao) and (Onlanh = có) and (Nghetmui = có) then Cum = có If (Daudau = có) and (Dauco = có) and (Thannhiet = cao) and (Onlanh = có) then Cum = có If (Daudau = có) and (Thannhiet = cao) and (Onlanh = có) and (Ho = có) then Cum = có If (Dauco = có) and (Thannhiet = cao) and (Onlanh = có) and (Ho = có) then Cum = có Trong chương trình thử nghiệm, hệ thống nghiên cứu phương pháp, mơ hình chẩn đốn y học, thu thập liệu tri thức bệnh cúm để dùng việc trích chọn, từ bảng định xây dựng phụ thuộc hàm thể luật chẩn đoán bệnh lĩnh vực y tế Phương pháp giúp xây dựng luật dựa sở liệu (tri thức) lưu trữ Các luật kết hợp với tri thức (luật) kinh nghiệm chuyên gia (bác sĩ) Từ bệnh án bệnh nhân thể bảng định lưu trữ sở liệu, chương trình thực trích chọn thuộc tính (triệu chứng), khai phá luật phát bệnh, đưa phụ thuộc hàm thể luật chẩn đoán bệnh Thực tế cho thấy bệnh nhân lại có triệu chứng khác nhiều bệnh có triệu chứng giống khiến bác sĩ khó nhanh chóng đưa chẩn đốn giai đoạn đầu nên thơng thường để đưa Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 71 chẩn đốn xác bệnh mà bác sĩ nghi ngờ bệnh nhân mắc phải bệnh nhân cần chẩn đoán tất triệu chứng có liên quan đến bệnh Với tập luật tạo giống kinh nghiệm chuyên gia (bác sĩ) sau điều trị cho nhiều bệnh nhân mắc cúm thu cần dựa vào số triệu chứng thể tập luật thu từ phụ thuộc hàm đưa chẩn đốn cho bệnh nhân cách nhanh chóng xác Thực tế kết chuyên gia (bác sĩ) đánh giá giúp ích nhiều cho cơng tác điều trị Các luật chẩn đốn tạo bác sĩ Phạm Mạnh Toàn, bệnh viện 30/04 Bộ Cơng An đánh giá tương đối tốt Độ xác tập luật khẳng định rõ ràng sau bệnh nhân chẩn đoán mắc cúm dựa vào tập luật thu trải qua xét nghiệm cận lâm sàng bác sĩ khẳng định chắn mắc bệnh cúm Khi áp dụng tập luật bác sĩ nhanh chóng đưa chẩn đốn ban đầu bệnh nhân mắc bệnh cúm hay khơng để từ yêu cầu bệnh nhân tiến hành làm xét nghiệm cận lâm sàng cần thiết để đưa phương pháp điều trị phù hợp * Ý nghĩa việc xây dựng phụ thuộc hàm từ bảng định xây dựng cơng cụ hình thức để biểu diễn tất định dạng phụ thuộc hàm từ bảng định cho trước Từ sở liệu tri thức lưu trữ, qua lý thuyết tập thơ trích chọn số luật định với thuộc tính rút gọn Đóng góp tri thức, phát tri thức, luật rút gọn 3.4 Kết luận chương Trong chương hướng dẫn cài đặt chương trình trình bày kết thử nghiệm chương trình tìm phụ thuộc hàm từ bảng định tạo tập luật hỗ trợ định chẩn đoán bệnh dựa vào triệu chứng lâm sàng Đưa số giao diện cách sử dụng chạy chương trình Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 72 KẾT LUẬN Kết đạt luận văn Về mặt lý thuyết:  Hệ thống kiến thức khai phá liệu  Hệ thống hóa kiến thức lý thuyết tập thơ, trình bày kèm theo ví dụ minh họa cụ thể  Luận văn trình bày thuật tốn tìm thuộc tính rút gọn, tìm họ tất thuộc tính rút gọn, xác định phụ thuộc hàm từ bảng định, số thuật toán liên quan đến phụ thuộc hàm thuật toán xây dựng bảng định từ tập phụ thuộc hàm Về mặt thực nghiệm:  Luận văn cố gắng trình bày thuật tốn ngơn ngữ lập trình C#, xây dựng chương trình thử nghiệm chẩn đốn bệnh cúm dựa vào triệu chứng lâm sàng Hướng phát triển đề tài  Trên sở nghiên cứu trình bày luận văn, tiếp tục nghiên cứu sâu số thuật toán liên quan tới tập rút gọn bảng định quán  Xây dựng chương trình hồn thiện để có tính ứng dụng thực tế cao  Cải thiện chương trình với quy mơ liệu lớn  Nghiên cứu sâu để xây dựng hệ thống chẩn đoán nhiều bệnh Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 73 Tài liệu tham khảo A Tiếng Việt [1] Nguyễn Long Giang (2012), “Nghiên cứu số phương pháp khai phá liệu theo tiếp cận lý thuyết tập thô”, Luận án Tiến sĩ Tốn học, Viện Cơng Nghệ Thơng Tin, Viện Khoa học Công nghệ Việt Nam [2] Phùng Thị Thu Hiền (2014), “Nghiên cứu rút gọn tập thuộc tính hệ định giá trị tập”, Luận án tiến sĩ Toán học, Học viện Kĩ Thuật Quân Sự, Bộ Quốc Phòng [3] Vũ Thị Mai (2012), “Nghiên cứu ứng dụng lý thuyết tập thơ trích chọn liệu”, Luận văn Thạc sĩ, Học viện Công nghệ Bưu Chính Viễn Thơng [4] TS Lê Văn Phùng – Ths Quách Xuân Trưởng (2012), “Khai phá liệu”, Nhà xuất Thông Tin Truyền Thông [5] Vũ Đức Thi (2010), Giáo trình sở liệu nâng cao, Nhà xuất Đại học Thái Nguyên [6] Nguyễn Đức Thuần (2010), “Phủ tập thô độ đo đánh giá hiệu tập luật định”, Luận án Tiến sĩ Tốn học, Viện Cơng Nghệ Thơng Tin, Viện Khoa học Công nghệ Việt Nam B Tiếng Anh [7] Demetrovics J and Thi V.D (1987), “Keys, antikeys and prime attributes”, Ann Univ Scien Budapest Sect Comput 8, pp 37-54 [8] Demetrovics J and Thi V.D (1998), “Relations and minimal keys”, Acta Cybernetica 8, 3, pp 279-285 [9] Hu X.H and Cercone N (1995), “Learning in relational databases: a rough set approach”, International Journal of computational intelligence, pp 323-338 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 74 [10] Yao Y.Y., Zhao Y., Wang J (2006) On reduct construction algorithms, Proceedings of International Conference on Rough Sets and Knowledge Technology, pp 297-304 [11] Z.Pawlak (1991), Rough Sets: Theoretical Aspects of reasoning about data, Kluwer Academic Publisher, London C Tài Liệu Website [12] Bài giảng bệnh cúm (Grippe) http://www.dieutri.vn/bgtruyennhiem/2-11-2012/S2980/Bai-giangbenh-cum-Grippe.htm Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 75 PHỤ LỤC Trong phụ lục trình bày kết thử nghiệm mối quan hệ bảng định phụ thuộc hàm theo chiều ngược từ tập phụ thuộc hàm xây dựng bảng định Ý nghĩa việc xây dựng bảng định từ tập phụ thuộc hàm khẳng định tính đắn việc suy diễn đưa định phụ thuộc hàm Nghĩa ta thực suy diễn định tri thức biểu diễn dạng phụ thuộc hàm mà không quan tâm đến bảng liệu cụ thể Từ tập phụ thuộc hàm xây dựng bảng định Sử dụng bảng định thu kết để xây dựng phụ thuộc hàm - Bước 1: Áp dụng Thuật toán 2.16 Xây dựng bảng định từ SĐQH với sơ đồ quan hệ s  R, F  với R  a,b, c, d  C  a,b, c tập phụ , thuộc hàm F  a, c  R,a  a,b, d ,b, c  b, c, d  + Dữ liệu đầu vào: Sơ đồ quan hệ s = < R,F >; Tập phụ thuộc hàm F Đầu ra: Bảng định T  U ,C  d  Dưới giao diện thể mối quan hệ bảng định phụ thuộc hàm theo chiều từ tập phụ thuộc hàm xây dựng bảng định Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 76 + Kết quả: Với sơ đồ quan hệ s  R, F  với R  a,b, c, d  C  a,b, c tập , phụ thuộc hàm F  a, c  R,a  a,b, d ,b, c  b, c, d  cho ta thu bảng định sau: U A B C D u0 0 0 u1 1 u2 2 - Bước 2: Áp dụng thuật toán Thuật toán 2.9 Xây dựng phụ thuộc hàm từ bảng định với bảng định sau: Xét bảng định có thuộc tính đối tượng sau: U A B C D u0 0 0 u1 1 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 77 u2 2 + Dữ liệu đầu vào: - Bảng định T  U ,C  d  - Các đối tượng U  u0 ,u1,u2 - Các thuộc tính C  a,b, c Đầu ra: SĐQH sd  R, F  Dưới giao diện thể mối quan hệ bảng định phụ thuộc hàm theo chiều từ bảng định xây dựng phụ thuộc hàm + Kết quả: Tập tất thuộc tính rút gọn C: REAT  C   a,b, c Họ tất tập rút gọn bảng định T PRED  C   K  d   a,b, c Với bảng định cho ta có SĐQH cần xây dựng sd  R, F  với R  a,b, c, d  F  a  d ,b, c  d  Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 78 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ... dựng bảng định thỏa mãn tập phụ thuộc hàm cho trước nên lựa chọn đề tài Nghiên cứu mối quan hệ phụ thuộc hàm bảng định chẩn đoán bệnh luận văn cao học Trong vận dụng kiến thức nghiên cứu vào chẩn. .. gọn bảng định 36 2.1.3 Tập lõi bảng định 38 2.1.4 Thuật toán xác định phụ thuộc hàm từ bảng định 42 2.2 Xây dựng bảng định từ tập phụ thuộc hàm 44 2.2.1 Sự phụ thuộc thuộc tính bảng định. .. bảng định, toán xây dựng bảng định thỏa mãn tập phụ thuộc hàm cho trước Do tính hấp dẫn tính thời khai phá liệu, đặc biệt mối quan hệ phụ thuộc hàm bảng định để từ bảng định trích lọc phụ thuộc hàm

Ngày đăng: 31/12/2018, 19:13

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan