Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả

Thông tin tài liệu

Những đóng góp mới của luận án: Trong quá trình thực hiện luận án, tác giả đã có một số đóng góp mới cả về lý thuyết cũng như cài đặt mô phỏng, trong việc cải tiến cơ chế quản lý hàng đợi tích cực tại các nút mạng trên mạng TCP/IP, bằng cách xây dựng bộ điều khiển mờ thích nghi AFC và xây dựng bộ điều khiển nơ-ron mờ FNN để tìm ra bộ tham số của bộ mờ tối ưu cho bộ điều khiển mờ thích nghi AFC. Cụ thể như sau:  Phân tích, đánh giá và phân lớp ứng dụng cho các cơ chế quản lý hàng đợi tích cực hiện có. Đồng thời, áp dụng bộ điều khiển mờ truyền thống để cải tiến các cơ chế các cơ chế quản lý hàng đợi tích cực tiêu biểu nhằm nâng cao hiệu quả kiểm soát tắc nghẽn trong mạng TCP/IP.  Đề xuất mô hình điều khiển mờ thích nghi AFC để cải tiến các cơ chế quản lý hàng đợi tích cực. Dựa trên mô hình lý thuyết, luận án đã xây dựng các cơ chế cải tiến FLRED và FLREM. Kết quả cài đặt mô phỏng đã chứng minh tính hiệu quả của việc sử dụng điều khiển mờ thích nghi AFC để cải tiến các cơ chế quản lý hàng đợi tích cực.  Đề xuất mô hình kết hợp điều khiển mờ với mạng nơ-ron mờ tối ưu FNN để nâng cao hiệu quả của các cơ chế quản lý hàng đợi tích cực. Dựa trên mô hình lý thuyết, luận án đã xây dựng các cơ chế cải tiến FNNRED, FNNREM. Hai cơ chế này có được bằng cách sử dụng mạng nơ-ron mờ FNN huấn luyện cho các cơ chế FLRED và FLREM. Kết quả cài đăt mô phỏng cho thấy hiệu năng của các cơ chế được nâng lên khi sử dụng điều khiển mờ tối ưu FNN. Từ kết quả nghiên cứu lý thuyết và kiểm chứng bằng cài đặt mô phỏng, cho thấy hiệu năng của các cơ chế quản lý hàng đợi tích cực tại các nút mạng được tăng dần khi lần lượt áp dụng các bộ điều khiển mờ truyền thống, bộ điều khiển mờ thích nghi AFC và điều khiển mơ tối ưu để cải tiến. Kết quả của luận án mới chỉ là bước đầu trong quá trình nghiên cứu của chúng tôi. Một số vấn đề còn có thể nghiên cứu hoàn thiện hơn cả về mặt lý thuyết cũng như thực tiễn. N

ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC TRẦN THANH LƯƠNG HỌC KHÁI NIỆM CHO CÁC HỆ THỐNG THÔNG TIN DỰA TRÊN LOGIC MÔ TẢ LUẬN ÁN TIẾN SĨ MÁY TÍNH HUẾ, NĂM 2015 ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC TRẦN THANH LƯƠNG HỌC KHÁI NIỆM CHO CÁC HỆ THỐNG THÔNG TIN DỰA TRÊN LOGIC MÔ TẢ CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 62.48.01.01 LUẬN ÁN TIẾN SĨ MÁY TÍNH Người hướng dẫn khoa học: 1. PGS. TSKH. NGUYỄN ANH LINH 2. TS. HOÀNG THỊ LAN GIAO HUẾ, NĂM 2015 LỜI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu do tôi thực hiện dưới sự hướng dẫn của PGS. TSKH. Nguyễn Anh Linh và TS. Hoàng Thị Lan Giao. Những nội dung trong các công trình đã công bố chung với các tác giả khác đã được sự đồng ý của đồng tác giả khi đưa vào luận án. Các số liệu và kết quả nghiên cứu trình bày trong luận án là trung thực, khách quan và chưa được công bố bởi tác giả nào trong bất cứ công trình nào khác. Nghiên cứu sinh Trần Thanh Lương i LỜI CẢM ƠN Luận án này được thực hiện và hoàn thành tại Khoa Công nghệ Thông tin, Trường Đại học Khoa học, Đại học Huế. Trong suốt quá trình học tập, tôi đã nhận được sự quan tâm, giúp đỡ của thầy giáo, cô giáo hướng dẫn, thầy cô giáo trong Ban chủ nhiệm Khoa Công nghệ Thông tin, Phòng Đào tạo Sau đại học và Ban giám hiệu Trường Đại học Khoa học. Tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS. TSKH. Nguyễn Anh Linh và TS. Hoàng Thị Lan Giao, là những người Thầy đã tận tình hướng dẫn, động viên và truyền đạt những kinh nghiệm quý báu trong nghiên cứu khoa học để tôi có thể hoàn thành luận án này. Tôi xin chân thành cảm ơn Quý thầy cô giáo trong Ban chủ nhiệm Khoa Công nghệ Thông tin đã tạo điều kiện thuận lợi trong công tác để tôi có đủ thời gian cho công việc nghiên cứu của mình. Tôi xin cảm ơn Quý thầy cô và cán bộ của Phòng Đào tạo Sau Đại học, Ban giám hiệu Trường Đại học Khoa học đã giúp đỡ tôi trong việc hoàn thành kế hoạch học tập. Tôi xin trân trọng cảm ơn GS. TSKH. Andrzej Szalas, PGS. TS. Hà Quang Thụy, PGS. TSKH. Nguyễn Hùng Sơn đã đóng góp nhiều ý kiến quý báu trong quá trình nghiên cứu và công bố các công trình khoa học. Tôi xin trân trọng cảm ơn PGS. TS. Lê Mạnh Thạnh đã đọc và đưa ra những góp ý cho luận án. Tôi xin cảm ơn Quý thầy cô giáo và các anh chị đồng nghiệp trong Khoa Công nghệ Thông tin đã giúp đỡ, chia sẻ trong quá trình công tác, học tập, nghiên cứu và thực hiện luận án của mình. Tôi xin cảm ơn bạn bè đã động viên và đặc biệt là những người thân trong gia đình luôn luôn quan tâm, ủng hộ và tạo mọi điều kiện thuận lợi nhất cho tôi hoàn thành luận án này. Nghiên cứu sinh Trần Thanh Lương ii MỤC LỤC Lời cam đoan Lời cảm ơn Mục lục Danh mục từ viết tắt Danh mục các ký hiệu Danh mục bảng, biểu Danh mục hình vẽ Mở đầu Chương 1. Logic mô tả và cơ sở tri thức 1.1. Tổng quan về logic mô tả . . . . . . . . . . . . . . . . . . . . 1.1.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2. Ngôn ngữ logic mô tả ALC . . . . . . . . . . . . . . . 1.1.3. Biểu diễn tri thức . . . . . . . . . . . . . . . . . . . . 1.1.4. Khả năng biểu diễn . . . . . . . . . . . . . . . . . . . 1.1.5. Logic mô tả và các tên gọi . . . . . . . . . . . . . . . 1.2. Cú pháp và ngữ nghĩa của logic mô tả . . . . . . . . . . . . . 1.2.1. Logic mô tả ALC reg . . . . . . . . . . . . . . . . . . . 1.2.2. Ngôn ngữ logic mô tả LΣ,Φ . . . . . . . . . . . . . . . 1.3. Các dạng chuẩn . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1. Dạng chuẩn phủ định của khái niệm . . . . . . . . . . 1.3.2. Dạng chuẩn lưu trữ của khái niệm . . . . . . . . . . . 1.3.3. Dạng chuẩn nghịch đảo của vai trò . . . . . . . . . . . 1.4. Cơ sở tri thức trong logic mô tả . . . . . . . . . . . . . . . . 1.4.1. Bộ tiên đề vai trò . . . . . . . . . . . . . . . . . . . . 1.4.2. Bộ tiên đề thuật ngữ . . . . . . . . . . . . . . . . . . 1.4.3. Bộ khẳng định cá thể . . . . . . . . . . . . . . . . . . 1.4.4. Cơ sở tri thức và mô hình của cơ sở tri thức . . . . . 1.5. Suy luận trong logic mô tả . . . . . . . . . . . . . . . . . . . 1.5.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . 1.5.2. Các thuật toán suy luận . . . . . . . . . . . . . . . . . Tiểu kết Chương 1 . . . . . . . . . . . . . . . . . . . . . . . . . . Chương 2. Mô phỏng hai chiều trong logic mô tả và tính bất 2.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Mô phỏng hai chiều . . . . . . . . . . . . . . . . . . . . . . . 2.2.1. Khái niệm . . . . . . . . . . . . . . . . . . . . . . . . iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . biến . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i ii iii v vi vii viii 1 7 7 7 8 11 13 16 17 17 18 21 21 22 23 24 24 25 25 26 29 29 30 32 33 33 34 34 2.2.2. Quan hệ tương tự hai chiều và quan hệ tương đương . . . . . . 2.3. Tính bất biến đối với mô phỏng hai chiều . . . . . . . . . . . . . . . . 2.3.1. Quan hệ giữa mô phỏng hai chiều với các khái niệm và vai trò 2.3.2. Tính bất biến của khái niệm . . . . . . . . . . . . . . . . . . . 2.3.3. Tính bất biến của cơ sở tri thức . . . . . . . . . . . . . . . . . 2.4. Tính chất Hennessy-Milner đối với mô phỏng hai chiều . . . . . . . . 2.5. Tự mô phỏng hai chiều . . . . . . . . . . . . . . . . . . . . . . . . . . Tiểu kết Chương 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chương 3. Học khái niệm cho hệ thống thông tin trong logic mô tả 3.1. Hệ thống thông tin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1. Hệ thống thông tin truyền thống . . . . . . . . . . . . . . . . . 3.1.2. Hệ thống thông tin dựa trên logic mô tả . . . . . . . . . . . . . 3.2. Học khái niệm trong logic mô tả với Ngữ cảnh (3) . . . . . . . . . . . 3.2.1. Giới thiệu bài toán . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2. Bộ chọn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3. Tính đơn giản của khái niệm . . . . . . . . . . . . . . . . . . . 3.2.4. Độ đo dựa trên entropy . . . . . . . . . . . . . . . . . . . . . . 3.2.5. Thuật toán học khái niệm trong logic mô tả với Ngữ cảnh (3) . 3.3. Ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4. Kết quả thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . Tiểu kết Chương 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Chương 4. Học khái niệm cho cơ sở tri thức trong logic mô tả 4.1. Giới thiệu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Phân hoạch miền của diễn dịch . . . . . . . . . . . . . . . . . . . . . 4.3. Học khái niệm trong logic mô tả với Ngữ cảnh (1) . . . . . . . . . . . 4.3.1. Thuật toán BBCL . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2. Thuật toán dual-BBCL . . . . . . . . . . . . . . . . . . . . . . 4.3.3. Tính đúng đắn của thuật toán BBCL . . . . . . . . . . . . . . 4.3.4. Ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4. Học khái niệm trong logic mô tả với Ngữ cảnh (2) . . . . . . . . . . . 4.4.1. Thuật toán BBCL2 . . . . . . . . . . . . . . . . . . . . . . . . 4.4.2. Tính đúng đắn của thuật toán BBCL2 . . . . . . . . . . . . . . 4.4.3. Ví dụ minh họa . . . . . . . . . . . . . . . . . . . . . . . . . . Tiểu kết Chương 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Kết luận Danh mục các công trình của tác giả Tài liệu tham khảo iv . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 42 42 47 48 50 54 56 57 57 57 58 61 61 63 68 70 71 74 80 84 86 86 88 91 91 94 94 95 98 98 100 101 103 104 106 107 DANH MỤC TỪ VIẾT TẮT Từ viết tắt ABox Diễn giải Assertion Box Bộ khẳng định cá thể BBCL Bisimulation-Based Concept Learning Học khái niệm dựa trên mô phỏng hai chiều CWA Close World Assumption Giả thiết thế giới đóng LCS Least Common Subsumers Bao hàm chung nhỏ nhất OWA Open World Assumption Giả thiết thế giới mở OWL Web Ontology Language Ngôn ngữ Web Ontology PAC Probably Approximately Correct Khả năng học chính xác RBox Role Box Bộ tiên đề vai trò TBox Terminology Box Bộ tiên đề thuật ngữ W3C World Wide Web Consortium Tổ chức tiêu chuẩn quốc tế về World Wide Web v DANH MỤC CÁC KÝ HIỆU Ký hiệu Diễn giải ý nghĩa A, B Các thuộc tính/tên khái niệm C, D Các khái niệm r, s Các tên vai trò đối tượng R, S Các vai trò đối tượng a, b Các cá thể c, d Các phần tử thuộc miền giá trị σ, Các vai trò dữ liệu range(A) Miền giá trị của thuộc tính A range(σ) Miền giá trị của vai trò dữ liệu σ † Σ, Σ Các tập ký tự logic mô tả ΣI , Σ†I ΣC , Σ†C ΣA , Σ†A ΣdA , Σ†dA ΣnA , Σ†nA ΣoR , Σ†oR ΣdR , Σ†dR † Các tập cá thể Φ, Φ Các tập đặc trưng của logic mô tả ∼Σ† ,Φ† ,I Quan hệ LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất ≡Σ† ,Φ† ,I Quan hệ LΣ† ,Φ† -tương đương Ref Khẳng định vai trò phản xạ Irr Khẳng định vai trò không phản xạ Sym Khẳng định vai trò đối xứng Tra Khẳng định vai trò bắc cầu Dis Khẳng định vai trò không giao nhau R Bộ tiên đề vai trò T Bộ tiên đề thuật ngữ A Bộ khẳng định cá thể KB Cơ sở tri thức trong logic mô tả Các tập tên khái niệm Các tập thuộc tính Các tập thuộc tính rời rạc Các tập thuộc tính số Các tập tên vai trò đối tượng Các tập vai trò dữ liệu vi DANH MỤC BẢNG, BIỂU Bảng 3.1. Kết quả ước lượng trên tập dữ liệu WebKB, PokerHand và Family với 100 khái niệm ngẫu nhiên trong logic mô tả ALCIQ . . . . . . . Bảng 3.2. Kết quả ước lượng trên tập dữ liệu Family với 5 khái niệm phổ biến 81 trong logic mô tả ALCI . . . . . . . . . . . . . . . . . . . . . . . . . Bảng 3.3. Kết quả ước lượng trên tập dữ liệu Poker Hand với 6 tập đối tượng 82 trong logic mô tả ALCQ . . . . . . . . . . . . . . . . . . . . . . . . . 83 vii DANH MỤC HÌNH VẼ Hình 1.1. Hình 1.2. Hình 1.3. Hình 1.4. Diễn dịch của logic mô tả . . . . . . . . . . . . . . . Kiến trúc của một hệ cơ sở tri thức trong logic mô tả Diễn dịch của các vai trò phức và khái niệm phức . . Một minh họa cho cơ sở tri thức của Ví dụ 1.9 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 11 21 27 Hình 2.1. Các diễn dịch I và I trong LΣ,Φ của Ví dụ 1.10 . . . . . . . . . . . . 42 Hình 3.1. Hình 3.2. Hình 3.3. Hình 3.4. Hình 3.5. Hình 3.6. 60 76 77 78 79 79 Một minh họa cho cơ sở tri thức của Ví dụ 3.2 . . . . . . . . . . . . . Quá trình làm mịn phân hoạch của Ví dụ 3.5 . . . . . . . . . . . . . Quá trình làm mịn phân hoạch của Ví dụ 3.6 . . . . . . . . . . . . . Hệ thống thông tin tương ứng với cơ sở tri thức trong Ví dụ 3.7 . . . Quá trình làm mịn phân hoạch sử dụng các bộ chọn đơn giản . . . . Quá trình làm mịn phân hoạch sử dụng các bộ chọn đơn giản và mở rộng Hình 4.1. Quá trình làm mịn phân hoạch của Ví dụ 4.1 Hình 4.2. Quá trình làm mịn phân hoạch của Ví dụ 4.2 viii . . . . . . . . . . . . . . . . . . . . . . . . . . 90 91 MỞ ĐẦU Logic mô tả (Description Logics) là một họ các ngôn ngữ hình thức rất thích hợp cho việc biểu diễn và suy luận tri thức trong một miền quan tâm cụ thể [2]. Trong logic mô tả, miền quan tâm được mô tả thông qua các thuật ngữ về cá thể, khái niệm và vai trò. Một cá thể đại diện cho một đối tượng, một khái niệm đại diện cho một tập các đối tượng và một vai trò đại diện cho một quan hệ hai ngôi giữa các đối tượng. Các khái niệm phức được xây dựng từ các tên khái niệm, tên vai trò và tên cá thể bằng cách kết hợp với các tạo tử. Logic mô tả có tầm quan trọng đặc biệt trong việc cung cấp mô hình lý thuyết cho các hệ thống ngữ nghĩa. Nó là nền tảng cơ bản trong việc xây dựng các ngôn ngữ để mô hình hóa các ontology, trong đó Web Ontology Language (OWL) là ngôn ngữ được tổ chức tiêu chuẩn quốc tế World Wide Web Consortium (W3C) khuyến nghị sử dụng cho các hệ thống Web ngữ nghĩa (Semantic Web). Về cơ bản, OWL là một ngôn ngữ dựa trên các logic mô tả [25], [26], [27]. Phiên bản đầu tiên của OWL (được giới thiệu vào năm 2004) dựa trên logic mô tả SHOIN và SHOIQ [25], [27], phiên bản thứ hai của OWL là OWL 2 (được giới thiệu năm 2009) dựa trên logic mô tả SROIQ [26]. Logic mô tả SHOIN , SHOIQ và SROIQ có khả năng biểu diễn rất tốt nhưng lại có độ phức tạp tính toán đối với các thuật toán suy luận rất cao (tương ứng là NExpTime-đầy đủ cho SHOIN , SHOIQ và NExpTime-khó cho SROIQ) và độ phức tạp dữ liệu cũng cao (NP-khó) đối với những bài toán suy luận cơ bản. Do vây, W3C khuyến khích nên sử dụng OWL 2 EL, OWL 2 QL và OWL 2 RL, là những ngôn ngữ con của OWL 2 Full với độ phức tạp dữ liệu đa thức tương ứng với miền quan tâm, mô để hình hóa các hệ thống ngữ nghĩa. Web ngữ nghĩa là một lĩnh vực đang phát triển rất nhanh và nhận được sự quan tâm của cộng đồng nghiên cứu trong thập niên vừa qua. Công nghệ Web ngữ nghĩa đang được áp dụng vào nhiều lĩnh vực khác nhau trong thực tế như: tin sinh học, tin học trong y tế, trình duyệt web ngữ nghĩa, quản trị tri thức, kỹ nghệ phần mềm, . . . Một trong các tầng cơ bản và đóng vai trò quan trọng trong Web ngữ nghĩa là ontology - thành phần được sử dụng để biểu diễn tri thức và suy luận cho Web ngữ nghĩa. Xây dựng ontology cho các hệ thống Web ngữ nghĩa và đặc tả các khái niệm phù hợp là một trong những vấn đề rất được quan tâm trong công nghệ ontology. Do vậy, bài toán đặt ra là cần tìm được các khái niệm quan trọng và xây dựng được định nghĩa 1 cho các khái niệm đó. Học khái niệm trong logic mô tả nhằm mục đích kiểm tra, suy luận và tìm ra được các khái niệm này phục vụ cho các ứng dụng cụ thể. Vấn đề học khái niệm trong logic mô tả tương tự như phân lớp nhị phân trong học máy truyền thống. Tuy nhiên, việc học khái niệm trong ngữ cảnh logic mô tả khác với học máy truyền thống ở điểm, các đối tượng không chỉ được đặc tả bằng các thuộc tính mà còn được đặc tả bằng các mối quan hệ giữa các đối tượng. Các mối quan hệ này là một trong những yếu tố làm giàu thêm ngữ nghĩa của hệ thống huấn luyện. Do đó, các phương pháp học khái niệm trong logic mô tả cần phải tận dụng được chúng như là một lợi thế. Thông qua việc khảo sát các công trình [4], [17], [32], [35], [15], [16], [36], [44], chúng tôi khái quát vấn đề học khái niệm trong logic mô tả theo ba ngữ cảnh chính như sau: • Ngữ cảnh (1): Cho cơ sở tri thức KB trong logic mô tả LΣ,Φ và các tập các cá thể E + , E − . Học khái niệm C trong LΣ,Φ sao cho: 1. KB |= C(a) với mọi a ∈ E + , và 2. KB |= ¬C(a) với mọi a ∈ E − . trong đó, tập E + chứa các mẫu dương và E − chứa các mẫu âm của C. • Ngữ cảnh (2): Ngữ cảnh này khác với ngữ cảnh đã đề cập ở trên là điều kiện thứ hai được thay bằng một điều kiện yếu hơn: 1. KB |= C(a) với mọi a ∈ E + , và 2. KB |= C(a) với mọi a ∈ E − . • Ngữ cảnh (3): Cho một diễn dịch I và các tập các cá thể E + , E − . Học khái niệm C trong logic mô tả LΣ,Φ sao cho: 1. I |= C(a) với mọi a ∈ E + , và 2. I |= ¬C(a) với mọi a ∈ E − . Chú ý rằng I |= ¬C(a) tương đồng với I |= C(a). Mô tả chi tiết của các ngữ cảnh được trình bày trong các chương tiếp theo, trong đó Ngữ cảnh (1) được trình bày trong Mục 3.2, Ngữ cảnh (2) được trình bày trong Mục 4.3 và Ngữ cảnh (3) được trình bày trong Mục 4.4. Học khái niệm trong logic mô tả đã được nhiều nhà khoa học quan tâm nghiên cứu và chia thành ba hướng tiếp cận chính. Hướng tiếp cận thứ nhất tập trung vào khả năng học trong logic mô tả [10], [11], [19] và xây dựng một số thuật toán đơn giản 2 liên quan [51], [11], [19], [33]. Hướng tiếp cận thứ hai nghiên cứu học khái niệm trong logic mô tả bằng cách sử dụng các toán tử làm mịn (refinement operators) [4], [17], [32], [35], [15], [16], [36]. Hướng tiếp cận thứ ba khai thác mô phỏng hai chiều (bisimulation) cho bài toán học khái niệm trong logic mô tả [44]. Quinlan nghiên cứu việc học các định nghĩa của mệnh đề Horn từ các dữ liệu được biểu diễn thông qua các quan hệ và đề xuất thuật toán học Foil [51]. Cohen và Hirsh nghiên cứu lý thuyết về khả năng học (Probably Approximately Correct - PAC) trong logic mô tả và đề xuất thuật toán học khái niệm LCSLearn dựa trên các “bao hàm chung nhỏ nhất” (least common subsumers) [10], [11]. Frazier và Pitt đã nghiên cứu về khả năng học trong logic mô tả Classic bằng cách sử dụng các truy vấn trên mô hình học PAC [19]. Lambrix và Larocchia đã đề xuất một thuật toán học khái niệm đơn giản dựa trên việc chuẩn hóa khái niệm và lựa chọn khái niệm thông qua các thể hiện của dạng chuẩn hóa [33]. Trong hướng tiếp cận thứ hai, Badea và Nienhuys-Cheng nghiên cứu học khái niệm trong logic mô tả ALER bằng cách sử dụng toán tử làm mịn như trong lập trình logic đệ quy [4]. Các tác giả đã giới thiệu một số tính chất của toán tử làm mịn và sử dụng chúng để thực hiện tìm kiếm theo chiến lược từ trên xuống. Iannone và cộng sự cũng nghiên cứu các thuật toán học bằng cách sử dụng toán tử làm mịn nhưng trên một logic mô tả giàu ngữ nghĩa hơn, logic mô tả ALC. Ý tưởng chính của các thuật toán này là tìm và loại bỏ những phần của khái niệm dẫn đến lỗi về phân loại [32]. Cả hai công trình trên đều nghiên cứu việc học khái niệm trong logic mô tả với Ngữ cảnh (1). Fanizzi cùng các cộng sự nghiên cứu toán tử làm mịn trên xuống trong logic mô tả ALN [17] và xây dựng hệ thống DL-Foil [15] cho việc học khái niệm trong logic mô tả hỗ trợ ngôn ngữ OWL. Các tác giả đã sử dụng kỹ thuật học bán giám sát với dữ liệu không gán nhãn. Các thành phần chính của hệ thống sử dụng tập các toán tử làm mịn tương tự như trong công trình của Badea và Nienhuys-Cheng [4]. Lehmann và Hitzler đề xuất thuật toán học DL-Learner theo phương pháp lập trình đệ quy và có khai thác thêm các kỹ thuật về lập trình di truyền [35], [36]. Các công trình này nghiên cứu việc học khái niệm trong logic mô tả với Ngữ cảnh (2). Ngoài việc sử dụng các toán tử làm mịn, các hàm tính điểm và chiến lược tìm kiếm cũng đóng vai trò quan trọng đối với các thuật toán đã được đề xuất trong những công trình nêu trên [4], [32], [35], [15], [36]. Hướng tiếp cận thứ ba sử dụng mô phỏng hai chiều trong logic mô tả [12], [44], [14]. Nguyen và Szalas đã áp dụng mô phỏng hai chiều vào trong logic mô tả để mô hình hóa tính không phân biệt được của các đối tượng [44]. Dựa trên tự mô phỏng hai chiều 3 lớn nhất, các tác giả đã đề xuất một phương pháp tổng quát để học khái niệm cho các hệ thống thông tin trong logic mô tả. Đây là công trình tiên phong trong việc sử dụng mô phỏng hai chiều cho việc giải quyết bài toán trên. Divroodi [12] và cộng sự đã nghiên cứu khả năng học trong logic mô tả sử dụng mô phỏng hai chiều. Các công trình này nghiên cứu bài toán học khái niệm trong logic mô tả với Ngữ cảnh (3). Ngoại trừ công trình của Nguyen và Szalas [44], Divrooodi [12] sử dụng mô phỏng hai chiều trong logic mô tả để hướng dẫn việc tìm kiếm khái niệm kết quả. Tất cả các công trình nghiên cứu còn lại [51], [11], [33], [4], [32], [17], [15], [35], [16], [36] đều sử dụng toán tử làm mịn như trong lập trình logic đệ quy và/hoặc các chiến lược tìm kiếm dựa vào các hàm tính điểm mà không sử dụng mô phỏng hai chiều. Các công trình này chủ yếu tập trung vào vấn đề học khái niệm với Ngữ cảnh (1) và Ngữ cảnh (2) trên các logic mô tả khá đơn giản ALER, ALN và ALC. Việc nghiên cứu học khái niệm trong các logic mô tả phức tạp hơn như ALCN , ALCQ, ALCIQ, SHIF, SHIQ, SHOIN , SHOIQ, SROIQ, . . . với các ngữ cảnh khác nhau chưa được các công trình trên đề cập đến vì còn gặp nhiều vấn đề khó khăn về mặt kỹ thuật đối với các toán tử làm mịn. Trong công trình [44], Nguyen và Szalas đã sử dụng mô phỏng hai chiều cho việc học khái niệm trong các logic mô tả chỉ với Ngữ cảnh (3) nhưng không đề cập đến các thuộc tính và vai trò dữ liệu trong hệ thống thông tin cũng như các đặc trưng quan trọng của logic mô tả như: F (tính chất hàm), N (hạn chế số lượng không định tính). Do không đề cập đến các thuộc tính và vai trò dữ liệu nên lớp các logic mô tả này không thể biểu diễn những hệ thống thông tin có chứa thuộc tính số và thuộc tính đa trị cũng như không giải quyết tốt những bài toán trong các logic mô tả SHIF, SHIN , SHOIN ,. . . Trong công trình [12], Divroodi và các cộng sự chỉ nghiên cứu về mô phỏng hai chiều và áp dụng để giải quyết bài toán khả năng học trong logic mô tả với Ngữ cảnh (3). Hai công trình trên không đề cập đến vấn đề học khái niệm trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2). Từ các khảo sát như đã nêu ở trên, chúng ta nhận thấy rằng học khái niệm trong logic mô tả là một vấn đề quan trọng trong việc xây dựng các khái niệm hữu ích phục vụ cho các hệ thống ngữ nghĩa nói chung và ontolgy nói riêng. Từ đó, nó tác động lên nhiều ứng dụng trong thực tế có áp dụng Web ngữ nghĩa vào hệ thống. Học khái niệm trong logic mô tả dựa trên mô phỏng hai chiều là một hướng đi mới chưa từng được nghiên cứu ngoại trừ công trình của Nguyen và Szalas [44], Divroodi [12] với một số kết quả ban đầu như đã đề cập ở trên. Trên cơ sở các kết quả của Nguyen, Szalas và Divroodi [44], [12], luận án tập trung nghiên cứu các phương pháp học khái niệm trong logic mô tả dựa trên mô phỏng hai chiều với các mục tiêu chính đặt ra là: 4 • Nghiên cứu cú pháp, ngữ nghĩa đối với một lớp lớn các logic mô tả giàu ngữ nghĩa hơn so với các công trình đã có bằng cách cho phép sử dụng các thuộc tính như là các phần tử cơ bản của ngôn ngữ, các quan hệ thông qua các vai trò dữ liệu và đề cập đến đặc trưng F, N . Lớp các logic này bao phủ những logic mô tả hữu ích như ALC, SHIF, SHIQ, SHOIN , SHOIQ, SROIQ, . . . • Xây dựng, mở rộng các định nghĩa, định lý, bổ đề về mô phỏng hai chiều trong lớp các logic mô tả đã đề cập ở trên và sử dụng nó để mô hình hóa tính không phân biệt được của các đối tượng làm cơ sở cho các thuật toán học khái niệm trong logic mô tả. • Phát triển thuật toán học khái niệm dựa trên mô phỏng hai chiều cho các hệ thống thông tin trong logic mô tả với Ngữ cảnh (3). • Xây dựng phương pháp làm mịn phân hoạch miền của các diễn dịch trong logic mô tả dựa trên mô phỏng hai chiều sử dụng các bộ chọn hợp lý và độ đo gia lượng thông tin. • Đề xuất các thuật toán học khái niệm cho các cơ sở tri thức trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2) sử dụng mô phỏng hai chiều. Nội dung của luận án được trình bày trong bốn chương: Chương 1 trình bày cú pháp và ngữ nghĩa của logic mô tả, khả năng biểu diễn của logic mô tả. Xây dựng ngôn ngữ logic mô tả lấy các thuộc tính làm thành phần cơ bản của ngôn ngữ, cho phép sử dụng vai trò dữ liệu cũng như mở rộng tập các đặc trưng của logic mô tả so với các công trình đã có. Trên cơ sở đó, chương này đề cập đến cơ sở tri thức, mô hình của cơ sở tri thức và những vấn đề cơ bản về suy luận trong logic mô tả. Chương 2 giới thiệu mô phỏng hai chiều trên lớp các logic mô tả đã đề cập ở Chương 1. Chúng tôi phát biểu các định nghĩa, định lý, bổ đề mở rộng về mô phỏng hai chiều và chứng minh tính bất biến đối với mô phỏng hai chiều cho các khái niệm, bộ tiên đề thuật ngữ, bộ khẳng định và cơ sở tri thức đối với các logic mô tả đang nghiên cứu. Đặc biệt tính bất biến của khái niệm là nền tảng cho phép mô hình hóa tính không phân biệt được của các đối tượng thông qua ngôn ngữ con. Đây là cơ sở cho việc sử dụng ngôn ngữ con trong quá trình xây dựng các thuật toán học khái niệm. Chương 3 trình bày thuật toán học khái niệm cho các hệ thống thông tin trong logic mô tả với Ngữ cảnh (3) (thể hiện qua Thuật toán 3.1). Thuật toán này cho phép học một khái niệm từ một hệ thống thông tin huấn luyện trong logic mô tả với tập 5 các mẫu dương và mẫu âm cho trước. Chúng tôi đã sử dụng bộ chọn cơ bản, bộ chọn đơn giản và bộ chọn mở rộng kết hợp với độ đo gia lượng thông tin để phân chia các khối trong quá trình làm mịn các phân hoạch miền của diễn dịch. Ngoài ra, chương này còn trình bày các kết quả thực nghiệm đối với thuật toán đã đề xuất. Chương 4 trình bày các thuật toán học khái niệm cho các cơ sở tri thức trong logic mô tả với Ngữ cảnh (1) và Ngữ cảnh (2), bao gồm thuật toán BBCL, dual-BBCL và BBCL2. Các thuật toán này sử dụng các mô hình của cơ sở tri thức kết hợp với mô phỏng hai chiều trong mô hình đó (để mô hình hóa tính không phân biệt được) và cây quyết định (để phân lớp dữ liệu) cho việc tìm kiếm khái niệm cần học. Chúng tôi cũng chứng minh tính đúng đắn của thuật toán thông qua các mệnh đề liên quan. Cuối cùng, phần kết luận trình bày tóm tắt những đóng góp chính của luận án, hướng phát triển và những vấn đề cần phải giải quyết trong tương lai. 6 Chương 1. LOGIC MÔ TẢ VÀ CƠ SỞ TRI THỨC 1.1. Tổng quan về logic mô tả 1.1.1. Giới thiệu Các nghiên cứu về biểu diễn tri thức được đặt ra từ những năm 70 của thế kỷ XX. Những công trình nghiên cứu đầu tiên trong lĩnh vực này dựa trên hướng tiếp cận phi logic. Hướng tiếp cận này sử dụng đồ thị làm nền tảng, trong đó tri thức được biểu diễn bằng những cấu trúc dữ liệu đặc biệt và việc suy luận được thực hiện thông qua các thủ tục thao tác trên những cấu trúc đó. Năm 1967, Quillian [49] đã sử dụng mạng ngữ nghĩa (semantic networks) để biểu diễn và suy luận tri thức thông qua các cấu trúc nhận thức dạng mạng lưới. Sau đó, năm 1974, Minsky giới thiệu hệ thống khung (frame systems) dựa trên các khái niệm về một “khung” như một giao thức và khả năng biểu diễn các mối quan hệ giữa các khung [37]. Hướng tiếp cận như trên không trang bị được ngữ nghĩa dựa trên logic hình thức. Để khắc phục nhược điểm này, người ta biểu diễn tri thức theo hướng tiếp cận dựa trên logic. Theo đó, ngôn ngữ biểu diễn thường là một biến thể của logic vị từ bậc nhất và việc tính toán, suy luận thường dựa vào các hệ quả logic. Logic mô tả được thiết kế như là một sự mở rộng của mạng ngữ nghĩa và hệ thống khung với ngữ nghĩa dựa trên logic. Nó là một họ các ngôn ngữ hình thức rất thích hợp cho việc biểu diễn và suy luận tri thức trong một miền quan tâm cụ thể [2]. Thuật ngữ “logic mô tả” được sử dụng rộng rãi từ những năm 80 của thế kỷ XX. Ngày nay, cùng với sự phát triển của các hệ thống biểu diễn tri thức, logic mô tả đã trở thành một nền tảng quan trọng của Web ngữ nghĩa do nó được sử dụng để cung cấp mô hình lý thuyết trong việc thiết kế các ontology. Logic mô tả được xây dựng dựa vào ba thành phần cơ bản gồm tập các cá thể (có thể hiểu như là các đối tượng), tập các khái niệm nguyên tố (có thể hiểu như là các lớp, các vị từ một đối) và tập các vai trò nguyên tố (có thể hiểu như là các quan hệ hai ngôi, các vị từ hai đối). Các logic mô tả khác nhau được đặc trưng bởi tập các tạo tử khái niệm và tạo tử vai trò mà nó được phép sử dụng để xây dựng các khái niệm phức, vai trò phức từ các khái niệm nguyên tố và vai trò nguyên tố. 7 Năm 1985, hệ thống biểu diễn tri thức dựa trên logic mô tả đầu tiên KL-one [56], [7] ra đời đã đánh dấu một sự khởi đầu mạnh mẽ về nghiên cứu logic mô tả. Một số hệ thống biểu diễn tri thức dựa trên logic mô tả khác tiếp tục xuất hiện sau đó là LOOM (1987), BACK (1988), CLASSIC (1991). Các hệ thống này có bộ suy luận sử dụng các thuật toán bao hàm cấu trúc. Gần đây, các hệ thống biểu diễn tri thức sử dụng các ngôn ngữ logic mô tả có khả năng biểu diễn tốt hơn như SHOIN , SHOIQ, SROIQ,. . . và các bộ suy luận hiệu quả hơn như FaCT (1998), RACER (2001), CEL (2005) và KAON 2 (2005) [53]. Các bộ suy luận này sử dụng các thuật toán tableaux để giải quyết các bái toán suy luận. 1.1.2. Ngôn ngữ logic mô tả ALC Logic mô tả cơ bản ALC được Schmidt-Schaubß và Smolka giới thiệu lần đầu tiên vào năm 1991 [55]. Tên ALC đại diện cho “Attribute concept Language with Complements”. Trên cơ sở logic mô tả cơ bản ALC, người ta mở rộng nó để có các logic mô tả khác có khả năng biểu diễn tốt hơn bằng cách thêm vào các tạo tử khái niệm và tạo tử vai trò. Các định nghĩa sau đây trình bày cú pháp và ngữ nghĩa của logic mô tả cơ bản ALC [34], [36]. Định nghĩa 1.1 (Cú pháp của ALC). Cho ΣC là tập các tên khái niệm và ΣR là tập các tên vai trò (ΣC ∩ ΣR = ∅). Các phần tử của ΣC được gọi là khái niệm nguyên tố. Logic mô tả ALC cho phép các khái niệm được định nghĩa một cách đệ quy như sau: • Nếu A ∈ ΣC thì A là một khái niệm của ALC, • Nếu C, D là các khái niệm và r ∈ ΣR là một vai trò thì , ⊥, ¬C, C D, C D, ∃r.C và ∀r.C cũng là các khái niệm của ALC. Các ký hiệu và các tạo tử khái niệm trong Định nghĩa 1.1 có ý nghĩa như sau: • gọi là khái niệm đỉnh, • ⊥ gọi là khái niệm đáy, • ¬C biểu diễn phủ định của khái niệm C, • C D biểu diễn giao của khái niệm C và D, • C D biểu diễn hợp của khái niệm C và D, • ∃r.C biểu diễn hạn chế tồn tại của khái niệm C bởi vai trò r, • ∀r.C biểu diễn hạn chế phổ quát của khái niệm C bởi vai trò r. 8 Cú pháp của logic mô tả ALC có thể mô tả một cách vắn tắt bằng các luật sau: C, D −→ A | | ⊥ | ¬C | C D|C D | ∃r.C | ∀r.C Định nghĩa 1.2 (Ngữ nghĩa của ALC). Một diễn dịch trong logic mô tả ALC là một bộ I = ∆I , ·I , trong đó ∆I là một tập khác rỗng được gọi là miền của I và ·I là một ánh xạ, được gọi là hàm diễn dịch của I, cho phép ánh xạ mỗi cá thể a ∈ ΣI thành một phần tử aI ∈ ∆I , mỗi tên khái niệm A ∈ ΣC thành một tập AI ⊆ ∆I và mỗi tên vai trò r ∈ ΣR thành một quan hệ hai ngôi rI ⊆ ∆I × ∆I . Diễn dịch của các khái niệm phức được xác định như sau: I = ∆I , ⊥I = ∅, (¬C)I = ∆I \ C I , (∃r.C)I = {x ∈ ∆I | ∃y ∈ ∆I [rI (x, y) ∧ C I (y)]}, (C D)I = C I ∩ DI , (∀r.C)I = {x ∈ ∆I | ∀y ∈ ∆I [rI (x, y) ⇒ C I (y)]}, (C D)I = C I ∪ DI . Hình 1.1 minh họa ngắn gọn cho diễn dịch trong logic mô tả. Mỗi cá thể được diễn dịch thành một đối tượng, mỗi khái niệm được diễn dịch thành một tập các đối tượng và mỗi vai trò được diễn dịch thành một quan hệ hai ngôi giữa các đối tượng [21]. Tên khái niệm Tên vai trò . . . a ∈ ΣI . . . . . . A ∈ ΣC . . . . . . r ∈ ΣR . . . diễn dịch I aI ∆I bộ ký tự Tên cá thể AI rI Hình 1.1: Diễn dịch của logic mô tả Ví dụ 1.1. Giả sử chúng ta có các cá thể, khái niệm nguyên tố và vai trò nguyên tố như sau: LAN, HAI, HUNG là các cá thể, Human là khái niệm chỉ các đối tượng là con người, 9 F emale là khái niệm chỉ các đối tượng là giống cái, Rich là khái niệm chỉ những đối tượng giàu có, hasChild là vai trò chỉ đối tượng này có con là đối tượng kia, hasDescendant là vai trò chỉ đối tượng này có con cháu là đối tượng kia, marriedT o là vai trò chỉ đối tượng này kết hôn với đối tượng kia. Với những khái niệm nguyên tố, vai trò nguyên tố đã cho ở trên và các tạo tử phủ định của khái niệm (¬), giao của các khái niệm ( ), hợp của các khái niệm ( ), lượng từ hạn chế tồn tại (∃), lượng từ hạn chế với mọi (∀), chúng ta có thể xây dựng các khái niệm phức như sau: Human F emale là khái niệm chỉ các đối tượng là người phụ nữ, Human ∃hasChild.F emale là khái niệm chỉ các đối tượng là người có con gái, Human ∃marriedT o.Human là khái niệm chỉ những người đã kết hôn, Human F emale Human ∀hasChild.F emale Rich là khái niệm chỉ những người phụ nữ giàu có, là khái niệm chỉ những người chỉ có toàn con gái hoặc những người không có con. Ngoài ra chúng ta có thể dùng khái niệm đỉnh (ký hiệu ), khái niệm đại diện cho tất cả các đối tượng và khái niệm đáy (ký hiệu ⊥), khái niệm không đại diện cho bất kỳ đối tượng nào, để xây dựng các khái niệm phức. Chẳng hạn như sau: Human ∃hasChild. là khái niệm chỉ các đối tượng là người có con, Human ∀hasChild.⊥ là khái niệm chỉ những người không có con. Ví dụ 1.2. Cho tập các cá thể, khái niệm và vai trò như trong Ví dụ 1.1. Xét diễn dịch I như sau: LANI = LAN, HAII = HAI, HUNGI = HUNG, ∆I = {LAN, HAI, HUNG}, HumanI = {LAN, HAI, HUNG}, F emaleI = {LAN}, RichI = {HUNG}, hasChildI = { LAN, HUNG , HAI, HUNG }, marriedT oI = { LAN, HAI , HAI, LAN }, 10 Lúc đó ta có: F emale)I (Human = {LAN}, (¬F emale)I = {HAI, HUNG}, (Human ¬F emale)I = {HAI, HUNG}, (Human ∃hasChild.F emale)I = ∅, (Human ∃marriedT o.Human)I = {LAN, HAI}. 1.1.3. Biểu diễn tri thức Từ các cá thể, các khái niệm và các vai trò, người ta có thể xây dựng một hệ thống để biểu diễn và suy luận tri thức dựa trên logic mô tả. Thông thường, một hệ thống biểu diễn và suy luận tri thức gồm có các thành phần sau [2]: ✂✍ ✂ ✂ H Ệ KB - CƠ SỞ TRI THỨC ✂ T H Ố N G ✛ ✂ ✂ RBox ✂ ✬✩ - Bộ tiên đề vai trò DL ✲ TBox - Bộ ✫✪ ❇ Logic mô tả ❇ ❇ ❇ ABox ❇ ❇ ❇ ❇◆ tiên đề thuật ngữ Bộ khẳng định ✛ S U Y L U Ậ N ✲ G I ✛ A O ✛ ✲ D I Ệ N ✛ ✲ Hình 1.2: Kiến trúc của một hệ cơ sở tri thức trong logic mô tả • Bộ tiên đề vai trò (Role Box - RBox): Bộ tiên đề vai trò chứa các tiên đề về vai trò bao gồm các tiên đề bao hàm vai trò và các khẳng định vai trò. Thông qua bộ tiên đề vai trò, chúng ta có thể xây dựng các vai trò phức từ các vai trò nguyên tố và các tạo tử vai trò mà logic mô tả được phép sử dụng. Ví dụ 1.3. Với các vai trò nguyên tố đã cho trong Ví dụ 1.1, chúng ta có thể xây dựng bộ tiên đề vai trò như sau: hasP arent ≡ hasChild− , hasChild hasDescendant, hasDescendant ◦ hasDescendant hasDescendant. Phát biểu đầu tiên để định nghĩa vai trò mới hasP arent là một vai trò nghịch đảo của vai trò hasChild. Tiên đề thứ hai là một tiên đề bao hàm vai trò dùng để chỉ nếu 11 một đối tượng này là con của đối tượng kia thì nó cũng là con cháu của đối tượng kia. Phát biểu thứ ba là một tiên đề thể hiện rằng hasDescendant là một vai trò bắc cầu. • Bộ tiên đề thuật ngữ (Terminology Box - TBox): Bộ tiên đề thuật ngữ chứa các tiên đề về thuật ngữ, nó cho phép xây dựng các khái niệm phức từ những khái niệm nguyên tố và vai trò nguyên tố, đồng thời bộ tiên đề thuật ngữ cho biết mối quan hệ giữa các khái niệm thông qua các tiên đề bao hàm tổng quát. Chúng ta xét ví dụ sau về mối quan hệ giữa các con người với nhau thông qua bộ tiên đề thuật ngữ. Ví dụ 1.4. Với các khái niệm nguyên tố, vai trò nguyên tố đã cho trong Ví dụ 1.1, chúng ta có thể xây dựng bộ tiên đề thuật ngữ như sau: Human ≡ , M ale ≡ ¬F emale, Husband ≡ M ale Husband M ale ∃marriedT o.F emale, ∀marriedT o.F emale, F emale ≡ ⊥. Phát biểu đầu tiên của bộ tiên đề thuật ngữ dùng để nói lên rằng miền quan tâm chỉ gồm các đối tượng là con người. Hai phát biểu tiếp theo dùng để định nghĩa các khái niệm mới đó là M ale và Husband tương ứng dùng để chỉ những đối tượng là giống đực và chồng. Phát biểu thứ tư yêu cầu mọi thể hiện của Husband phải thỏa mãn khái niệm ∀marriedT o.F emale, nghĩa là, mọi người đàn ông đã kết hôn (được gọi là chồng) thì phải kết hôn với một người phụ nữ. Phát biểu cuối cùng để biểu diễn hai khái niệm M ale và F emale không giao nhau. • Bộ khẳng định (Assertion Box - ABox): Bộ khẳng định dùng để chứa những tri thức đã biết thông qua các khẳng định về các cá thể bao gồm khẳng định khái niệm, khẳng định vai trò, khẳng định đẳng thức, khẳng định bất đẳng thức, . . . Chúng ta xét ví dụ sau đây với các khẳng định về thông tin của con người. Ví dụ 1.5. Với các khái niệm nguyên tố, vai trò nguyên tố đã cho trong Ví dụ 1.1 và các khái niệm được định nghĩa thêm trong Ví dụ 1.4, chúng ta có thể cung cấp những khẳng định sau đây: Human(LAN), M ale(HUNG), Husband(HAI), hasChild(LAN, HUNG), (¬F emale Rich)(HUNG). 12 Khẳng định thứ nhất cho biết cá thể LAN là một con người, khẳng định thứ hai cho biết cá thể HUNG là một đối tượng giống đực, khẳng định thứ ba cho biết cá thể HAI là một người chồng, khẳng định thứ tư cho biết cá thể LAN có con là cá thể HUNG và khẳng định cuối cùng cho biết cá thể HUNG là một người đàn ông giàu có. Ngoài ra, một hệ thống biểu diễn tri thức còn có thêm các thành phần bổ trợ để thực hiện các chức năng mà hệ thống đó hướng tới. Thông thường, hệ thống biểu diễn tri thức còn có thêm những thành phần sau [2]: • Hệ thống suy luận (Inference System - IS): Hệ thống suy luận cho phép trích rút ra những tri thức tiềm ẩn từ những tri thức đã có được thể hiện trong RBox, TBox và ABox. Một trong những bài toán suy luận phổ biến trong logic mô tả là kiểm tra xem một cá thể có phải là thể hiện của một khái niệm hay không. Thông qua Ví dụ 1.4 và 1.5, chúng ta có thể suy luận ra rằng cá thể HAI là một thể hiện của khái niệm M ale. Lý do đưa ra khẳng định này là: HAI là thể hiện của Husband, mà Husband là khái niệm được định nghĩa thông qua phát biểu Husband ≡ M ale ∃marriedT o.Human. Một bài toán suy luận khác cũng phổ biến của logic mô tả là kiểm tra tính bao hàm của các khái niệm. Qua Ví dụ 1.4, chúng ta thấy rằng cả M ale và F emale đều được bao hàm trong Human. Một điểm lưu ý là, chúng ta không xem xét một cơ sở tri thức theo giả thiết thế giới đóng (Closed World Assumption - CWA) mà xem xét nó theo giả thiết thế giới mở (Open World Assumption - OWA). Nghĩa là, những khẳng định xuất hiện trong ABox thì được cho là đúng. Ngược lại, những khẳng định không xuất hiện trong ABox và không thể suy luận được thông qua bộ suy luận thì không được kết luận là sai mà phải được xem như là chưa biết, ngoại trừ chúng ta suy luận được khẳng định đó sai. • Giao diện người dùng (User Interface - UI): Giao diện người dùng được sử dụng để giao tiếp với người sử dụng. Thông qua giao diện này, người sử dụng có thể trích rút ra những thông tin từ cơ sở tri thức. Giao diện người dùng được thiết kế tùy thuộc vào từng ứng dụng cụ thể. 1.1.4. Khả năng biểu diễn Khả năng biểu diễn của logic mô tả có quan hệ mật thiết với độ phức tạp của các bài toán suy luận. Theo đó, thông thường nếu logic mô tả càng diễn cảm (có khả năng biểu diễn tốt) thì có độ phức tạp trong suy luận càng cao. Khả năng biểu diễn của logic mô tả được thể hiện thông qua các tạo tử khái niệm và tạo tử vai trò mà nó được phép sử dụng để xây dựng các khái niệm phức và vai trò phức. Hiện nay, logic mô tả ALC (chỉ sử dụng các tạo tử ¬, , 13 , ∃ và ∀) được xem là logic mô tả cơ bản nhất. Trong mục này chúng tôi điểm qua thêm một số nét cơ bản của các tạo tử khái niệm và tạo tử vai trò dùng để xây dựng các logic mô tả mở rộng thông qua logic mô tả cơ bản ALC. 1.1.4.1. Hạn chế số lượng Tạo tử hạn chế số lượng cho phép xây dựng những khái niệm có ràng buộc bản số về đối tượng. Trong logic mô tả, người ta sử dụng hai loại hạn chế số lượng như sau: • Hạn chế số lượng có định tính (qualified number restrictions), ký hiệu là Q, là hạn chế số lượng trên các vai trò có chỉ ra tính chất của các đối tượng cần hạn chế. Chẳng hạn, để xây dựng khái niệm đại diện cho “đối tượng là người có ít nhất hai con gái”, chúng ta sử dụng biểu thức Human (≥ 2 hasChild.F emale). Ở đây, khái niệm F emale đặt sau vai trò hasChild dùng để chỉ tính chất mà nó cần định tính thông qua vai trò. • Hạn chế số lượng không định tính (unqualified number restrictions), ký hiệu là N , là hạn chế số lượng trên các vai trò nhưng không chỉ ra tính chất của các đối tượng cần hạn chế. Chẳng hạn, để xây dựng khái niệm đại diện cho “những đối tượng là người có nhiều nhất ba con”, chúng ta sử dụng biểu thức Human (≤ 3 hasChild) (là cách viết ngắn gọn của Human (≤ 3 hasChild. )). Chúng ta thấy rằng sau vai trò hasChild không yêu cầu chỉ ra tính chất cần thỏa mãn (khái niệm nói lên rằng tất cả các đối tượng đều phù hợp). 1.1.4.2. Tính chất hàm Ràng buộc tính chất hàm (functionality), ký hiệu là F, là trường hợp đặc biệt của ràng buộc hạn chế số lượng không định tính. Nó cho phép chỉ ra tính chất hàm cục bộ của vai trò, nghĩa là mỗi cá thể của khái niệm có quan hệ tối đa với một cá thể khác thông qua vai trò được chỉ định. Chẳng hạn, để quy định “một người chỉ có thể được kết hôn với một người khác”, chúng ta có thể sử dụng ràng buộc ≤ 1 marriedT o. 1.1.4.3. Định danh Tạo tử định danh (nominal), ký hiệu là O, cho phép xây dựng khái niệm dạng {a} từ một cá thể đơn lẻ a. Khái niệm này biểu diễn cho tập có thể hiện chỉ là một cá thể. Bằng cách sử dụng tạo tử định danh, chúng ta có thể xây dựng cấu trúc {a1 , a2 , . . . , an } để biểu diễn cho khái niệm gồm chính xác các thể hiện là những cá thể a1 , a2 , . . . , an . Chẳng hạn, để biểu diễn “các nước thành viên thường trực của Hội đồng Bảo an Liên hiệp quốc”, chúng ta sử dụng khái niệm {ANH, MY, NGA, PHAP, TRUNGQUOC}. 14 1.1.4.4. Vai trò nghịch đảo Một logic mô tả với vai trò nghịch đảo (inverse role), ký hiệu là I, cho phép người sử dụng định nghĩa các vai trò là nghịch đảo của nhau nhằm tăng khả năng ràng buộc đối với các đối tượng trong miền biểu diễn. Nghịch đảo của vai trò r được viết là r− . Nghĩa là, nếu s là một vai trò nghịch đảo của r (s ≡ r− ) thì r(a, b) thỏa mãn khi và chỉ khi s(b, a) thỏa mãn. Chẳng hạn, chúng ta có thể định nghĩa vai trò hasP arent là vai trò nghịch đảo của vai trò hasChild và ký hiệu là hasP arent ≡ hasChild− . 1.1.4.5. Vai trò bắc cầu Tạo tử vai trò bắc cầu (transitive role), ký hiệu là S, được đưa vào logic mô tả nhằm tăng khả năng biểu diễn của logic mô tả đó. Một vai trò r được gọi là bắc cầu nếu r◦r r. Nghĩa là, khi r là một vai trò bắc cầu, lúc đó nếu r(a, b) và r(b, c) thỏa mãn thì r(a, c) cũng thỏa mãn. Chẳng hạn, xét vai trò hasDescendant (vai trò để chỉ đối tượng này có con cháu là đối tượng kia), giả sử rằng đối tượng a có con cháu là đối tượng b và đối tượng b có con cháu là đối tượng c. Một cách tự nhiên, chúng ta thấy đối tượng a có con cháu là đối tượng c. Nghĩa là, hasDescendant◦hasDescendant hasDescendant. Như vậy, vai trò hasDescendant có tính chất bắc cầu. 1.1.4.6. Phân cấp vai trò Tạo tử phân cấp vai trò (role hierarchive), ký hiệu là H, cho phép người sử dụng biểu diễn mối quan hệ giữa các vai trò theo phương cách cụ thể hóa hoặc theo phương cách tổng quát hóa. Vai trò r là cụ thể hóa của vai trò s (hay nói cách khác, vai trò s là tổng quát hóa của vai trò r) và được viết là r s. Khi đó nếu r(a, b) thỏa mãn thì s(a, b) cũng thỏa mãn. Xét hai vai trò hasChild và hasDescendant. Chúng ta thấy nếu đối tượng a có con là đối tượng b thì đối tượng a cũng có con cháu là đối tượng b. Vì vậy, vai trò hasChild được bao hàm trong vai trò hasDescendant và được ký hiệu là hasChild hasDescendant. 1.1.4.7. Bao hàm vai trò phức Tạo tử bao hàm vai trò phức (complex role inclusion), ký hiệu là R, cho phép người sử dụng biểu diễn các tiên đề bao hàm dạng r ◦ s r (hoặc r ◦ s s). Nghĩa là, nếu r(a, b) và s(b, c) thỏa mãn thì r(a, c) (hoặc s(a, c)) cũng thỏa mãn. Ví dụ, với vai trò hasChild và hasDescendant, giả sử đối tượng a có con là đối tượng b và đối tượng b có con cháu là đối tượng c, lúc đó đối tượng a cũng có con cháu là đối tượng c. Rõ ràng chúng ta có hasChild ◦ hasDescendant 15 hasDescendant. 1.1.5. Logic mô tả và các tên gọi Hiện nay, có rất nhiều logic mô tả được phát triển để đáp ứng các nhu cầu trong thực tế về biểu diễn và suy luận tri thức. Để thống nhất các tên gọi của logic mô tả, người ta lấy logic mô tả ALC làm nền tảng [55]. Từ logic mô tả cơ bản ALC, bằng cách thêm các tính chất thông qua các tạo tử khái niệm và tạo tử vai trò người ta xây dựng được các logic mô tả mở rộng khác nhau. Các logic mô tả này sử dụng các ký tự để biểu diễn cho các tính chất được mở rộng, cụ thể như sau [34], [52]: • ALC - logic mô tả cơ bản nhất: ALC là ngôn ngữ khái niệm thuộc tính có phủ định. • S - ALC + tính chất bắc cầu của vai trò: Tính chất bắc cầu của vai trò cho phép các vai trò bắc cầu được sử dụng. • H - bao hàm vai trò: Tính chất bao hàm vai trò cho phép một vai trò được bao hàm trong một vai trò khác theo dạng r s. • I - vai trò nghịch đảo: Tính chất vai trò nghịch đảo cho phép sử dụng nghịch đảo của một vai trò r theo dạng r− . • O - định danh: Tạo tử định danh cho phép tạo ra các khái niệm đơn từ các cá thể đơn lẻ a với dạng {a} và danh sách các cá thể a1 , a2 , . . . , an với dạng {a1 , a2 , . . . , an }. • N - hạn chế số lượng không định tính: Tạo tử hạn chế số lượng không định tính cho phép xây dựng các khái niệm về hạn chế số lượng dạng ≥ n r và ≤ n r. • Q - hạn chế số lượng có định tính: Tạo tử hạn chế số lượng có định tính cho phép xây dựng các khái niệm hạn chế số lượng dạng ≥ n r.C và ≤ n r.C. • F - tính chất hàm: Tính chất hàm cho phép biểu diễn một vai trò là một hàm và nó tương đương với tiên đề ≤ 1 r. • R - bao hàm vai trò phức: Bao hàm vai trò phức cho phép các tiên đề dạng r◦s r hoặc r ◦ s s. Với các ký hiệu như vậy, khi ta viết logic mô tả ALCI, nghĩa là logic mô tả ALC cộng thêm tính chất vai trò nghịch đảo; SHOIQ là logic mô tả ALC có thêm tính chất bắc cầu của vai trò, phân cấp vai trò, định danh, vai trò nghịch đảo và hạn chế số lượng có định tính. 16 1.2. Cú pháp và ngữ nghĩa của logic mô tả 1.2.1. Logic mô tả ALC reg Logic mệnh đề động (Propositional Dynamic Logics) là một biến thể của logic hình thái được Fischer và Ladner giới thiệu vào năm 1979 [18]. Nó được thiết kế chuyên biệt cho việc biểu diễn và suy luận trong các chương trình. Schild đã chỉ ra rằng có sự tương ứng giữa các logic mô tả và một số logic mệnh đề động [54]. Sự tương ứng dựa trên tính tương tự giữa các cấu trúc diễn dịch của hai logic. Theo đó, mỗi đối tượng trong logic mô tả tương ứng với một trạng thái trong logic mệnh đề động và các kết nối giữa hai đối tượng tương ứng với các dịch chuyển trạng thái. Các khái niệm tương ứng với các mệnh đề và các vai trò tương ứng với các chương trình [20], [9]. Định nghĩa 1.3 (Cú pháp của ALC reg ). Cho ΣC là tập các tên khái niệm và ΣR là tập các tên vai trò (ΣC ∩ ΣR = ∅). Các phần tử của ΣC được gọi là khái niệm nguyên tố và các phần tử của ΣR được gọi là vai trò nguyên tố. Logic mô tả động ALC reg cho phép các khái niệm và các vai trò được định nghĩa một cách đệ quy như sau: • Nếu r ∈ ΣR thì r là một vai trò của ALC reg , • Nếu A ∈ ΣC thì A là một khái niệm của ALC reg , • Nếu C, D là các khái niệm và R, S là các vai trò thì – ε, R ◦ S, R – , ⊥, ¬C, C S, R∗ , C? là các vai trò của ALC reg , D, C D, ∃R.C và ∀R.C là các khái niệm của ALC reg . Cú pháp ALC reg có thể mô tả một cách vắn tắt bằng các luật sau: R, S −→ ε | r | R ◦ S | R C, D −→ A | S | R∗ | C? | ⊥ | ¬C | C D|C D | ∃R.C | ∀R.C Các ký hiệu và các tạo tử vai trò có ý nghĩa như sau: • ε biểu diễn quan hệ đồng nhất, • R ◦ S biểu diễn hợp thành tuần tự của R và S, • R S biểu diễn hợp của R và S, • R∗ biểu diễn cho vai trò bao đóng phản xạ và bắc cầu của R,1 • C? biểu diễn cho toán tử kiểm tra. 1 Bao đóng phản xạ và bắc cầu của R là quan hệ nhỏ nhất S thỏa mãn R phản xạ và bắc cầu. 17 S, S có tính chất Diễn dịch của các vai trò phức trong ALC reg được xác định như sau: εI = { x, x | x ∈ ∆I }, (R ◦ S)I = RI ◦ S I , (R S)I = RI ∪ S I , (R∗ )I = (RI )∗ , (C?)I = { x, x | C I (x)}. Trong luận án này, chúng tôi ký hiệu các ký tự chữ cái thường như a, b, . . . cho các cá thể; các ký tự chữ cái hoa như A, B, . . . cho các thuộc tính và/hoặc tên khái niệm (khái niệm nguyên tố); các ký tự chữ cái hoa như C, D, . . . cho các khái niệm (khái niệm nguyên tố và khái niệm phức); các ký tự chữ cái thường như r, s, . . . cho các tên vai trò đối tượng (vai trò đối tượng nguyên tố); các ký tự chữ cái hoa như R, S, . . . cho các vai trò đối tượng (vai trò đối tượng nguyên tố và vai trò đối tượng phức). 1.2.2. Ngôn ngữ logic mô tả LΣ,Φ Một bộ ký tự logic mô tả là một tập hữu hạn Σ = ΣI ∪ ΣdA ∪ ΣnA ∪ ΣoR ∪ ΣdR , trong đó ΣI là tập các cá thể, ΣdA là tập các thuộc tính rời rạc, ΣnA là tập các thuộc tính số, ΣoR là tập các tên vai trò đối tượng và ΣdR là tập các vai trò dữ liệu. Tất cả các tập ΣI , ΣdA , ΣnA , ΣoR và ΣdR rời nhau từng đôi một. Đặt ΣA = ΣdA ∪ ΣnA . Khi đó mỗi thuộc tính A ∈ ΣA có một miền giá trị là range(A). Miền range(A) là một tập khác rỗng đếm được nếu A là thuộc tính rời rạc và có thứ tự “≤” nếu A là thuộc tính liên tục.2 (Để đơn giản, chúng ta không ghi ký hiệu “≤” kèm theo thuộc tính A). Một thuộc tính rời rạc được gọi là thuộc tính Bool nếu range(A) = {true, false}. Chúng ta xem các thuộc tính Bool như là các tên khái niệm. Gọi ΣC là tập các tên khái niệm của Σ, lúc đó ta có ΣC ⊆ ΣdA . Mỗi tên vai trò đối tượng đại diện cho một vị từ hai ngôi giữa các cá thể. Mỗi vai trò dữ liệu σ có miền giá trị là range(σ) và σ đại diện cho một vị từ hai ngôi giữa các cá thể với các phần tử trong tập range(σ). Ở đây, các ký tự như σ, , . . . dùng để ký hiệu cho các vai trò dữ liệu; và các ký tự c, d, . . . dùng để ký hiệu cho các phần tử của tập range(A) hoặc range(σ). Xét các đặc trưng của logic mô tả gồm: I (vai trò nghịch đảo), O (định danh), F (tính chất hàm), N (hạn chế số lượng không định tính), Q (hạn chế số lượng có định tính), U (vai trò phổ quát), Self (tính phản xạ cục bộ của vai trò). Tập các đặc trưng 2 Có thể giả sử rằng nếu A là một thuộc tính số thì range(A) là tập các số thực và “≤” là một quan hệ thứ tự giữa các số thực. 18 của logic mô tả Φ là một tập rỗng hoặc tập chứa một số các đặc trưng nêu trên. Chẳng hạn như Φ = {I, O, Q} để chỉ tập các đặc trưng của logic mô tả gồm: vai trò nghịch đảo, định danh và hạn chế số lượng có định tính. Luận án xây dựng các thuật toán học máy cho các hệ thống thông tin dựa trên logic mô tả. Cách tiếp cận này phù hợp đối với các hệ thống thông tin thường có trong thực tế. Lý do là các hệ thống thông tin truyền thống được định nghĩa như các bảng dữ liệu về các giá trị của các thuộc tính, các đối tượng chỉ được đặc tả thông qua các thuộc tính. Tuy nhiên, trong thực tế tồn tại những hệ thống thông tin mà các đối tượng không những được đặc tả bằng các thuộc tính mà còn được đặc tả thông qua các mối quan hệ giữa các đối tượng đó. Hệ thống thông tin dựa trên logic mô tả giải quyết được nhược điểm vốn có của hệ thống thông tin truyền thống và phù hợp với thực tế hơn. Dovroodi và Nguyen [13], [14], Nguyen và Szalas [44] nghiên cứu logic mô tả ALC reg với tập các đặc trưng gồm I, O, Q, U và Self. Ngoài những đặc trưng đã đề cập ở trên, luận án này mở rộng lớp các logic mô tả bằng cách xem xét thêm các đặc trưng F và N . Đặc biệt, luận án xem xét thêm các thuộc tính như là các thành phần cơ bản của ngôn ngữ, bao gồm thuộc tính rời rạc và thuộc tính số. Do đó, ngôn ngữ logic mô tả được nghiên cứu trong luận án tổng quát hơn so với công trình của Nguyen và Szalas [44]. Các kết quả trình bày trong các định nghĩa, định lý tiếp theo là những mở rộng của các định nghĩa, định lý trong [13], [14], [44] bằng cách phát triển nó trên một lớp các logic mô tả rộng hơn. Định nghĩa 1.4 (Ngôn ngữ LΣ,Φ ). Cho Σ là bộ ký tự logic mô tả, Φ là tập các đặc trưng của logic mô tả và L đại diện cho ALC reg . Ngôn ngữ logic mô tả LΣ,Φ cho phép các vai trò đối tượng và các khái niệm được định nghĩa đệ quy như sau: • Nếu r ∈ ΣoR thì r là một vai trò đối tượng của LΣ,Φ , • Nếu A ∈ ΣC thì A là một khái niệm của LΣ,Φ , • Nếu A ∈ ΣA \ ΣC và d ∈ range(A) thì A = d và A = d là các khái niệm của LΣ,Φ , • Nếu A ∈ ΣnA và d ∈ range(A) thì A ≤ d, A < d, A ≥ d và A > d là các khái niệm của LΣ,Φ , • Nếu R và S là các vai trò đối tượng của LΣ,Φ , C và D là các khái niệm của LΣ,Φ , r ∈ ΣoR , σ ∈ ΣdR , a ∈ ΣI và n là một số tự nhiên thì – ε, R ◦ S , R – , ⊥, ¬C, C S, R∗ và C? là các vai trò đối tượng của LΣ,Φ , D, C D, ∃R.C và ∀R.C là các khái niệm của LΣ,Φ , 19 – Nếu d ∈ range(σ) thì ∃σ.{d} là một khái niệm của LΣ,Φ , – Nếu I ∈ Φ thì R− là một vai trò đối tượng của LΣ,Φ , – Nếu O ∈ Φ thì {a} là một khái niệm của LΣ,Φ , – Nếu F ∈ Φ thì ≤ 1 r là một khái niệm của LΣ,Φ , – Nếu {F, I} ⊆ Φ thì ≤ 1 r− là một khái niệm của LΣ,Φ , – Nếu N ∈ Φ thì ≥ n r và ≤ n r là các khái niệm của LΣ,Φ , – Nếu {N , I} ⊆ Φ thì ≥ n r− và ≤ n r− là các khái niệm của LΣ,Φ , – Nếu Q ∈ Φ thì ≥ n r.C và ≤ n r.C là các khái niệm của LΣ,Φ , – Nếu {Q, I} ⊆ Φ thì ≥ n r− .C và ≤ n r− .C là các khái niệm của LΣ,Φ , – Nếu U ∈ Φ thì U là một vai trò đối tượng của LΣ,Φ , – Nếu Self ∈ Φ thì ∃r.Self là một khái niệm của LΣ,Φ . Định nghĩa 1.5 (Ngữ nghĩa của LΣ,Φ ). Một diễn dịch trong LΣ,Φ là một bộ I = ∆I , ·I , trong đó ∆I là một tập khác rỗng được gọi là miền của I và ·I là một ánh xạ được gọi là hàm diễn dịch của I cho phép ánh xạ mỗi cá thể a ∈ ΣI thành một phần tử aI ∈ ∆I , mỗi tên khái niệm A ∈ ΣC thành một tập AI ⊆ ∆I , mỗi thuộc tính A ∈ ΣA \ ΣC thành một hàm từng phần AI : ∆I → range(A), mỗi tên vai trò đối tượng r ∈ ΣoR thành một quan hệ hai ngôi rI ⊆ ∆I × ∆I và mỗi vai trò dữ liệu σ ∈ ΣdR thành một quan hệ hai ngôi σ I ⊆ ∆I × range(σ). Hàm diễn dịch ·I được mở rộng cho các vai trò đối tượng phức và các khái niệm phức như trong Hình 1.3, trong đó #Γ ký hiệu cho lực lượng của tập Γ. Chúng ta nói C I (tương ứng, RI ) là diễn dịch của khái niệm C (tương ứng, vai trò R) trong diễn dịch I. Một khái niệm C được gọi là thỏa mãn nếu tồn tại một diễn dịch I sao cho C I = ∅. Nếu aI ∈ C I , lúc đó chúng ta nói a là một thể hiện của C trong diễn dịch I. Để ngắn gọn, ta viết C I (x) (tương ứng, RI (x, y), σ I (x, d)) thay cho x ∈ C I (tương ứng, x, y ∈ RI , x, d ∈ σ I ). Cho diễn dịch I = ∆I , ·I trong ngôn ngữ LΣ,Φ . Chúng ta nói rằng đối tượng x ∈ ∆I có độ sâu là k nếu k là số tự nhiên lớn nhất sao cho tồn tại các đối tượng x0 , x1 , . . . , xk ∈ ∆I khác nhau từng đôi một thỏa mãn: • xk = x và x0 = aI với a ∈ ΣI , • xi = bI với mọi 1 ≤ i ≤ k và với mọi b ∈ ΣI , • với mỗi 1 ≤ i ≤ k tồn tại một vai trò đối tượng Ri của LΣ,Φ sao cho RiI (xi−1 , xi ) thỏa mãn. 20 Chúng ta ký hiệu I|k là diễn dịch thu được từ diễn dịch I bằng cách hạn chế miền I ∆ của diễn dịch I chỉ bao gồm các đối tượng có độ sâu không lớn hơn k và hàm diễn dịch ·I được hạn chế một cách tương ứng. (R ◦ S)I = RI ◦ S I (R (R∗ )I = (RI )∗ S)I = RI ∪ S I (R− )I = (RI )−1 U I = ∆I × ∆I (C (C?)I = { x, x | C I (x)} I D)I = C I ∩ DI = ∆I (C εI = { x, x | x ∈ ∆I } ⊥I = ∅ D)I = C I ∪ DI (¬C)I = ∆I \ C I {a}I = {aI } (A ≤ d)I = {x ∈ ∆I | AI (x) xác định và AI (x) ≤ d} (A ≥ d)I = {x ∈ ∆I | AI (x) xác định và AI (x) ≥ d} (A = d)I = {x ∈ ∆I | AI (x) = d} (A = d)I = (¬(A = d))I (A < d)I = ((A ≤ d) (A > d)I = ((A ≥ d) (A = d))I (A = d))I (∀R.C)I = {x ∈ ∆I | ∀y [RI (x, y) ⇒ C I (y)]} (∃r.Self)I = {x ∈ ∆I | rI (x, x)} (∃R.C)I = {x ∈ ∆I | ∃y [RI (x, y) ∧ C I (y)]} (∃σ.{d})I = {x ∈ ∆I | σ I (x, d)} (≥ n R.C)I = {x ∈ ∆I | #{y | RI (x, y) ∧ C I (y)} ≥ n} (≥ n R)I = (≥ n R. )I (≤ n R.C)I = {x ∈ ∆I | #{y | RI (x, y) ∧ C I (y)} ≤ n} (≤ n R)I = (≤ n R. )I Hình 1.3: Diễn dịch của các vai trò phức và khái niệm phức 1.3. Các dạng chuẩn Để biểu diễn các khái niệm và vai trò theo một dạng thống nhất trong logic mô tả nhằm phù hợp với quá trình xử lý khái niệm và vai trò đó, người ta sử dụng các dạng chuẩn của khái niệm và vai trò. Dạng chuẩn của khái niệm C (tương ứng, vai trò R) là một khái niệm C (tương ứng, vai trò R ) tương đương với khái niệm C (tương ứng, vai trò R). Nghĩa là khái niệm C (tương ứng, vai trò R ) có cùng ý nghĩa với khái niệm C (tương ứng, vai trò R) nhưng khác nhau về cú pháp biểu diễn. Việc sử dụng các dạng chuẩn nhằm để nhất quán cách biểu diễn của khái niệm và vai trò trong một hệ thống. Điều này thuận lợi cho việc xử lý các khái niệm trong cài đặt chương trình được đề cập trong Chương 3. 1.3.1. Dạng chuẩn phủ định của khái niệm Dạng chuẩn phủ định của khái niệm (Negation Normal Form) [2], [34] được đề xuất nhằm phục vụ cho việc xử lý các bài toán suy luận của cơ sở tri thức trong logic mô tả. Khái niệm C được gọi là ở dạng chuẩn phủ định nếu toán tử phủ định chỉ xuất hiện trước các tên khái niệm có trong C. 21 Để chuyển một khái niệm về dạng chuẩn phủ định, chúng ta sử dụng luật De Morgan và các phép biến đổi tương đương, cụ thể như sau: ¬¬C −→ C D) −→ ¬C ¬(∃R.C) −→ ∀R.¬C ¬(∀R.C) −→ ∃R.¬C ¬(≥ n R) −→ ≤ (n − 1) R ¬(≤ n R) −→ ≥ (n + 1) R ¬(≥ n R.C) −→ ≤ (n − 1) R.C ¬(C ¬ −→ ⊥ ¬⊥ ¬D ¬(C −→ D) −→ ¬(≤ n R.C) −→ ¬C ¬D ≥ (n + 1) R.C Ví dụ 1.6. Cho A và B là các tên khái niệm, r và s là các tên vai trò đối tượng và khái niệm C ≡ ¬(∃r.¬A C là (∀r.A (¬B ∀s.A)) (B ∃s.¬A)) (≤ 2 r.A ¬(≥ 3 r.A ¬B). Dạng chuẩn phủ định của B). 1.3.2. Dạng chuẩn lưu trữ của khái niệm Ngoài dạng chuẩn phủ định của khái niệm, chúng ta có thể sử dụng các dạng chuẩn khác để phù hợp với quá trình thao tác và xử lý khái niệm. Luận án đề xuất một dạng chuẩn để lưu trữ khái niệm trong quá trình xây dựng các chương trình học máy. Dạng chuẩn lưu trữ khái niệm được xây dựng dựa trên dạng chuẩn phủ định và tập hợp. Nó là một mở rộng của dạng chuẩn đã đề xuất trong [38]. Để chuyển một khái niệm về dạng chuẩn này, chúng ta áp dụng các luật chuẩn hóa sau: 1. Các khái được biểu diễn theo dạng chuẩn phủ định, 2. Khái niệm C1 C2 ··· Cn được biểu diễn bằng một tập hợp “AND” và ký hiệu là {C1 , C2 , . . . , Cn }, 3. {C} được thay thế bằng C, 4. { {C1 , C2 , . . . , Ci }, Ci+1 , . . . , Cn } được thay thế bằng {C1 , C2 , . . . , Cn }, 5. { , C1 , C2 , . . . , Cn } được thay thế bằng {C1 , C2 , . . . , Cn }, 6. {⊥, C1 , C2 , . . . , Cn } được thay thế bằng ⊥, 7. Nếu Ci Cj và 1 ≤ i = j ≤ n thì loại bỏ Cj ra khỏi {C1 , C2 , . . . , Cn }, 8. Nếu Ci ≡ C j và 1 ≤ i = j ≤ n thì {C1 , C2 , . . . , Cn } được thay thế bằng ⊥, trong đó C là dạng chuẩn của ¬C, 9. ∀R. 10. ∀R. {C1 , C2 , . . . , Cn } được thay thế bằng {∀R.C1 , ∀R.C2 , . . . , ∀R.Cn }, được thay thế bằng , 22 11. ≤ n R.⊥ được thay thế bằng , 12. ≥ 1 R.C được thay thế bằng ∃R.C, 13. ≥ n R.⊥ được thay thế bằng ⊥ nếu n > 0, 14. Các luật song hành được áp dụng cho các luật từ thứ 2 đến thứ 10 bằng , ⊥ trong luật một cách tương ứng (chẳng cách đảo các tạo tử và khái niệm {⊥, C1 , C2 , . . . , Cn } được hạn, luật song hành tương ứng của luật thứ 5 là thay thế bằng {C1 , C2 , . . . , Cn }, luật song hành tương ứng của luật thứ 6 là { , C1 , C2 , . . . , Cn } được thay thế bằng . Các khái niệm ở dạng chuẩn được biểu diễn dưới dạng tập hợp của các khái niệm con. Sử dụng tập hợp trong biểu diễn khái niệm mang lại một lợi thế quan trọng là thứ tự của các khái niệm con trong tập hợp không ảnh hưởng tới khái niệm đang xét. Chẳng hạn, {C1 , C2 } và {C2 , C1 } là hai khái niệm giống nhau. Vì vậy, trong thực nghiệm, các chương trình cài đặt cần phải xây dựng được cấu trúc dữ liệu thích hợp cho việc lưu trữ khái niệm. Cấu trúc dữ liệu này phải đảm bảo hai khái niệm có cùng “dạng chuẩn” được biểu diễn như nhau để tránh việc lưu trữ lặp lại các khái niệm giống nhau trong bộ nhớ. Ví dụ 1.7. Cho A và B là các tên khái niệm, r và s là các tên vai trò đối tượng và khái niệm C ≡ ¬(∃r.¬A định của C là (∀r.A (¬B (B ∀s.A)) ∃s.¬A)) ¬(≥ 3 r.A (≤ 2 r.A ¬B). Dạng chuẩn phủ B). Dạng chuẩn lưu trữ của C là { {∀r.A, {¬B, ∃s.¬A}}, ≤ 2 r.A, B}. 1.3.3. Dạng chuẩn nghịch đảo của vai trò Vai trò đối tượng R được gọi là một vai trò ở dạng chuẩn nghịch đảo (Converse Normal Form) nếu tạo tử nghịch đảo chỉ áp dụng cho các tên vai trò đối tượng xuất hiện trong R (không xét đến vai trò đối tượng phổ quát U ) [14]. Rõ ràng, tất cả các vai trò đối tượng đều có thể chuyển đổi tương đương thành vai trò đối tượng ở dạng chuẩn nghịch đảo. Trong luận án này, chúng ta sử dụng các vai trò được biểu diễn ở dạng chuẩn nghịch đảo. Để chuyển một vai trò về dạng chuẩn nghịch đảo, chúng ta sử dụng các phép biến đổi tương đương sau: (R− )− −→ R (R S)− −→ R− S− (R∗ )− −→ (R− )∗ (R ◦ S)− −→ S − ◦ R− Ví dụ 1.8. Cho r, s là các tên vai trò đối tượng và vai trò R ≡ ((r◦s− ) (r∗ ◦s) s− )− . Dạng chuẩn nghịch đảo của R là (s ◦ r− ) (s− ◦ (r− )∗ ) 23 s. − Đặt Σ± oR = ΣoR ∪ {r | r ∈ ΣoR }. Một vai trò đối tượng cơ bản là một phần tử thuộc Σ± oR nếu ngôn ngữ được xem xét cho phép vai trò nghịch đảo hoặc một phần tử thuộc ΣoR nếu ngôn ngữ được xem xét không cho phép vai trò nghịch đảo [14]. 1.4. Cơ sở tri thức trong logic mô tả Cơ sở tri thức trong logic mô tả thường bao gồm ba thành phần: bộ tiên đề vai trò chứa các tiên đề vai trò, bộ tiên đề thuật ngữ chứa các tiên đề thuật ngữ và bộ khẳng định chứa các khẳng định về cá thể [2], [14]. 1.4.1. Bộ tiên đề vai trò Định nghĩa 1.6 (Tiên đề vai trò). Một tiên đề bao hàm vai trò trong ngôn ngữ LΣ,Φ là một biểu thức có dạng ε r hoặc R1 ◦ R2 ◦ · · · ◦ Rk r, trong đó k ≥ 1, r ∈ ΣoR và R1 , R2 , . . . , Rk là các vai trò đối tượng cơ bản của LΣ,Φ khác với vai trò phổ quát U . Một khẳng định vai trò trong ngôn ngữ LΣ,Φ là một biểu thức có dạng Ref(r), Irr(r), Sym(r), Tra(r) hoặc Dis(R, S), trong đó r ∈ ΣoR và R, S là các vai trò đối tượng của LΣ,Φ khác với vai trò phổ quát U . Một tiên đề vai trò trong ngôn ngữ LΣ,Φ là một tiên đề bao hàm vai trò hoặc một khẳng định vai trò trong LΣ,Φ . Ý nghĩa của các khẳng định vai trò trong Định nghĩa 1.6 được hiểu như sau: • Ref(r) được gọi là một khẳng định vai trò phản xạ, • Irr(r) được gọi là một khẳng định vai trò không phản xạ, • Sym(r) được gọi là một khẳng định vai trò đối xứng, • Tra(r) được gọi là một khẳng định vai trò bắc cầu, • Dis(R, S) được gọi là một khẳng định vai trò không giao nhau. Ngữ nghĩa của các tiên đề vai trò được xác định thông qua diễn dịch I như sau: nếu εI ⊆ r I , nếu R1I ◦ R2I ◦ · · · ◦ RkI ⊆ rI , I |= Ref(r) nếu rI phản xạ, I |= Irr(r) nếu rI không phản xạ, I |= Sym(r) nếu rI đối xứng, I |= Tra(r) nếu rI bắc cầu, I |= Dis(R, S) nếu RI và S I không giao nhau. I |= ε r I |= R1 ◦ R2 ◦ · · · ◦ Rk r Giả sử ϕ là một tiên đề vai trò. Chúng ta nói rằng I thỏa mãn ϕ nếu I |= ϕ. 24 Định nghĩa 1.7 (Bộ tiên đề vai trò). Bộ tiên đề vai trò (RBox) trong ngôn ngữ LΣ,Φ là một tập hữu hạn các tiên đề vai trò trong LΣ,Φ . 1.4.2. Bộ tiên đề thuật ngữ Định nghĩa 1.8 (Tiên đề thuật ngữ). Một tiên đề bao hàm khái niệm tổng quát trong ngôn ngữ LΣ,Φ là một biểu thức có dạng C D, trong đó C và D là các khái niệm của LΣ,Φ . Một tiên đề tương đương khái niệm trong ngôn ngữ LΣ,Φ là một biểu thức có dạng C ≡ D, trong đó C và D là các khái niệm của LΣ,Φ . Một tiên đề thuật ngữ trong ngôn ngữ LΣ,Φ là một tiên đề bao hàm khái niệm tổng quát hoặc một tiên đề tương đương khái niệm trong LΣ,Φ . Đối với tiên đề tương đương khái niệm C ≡ D, trong đó C và D là các khái niệm của LΣ,Φ , nếu C là một tên khái niệm thì chúng ta nói C ≡ D là một định nghĩa khái niệm và khái niệm C được gọi là khái niệm định nghĩa. Một tiên đề tương đương khái niệm C ≡ D có thể được chuyển đổi tương đương thành hai tiên đề bao hàm khái niệm tổng quát là C D và D C. Ngữ nghĩa của các tiên đề thuật ngữ được xác định thông qua diễn dịch I như sau: D nếu C I ⊆ DI , I |= C ≡ D nếu C I = DI . I |= C Giả sử ϕ là một tiên đề thuật ngữ. Chúng ta nói rằng I thỏa mãn ϕ nếu I |= ϕ. Định nghĩa 1.9 (Bộ tiên đề thuật ngữ). Bộ tiên đề thuật ngữ (TBox) trong ngôn ngữ LΣ,Φ là một tập hữu hạn các tiên đề thuật ngữ trong LΣ,Φ . 1.4.3. Bộ khẳng định cá thể Định nghĩa 1.10 (Khẳng định cá thể). Một khẳng định cá thể trong ngôn ngữ LΣ,Φ là một biểu thức có dạng C(a), R(a, b), ¬R(a, b), a = b, a = b, trong đó C là một khái niệm và R là một vai trò đối tượng của LΣ,Φ . Ý nghĩa của các khẳng định cá thể trong Định nghĩa 1.10 được hiểu như sau: • C(a) được gọi là một khẳng định khái niệm, • R(a, b) được gọi là một khẳng định vai trò đối tượng dương, • ¬R(a, b) được gọi là một khẳng định vai trò đối tượng âm, • a = b được gọi là một khẳng định bằng nhau, 25 • a = b được gọi là một khẳng định khác nhau. Ngữ nghĩa của các khẳng định cá thể được xác định thông qua diễn dịch I như sau: aI ∈ C I , I |= C(a) nếu I |= R(a, b) nếu aI , bI ∈ RI , I |= ¬R(a, b) nếu / RI , aI , bI ∈ I |= a = b nếu aI = b I , I |= a = b nếu aI = b I . Giả sử ϕ là một khẳng định cá thể. Chúng ta nói rằng I thỏa mãn ϕ nếu I |= ϕ. Định nghĩa 1.11 (Bộ khẳng định cá thể). Bộ khẳng định cá thể (ABox) trong ngôn ngữ LΣ,Φ là một tập hữu hạn các khẳng định cá thể trong LΣ,Φ . 1.4.4. Cơ sở tri thức và mô hình của cơ sở tri thức Định nghĩa 1.12 (Cơ sở tri thức). Một cơ sở tri thức trong ngôn ngữ LΣ,Φ là một bộ ba KB = R, T , A , trong đó R là một RBox, T là một TBox và A là một ABox trong LΣ,Φ . Định nghĩa 1.13 (Mô hình). Một diễn dịch I là một mô hình của RBox R (tương ứng, TBox T , ABox A), ký hiệu là I |= R (tương ứng, I |= T , I |= A), nếu I thỏa mãn tất cả các tiên đề vai trò trong R (tương ứng, tiên đề thuật ngữ trong T , khẳng định cá thể trong A). Một diễn dịch I là một mô hình của cơ sở tri thức KB = R, T , A , ký hiệu là I |= KB, nếu nó là mô hình của cả R, T và A. Cơ sở tri thức KB được gọi là thỏa mãn được nếu KB có mô hình. Một cá thể a được gọi là thể hiện của khái niệm C dựa trên cơ sở tri thức KB, ký hiệu là KB |= C(a), nếu với mọi diễn dịch I là mô hình của KB thì aI ∈ C I . Cá thể a không phải thể hiện của khái niệm C dựa trên cơ sở tri thức KB được ký hiệu là KB |= C(a). Khái niệm D được gọi là bao hàm khái niệm C dựa trên cơ sở tri thức KB, ký hiệu là KB |= C D, nếu với mọi diễn dịch I là mô hình của KB thì C I ⊆ DI . Một logic LΣ,Φ được xác định thông qua một số hạn chế cụ thể đối với ngôn ngữ LΣ,Φ . Ta nói rằng logic LΣ,Φ là quyết định được nếu bài toán kiểm tra tính thỏa mãn của một cơ sở tri thức trong LΣ,Φ là quyết định được. Một logic LΣ,Φ được xem là có tính chất mô hình hữu hạn nếu với mọi cơ sở tri thức thỏa mãn được trong LΣ,Φ đều có mô hình hữu hạn. Một logic LΣ,Φ được xem là có tính chất mô hình nửa hữu hạn nếu với mọi cơ sở tri thức thỏa mãn được trong LΣ,Φ đều có mô hình I sao cho với mọi số tự nhiên k, I|k là hữu hạn và có thể xây dựng được. 26 Ví dụ 1.9. Ví dụ sau đây là các cơ sở tri thức đề cập về các ấn phẩm khoa học: Φ = {I, O, N , Q}, ΣI = {P1 , P2 , P3 , P4 , P5 , P6 }, ΣC = {Pub, Awarded , UsefulPub, Ad }, ΣoR = {cites, cited_by}, T ={ ΣnA = {Year }, ΣdR = ∅, cited_by, cited_by − R = {cites − ΣdA = ΣC , cites, Irr(cites)}, Pub, UsefulPub ≡ ∃cited_by. }, A0 = {Awarded (P1 ), ¬Awarded (P2 ), ¬Awarded (P3 ), Awarded (P4 ), ¬Awarded (P5 ), Awarded (P6 ), Year (P1 ) = 2010, Year (P2 ) = 2009, Year (P3 ) = 2008, Year (P4 ) = 2007, Year (P5 ) = 2006, Year (P6 ) = 2006, cites(P1 , P2 ), cites(P1 , P3 ), cites(P1 , P4 ), cites(P1 , P6 ), cites(P2 , P3 ), cites(P2 , P4 ), cites(P2 , P5 ), cites(P3 , P4 ), cites(P3 , P5 ), cites(P3 , P6 ), cites(P4 , P5 ), cites(P4 , P6 )}, A0 = A0 ∪ {(¬∃cited_by. )(P1 ), (∀cited_by.{P2 , P3 , P4 })(P5 )}. Lúc đó KB 0 = R, T , A0 và KB 0 = R, T , A0 là các cơ sở tri thức trong LΣ,Φ . Pub để chỉ ra rằng miền của bất kỳ mô hình nào của KB0 hoặc KB 0 đều Tiên đề chỉ gồm các ấn phẩm khoa học. Cơ sở tri thức KB 0 và KB 0 được minh họa như trong Hình 1.4. Trong hình này, các nút ký hiệu cho các ấn phẩm và các cạnh ký hiệu cho các trích dẫn (khẳng định của vai trò cites). Hình này chỉ biểu diễn những thông tin về các khẳng định Year , Awarded và cites. Cơ sở tri thức KB0 khác với KB 0 ở điểm là KB 0 có thêm khẳng định (¬∃cited_by. )(P1 ) (trong A0 ) để khẳng định P1 không được trích dẫn bởi bất kỳ ấn phẩm nào và khẳng định (∀cited_by.{P2 , P3 , P4 })(P5 ) (trong A0 ) để khẳng định P5 chỉ được trích dẫn bởi các ấn phẩm P2 , P3 và P4 . P1 : 2010 P2 : 2009 G ¬Awarded Awarded x P3 : 2008 ¬Awarded G 8 V G P5 : 2006 Q ¬Awarded P4 : 2007 Awarded R G C P6 : 2006 Awarded Hình 1.4: Một minh họa cho cơ sở tri thức của Ví dụ 1.9 27 Ví dụ 1.10. Cho ΣI = {a, b, c}, ΣnA = {BirthY ear}, ΣC = {Human, M ale, F emale}, ΣdA = {N ickN ame}∪ΣC , ΣoR = {hasChild, marriedT o} và ΣdR = {hasOccupation}. Chúng ta có thể xem cá thể a là ALICE, b là BOB và c là CALVIN và các diễn dịch I1 và I2 được xây dựng như sau: • Diễn dịch I1 : ∆I1 = {aI1 , bI1 , cI1 , x1 , x2 , x3 , x4 }, HumanI1 = {aI1 , bI1 , cI1 , x1 , x2 , x3 , x4 }, M aleI1 = {bI1 , x1 , x2 , x3 }, F emaleI1 = {aI1 , cI1 , x4 }, BirthY earI1 (aI1 ) = 1925, BirthY earI1 (bI1 ) = 1920, BirthY earI1 (cI1 ) = 1955, BirthY earI1 (x1 ) = 1957, BirthY earI1 (x2 ) = 1956, BirthY earI1 (x3 ) = 1987, BirthY earI1 (x4 ) = 1984, N ickN ameI1 (aI1 ) = “Allie”, N ickN ameI1 (bI1 ) = “Bo”, N ickN ameI1 (cI1 ) = “Cal” N ickN ameI1 (x1 ) = “Dell”, N ickN ameI1 (x2 ) = “Eddy”, N ickN ameI1 (x3 ) = “Fae”, N ickN ameI1 (x4 ) = “Garry”, hasChildI1 = { aI1 , cI1 , aI1 , x1 , bI1 , cI1 , bI1 , x1 , cI1 , x3 , cI1 , x4 , x2 , x3 , x2 , x4 }, marriedT oI1 = { aI1 , bI1 , bI1 , aI1 , cI1 , x2 , x2 , cI1 }, hasOccupationI1 = { aI1 , “housewife” , bI1 , “doctor” , bI1 , “lecturer” , cI1 , “nurse” , cI1 , “lecturer” , xI1 1 , “programmer” , xI1 1 , “engineer” , xI2 1 , “accountant” , xI2 1 , “teacher” }. • Diễn dịch I2 : ∆I2 = {aI2 , bI2 , cI2 , y1 , y2 , y3 , y4 , y5 }, HumanI2 = {aI2 , bI2 , cI2 , y1 , y2 , y3 , y4 , y5 }, M aleI2 = {bI2 , y1 , y2 , y3 , y5 }, F emaleI2 = {aI2 , cI2 , y4 }, BirthY earI2 (aI2 ) = 1925, BirthY earI2 (bI2 ) = 1920, BirthY earI2 (cI2 ) = 1955, BirthY earI2 (y1 ) = 1957, BirthY earI2 (y2 ) = 1956, BirthY earI2 (y3 ) = 1987, BirthY earI2 (y4 ) = 1984, BirthY earI2 (y5 ) = 1987, N ickN ameI2 (aI2 ) = “Allie”, N ickN ameI2 (bI2 ) = “Bo”, N ickN ameI2 (cI2 ) = “Cal” N ickN ameI2 (y1 ) = “Dell”, N ickN ameI2 (y2 ) = “Eddy”, N ickN ameI2 (y3 ) = “Fae”, N ickN ameI2 (y4 ) = “Garry”, N ickN ameI2 (y5 ) = “Jay”, 28 hasChildI2 = { aI2 , cI2 , aI2 , y1 , bI2 , cI2 , bI2 , y1 , cI2 , y3 , cI2 , y4 , cI2 , y5 , y2 , y3 , y2 , y4 , y2 , y5 }, marriedT oI2 = { aI2 , bI2 , bI2 , aI2 , cI2 , y2 , y2 , cI2 }, hasOccupationI2 = { aI2 , “housewife” , bI2 , “doctor” , bI2 , “lecturer” , cI2 , “nurse” , cI2 , “lecturer” , y1I2 , “programmer” , y1I2 , “engineer” , y2I2 , “accountant” , y2I2 , “teacher” , y2I2 , “programmer” }. Hai diễn dịch I1 và I2 nêu trên đều là mô hình của RBox R, TBox T và ABox A trong ngôn ngữ LΣ,Φ với Φ = {I, O, Q} và các R, T , A như sau: R = {Sym(marriedT o), Irr(hasChild)}, T = {Human ≡ {c} , ¬F emale M ale, ∃marriedT o.M ale (≥ 2 hasChild.Human), {b, c} F emale, ∃hasOccupation.{“lecturer”}}, A = {F emale(a), M ale(b), F emale(c), (≥ 2 hasChild.Human)(a), marriedT o(a, b), marriedT o(b, a), hasChild(a, c), hasChild(b, c), hasOccupation(b, “doctor”), hasOccupation(b, “lecturer”), hasOccupation(c, “lecturer”)}. Qua các Ví dụ 1.9 và 1.10, chúng ta thấy rằng nếu không sử dụng thuộc tính thì sẽ rất khó biểu diễn dữ liệu số như: năm xuất bản của một công trình, tuổi của một người. Tương tự như thế, nếu không dùng vai trò dữ liệu thì cũng sẽ rất khó biểu diễn các dữ liệu đa trị như nghề nghiệp của một người. Như vậy, bằng cách sử dụng các thuộc tính và vai trò dữ liệu, chúng ta có thể biểu diễn các thuộc tính số và các dữ liệu đa trị. 1.5. Suy luận trong logic mô tả 1.5.1. Giới thiệu Mục đích của các hệ thống biểu diễn tri thức ngoài việc lưu trữ các tiên đề vai trò, tiên đề thuật ngữ, định nghĩa khái niệm và các khẳng định còn có việc thực hiện các suy luận để tìm ra những tri thức tiềm ẩn. Chẳng hạn, từ bộ tiên đề thuật ngữ trong Ví dụ 1.4 và bộ khẳng định trong Ví dụ 1.5, chúng ta có thể kết luận rằng cá thể HAI là một người đàn ông (cá thể hải là một thể hiện của khái niệm M ale) mặc dù tri thức này không được đưa ra trong bộ khẳng định. Có nhiều bài toán suy luận được đặt ra trong các hệ thống biểu diễn tri thức dựa trên logic mô tả. Từ cơ sở tri thức KB, chúng ta có các bài toán suy luận như sau [2]: 29 • Tính thỏa mãn của cơ sở tri thức: KB được gọi là thỏa mãn nếu tồn tại diễn dịch I là mô hình của KB. • Tính thỏa mãn của khái niệm: Một khái niệm C được gọi là thỏa mãn dựa trên KB nếu tồn tại một mô hình I của KB sao cho C I = ∅. • Bao hàm khái niệm: Khái niệm C được bao hàm trong khái niệm D dựa trên KB, ký hiệu là KB |= C D, nếu C I ⊆ DI với mọi mô hình I của KB. • Tương đương khái niệm: Khái niệm C tương đương với khái niệm D dựa trên KB, ký hiệu là KB |= C ≡ D, nếu C I = DI với mọi mô hình I của KB. • Khái niệm rời nhau: Khái niệm C và khái niệm D là rời nhau dựa trên KB nếu C I ∩ DI = ∅ với mọi mô hình I của KB. Trong các bài toán suy luận trên đây, bài toán suy luận quan trọng nhất là bài toán kiểm tra tính thỏa mãn một cơ sở tri thức. Lý do bài toán này được xem là quan trọng bởi vì thuật toán để giải bài toán này tương đối đã đầy đủ. Hơn nữa, các bài toán suy luận khác đều có thể được chuyển đổi tương đương về bài toán kiểm tra tính thỏa mãn của một cơ sở tri thức [2]. Ví dụ 1.11. Chuyển bài toán kiểm tra thể hiện của một khái niệm về bài toán kiểm tra tính thỏa mãn của một cơ sở tri thức. Cho cơ sở tri thức KB, khái niệm C và cá thể a. Kiểm tra xem cá thể a có phải là một thể hiện của khái niệm C (KB |= C(a)) hay không? Nghĩa là, kiểm tra xem với mọi diễn dịch I là mô hình của KB thì I có phải là mô hình của C(a) hay không? Để kiểm tra vấn đề này, chúng ta có thể chuyển bài toán trên về bài toán kiểm tra tính thỏa mãn của cơ sở tri thức KB = R, T , A với A = A ∪ C(a). Nghĩa là kiểm tra xem có tồn tại hay không một diễn dịch I là mô hình của KB ? Nếu cơ sở tri thức KB thỏa mãn thì cá thể a là một thể hiện của khái niệm C dựa trên KB, ngược lại nếu cơ sở tri thức KB không thỏa mãn thì cá thể a không phải là một thể hiện của khái niệm C dựa trên KB. 1.5.2. Các thuật toán suy luận 1.5.2.1. Thuật toán bao hàm theo cấu trúc Thuật toán bao hàm theo cấu trúc thực hiện quá trình suy luận dựa trên việc so sánh cấu trúc cú pháp của các khái niệm (thường đã được chuyển về ở dạng chuẩn phủ định). Thuật toán này tỏ ra hiệu quả đối với các ngôn ngữ logic mô tả đơn giản có khả năng biểu diễn yếu như FL0 , FL⊥ , ALN . Với các ngôn ngữ logic mô tả giàu ngữ 30 nghĩa hơn, chẳng hạn như ALC, ALCI, ALCIQ, SHIQ, SHOIQ, . . . , thuật toán bao hàm theo cấu trúc không thể giải quyết được các bài toán suy luận như đã đề cập trong Mục 1.5.1. Thuật toán bao hàm theo cấu trúc được thực hiện theo hai pha [2]. Pha thứ nhất, chuyển các khái niệm về dạng chuẩn tương ứng với từng loại ngôn ngữ. Pha thứ hai, so sánh cấu trúc cú pháp của các khái niệm. Chẳng hạn, xét ngôn ngữ logic mô tả FL0 , ngôn ngữ chỉ cho phép phép giao (C D) và lượng từ hạn chế với mọi (∀r.C), một khái niệm trong ngôn ngữ FL0 được gọi là ở dạng chuẩn nếu nó có dạng: A1 A2 ··· Am ∀r1 .C1 ∀r2 .C2 ··· ∀rn .Cn , trong đó A1 , A2 , . . . , Am là các tên khái niệm phân biệt nhau, r1 , r2 , . . . , rn là các tên vai trò phân biệt nhau, C1 , C2 , . . . , Cn là các khái niệm ở dạng chuẩn. Việc so sánh cấu trúc cú pháp trong pha thứ hai của thuật toán bao hàm theo cấu trúc thực hiện dựa trên mệnh đề sau [2]: Mệnh đề 1.1. Cho C ≡ A1 D ≡ B1 B2 · · · Bk ∀s1 .D1 trong ngôn ngữ FL0 . Lúc đó C A2 ··· ∀s2 .D2 Am ∀r1 .C1 ∀r2 .C2 ··· ∀rn .Cn và · · · ∀sl .Dl là các khái niệm ở dạng chuẩn D khi và chỉ khi hai điều kiện sau đây thỏa mãn: 1. với mọi 1 ≤ i ≤ k, tồn tại j, 1 ≤ j ≤ m sao cho Aj ≡ Bi , 2. với mọi 1 ≤ i ≤ l, tồn tại j, 1 ≤ j ≤ n sao cho rj ≡ si và Cj Di . Thuật toán bao hàm theo cấu trúc trong các ngôn ngữ khác như FL⊥ , ALN thực hiện một cách tương tự. 1.5.2.2. Thuật toán tableaux Để khắc phục những nhược điểm của thuật toán bao hàm theo cấu trúc, năm 1991, Schmidt-Schauß và Smolka đề xuất thuật toán tableaux để kiểm tra tính thỏa mãn của một khái niệm trong logic mô tả ALC [55]. Hướng tiếp cận này sau đó đã được áp dụng cho các logic mô tả mở rộng của ALC [3], [23], [24], [39], [41], [40], [42] và được áp dụng để cài đặt các bộ suy luận FaCT, FaCT++ , RACER, CEL và KAON 2. Quá trình thực hiện thuật toán tableaux dùng để kiểm tra tính thỏa mãn của một khái niệm trong cơ sở tri thức, kiểm tra tính nhất quán của bộ khẳng định. Thuật toán này trải qua hai giai đoạn. Giai đoạn thứ nhất là chuyển các khái niệm về dạng chuẩn phủ định. Giai đoạn thứ hai là áp dụng các luật chuyển đổi tương ứng với từng logic mô tả cụ thể để tìm mâu thuẫn. 31 Độ phức tạp của thuật toán suy luận tableaux phụ thuộc vào từng logic mô tả. Logic mô tả càng có nhiều tạo tử với khả năng biểu diễn tốt sẽ dẫn đến độ phức tạp càng cao trong quá trình suy luận. Độ phức tạp đối với bài toán suy luận trong logic mô tả ALC, ALCI, ALCIQ và S là PSpace-đầy đủ (đối với trường hợp TBox rỗng hoặc TBox không vòng) và ExpTime-đầy đủ (đối với trường hợp TBox tổng quát); SH, SHI, SHIN và SHIQ là ExpTime-đầy đủ; SHOIN và SHOIQ là NExpTime-đầy đủ; SROIQ là NExpTime-khó [28, 30, 26, 29, 38, 44, 42, 62]. Tiểu kết Chương 1 Trong chương này, luận án đã giới thiệu khái quát về logic mô tả, khả năng biểu diễn tri thức của các logic mô tả. Thông qua cú pháp và ngữ nghĩa của logic mô tả, luận án đã trình bày về cơ sở tri thức, mô hình của cơ sở tri thức trong logic mô tả và những vấn đề cơ bản về suy luận trong logic mô tả. Ngoài việc trình bày ngôn ngữ logic mô tả một cách tổng quát dựa trên logic ALC reg với các đặc trưng mở rộng I (vai trò nghịch đảo), O (định danh), F (tính chất hàm), N (hạn chế số lượng không định tính), Q (hạn chế số lượng định tính), U (vai trò phổ quát), Self (tính phản xạ cục bộ của vai trò), luận án còn xem xét các thuộc tính như là các thành phần cơ bản của ngôn ngữ, bao gồm thuộc tính rời rạc và thuộc tính số cũng như xem xét thêm vai trò dữ liệu trong ngôn ngữ. Cách tiếp cận này phù hợp đối với các hệ thống thông tin dựa trên logic mô tả thường có trong thực tế như SHOIN và SHOIQ là nền tảng để xây dựng OWL, SROIQ là nền tảng để xây dựng OWL 2 - những ngôn ngữ được W3C khuyến nghị để xây dựng ontology cho các hệ thống ngữ nghĩa. 32 Chương 2. MÔ PHỎNG HAI CHIỀU TRONG LOGIC MÔ TẢ VÀ TÍNH BẤT BIẾN 2.1. Giới thiệu Mô phỏng hai chiều được J. van Benthem giới thiệu lần đầu dưới tên gọi p-quan hệ (p-relation) [58] và quan hệ zig-zag (zig-zag relation) [59]. Đây là một khái niệm rất quan trọng trong logic hình thái (modal logic) [60], [5], [6], [61] và trong các hệ thống chuyển trạng thái (state transition systems) [45], [22]. Mô phỏng hai chiều là một quan hệ hai ngôi cho phép đặc tả tính tương tự giữa hai trạng thái, hai đối tượng cũng như tính tương tự giữa các mô hình Kripke. Hai đối tượng được xem là không thể phân biệt được với nhau trên ngôn ngữ logic đang xem xét nếu chúng tương tự nhau theo mô phỏng hai chiều trong logic đó. Trên cơ sở này, các đối tượng không thể phân biệt được với nhau sẽ được đưa vào cùng một lớp khi phân hoạch miền trong quá trình học máy. Mô phỏng hai chiều được sử dụng để phân tích khả năng biểu diễn của một lớp lớn các logic hình thái mở rộng. J. van Benthem đã phát biểu một định lý, được gọi là Van Benthem Characterization, nói lên rằng logic hình thái là phân nhánh bất biến đối với mô phỏng hai chiều của logic bậc nhất. Mô phỏng hai chiều đã thu hút được sự quan tâm nghiên cứu của các nhà khoa học bởi vì chúng là một công cụ phổ biến để mô tả mối quan hệ giữa các trạng thái trong logic tính toán. Về mặt tổng quát, mô phỏng hai chiều là một khái niệm rất tự nhiên về tính tương đương và do đó nó được đầu tư nghiên cứu trong lĩnh vực toán học và logic tính toán. Divroodi và Nguyen đã nghiên cứu mô phỏng hai chiều trong một số logic mô tả cụ thể [13], [14]. Các công trình này tập trung nghiên cứu mô phỏng hai chiều đối với lớp các logic mô tả ALC reg với tập các đặc trưng là I, O, Q, U, Self. Các tác giả đã trình bày các điều kiện của mô phỏng hai chiều một cách thống nhất cho lớp các logic mô tả trên và giải quyết các vấn đề: điều kiện để TBox, ABox bất biến đối với mô phỏng hai chiều; điều kiện về bảo toàn hoặc bất biến của cơ sở tri thức đối với mô phỏng hai chiều. Ngoài ra, các công trình [13], [14] còn cung cấp một số kết quả về tự mô phỏng hai chiều lớn nhất, thuật toán để kiểm tra tính tương tự giữa hai diễn dịch và thuật toán tính phân hoạch tương ứng với tự mô phỏng hai chiều lớn nhất. 33 Nguyen và Szalas đã nghiên cứu về mô phỏng hai chiều và tính không phân biệt được của các đối tượng để áp dụng vào việc học khái niệm trong logic mô tả [44]. Đây là công trình tiên phong về học khái niệm cho các hệ thống thông tin sử dụng mô phỏng hai chiều. Các tác giả đã đề xuất phương pháp tổng quát để làm mịn miền của diễn dịch và thông qua đó để xây dựng khái niệm cần học. Hơn nữa, công trình này còn đề cập đến việc xấp xỉ khái niệm theo lý thuyết tập thô của Pawlak [46], [47]. Lớp các logic mô tả mà công trình này tập trung nghiên cứu là ALC reg với tập các đặc trưng là I, O, Q, U, Self. Ngoài những đặc trưng đã đề cập ở các nghiên cứu trên, trong chương này, chúng tôi tổng quát hóa và mở rộng các kết quả về mô phỏng hai chiều cho một lớp lớn hơn các logic mô tả bằng cách xem xét thêm các thuộc tính như là các phần tử cơ bản của ngôn ngữ và xem xét thêm vai trò dữ liệu. Bên cạnh đó, chúng tôi cũng đề cập đến các đặc trưng F, N cho lớp các logic mô tả trình bày trong luận án này. 2.2. Mô phỏng hai chiều 2.2.1. Khái niệm Định nghĩa 2.1 (Mô phỏng hai chiều). Cho Σ và Σ† là các bộ ký tự logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I và I là các diễn dịch trong LΣ,Φ . Một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I là một quan hệ hai ngôi Z ⊆ ∆I × ∆I thỏa các điều kiện sau với mọi a ∈ Σ†I , A ∈ Σ†C , B ∈ Σ†A \ Σ†C , r ∈ Σ†oR , σ ∈ Σ†dR , d ∈ range(σ), x, y ∈ ∆I , x , y ∈ ∆I : Z(aI , aI ) (2.1) Z(x, x ) ⇒ [AI (x) ⇔ AI (x )] (2.2) Z(x, x ) ⇒ [B I (x) = B I (x ) hoặc cả hai đều không xác định] (2.3) [Z(x, x ) ∧ rI (x, y)] ⇒ ∃y ∈ ∆I [Z(y, y ) ∧ rI (x , y )] (2.4) [Z(x, x ) ∧ rI (x , y )] ⇒ ∃y ∈ ∆I [Z(y, y ) ∧ rI (x, y)] (2.5) Z(x, x ) ⇒ [σ I (x, d) ⇔ σ I (x , d)], (2.6) nếu I ∈ Φ† thì [Z(x, x ) ∧ rI (y, x)] ⇒ ∃y ∈ ∆I [Z(y, y ) ∧ rI (y , x )] (2.7) [Z(x, x ) ∧ rI (y , x )] ⇒ ∃y ∈ ∆I [Z(y, y ) ∧ rI (y, x)], (2.8) nếu O ∈ Φ† thì Z(x, x ) ⇒ [x = aI ⇔ x = aI ], 34 (2.9) nếu N ∈ Φ† thì Z(x, x ) ⇒ #{y ∈ ∆I | rI (x, y)} = #{y ∈ ∆I | rI (x , y )}, (2.10) nếu {N , I} ⊆ Φ† thì Z(x, x ) ⇒ #{y ∈ ∆I | rI (y, x)} = #{y ∈ ∆I | rI (y , x )}, (2.11) nếu F ∈ Φ† thì Z(x, x ) ⇒ [#{y ∈ ∆I | rI (x, y)} ≤ 1 ⇔ #{y ∈ ∆I | rI (x , y )} ≤ 1], (2.12) nếu {F, I} ⊆ Φ† thì Z(x, x ) ⇒ [#{y ∈ ∆I | rI (y, x)} ≤ 1 ⇔ #{y ∈ ∆I | rI (y , x )} ≤ 1], (2.13) nếu Q ∈ Φ† thì nếu Z(x, x ) thỏa mãn thì với mọi r ∈ Σ†oR , tồn tại một song ánh h : {y ∈ ∆I | rI (x, y)} → {y ∈ ∆I | rI (x , y )} sao cho h ⊆ Z, (2.14) nếu {Q, I} ⊆ Φ† thì nếu Z(x, x ) thỏa mãn thì với mọi r ∈ Σ†oR , tồn tại một song ánh h : {y ∈ ∆I | rI (y, x)} → {y ∈ ∆I | rI (y , x )} sao cho h ⊆ Z, (2.15) nếu U ∈ Φ† thì ∀x ∈ ∆I ∃x ∈ ∆I Z(x, x ) (2.16) ∀x ∈ ∆I ∃x ∈ ∆I Z(x, x ) (2.17) Z(x, x ) ⇒ [rI (x, x) ⇔ rI (x , x )], (2.18) nếu Self ∈ Φ† thì trong đó #Γ ký hiệu cho lực lượng của tập hợp Γ1 . Thông qua Định nghĩa 2.1, chúng ta thấy rằng nếu Z là một LΣ† ,Φ† -mô phỏng hai chiều, x ∈ ∆I và x ∈ ∆I sao cho Z(x, x )2 thỏa mãn thì khi phần tử x thỏa mãn tính chất, điều kiện gì trên tập ký tự logic mô tả Σ† và tập các đặc trưng Φ† trong diễn dịch I thì x cũng thỏa mãn những điều kiện đó trên tập ký tự logic mô tả Σ† và tập các đặc trưng Φ† trong diễn dịch I . 1 2 Các ký hiệu được dùng theo ý nghĩa, ⇒: suy ra, ⇔: khi và chỉ khi, =: quan hệ “=” truyền thống. Ký hiệu Z(x, x ) được sử dụng để thay thế cho x, x ∈ Z. 35 Bổ đề 2.1 sau đây nói lên sự tồn tại của mô phỏng hai chiều, tính nghịch đảo của mô phỏng hai chiều, tính chất hợp thành của mô phỏng hai chiều và hợp của các mô phỏng hai chiều. Bổ đề này được phát triển dựa trên Bổ đề 3.1 của Divroodi và Nguyen [14] với điểm khác biệt là nó được áp dụng cho một lớp lớn hơn các logic mô tả khác nhau như đã đề cập trong Mục 1.2.2 của Chương 1. Bổ đề 2.1. 1. Quan hệ { x, x | x ∈ ∆I } là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I. 2. Nếu Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I thì Z −1 cũng là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I. 3. Nếu Z1 là một LΣ† ,Φ† -mô phỏng hai chiều giữa I0 và I1 , Z2 là một LΣ† ,Φ† -mô phỏng hai chiều giữa I1 và I2 thì Z1 ◦ Z2 là một LΣ† ,Φ† -mô phỏng hai chiều giữa I0 và I2 . 4. Nếu Z là một tập các LΣ† ,Φ† -mô phỏng hai chiều giữa I và I thì Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Chứng minh. Để chứng minh bổ đề này, chúng ta chứng minh lần lượt các khẳng định 1–4 của bổ đề. Với mỗi khẳng định, ta cần phải chỉ ra rằng quan hệ đó thỏa mãn 18 điều kiện của mô phỏng hai chiều theo Định nghĩa 2.1. - Xét khẳng định (1) và giả sử có Σ† ⊆ Σ, Φ† ⊆ Φ. Xét a ∈ Σ†I , A ∈ Σ†C , B ∈ Σ†A \ Σ†C , r ∈ Σ†oR , σ ∈ Σ†dR , d ∈ range(σ), x, y ∈ ∆I , x , y ∈ ∆I . Gọi Z là quan hệ { x, x | x ∈ ∆I }. Lúc đó, nếu Z(x, x ) thỏa mãn thì x = x , và khi cần chúng ta chọn y = y thì quan hệ Z thỏa tất cả các điều kiện (2.1)–(2.18). - Xét khẳng định (2) và giả sử Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Lúc đó Z(x, x ) thỏa mãn khi và chỉ khi Z −1 (x , x) thỏa mãn. Bằng cách hoán vị x và x cho nhau chúng ta dễ dàng thấy rằng quan hệ Z −1 thỏa tất cả các điều kiện (2.1)–(2.18). - Xét khẳng định (3) và giả sử Z1 là một LΣ† ,Φ† -mô phỏng hai chiều giữa I0 và I1 , Z2 là một LΣ† ,Φ† -mô phỏng hai chiều giữa I1 và I2 . Giả sử có Σ† ⊆ Σ, Φ† ⊆ Φ. Xét a ∈ Σ†I , A ∈ Σ†C , B ∈ Σ†A \ Σ†C , r ∈ Σ†oR , σ ∈ Σ†dR , d ∈ range(σ), x0 , y0 ∈ ∆I0 và x2 , y2 ∈ ∆I2 . Đặt Z = Z1 ◦ Z2 . Chúng ta chứng minh Z là một LΣ† ,Φ† -mô phỏng hai chiều bằng cách chỉ ra rằng Z thỏa mãn tất cả các điều kiện (2.1)–(2.18). • Xét điều kiện (2.1) và giả sử Z1 (aI0 , aI1 ), Z2 (aI1 , aI2 ) thỏa mãn. Vì Z1 (aI0 , aI1 ) và Z2 (aI1 , aI2 ) thỏa mãn nên ta có (Z1 ◦ Z2 )(aI0 , aI2 ) thỏa mãn. Vậy Z(aI0 , aI2 ) thỏa mãn. 36 • Xét điều kiện (2.2) và giả sử Z(x0 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Do đó, ta có AI0 (x0 ) ⇔ AI1 (x1 ) và AI1 (x1 ) ⇔ AI2 (x2 ). Từ đó suy ra AI0 (x0 ) ⇔ AI2 (x2 ). • Xét điều kiện (2.3) và giả sử Z(x0 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Vì Z1 (x0 , x1 ) thỏa mãn nên ta có B I0 (x0 ) = B I1 (x1 ) hoặc cả hai không xác định. Tương tự, Z1 (x0 , x1 ) thỏa mãn nên B I1 (x1 ) = B I2 (x2 ) hoặc cả hai không xác định. Nếu B I0 (x0 ) = B I1 (x1 ) thì B I1 (x1 ) xác định và B I1 (x1 ) = B I2 (x2 ). Từ đó suy ra B I0 (x0 ) = B I1 (x1 ) = B I2 (x2 ). Nếu B I0 (x0 ) không xác định ta suy ra B I1 (x1 ) không xác định và ngược lại. Tương tự, khi B I1 (x1 ) không xác định ta suy ra B I2 (x2 ) không xác định và ngược lại. Từ đó ta có B I0 (x0 ) không xác định khi và chỉ khi B I2 (x2 ) không xác định. • Xét điều kiện (2.4) và giả sử Z(x0 , x2 ) và rI0 (x0 , y0 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Từ Z1 (x0 , x1 ) và rI0 (x0 , y0 ) thỏa mãn ta suy ra tồn tại y1 ∈ ∆I1 sao cho Z1 (y0 , y1 ) và rI1 (x1 , y1 ) thỏa mãn. Từ Z2 (x1 , x2 ) và rI1 (x1 , y1 ) thỏa mãn ta suy ra tồn tại y2 ∈ ∆I2 sao cho Z2 (y1 , y2 ) và rI2 (x2 , y2 ) thỏa mãn. Từ Z1 (y0 , y1 ) và Z2 (y1 , y2 ) thỏa mãn ta có Z(y0 , y2 ) thỏa mãn. • Điều kiện (2.5) được chứng minh tương tự như điều kiện (2.4). • Xét điều kiện (2.6) và giả sử Z(x0 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn nên ta có σ I0 (x0 , d) ⇔ σ I1 (x1 , d) và σ I1 (x1 , d) ⇔ σ I2 (x2 , d). Từ đó ta suy ra σ I0 (x0 , d) ⇔ σ I2 (x2 , d). • Điều kiện (2.7) trong trường hợp I ∈ Φ† cũng được chứng minh tương tự như điều kiện (2.4) bằng cách thay vai trò r bởi vai trò r− . • Tương tự, điều kiện (2.8) trong trường hợp I ∈ Φ† cũng được chứng minh như điều kiện (2.4) và (2.7). • Điều kiện (2.9) trong trường hợp O ∈ Φ† được chứng minh bằng cách vận dụng kết quả của điều kiện (2.2) với khái niệm A được thay thế bởi khái niệm {a}. • Xét điều kiện (2.10) trong trường hợp N ∈ Φ† và giả sử Z(x0 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Vì Z1 (x0 , x1 ) thỏa mãn nên ta có #{y0 ∈ ∆I0 | rI0 (x0 , y0 )} = #{y1 ∈ ∆I1 | rI1 (x1 , y1 )}. Tương tự, Z2 (x1 , x2 ) thỏa mãn nên ta có #{y1 ∈ ∆I1 | rI1 (x1 , y1 )} = 37 #{y2 ∈ ∆I2 | rI2 (x2 , y2 )}. Từ đó ta suy ra #{y0 ∈ ∆I0 | rI0 (x0 , y0 )} = #{y2 ∈ ∆I2 | rI2 (x2 , y2 )}. • Điều kiện (2.11) trong trường hợp {N , I} ⊆ Φ† cũng được chứng minh tương tự như điều kiện (2.10) bằng cách thay vai trò r bởi vai trò r− . • Xét điều kiện (2.12) trong trường hợp F ∈ Φ† và giả sử Z(x0 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Do Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn nên ta có [#{y0 ∈ ∆I0 | rI0 (x0 , y0 )} ≤ 1] ⇔ [#{y1 ∈ ∆I1 | rI1 (x1 , y1 )} ≤ 1] và [#{y1 ∈ ∆I1 | rI1 (x1 , y1 )} ≤ 1] ⇔ [#{y2 ∈ ∆I2 | rI2 (x2 , y2 )} ≤ 1]. Từ đó ta suy ra [#{y0 ∈ ∆I0 | rI0 (x0 , y0 )} ≤ 1] ⇔ [#{y2 ∈ ∆I2 | rI2 (x2 , y2 )} ≤ 1]. • Điều kiện (2.13) trong trường hợp {F, I} ⊆ Φ† cũng được chứng minh tương tự như điều kiện (2.12) bằng cách thay vai trò r bởi vai trò r− . • Xét điều kiện (2.14) trong trường hợp Q ∈ Φ† và giả sử Z(x0 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Do Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn nên với mọi tên vai trò đối tượng r ∈ Σ†oR tồn tại một song ánh h1 : {y0 ∈ ∆I0 | rI0 (x0 , y0 )} → {y1 ∈ ∆I1 | rI1 (x1 , y1 )} sao cho h1 ⊆ Z1 và một song ánh h2 : {y1 ∈ ∆I1 | rI1 (x1 , y1 )} → {y2 ∈ ∆I2 | rI2 (x2 , y2 )} sao cho h2 ⊆ Z2 . Đặt h = h2 ◦ h1 là hàm hợp thành của h1 và h2 . Rõ ràng h : {y0 ∈ ∆I0 | rI0 (x0 , y0 )} → {y2 ∈ ∆I2 | rI2 (x2 , y2 )} là một song ánh và h ⊆ Z. • Điều kiện (2.15) trong trường hợp {Q, I} ⊆ Φ† được chứng minh tương tự như điều kiện (2.14) bằng cách thay vai trò r bởi vai trò r− . • Xét điều kiện (2.16) trong trường hợp U ∈ Φ† . Với mọi x0 ∈ ∆I0 tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) thỏa mãn và với x1 ∈ ∆I1 tồn tại x2 ∈ ∆I2 sao cho Z2 (x1 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 , do đó với mọi x0 ∈ ∆I0 tồn tại x2 ∈ ∆I2 sao cho Z(x0 , x2 ) thỏa mãn. • Điều kiện (2.17) trong trường hợp U ∈ Φ† cũng được chứng minh tương tự như điều kiện (2.16). • Xét điều kiện (2.18) trong trường hợp Self ∈ Φ† và giả sử Z(x0 , x2 ) thỏa mãn. Vì Z = Z1 ◦ Z2 nên tồn tại x1 ∈ ∆I1 sao cho Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn. Vì Z1 (x0 , x1 ) và Z2 (x1 , x2 ) thỏa mãn nên ta có rI0 (x0 , x0 ) ⇔ rI1 (x1 , x1 ) và rI1 (x1 , x1 ) ⇔ rI2 (x2 , x2 ). Từ đó ta suy ra rI0 (x0 , x0 ) ⇔ rI2 (x2 , x2 ). - Xét khẳng định (4) và giả sử Z = {Z1 , Z2 , . . .} là một tập các LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Giả sử có Σ† ⊆ Σ, Φ† ⊆ Φ. Xét a ∈ Σ†I , A ∈ Σ†C , B ∈ Σ†A \ Σ†C , 38 r ∈ Σ†oR , σ ∈ Σ†dR , d ∈ range(σ), x, y ∈ ∆I và x , y ∈ ∆I . Đặt Z = Z. Chúng ta chứng minh Z là một LΣ† ,Φ† -mô phỏng hai chiều bằng cách chỉ ra rằng Z thỏa mãn tất cả các điều kiện (2.1)–(2.18). • Xét điều kiện (2.1). Với mọi Zi ∈ Z, Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có Zi (aI , aI ) thỏa mãn. Từ đó ta suy ra Z(aI , aI ) thỏa mãn. • Xét điều kiện (2.2) và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có AI (x) ⇔ AI (x ). • Xét điều kiện (2.3) và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có B I (x) = B I (x ) hoặc cả hai đều không xác định. • Xét điều kiện (2.4) và giả sử Z(x, x ) và rI (x, y) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I và rI (x, y) thỏa mãn nên tồn tại y ∈ ∆I sao cho Zi (y, y ) và rI (x , y ) thỏa mãn. Vì Zi (y, y ) thỏa mãn nên ta có Z(y, y ) thỏa mãn. • Điều kiện (2.5) được chứng minh tương tự như điều kiện (2.4). • Xét điều kiện (2.6) và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có σ I (x, d) ⇔ σ I (x , d). • Điều kiện (2.7) trong trường hợp I ∈ Φ† được chứng minh tương tự như điều kiện (2.4) bằng cách thay vai trò r bởi vai trò r− . • Tương tự, điều kiện (2.8) trong trường hợp I ∈ Φ† cũng được chứng minh như điều kiện (2.4) và (2.7). • Xét điều kiện (2.9) và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có x = aI ⇔ x = aI . • Xét điều kiện (2.10) trong trường hợp N ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có #{y ∈ ∆I | rI (x, y)} = #{y ∈ ∆I | rI (x , y )}. 39 • Điều kiện (2.11) trong trường hợp {N , I} ⊆ Φ† được chứng minh tương tự như điều kiện (2.10) bằng cách thay vai trò r bởi vai trò r− . • Xét điều kiện (2.12) trong trường hợp F ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có [#{y ∈ ∆I | rI (x, y)} ≤ 1] ⇔ [#{y ∈ ∆I | rI (x , y )}]. • Điều kiện (2.13) trong trường hợp {F, I} ⊆ Φ† cũng được chứng minh tương tự như điều kiện (2.12) bằng cách thay vai trò r bởi vai trò r− . • Xét điều kiện (2.14) trong trường hợp Q ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên với mọi vai trò đối tượng r ∈ Σ†oR tồn tại một song ánh xạ h : {y ∈ ∆I | rI (x, y)} → {y ∈ ∆I | rI (x , y )} sao cho h ⊆ Zi . Do Zi ⊆ Z = Z nên ta có h ⊆ Z. • Điều kiện (2.15) trong trường hợp {Q, I} ⊆ Φ† cũng được chứng minh tương tự như điều kiện (2.14) bằng cách thay vai trò r bởi vai trò r− . • Xét điều kiện (2.16) trong trường hợp U ∈ Φ† . Với Zi ∈ Z là một LΣ† ,Φ† -mô phỏng hai chiều nên với mọi x ∈ ∆I tồn tại x ∈ ∆I sao cho Zi (x, x ) thỏa mãn. Vì Zi (x, x ) thỏa mãn nên Z(x, x ) thỏa mãn. • Điều kiện (2.17) trong trường hợp U ∈ Φ† cũng được chứng minh tương tự như điều kiện (2.16). • Xét điều kiện (2.18) trong trường hợp Self ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên ta suy ra tồn tại Zi ∈ Z sao cho Zi (x, x ) thỏa mãn. Vì Zi là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên rI (x, x) ⇔ rI (x , x ). 2.2.2. Quan hệ tương tự hai chiều và quan hệ tương đương Các định nghĩa sau đây phát biểu về quan hệ tương tự giữa các diễn dịch, quan hệ tương tự giữa các phần tử trong miền của diễn dịch và quan hệ tương đương trong một ngôn ngữ con cho trước [13], [14], [44]. Định nghĩa 2.2. Cho I và I là các diễn dịch trong ngôn ngữ LΣ,Φ . Ta nói rằng I LΣ† ,Φ† -tương tự hai chiều với I nếu tồn tại một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . 40 Quan hệ LΣ† ,Φ† -tương tự hai chiều giữa hai diễn dịch I và I nói lên rằng khi Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I thì chúng ta có thể mô phỏng diễn dịch này bằng diễn dịch kia và ngược lại thông qua quan hệ Z và khi đó diễn dịch I và I là LΣ† ,Φ† -tương tự hai chiều với nhau. Định nghĩa 2.3. Cho I và I là các diễn dịch trong ngôn ngữ LΣ,Φ , x ∈ ∆I và x ∈ ∆I . Ta nói rằng x LΣ† ,Φ† -tương tự hai chiều với x nếu tồn tại một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I sao cho Z(x, x ) thỏa mãn. Định nghĩa 2.3 chỉ ra rằng nếu hai diễn dịch I và I là LΣ† ,Φ† -tương tự hai chiều với nhau thông qua LΣ† ,Φ† -mô phỏng hai chiều Z và phần tử x ∈ ∆I , x ∈ ∆I mà Z(x, x ) thỏa mãn thì chúng ta có thể mô phỏng một phần tử x bởi một phần tử x thông qua quan hệ Z và khi đó phần tử x và x là LΣ† ,Φ† -tương tự hai chiều với nhau. Định nghĩa 2.4. Cho I và I là các diễn dịch trong ngôn ngữ LΣ,Φ , x ∈ ∆I và x ∈ ∆I . Ta nói rằng x LΣ† ,Φ† -tương đương với x nếu với mọi khái niệm C của LΣ† ,Φ† , x ∈ C I khi và chỉ khi x ∈ C I . Quan hệ LΣ† ,Φ† -tương đương giữa các đối tượng là một quan hệ rất quan trọng. Nó được sử dụng để mô hình hóa tính không phân biệt được của các đối tượng. Theo đó, nếu hai đối tượng x ∈ ∆I và x ∈ ∆I là LΣ† ,Φ† -tương đương với nhau thì hai đối tượng này không phân biệt được thông qua tất cả các khái niệm C của LΣ† ,Φ† . Theo Bổ đề 2.1, chúng ta thấy rằng quan hệ tương tự hai chiều giữa các diễn dịch là một quan hệ tương đương và quan hệ tương tự hai chiều giữa các phần tử trong diễn dịch cũng là một quan hệ tương đương bởi vì các quan hệ này đều thỏa mãn ba tính chất phản xạ, đối xứng và bắc cầu. Ví dụ 2.1. Xét các diễn dịch I1 và I2 trong ngôn ngữ LΣ,Φ như đã cho ở Ví dụ 1.10. Hình 2.1 biểu diễn hai diễn dịch I1 và I2 , trong đó mỗi nút đại diện cho một cá thể, các cạnh liền nét thể hiện cho vai trò hasChild, các cạnh đứt nét thể hiện cho vai trò marriedT o. Khái niệm M ale được ký hiệu bằng chữ cái M , khái niệm F emale được ký hiệu bằng chữ cái F . Giá trị của thuộc tính BirthY ear được viết phía trên của mỗi cá thể. Giá trị của thuộc tính N ickN ame được viết phía dưới của mỗi cá thể. Chúng ta có một số kết luận sau đây: • I1 LΣ† ,Φ† -tương tự hai chiều với I2 , trong đó Σ† = Σ\{N ickN ame, hasOccupation} và Φ† ⊆ {I, O}, • I1 không LΣ† ,Φ† -tương tự hai chiều với I2 , trong đó Σ† = Σ và Φ† = {N }, 41 (I1 ) aI1 1925 : F k Allie D bI1 1920 : M Bo A u x1957 1 :M Dell c I1 1955 C :F x1956 :M 2 Eddy k Cal u x1987 3 A :M Fae x1984 4 (I2 ) aI2 1925 : F k Allie :M Dell :M Jay bI2 1920 : M Bo A u y11957 y51987 D :F Garry c I2 1955 C :F q Cal k u y31987 y21956 : M Eddy u :M Fae A y41984 :F Garry Hình 2.1: Các diễn dịch I và I trong LΣ,Φ của Ví dụ 1.10 • I1 không LΣ† ,Φ† -tương tự hai chiều với I2 , trong đó Σ† = Σ và Φ† = {Q}, • x3 (của diễn dịch I1 ) LΣ† ,Φ† -tương tự hai chiều với y3 , y5 (của diễn dịch I2 ), trong đó Σ† = Σ \ {N ickN ame, hasOccupation} và Φ† ⊆ {I, O}, • cI1 không LΣ† ,Φ† -tương tự hai chiều với cI2 , trong đó Σ† = Σ \ {N ickN ame, hasOccupation} và Φ† = {N }. 2.3. Tính bất biến đối với mô phỏng hai chiều 2.3.1. Quan hệ giữa mô phỏng hai chiều với các khái niệm và vai trò Điều kiện (2.2), (2.4), (2.5) và (2.9) cho biết rằng, khi Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa diễn dịch I và I thì các điều kiện này thỏa mãn đối với các tên khái niệm và tên vai trò trong tập ký tự logic mô tả Σ† . Bổ đề 2.2 sau đây khẳng định các điều kiện trên cũng đúng với các khái niệm phức và vai trò phức của ngôn ngữ LΣ† ,Φ† . Bổ đề này được được phát triển dựa trên Bổ đề 3.3 của công trình [14] với lớp các logic mô tả lớn hơn như đã đề cập trong Mục 1.2.2 của Chương 1. Phần chứng minh 42 của bổ đề, chúng tôi đã bổ sung cho những trường hợp phát sinh thêm trên lớp các ngôn ngữ đang nghiên cứu. Bổ đề 2.2. Cho I và I là các diễn dịch trong ngôn ngữ LΣ,Φ , Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Lúc đó, với mọi khái niệm C của LΣ† ,Φ† , mọi vai trò đối tượng R của LΣ† ,Φ† , mọi đối tượng x, y ∈ ∆I , x , y ∈ ∆I và mọi cá thể a ∈ Σ†I , các điều kiện sau sẽ được thỏa mãn: Z(x, x ) ⇒ [C I (x) ⇔ C I (x )] (2.19) [Z(x, x ) ∧ RI (x, y)] ⇒ ∃y ∈ ∆I | [Z(y, y ) ∧ RI (x , y )] (2.20) [Z(x, x ) ∧ RI (x , y )] ⇒ ∃y ∈ ∆I | [Z(y, y ) ∧ RI (x, y)], (2.21) nếu O ∈ Φ† thì: Z(x, x ) ⇒ [RI (x, aI ) ⇔ RI (x , aI )]. (2.22) Chứng minh. Giả sử I và I là các diễn dịch trong LΣ,Φ và Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Chúng ta sẽ chứng minh bổ đề này bằng phương pháp đệ quy theo cấu trúc của khái niệm C và vai trò R. - Xét khẳng định (2.19). Giả sử Z(x, x ) thỏa mãn với x ∈ ∆I , x ∈ ∆I và C là một khái niệm bất kỳ của LΣ† ,Φ† . Chúng ta cần chứng minh nếu C I (x) thỏa mãn thì C I (x ) thỏa mãn và ngược lại. Giả sử C I (x) thỏa mãn, chúng ta chứng minh C I (x ) thỏa mãn. Việc chứng minh chiều ngược lại được thực hiện tương tự. • Trường hợp C có dạng , ⊥ hoặc A là những trường hợp tầm thường được suy ra trực tiếp từ điều kiện (2.2). • Trường hợp C có dạng A = d, A = d, A ≤ d, A < d, A ≥ d hoặc A > d là những trường hợp tầm thường được suy ra trực tiếp từ điều kiện (2.3). • Trường hợp C ≡ ¬D, vì C I (x) thỏa mãn nên ta có DI (x) không thỏa mãn. Vì Z(x, x ) thỏa mãn và DI (x) không thỏa mãn nên ta suy ra DI (x ) không thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.19)). Do đó, ¬DI (x ) thỏa mãn. Nói cách khác C I (x ) thỏa mãn. • Trường hợp C ≡ D D , vì C I (x) thỏa mãn nên DI (x) và D I (x) thỏa mãn. Vì Z(x, x ), DI (x) và D I (x) thỏa mãn nên ta có DI (x ) và D I (x ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.19)). Do đó, C I (x ) thỏa mãn. • Trường hợp C ≡ D D , vì C I (x) thỏa mãn nên DI (x) hoặc D I (x) thỏa mãn. Không mất tính tổng quát ta giả sử DI (x) thỏa mãn. Vì Z(x, x ) và DI (x) 43 thỏa mãn nên ta có DI (x ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.19)). Do đó, C I (x ) thỏa mãn. • Trường hợp C ≡ ∃R.D, vì C I (x) thỏa mãn nên tồn tại y ∈ ∆I sao cho RI (x, y) và DI (y) thỏa mãn. Do Z(x, x ) và RI (x, y) thỏa mãn nên tồn tại y ∈ ∆I sao cho Z(y, y ) và RI (x , y ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.20)). Vì Z(y, y ) và DI (y) thỏa mãn nên DI (y ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.19)). Vì RI (x , y ) và DI (y ) thỏa mãn nên ta có C I (x ) thỏa mãn. • Trường hợp C ≡ ∀R.D, khái niệm C được biến đổi thành ¬∃R.¬D và được chứng minh bằng cách vận dụng C có dạng là một khái niệm phủ định. • Trường hợp C ≡ ∃σ.{d}, vì C I (x) thỏa mãn nên ta có σ I (x, d) thỏa mãn. Vì Z(x, x ) thỏa mãn nên theo điều kiện (2.6) ta có σ I (x , d) thỏa mãn. Do đó, C I (x ) thỏa mãn. • Trường hợp O ∈ Φ† và C ≡ {a}, vì C I (x) thỏa mãn nên ta có x = aI . Do Z(x, x ) thỏa mãn nên theo điều kiện (2.9) ta có x = aI . Vậy C I (x ) thỏa mãn. • Trường hợp F ∈ Φ† và C ≡ (≤ 1 R), trong đó R là một vai trò đối tượng cơ bản. Vì Z(x, x ) thỏa mãn nên ta có [#{y ∈ ∆I | RI (x, y)} ≤ 1] ⇔ [#{y ∈ ∆I | RI (x , y )} ≤ 1]. Vì C I (x) thỏa mãn nên #{y ∈ ∆I | RI (x, y)} ≤ 1 và do đó #{y ∈ ∆I | RI (x , y )} ≤ 1. Từ đó suy ra C I (x ) thỏa mãn. • Trường hợp N ∈ Φ† và C ≡ (≥ n R), trong đó R là một vai trò đối tượng cơ bản. Vì Z(x, x ) thỏa mãn nên ta có #{y ∈ ∆I | RI (x, y)} = #{y ∈ ∆I | RI (x , y )}. Vì C I (x) thỏa mãn nên #{y ∈ ∆I | RI (x, y)} ≥ n và do đó #{y ∈ ∆I | RI (x , y )} ≥ n. Từ đó suy ra C I (x ) thỏa mãn. • Trường hợp N ∈ Φ† và C ≡ (≤ n R), trong đó R là một vai trò đối tượng cơ bản được chứng minh tương tự như trên. • Trường hợp Q ∈ Φ† và C ≡ (≥ n R.D), trong đó R là một vai trò đối tượng cơ bản. Vì Z(x, x ) thỏa mãn nên tồn tại một song ánh h : {y ∈ ∆I | RI (x, y)} → {y ∈ ∆I | RI (x , y )} sao cho h ⊆ Z. Vì C I (x) thỏa mãn nên tồn tại các đối tượng y1 , y2 , . . . , yn ∈ ∆I khác nhau từng đôi một sao cho RI (x, yi ) và DI (yi ) thỏa mãn với mọi 1 ≤ i ≤ n. Đặt yi = h(yi ). Vì h ⊆ Z nên ta có Z(yi , yi ) thỏa mãn. Từ Z(yi , yi ) và DI (yi ) thỏa mãn ta suy ra DI (yi ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.19)). Do RI (x , yi ) và DI (yi ) thỏa mãn với mọi 1 ≤ i ≤ n nên C I (x ) thỏa mãn. 44 • Trường hợp Q ∈ Φ† và C ≡ (≤ n R.D), trong đó R là một vai trò đối tượng cơ bản. Khái niệm C được biến đổi thành ¬(≥ (n + 1) R.D) và được chứng minh bằng cách vận dụng C là một khái niệm có dạng phủ định. • Trường hợp Self ∈ Φ† và C ≡ ∃r.Self, vì C I (x) thỏa mãn nên ta có rI (x, x) thỏa mãn. Vì rI (x, x) thỏa mãn nên theo điều kiện (2.18) ta có rI (x , x ) thỏa mãn. Do đó, C I (x ) thỏa mãn. - Xét khẳng định (2.20). Giả sử Z(x, x ) và RI (x, y) thỏa mãn với x, y ∈ ∆I và x ∈ ∆I , trong đó R là một vai trò đối tượng cơ bản của LΣ† ,Φ† . Chúng ta chứng minh tồn tại y ∈ ∆I sao cho Z(y, y ) và RI (x , y ) thỏa mãn. • Trường hợp R là một vai trò nguyên tố (tên vai trò đối tượng), theo điều kiện (2.4) ta suy ra khẳng định là đúng. • Trường hợp R ≡ S1 ◦ S2 , ta có (S1 ◦ S2 )I (x, x ) thỏa mãn. Do đó, tồn tại một z ∈ ∆I sao cho S1I (x, z) và S2I (z, y) thỏa mãn. Vì Z(x, x ) và S1I (x, z) thỏa mãn nên tồn tại z ∈ ∆I sao cho Z(z, z ) và S1I (x , z ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.20)). Vì Z(z, z ) và S2I (z, y) thỏa mãn nên tồn tại y ∈ ∆I sao cho Z(y, y ) và S2I (z , y ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.20)). Vì S1I (x , z ) và S2I (z , y ) thỏa mãn nên ta suy ra (S1 ◦ S2 )I (x , y ) thỏa mãn. Vậy ta có Z(y, y ) và RI (x , y ) thỏa mãn. • Trường hợp R ≡ S1 S2 , ta có (S1 S2 )I (x, y) thỏa mãn. Điều này suy ra rằng S1I (x, y) hoặc S2I (x, y) thỏa mãn. Không làm mất tính tổng quát, ta giả sử S1I (x, y) thỏa mãn. Vì Z(x, x ) và S1I (x, y) thỏa mãn nên tồn tại y ∈ ∆I sao cho Z(y, y ) và S1I (x , y ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.20)). Vậy ta có Z(y, y ) và (S1 S2 )I (x , y ) thỏa mãn. Hay nói cách khác Z(y, y ) và RI (x , y ) thỏa mãn. • Trường hợp R ≡ S ∗ , vì RI (x, y) thỏa mãn nên tồn tại x0 , x1 , . . . , xk ∈ ∆I với k ≥ 0 sao cho x0 = x, xk = y và S I (xi−1 , xi ) thỏa mãn với 1 ≤ i ≤ k. Đặt x0 = x . Với 1 ≤ i ≤ k ta có Z(xi−1 , xi−1 ) và S I (xi−1 , xi ) thỏa mãn nên tồn tại xi ∈ ∆I sao cho Z(xi , xi ) và S I (xi−1 , xi ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.20)). Đặt y = xk . Vì Z(xk , xk ) và (S ∗ )I (x0 , xk ) thỏa mãn nên Z(y, y ) và RI (x , y ) thỏa mãn. • Trường hợp R ≡ (D?), vì RI (x, y) thỏa mãn nên ta có DI (x) thỏa mãn và x = y. Vì Z(x, x ) và DI (x) thỏa mãn nên DI (x ) thỏa mãn (thông qua giả thiết đệ 45 quy của khẳng định (2.19)) và do đó RI (x , x ) thỏa mãn. Chọn y = x ta có Z(y, y ) và RI (x , y ) thỏa mãn. • Trường hợp R ≡ ε, vì RI (x, y) thỏa mãn nên ta có x = y. Chọn y = x . Vì Z(x, x ) thỏa mãn nên ta có Z(y, y ) và RI (x , y ) thỏa mãn. • Trường hợp I ∈ Φ† và R ≡ r− , khẳng định được chứng minh bằng cách suy luận từ điều kiện (2.7). • Trường hợp U ∈ Φ† và R ≡ U , vì Z(x, x ) và RI (x, y) thỏa mãn. Theo điều kiện (2.16), tồn tại y ∈ ∆I sao cho Z(y, y ) thỏa mãn. Như vậy Z(y, y ) và RI (x , y ) thỏa mãn. - Khẳng định (2.21) được chứng minh tương tự như (2.20). - Xét khẳng định (2.22) trong trường hợp O ∈ Φ† . Với a ∈ Σ†I , x ∈ ∆I và x ∈ ∆I , giả sử Z(x, x ) thỏa mãn chúng ta cần chứng minh nếu RI (x, aI ) thỏa mãn thì RI (x , aI ) thỏa mãn và ngược lại. Giả sử RI (x, aI ) thỏa mãn chúng ta chứng minh RI (x , aI ) thỏa mãn. Việc chứng minh chiều ngược lại được thực hiện tương tự. • Trường hợp R là một vai trò nguyên tố (tên vai trò đối tượng), theo điều kiện (2.4) và (2.9) ta suy ra khẳng định là đúng. • Trường hợp R ≡ S1 ◦ S2 , vì RI (x, aI ) thỏa mãn nên ta có (S1 ◦ S2 )I (x, aI ) thỏa mãn. Do đó, tồn tại một z ∈ ∆I sao cho S1I (x, z) và S2I (z, aI ) thỏa mãn. Vì Z(x, x ) và S1I (x, z) thỏa mãn nên tồn tại z ∈ ∆I sao cho Z(z, z ) và S1I (x , z ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.20)). Vì Z(z, z ) và S2I (z, aI ) thỏa mãn nên ta suy ra S2I (z , aI ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.22)). Vì S1I (x , z ) và S2I (z , aI ) thỏa mãn nên ta có (S1 ◦ S2 )I (x , aI ) thỏa mãn. Như vậy RI (x , aI ) thỏa mãn. • Trường hợp R ≡ S1 S2 , vì RI (x, aI ) thỏa mãn nên ta có (S1 S2 )I (x, aI ) thỏa mãn. Điều này suy ra rằng S1I (x, aI ) hoặc S2I (x, aI ) thỏa mãn. Không làm mất tính tổng quát, ta giả sử S1I (x, aI ) thỏa mãn. Vì Z(x, x ) và S1I (x, aI ) thỏa mãn nên S1I (x , aI ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.22)). Vì S1I (x , aI ) thỏa mãn nên (S1 S2 )I (x , aI ) thỏa mãn. Do đó, RI (x , aI ) thỏa mãn. • Trường hợp R ≡ S ∗ , vì RI (x, aI ) thỏa mãn nên tồn tại x0 , x1 , . . . , xk ∈ ∆I với k ≥ 0 sao cho x0 = x, xk = aI và S I (xi−1 , xi ) thỏa mãn với 1 ≤ i ≤ k. 46 + Nếu k = 0, ta có x = aI . Do Z(x, x ) thỏa mãn nên theo điều kiện (2.9) ta có x = aI . Vì vậy, RI (x , aI ) thỏa mãn. + Nếu k > 0, đặt x0 = x . Với 1 ≤ i < k ta có Z(xi−1 , xi−1 ) và S I (xi−1 , xi ) thỏa mãn nên tồn tại xi ∈ ∆I sao cho Z(xi , xi ) và S I (xi−1 , xi ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.20)). Do đó, Z(xk−1 , xk−1 ) và (S ∗ )I (x0 , xk−1 ) thỏa mãn. Vì Z(xk−1 , xk−1 ) và S I (xk−1 , aI ) thỏa mãn nên ta có S I (xk−1 , aI ) thỏa mãn (thông qua giả thiết đệ quy của khẳng định (2.22)). Vì (S ∗ )I (x0 , xk−1 ) và S I (xk−1 , aI ) thỏa mãn nên (S ∗ )I (x0 , aI ) thỏa mãn. Nghĩa là RI (x , aI ) thỏa mãn. • Trường hợp R ≡ (D?), vì RI (x, aI ) thỏa mãn nên ta có x = aI và DI (aI ) thỏa mãn. Vì Z(x, x ) thỏa mãn nên theo điều kiện (2.9) thì x = aI . Từ Z(aI , aI ) và DI (aI ) thỏa mãn ta có DI (aI ) (thông qua giả thiết đệ quy của khẳng định (2.19)). Từ x = aI và DI (aI ) thỏa mãn ta suy ra RI (x , aI ) thỏa mãn. • Trường hợp R ≡ ε, vì RI (x, aI ) thỏa mãn nên ta có x = aI . Vì Z(x, x ) nên theo điều kiện (2.9) ta có x = aI . Do đó, RI (x , aI ) thỏa mãn. • Trường hợp I ∈ Φ† và R ≡ r− , khẳng định được chứng minh bằng cách suy luận từ điều kiện (2.7) và khẳng định (2.21). • Trường hợp U ∈ Φ† và R ≡ U , theo định nghĩa diễn dịch của vai trò U , ta có RI (x, aI ) và RI (x , aI ) luôn thỏa mãn. 2.3.2. Tính bất biến của khái niệm Tính bất biến của khái niệm đối với mô phỏng hai chiều là một trong những tính chất quan trọng trong việc mô hình hóa tính không phân biệt được của các đối tượng. Divroodi và Nguyen [14], Nguyen và Szalas [44] đã định nghĩa về khái niệm bất biến trong logic mô tả như sau. Định nghĩa 2.5 (Khái niệm bất biến). Một khái niệm C được gọi là bất biến đối với LΣ† ,Φ† -mô phỏng hai chiều nếu Z(x, x ) thỏa mãn thì x ∈ C I khi và chỉ khi x ∈ C I với mọi diễn dịch I, I trong ngôn ngữ LΣ,Φ và với mọi LΣ† ,Φ† -mô phỏng hai chiều Z giữa I và I , trong đó Σ† ⊆ Σ, Φ† ⊆ Φ. Trên cơ sở Định lý 3.4 của Divroodi và Nguyen [14], chúng tôi đã phát biểu và chứng minh một định lý về tính bất biến của khái niệm trên một lớp lớn hơn các logic mô tả như đã đề cập trong Mục 1.2.2 của Chương 1. 47 Định lý 2.1. Tất cả các khái niệm của LΣ† ,Φ† đều bất biến đối với LΣ† ,Φ† -mô phỏng hai chiều. Chứng minh. Giả sử I và I là các diễn dịch trong LΣ,Φ , Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I , x ∈ ∆I và x ∈ ∆I sao cho Z(x, x ) thỏa mãn và C là một khái niệm bất kỳ của LΣ† ,Φ† . Áp dụng khẳng định (2.19) của Bổ đề 2.2 ta có C I (x) ⇔ C I (x ). Nghĩa là, Z(x, x ) thỏa mãn thì x ∈ C I khi và chỉ khi x ∈ C I . Theo Định nghĩa 2.5, C là một khái niệm bất biến. Định lý này cho phép mô hình hóa tính không phân biệt được của các đối tượng thông qua ngôn ngữ con LΣ† ,Φ† . Tính không phân biệt của các đối tượng là một trong những đặc trưng cơ bản trong quá trình phân lớp dữ liệu. Điều này có nghĩa là chúng ta có thể sử dụng ngôn ngữ con LΣ† ,Φ† cho các bài toán học máy trong logic mô tả. 2.3.3. Tính bất biến của cơ sở tri thức Các định nghĩa, định lý, hệ quả trình bày trong mục này được xây dựng và chứng minh dựa trên những kết quả của công trình [14]. Điểm khác ở đây là các kết quả được chúng tôi phát triển trên lớp các logic mô tả lớn hơn đã đề cập trong Mục 1.2.2 của Chương 1. Định nghĩa 2.6. Một TBox T (tương ứng, ABox A) trong LΣ† ,Φ† được gọi là bất biến đối với LΣ† ,Φ† -mô phỏng hai chiều nếu với mọi diễn dịch I và I trong LΣ,Φ tồn tại một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I sao cho I là mô hình của T (tương ứng, A) khi và chỉ khi I là mô hình của T (tương ứng, A). Hệ quả 2.1. Nếu U ∈ Φ† thì tất cả các TBox trong LΣ† ,Φ† đều bất biến đối với LΣ† ,Φ† -mô phỏng hai chiều. Chứng minh. Giả sử U ∈ Φ† , T là một TBox trong LΣ† ,Φ† , I và I là các diễn dịch trong ngôn ngữ LΣ,Φ , Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Chúng ta cần chứng minh nếu I là mô hình của T thì I cũng là mô hình của T và ngược lại. Giả sử I là mô hình của T , ta cần chỉ ra rằng I cũng là mô hình của T . Chiều ngược lại được chứng minh tương tự. Xét C D là một tiên đề thuật ngữ bất kỳ của TBox T và x ∈ ∆I . Theo điều kiện (2.17), tồn tại x ∈ ∆I sao cho Z(x, x ) thỏa mãn. Vì I là mô hình của T nên ta có x ∈ (¬C D)I . Theo khẳng định (2.19) của Bổ đề 2.2 ta suy ra x ∈ (¬C Do vậy, I cũng là mô hình của T . 48 D)I . Một diễn dịch I trong LΣ,Φ được gọi là kết nối đối tượng được đối với LΣ† ,Φ† nếu với mọi đối tượng x ∈ ∆I tồn tại cá thể a ∈ Σ†I , các đối tượng x0 , x1 , . . . , xk ∈ ∆I và các vai trò đối tượng cơ bản R1 , R2 , . . . , Rk của LΣ† ,Φ† với k ≥ 0 sao cho x0 = aI , xk = x và RiI (xi−1 , xi ) thỏa mãn với mọi 1 ≤ i ≤ k [14]. Định lý 2.2. Cho T là một TBox trong LΣ† ,Φ† , I và I là các diễn dịch trong LΣ,Φ thỏa điều kiện kết nối đối tượng được đối với LΣ† ,Φ† sao cho tồn tại một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Lúc đó I là mô hình của T khi và chỉ khi I là mô hình của T . Chứng minh. Gọi T là một TBox trong LΣ† ,Φ† . Giả sử I và I là các diễn dịch kết nối đối tượng được trong LΣ† ,Φ† , Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Chúng ta cần chứng minh nếu I là mô hình của T thì I cũng là mô hình của T và ngược lại. Giả sử I là mô hình của T , ta cần chỉ ra I là mô hình của T . Chiều ngược lại được chứng minh tương tự. Xét C D là một tiên đề bất kỳ của TBox T . Để chứng minh I cũng là mô hình của T , chúng ta cần chỉ ra rằng C I ⊆ DI . Nghĩa là, với mọi x ∈ C I thì x ∈ DI . Vì I là một diễn dịch kết nối đối tượng được trong LΣ† ,Φ† nên tồn tại cá thể a ∈ Σ†I , các đối tượng x0 , x1 , . . . , xk ∈ ∆I và các vai trò đối tượng cơ bản R1 , R2 , . . . , Rk của LΣ† ,Φ† với k ≥ 0 sao cho x0 = aI , xk = x và RiI (xi−1 , xi ) thỏa mãn với mọi 1 ≤ i ≤ k. Vì Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I nên ta có Z(aI , aI ) thỏa mãn (theo điều kiện (2.1)). Đặt x0 = aI . Với mỗi 1 ≤ i ≤ k, ta có Z(xi−1 , xi−1 ) và RiI (xi−1 , xi ) thỏa mãn nên tồn tại xi ∈ ∆I sao cho Z(xi , xi ) và RiI (xi−1 , xi ) thỏa mãn (theo khẳng định (2.21)). Đặt x = xk , ta có Z(x, x ) thỏa mãn. Vì x ∈ C I nên x ∈ C I (theo khẳng định (2.19)). Do I là mô hình của T nên x ∈ DI . Từ Z(x, x ) thỏa mãn và x ∈ DI ta suy ra x ∈ DI (theo khẳng định (2.19)). Do vậy, I là mô hình của T . Định lý 2.3. Cho A là một ABox trong LΣ† ,Φ† . Nếu O ∈ Φ† hoặc A chỉ chứa các khẳng định dạng C(a) thì A bất biến đối với LΣ† ,Φ† -mô phỏng hai chiều. Chứng minh. Giả thiết O ∈ Φ† hoặc A chỉ chứa các khẳng định dạng C(a). Gọi I và I là các diễn dịch trong LΣ,Φ , Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Chúng ta cần chứng minh nếu I là mô hình của A thì I cũng là mô hình của A và ngược lại. Giả sử I là mô hình của A, chúng ta cần chỉ ra I cũng là mô hình của A. Chiều ngược lại được chứng minh tương tự. Xét ϕ là một khẳng định bất kỳ của A, chúng ta cần chỉ ra I |= ϕ. 49 - Trường hợp ϕ = (a = b), vì I |= ϕ nên ta có aI = bI . Theo điều kiện (2.1) thì Z(aI , aI ) và Z(bI , bI ) thỏa mãn. Vì aI = bI nên theo (2.9) ta có aI = bI . Do vậy, I |= ϕ. - Trường hợp ϕ = (a = b) được chứng minh tương tự như trường hợp trên. - Trường hợp ϕ = C(a), vì I |= ϕ nên ta có C I (aI ) thỏa mãn. Theo điều kiện (2.1) thì Z(aI , aI ) thỏa mãn. Vì Z(aI , aI ) và C I (aI ) thỏa mãn nên theo khẳng định (2.19) thì C I (aI ) thỏa mãn. Do vậy, I |= ϕ. - Trường hợp ϕ = R(a, b), vì I |= ϕ nên ta có RI (aI , bI ) thỏa mãn. Theo điều kiện (2.1) thì Z(aI , aI ) thỏa mãn. Vì Z(aI , aI ) và RI (aI , bI ) thỏa mãn nên theo khẳng định (2.20), tồn tại y ∈ ∆I sao cho Z(bI , y ) và RI (aI , y ) thỏa mãn. Theo giả thiết O ∈ Φ† , ta chọn C ≡ {b}. Vì Z(bI , y ) và C I (bI ) thỏa mãn nên ta có C I (y ) thỏa mãn (theo khẳng định (2.19)). Điều này có nghĩa là y = bI và RI (aI , bI ) thỏa mãn. Do vậy, I |= ϕ. - Trường hợp ϕ = ¬R(a, b) được chứng minh tương tự như trường hợp trên. Hệ quả sau đây xem xét cơ sở tri thức trong trường hợp RBox bằng rỗng. Lúc đó cơ sở tri thức chỉ còn TBox và ABox và do đó tính bất biến của cơ sở tri thức có thể được suy ra trực tiếp từ Định lý 2.2 và Định lý 2.3. Hệ quả 2.2. Cho cơ sở tri thức KB = R, T , A trong LΣ† ,Φ† sao cho R = ∅ và giả thiết O ∈ Φ† hoặc A chỉ chứa các khẳng định có dạng C(a), I và I là các diễn dịch kết nối đối tượng được trong LΣ† ,Φ† sao cho tồn tại một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . Lúc đó I là mô hình của KB khi và chỉ khi I là mô hình của KB. 2.4. Tính chất Hennessy-Milner đối với mô phỏng hai chiều Trong logic mô tả, một diễn dịch trong ngôn ngữ LΣ,Φ có thể là hữu hạn hoặc vô hạn. Một diễn dịch I trong LΣ,Φ có thể là vô hạn, nhưng khi hạn chế nó trên ngôn ngữ con LΣ† ,Φ† , với Σ† ⊆ Σ và Φ† ⊆ Φ thì I có thể là một diễn dịch hữu hạn. Tính hữu hạn của một diễn dịch trong ngôn ngữ con được định nghĩa như sau [14]: Định nghĩa 2.7. Một diễn dịch I trong LΣ,Φ được gọi là phân nhánh hữu hạn (hay hữu hạn ảnh) đối với LΣ† ,Φ† nếu với mọi x ∈ ∆I và với mọi vai trò r ∈ Σ†oR thì: • tập {y ∈ ∆I | rI (x, y)} là hữu hạn, • nếu I ∈ Φ† thì tập {y ∈ ∆I | rI (y, x)} là hữu hạn. 50 Tính chất Hennessy-Milner đối với mô phỏng hai chiều trong Định lý 2.4 và Hệ quả 2.3 sau đây được phát triển và chứng minh dựa trên các kết quả của nghiên cứu [14] cho một lớp lớn hơn các logic mô tả đã đề cập trong Mục 1.2.2 của Chương 1. Ở đây, tính chất Hennessy-Milner được phát biểu trên các diễn dịch phân nhánh hữu hạn. Định lý 2.4 trình bày điều kiện cần và đủ để xây dựng tính bất biến dựa trên các diễn dịch phân nhánh hữu hạn. Định lý 2.4 (Tính chất Hennessy-Milner). Cho Σ và Σ† là các bộ ký tự logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I và I là các diễn dịch trong LΣ,Φ thỏa mãn điều kiện phân nhánh hữu hạn đối với LΣ† ,Φ† , sao cho với mọi a ∈ Σ†I , aI LΣ† ,Φ† -tương đương với aI . Giả thiết rằng U ∈ Φ† hoặc Σ†I = ∅. Lúc đó, x ∈ ∆I LΣ† ,Φ† -tương đương với x ∈ ∆I khi và chỉ khi tồn tại một LΣ† ,Φ† -mô phỏng hai chiều Z giữa I và I sao cho Z(x, x ) thỏa mãn. Chứng minh. Giả sử Σ và Σ† là các bộ ký tự logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I và I là các diễn dịch trong LΣ,Φ thỏa mãn điều kiện phân nhánh hữu hạn đối với LΣ† ,Φ† , sao cho với mọi a ∈ Σ†I , aI LΣ† ,Φ† -tương đương với aI . Giả thiết rằng U ∈ Φ† hoặc Σ†I = ∅. Ta cần phải chứng minh: (*) Với x ∈ ∆I và x ∈ ∆I , nếu x LΣ† ,Φ† -tương đương với x thì tồn tại một LΣ† ,Φ† -mô phỏng hai chiều Z giữa I và I sao cho Z(x, x ) thỏa mãn. (**) Nếu tồn tại một LΣ† ,Φ† -mô phỏng hai chiều Z giữa I và I sao cho Z(x, x ) thỏa mãn thì x LΣ† ,Φ† -tương đương với x , trong đó x ∈ ∆I và x ∈ ∆I . Đầu tiên, ta chứng minh khẳng định (*). Giả sử có x ∈ ∆I , x ∈ ∆I thỏa mãn x LΣ† ,Φ† -tương đương với x . Ta định nghĩa quan hệ Z như sau: Z = { x, x ∈ ∆I × ∆I | x LΣ† ,Φ† -tương đương với x }, và chỉ ra rằng Z là một mô phỏng hai chiều giữa I và I . - Xét điều kiện (2.1), vì theo giả thiết aI LΣ† ,Φ† -tương đương với aI nên Z(aI , aI ) thỏa mãn. - Xét điều kiện (2.2) và giả sử Z(x, x ) thỏa mãn. Theo định nghĩa của quan hệ Z và quan hệ LΣ† ,Φ† -tương đương, ta có AI (x) thỏa mãn khi và chỉ khi AI (x ) thỏa mãn với mọi tên khái niệm A ∈ Σ†C . - Xét điều kiện (2.3) và giả sử Z(x, x ) thỏa mãn. Nếu B I (x) xác định và B I (x) = d. Lúc đó ta có x ∈ (B = d)I . Vì x ∈ (B = d)I và theo định nghĩa của quan hệ Z và quan hệ LΣ† ,Φ† -tương đương nên x ∈ (B = d)I . Nói cách khác B I (x ) = d và do đó B I (x) = B I (x ). Tương tự, nếu B I (x ) xác định thì B I (x) xác định. Từ đó suy ra 51 B I (x) không xác định khi và chỉ khi B I (x ) không xác định. Vậy ta có B I (x) = B I (x ) hoặc cả hai không xác định. - Xét điều kiện (2.4) và giả sử Z(x, x ), rI (x, y) thỏa mãn. Đặt S = {y ∈ ∆I | rI (x , y )}, ta cần chỉ ra rằng tồn tại y ∈ S sao cho Z(y, y ) thỏa mãn. Vì rI (x, y) thỏa mãn nên x ∈ (∃r. )I . Vì x LΣ† ,Φ† -tương đương với x nên x ∈ (∃r. )I . Từ x ∈ (∃r. )I ta suy ra S = ∅. Mặt khác, I là một diễn dịch phân nhánh hữu hạn đối với LΣ† ,Φ† nên S là một tập hữu hạn. Gọi y1 , y2 , . . . , yn là các phần tử của S, ta có n ≥ 1. Giả sử Z(y, yi ) không thỏa mãn với mọi 1 ≤ i ≤ n. Điều này suy ra y không LΣ† ,Φ† -tương đương với yi với mọi 1 ≤ i ≤ n. Nghĩa là, với mỗi 1 ≤ i ≤ n, tồn tại khái niệm Ci sao cho y ∈ CiI và yi ∈ CiI . Đặt C ≡ ∃r.(C1 C2 ··· Cn ), ta có x ∈ C I và x ∈ C I . Điều này mâu thuẩn với giả thiết x LΣ† ,Φ† -tương đương với x . Do vậy, tồn tại yi ∈ S sao cho Z(y, yi ) thỏa mãn. - Điều kiện (2.5) được chứng minh tương tự như điều kiện (2.4). - Xét điều kiện (2.6) và giả sử Z(x, x ) thỏa mãn. Bằng cách thay khái niệm A trong điều kiện (2.2) bởi khái niệm ∃σ.{d}, ta suy ra được x ∈ (∃σ.{d})I khi và chỉ khi x ∈ (∃σ.{d})I . Vì vậy, σ I (x, d) ⇔ σ I (x , d). - Điều kiện (2.7) và (2.8) trong trường hợp I ∈ Φ† được chứng minh tương tự như điều kiện (2.4) và (2.5) bằng cách thay vai trò r bởi vai trò r− . - Xét điều kiện (2.9) trong trường hợp O ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Đặt C ≡ {a}. Vì x LΣ† ,Φ† -tương đương với x nên x ∈ C I khi và chỉ khi x ∈ C I . Do đó, ta có x = aI khi và chỉ khi x = aI . - Xét điều kiện (2.10) trong trường hợp N ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Đặt S = {y ∈ ∆I | rI (x, y)} và S = {y ∈ ∆I | rI (x , y )}. Vì I và I là các diễn dịch phân nhánh hữu hạn đối với LΣ† ,Φ† nên S và S là hữu hạn. Nếu S = ∅, ta có x∈ / (∃r. )I và do x LΣ† ,Φ† -tương đương với x nên ta có x ∈ / (∃r. )I . Vì x ∈ / (∃r. )I nên ta có S = ∅. Từ đó suy ra #S = 0 = #S . Nếu S = ∅, gọi y1 , y2 , . . . , yn là các phần tử của S với n ≥ 1. Rõ ràng x ∈ (≥ n r. )I và x ∈ (≤ n r. )I . Do x LΣ† ,Φ† -tương đương với x nên ta có x ∈ (≥ n r. )I và x ∈ (≤ n r. )I . Vì x ∈ (≥ n r. )I nên #S ≥ n và vì x ∈ (≤ n r. )I nên #S ≤ n. Từ đó suy ra #S = n = #S . Nói cách khác #{y ∈ ∆I | rI (x, y)} = #{y ∈ ∆I | rI (x , y )}. - Điều kiện (2.11) trong trường hợp {N , I} ⊆ Φ† được chứng minh tương tự như điều kiện (2.10) bằng cách thay vai trò r bởi vai trò r− . - Xét điều kiện (2.12) trong trường hợp F ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Đặt 52 C ≡ (≤ 1 r). Nếu x ∈ C I thì #{y ∈ ∆I | rI (x, y)} ≤ 1. Vì x ∈ C I và x LΣ,Φ -tương / CI đương với x nên x ∈ C I và do đó #{y ∈ ∆I | rI (x , y )} ≤ 1. Tương tự, nếu x ∈ thì x ∈ / C I , do đó #{y ∈ ∆I | rI (x, y)} > 1 và #{y ∈ ∆I | rI (x , y )} > 1. Vậy ta có [#{y ∈ ∆I | rI (x, y)} ≤ 1] ⇔ [#{y ∈ ∆I | rI (x , y )} ≤ 1]. - Điều kiện (2.13) trong trường hợp {F, I} ⊆ Φ† được chứng minh tương tự như điều kiện (2.12) bằng cách thay vai trò r bởi vai trò r− . - Xét điều kiện (2.14) trong trường hợp Q ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Đặt S = {y ∈ ∆I | rI (x, y)} và S = {y ∈ ∆I | rI (x , y )}. Vì I và I là các diễn dịch phân nhánh hữu hạn đối với LΣ† ,Φ† nên S và S là hữu hạn. Giả sử không tồn tại một song ánh h : S → S nào sao cho h ⊆ Z. Từ giả thiết này ta suy ra tồn tại một y ∈ S ∪ S sao cho với y1 , y2 , . . . , yk ∈ S và y1 , y2 , . . . , yk ∈ S khác nhau từng đôi một LΣ† ,Φ† -tương đương với y , ta có k = k . Đặt I = I nếu y ∈ S và I = I nếu y ∈ S . Đặt {z1 , z2 , . . . , zh } = S \ {y1 , y2 , . . . , yk } và {z1 , z2 , . . . , zh } = S \ {y1 , y2 , . . . , yk }. Với mỗi 1 ≤ i ≤ h tồn tại Ci sao cho y ∈ CiI và zi ∈ / CiI . Tương tự, với mỗi 1 ≤ i ≤ h tồn / DiI . Đặt C ≡ (C1 C2 · · · Ch D1 D2 · · · Dh ). tại Di sao cho y ∈ DiI và zi ∈ Chúng ta có {y1 , y2 , . . . , yk } ⊆ C I và {z1 , z2 , . . . , zh } ∩ C I = ∅. Tương tự như thế, {y1 , y2 , . . . , yk } ⊆ C I và {z1 , z2 , . . . , zh } ∩ C I = ∅. Nếu k > k thì x ∈ (≥ k r.C)I và x ∈ / (≥ k r.C)I . Nếu k < k thì x ∈ / (≥ k r.C)I và x ∈ (≥ k r.C)I . Điều này trái với giả thiết x LΣ† ,Φ† -tương đương với x . Do vậy, điều kiện (2.14) thỏa mãn. - Điều kiện (2.15) trong trường hợp {Q, I} ⊆ Φ† được chứng minh tương tự như điều kiện (2.14) bằng cách thay vai trò r bởi vai trò r− . - Xét điều kiện (2.16) trong trường hợp U ∈ Φ† . Vì I và I là các diễn dịch phân nhánh hữu hạn đối với LΣ† ,Φ† và U ∈ Σ†oR nên I và I là hữu hạn. Giả sử ∆I = {x1 , x2 , . . . , xn } với n ≥ 1. Lấy một đối tượng bất kỳ x ∈ ∆I , giả sử rằng x không LΣ† ,Φ† -tương đương với xi với mọi 1 ≤ i ≤ n. Lúc đó, với mỗi 1 ≤ i ≤ n tồn tại một khái niệm Ci sao cho xi ∈ CiI và x ∈ / CiI . Đặt C ≡ (C1 C2 · · · Cn ) và a ∈ Σ†I là một tên cá thể, ta có aI ∈ (∀U.C)I và aI ∈ / (∀U.C)I . Điều này trái với giả thiết aI LΣ† ,Φ† -tương đương với aI . Do đó, tồn tại xi ∈ ∆I sao cho Z(x, xi ) thỏa mãn. - Điều kiện (2.17) trong trường hợp U ∈ Φ† được chứng minh tương tự như điều kiện (2.16). - Xét điều kiện (2.18) trong trường hợp Self ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Vì x LΣ† ,Φ† -tương đương với x nên x ∈ (∃r.Self)I khi và chỉ khi x ∈ (∃r.Self)I . Do vậy, rI (x, x) thỏa mãn khi và chỉ khi rI (x , x ) thỏa mãn. Chứng minh khẳng định (**). Giả sử I và I là các diễn dịch trong LΣ,Φ thỏa điều 53 kiện phân nhánh hữu hạn đối với LΣ† ,Φ† , Z là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I sao cho Z(x, x ) thỏa mãn. Theo khẳng định (2.19), với mọi khái niệm C của LΣ† ,Φ† , C I (x) thỏa mãn khi và chỉ khi C I (x ) thỏa mãn. Do đó, x LΣ† ,Φ† -tương đương với x . Hệ quả 2.3. Cho Σ và Σ† là các bộ ký tự logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I và I là các diễn dịch trong LΣ,Φ thỏa điều kiện phân nhánh hữu hạn đối với LΣ† ,Φ† . Giả thiết rằng Σ†I = ∅ và với mọi a ∈ Σ†I , aI LΣ† ,Φ† -tương đương với aI . Lúc đó, quan hệ { x, x ∈ ∆I × ∆I | x LΣ† ,Φ† -tương đương với x } là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và I . 2.5. Tự mô phỏng hai chiều Một trong những mục đích của luận án là sử dụng mô phỏng hai chiều để thực hiện việc phân hoạch miền của một diễn dịch. Để làm được điều này chúng ta cần phải xây dựng được mô phỏng hai chiều trên cùng một diễn dịch, được gọi là tự mô phỏng hai chiều. Từ kết quả của các nghiên cứu [14], [44] chúng tôi phát triển các định nghĩa, định lý sau đây trên lớp ngôn ngữ đã đề cập trong Mục 1.2.2 của Chương 1. Định nghĩa 2.8 (Tự mô phỏng hai chiều). Cho I là một diễn dịch trong LΣ,Φ . Một LΣ† ,Φ† -tự mô phỏng hai chiều của I là một LΣ† ,Φ† -mô phỏng hai chiều giữa I và chính nó. Một LΣ† ,Φ† -tự mô phỏng hai chiều Z của I được gọi là lớn nhất nếu với mọi LΣ† ,Φ† -tự mô phỏng hai chiều Z của I thì Z ⊆ Z. Cho I là một diễn dịch trong LΣ,Φ , chúng ta ký hiệu LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I là ∼Σ† ,Φ† ,I , và ký hiệu quan hệ hai ngôi ≡Σ† ,Φ† ,I trên ∆I là quan hệ thỏa mãn tính chất x ≡Σ† ,Φ† ,I x khi và chỉ khi x LΣ† ,Φ† -tương đương với x . Định lý 2.5 sau đây nói lên rằng tự mô phỏng hai chiều lớn nhất trên một diễn dịch là tồn tại và nó là một quan hệ tương đương. Vì là nó một quan hệ tương đương nên chúng ta có thể sử dụng nó để mô hình hóa tính không phân biệt được của các đối tượng. Do đó, tự mô phỏng hai chiều lớn nhất đóng một vai trò quan trọng trong quá trình phân hoạch miền của một diễn dịch. Định lý 2.5. Cho Σ và Σ† là các bộ ký tự của logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I là một diễn dịch trong LΣ,Φ . Lúc đó: 1. LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I tồn tại và nó là một quan hệ tương đương, 54 2. nếu I là một phân nhánh hữu hạn đối với LΣ† ,Φ† thì quan hệ ≡Σ† ,Φ† ,I là một LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I (nghĩa là, quan hệ ≡Σ† ,Φ† ,I và ∼Σ† ,Φ† ,I trùng khớp nhau). Chứng minh. - Khẳng định thứ nhất được suy ra trực tiếp từ khẳng định thứ nhất của Bổ đề 2.1. - Xét khẳng định thứ hai, nếu U ∈ / Φ† hoặc Σ† = ∅ thì theo Định lý 2.4, ≡Σ† ,Φ† ,I là một LΣ† ,Φ† -tự mô phỏng hai chiều của I. Trường hợp U ∈ Φ† và Σ†I = ∅ là cần thiết cho Định lý 2.4 để chứng minh điều kiện (2.16) và (2.17). Thật vậy, trong trường hợp U ∈ Φ† và Σ†I = ∅, các điều kiện này rõ ràng thỏa mãn khi I = I. Như vậy ≡Σ† ,Φ† ,I là một LΣ† ,Φ† -tự mô phỏng hai chiều của I. Bây giờ chúng ta chứng minh ≡Σ† ,Φ† ,I là một LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I. Giả sử Z là một LΣ† ,Φ† -tự mô phỏng hai chiều bất kỳ của I. Với mọi x ∈ ∆I và x ∈ ∆I , ta cần chỉ ra nếu Z(x, x ) thỏa mãn thì x ≡Σ† ,Φ† ,I x . Vì Z là một LΣ† ,Φ† -tự mô phỏng hai chiều của I và Z(x, x ) thỏa mãn nên theo khẳng định (2.19) với mọi khái niệm C của LΣ† ,Φ† , C I (x) thỏa mãn khi và chỉ khi C I (x ) thỏa mãn và do đó x ≡Σ† ,Φ† ,I x . Do đó, ta có Z ⊆ ≡Σ† ,Φ† ,I . Vậy ≡Σ† ,Φ† ,I là một LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I. Chúng ta nói rằng tập Y bị phân chia bởi tập X nếu Y \ X = ∅ và Y ∩ X = ∅. Như vậy, tập Y không bị phân chia bởi tập X nếu hoặc Y ⊆ X hoặc Y ∩ X = ∅. Phân hoạch Y = {Y1 , Y2 , . . . , Yn } được gọi là nhất quán với tập X nếu với mọi 1 ≤ i ≤ n, Yi không bị phân chia bởi X. Định lý 2.6 sau đây nói lên khả năng phân hoạch miền của diễn dịch dựa trên mô phỏng hai chiều lớn nhất sao cho nó nhất quán với một tập các đối tượng cho trước. Khi một phân hoạch nhất quán với một tập các đối tượng cho trước, chúng ta có thể biểu diễn tập đó thông qua hợp của một số lớp tương đương trong phân hoạch đó. Từ đó cho phép chúng ta xây dựng thuật toán học một khái niệm trong hệ thống thông tin thông qua mô phỏng hai chiều lớn nhất. Định lý 2.6. Cho Σ và Σ† là các bộ ký tự của logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng của logic mô tả sao cho Φ† ⊆ Φ, I là một diễn dịch hữu hạn trong LΣ,Φ và X ⊆ ∆I . Gọi Y là phân hoạch của ∆I thông qua quan hệ ∼Σ† ,Φ† ,I . Lúc đó: 1. nếu tồn tại khái niệm C của LΣ† ,Φ† sao cho C I = X thì phân hoạch Y nhất quán với tập X, 55 2. nếu phân hoạch Y nhất quán với tập X thì tồn tại khái niệm C của LΣ† ,Φ† sao cho C I = X. Chứng minh. Vì I là một diễn dịch hữu hạn trong LΣ,Φ nên I thỏa mãn điều kiện phân nhánh hữu hạn đối với LΣ† ,Φ† . Theo khẳng định (2) của Định lý 2.5, ta có ∼Σ† ,Φ† ,I trùng khớp với ≡Σ† ,Φ† ,I . - Xét khẳng định (1) và giả sử C I = X với C là một khái niệm của LΣ† ,Φ† . Gọi Y = {Y1 , Y2 , . . . , Yn } là một phân hoạch của ∆I được phân hoạch thông qua quan hệ ∼Σ† ,Φ† ,I . Với 1 ≤ i ≤ n, lấy x và x là hai phần tử bất kỳ của Yi , ta có x và x thuộc về một lớp tương đương được phân hoạch bởi ∼Σ† ,Φ† ,I . Do ∼Σ† ,Φ† ,I trùng với ≡Σ† ,Φ† ,I nên x LΣ† ,Φ† -tương đương với x và do đó x ∈ C I khi và chỉ khi x ∈ C I . Nghĩa là {x, x } không bị phân chia bởi C I . Do vậy, C I phải là hợp của một số lớp tương đương được phân hoạch bởi ∼Σ† ,Φ† ,I . Từ đó suy ra phân hoạch Y nhất quán với X. - Xét khẳng định (2) và giả sử Y là một phân hoạch của ∆I được phân hoạch thông qua quan hệ ∼Σ† ,Φ† ,I và Y nhất quán với X. Lúc đó Y = {U1 , U2 , . . . , Um } ∪ {V1 , V2 , . . . , Vn }, trong đó Ui ⊆ X với mọi 1 ≤ i ≤ m, Vj ∩ X = ∅ với mọi 1 ≤ j ≤ n và X = U1 ∪U2 ∪· · ·∪Um . Vì Ui và Vj là các lớp tương đương khác nhau từng đôi một theo quan hệ ≡Σ† ,Φ† ,I nên với mọi 1 ≤ i ≤ m và 1 ≤ j ≤ n tồn tại khái niệm Cij của LΣ† ,Φ† sao cho Ui ⊆ CijI và Vj ∩ CijI = ∅. Với mỗi 1 ≤ i ≤ m, đặt Ci ≡ Ci1 ta có Ui ⊆ CiI , và Vj ∩ CiI = ∅ với mọi 1 ≤ j ≤ n. Đặt C ≡ C1 C2 Ci2 ··· ··· Cm , ta có Cin , Ui ⊆ C I với mọi 1 ≤ i ≤ m và Vj ∩ C I = ∅ với mọi 1 ≤ j ≤ n. Do đó, C I = X. Tiểu kết Chương 2 Thông qua ngôn ngữ LΣ,Φ và ngôn ngữ con LΣ† ,Φ† , chương này đã trình bày mô phỏng hai chiều và tính bất biến đối với mô phỏng hai chiều trên một lớp các logic mô tả như đã đề cập trong Chương 1. Các khái niệm, định nghĩa và các định lý, bổ đề cũng như các hệ quả được phát triển dựa trên các kết quả của các công trình [13], [14], [44] với lớp các logic mô tả lớn hơn. Chúng tôi cũng trình bày các chứng minh cho những định lý, bổ đề, hệ quả đã nêu ra trong chương này. Những định nghĩa, định lý này là các công cụ tốt cho nghiên cứu và triển khai về học khái niệm trong logic mô tả. Tính bất biến, đặc biệt là tính bất biến của khái niệm là một trong những nền tảng cho phép mô hình hóa tính không phân biệt được của các đối tượng thông qua ngôn ngữ con. Tính không phân biệt của các đối tượng là một trong những đặc trưng cơ bản trong quá trình xây dựng các kỹ thuật phân lớp dữ liệu. Điều này có nghĩa là chúng ta có thể sử dụng ngôn ngữ con cho các bài toán học máy trong logic mô tả bằng cách sử dụng mô phỏng hai chiều. 56 Chương 3. HỌC KHÁI NIỆM CHO HỆ THỐNG THÔNG TIN TRONG LOGIC MÔ TẢ 3.1. Hệ thống thông tin 3.1.1. Hệ thống thông tin truyền thống Một trong những công cụ khá hữu hiệu để biểu diễn tri thức dưới dạng bảng dữ liệu là sử dụng hệ thống thông tin. Một hệ thống thông tin thường dùng để mô tả một tập hữu hạn, khác rỗng các đối tượng U (được gọi là tập vũ trụ các đối tượng) thông qua tập hữu hạn các thuộc tính A khác rỗng (được gọi là tập thuộc tính) [46], [48]. Các đối tượng được phân loại thông qua tập thuộc tính A. Giả sử Va là tập các giá trị của thuộc tính a ∈ A, lúc đó Va được gọi là miền giá trị của thuộc tính a. ρ là một hàm thông tin từ U × A vào V (V = Va ) sao cho ρ(u, a) ∈ Va với mọi u ∈ U và a∈A a ∈ A. Điều này có nghĩa là hàm ρ được sử dụng để mô tả các đối tượng thông qua tập các giá trị thuộc tính của nó. Một cách hình thức, hệ thống thông tin được định nghĩa như sau [46]: Định nghĩa 3.1. Hệ thống thông tin là một bộ IS = U, A, V, ρ , trong đó: • U là một tập hữu hạn, khác rỗng các đối tượng, được gọi là tập vũ trụ các đối tượng, • A là một tập hữu hạn, khác rỗng, được gọi là tập thuộc tính, • V = Va , trong đó Va là tập khác rỗng các giá trị của thuộc tính a ∈ A và Va a∈A được gọi là miền giá trị của a, • ρ : U × A → V là một hàm thông tin, sao cho ρ(u, a) ∈ Va với mọi u ∈ U và a ∈ A. Ví dụ 3.1. Xét hệ thống thông tin đặc tả về các ấn phẩm khoa học IS = U, A, V, ρ được xác định như sau: U = {u1 , u2 , u3 , u4 , u5 , u6 }, A = {Kind , Year , Awarded }, V = VKind ∪ VYear ∪ VAwarded , trong đó: VKind = {“article”, “book”, “conf. paper”}, VYear = Z và VAwarded = {true, false}. 57 Hàm ρ trong ví dụ này được xác định thông qua bảng sau: ❍❍ ❍ U A ❍❍ ❍ Kind Year Awarded ❍❍ u1 book 2010 true u2 book 2009 false u3 book 2008 false u4 article 2007 true u5 article 2006 false u6 conf. paper 2006 true Các hệ thống thông tin truyền thống được định nghĩa như các bảng dữ liệu về các giá trị của các thuộc tính. Mỗi hàng của bảng dữ liệu biểu diễn một đối tượng và mỗi cột biểu diễn một thuộc tính. Như vậy, các đối tượng chỉ được đặc tả thông qua các thuộc tính. 3.1.2. Hệ thống thông tin dựa trên logic mô tả Chúng ta thấy rằng, hệ thống thông tin truyền thống chỉ đặc tả các đối tượng thông qua các thuộc tính mà không đề cập đến mối quan hệ, liên kết với nhau giữa các đối tượng. Tuy nhiên, trong thực tế tồn tại những hệ thống thông tin mà các đối tượng không những được đặc tả bằng các thuộc tính mà còn được đặc tả thông qua các mối quan hệ giữa các đối tượng đó. Chẳng hạn, trong Ví dụ 3.1, chúng ta có thể nghĩ đến việc một ấn phẩm này có thể trích dẫn (tham khảo) thông tin từ một ấn phẩm khác. Web ngữ nghĩa là một trong những hệ thống thể hiện rất rõ mối quan hệ này và tính ưu việt của nó trong quá trình suy luận tri thức. Khai thác được mối quan hệ giữa các đối tượng trong các hệ thống thông tin có thể mang lại những lợi ích nhất định trong quá trình phân loại đối tượng. Có nhiều cách để đặc tả một hệ thống thông tin dựa trên logic mô tả. Chẳng hạn, hệ thống thông tin có thể được đặc tả bằng cách xây dựng diễn dịch một cách cụ thể hoặc có thể đặc tả dựa trên logic mô tả thông qua một cơ sở tri thức không vòng. Ở đây, chúng tôi đặc tả hệ thống thông tin dựa trên logic mô tả lấy cơ sở tri thức không vòng làm nền tảng và thông qua cơ sở tri thức đó để thể hiện thuộc tính của các đối tượng bằng các khái niệm, thể hiện mối quan hệ giữa các đối tượng bằng cách sử dụng các vai trò đối tượng. Định nghĩa 3.2 (Cơ sở tri thức không vòng). Cơ sở tri thức không vòng trong ngôn ngữ LΣ,Φ là một bộ KB = R, T , A , trong đó: 58 • R là một danh sách hữu hạn (ψ1 , ψ2 , . . . , ψm ), được gọi là bộ tiên đề vai trò của KB. Mỗi ψi là một tiên đề vai trò có dạng r ≡ R, trong đó R là một vai trò đối tượng của LΣ,Φ và r ∈ ΣoR là một tên vai trò đối tượng không có mặt trong R, A và ψ1 , ψ2 , . . . , ψi−1 , • T là một danh sách hữu hạn (ϕ1 , ϕ2 , . . . , ϕn ), được gọi là bộ tiên đề thuật ngữ của KB. Mỗi ϕi là một tiên đề thuật ngữ có dạng A ≡ C, trong đó C là một khái niệm của LΣ,Φ và A ∈ ΣC là một tên khái niệm không có mặt trong C, A và ϕ1 , ϕ2 , . . . , ϕi−1 , • A là một tập hữu hạn, được gọi là bộ khẳng định cá thể của KB, chứa các khẳng định cá thể. Một cơ sở tri thức định nghĩa như trên tương tự như một chương trình logic phân tầng [1], [44]. Các tên khái niệm (tương ứng, tên vai trò đối tượng) có mặt trong A được gọi là các khái niệm (tương ứng, vai trò đối tượng) nguyên thủy. Các tên vai trò đối tượng ở về trái của “≡” trong các định nghĩa của R được gọi là vai trò đối tượng định nghĩa. Các tên khái niệm ở vế trái của “≡” trong các định nghĩa của T được gọi là khái niệm định nghĩa. Ví dụ 3.2. Ví dụ sau đây đề cập đến các ấn phẩm khoa học: Φ = {I, O, N , Q}, ΣI = {P1 , P2 , P3 , P4 , P5 , P6 }, ΣC = {Pub, Book , Article, Awarded , UsefulPub, GoodPub, ExcellentPub, RecentPub, CitingP 5}, ΣdA = ΣC ∪ {Title, Kind }, ΣnA = {Year }, ΣoR = {cites, cited_by}, ΣdR = ∅, A = {Title(P1 ) = “Introduction to Logic”, Awarded (P1 ), Title(P2 ) = “The Essence of Logic”, Awarded (P4 ), Awarded (P6 ), Kind (P1 ) = “book”, Kind (P2 ) = “book”, Kind (P3 ) = “book”, Kind (P4 ) = “article”, Kind (P5 ) = “article”, Kind (P6 ) = “conf. paper”, Year (P1 ) = 2010, Year (P2 ) = 2009, Year (P3 ) = 2008, Year (P4 ) = 2007, Year (P5 ) = 2006, Year (P6 ) = 2006, cites(P1 , P2 ), cites(P1 , P3 ), cites(P1 , P4 ), cites(P1 , P6 ), cites(P2 , P3 ), cites(P2 , P4 ), cites(P2 , P5 ), cites(P3 , P4 ), cites(P3 , P5 ), cites(P3 , P6 ), cites(P4 , P5 ), cites(P4 , P6 )}, R = {cited_by ≡ cites − }, T = {Pub ≡ , Book ≡ (Kind = “book”), Article ≡ (Kind = “article”), UsefulPub ≡ ∃cited_by. , GoodPub ≡ (≥ 2 cited_by), CitingP 5 ≡ ∃cites.{P5 }, 59 ExcellentPub ≡ GoodPub Awarded , RecentPub ≡ (Year ≥ 2008)}. Lúc đó KB = R, T , A là một cơ sở tri thức không vòng trong LΣ,Φ . Định nghĩa Pub ≡ nói lên rằng miền của mô hình KB chỉ chứa các ấn phẩm khoa học. Cơ sở tri thức này được minh họa như Hình 3.1, trong đó, các nút ký hiệu cho các ấn phẩm và các cạnh ký hiệu cho các trích dẫn (nghĩa là, các khẳng định của vai trò cites). Hình này chỉ thể hiện các thông tin cần quan tâm như Year , Awarded và cites. G P2 : 2009 9 G P4 : 2007 Awarded P1 : 2010 Awarded w P3 : 2008 G P D G U Q P5 : 2006 P6 : 2006 Awarded Hình 3.1: Một minh họa cho cơ sở tri thức của Ví dụ 3.2 Cho cơ sở tri thức không vòng KB = R, T , A . Một mô hình I của KB trong LΣ,Φ được gọi là mô hình chuẩn nếu I thỏa mãn các điều kiện sau: • ∆I = ΣI (nghĩa là, miền của I chứa tất cả các tên cá thể của Σ), • Nếu A ∈ ΣC là một khái niệm nguyên thủy trong KB thì AI = {a | A(a) ∈ A}, • Nếu B ∈ ΣA \ ΣC thì B I : ∆I → range(B) là một hàm từng phần sao cho B I (aI ) = c nếu (B(a) = c) ∈ A, • Nếu r ∈ ΣoR là một vai trò đối tượng nguyên thủy trong KB thì rI = { a, b | r(a, b) ∈ A}, • Nếu σ ∈ ΣdR thì σ I = { a, d | σ(a, d) ∈ A}, • Nếu r ≡ R là một định nghĩa vai trò đối tượng trong R thì rI = RI , • Nếu A ≡ C là một định nghĩa khái niệm trong T thì AI = C I , • Nếu A ∈ ΣC mà A không có mặt trong KB thì AI = ∅, • Nếu r ∈ ΣoR mà r không xuất hiện trong KB thì rI = ∅. Như vậy, một mô hình chuẩn của KB là một diễn dịch hữu hạn. Các định nghĩa khái niệm và định nghĩa vai trò đối tượng áp dụng cho giả thiết tên duy nhất và giả thiết thế giới đóng. 60 Ghi chú 3.1. Giả thiết tên duy nhất được sử dụng để đơn giản hóa vấn đề. Giả thiết này cho phép các ABox có thể chứa các khẳng định cá thể dạng a = b, trong đó a, b ∈ ΣI với ngữ nghĩa là một diễn dịch I thỏa mãn khẳng định cá thể a = b nếu aI = bI . Lúc đó, một cơ sở tri thức không vòng trong LΣ,Φ có thể được chuyển đổi thành một cơ sở tri thức không vòng tương đương bằng cách gộp các cá thể bằng nhau lại để chúng trở thành một cá thể duy nhất. Giả thiết tên duy nhất và giả thiết thế giới đóng phù hợp cho các hệ thống thông tin được lấy từ diễn dịch của cơ sở tri thức. Định nghĩa 3.3. Cho cơ sở tri thức không vòng KB = R, T , A . Hệ thống thông tin dựa trên logic mô tả được xác định bởi một cơ sở tri thức không vòng KB trong LΣ,Φ là một mô hình chuẩn của cơ sở tri thức đó trong LΣ,Φ . Trong chương này, các hệ thống thông tin dựa trên logic mô tả được sử dụng trong quá trình học khái niệm. Do đó, để đơn giản, thuật ngữ hệ thống thông tin dựa trên logic mô tả được gọi tắt là hệ thống thông tin. Ví dụ 3.3. Xét cơ sở tri thức KB như đã cho trong Ví dụ 3.2. Hệ thống thông tin được xác định bởi KB là một diễn dịch I như sau: ∆I = {P1 , P2 , P3 , P4 , P5 , P6 }, P1I = P1 , P2I = P2 , . . . , P6I = P6 , Pub I = ∆I , Book I = {P1 , P2 , P3 }, Article I = {P4 , P5 }, Awarded I = {P1 , P4 , P6 }, cites I = { P1 , P2 , P1 , P3 , P1 , P4 , P1 , P6 , P2 , P3 , P2 , P4 , P2 , P5 , P3 , P4 , P3 , P5 , P3 , P6 , P4 , P5 , P4 , P6 }, cited_by I = (cites I )−1 , UsefulPub I = {P2 , P3 , P4 , P5 , P6 }, GoodPub I = {P3 , P4 , P5 , P6 }, ExcellentPub I = {P4 , P6 }, RecentPub I = {P1 , P2 , P3 }, CitingP 5I = {P2 , P3 , P4 }, các hàm từng phần Title I , Year I và Kind I có thể được xác định bằng cách liệt kê theo từng cá thể. 3.2. Học khái niệm trong logic mô tả với Ngữ cảnh (3) 3.2.1. Giới thiệu bài toán Cho diễn dịch I là một hệ thống thông tin huấn luyện trong LΣ,Φ 1 . Gọi Ad ∈ ΣC là một khái niệm đại diện cho “thuộc tính quyết định”, E = E + , E − với E + = {a | 1 Hệ thống thông tin được đề cập ở đây là hệ thống thông tin dựa trên logic mô tả, ký hiệu là I, khác với hệ thống thông tin truyền thống, ký hiệu là IS. 61 aI ∈ AId } và E − = {a | aI ∈ (¬AId )} tương ứng là tập các mẫu dương và mẫu âm của Ad trong I. Giả sử rằng Ad có thể được biểu diễn bởi một khái niệm C trong ngôn ngữ con LΣ† ,Φ† , trong đó Σ† ⊆ Σ \ {Ad } và Φ† ⊆ Φ. Vấn đề đặt ra là học khái niệm C dựa trên các thông tin cơ bản I, E + và E − trong ngôn ngữ con LΣ† ,Φ† sao cho C phải thỏa mãn các điều kiện sau: • I |= C(a) với mọi a ∈ E + , • I |= ¬C(a) với mọi a ∈ E − . Lưu ý rằng, bài toán học khái niệm trong logic mô tả trong ngữ cảnh này được thực hiện trong giả thiết thế giới đóng. Do đó, I |= ¬C(a) tương đồng với I |= C(a). Đây chính là bài toán học khái niệm trong logic mô tả với Ngữ cảnh (3) như đã giới thiệu trong phần mở đầu. Để thực hiện việc học khái niệm trong logic mô tả, chúng ta sử dụng mô phỏng hai chiều để mô hình hóa tính không phân biệt được của các đối tượng. Thông qua tự mô phỏng hai chiều lớn nhất và tính không phân biệt được, chúng ta phân hoạch miền của diễn dịch nhằm tìm kiếm khái niệm phù hợp với định nghĩa của tập các đối tượng cần học. Với E = E + , E − , trong đó E + là tập chứa các mẫu dương và E − là tập chứa các mẫu âm cho trước, ta nói rằng tập Y ⊆ ∆I bị phân chia bởi E nếu tồn tại a ∈ E + và b ∈ E − sao cho {aI , bI } ⊆ Y . Một phân hoạch Y = {Y1 , Y2 , . . . , Yn } của ∆I được gọi là nhất quán với E nếu với mọi 1 ≤ i ≤ n, Yi không bị phân chia bởi E. Vấn đề đặt ra là phân hoạch miền ∆I của diễn dịch I dựa trên các thông tin cơ bản I, E + và E − trong ngôn ngữ LΣ† ,Φ† , trong đó Σ† ⊆ Σ và Φ† ⊆ Φ, để đạt được phân hoạch Y nhất quán với E. Theo Định lý 2.6, nếu khái niệm cần học được xác định trong LΣ† ,Φ† bởi một khái niệm C, lúc đó ta có: • C I phải là hợp của một số lớp tương đương của phân hoạch Y, trong đó Y là kết quả của phép phân hoạch miền ∆I thông qua quan hệ tự mô phỏng hai chiều lớn nhất ∼Σ† ,Φ† ,I , • aI ∈ C I với mọi a ∈ E + và aI ∈ C I với mọi a ∈ E − . Nguyen và Szalas đã vận dụng mô phỏng hai chiều để xây dựng phương pháp học khái niệm cho các hệ thống thông tin trong logic mô tả [44]. Ý tưởng chính của phương pháp này là làm mịn miền ∆I của hệ thống thông tin I bằng cách sử dụng 62 các bộ chọn. Dựa trên ý tưởng đó, phương pháp học khái niệm được mô tả tổng quát như sau: • Bắt đầu từ phân hoạch {∆I }, chúng ta thực hiện làm mịn phân hoạch này một cách tuần tự cho đến khi đạt được phân hoạch tương ứng với ∼Σ† ,Φ† ,I . Quá trình làm mịn có thể dừng lại sớm hơn khi phân hoạch hiện thời nhất quán với E hoặc khi thỏa mãn một số điều kiện cho trước. • Trong quá trình làm mịn phân hoạch {∆I }, các khối được tạo ra ở tất cả các bước là Y1 , Y2 , . . . , Yn . Mỗi khối tạo ra được ký hiệu bởi một chỉ số mới bằng cách tăng giá trị của n. Với mỗi 1 ≤ i ≤ n, ta thiết lập các thông tin sau: – Yi được đặc trưng bởi một khái niệm Ci sao cho CiI = Yi , – Ghi nhận lại các thông tin về việc Yi bị phân chia bởi E, – Ghi nhận LargestContainer [i] := j để lưu lại j là chỉ số của khối lớn nhất Yj sao cho Yi ⊆ Yj và Yj không bị phân chia bởi E. • Phân hoạch hiện thời được ký hiệu là Y = {Yi1 , Yi2 , . . . , Yik } ⊆ {Y1 , Y2 , . . . , Yn }. Như vậy, Y là một tập con của tập tất cả các khối được tạo ra trong quá trình làm mịn. • Gọi j1 , j2 , . . . , jh là các chỉ số lấy từ {i1 , i2 , . . . , ik } sao cho Yjt ⊆ {aI | a ∈ E + } với 1 ≤ t ≤ h, và đặt {l1 , l2 , . . . , lp } = {LargestContainer [jt ] | 1 ≤ t ≤ h}. • Thiết lập khái niệm C ≡ Cl1 Cl2 · · · Clp . Chúng ta lấy kết quả trả về là Crs , trong đó Crs là khái niệm tương đương với khái niệm C sau khi đã rút gọn. Trong các phần tiếp theo, chúng tôi sẽ giới thiệu về bộ chọn cơ bản, bộ chọn đơn giản và đề xuất các bộ chọn mở rộng trong LΣ† ,Φ† cũng như độ đo gia lượng thông tin được sử dụng trong chiến lược phân chia khối của quá trình làm mịn. Kết hợp với quá trình thực nghiệm, chúng ta có thể đánh giá tính hiệu quả các các loại bộ chọn khác nhau. 3.2.2. Bộ chọn Trong phần này, các bộ chọn trong LΣ† ,Φ† được sử dụng để phân chia khối của phân hoạch hiện thời. Chúng tôi phát biểu và chứng minh một định lý về các bộ chọn cơ bản. Theo đó, các bộ chọn cơ bản là điều kiện đủ để khi làm mịn liên tục phân hoạch {∆I } chúng ta đạt được phân hoạch tương ứng với quan hệ tương đương ∼Σ† ,Φ† ,I . Ngoài ra, để quá trình làm mịn trong thực tế đạt hiệu quả cao, các bộ chọn đơn giản và bộ chọn mở rộng cũng sẽ được xem xét sử dụng. 63 Định nghĩa 3.4 (Bộ chọn cơ bản). Một bộ chọn cơ bản trong LΣ† ,Φ† dùng để phân chia khối Yij của phân hoạch Y = {Yi1 , Yi2 , . . . , Yik } là một khái niệm thuộc một trong các dạng sau: • A, trong đó A ∈ Σ†C , • A = d, trong đó A ∈ Σ†A \ Σ†C và d ∈ range(A), • ∃σ.{d}, trong đó σ ∈ Σ†dR và d ∈ range(σ), • ∃r.Cit , trong đó r ∈ Σ†oR và 1 ≤ t ≤ k, • ∃r− .Cit , nếu I ∈ Φ† , r ∈ Σ†oR và 1 ≤ t ≤ k, • {a}, nếu O ∈ Φ† và a ∈ Σ†I , • ≤ 1 r, nếu F ∈ Φ† và r ∈ Σ†oR , • ≤ 1 r− , nếu {F, I} ⊆ Φ† và r ∈ Σ†oR , • ≥ l r và ≤ m r, nếu N ∈ Φ† , r ∈ Σ†oR , 0 < l ≤ #∆I và 0 ≤ m < #∆I , • ≥ l r− và ≤ m r− , nếu {N , I} ⊆ Φ† , r ∈ Σ†oR , 0 < l ≤ #∆I và 0 ≤ m < #∆I , • ≥ l r.Cit và ≤ m r.Cit , nếu Q ∈ Φ† , r ∈ Σ†oR , 1 ≤ t ≤ k, 0 < l ≤ #CiIt và 0 ≤ m < #CiIt , • ≥ l r− .Cit và ≤ m r− .Cit , nếu {Q, I} ⊆ Φ† , r ∈ Σ†oR , 1 ≤ t ≤ k, 0 < l ≤ #CiIt và 0 ≤ m < #CiIt , • ∃r.Self, nếu Self ∈ Φ† và r ∈ Σ†oR . Định lý 3.1 (Về bộ chọn cơ bản). Cho Σ và Σ† là các bộ ký tự logic mô tả sao cho Σ† ⊆ Σ, Φ và Φ† là tập các đặc trưng logic mô tả sao cho Φ† ⊆ Φ, I là một hệ thống thông tin trong LΣ,Φ . Xuất phát từ phân hoạch {∆I } và thực hiện việc làm mịn liên tục nó bằng các bộ chọn cơ bản ta sẽ nhận được một phân hoạch tương ứng với quan hệ tương đương ∼Σ† ,Φ† ,I . Chứng minh. Gọi Y = {Yi1 , Yi2 , . . . , Yik } là phân hoạch cuối cùng đạt được bằng cách làm mịn liên tục phân hoạch {∆I } thông qua việc sử dụng các bộ chọn cơ bản. Gọi Z là quan hệ tương đương tương ứng với phân hoạch Y và được định nghĩa là Z = { x, x | x, x ∈ Yij với 1 ≤ j ≤ k}. Chú ý rằng Cij là khái niệm đại diện cho tập Yij , nghĩa là Yij = CiIj . 64 Đầu tiên chúng ta chứng minh quan hệ Z là một LΣ† ,Φ† -tự mô phỏng hai chiều của I. Giả sử Σ† ⊆ Σ, Φ† ⊆ Φ, a ∈ Σ†I , A ∈ Σ†C , B ∈ Σ†A \ Σ†C , r ∈ Σ†oR , σ ∈ Σ†dR , d ∈ range(σ) và x, y, x , y ∈ ∆I . - Xét điều kiện (2.1), ta có Z(aI , aI ) luôn thỏa mãn với mọi a ∈ Σ†I . - Xét điều kiện (2.2) và giả sử Z(x, x ) thỏa mãn. Lúc đó tồn tại 1 ≤ j ≤ k sao cho x, x ∈ Yij . Vì phân hoạch Y không thể làm mịn hơn nữa bằng cách sử dụng khái niệm A nên ta có hoặc Yij ⊆ AI hoặc Yij ∩ AI = ∅. Nếu Yij ⊆ AI thì x, x ∈ AI . Nếu Yij ∩ AI = ∅ thì x, x ∈ / AI . Do đó, AI (x) ⇔ AI (x ). - Xét điều kiện (2.3) và giả sử Z(x, x ) thỏa mãn. Tương tự như trên, vì phân hoạch Y không thể làm mịn hơn nữa bằng cách sử dụng bộ chọn (B = d) với d ∈ range(B), ta có Yij ⊆ (B = d)I hoặc Yij ∩ (B = d)I = ∅ với mọi 1 ≤ j ≤ k. Nếu x, x ∈ Yij và Yij ⊆ (B = d)I với d ∈ range(B) thì x, x ∈ (B = d)I , và do đó B(x) = d = B(x ). Nếu x, x ∈ Yij và Yij ∩ (B = d)I = ∅ với d ∈ range(B) thì cả B(x) và B(x ) không xác định. - Xét điều kiện (2.4) và giả sử Z(x, x ) và rI (x, y) thỏa mãn. Gọi Yij ∈ Y là khối có chứa y, ta có x ∈ (∃r.Cij )I . Vì Y không thể làm mịn hơn nữa bằng cách sử dụng (∃r.Cij ) nên x ∈ (∃r.Cij )I . Vì vậy, tồn tại y ∈ ∆I sao cho rI (x , y ) thỏa mãn và y ∈ CiIj = Yij , nghĩa là Z(y, y ) thỏa mãn. - Điều kiện (2.5) được chứng minh tương tự điều kiện (2.4). - Xét điều kiện (2.6) và giả sử Z(x, x ) thỏa mãn. Bằng cách thay khái niệm A trong điều kiện (2.2) bởi khái niệm ∃σ.{d}, ta suy ra được x ∈ (∃σ.{d})I nếu và chỉ nếu x ∈ (∃σ.{d})I . Vì vậy, σ I (x, d) ⇔ σ I (x , d). - Điều kiện (2.7), (2.8) trong trường hợp I ∈ Φ† được chứng minh tương tự điều kiện (2.4) và (2.5) bằng cách thay vai trò r bởi vai trò r− . - Điều kiện (2.9) trong trường hợp O ∈ Φ† được chứng minh tương tự điều kiện (2.2) bằng cách thay khái niệm A bởi khái niệm {a}. - Xét điều kiện (2.10) trong trường hợp N ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Đặt l = #{y | rI (x, y)}. Vì phân hoạch Y không thể làm mịn hơn nữa bằng cách sử dụng khái niệm ≥ l r (khi l > 0) và ≤ l r (khi l < #∆I ), ta có x ∈ (≥ l r)I và x ∈ (≤ l r)I . Từ đó suy ra #{y | rI (x , y )} = l. - Điều kiện (2.11) trong trường hợp {N , I} ⊆ Φ† được chứng minh tương tự điều kiện (2.10) bằng cách thay vai trò r bởi vai trò r− . 65 - Xét điều kiện (2.12) trong trường hợp F ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Bằng cách thay khái niệm A trong điều kiện (2.2) bởi khái niệm (≤ 1 r), ta suy ra được x ∈ (≤ 1 r)I nếu và chỉ nếu x ∈ (≤ 1 r)I . Vì vậy, [#{y | rI (x, y)} ≤ 1] ⇔ [#{y | rI (x , y )} ≤ 1]. - Điều kiện (2.13) với {F, I} ⊆ Φ† được chứng minh tương tự điều kiện (2.12) bằng cách thay thế vai trò r bởi vai trò r− . - Xét điều kiện (2.14) trong trường hợp Q ∈ Φ† và giả sử Z(x, x ) thỏa mãn. Gọi S = {y ∈ ∆I | rI (x, y)} và S = {y ∈ ∆I | rI (x , y )}. Rõ ràng S và S hữu hạn. Ta sẽ chứng minh theo phương pháp phản chứng. Giả sử không tồn tại bất kỳ một song ánh h : S → S nào sao cho h ⊆ Z. Do đó, tồn tại 1 ≤ j ≤ k thỏa #(S ∩ Yij ) = l = m = #(S ∩ Yij ). Nếu l > m thì x ∈ (≥ l r.Cij )I nhưng x ∈ / (≥ l r.Cij )I . Nếu m > l thì x ∈ / (≥ m r.Cij )I nhưng x ∈ (≥ m r.Cij )I . Vì vậy, x và x sẽ phân biệt nhau bởi một bộ chọn nào đó của LΣ† ,Φ† . Điều này mâu thuẫn với giả thiết là phân hoạch Y không thể làm mịn hơn được nữa. - Điều kiện (2.15) trong trường hợp {Q, I} ⊆ Φ† được chứng minh tương tự điều kiện (2.14) bằng cách thay thế vai trò r bởi vai trò r− . - Điều kiện (2.16) thỏa mãn vì với bất kỳ x ∈ ∆I ta chỉ cần chọn x = x. Lúc đó, ta có Z(x, x ) thỏa mãn. - Điều kiện (2.17) thỏa mãn vì với bất kỳ x ∈ ∆I ta chỉ cần chọn x = x . Lúc đó, ta có Z(x, x ) thỏa mãn. - Điều kiện (2.18) trong trường hợp Self ∈ Φ† ta có thể chứng minh tương tự như điều kiện (2.2) bằng cách thay khái niệm A bởi khái niệm ∃r.Self. Bây giờ chúng ta chứng minh Z là một LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I. Ta thấy, tại mỗi bước làm mịn, quan hệ tương đương tương ứng với phân hoạch đó là một tập cha của ≡Σ† ,Φ† ,I vì mỗi khối của phân hoạch được đặc trưng bởi một khái niệm. Do đó, với phân hoạch cuối cùng, ta có Z ⊇ ≡Σ† ,Φ† ,I . Vì Z là một LΣ† ,Φ† -tự mô phỏng hai chiều của I và ∼Σ† ,Φ† ,I là một LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I nên ta có Z ⊆ ∼Σ† ,Φ† ,I . Theo Định lý 2.6, ta có ≡Σ† ,Φ† ,I và ∼Σ† ,Φ† ,I trùng nhau. Vậy Z = ∼Σ† ,Φ† ,I , nghĩa là Z là một LΣ† ,Φ† -tự mô phỏng hai chiều lớn nhất của I. Theo Định lý 3.1, chúng ta chỉ cần sử dụng các bộ chọn cơ bản là đủ để làm mịn phân hoạch {∆I } nhằm đạt được phân hoạch tương ứng với quan hệ ∼Σ† ,Φ† ,I . Tuy nhiên, để ngăn chặn vấn đề quá tải (overfitting) đối với hệ thống huấn luyện I và để có được các định nghĩa đơn giản cho khái niệm cần học, Nguyen và Szalas đề xuất sử 66 dụng thêm các bộ chọn được tạo ra bằng cách kết hợp các tên vai trò với các khái niệm đại diện cho tất cả khối đã được tạo ra (nghĩa là, các khái niệm Ci với 1 ≤ i ≤ n và n là chỉ số lớn nhất trong các khối) [44]. Cùng với đề xuất này, chúng tôi xem xét thêm các bộ chọn dựa trên các thuộc tính để xây dựng các bộ chọn đơn giản. Định nghĩa 3.5 (Bộ chọn đơn giản). Giả sử Y1 , Y2 , . . . , Yn là các khối được tạo ra trong quá trình làm mịn phân hoạch {∆I }, trong đó Yi được đặc trưng bởi khái niệm Ci sao cho Yi = CiI . Một bộ chọn đơn giản trong LΣ† ,Φ† để phân chia một khối là một bộ chọn cơ bản hoặc một khái niệm có dạng sau: • A ≤ d và A < d, trong đó A ∈ Σ†nA , d ∈ range(A) và d không phải là phần tử nhỏ nhất của range(A), • A ≥ d và A > d, trong đó A ∈ Σ†nA , d ∈ range(A) và d không phải là phần tử lớn nhất của range(A), • ∃r. , ∃r.Ci và ∀r.Ci , trong đó r ∈ Σ†oR và 1 ≤ i ≤ n, • ∃r− . , ∃r− .Ci và ∀r− .Ci , nếu I ∈ Φ† , r ∈ Σ†oR và 1 ≤ i ≤ n, • ≥ l r.Ci và ≤ m r.Ci , nếu Q ∈ Φ† , r ∈ Σ†oR , 1 ≤ i ≤ n, 0 < l ≤ #CiI và 0 ≤ m < #CiI , • ≥ l r− .Ci và ≤ m r− .Ci , nếu {Q, I} ⊆ Φ† , r ∈ Σ†oR , 1 ≤ i ≤ n, 0 < l ≤ #CiI và 0 ≤ m < #CiI . Chương trình cài đặt đối với phương pháp học khái niệm cho các hệ thống thông tin trong logic mô tả sử dụng mô phỏng hai chiều sử dụng bộ chọn đơn giản cho kết quả tốt trong trường hợp học các khái niệm đơn giản. Tuy nhiên, đối với những trường hợp học khái niệm phức tạp, các bộ chọn đơn giản đem lại kết quả chưa tốt. Kết quả thực nghiệm cho thấy rằng khái niệm học được thường có những đặc điểm sau2 : • Độ dài của khái niệm kết quả thường lớn, • Độ đúng đắn, tỉ lệ chính xác, tỉ lệ bao phủ và độ đo F1 của bộ phân lớp trong việc dự đoán các đối tượng mới chưa cao. Lý do chính là các bộ chọn đơn giản chưa đủ phong phú và chưa đủ mạnh để làm mịn các phân hoạch. Do đó, để khắc phục vấn đề này, luận án đề xuất sử dụng thêm một loại bộ chọn mới, được gọi là bộ chọn mở rộng. 2 Kết quả thực nghiệm thể hiện trong các Bảng 3.1, 3.2 và 3.3. 67 Gọi D là tập chứa các bộ chọn hiện có (tại thời điểm ban đầu D = ∅). Tại mỗi bước trong quá trình làm mịn, các bộ chọn được tạo ra và thêm vào tập D. Cùng với phân hoạch hiện thời Y, tập D = {D1 , D2 , . . . , Dh } được gọi là tập các bộ chọn hiện thời. Các bộ chọn mở rộng được xây dựng bằng cách kết hợp tập các bộ chọn hiện thời với các vai trò đối tượng mà ngôn ngữ con được phép sử dụng cho quá trình học. Định nghĩa 3.6 (Bộ chọn mở rộng). Cho D = {D1 , D2 , . . . , Dh } là tập các bộ chọn hiện thời. Một bộ chọn mở rộng trong LΣ† ,Φ† để phân chia một khối của phân hoạch hiện thời là một khái niệm thuộc một trong các dạng sau: • ∃r.Du và ∀r.Du , trong đó r ∈ Σ†oR và Du ∈ D, • ∃r− .Du và ∀r− .Du , nếu I ∈ Φ† , r ∈ Σ†oR và Du ∈ D, • ≥ l r.Du và ≤ m r.Du , nếu Q ∈ Φ† , r ∈ Σ†oR , Du ∈ D, 0 < l ≤ #DuI và 0 ≤ m < #DuI , • ≥ l r− .Du và ≤ m r− .Du , nếu {Q, I} ⊆ Φ† , r ∈ Σ†oR , Du ∈ D, 0 < l ≤ #DuI và 0 ≤ m < #DuI . Các bộ chọn mở rộng đóng vai trò quan trọng trong quá trình làm mịn các phân hoạch. Bằng cách sử dụng các bộ chọn này, chúng ta có thêm nhiều bộ chọn (với độ sâu lớn) để phân chia các khối. Do đó, phân hoạch thu được sẽ tốt hơn so với chỉ sử dụng các bộ chọn đơn giản. Hơn nữa, thông qua việc sử dụng các bộ chọn mở rộng, số lần lặp để đạt được phân hoạch cuối cùng sẽ giảm bớt đáng kể. Điều này dẫn đến khái niệm kết quả có độ dài ngắn hơn và độ chính xác cao hơn khi phân loại các đối tượng mới. 3.2.3. Tính đơn giản của khái niệm Trong quá trình làm mịn phân hoạch miền của diễn dịch, các bộ chọn được sinh ra ngày càng nhiều. Trong số các khái niệm đó, có những khái niệm có cùng tập thể hiện.3 Do đó, chúng ta cần chọn khái niệm đơn giản nhất để phân chia khối. Trong luận án này, tính đơn giản của khái niệm được xác định thông qua độ dài và độ sâu khả năng của khái niệm. Định nghĩa 3.7 (Độ sâu khả năng). Cho C là một khái niệm ở dạng chuẩn trong ngôn ngữ LΣ,Φ . Độ sâu khả năng của khái niệm C, ký hiệu là mdepth(C), được xác định như sau: 3 Các khái niệm khác nhau nhưng có cùng tập đối tượng trong một diễn dịch cụ thể. 68 • 0 nếu C có dạng , ⊥, A, A = d, A = d, A > d, A ≥ d, A < d hoặc A ≤ d, • mdepth(D) nếu C là dạng chuẩn của ¬D, • 1 nếu C có dạng ∃σ.{d}, ∃r.Self, ≥ n R hoặc ≤ n R, • 1 + mdepth(D) nếu C có dạng ∃R.D, ∀R.D, ≥ n R.D hoặc ≤ n R.D, • max{mdepth(D1 ), mdepth(D2 ), . . . , mdepth(Dn )} nếu C có dạng {D1 , D2 , . . . , Dn } hoặc {D1 , D2 , . . . , Dn }. Định nghĩa 3.8 (Độ dài). Cho C là một khái niệm ở dạng chuẩn trong ngôn ngữ LΣ,Φ . Độ dài của khái niệm C, ký hiệu bởi length(C), được xác định như sau: • 0 nếu C có dạng hoặc ⊥, • 1 nếu C có dạng A, A = d, A = d, A > d, A ≥ d, A < d hoặc A ≤ d, • length(D) nếu C ≡ D và D là dạng chuẩn của ¬D, • 3 nếu C có dạng ∃σ.{d}, ∃r.Self, ≥ n R hoặc ≤ n R, • 2 + length(D) nếu C có dạng ∃R.D hoặc ∀R.D, • 3 + length(D) nếu C có dạng ≥ n R.D hoặc ≤ n R.D, • 1 + length(D1 ) + length(D2 ) + · · · + length(Dn ) nếu C có dạng {D1 , D2 , . . . , Dn } hoặc {D1 , D2 , . . . , Dn }. Chúng ta sử dụng các khái niệm được biểu diễn ở dạng chuẩn (nghĩa là, tạo tử phủ định chỉ xuất hiện trước các tên khái niệm). Vì lý do này, length(D) được định nghĩa bằng với length(D), trong đó D là dạng chuẩn của ¬D. Ví dụ 3.4. Cho A, B là các tên khái niệm và r, s là các tên vai trò đối tượng. Ta có: • mdepth( {¬A, ≥ 2 r.(∃r. ), ∃s.B}) = 2, • length( {¬A, ≥ 2 r.(∃r. ), ∃r.B}) = 10. Cho hai khái niệm C và D trong ngôn ngữ LΣ,Φ . Chúng ta nói rằng khái niệm C đơn giản hơn khái niệm D nếu: • length(C) < length(D), hoặc • length(C) = length(D) và mdepth(C) ≤ mdepth(D). 69 Trong thực tế, độ sâu khả năng của một khái niệm thường là một giá trị rất nhỏ, trong lúc đó độ dài của khái niệm thường là một giá trị rất lớn. Điều này dẫn đến sự khác nhau về độ sâu của hai khái niệm không nhiều. Ngược lại, sự khác nhau về độ dài giữa hai khái niệm lại khá lớn. Đây chính là lý do chúng tôi chọn độ dài của khái niệm làm yếu tố chính để xem xét tính đơn giản của khái niệm. Cho C = {C1 , C2 , . . . , Cn } là tập các khái niệm của LΣ,Φ . Khái niệm Ci ∈ C được gọi là đơn giản nhất nếu nó đơn giản hơn bất kỳ khái niệm nào khác trong C. 3.2.4. Độ đo dựa trên entropy Trong ngữ cảnh logic mô tả và phân hoạch miền của diễn dịch trong logic mô tả, entropy được xác định thông qua các khối của phân hoạch. Cho I là một hệ thống thông tin, X và Y là các tập con của ∆I , trong đó X đóng vai trò là tập các mẫu dương của khái niệm cần học, Y đóng vai trò là một khối của phân hoạch. Định nghĩa 3.9 (Entropy). Entropy của tập Y đối với tập X trong miền ∆I của hệ thống thông tin I, ký hiệu là E∆I (Y /X), được xác định như sau:   0, nếu Y ∩ X = ∅ hoặc Y ⊆ X E∆I (Y /X) = #XY #XY #XY #XY  − log2 − log2 , nếu ngược lại, #Y #Y #Y #Y (3.1) trong đó XY đại diện cho tập X ∩ Y và XY đại diện cho tập X ∩ Y . Entropy là một lý thuyết độ đo về tính không chắc chắn trong các hệ thống thông tin khi các đối tượng trong hệ thống đó xuất hiện nhiều hơn trong một lớp. Entropy có giá trị nhỏ nhất là 0 khi và chỉ khi tất cả các đối tượng thuộc về cùng một lớp. Nói cách khác, tập các đối tượng không bị phân chia bởi tập các mẫu dương cũng như tập các mẫu âm. Entropy đạt giá trị lớn nhất khi các đối tượng phân bố đều nhau trong các lớp. Ghi chú 3.2. Theo công thức (3.1), chúng ta thấy rằng E∆I (Y /X) = 0 khi và chỉ khi tập Y không bị phân chia bởi tập X. Chúng ta cần xác định thuộc tính nào trong hệ thống thông tin huấn luyện để phân chia tập các đối tượng thành các lớp cần học là tốt nhất. Quinlan đề xuất sử dụng độ đo gia lượng thông tin (information gain) nhằm quyết định thứ tự của các thuộc tính cần dùng để phân chia các nút trong cây quyết định [50]. Trong ngữ cảnh logic mô tả, chúng tôi đưa ra định nghĩa về gia lượng thông tin khi sử dụng một bộ chọn để chia một khối trong phân hoạch. 70 Định nghĩa 3.10 (Gia lượng thông tin). Gia lượng thông tin của bộ chọn D trong việc phân chia tập Y đối với tập X trong ∆I của hệ thống thông tin I, ký hiệu là IG∆I (Y /X, D), được xác định như sau: IG∆I (Y /X, D) = E∆I (Y /X) − #DI Y #DI Y E∆I (DI Y /X) + E∆I (DI Y /X) (3.2) #Y #Y trong đó DI Y đại diện cho tập DI ∩ Y và DI Y đại diện cho tập DI ∩ Y . Gia lượng thông tin dựa trên mức độ giảm bớt thông tin sau khi hệ thống thông tin bị phân chia trên một khối bởi một bộ chọn. Do vậy, chúng ta cần tìm khối và bộ chọn hợp lý sao cho gia lượng thông tin thu được khi sử dụng bộ chọn này để phân chia khối đã chọn là lớn nhất để xây dựng được cây quyết định tốt nhất. Trong ngữ cảnh ∆I và X đã rõ ràng, chúng ta viết E(Y ) thay cho E∆I (Y /X) và IG(Y, D) thay cho IG∆I (Y /X, D). 3.2.5. Thuật toán học khái niệm trong logic mô tả với Ngữ cảnh (3) Thuật toán 3.1 về học khái niệm cho các hệ thống thông tin trong logic mô tả được phát triển dựa trên các nghiên cứu của Nguyen và Szalas [44] với lớp ngôn ngữ logic mô tả lớn hơn, đưa ra các chiến lược, bổ sung bộ chọn, xây dựng và sử dụng các độ đo phù hợp cho quá trình phân hoạch. Trong thuật toán này, quá trình phân hoạch miền của một diễn dịch sử dụng các bộ chọn cơ bản, bộ chọn đơn giản và/hoặc bộ chọn mở rộng như đã đề cập trong các Định nghĩa 3.4, 3.5 và 3.6. Việc quyết định sử dụng các loại bộ chọn nào phụ thuộc vào Bước 2 và 19 của Thuật toán 3.1. Ngoài ra, thuật toán này sử dụng độ đo gia lượng thông tin để tiến hành chọn khối và bộ chọn để phân hoạch thông qua Hàm chooseBlockSelector. Hàm chooseBlockSelector trong Bước 4 cho phép chọn khối và bộ chọn tốt nhất trong quá trình làm mịn. Hàm này áp dụng độ đo gia lượng thông tin cũng như tính đơn giản của các bộ chọn để xem xét lựa chọn khối và bộ chọn tương ứng cần phân chia trước. Giả sử rằng phân hoạch hiện thời là Y = {Yi1 , Yi2 , . . . , Yik } và tập các bộ chọn hiện thời là D = {D1 , D2 , . . . , Dh }. Với mỗi khối Yij ∈ Y (1 ≤ j ≤ k), gọi Sij là bộ chọn đơn giản nhất được lấy từ tập arg max{IG(Yij , Du )}. Từ phân hoạch hiện Du ∈D thời, nếu Yij được chọn để phân chia thì Sij chính là bộ chọn dùng để phân chia Yij . Sau khi chọn bộ chọn cho các khối, chúng ta sẽ quyết định khối được phân chia trước là khối Yij mà khi áp dụng bộ chọn Sij để phân chia Yij ta thu được gia lượng thông tin là cực đại. Nghĩa là, ta chọn Yij ∈ arg max{IG(Yij , Sij )} để phân chia trước. Yij ∈Y 71 Function chooseBlockSelector Input : Y, D Output: Yij , Sij sao cho IG(Yij , Sij ) cực đại, trong đó Yij ∈ Y và Sij ∈ D 1 BS := ∅; 2 foreach Yij ∈ Y do 3 foreach Du ∈ D do Tính IG(Yij , Du ); 4 5 S := arg max{IG(Yij , Du )}; Du ∈D 6 Lấy Sij ∈ S sao cho Sij là khái niệm đơn giản nhất; 7 BS := BS ∪ { Yij , Sij }; 8 Chọn Yij , Sij ∈ BS sao cho IG(Yij , Sij ) là cực đại; 9 return Yij , Sij ; Đối với Bước 19, sau khi phân chia khối, chúng ta có được phân hoạch mới. Tiếp đó, các bộ chọn mới sẽ được tạo ra và thêm vào tập các bộ chọn hiện thời D. Tập này tiếp tục được dùng để làm mịn phân hoạch mới. Đối với Bước 24, ý nghĩa của tập J là dùng để lưu lại các chỉ số l sao cho Yl là khối lớn nhất không bị phân chia bởi E và Yl ⊆ {aI | a ∈ E + } Thuật toán dừng khi phân hoạch đạt được nhất quán với E (khi đó thuật toán trả về kết quả là khái niệm cần học) hoặc không thể phân hoạch thêm được nữa (khi đó thuật toán trả về kết quả thất bại). Tuy nhiên, trong thực tế, các hệ thống thông tin rất đa dạng nên điều kiện “Yi không bị phân chia bởi E” rất khó để đạt được. Vì vậy, chúng ta có thể xấp xỉ điều kiện này với một tỉ lệ phần trăm các mẫu dương trong mỗi khối bằng một tham số r (chẳng hạn như, tham số r có thể thiết lập từ 90% trở lên). Tương tự như vậy, điều kiện ∃a ∈ E + : aI ∈ Yij trong Bước 23 cũng được thiết lập như trên. Ghi chú 3.3. Ký hiệu C được hiểu như sau: • nếu C = {C1 , C2 , . . . , Cp } thì • nếu C = ∅ thì C= C= {C1 , C2 , . . . , Cp } = C1 C2 ··· Cp , ∅ = ⊥. Cây quyết định sinh ra trong quá trình làm mịn phân hoạch có thể sẽ rất lớn và do đó dễ dẫn đến quá tải đối với một số tập dữ liệu huấn luyện. Ngoài ra, một cây quyết định quá lớn cũng ảnh hưởng đến tính chính xác khi phân lớp các đối tượng. 72 Thuật toán 3.1: Học khái niệm cho hệ thống thông tin trong logic mô tả Input : I, Σ† , Φ† , E = E − , E + Output: Khái niệm C sao cho: • I |= C(a) với mọi a ∈ E + , và • I |= C(a) với mọi a ∈ E − . 1 n := 1; Y1 := ∆I ; C1 := 2 Tạo và thêm các bộ chọn vào D; 3 while (Y không nhất quán với E) do /* Định nghĩa 3.4, 3.5 và/hoặc 3.6 */ Yij , Sij := chooseBlockSelector(Y, D); 4 5 ; Y := {Y1 }; D = ∅; if (Yij không bị phân chia bởi SiIj ) then break; 6 7 s := n + 1; t := n + 2; n := n + 2; 8 Ys := Yij ∩ SiIj ; 9 Yt := Yij ∩ (¬Sij )I ; Ct := Cij 10 Cs := Cij Sij ; ¬Sij ; if (Yij không bị phân chia bởi E) then 11 LargestContainer [s] := LargestContainer [ij ]; 12 LargestContainer [t] := LargestContainer [ij ]; 13 else if (Ys không bị phân chia bởi E) then 14 LargestContainer [s] := s; 15 if (Yt không bị phân chia bởi E) then 16 LargestContainer [t] := t; 17 18 Y := Y ∪ {Ys , Yt } \ {Yij }; 19 Tạo và thêm các bộ chọn vào D; 20 J := ∅; C := ∅; 21 if (Y nhất quán với E) then 22 foreach Yij ∈ Y do if (∃a ∈ E + : aI ∈ Yij ) then 23 J := J ∪ {LargestContainer [ij ]} ; 24 25 foreach l ∈ J do C := C ∪ {Cl }; 26 27 C := 28 return Crs :=simplify (C); 29 30 /* Định nghĩa 3.4, 3.5 và/hoặc 3.6 */ C; else return failure; 73 Hàm simplify trong Bước 28 có nhiệm vụ giảm kích thước của cây quyết định và độ dài của khái niệm kết quả. Hàm này sử dụng một số kỹ thuật trên cây kết hợp với các tập dữ liệu chứng thực để cắt gảm cây quyết định. Ngoài ra hàm simplify còn sử dụng các kỹ thuật thay thế khái niệm và rút gọn khái niệm khác. Cụ thể như sau: • Kỹ thuật cắt cây: Kỹ thuật cắt cây cho phép loại bỏ đi các phần của cây có xu hướng làm cho việc phân loại các đối tượng kém chính xác. Kỹ thuật này có thể được thực hiện theo chiến lược trên-xuống hoặc dưới-lên. Chẳng hạn, khi cắt cây theo chiến lược dưới-lên, chúng ta chọn nút lá để loại bỏ sao cho sau khi loại bỏ nút đó độ chính xác trung bình được tăng lên trên tập dữ liệu huấn luyện và tập dữ liệu chứng thực. Lặp lại quá trình này cho đến khi độ chính xác không thể tăng lên được nữa. Mục đích của kỹ thuật cắt cây là giảm kích thước của cây quyết định và làm tăng độ chính xác khi phân loại đối tượng. • Kỹ thuật thay thế: Khái niệm kết quả sau khi học luôn có dạng C1 C2 · · · Cp . Trong trường hợp một khái niệm Ci (1 ≤ i ≤ p) quá phức tạp, chúng ta xem xét thay thế nó bằng một khái niệm đơn giản hơn trong tập các bộ chọn với điều kiện phải đảm bảo là hai khái niệm này có cùng thể hiện đối với hệ thống thông tin đang xem xét. Việc thay thế này chỉ được thực hiện chỉ khi độ chính xác của khái niệm kết quả trên tập dữ liệu chứng thực không bị giảm đi. • Kỹ thuật rút gọn khái niệm: Khái niệm kết quả sẽ được rút gọn thành một khái niệm tương đương bằng cách vận dụng các luật De Morgan và các luật chuyển đổi tương đương khác. 3.3. Ví dụ minh họa Trong mục này, chúng tôi trình bày các ví dụ minh họa cho Thuật toán 3.1, trong đó Ví dụ 3.5 chỉ sử dụng các bộ chọn cơ bản, Ví dụ 3.6 sử dụng các bộ chọn đơn giản và Ví dụ 3.8 sử dụng cả bộ chọn đơn giản và bộ chọn mở rộng trong quá trình làm mịn phân hoạch. Mục đích của các ví dụ này nhằm chỉ ra tính hiệu quả của các loại bộ chọn khác nhau. Ví dụ 3.5. Xét hệ thống thông tin I như đã cho trong Ví dụ 3.3. Giả sử chúng ta muốn học định nghĩa của khái niệm ExcellentPub (nghĩa là, E = E + , E − với E + = {P4 , P6 } và E − = {P1 , P2 , P3 , P5 }) trong ngôn ngữ con LΣ† ,Φ† , trong đó Σ† = {Awarded , cited_by} và Φ† = ∅. Chúng ta chỉ sử dụng các bộ chọn cơ bản trong quá trình làm mịn phân hoạch. Các bước của ví dụ được mô tả như sau: 1. Y1 := ∆I , C1 := , Y := {Y1 } 74 2. Theo độ đo gia lượng thông tin, bộ chọn tốt nhất để phân chia Y1 là Awarded . Tiến hành phân chia khối Y1 bởi Awarded chúng ta thu được: • Y2 := {P1 , P4 , P6 }, C2 := Awarded • Y3 := {P2 , P3 , P5 }, C3 := ¬Awarded • LargestContainer [3] := 3 (vì Y3 không bị phân chia bởi E) • Y := {Y2 , Y3 } 3. Theo độ đo gia lượng thông tin, các bộ chọn tốt nhất để phân chia Y2 là ∃cited_by. , ∃cited_by.C2 và ∃cited_by.C3 . Tất cả các bộ chọn này đều phân chia Y2 giống nhau. Chúng ta sử dụng bộ chọn đơn giản nhất ∃cited_by. để phân chia Y2 và thu được: • Y4 := {P4 , P6 }, C4 := C2 ∃cited_by. • LargestContainer [4] := 4 (vì Y4 không bị phân chia bởi E) • Y5 := {P1 }, C5 := C2 ¬∃cited_by. • LargestContainer [5] := 5 (vì Y5 không bị phân chia bởi E) • Y := {Y3 , Y4 , Y5 } Phân hoạch đạt được là Y = {Y3 , Y4 , Y5 } nhất quán với E, gồm Y4 chứa P4 , P6 với P4 , P6 ∈ E + và Y3 , Y5 không chứa cá thể nào của E + (phân hoạch này không tương ứng với quan hệ ∼Σ† ,Φ† ,I ). Vì LargestContainer [4] = 4 nên ta có C = {C4 } và C ≡ C4 ≡ Awarded ∃cited_by. . Khái niệm C không thể rút gọn thêm được nữa nên khái niệm kết quả trả về là Crs ≡ C ≡ Awarded ∃cited_by. . Khái niệm này được định nghĩa đơn giản hơn so với khái niệm gốc ExcellentPub ≡ (GoodPub Awarded ) ≡ (Awarded ≥ 2 cited_by). Quá trình làm mịn phân hoạch của Ví dụ 3.5 được minh họa thông qua cây quyết định như trong Hình 3.2. Ví dụ sau đây minh họa cho trường hợp học khái niệm không sử dụng vai trò, nghĩa là, Σ†oR ∪ Σ†dR = ∅. Do đó, phương pháp đã đề xuất ở trên giống như phương pháp học máy truyền thống dựa trên cây quyết định. Ví dụ 3.6. Xét hệ thống thông tin I như đã cho trong Ví dụ 3.3. Giả sử chúng ta muốn học định nghĩa của X = {P4 , P6 } (nghĩa là, E = E + , E − với E + = {P4 , P6 } và E − = {P1 , P2 , P3 , P5 }) trong ngôn ngữ con LΣ† ,Φ† , trong đó Σ† = {Awarded , Year } và Φ† = ∅. Chúng ta chỉ sử dụng các bộ chọn đơn giản trong quá trình làm mịn phân hoạch. Các bước của ví dụ được mô tả như sau: 75 {P1 , P2 , P3 , P4 , P5 , P6 } ¬Awarded Awarded B {P1 , P4 , P6 } ¬∃cited_by. {P1 } {P2 , P3 , P5 } ∃cited_by. u {P4 , P6 } Hình 3.2: Quá trình làm mịn phân hoạch của Ví dụ 3.5 1. Y1 := ∆I , C1 := , partition := {Y1 } 2. Theo độ đo gia lượng thông tin, bộ chọn tốt nhất tại bước này để phân chia khối Y1 là Awarded và Year ≥ 2008. Chúng ta chọn Awarded là bộ chọn đơn giản nhất để phân chia Y1 và thu được: • Y2 := {P1 , P4 , P6 }, C2 := Awarded • Y3 := {P2 , P3 , P5 }, C3 := ¬Awarded • LargestContainer [3] := 3 (vì Y3 không bị phân chia bởi E) • Y := {Y2 , Y3 }. 3. Theo độ đo gia lượng thông tin, bộ chọn tốt nhất để phân chia khối Y2 là Year ≥ 2009. Tiến hành phân chia Y2 bởi Year ≥ 2009 chúng ta thu được: • Y4 := {P1 }, C4 := C2 (Year ≥ 2009) • LargestContainer [4] := 4 (vì Y4 không bị phân chia bởi E) • Y5 := {P4 , P6 }, C5 := C2 (Year < 2009) • LargestContainer [5] := 5 (vì Y5 không bị phân chia bởi E) • Y := {Y3 , Y4 , Y5 }. Phân hoạch đạt được là Y = {Y3 , Y4 , Y5 } nhất quán với E, gồm Y5 chứa P4 , P6 với P4 , P6 ∈ E + và Y3 , Y4 không chứa cá thể nào của E + (phân hoạch này không tương ứng với quan hệ ∼Σ† ,Φ† ,I ). Vì LargestContainer [5] = 5 nên ta có C = {C5 } và C ≡ C5 ≡ Awarded (Year < 2009). Khái niệm C không thể rút gọn thêm được nữa nên khái niệm kết quả trả về là Crs ≡ Awarded (Year < 2009). Quá trình làm mịn phân hoạch của Ví dụ 3.6 được minh họa thông qua cây quyết định như trong Hình 3.3. 76 {P1 , P2 , P3 , P4 , P5 , P6 } ¬Awarded Awarded B {P1 , P4 , P6 } Year ≥2009 {P1 } {P2 , P3 , P5 } Year 2007) và ≥ 3 cited_by. (tương đương với ≥ 3 cited_by.C1 ). Ở đây, chúng ta chọn Year ≥ 2008 là bộ chọn đơn giản nhất để phân chia Y1 và thu được: • Y2 := {P1 , P2 , P3 }, C2 := (Year ≥ 2008) • Y3 := {P4 , P5 , P6 }, C3 := (Year < 2008) • Y := {Y2 , Y3 } 3. Theo độ đo gia lượng thông tin chúng ta tiếp tục phân chia Y3 bằng bộ chọn Year ≥ 2007 và thu được:2 • Y4 := {P4 }, C4 := C3 (Year ≥ 2007) • Y5 := {P5 , P6 }, C5 := C3 (Year < 2007) • Y := {Y2 , Y4 , Y5 } 2 Khối Y2 nhất quán với E và khối Y3 không nhất quán với E. Một cách tự nhiên, chúng ta chọn khối Y3 để phân chia. Tuy nhiên, nếu chúng ta phân chia Y2 trước bằng bộ chọn Year ≥ 2010 sẽ cho kết quả tốt hơn về sau này. Đây chính là một gợi ý cho việc xây dựng các heuristic trong quá trình quyết định khối nào nên được phân chia trước và nên sử dụng bộ chọn nào để phân chia khối đó. 90 4. Khối Y4 , Y5 không thể tiếp tục phân chia. Vì vậy, mặc dầu Y2 nhất quán với E chúng ta vẫn tiếp tục phân chia nó để sử dụng sau này. Áp dụng độ đo gia lượng thông tin, chúng ta sử dụng bộ chọn Year ≥ 2010 để phân chia Y2 và thu được: • Y6 := {P1 }, C6 := C2 (Year ≥ 2010) • Y7 := {P2 , P3 }, C7 := C2 (Year < 2010) • Y := {Y4 , Y5 , Y6 , Y7 } 5. Theo độ đo gia lượng thông tin, chúng ta phân chia khối Y5 bằng bộ chọn ∃cited_by.C6 và thu được: • Y8 := {P6 }, C8 := C5 ∃cited_by.C6 • Y9 := {P5 }, C9 := C5 ¬∃cited_by.C6 • Y := {Y4 , Y6 , Y7 , Y8 , Y9 } Phân hoạch thu được là Y = {Y4 , Y6 , Y7 , Y8 , Y9 } nhất quán với E gồm khối Y4 chứa P4 , khối Y8 chứa P6 , với P4 , P6 ∈ E + và các khối Y6 , Y7 , Y9 không chứa cá thể nào của E + nên ta có kết quả trả về là Y = {Y4 , Y6 , Y7 , Y8 , Y9 }. Quá trình làm mịn phân hoạch của Ví dụ 4.2 được minh họa thông qua cây quyết định như trong Hình 4.2. {P1 , P2 , P3 , P4 , P5 , P6 } Year ≥2008 u {P1 , P2 , P3 } Year ≥2010 {P1 } y Year [...]... trong lớp các logic mô tả đã đề cập ở trên và sử dụng nó để mô hình hóa tính không phân biệt được của các đối tượng làm cơ sở cho các thuật toán học khái niệm trong logic mô tả • Phát triển thuật toán học khái niệm dựa trên mô phỏng hai chiều cho các hệ thống thông tin trong logic mô tả với Ngữ cảnh (3) • Xây dựng phương pháp làm mịn phân hoạch miền của các diễn dịch trong logic mô tả dựa trên mô phỏng... Lý do là các hệ thống thông tin truyền thống được định nghĩa như các bảng dữ liệu về các giá trị của các thuộc tính, các đối tượng chỉ được đặc tả thông qua các thuộc tính Tuy nhiên, trong thực tế tồn tại những hệ thống thông tin mà các đối tượng không những được đặc tả bằng các thuộc tính mà còn được đặc tả thông qua các mối quan hệ giữa các đối tượng đó Hệ thống thông tin dựa trên logic mô tả giải... hasDescendant 1.1.5 Logic mô tả và các tên gọi Hiện nay, có rất nhiều logic mô tả được phát triển để đáp ứng các nhu cầu trong thực tế về biểu diễn và suy luận tri thức Để thống nhất các tên gọi của logic mô tả, người ta lấy logic mô tả ALC làm nền tảng [55] Từ logic mô tả cơ bản ALC, bằng cách thêm các tính chất thông qua các tạo tử khái niệm và tạo tử vai trò người ta xây dựng được các logic mô tả mở rộng... hệ thứ tự giữa các số thực 18 của logic mô tả Φ là một tập rỗng hoặc tập chứa một số các đặc trưng nêu trên Chẳng hạn như Φ = {I, O, Q} để chỉ tập các đặc trưng của logic mô tả gồm: vai trò nghịch đảo, định danh và hạn chế số lượng có định tính Luận án xây dựng các thuật toán học máy cho các hệ thống thông tin dựa trên logic mô tả Cách tiếp cận này phù hợp đối với các hệ thống thông tin thường có trong... nghĩa và đặc tả các khái niệm phù hợp là một trong những vấn đề rất được quan tâm trong công nghệ ontology Do vậy, bài toán đặt ra là cần tìm được các khái niệm quan trọng và xây dựng được định nghĩa 1 cho các khái niệm đó Học khái niệm trong logic mô tả nhằm mục đích kiểm tra, suy luận và tìm ra được các khái niệm này phục vụ cho các ứng dụng cụ thể Vấn đề học khái niệm trong logic mô tả tương tự như... nhị phân trong học máy truyền thống Tuy nhiên, việc học khái niệm trong ngữ cảnh logic mô tả khác với học máy truyền thống ở điểm, các đối tượng không chỉ được đặc tả bằng các thuộc tính mà còn được đặc tả bằng các mối quan hệ giữa các đối tượng Các mối quan hệ này là một trong những yếu tố làm giàu thêm ngữ nghĩa của hệ thống huấn luyện Do đó, các phương pháp học khái niệm trong logic mô tả cần phải... khái niệm cho các hệ thống thông tin trong logic mô tả với Ngữ cảnh (3) (thể hiện qua Thuật toán 3.1) Thuật toán này cho phép học một khái niệm từ một hệ thống thông tin huấn luyện trong logic mô tả với tập 5 các mẫu dương và mẫu âm cho trước Chúng tôi đã sử dụng bộ chọn cơ bản, bộ chọn đơn giản và bộ chọn mở rộng kết hợp với độ đo gia lượng thông tin để phân chia các khối trong quá trình làm mịn các. .. ngôi, các vị từ hai đối) Các logic mô tả khác nhau được đặc trưng bởi tập các tạo tử khái niệm và tạo tử vai trò mà nó được phép sử dụng để xây dựng các khái niệm phức, vai trò phức từ các khái niệm nguyên tố và vai trò nguyên tố 7 Năm 1985, hệ thống biểu diễn tri thức dựa trên logic mô tả đầu tiên KL-one [56], [7] ra đời đã đánh dấu một sự khởi đầu mạnh mẽ về nghiên cứu logic mô tả Một số hệ thống. .. ký hiệu các ký tự chữ cái thường như a, b, cho các cá thể; các ký tự chữ cái hoa như A, B, cho các thuộc tính và/hoặc tên khái niệm (khái niệm nguyên tố); các ký tự chữ cái hoa như C, D, cho các khái niệm (khái niệm nguyên tố và khái niệm phức); các ký tự chữ cái thường như r, s, cho các tên vai trò đối tượng (vai trò đối tượng nguyên tố); các ký tự chữ cái hoa như R, S, cho các vai... cứu các thuật toán học bằng cách sử dụng toán tử làm mịn nhưng trên một logic mô tả giàu ngữ nghĩa hơn, logic mô tả ALC Ý tưởng chính của các thuật toán này là tìm và loại bỏ những phần của khái niệm dẫn đến lỗi về phân loại [32] Cả hai công trình trên đều nghiên cứu việc học khái niệm trong logic mô tả với Ngữ cảnh (1) Fanizzi cùng các cộng sự nghiên cứu toán tử làm mịn trên xuống trong logic mô tả ... Luận án xây dựng thuật toán học máy cho hệ thống thông tin dựa logic mô tả Cách tiếp cận phù hợp hệ thống thông tin thường có thực tế Lý hệ thống thông tin truyền thống định nghĩa bảng liệu giá... cho khái niệm Học khái niệm logic mô tả nhằm mục đích kiểm tra, suy luận tìm khái niệm phục vụ cho ứng dụng cụ thể Vấn đề học khái niệm logic mô tả tương tự phân lớp nhị phân học máy truyền thống. .. 3.1.1 Hệ thống thông tin truyền thống 3.1.2 Hệ thống thông tin dựa logic mô tả 3.2 Học khái niệm logic mô tả với Ngữ cảnh (3)

Ngày đăng: 20/10/2015, 17:02

Xem thêm: Học khái niệm cho các hệ thống thông tin dựa trên logic mô tả