Nghiên cứu một số phương pháp rút gọn thuộc tính trên bảng quyết định không đầy đủ và ứng dụng

64 309 0
Nghiên cứu một số phương pháp rút gọn thuộc tính trên bảng quyết định không đầy đủ và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i LỜI CẢM ƠN Em xin chân thành cảm ơn biết ơn sâu sắc đến GS.TS Vũ Đức Thi, Viện Công nghệ thông tin – Đại học Quốc gia Hà Nội Người tận tình hướng dẫn giúp đỡ em hoàn thành luận văn Em xin chân thành cảm ơn Thầy Viện Công nghệ thông tin dạy bảo, giúp đỡ truyền đạt kiến thức cho em suốt khóa học trình em làm luận văn Em xin chân thành cảm ơn Thầy, Cô trường Đại học Công nghệ thông tin truyền thông Thái Nguyên tận tình dạy bảo, động viên, giúp đỡ tạo điều kiện cho em suốt thời gian học tập nghiên cứu Cuối xin chân thành cảm ơn bạn bè, người thân gia đình người đồng hành, động viên, chhia sẻ khó khăn suốt thời gian hoàn thành luận văn Học viên ` Phạm Văn Dương ii LỜI CAM ĐOAN Tôi xin cam đoan đề tài "Nghiên cứu số phương pháp rút gọn thuộc tính bảng định không đầy đủ ứng dụng” công trình nghiên cứu thực hướng dẫn giáo viên hướng dẫn khoa học Một số Định nghĩa, Định lý, Tính chất, Mệnh đề Thuật toán lấy từ nguồn tài liệu xác có trích dẫn tên tài liệu tên tác giả rõ ràng Tôi xin chịu trách nhiệm luận văn Học viên Phạm Văn Dương iii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỤC LỤC iii DANH MỤC CÁC THUẬT NGỮ v BẢNG CÁC KÝ HIỆU, TỪ VIẾT TẮT vi DANH SÁCH BẢNG viii DANH SÁCH HÌNH ix MỞ ĐẦU Chương 1: NHỮNG KHÁI NIỆM CƠ BẢN VỀ CÁC PHƯƠNG PHÁP RÚT GỌN TRONG BẢNG QUYẾT ĐỊNH 1.1 Hệ thông tin đầy đủ mô hình tập thô truyền thống 1.1.1 Hệ thông tin đầy đủ 1.1.2 Mô hình tập thô truyền thống 1.1.3 Bảng định đầy đủ 1.1.4 Tập rút gọn tập lõi 1.1.5 Ma trận phân biệt 1.2 Hệ thông tin không đầy đủ mô hình tập thô dung sai 10 1.2.1 Hệ thông tin không đầy đủ 10 1.2.2 Mô hình tập thô dung sai 14 1.2.3 Bảng định không đầy đủ 17 1.3 Tình hình nghiên cứu phương pháp rút gọn thuộc tính 18 1.3.1 Các phương pháp rút gọn nghiên cứu 18 1.3.2 Mối liên hệ khái niệm tập rút gọn 19 1.3.3 Phân nhóm mối liên hệ phương pháp 21 1.3.4 Luật định bảng định không đầy đủ độ đo cổ điển 22 1.3.5 Các độ đo đánh giá hiệu tập luật tính chất 25 iv 1.3.6 Sự thay đổi giá trị độ đo đánh giá hiệu tập luật định tập rút gọn 27 Chương PHƯƠNG PHÁP RÚT GỌN TRONG BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ 31 2.1 Mở đầu 31 2.2 Entropy Liang mở rộng hệ thông tin không đầy đủ tính chất 31 2.2.1 Entropy Liang mở rộng tập thuộc tính 32 2.2.2 Entropy Liang mở rộng có điều kiện 33 2.2.3 Một số tính chất entropy Liang mở rộng 34 2.3 Rút gọn thuộc tính hệ định không đầy đủ sử dụng ma trận phân biệt hàm phân biệt mở rộng 37 2.4 Thuật toán rút gọn thuộc tính 42 Chương 3: XÂY DỰNG CHƯƠNG TRÌNH THỰC NGHIỆM 45 3.1 Cấu trúc lớp chương trình 45 3.2 Thiết kế phần mềm thực nghiệm 47 3.2.1 Yêu cầu hệ thống 47 3.2.2 Dữ liệu thử nghiệm 47 3.2.3 Chuẩn bị liệu 47 3.2.4 Một số giao diện chương trình 49 3.2.5 Kết thực nghiệm 51 KẾT LUẬN 52 TÀI LIỆU THAM KHẢO 53 PHỤ LỤC Error! Bookmark not defined v DANH MỤC CÁC THUẬT NGỮ Thuật ngữ tiếng Việt Thuật ngữ tiếng Anh Tập thô Rough Set Hệ thông tin Information System Hệ thông tin đầy đủ Complete Information System Hệ thông tin không đầy đủ Incomplete Information System Bảng định Decision Table Bảng định đầy đủ Complete Decision Table Bảng định không đầy đủ Incomplete Decision Table Xấp xỉ Lower Approximation Xấp xỉ Upper Approximation Rút gọn thuộc tính Attribute Reduction Tập rút gọn Reduct Tập lõi Core Ma trận phân biệt Indiscernibility Matrix Hàm phân biệt Indiscernibility Function Quan hệ Relation Tập tối thiểu thuộc tính a Minimal set of the attribute a Họ tập tối thiểu thuộc tính a Family of all minimal sets of attribute a vi BẢNG CÁC KÝ HIỆU, TỪ VIẾT TẮT Ký hiệu, từ viết tắt IS  U , A,V , f  Diễn giải Hệ thông tin, hệ thông tin đầy đủ IIS  U , A,V , f  Hệ thông tin không đầy đủ DS  U , C  D, V , f  Bảng định, bảng định đầy đủ IDS  U , C  D,V , f  Bảng định không đầy đủ U Số đối tượng C Số thuộc tính điều kiện bảng định A Số thuộc tính hệ thông tin u a Giá trị đối tượng u thuộc tính a IND  B  Quan hệ B  không phân biệt SIM  B  Quan hệ dung sai tập thuộc tính B  u B SB  u  Lớp tương đương chứa u quan hệ IND  B  U/B U / SIM  B  Phân hoạch U sinh tập thuộc tính B Phủ U sinh tập thuộc tính B COVER U  Họ tất phủ U  B (u ) Hàm định suy rộng đối tượng u B BX B  xấp xỉ X BX B  xấp xỉ X BN B  X  B - miền biên X POS B  D  B  miền dương D PRED  C  Họ tất tập rút gọn Pawlak SRED  C  Họ tất tập rút gọn sử dụng ma trận phân biệt ERED  C  Họ tất tập rút gọn Entropy Liang MRED  C  Họ tất tập rút gọn dựa metric PCORE  C  Tập lõi dựa miền dương SCORE  C  Tập lõi sử dụng ma trận phân biệt ECORE  C  Tập lõi dựa entropy Liang có điều kiện Lớp dung sai đối tượng u quan hệ SIM  B  vii MCORE  C  Tập lõi dựa metric E  P Entropy Liang tập thuộc tính P E (Q P ) Entropy Liang có điều kiện Q biết P IE  P  Entropy Liang mở rộng tập thuộc tính P hệ thông tin không đầy đủ Entropy Liang mở rộng có điều kiện Q biết P hệ thông tin không đầy đủ IE (Q P) K  P Trong hệ thông tin đầy đủ, ký hiệu K  P  tri thức sinh tập thuộc tính P Trong hệ thông tin không đầy đủ, ký hiệu K  P  phủ sinh tập thuộc tính P d J  K  P  , K Q   Khoảng cách K  P  K  Q  hệ thông tin đầy đủ dựa khoảng cách Jaccard hai tập hợp dE  K  P  , K Q  Khoảng cách K  P  K  Q  hệ thông tin không đầy đủ dựa entropy Liang mở rộng viii DANH SÁCH BẢNG Bảng 1.1 Bảng thông tin bệnh cúm Bảng 1.2 Bảng định bệnh cúm Bảng 1.3 Bảng thông tin xe 13 Bảng 1.4 Bảng định xe 18 Bảng 1.5 Ký hiệu tập rút gọn bảng định không đầy đủ 19 Bảng 2.1 Hệ thông tin không đầy đủ xe 35 Bảng 2.2 Bảng định không đầy đủ tivi 38 ix DANH SÁCH HÌNH Hình 1.1 Mối liên hệ tập rút gọn bảng định không đầy đủ 20 Hình 3.1: Giao diện lớp MaxtrixDiscern 45 Hình 3.2: Giao diện lớp SqlExecute 45 Hình 3.3: Giao diện lớp ImportData 46 Hình 3.4: Giao diện lớp MainForm 46 Hình 3.5 Dữ liệu adult-stretch gốc 48 Hình 3.6 Dữ liệu adult-stretch sau chuyển đổi 49 Hình 3.7 Giao diện chọn tệp liệu 50 Hình 3.8 Kết thử nghiệm với liệu adult-stretch 50 Hình 3.9 Lưu kết rút gọn thành dạng tệp 51 MỞ ĐẦU Những năm trở lại đây, chứng kiến phát triển mạnh mẽ sôi động lĩnh vực nghiên cứu rút gọn thuộc tính sử dụng lý thuyết tập thô Trong xu đó, nhiều nhóm nhà khoa học giới quan tâm nghiên cứu phương pháp rút gọn thuộc tính bảng định Các phương pháp là: Phương pháp dựa miền dương, phương pháp sử dụng phép toán đại số quan hệ, phương pháp sử dụng ma trận phân biệt, phương pháp sử dụng entropy mở rộng, phương pháp sử dụng độ đo tính toán hạt Mục tiêu rút gọn thuộc tính loại bỏ thuộc tính dư thừa để tìm thuộc tính cốt yếu cần thiết sở liệu Với bảng định không đầy đủ rút gọn thuộc tính tìm tập nhỏ tập thuộc tính điều kiện bảo đảm thông tin phân lớp bảng định Đối với bảng định không đầy đủ có nhiều tập rút gọn khác Tuy nhiên, thực hành thường không đòi hỏi tìm tất tập rút gọn mà cần tìm tập rút gọn theo tiêu chuẩn đánh giá đủ Các kết nghiên cứu cho thấy rút gọn thuộc tính làm giảm thiểu đáng kể khối lượng tính toán, nhờ áp dụng toán có khối lượng liệu lớn Nên em lựa chọn đề tài luận văn: “Nghiên cứu số phương pháp rút gọn thuộc tính bảng định không đầy đủ ứng dụng” Mục tiêu luận văn: Tập trung nghiên cứu rút gọn thuộc tính bảng định không đầy đủ Đối tượng phạm vi nghiên cứu: Các bảng định đầy đủ, bảng định không đầy đủ với kích thước trung bình lớn Phương pháp nghiên cứu: 41 ii) Ngược lại, giả sử DIS R   DIS ( A) Theo bổ đề từ R  A ta có M R  M A , kết hợp với DIS R   DIS ( A) suy M R  M A , tồn i0 j0 cho mi0 j0  M R , mi0 j0      (3) mi j  M A mi j  (4) Từ (4) suy 0     0     d u j0   A u i0 Từ (3) suy d u j0   R ui0 Do đó,  R u i0   A u i0 , điều mâu thuẫn với điều kiện  R u    A u  với u  U Vì  R u    A u  với u U DIS R   DIS ( A) Từ i) ii) ta có điều phải chứng minh Phần tiếp theo, tác giả trình bày phương pháp rút gọn thuộc tính hệ định không đầy đủ sử dụng hàm phân biệt mở rộng Giống phương pháp rút gọn thuộc tính lý thuyết tập thô truyền thống, phương pháp tác giả bao gồm bước: định nghĩa tập rút gọn, định nghĩa độ quan trọng thuộc tính xây dựng thuật toán heuristic tìm tập rút gọn tốt dựa độ quan trọng thuộc tính Định nghĩa 2.3 cho thấy, hàm phân biệt mở rộng DIS R  đặc trưng cho khả phân lớp tập thuộc tính R  A vào lớp định sinh thuộc tính d , tác giả sử dụng hàm phân biệt mở rộng làm tiêu chuẩn lựa chọn thuộc tính thuật toán heuristic tìm tập rút gọn, gọi độ quan trọng thuộc tính Định nghĩa 2.8 Cho hệ định không đầy đủ IDS  U, Ad Nếu R  A thỏa mãn: (1) DIS R   DIS ( A) (2) R '  R , DIS R '   DIS ( A) R gọi tập rút gọn IDS dựa hàm phân biệt mở rộng 42 Định nghĩa 2.9 Cho hệ định không đầy đủ IDS  U, Ad , R  A a  A  R Độ quan trọng thuộc tính a tập thuộc tính R định nghĩa SIG Rout a   DIS R  a  DIS R  Định nghĩa 2.10 Cho hệ định không đầy đủ IDS  U, Ad , R  A a  R Độ quan trọng thuộc tính a tập thuộc tính R định nghĩa SIG Rin a   DIS R   DIS R  a Từ Mệnh đề ta có SIGRout a   SIGRin a   Do đó, SIG Rout a  SIG Rin a  tính lượng thay đổi hàm phân biệt mở rộng thêm thuộc tính a vào R loại bỏ a khỏi R SIG Rout a  , SIG Rin a  lớn lượng thay đổi lớn, hay thuộc tính a quan trọng ngược lại Tiếp theo, tác giả đề xuất thuật toán heuristic tìm tập rút gọn tốt theo tiêu chuẩn đánh giá độ quan trọng thuộc tính Ý tưởng thuật toán xuất phát từ tập thuộc tính rỗng R :  , bổ sung vào tập R thuộc tính có độ quan trọng lớn tìm tập rút gọn Thuật toán đề xuất sử dụng chiến lược Thêm - Xóa [13] 2.4 Thuật toán rút gọn thuộc tính Thuật toán Thuật toán heuristic tìm tập rút gọn sử dụng hàm phân biệt mở rộng Đầu vào: Hệ định không đầy đủ IDS  U, Ad Đầu ra: Một tập rút gọn R R   ; // Thêm dần vào R thuộc tính có độ quan trọng lớn nhất; 43 While DIS R   DIS ( A) Begin For each a  A  R tính SIGRout  a   DIS  R  a  DIS  R  ; Chọn a m  A  R cho SIGRout a m   MaxSIG Rout a ; R  R  am  ; a A R End; //Loại bỏ thuộc tính dư thừa R có; For each a  R If DIS  R  a  DIS  R  then R  R  a ; 10 Return R ; Giả sử k số thuộc tính điều kiện n số đối tượng Dễ thấy độ phức tạp để tính M A O  kn  , độ phức tạp tính DIS  A O  kn  Xét vòng lặp While từ dòng lệnh đến dòng lệnh 7, độ phức tạp để tính tất SIGR  a   k   k 1  1 * kn2   k * k 1 / 2 *kn2  O k3n2  Độ phức tạp thời gian để chọn thuộc tính có độ quan trọng lớn k   k  1    k *  k  1 /  O  k  Do đó, độ phức tạp vòng lặp While O  k 3n  Tương tự, độ phức tạp vòng lặp For O  k 2n  Vì vậy, độ phức tạp Thuật toán O  k 3n  Ví dụ 2.5 Xét hệ định không đầy đủ IDS  U, Ad cho Ví dụ 2.2 Áp dụng Thuật toán tìm tập rút gon R ta có: Đặt R   tính: SIGout  a1   DIS a1  DIS     DIS a1  44 SIGout  a2   DIS a2   DIS     DIS a2   SIGout a3   DIS a3   DIS    DIS a3   10 SIGout a   DIS a   DIS    DIS a   Chọn thuộc tính a3 có độ quan trọng lớn R  a3  Từ Ví dụ 2.4 ta có: DIS  A  13 , DIS R   DIS ( A) Chuyển vòng lặp thứ tính: a1   DIS a1 , a3   DIS a3   10  10  SIGaout SIGaout a   DIS a2 , a3   DIS a3   10  10  a   DIS a3 , a   DIS a3   13  10  SIGaout Chọn thuộc tính a4 có độ quan trọng lớn nhất, R  a3 , a4  Ta thấy DIS a3 , a   DIS ( A)  13 , chuyển đến vòng lặp For thực kiểm tra tập R thu Theo tính toán trên, DIS a   DIS ( A) DIS a3   DIS ( A) Do thuật toán kết thúc R  a3 , a4  rút gọn “tốt nhất” A 45 Chương 3: XÂY DỰNG CHƯƠNG TRÌNH THỰC NGHIỆM 3.1 Cấu trúc lớp chương trình Lớp MaxtrixDiscern: lớp chương trình thực toàn nội dung thuật toán rút gọn Lớp tính ma trận phân biệt, hàm phân biệt mở rộng lựa chọn thuộc tính có độ quan trọng Hình 3.1: Giao diện lớp MaxtrixDiscern Lớp SqlExecute: lớp chịu trách nhiệm giao tiếp với sở liệu gồm thao tác thêm, sửa xóa Hình 3.2: Giao diện lớp SqlExecute SqlExecute Class Fields ConnectionStri… Methods ExecuteData ExecuteDataExt… ExecuteNonQu… ExecuteReader PrepareComma… 46 Lớp ImportData: thực nhập liệu từ file text lưu vào sở liệu hỗ trợ cho lớp MaxtrixDiscern tính toán Hình 3.3: Giao diện lớp ImportData ImportData Class Properties nAttrs nRecord Methods CreateTable Import Lớp MainForm: xử lý thao tác liên quan đến giao diện chương trình Hình 3.4: Giao diện lớp MainForm MainForm Class Form Fields Properties fileName Methods backgroundWo… backgroundWo… backgroundWo… backgroundWo… btnExecute_Click btnLoad_Click Dispose InitializeCompo… MainForm 47 3.2 Thiết kế phần mềm thực nghiệm 3.2.1 Yêu cầu hệ thống Chương trình thực nghiệm viết ngôn ngữ C#, sử dụng sở liệu SQL Server Yêu cầu tối thiểu hệ thống sử dụng chương trình: - Cài đặt Net Framework phiên 4.0 trở lên - Cài đặt SQL Server phiên 2005 trở lên (có thể triển khai sở liệu máy chủ từ xa để kết nối với chương trình, không cần cài đặt thành phần này) Phiên Net Framework 4.0 hỗ trợ hệ điều hành Windows XP SP3 trở lên Để cài đặt Windows XP SP2, cần cài đặt thêm phần mở rộng Windows Imaging Component (WIC) trước cài đặt Net Framework 4.0 3.2.2 Dữ liệu thử nghiệm Dữ liệu thực nghiệm lấy từ kho liệu học máy UCI gồm ba bộ: adult-stretch, soybean-small zoo Chi tiết liệu sau: + Bộ adult-stretch: liệu thu thí nghiệm tâm lý học nhận thức gồm thuộc tính 16 ghi + Bộ soybean-small: sở liệu thông tin giống đậu tương gồm 35 thuộc tính 47 ghi + Bộ zoo: liệu chứa 17 thuộc tính 101 ghi phân lớp vật nuôi sở thú 3.2.3 Chuẩn bị liệu Dữ liệu đầu vào chương trình thử nghiệm lưu dạng tệp text có cấu trúc sau: 48  Dòng đầu tiên: Chỉ tên thuộc tính, để thuận tiện lưu trữ vào sở liệu, tên thuộc tính chuyển thành dạng a1,a2, , tên thuộc tính định chuyển thành ‘d’ Các thuộc tính cách kí tự tab  Các dòng tiếp theo: dòng tương ứng với ghi liệu, giá trị rời rạc hóa lưu dạng số nguyên Các giá trị phân cách dấu tab Các giá trị thiếu thay tập giá trị thuộc tính Dưới ví dụ liệu adult-stretch sau chuyển đổi: Hình 3.5 Dữ liệu adult-stretch gốc 49 Hình 3.6 Dữ liệu adult-stretch sau chuyển đổi Các bước chuyển đổi bao gồm:  Chuyển giá trị dạng chữ thành dạng số Ví dụ: với thuộc tính đầu tiên, giá trị ‘YELLOW’ chuyển thành ‘0’ giá trị ‘PURPLE’ chuyển thành giá trị ‘1’  Giá trị thuộc tính chuyển thành a1,a2,a3,a4,d  Đổi kí tự ‘,’ thành kí tự ‘tab’ 3.2.4 Một số giao diện chương trình Giao diện chương trình chia thành phần, phần ‘Nhập liệu từ tệp’: giao diện này, nhấn nút ‘Chọn ’ chọn đến tệp liệu chuẩn bị 50 Hình 3.7 Giao diện chọn tệp liệu Sau liệu đọc thành công, liệu hiển thị lên lưới liệu Nhấn vào nút “Thực hiện” để thực thuật toán hiển thị kết Kết hiển thị phần ‘Kết thực thuật toán’ Hình 3.8 Kết thử nghiệm với liệu adult-stretch 51 Nhấn nút ‘Lưu kết quả’ để lưu liệu sau rút gọn Kết lưu lại thành file text có cấu trúc mô tả mục 3.2.2 Hình 3.9 Lưu kết rút gọn thành dạng tệp 3.2.5 Kết thực nghiệm Dưới kết thử nghiệm với ba liệu sau thực rút gọn: STT Tên Số thuộc liệu tính Số ghi Số thuộc tính sau rút gọn adult-stretch 16 2 soybean-small 37 47 zoo 17 101 Bảng cho thấy kết rút gọn tốt Tuy với trường hợp soybean-small, kết rút gọn sau thu nhỏ Kết hàm ‘khoảng cách’ mà thuật toán áp dụng để tính khoảng cách tập hợp ‘thô’ dựa hai phép toán phép hợp phép giao hai tập dung sai 52 KẾT LUẬN Luận văn thực nghiên cứu xây dựng ứng dụng thực nghiệm thể việc rút gọn thuộc tính bảng định sử dụng ma trận phân biệt hàm phân biệt mở rộng Chương trình rút gọn trường hợp bảng định tập giá trị bảng định thông thường (trường hợp đặc biệt bảng định tập giá tập có giá trị) Hướng phát triển đề tài thực tìm tập rút gọn bảng định liệu thay đổi, thuật toán đề xuất sử dụng chiến lược thêm, loại bỏ thuộc tính 53 TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt [1] Nguyễn Long Giang, Nghiêm Hải Lâm (2008), “Một thuật toán hiệu rút gọn thuộc tính bảng định”, Kỷ yếu hội thảo Một số vấn đề chọn lọc CNTT TT, Huế, tr 257-267 [2] Nguyễn Long Giang, Nguyễn Thanh Tùng (2012), “Một phương pháp rút gọn thuộc tính bảng định sử dụng metric”, Kỷ yếu Hội thảo Quốc gia “Một số vấn đề chọn lọc CNTT TT”, Cần Thơ, 10/2011, Tr 249-266 [3] Nguyễn Thanh Tùng (2010), “Về metric họ phân hoạch tập hợp hữu hạn”, Tạp chí Tin học Điều khiển học, T.26, S.1, tr 73-85 Tài liệu tiếng Anh [4] Andrzej Skowron and Rauszer C (1992), “The Discernibility Matrices and Functions in Information Systems”, Interlligent Decision Support, Handbook of Applications and Advances of the Rough Sets Theory, Kluwer, Dordrecht, pp 331-362 [5] Huasheng ZOU, Changsheng ZHANG, “Efficient Algorithm for Knowledge Reduction in Incomplete Information System”, Journal of Computational Information Systems 8: 6, 2012, pp 2531-2538 [6] Hu X.H and Cercone N (1995), “Learning in relational databases: 54 a rough set approach”, International Journal of computational intelligence, pp 323-338 [7] Kryszkiewicz M (1998), “Rough set approach to incomplete information systems”, Information Science, Vol 112, pp 39-49 [8] Li X.H and Shi K.Q (2006), “A knowledge granulation-based algorithm for attribute reduction under incomplete information systems”, Computer Science, Vol 33, pp 169-171 [9] Nguyen Long Giang, Vu Van Dinh (2013), “Relationships Among the Concepts of Reduct in Incomplete Decision Tables”, Frontiers in Artificial Intelligence and Applications, Volume 252: Advanced Methods and Technologies for Agent and Multi-Agent Systems, IOS Press, pp 417-426 [10] Pawlak Z (1998), “Rough set theory and its applications to data analysis”, Cybernetics and systems 29, pp 661-688 [11] Pawlak Z (1991), Rough sets: Theoretical Aspects of Reasoning About Data, Kluwer Aca-demic Publishers [12] Renpu Li, Dao Huang, “Reducts in incomplete decision tables”, Proceedings of the First international conference on Advanced Data Mining and Applications, ADMA’05, 2005, pp 165-174 [13] Zhou X.Z and Huang B (2003), “Rough set-based attribute reduction under incomplete Information Systems”, Journal of 55 Nanjing University of Science and Technology, Vol 27, pp 630636 [14] Zuqiang Meng, Zhongzhi Shi (2009), “A fast approach to attribute reduction in incomplete decision systems with tolerance relation-based rough sets”, Information Sciences, Vol 179, pp 2774-2793 [...]... tồn tại một tập rút gọn R2 thuộc nhóm 2 và một tập rút gọn R1 thuộc nhóm 1 sao cho R1  R2  R3  Nếu R4 là một tập rút gọn thuộc nhóm 4 thì tồn tại một tập rút gọn R2 thuộc nhóm 2 và một tập rút gọn R1 thuộc nhóm 1 sao cho R1  R2  R4 Dựa vào phân nhóm các tập rút gọn, các phương pháp rút gọn thuộc tính trong bảng quyết định không đầy đủ cũng được phân thành bốn nhóm tương ứng Đế đánh giá tính hiệu... việc rút gọn thuộc tính trên bảng quyết định không đầy đủ Bố cục của luận văn: Gồm phần mở đầu và 3 chương nội dung, phần kết luận, danh mục tài liệu tham khảo và phụ lục Chương 1: Trình bày các khái niệm cơ bản về bảng quyết định đầy đủ, bảng quyết định không đầy đủ, mô hình tập thô truyền thống, mô hình tập thô dung sai, trình bày một số phương pháp rút gọn thuộc tính trong bảng quyết định đầy đủ Chương... niệm tập rút gọn Trong mục này, tác giả tổng kết các kết quả nghiên cứu mối liên hệ giữa các khái niệm tập rút gọn đã của bảng quyết định không đầy đủ nhất quán và không nhất quán trong công trình số [9] Để mô tả một cách ngắn gọn, tác giả ký hiệu các tập rút gọn ở Bảng 3.1 như sau: Bảng 1.5 Ký hiệu các tập rút gọn trong bảng quyết định không đầy đủ Ký hiệu Mô tả tập rút gọn RP Tập rút gọn dựa trên miền... D , d  u  đầy đủ giá trị, nếu tồn tại u  U và c  C sao cho c  u  thiếu giá trị thì DS được gọi là bảng quyết định không đầy đủ, trái lại DS được gọi là bảng quyết định đầy đủ Ta biểu diễn bảng quyết định không đầy đủ là IDS  U , C  D  với d  D, '*' Vd Không mất tính chất tổng quát, giả thiết D chỉ gồm một thuộc tính quyết định duy nhất d  Cho bảng quyết định không đầy đủ IDS  U ,... miền dương R Tập rút gọn dựa trên hàm quyết định suy rộng R Tập rút gọn ấn định RM Tập rút gọn dựa trên ma trận phân biệt RI Tập rút gọn dựa trên lượng thông tin RTM Tập rút gọn dựa trên ma trận dung sai R Tập rút gọn phân bố Trước hết, tác giả tổng kết các kết quả đã công bố về mối liên hệ giữa các khái niệm tập rút gọn trong bảng quyết định không đầy đủ 20 1) Nếu bảng quyết định nhất quán, các... nhau C và D , lần lượt được gọi là tập thuộc tính điều kiện và tập thuộc tính quyết định Tức là DS  U , C  D, V , f  với C  D   Xét bảng quyết định DS  U , C  D, V , f  với giả thiết u  U , d  D , d  u  đầy đủ giá trị DS được gọi là bảng quyết định đầy đủ Trong luận văn này, bảng quyết định đầy đủ được gọi tắt là bảng quyết định Bảng quyết định DS được gọi là nhất quán nếu D phụ thuộc. .. Hàm quyết định suy rộng của các đối tượng trên tập thuộc tính A là  A (u1 )  {Tốt},  A (u2 )  {Tốt},  A (u3 )  {Xấu},  A (u4 )  {Tốt, Tuyệt hảo},  A (u5 )  {Tốt, Tuyệt hảo},  A (u6 )  {Tốt, Tuyệt hảo} Do đó, IDS là bảng quyết định không nhất quán 1.3 Tình hình nghiên cứu các phương pháp rút gọn thuộc tính 1.3.1 Các phương pháp rút gọn đã được nghiên cứu Cho bảng quyết định không đầy đủ IDS... cao Có Bảng này có hai tập rút gọn là R1 = {Đau cơ, Thân nhiệt} và R2 = {Đau đầu, Thân nhiệt} Như vậy tập lõi là PCORE(C) = {Thân nhiệt} và Thân nhiệt là thuộc lõi duy nhất Các thuộc tính không cần thiết bao gồm:  Thuộc tính Mệt mỏi là thuộc tính dư thừa vì không tham gia vào rút gọn nào  Hai thuộc tính Đau đầu và Đau cơ là hai thuộc tính rút gọn vì đều có mặt trong một tập rút gọn Hai thuộc tính này... thừa không xuất hiện trong bất kỳ tập rút gọn nào của bảng quyết định Thuộc tính rút gọn là thuộc tính xuất hiện 8 trong một tập rút gọn nào đó của bảng quyết định Chúng ta sẽ đưa ra các định nghĩa chính xác trong phần tiếp theo Định nghĩa 1.3 [11] (Tập lõi dựa trên miền dương) Cho bảng quyết định DS  U , C  D, V , f  Thuộc tính c  C được gọi là không cần thiết (dispensable) trong DS dựa trên. .. (indispensable) Tập tất cả các thuộc tính cần thiết trong DS được gọi là tập lõi dựa trên miền dương và được ký hiệu là PCORE  C  Khi đó, thuộc tính cần thiết chính là thuộc tính lõi Theo Định nghĩa 1.3, thuộc tính không cần thiết là thuộc tính dư thừa hoặc thuộc tính rút gọn Định nghĩa 1.4 [11] (Tập rút gọn dựa trên miền dương) Cho bảng quyết định DS  U, C  D,V, f  và tập thuộc tính R  C Nếu 1) POS

Ngày đăng: 25/05/2016, 22:45

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan