Nghiên cứu một số phương pháp rút gọn thuộc tính trong bảng quyết định không đầy đủ

82 514 0
Nghiên cứu một số phương pháp rút gọn thuộc tính trong bảng quyết định không đầy đủ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG NGUYỄN QUỲNH LAN NGHIÊN CỨU MỘT SỐ PHƢƠNG PHÁP RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ Chuyên ngành: Khoa học máy tính LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên, 2013 Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ LỜI CẢM ƠN Em xin chân thành cảm ơn và biết ơn sâu sắc đến GS.TS Vũ Đức Thi, Viện Công nghệ Thông tin, Viện Khoa học và Công nghệ Việt Nam. Ngƣời đã tận tình dày công hƣớng dẫn và giúp đỡ em hoàn thành luận văn này. Em xin chân thành cảm ơn các Thầy ở Viện Công nghệ Thông tin đã dạy bảo, giúp đỡ và truyền đạt kiến thức cho em trong suốt khóa học, trong suốt cả quá trình em làm luận văn. Em xin chân thành cảm ơn các Thầy, các Cô ở trƣờng Đại học Công nghệ Thông tin và Truyền thông Thái Nguyên đã động viên, giúp đỡ và tạo điều kiện cho em trong suốt thời gian học tập và nghiên cứu. Cuối cùng xin chân thành cảm ơn bàn bè, ngƣời thân và gia đình luôn là ngƣời đồng hành, động viên, chia sẻ những khó khăn trong suốt thời gian hoàn thành luận văn. Thái Nguyên, tháng 08 năm 2013 Nguyễn Quỳnh Lan Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ LỜI CAM ĐOAN Tôi xin cam đoan luận văn này là sản phẩm tìm hiểu, nghiên cứu của mình. Một số Định nghĩa, Định lý, Tính chất, Mệnh đề và Thuật toán tôi lấy từ nguồn tài liệu chính xác có trích dẫn tên tài liệu và tên tác giả rõ ràng. Tôi xin chịu trách nhiệm về luận văn của mình. Học viên Nguyễn Quỳnh Lan i Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ MỤC LỤC MỤC LỤC i Danh mục các thuật ngữ iii Bảng các ký hiệu, từ viết tắt iv Danh sách bảng v MỞ ĐẦU 1 Chƣơng 1. TỔNG QUAN VỀ BẢNG QUYẾT ĐỊNH ĐẦY ĐỦ VÀ BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ 3 1.1. Bảng quyết định đầy đủ 3 1.2. Hệ thông tin 3 1.3. Hệ thông tin đầy đủ và mô hình tập thô truyền thống 3 1.3.1. Hệ thông tin đầy đủ 3 1.3.2. Mô hình tập thô truyền thống 5 1.3.3. Tập rút gọn và tập lõi 7 1.4. Hệ thông tin không đầy đủ và mô hình tập thô dung sai 9 1.4.1. Hệ thông tin không đầy đủ 9 1.4.2. Bảng quyết định không đầy đủ 11 1.4.3. Tập rút gọn của bảng quyết định không đầy đủ 11 1.5.Rút gọn thuộc tính trong bảng quyết định đầy đủ sử dụng metric 12 1.5.1. Metric trên họ các tri thức và tính chất 12 1.5.1.1. Khoảng cách Jaccard giữa hai tập hợp hữu hạn 12 1.5.1.2. Metric trên họ các tri thức 14 1.5.1.3. Một số tính chất của metric trên bảng quyết định 15 1.5.2. Rút gọn thuộc tính trong bảng quyết định sử dụng metric 18 ii Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 1.5.2.1.Tập lõi và tập rút gọn của bảng quyết định dựa trên metric……….…… 18 1.5.2.2.Thuật toán tìm tập rút gọn của bảng quyết định sử dụng metric 19 1.6 Kết luận chƣơng 1…………………………………………………………… 27 Chƣơng 2.RÚT GỌN THUỘC TÍNH TRONG BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ….28 2.1 Giới thiệu 28 2.2. Entropy Liang mở rộng trong hệ thông tin không đầy đủ và các tính chất… …… 29 2.2.1. Entropy Liang mở rộng của tập thuộc tính 29 2.2.2. Entropy Liang mở rộng có điều kiện 30 2.2.3. Một số tính chất của entropy Liang mở rộng 32 2.3. Metric trên họ các phủ và các tính chất 37 2.3.1. Metric trên họ các phủ 37 2.3.2. Một số tính chất chất của metric 40 2.4. Rút gọn thuộc tính trong bảng quyết định không đầy đủ sử dụng metric……… … 43 2.4.1 Tập rút gọn của bảng quyết định không đầy đủ dựa trên metric 43 2.4.2.Thuật toán tìm tập rút gọn của bảng quyết định không đầy đủ 44 2.5. Kết luận chƣơng 2 52 Chƣơng 3. CHƢƠNG TRÌNH THỬ NGHIỆM 53 3.1 Mô tả dữ liệu 53 3.2 Xây dựng chƣơng trình 57 3.3 Kết quả thực nghiệm 59 3.4 Nhận xét 60 KẾT LUẬN 61 TÀI LIỆU THAMKHẢO………………………………………………………………….62 PHỤ LỤC………………………………………………………………………… 64 iii Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ Danh mục các thuật ngữ Thuật ngữ tiếng việt Thuật ngữ tiếng anh Tập thô Rough set Hệ thông tin Information system Hệ thông tin đầy đủ Complete Information system Hệ thông tin không đầy đủ Incomplete Information system Bảng quyết định Decision Table Bảng quyết định đầy đủ Complete Decision Table Bảng quyết định không đầy đủ Incomplete Decision Table Quan hệ không phân biệt đƣợc Indiscernibility Relation Xấp xỉ dƣới Lower Approximation Xấp xỉ trên Upper Lower Approximation Rút gọn thuộc tính Attribute Reduction Tập rút gọn Reduct Tập lõi Core Ma trận phân biệt Indiscernibility Matrix Hàm phân biệt Indiscernibility Function [...]... Tập rút gọn của bảng quyết định không đầy đủ Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/ 13 Trong [6], Marzena Kryszkiewic định nghĩa tập rút gọn của bảng quyết định không đầy đủ, là tập con tối thiểu của tập thuộc tính điều kiện mà bảo toàn hàm quyết định suy rộng của tất cả các đối tƣợng Định nghĩa 1.8 [6] (Tập rút gọn của bảng quyết định không đầy đủ) Cho bảng quyết định không đầy đủ. .. Tập rút gọn và tập lõi Trong bảng quyết định, các thuộc tính điều kiện đƣợc phân thành 3 nhóm: thuộc tính lõi (core attribute), thuộc tính rút gọn (reductive attribute) và thuộc tính dƣ thừa (redundant attribute) Thuộc tính lõi là thuộc tính không thể thiếu trong việc phân lớp chính xác tập dữ liệu Thuộc tính lõi xuất hiện trong tất cả các tập rút gọn của bảng quyết định Thuộc tính dƣ thừa là những thuộc. .. tính mà việc loại bỏ chúng không ảnh hƣởng đến việc phân lớp tập dữ liệu, thuộc tính dƣ thừa không xuất hiện trong bất kỳ rút gọn nào của bảng quyết định Thuộc tính rút gọn là thuộc tính xuất hiện trong một tập rút gọn nào đó của bảng quyết định Định nghĩa 1.3 (Tập lõi dựa trên miền dương) Cho bảng quyết định DS = (U, C∪D, V,f) Thuộc tính c∈C đƣợc gọi là không cần thiết (dispensable) trong DS dựa Số. .. Chƣơng 1 TỔNG QUAN VỀ BẢNG QUYẾT ĐỊNH ĐẦY ĐỦ VÀ BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ 1.1 Bảng quyết định đầy đủ Một lớp đặc biệt của hệ thông tin có vai trò quan trọng trong nhiều ứng dụng là bảng quyết định Bảng quyết định là một hệ thông tin DS với tập thuộc tính A đƣợc chia thành hai tập khác rỗng rời nhau C và D, lần lƣợt đƣợc gọi là tập thuộc tính điều kiện và tập thuộc tính quyết định Tức là DS = (U,... u2,u4, u5,u6} 1.4.2 Bảng quyết định không đầy đủ Nhƣ đã trình bày ở trên với bảng quyết định DS = (U, C∪D,V,f), nếu tồn tại u∈U và c∈C sao cho c(u) thiếu gái trị thì DS đƣợc gọi là bảng quyết định không đầy đủ Ta biểu diễn giá trị thiếu là „*‟ và bảng quyết định không đầy đủ là IDS=(U, C∪D,V, f) với mọi d∈D, „*‟ Vd Không mất tính chất tổng quát, giả thiết D chỉ gồm một thuộc tính quyết định duy nhất {d}... Có Bảng này có hai tập rút gọn là R1={Đau cơ, Thân nhiệt}, R2={Đau đầu, thân nhiệt} Nhƣ vậy tập lõi là PCORE (C)={Thân nhiệt} và Thân nhiệt là thuộc lõi duy nhất Các thuộc tính không cần thiết bao gồm: +Thuộc tính Mệt mỏi là thuộc tính dƣ thừa vì không tham gia vào rút gọn nào +Hai thuộc tính Đau đầu và Đau cơ là hai thuộc tính rút gọn vì đều có mặt trong một tập rút gọn Hai thuộc tính này đều không. .. C∩D= Xét bảng quyết định DS = (U, C∪D, V, f) với giả thiết mọi u∈U, mọi d∈D, d(u) đầy đủ giá trị, nếu tồn tại u∈U và c∈C sao cho c(u) thiếu giá trị thì DS đƣợc gọi là bảng quyết định không đầy đủ, trái lại DS đƣợc gọi là bảng quyết định đầy đủ Trong luận văn này, bảng quyết định đầy đủ đƣợc gọi tắt là bảng quyết định 1.2 Hệ thông tin Hệ thông tin là công cụ biểu diễn tri thức dƣới dạng 1 bảng dữ liệu... (indispensable) Tập tất cả các thuộc tính cần thiết trong DS đƣợc gọi là tập lõi dựa trên miền dƣơng và đƣợc ký hiệu là PCORE (C) Khi đó, thuộc tính cần thiết chính là thuộc tính lõi Theo Định nghĩa 1.3 thuộc tính không cần thiết đƣợc gọi là thuộc tính dƣ thừa hoặc thuộc tính rút gọn Định nghĩa 1.4 (Tập rút gọn dựa trên miền dương) Cho bảng quyết định DS=(U, C∪D, V, f) Và tập thuộc tính R⊆C Nếu: 1) POSR (D)=POSC... (D) Thì R là một tập rút gọn của C dựa trên miền dƣơng Tập rút gọn định nghĩa nhƣ trên còn gọi là tập rút gọn Pawlak Ký hiệu PRED(C) là họ tất cả các tập rút gọn Pawlak của C Khi đó PCORE (C) =  R R PRED ( C ) Định nghĩa 1.5 Cho bảng quyết định DS = (U, C∪D, V, f) Và a∈C Ta nói rằng a là thuộc tính rút gọn của DS nếu tồn tại 1 tập rút gọn R∈PRED(C) sao cho a∈R Định nghĩa 1.6 Cho bảng quyết định DS =... C∪D, V, f) và tập thuộc tính R⊆C Nếu: 1) R(u)= C(u) với mọi u∈U 2) Với mọi R‟ R, tồn tại u∈U sao cho R‟(u)≠ C(u) Thì R đƣợc gọi là một tập rút gọn của C.Tập rút gọn định nghĩa nhƣ trên còn gọi là tập rút gọn Kryszkiewic 1.5 Rút gọn thuộc tính trong bảng quyết định đầy đủ sử dụng metric Các kết quả trong phần này đƣợc tìm hiểu trong tài liệu [3] 1.5.1 Metric trên họ các tri thức và các tính chất 1.5.1.1 . không đầy đủ 9 1.4.2. Bảng quyết định không đầy đủ 11 1.4.3. Tập rút gọn của bảng quyết định không đầy đủ 11 1.5 .Rút gọn thuộc tính trong bảng quyết định đầy đủ sử dụng metric 12 1.5.1 ĐẦU 1 Chƣơng 1. TỔNG QUAN VỀ BẢNG QUYẾT ĐỊNH ĐẦY ĐỦ VÀ BẢNG QUYẾT ĐỊNH KHÔNG ĐẦY ĐỦ 3 1.1. Bảng quyết định đầy đủ 3 1.2. Hệ thông tin 3 1.3. Hệ thông tin đầy đủ và mô hình tập thô truyền. các tính chất 37 2.3.1. Metric trên họ các phủ 37 2.3.2. Một số tính chất chất của metric 40 2.4. Rút gọn thuộc tính trong bảng quyết định không đầy đủ sử dụng metric……… … 43 2.4.1 Tập rút gọn

Ngày đăng: 26/02/2015, 01:33

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan