Phân lớp miền xác định thuộc tính trong bài toán khai phá dữ liệu mờ

63 383 0
Phân lớp miền xác định thuộc tính trong bài toán khai phá dữ liệu mờ

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHÙNG THỊ NGA PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH TRONG BÀI TOÁN KHAI PHÁ DỮ LIỆU MỜ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG PHÙNG THỊ NGA PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH TRONG BÀI TOÁN KHAI PHÁ DỮ LIỆU MỜ Chuyên ngành: Khoa học máy tính Mã số: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Ngƣời hƣớng dẫn khoa học: TS TRẦN THÁI SƠN THÁI NGUYÊN - 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan công trình nghiên cứu riêng dƣới hƣớng dẫn trực tiếp Ts Trần Thái Sơn Mọi trích dẫn sử dụng báo cáo đƣợc ghi rõ nguồn tài liệu tham khảo theo qui định Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, xin chịu hoàn toàn trách nhiệm Thái Nguyên, ngày … tháng … năm 2014 Tác giả Phùng Thị Nga Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Luận văn đƣợc viết dƣới hƣớng dẫn tận tình nghiêm khắc TS Trần Thái Sơn Lời đầu tiên, tác giả xin bày tỏ lòng kính trọng biết ơn sâu sắc tới thầy Xin chân thành gửi lời cảm ơn tới thầy đóng góp quý báu trình nghiên cứu nhƣ thời gian hoàn thành luận văn Tác giả xin chân thành gửi lời cảm ơn đến Phòng Đào tạo sau đại học tạo điều kiện thuận lợi trình học tập, nghiên cứu hoàn thành luận văn, đảm bảo tiến độ Cuối cùng, tác giả xin chân thành cảm ơn thành viên gia đình, ngƣời dành cho tác giả tình cảm nồng ấm sẻ chia lúc khó khăn sống, động viên giúp đỡ tác giả trình nghiên cứu Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT iv DANH MỤC CÁC HÌNH v MỞ ĐẦU CHƢƠNG KHAI PHÁ TRI THỨC VỚI HỆ LUẬT MỜ 1.1 Khai phá tri thức từ sở liệu với hệ luật mờ .4 1.2 Khai phá tri thức theo cách tiếp cận lý thuyết tập mờ 1.2.1 Kiến thức sở tập mờ 1.2.2 Khai phá tri thức với thông tin mờ .6 1.3 Khai phá tri thức theo cách tiếp cận lý thuyết Đại số gia tử .12 1.3.1 Kiến thức sở ĐSGT 12 1.3.2 Khai phá tri thức với thông tin mờ theo cách tiếp cận ĐSGT 15 CHƢƠNG BÀI TOÁN PHÂN CHIA MIỀN XÁC ĐỊNH THUỘC TÍNH 22 2.1 Bài toán phân chia miền xác định thuộc tính .22 2.2 Các phƣơng pháp giải toán phân chia miền xác định thuộc tính 27 2.2.1 Phƣơng pháp tiền định 27 2.2.2 Tối ƣu hóa hàm thuộc MF (Membership functions) 28 CHƢƠNG ĐẠI SỐ GIA TỬ, CÁCH TIẾP CẬN MỚI CHO BÀI TOÁN PHÂN LỚP MIỀN XÁC ĐỊNH THUỘC TÍNH 41 3.1 Giải toán phân chia miền xác định thuộc tính sử dụng khoảng tính mờ giá trị định lƣợng ngữ nghĩa 41 3.2 Thuật toán giải toán phân chia miền xác định thuộc tính theo cách tiếp cận ĐSGT .41 KẾT LUẬN 49 TÀI LIỆU THAM KHẢO 49 PHỤ LỤC: CHƢƠNG TRÌNH TỐI ƢU HÓA THAM SỐ TẬP MỜ .52 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iv DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT Các ký hiệu AX Đại số gia tử tuyến tính AX Đại số gia tử tuyến tính đầy đủ A X2 Đại số gia tử µ(h), fm(x) Độ đo tính mờ gia tử h hạng từ xυ Giá trị định lƣợng theo điểm giá trị ngôn ngữ µA(v) Hàm định lƣợng giá trị ngôn ngữ A (đo độ thuộc v) sm(x,y) Hàm xác định mức độ gần hai hạng từ x y ℑ Khoảng tính mờ giá trị ngôn ngữ Xk Tập hạng từ có độ dài k X(k) Tập hạng từ có độ dài không k Ik Hệ khoảng tính mờ mức k giá trị ngôn ngữ I(k) Hệ khoảng tính mờ từ mức đến mức k giá trị ngôn ngữ Tg Khoảng tƣơng tự bậc g giá trị ngôn ngữ S(k) Hệ khoảng tƣơng tự mức k giá trị ngôn ngữ Các chữ viết tắt CSDL Cơ sở liệu ĐSGT Đại số gia tử ĐS2GT Đại số gia tử ĐLNN Định lƣợng ngữ nghĩa RB Rule-Base FB Fuzzy Base HAFRG Hedge Algebras based Fuzzy Rules Generation Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ v MOGA Thuật giải di truyền đa đối tƣợng NST Nhiễm sắc thể DANH MỤC CÁC HÌNH Hình 1.1 Độ đo tính mờ biến TRUTH 17 Hình 1.2 Khoảng tính mờ hạng từ biến TRUTH 20 Hình 2.1 Lƣới phân hoạch mờ miền thuộc tính 25 Hình 2.2 Phƣơng pháp phân hoạch mờ scatter-partitio 27 Hình 2.3 Tập MF thuộc tính Ij 30 Hình 2.4 Hai dạng không thích hợp MF 30 Hình 3.1 Tập hàm thuộc cho thuộc tính AGE 46 Hình 3.2 Tập hàm thuộc cho thuốc tính Hours 47 Hình 3.3 Tập hàm thuộc cho thuốc tính IncFam 47 Hình 3.4 Tập hàm thuộc cho thuốc tính IncHead 48 Hình 3.5 Tập hàm thuộc cho thuốc tính MARCHWGT 48 DANH MỤC BẢNG BIỂU Bảng 2.1: Dữ liệu mờ từ liệu bảng 36 Bảng 2.2: Cơ sở liệu 36 Bảng 3.1 Cơ sở liệu 44 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ MỞ ĐẦU Lý chọn đề tài Trong lĩnh vực khai phá liệu, khó khăn thƣờng gặp hệ thống phải xử lý khối lƣợng thông tin lớn, đòi hỏi phải có thuật toán hữu hiệu để khai thác tri thức ngầm chứa khối thông tin to lớn Một toán đặt lĩnh vực nghiên cứu cho trƣớc Cơ sở liệu (thƣờng CSDL số, tức giá trị CSDL số thực), từ đó, phƣơng pháp xử lý định, rút hệ tri thức phản ánh quy luật chứa CSDL số Các quy luật biểu diễn dƣới dạng hệ luật IF X is A and Y is B THEN Z is C, X, Y, Z biến mờ (thƣờng biến ngôn ngữ), A, B, C giá trị biến ngôn ngữ (thƣờng tập mờ) Thí dụ luật IF đường xa tốc độ di chuyển trung bình THEN thời gian đến đích lâu Để sinh luật nhƣ vậy, ta phải chuyển hóa miền giá trị thuộc tính “khoảng cách”, “tốc độ”, “thời gian” thành miền mờ, hay nói cách khác phân chia miền giá trị thành miền mờ cho bƣớc xử lý Chẳng hạn, chia miền giá trị thuộc tính độ dài (có giá trị min, max tƣơng ứng chẳng hạn 0km, 200km) thành miền mờ “gần” (0km- 50km), “trung bình” (51km-100km), “xa” (100km-200km) Trong lý thuyết tập mờ, miền mờ nhƣ đƣợc coi tập mờ ứng với hàm thuộc (MF- membership function) nhằm xác định độ “thuộc” giá trị biến vào tập mờ cho Khi đó, giá trị thuộc tính CSDL ứng với tập giá trị hàm thuộc ứng với với tập mờ thuộc tính Và ta xây dựng hệ luật mờ dựa việc xử lý tập giá trị độ thuộc thay xử lý thân giá trị ban đầu CSDL Việc xây dựng MF phân chia miền xác định thuộc tính bƣớc nhƣng quan trọng quy trình xây dựng hệ luật mờ có sở phân chia hợp lý miền xác định thuộc tính ta có tập mờ ngôn ngữ phản ánh Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ tƣơng đối xác ngữ nghĩa định tính nhãn ngôn ngữ dùng hệ luật đƣợc xây dựng tiếp theo.Phƣơng pháp tiếp cận theo lý thuyết tập mờ cho ta cách xử lý liệu mềm dẻo, nhanh chóng so với phƣơng pháp xử lý số cổ điển Tuy vậy, nhiều vấn đề đặt nhƣ việc phân chia miền mờ cho hợp lý, xây dựng đƣợc hàm thuộc nhanh chóng, phù hợp cách xử lý hàm thuộc để giữ đƣợc ngữ nghĩa gắn với chúng Đại số gia tử (ĐSGT) đời dựa cấu trúc thứ tự tốt tập giá trị ngôn ngữ biến ngôn ngữ khắc phục phần điểm yếu Luận văn đặt mục tiêu sử dụng cách tiếp cận ĐSGT việc xác định MF tối ƣu phân chia miền mờ cho thuộc tính CSDL, để xây dựng đƣợc hệ luật mờ tốt bƣớc nhằm giải toán quan tâm lĩnh vực khai phá liệu hay điều khiển mờ Đƣợc đồng ý trƣờng Đại học Công nghệ thông tin Truyền thông với hƣớng dẫn Thầy giáo em xin mạnh dạn nhận đề tài: “Phân lớp miền xác định thuộc tính toán khai phá liệu mờ” làm đề tài luận văn Đối tƣợng phạm vi nghiên cứu Đối tƣợng nghiên cứu luận văn sở liệu đầu vào dùng để khai phá liệu Lý thuyết tập mờ đại số gia tử đƣợc nghiên cứu nhƣ công cụ để giải toán đặt Hƣớng nghiên cứu đề tài Luận văn nghiên cứu phƣơng pháp giải toán phân lớp miền xác định thuộc tính tác giả nƣớc nhƣ giới, ƣu, khuyết điểm phƣơng pháp có nghiên cứu cách giải toán theo cách tiếp cận Đại số gia tử, sử dụng giá trị định lƣợng ngữ nghĩa giá trị biến ngôn ngữ, phân chia miền thuộc tính tiến hành khai phá liệu Phƣơng pháp nghiên cứu Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ Tìm hiểu lý thuyết tập mờ, dạng tập mờ, tìm hiểu cách biểu diễn tập giá trị chân lý ngôn ngữ cho tập mờ Tìm hiểu mối quan hệ dạng biểu diễn tập mờ với hàm định lƣợng ngữ nghĩa đại số gia tử, tìm hiểu cách thức chuyển đổi giá trị chân lý ngôn ngữ thành giá trị số Phân tích, đối sánh, liệt kê, nghiên cứu tài liệu, tổng hợp kết nhà nghiên cứu liên quan đến lĩnh vực nghiên cứu Ý nghĩa khoa học Bài toán phân chia miền xác định thuộc tính nói chung đóng vai trò quan trọng trình khai phá liệu có ý nghĩa ứng dụng rộng lớn, đặc biệt loại toán liên quan đến thông tin mờ ngƣời thƣờng định thông qua thông tin mờ ngôn ngữ Cho đến phƣơng pháp giải toán chủ yếu dựa tập mờ Giải toán phân chia miền xác định thuộc tính theo cách tiếp cận Đại số gia tử cho ta phƣơng pháp tƣơng đối đơn giản nhƣng hữu hiệu cách mà Đại số gia tử nói riêng lý thuyết tập mờ nói chung sử dụng Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 42 chia miền thuộc tính Việc xây dựng hàm thuộc tiến hành nhƣ sau Ta thấy, miền xác định thuộc tính, giá trị số nằm hai giá trị ĐLNN khoảng tính mờ liên tiếp trùng với giá trị ĐLNN khoảng tính mờ tính chất tạo nên phân hoạch miền xác định khoảng tính mờ Nhƣ vậy, khoảng cách giá trị xij tới giá trị ĐLNN dùng để tính độ thuộc xij vào tập mờ đƣợc biểu diễn khoảng tính mờ (trƣờng hợp trùng với giá trị ĐLNN có độ thuộc): khoảng cách nhỏ độ thuộc lớn, trùng coi đạt Cụ thể, ta xây dựng hàm thuộc từ giá trị ĐLNN, tức dựng tam giác biểu diễn hàm thuộc tập mờ với đỉnh có tọa độ (υ(xi),1), hai đỉnh lại nằm miền xác định, có tọa độ tƣơng ứng (υ(xi1),0), (υ(xi+1),0), υ(xi-1), υ(xi), υ(xi+1) giá trị ĐLNN liên tiếp C D B A F G v(x1) v(x2) E v(x3) v(x4) Cách xây dựng hàm thuộc hay tƣơng đƣơng tập mờ để phân chia miền xác định thuộc tính theo cách tiếp cận ĐSGT nhƣ có ƣu điểm sau: a Do cách xây dựng ĐSGT có sở phù hợp với ngữ nghĩa ngƣời cảm nhận nên mặt cảm tính, thấy hàm thuộc đƣợc xây dựng phản ánh tốt ngữ nghĩa tập mờ mà biểu diễn b Dễ thấy độ chồng lấn độ phủ hàm thuộc tốt (độ chồng lấn độ phủ nói chƣơng 2) Từ ta thấy cần tối ƣu độ thích hợp (suitabitity) MF, ta cần tối ƣu usage_factor Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 43 c Các tham số cần quản xây dựng (mỗi tam giác tham số, giá trị ĐLNN), thay đổi tham số ban đầu ĐSGT, dễ dàng có MF MF giữ nguyên độ đo chồng lấn phủ nhƣ cũ Phƣơng pháp vậy, đơn giản hợp lý Với cách xác định hàm thuộc nhƣ trên, ta có hàm thuộc phân chia miền xác định thuộc tính thỏa mãn phần lớn tiêu chí nêu chƣơng trƣớc Việc lại tối ƣu hóa tham số ĐSGT tƣơng ứng để có tập hàm thuộc có tổng độ hỗ trợ 1-thuộc tính phổ biến (usage_factor) lớn Việc đƣợc tiến hành thông qua giải thuật di truyền 3.2 Thuật toán giải toán phân chia miền xác định thuộc tính theo cách tiếp cận ĐSGT Giải thuật di truyền nhằm xây dựng cho thuộc tính CSDL đầu vào tập MF nhằm phân chia tối ƣu miền xác định thuộc tính, tức xây dựng CSDL mờ tối ƣu từ CSDL số ban đầu Trƣớc hết, với thuộc tính định tính CSDL đầu vào, xác định ĐSGT (bằng cách xác định tham số cần có ĐSGT) Với tham số ĐSGT có đƣợc, tính giá trị ĐLNN hạng từ ĐSGT có độ dài không lớn (là độ dài thông thƣờng ta sử dụng) từ xây dựng MF theo cách mô tả mục Tiếp theo, kiểm tra tính tối ƣu hệ tập MF đƣợc xây dựng thông qua hàm tƣơng thích (Fitness Functions), cụ thể kiểm tra tổng độ hỗ trợ tập phổ biến phần tử (1-item frequency sets), tốt giữ lại quần thể Tạo quần thể phép toán di truyền: lai ghép đột biến Lặp lại thuật toán điều kiện dừng thỏa mãn Bài toán phân chia miền xác định thuộc tính với mẫu liệu đƣợc thu thập bao gồm ghi thuộc tính sở liệu số nhƣ sau: Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 44 Bài toán đƣợc chạy thử nghiệm tập CSDL gồm sáu mƣơi năm nghìn ghi Dƣới trình bày 10 ghi tập CSDL Bao gồm thuộc tính: Tuổi, Số làm việc tuần Mức thu nhập gia đình, mức thu nhập cá nhân mức thuế Bảng 3.1 Cơ sở liệu AGE HOURE INCFAM INCHED MARCHWGP 40 40 41344 49158 58387 35 31700 36960 58387 62 27648 27648 53353 59 40 24691 24691 51338 56 40 31025 50050 55785 71 7549 14869 54960 40 46 14052 38044 110540 69 15874 15874 102395 34 48 27507 27507 117408 38 40 23025 36410 112468 Trong toán thực nghiệm này, từ sở liệu số tiến hành phân chia năm thuộc tính (phân chia miền xác định thuộc tính thành miền mờ) mục đích đƣa hàm thuộc tối ƣu Xây dựng đƣợc hàm thuộc tối ƣu Mỗi thuộc tính tìm đƣợc cá thể có độ thuộc tối ƣu Sử dụng phƣơng pháp ĐSGT xây dựng hàm thuộc cách tối ƣu nhƣ sau: Mỗi thuộc tính xác định ĐSGT Khi biết tham số ĐSGT, ta biết giá trị ĐLNN Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 45 3.Xây dựng tam giác MF dựa giá trị ĐLNN nhƣ sau: đỉnh tam giác có giá trị trục tung chân đƣờng cao hạ từ đỉnh giá trị ĐLNN, chân tam giác giá trị ĐLNN hai phía liền kề Bài toán đƣợc đƣợc áp dụng thuật giải khai phá gen mờ đa mục tiêu Thực công việc lựa chọn cá thể, chọn lọc giá trị thích nghi, lai tạo đột biến Cụ thể đƣợc thể qua bƣớc thuật toán Bƣớc 1: Cá thể P đƣợc tạo ngẫu nhiên từ tổng thể ban đầu Tập hợp không thống trị NDS đƣợc thiết lập ban đầu rỗng Trong toán này, P đƣợc thiết lập đến 10 Mỗi cá thể hàm liên thuộc cho phần tử Bƣớc 2: Các giá trị phù hơp tổng số lƣợng tập hợp phần tử tập hợp xác định giá trị hỗ trợ tối thiểu NST đƣợc tính Bƣớc 3: Các bƣớc xếp hạng đƣợc thực thi để xếp hạng 10 NST dựa tiêu chí, suitability(Cq) and totalNumL1, nhƣ sau: Bƣớc 4: Các giá trị tƣơng ứng NST đƣợc tính dựa giá trị thứ hạng Bƣớc 5: giá trị tƣơng ứng trung bình NST với thứ hạng tƣơng đƣơng đƣợc tính toán Bƣớc 6: Các NST với giá trị thứ hạng đƣợc chép vào tập hợp không thống trị NDS Đó là, NDS = {C2, C3, C5, C7, C10 } Bƣớc đến 10: Các hoạt động xuyên chéo đột biến đƣợc thực thi tổng thể hoạt động xuyên chéo MMa hoạt động đột biến onepoint đƣợc sử dụng để tạo hệ Giá trị tƣơng ứng NST đƣợc tính bƣớc đến Các hoạt động đƣợc chọn dùng tập hợp không thống trị NDS để chọn cá thể thích hợp cho hệ Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 46 Bƣớc 10 đến 14: Nếu tiêu chí chấm dứt không phù hợp, trở bƣớc 6, ngƣợc lại, NST tập hợp không thống trị output nhƣ tập hợp hàm liên thuộc cho việc suy luật liên kết mờ cho tập hợp hàm liên thuộc Hình 3.1 Tập hàm thuộc cho thuộc tính AGE Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 47 Hình 3.2 Tập hàm thuộc cho thuốc tính Hours Hình 3.3 Tập hàm thuộc cho thuốc tính IncFam Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 48 Hình 3.4 Tập hàm thuộc cho thuốc tính IncHead Hình 3.5 Tập hàm thuộc cho thuốc tính MARCHWGT Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 49 KẾT LUẬN Luận văn đạt đƣợc số kết nhƣ sau: 1) Giải toán phân chia miền xác định thuộc tính theo cách tiếp cận ĐSGT Chia miền xác định thuộc tính thành miền mờ có nhiều ƣu điểm nhƣ tính đơn giản, gắn chặt ngữ nghĩa so với cách tiếp cận theo lý thuyết tập mờ cổ điển L.Zadeh 2) Tối ƣu hàm thuộc dựa phƣơng pháp phân chia hàm thuộc có dạng thống phƣơng pháp phân chia ràng buộc động từ tập sở liệu số chuẩn Hệ tối ƣu đa mục tiêu 3) Xây dựng CSDL mờ theo chu trình lặp để có hệ luật mờ tối ƣu Từ CSDL số, xây dựng CSDL mờ, Xây dựng hệ luật mờ lại quay lại bƣớc xây dựng CSDL mới, xây dựng luật mờ tối ƣu Quá trình đƣợc lặp lặp lại dựa thuật toán di truyền 4) Cài đặt chƣơng trình CSDL số mẫu đƣa đƣợc tập hàm thuộc cho thuộc tính tối ƣu tham số mờ Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 50 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Cát Hồ, Nguyễn Văn Long, "Đại số gia tử tuyến tính", Tạp chí Tin học Điều khiển học, T.19(3)(2003), 274-280 [2] Nguyễn Cát Hồ, Trần Thái Sơn, Dƣơng Thăng Long, “Tiếp cận đại số gia tử cho phân lớp mờ”, Tạp chí Tin học Điều khiển học, Tập 25(1), 2009, 53-68 [3] Nguyễn Cát Hồ, Trần Thái Sơn, Dƣơng Thăng Long, Trần Duy Hùng, “Phƣơng pháp tối ƣu Pareto hệ luật mờ dựa đại số gia tử sử dụng giải thuật di truyền ứng dụng vào toán phân lớp”, Tạp chí Tin học Điều khiển học, Tập 26(2), (2010), 103-117 [4] Dƣơng Thăng Long (2010), Phương pháp xây dựng hệ mờ dạng luật với ngữ nghĩa dựa đại số gia tử ứng dụng toán phân lớp, Luận án Tiến sĩ Toán học, Viện công nghệ thông tin [5] Trần Thái Sơn, Đỗ Nam Tiến, Phạm Đình Phong, “Luật kết hợp theo cách tiếp cận Đại số gia tử”, Tạp chí Tin học Điều khiển học, 27(4), 2011 [6] Trần Thái Sơn, “Lập luận xấp xỉ với giá trị biến ngôn ngữ”, Tạp chí Tin học Điều điều khiển, 15(2) 1999-6-10 Tiếng Anh [7] C Chen, T Hong, Vincent S T and L Chen, Multi-objective geneticfuzzy data mining International Journal of Innovative Computing, Information and Control Volume 8, Number 10(A), October 2012 [8] Nguyen Cat Ho, Tran Thai Son, Tran Dinh Khang, Le Xuan Viet, Fuzziness Measure, Quantified Semantic Mapping And Interpolative Method of Approximate Reasoning in Medical Expert Systems, J.of Computer Science and Cybernetic, T.18(3)(2002), 237-252 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 51 [9] L.A.Zadeh, The concept of linguistic variable and its application to approximate reasoning Inform Sci (I) (1975) 199-249; (II) (1975) 310 -357; (III) (1975) 43-80 [10] Kevin L and Olivier S (2006), “Fuzzy Histograms and Density Estimation” advances in Soft Computing, Springer Berlin, ISSN 16153871, pp.45-52 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 52 PHỤ LỤC: CHƢƠNG TRÌNH TỐI ƢU HÓA THAM SỐ TẬP MỜ clear all global alpha_Array global w_Array global minsupp minsupp=0.2; start_time = cputime; loop_time = start_time; generation=200; popsize=100; nst=10; bit=10; vlb=0.2; % kich thuoc cua mot nhiem sac the % GTNN cua nst vub=1-vlb; Pc=0.8; Pm=0.002; % GTLN cua nst % xac suat lai % xac suat dot bien % Read data from file dataBase = dlmread('data\data_Full.txt',','); = [0,0,-20000,-40000,0]; max = [100,100,350000,1300000,1300000]; dataBase = ConvertTo01(dataBase, min, max); % -% Tinh xem chay dc bao nhieu vong lap repeat_num = 0; % Tong so vong lap repeat_num_sum = generation*popsize+popsize; Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 53 %% Khoi tao quan the for i=1:popsize for j=1:nst CaThe(i).gen(j).gen=round(rand(1,bit)); end end %% Giai thuat di truyen for i=1:generation %% Chon loc % Gia tri thich nghi (dtn) for j=1:popsize loop_time = cputime; repeat_num = repeat_num+1; fprintf(' So lan lap = %d \n', repeat_num); fprintf(' Tien trinh = %f %% \n', (repeat_num/repeat_num_sum)*100); % -for k=1:nst if(k[...]... (c+), µ(h) h ∈ H CHƢƠNG 2 BÀI TOÁN PHÂN CHIA MIỀN XÁC ĐỊNH THUỘC TÍNH 2.1 Bài toán phân chia miền xác định thuộc tính Trong quá trình giải quyết các bài toán có liên quan đến xây dựng hệ luật mờ (1.1), có hai công đoạn tuy liên quan với nhau nhƣng có thể coi nhƣ xử lý tách biệt Công đoạn thứ nhất là là từ CSDL số tiến hành phân chia miền xác định của các thuộc tính thành các miền mờ Việc này tƣơng đƣơng... giá trị số xij (là giá trị thuộc cột i, tức thuộc tính Ai và hàng j trong CSDL) sẽ nhận một tập các giá trị tƣơng ứng là độ thuộc của xij vào các miền mờ Ri1, Ri2, , Rik phân chia thuộc tính Ai Thí dụ, ta có thuộc tính “TUỔI” Có thể chia miền xác định của thuộc tính “TUỔI” (miền xác định là [0,150] ) thành 3 (k=3) miền mờ có nhãn là “Trẻ”, “Trung niên” và “Già” (tƣơng ứng xác định 3 MF là μTrẻ, μTrungniên... xây dựng các hàm thuộc (MF) cho thuộc tính vì mỗi miền mờ của thuộc tính đƣợc xác định thông qua hàm thuộc MF Khi xác định đƣợc xong tất cả các Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 23 MF, mỗi giá trị số của CSDL sẽ nhận một tập các giá trị là độ thuộc của giá trị đó vào các miền mờ đã xây dựng của thuộc tính Cụ thể, thuộc tính Ai có thể đƣợc phân thành k miền mờ (thông thƣờng,... phƣơng pháp điều chỉnh tham số mờ cho hệ mờ Hình vẽ 1.6 minh họa phƣơng pháp scatter-partition Trong đó, trên miền của mỗi thuộc tính sẽ chọn các giá trị ngôn ngữ cùng với hàm thuộc tƣơng ứng dựa trên sự phân tán của dữ liệu Chẳng hạn hình chữ nhật tô màu chứa các dữ liệu với phân hoạch bởi các hàm thuộc dạng tam giác có màu tƣơng ứng trên x1x2 Rõ ràng phƣơng pháp giải bài toán phân lớp mờ phụ thuộc. .. tập mờ cho các giá trị ngôn ngữ để phân hoạch trên miền của các thuộc tính cũng nhƣ số lƣợng các giá trị ngôn ngữ, phƣơng pháp lựa chọn, xác định các luật mờ từ không gian các siêu hộp HS để đạt các mục tiêu trong (1.4) Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 27 Hình 2.2 Phương pháp phân hoạch mờ scatter-partitio 2.2 Các phƣơng pháp giải bài toán phân chia miền xác định thuộc tính. .. h1c , {-,+}, dễ dàng tính đƣợc độ đo tính mờ của x nhƣ sau: fm(x) = µ(hn) µ(h1)fm(c ) Hình 1.1 Độ đo tính mờ của biến TRUTH Với ĐSGT, các khoảng tính mờ của tập các phần tử có cùng độ dài sẽ tạo nên một phân hoạch trên miền xác định của thuộc tính Các khoảng tính mờ này có độ dài tƣơng ứng với độ đo tính mờ của từng phần tử Ngoài ra, các khoảng tính mờ này đƣợc sắp xếp trên miền xác định theo thứ tự tự... Cho bài toán phân lớp với tập mẫu có thuộc tính X1, X2 và hai lớp {C1, C2} biểu thị bằng chấm tròn và vuông (Hình 1.5) Theo phƣơng pháp grid-partition, phân hoạch mờ trên miền của 2 thuộc tính thành các tập mờ dạng tam giác tƣơng ứng với giá trị ngôn ngữ là {S(small), M(medium), L(large)} sẽ tạo thành một lƣới phân hoạch mờ nhƣ Hình vẽ 1.3 Hình 2.1 Lưới phân hoạch mờ trên miền của 2 thuộc tính Lƣới phân. .. định thuộc tính Trong mục này, luận văn sẽ đi sâu hơn trình bày cụ thể hai nhóm phƣơng pháp chính trong việc xây dựng các hệ luật mờ, phƣơng pháp tiền định - xây dựng CSDL mờ và hệ luật mờ tách biệt và phƣơng pháp tối ƣu hóa các hàm thuộc - xây dựng hệ luật mờ đồng thời với việc tối ƣu hóa các hàm thuộc 2.2.1 Phương pháp tiền định Trong nhóm phƣơng pháp này, miền xác định thuộc tính đƣợc phân chia trƣớc,... CHƢƠNG 1 KHAI PHÁ TRI THỨC VỚI HỆ LUẬT MỜ 1.1 Khai phá tri thức từ cơ sở dữ liệu với hệ luật mờ Từ nhu cầu cần xử lý một khối lƣợng thông tin lớn đặc biệt đối tƣợng thông tin chỉ mang tính định tính hay còn gọi là thông tin mờ thông thƣờng ngƣời ta có thể chọn các cách tiếp cận theo lý thuyết tập mờ, xác suất thống kê Trong thực tế khái niệm mờ luôn tồn tại, hiện hữu trong các bài toán, trong cách... cho từng bài toán, chẳng hạn bài toán phân lớp đầu ra là lớp mà giá trị đầu vào cần thuộc, bài toán hồi quy thì đầu ra là số thực mà giá trị đầu vào cần nhận đƣợc ) Đối với tập dữ liệu mẫu của bài toán phân lớp đƣợc cho dƣới dạng số, tức là U ⊂ Rn, thì việc xây dựng một hệ luật mờ S thƣờng gồm hai bƣớc sau: [3] (Bước 1) Phân hoạch mờ (fuzzy partition) trên miền của các thuộc tính bằng tập các giá trị ... CHƢƠNG BÀI TOÁN PHÂN CHIA MIỀN XÁC ĐỊNH THUỘC TÍNH 22 2.1 Bài toán phân chia miền xác định thuộc tính .22 2.2 Các phƣơng pháp giải toán phân chia miền xác định thuộc tính 27 2.2.1 Phƣơng pháp... đầy đủ vào tham số mờ gia tử fm (c-), fm (c+), µ(h) h ∈ H CHƢƠNG BÀI TOÁN PHÂN CHIA MIỀN XÁC ĐỊNH THUỘC TÍNH 2.1 Bài toán phân chia miền xác định thuộc tính Trong trình giải toán có liên quan... SỐ GIA TỬ, CÁCH TIẾP CẬN MỚI CHO BÀI TOÁN PHÂN CHIA MIỀN XÁC ĐỊNH THUỘC TÍNH 3.1 Giải toán phân chia miền xác định thuộc tính sử dụng khoảng tính mờ giá trị định lƣợng ngữ nghĩa Với kết nhận

Ngày đăng: 20/01/2016, 09:09

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan