Một số độ đo mức tương tự giữa các tập mờ trực cảm (vague sets), thử nghiệm trong phân cụm dữ liệu

61 326 0
Một số độ đo mức tương tự giữa các tập mờ trực cảm (vague sets), thử nghiệm trong phân cụm dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i LỜI CAM ĐOAN Tôi xin cam đoan kết nêu luận văn kết tìm hiểu, nghiên cứu hướng dẫn Thầy giáo PGS.TS: Nguyễn Tân Ân Mọi trích dẫn sử dụng báo cáo ghi rõ nguồn tài liệu tham khảo theo quy định Vũ Thị Lành ii MỤC LỤC LỜI CAM ĐOAN i MỤC LỤC ii LỜI CẢM ƠN iv DANH MỤC HÌNH v MỞ ĐẦU CHƯƠNG I: TẬP MỜ VÀ TẬP MỜ TRỰC CẢM 1.1 Tập mờ 1.1.1 Định nghĩa tập mờ 1.1.2 Các phép toán tập mờ 1.1.3 Khoảng cách tập mờ 10 1.2 Tập mờ trực cảm ( Intuitionistic Fuzzy Sets - IFSs) 11 1.2.1 Định nghĩa tập mờ trực cảm 11 1.2.2 Một số phép toán tập mờ trực cảm hình thang 11 1.2.3.Các phép toán số mờ trực cảm hình thang, hình tam giác 13 Kết luận chương 1: 14 CHƯƠNG II ĐỘ TƯƠNG TỰ GIỮA CÁC TẬP MỜ TRỰC CẢM 16 2.1 Khoảng cách tập mờ trực cảm 16 2.1.1 Khoảng cách S C ( A, B ) 16 2.1.2 Khoảng cách S H S L 19 2.1.3 Khoảng cách SO 21 2.2 Độ đo mức tương tự 21 2.2.1 Độ đo mức tương tự dựa khoảng cách 22 2.2.2 Độ đo mức tương tự dựa lý thuyết tập hợp 26 2.2.3 Độ đo mức tương tự dựa hàm xác định mức phù hợp 26 Kết luận chương 2: 27 CHƯƠNG III THỬ NGHIỆM MỘT SỐ ĐỘ ĐO MỨC ĐỘ TƯƠNG TỰ TRONG BÀI TOÁN PHÂN CỤM 28 iii 3.1 Bài toán phân cụm 28 3.1.1 Phân cụm ứng dụng 28 3.1.2 Một số phương pháp phân cụm 28 3.2 Thử nghiệm số độ đo mức tương tự phân cụm 47 3.2.1 Ngôn ngữ lập trình 47 3.2.2 Biểu diễn liệu sinh viên nhờ tập mờ trực cảm 47 3.2.3 Giao diện hướng dẫn sử dụng chương trình 48 3.2.4 Thử nghiệm phân cụm liệu sinh viên trường Đại học Hoa Lư 49 3.2.5 So sánh kết phân cụm trường hợp sử dụng độ đo mức tương tự khác 50 KẾT LUẬN 54 TÀI LIỆU THAM KHẢO 55 iv LỜI CẢM ƠN Trước hết, xin chân thành cảm ơn Thầy cô Trường Đại học Công nghệ Thông tin & Truyền thông, đặc biệt Thầy cô tận tình giảng dạy suốt trình học tập trường Tôi xin gửi lời biết ơn sâu sắc đến Thầy giáo PGS.TS Nguyễn Tân Ân, Thầy hướng dẫn, dành nhiều thời gian tâm huyết hướng dẫn nghiên cứu suốt thời gian qua Tôi xin chân thành cảm ơn đồng nghiệp nhóm tin Trường Đại học Hoa Lư tạo điều kiện mặt thời gian để hoàn thành chương trình học bảo vệ Luận văn Tốt nghiệp Cuối cùng, xin gửi lời cảm ơn tới người thân gia đình tôi, bạn bè động viên, khích lệ trình học tập nghiên cứu Mặc dù có nhiều cố gắng hoàn thành luận văn cách tốt nhất, nhiên lực nhiều hạn chế nên tránh khỏi thiếu sót Vì vậy, mong nhận đóng góp quý báu thầy cô bạn Thái Nguyên, ngày 14 tháng năm 2014 Học viên Vũ Thị Lành v DANH MỤC HÌNH Trang Hình 1.1 Đồ thị biểu diễn hàm thuộc Hình 1.2 Đồ thị biểu diễn phép giao Hình 1.3 Đồ thị biểu diễn phép hợp Hình 1.4: Số mờ trực cảm hình thang 14 Hình 1.5: Số mờ trực cảm tam giác 14 Hình 3.1 Minh họa nguyên tắc thuật toán phân cụm K-means 30 Hình 3.2 Lân cận p với ngưỡng Eps 32 Hình 3.3 Mật độ - đến trực tiếp 33 Hình 3.4 Mật độ - đến 33 Hình 3.5 Mật độ - liên thông 34 Hình 3.6 Cụm Nhiễu 34 Hình 3.7 Các cụm liệu tìm thuật toán CURE 36 Hình 3.8 Mô hình biểu diễn liệu sinh viên 48 Hình 3.9 Giao diện chương trình 48 Hình 3.10 Giao diện trước phân cụm 49 Hình 3.11 Giao diện sau phân cụm 50 Hình 3.12 Biểu đồ phân cụm áp dụng độ đo khoảng cách 51 Hình 3.13 Biểu đồ phân cụm áp dụng độ đo lý thuyết tập hợp 51 Hình 3.14 Biểu đồ phân cụm áp dụng độ đo hàm xác định 52 MỞ ĐẦU Đặt vấn đề: Độ đo mức tương tự có ý nghĩa quan trọng khai phá liệu, tìm kiếm thông tin phát tri thức Trong trường hợp không đủ thông tin thông tin đối tượng không rõ ràng ta khó xác định mức tương tự đối tượng Lý thuyết tập mờ L Zadeh đưa năm 1965 giúp cho việc biểu diễn đối tượng mờ có sở lý thuyết chắn Với hàm thành viên, tập mờ Zadeh cho phép biểu diễn xử lý nhiều trường hợp mờ cách hiệu Tuy nhiên giới khách quan vô phong phú Khi biểu diễn đối tượng mờ người ta phát tập mờ Zadeh trở nên chật hẹp diễn tả khái niệm không rõ ràng Năm 1986, Atanassov đưa tập mờ trực cảm (intuitionistic fuzzy set), mở rộng tập mờ Zadeh Năm 1993 Gau & Buehrer giới thiệu loại tập mờ mà ông gọi Vague set Sau người ta intuitionistic fuzzy set Vague set (trong luận văn dịch tập mờ trực cảm) Trong tập mờ trực cảm tác giả dựa vào hai hàm thành viên: Hàm thành viên thể mức độ thuộc phần tử xét vào tập mờ cho Hàm thành viên sai thể mức độ không thuộc phần tử xét vào tập mờ cho Tập mờ Zadeh trở thành trường hợp riêng tập mờ trực cảm Với tập mờ trực cảm ta biểu diễn đối tượng mờ cách sát thực với chất Trong sở liệu mờ biểu diễn tập mờ trực cảm, xác định độ tương tự phần tử đòi hỏi cách làm khác Càng tính độ tương tự phần tử phản ánh chất giống nhau, ta có kết truy vấn, kết tìm kiếm qui luật liệu đắn Trong khuôn khổ luận văn thạc sỹ, chọn đề tài “Một số độ đo mức tương tự tập mờ trực cảm (Vague sets), thử nghiệm phân cụm liệu” tìm hiểu độ đo mức tương tự tập mờ trực cảm, ứng dụng phân cụm liệu độ đo mức tương tự lý thuyết tập mờ, ứng dụng tập mờ để biểu diễn thông tin Đối tượng phạm vi nghiên cứu - Lý thuyết tập mờ tập mờ trực cảm trực cảm - Các độ đo mức tương tự tập mờ trực cảm ứng dụng phân cụm liệu - Nghiên cứu lý thuyết ứng dụng tập mờ, tập mờ trực cảm - Nghiên cứu độ tương tự tập mờ trực cảm - Thử nghiệm số độ đo mức tương tự phân cụm liệu Hướng nghiên cứu đề tài - Tìm hiểu tập mờ tập mờ trực cảm - Tìm hiểu độ đo tương tự tập mờ trực cảm Tìm hiểu độ đo khoảng cách tập mờ, xác định độ tương tự dựa xác định khoảng cách - Tìm hiểu phân cụm liệu - Cài đặt thử nghiệm chương trình phân cụm liệu biểu diễn nhờ tập mờ trực cảm Phương pháp nghiên cứu - Phương pháp đọc tài liệu, phân tích, tổng hợp - Phương pháp thực nghiệm đối chứng Ý nghĩa khoa học đề tài - Việc áp dụng độ đo mức tương tự tập mờ trực cảm giúp phân cụm liệu từ ứng dụng vào việc phân cụm liệu cách khoa học xác - Hỗ trợ góp phần nâng cao hiệu việc đánh giá, phân loại lực sinh viên CHƯƠNG I: TẬP MỜ VÀ TẬP MỜ TRỰC CẢM 1.1 Tập mờ L.A Zadeh lần đưa khái niệm lý thuyết tập mờ thông qua báo “Fuzzy Set” đăng tạp chí Information and Control năm 1965, sau với hàng loạt báo sau mở đầu cho phát triển ứng dụng lý thuyết Ngày nay, lý thuyết tập mờ không ngừng phát triển đóng góp ứng dụng vào nhiều ngành nghiên cứu như: lý thuyết điều khiển, trí tuệ nhân tạo, khai phá liệu,… Ý tưởng tập mờ xuất phát từ khái niệm trừu tượng ngữ nghĩa thông tin không chắn như: trẻ, xinh, cao, tốt,… Khi nói đến khái niệm tập hợp thường phần tử có số tính chất chung đó, ví dụ tập sinh viên Ta có: S = {s | s sinh viên} Vậy người sinh viên thuộc tập S, ngược lại không thuộc tập S Tuy nhiên, thực tế có nhiều trường hợp mà khái niệm không định nghĩa cách rõ ràng Ví dụ, nhận xét người: “người trẻ” có câu hỏi: “như trẻ?”, có ví dụ khác như: “lớp xe đẹp”, “lớp người cao”,… Khi khái niệm gọi khái niệm mờ, khái niệm không định nghĩa cách rõ ràng Những tập hợp dạng Zadeh biểu diễn khái niệm toán học gọi tập mờ coi trường hợp riêng khái quát từ khái niệm tập hợp kinh điển [8] Xét lại ví dụ trên, ta biểu diễn ngữ nghĩa khái niệm “trẻ” việc đánh giá người Giả sử tuổi người biểu diễn đoạn từ [0, 140] tính theo đơn vị năm Theo Zadeh, khái niệm “trẻ” biểu diễn sau: Xét tập hợp Atrẻ người đánh giá trẻ Ông đưa câu hỏi cần trả lời “Một người có tuổi x hiểu thuộc tập Atrẻ nào?” Thông thường ta thấy người có tuổi từ 0-25 thuộc vào tập Atrẻ tức độ thuộc 1; với người có tuổi 26 có lẽ thuộc vào tập Acao với độ thuộc 0.3, người có tuổi 40 thuộc vào tập Atrẻ với độ thuộc 0,… Từ ông đưa ra, ngữ nghĩa khái niệm trẻ biểu diễn hàm số  trÎ : U  [0, 1] 1.1.1 Định nghĩa tập mờ Cho tập vũ trụ U  u , u , , u n  Tập hợp A =  u,  (u) | u U,  (u) 0, 1 gọi tập hợp mờ tập U A A Trong đó: + Biến u gọi biến sở + Hàm A : U  0, 1 gọi hàm thành viên + Giá trị  A ( u ) gọi độ thành viên phần tử u thuộc vào tập hợp A Ví dụ: Xét tập U gồm người x1 , x2 , , x5 có tuổi tương ứng là: 1, 15, 20, 30, 50 A tập hợp người “trẻ” Khi ta xây dựng hàm thuộc sau:  trÎ (1)  1, trÎ (15)  1, trÎ (20)  1, trÎ (30)  0.1,  trÎ (50)  tập mờ AtrÎ   0,1 , 15,1 ,  20,1 ,  30,0.1 ,  50,0 1.1.2 Các phép toán tập mờ Để tiến hành mô hình hóa hệ thống có chứa tập mờ biểu diễn quy luật vận hành hệ thống trước tiên ta cần tới việc suy rộng phép toán logic với mệnh đề có chân trị đoạn [0,1] Cho Ω = {P1, P2, } với P1, P2, mệnh đề Tập mờ A Ω tương ứng với ánh xạ v sau: v: Ω → [0,1]  Pi  Ω → v(Pi) Ta gọi v(Pi) chân trị mệnh đề Pi [0,1] 1.1.2.1 Phép phủ định mờ Định nghĩa 1: Hàm n: [0,1] → [0,1] không tăng thỏa mãn điều kiện n(0) = 1, n (1) = thỏa điều kiện: - v(NOT P) phụ thuộc vào v(P) - Nếu v(P) = v(NOT P) = - Nếu v(P) = v(NOT P) = - Nếu v(P1) ≤ v(P2) v(NOT P1) ≥ v(NOT P2) gọi hàm phủ định Ví dụ: n(x) = - x hay n(x) = - x2 hàm phủ định Dễ thấy hàm thỏa điều kiện định nghĩa Định nghĩa (Phần bù tập mờ): Cho n hàm phủ định, phần bù Ac tập mờ A tập mờ với hàm thuộc xác định bởi: μAc (a) = n(μA(a)), với a  Ω Đồ thị hàm thuộc có dạng sau: a b Hình 1.1 Đồ thị biểu diễn hàm thuộc Hình a: Hàm thuộc tập mờ A, Hình b: Hàm thuộc tập mờ Ac Ví dụ: với n(x) = - x Ta có: μAc (a) = n(μA(a)) = - μA(a), với a  Ω 42 Thuật toán FCM Input: Số cụm c tham số mũ m cho hàm mục tiêu J Output: c cụm cho hàm mục tiêu (1) đạt cực tiểu Begin Bước 1: Khởi tạo ma trận V  vij  , V (0)  Rsxc , j  Bước 2:Lặp j++; Tính ma trận phân hoạch mờ U ( j ) theo công thức (3) Cập nhật trung tâm cụm V ( j )   vi( j ) , v2( j ) , , vc( j )  dựa vào công thức (4) U ( j )  Cho đến U ( j 1)  U ( j ) F   Bước 3: Trả cụm kết End Trong đó, U ( j 1)  U ( j ) F tiêu chuẩn Frobenious định nghĩa sau: U F  Tr (UU T )  i  k uik2 Kết phân cụm phụ thuộc vào việc chọn tham số, tham số chọn ngẫu nhiên dựa theo Heuristic Nếu chọn m  1 thuật toán C-means trở thành thuật toán rõ 43 Nếu chọn m   thuật toán Fuzzy C-means trở thành thuật toán phân c cụm mờ với uik  Chưa có quy tắc chuẩn để chọn tham số phân cụm hiệu thường chọn m = [11] 3.1.3.2 Thuật toán  FCM (  -Insensitive Fuzzy C-means) Thuật toán FCM tồn nhược điểm dễ bị ảnh hưởng nhiễu phần tử ngoại lai sử dụng hàm bậc hai để đo độ phi tương tự liệu trung tâm cụm Năm 1998, Vapnik đưa độ đo cải tiến: t  t  0   t   t  ,  tham số phi nhạy cảm với nhiễu (5) Hàm mục tiêu thuật toán  FCM xác định sau: n c J m (U ,V )   (uik )m xk , vi (6)  k 1 i 1 p Trong đó: xk , vi    xkl  v  l 1 * Định lý:Nếu m, c  tham số cố định, với (U ,V )  ( E fc * R pc ) , hàm mục tiêu J m (U ,V ) đạt giá trị tối thiểu khi: 1   c  1 m 1 m x  v x  v  k   k  i   i    j 1    uik   0 i  Ik 1i  c i  k  N  i  Ik    uik    iI k  xkl      vil   1i c 1l  p  xkl   Ik  (7) Ik   k |kAi   k |k Ai (8) 44 Trong đó, N N     Ai  i   0,(u ik )m  |    x   k  k       k k kl    k k  k 1 k 1   N N  k   k k , k  0,(uik )m  với giả thiết k 1 k 1 với I k xác định: I k  i |1  i  c; xk  vi   0; k  1,2, , N    vil  1i  c 1l  p card ( Ai ) Ai     ( xkl   )   ( xkl   )  k |iAi   k |iAi  (9) với ký hiệu: +  (  )  (  )  (  ) + Lực lượng tập A: card(A) Định lý chứng minh Các bước thuật toán  FCM: Thuật toán  FCM Input: Số cụm c tham số mũ m,  cho hàm mục tiêu J Output: c cụm cho hàm mục tiêu (6) đạt cực tiểu Begin Bước 1: Khởi tạo ma trận V  vij  , V (0)  Rsxc , j  Bước 2:Lặp j++; Tính ma trận phân hoạch mờ U ( j ) theo công thức (7) Cập nhật trung tâm cụm V ( j )   vi( j ) , v2( j ) , , vc( j )  dựa vào công thức (9) U ( j )  Cho đến U ( j 1)  U ( j ) Bước 3: Trả cụm kết End F   45 Thuật toán  FCM thuật toán mở rộng từ thuật toán FCM nhằm khắc phục nhược điểm để thích nghi với nhiễu phần tử ngoại lai.Tuy nhiên, hiệu thuật toán tập liệu lớn, nhiều chiều cách xác định tham số  chưa hoàn thiện [11] 3.1.3.3 Thuật toán Fuzzy C-means cải tiến Nhằm khắc số nhược điểm thuật toán FCM  FCM cách tối ưu phần thuật toán FCM sau: * Lựa chọn điểm làm ứng viên cho việc chọn trung tâm cụm - B1 Chia tập liệu X  { x1 , x2 , , xn} thành nhiều tập số lượng thành viên n lớn - B2 Chọn lân cận: bước có ảnh hưởng lớn đến trình tính toán nên tối ưu bước giảm thiểu thời gian tính toán Một phương pháp đưa dùng khái niệm phương sai mẫu Một lân cận điểm hình hộp có bán kính giá trị nhỏ độ lệch chuẩn tập - B3 Tính độ đậm đặc điểm: Độ đậm đặc số điểm nằm lân cận điểm Xác định điểm có độ đậm đặc lớn Sau áp dụng bước ta có tập ứng viên điểm có độ đậm đặc lớn * Lược bớt ứng viên Trong trường hợp số lượng ứng viên lớn phương pháp sau đưa nhằm giảm bớt số lượng ứng viên cách áp dụng lại phương pháp Lựa chọn ứng viên bên cho tập ứng viên vừa tìm 46 * Lựa chọn ứng viên làm cực tiểu hàm mục tiêu Giả sử sau phương pháp ta thu tập ứng viên cho trung   tâm cụm là: Ccp  cc1 , cc2 , , ccn p Thay hàm mục tiêu thuật toán FCM hàm mục tiêu là: n q * J FCM    mji xi  cc cj   J cc i 1 j 1 Trong đó: q q J cc    cci  cc cj i 1 j i 1  ji  c j  x  cc  i  c k 1  x  cc k  i q     m1 * Gán trung tâm có liên kết gần vào cụm Sau lựa chọn trung tâm cụm kiểm tra xác định xem có trung tâm cụm gần mà gán vào thành cụm hay không Từ phương pháp cải tiến hiệu thuật toán ta tóm tắt thuật toán FCM cải tiến sau: Thuật toán FCM cải tiến Begin Bước 1: Nếu n lớn áp dụng phương pháp Lựa chọn điểm làm ứng viên trung tâm cụm Bước 2:Nếu sau Bước 1, số trung tâm ứng viên lớn chạy phương pháp Lược bớt ứng viên để rút gọn số ứng viên làm trung tâm cụm 47 Bước 3:Áp dụng phương pháp Lựa chọn ứng viên làm cực tiểu hàm mục tiêu để xác định trung tâm cụm Bước 4: Áp dụng phương pháp Gán trung tâm có liên kết gần vào thành cụm Bước 5: Chạy thuật toán FCM với tập trung tâm cụm, sau dừng lại Bước 6: Tính độ thuộc điểm liệu lại End 3.2 Thử nghiệm số độ đo mức tương tự phân cụm 3.2.1 Ngôn ngữ lập trình Chương trình xây dựng dựa ngôn ngữ lập trình C# kết hợp với hệ quản trị CSDL Microsoft SQL Server 3.2.2 Biểu diễn liệu sinh viên nhờ tập mờ trực cảm Do cách biểu diễn tập mờ trực cảm khác với tập mờ có thêm hàm không thành viên hàm thành viên nên bảng sở liệu bổ sung thêm trường tương ứng Cụ thể, xây dựng mô hình sở liệu sau: 48 Hình 3.8 Mô hình biểu diễn liệu sinh viên 3.2.3 Giao diện hướng dẫn sử dụng chương trình Hình 3.9 Giao diện chương trình 49 3.2.4 Thử nghiệm phân cụm liệu sinh viên trường Đại học Hoa Lư Chạy thử nghiệm chương trình áp dụng cho 1000 sinh viên trường Đại học Hoa Lư Mặc dù liệu vào bao gồm nhiều thông tin chương trình thực tính toán lực: Năng lực tự học, lực tư duy, lực giao tiếp, lực tự quản lý Trong chương trình, xây dựng thuật toán dựa việc sử dụng độ đo để tính toán mức độ tương tự đối tượng là: Độ đo mức tương tự dựa khoảng cách, độ đo mức tương tự dựa lý thuyết tập hợp, độ đô mức tương tự dựa hàm xác định mức phù hợp Hình 3.10 Giao diện trước phân cụm 50 Hình 3.11 Giao diện sau phân cụm Sau lựa chọn tham số chạy chương trình, chương trình thực thuật toán Fuzzy C-means áp dụng độ đo lựa chọn, sau phân sinh viên vào cụm tương ứng Kết thu Hình cho thấy bước đầu sinh viên phân vào cụm dựa mức độ tương đồng thông qua việc tính toán dựa độ đo Với đầu vào 1000 sinh viên, thuật toán chạy nhanh trả kết khoảng thời gian giây 3.2.5 So sánh kết phân cụm trường hợp sử dụng độ đo mức tương tự khác Ngoài chức phân cụm sinh viên dựa độ đo, xây dựng chức vẽ biểu đồ minh họa cho việc phân đối tượng vào cụm khác dựa độ đo Các Hình 3.12, 3.13, 3.14 minh họa cho kết phân cụm sinh viên dựa vào độ đo khác Độ đo mức tương tự dựa khoảng cách, độ đo dựa lý thuyết tập hợp, độ đo dựa hàm xác định mức phù hợp Kết cho thấy nhiều khác phân cụm đối tượng dựa độ đo này, từ thấy liệu đầu 51 vào liệu sinh viên độ đo cho kết tương đồng Hình 3.12 Biểu đồ phân cụm áp dụng độ đo khoảng cách Hình 3.13 Biểu đồ phân cụm áp dụng độ đo lý thuyết tập hợp 52 Hình 3.14 Biểu đồ phân cụm áp dụng độ đo hàm xác định Kết luận chương Phần chương 3, trình bày phân cụm ứng dụng số thuật toán bật sử dụng phân cụm liệu như: DBSCAN, K-means, CURE, CLIQUE,… thuộc nhóm phương pháp pháp phân cụm bật: phân cụm dựa mật độ, phân cụm phân cấp, phân cụm dựa lưới, phân cụm dựa mô hình, phân cụm quy hoạch phân cụm ràng buộc việc cài đặt chương trình phân cụm sinh viên dựa thuật toán Fuzzy C-means áp dụng độ đo mức tương tự tập mờ trực cảm khác Như trình bày trên, tập mờ đóng vai trò quan trọng việc phân cụm tập liệu ràng buộc Trong cách biểu diễn tập mờ sử dụng đến hàm thuộc để biểu thị tính thuộc (thành viên) đối tượng vào tập, cách biểu diễn có cách định nghĩa khác đưa nhằm tăng tính mô tả cho đối tượng tập mờ trực cảm, cách sử dụng thêm hàm không thuộc để biểu thị tính không thuộc (không phải thành viên) đối tượng tập Trong phân cụm liệu mờ 53 khâu quan trọng, làm ảnh hưởng đến kết phân cụm việc cực tiểu hóa hàm mục tiêu dựa việc tính toán độ tương tự đối tượng liệu Để tính toán độ tương tự đối tượng liệu cần phải xây dựng nên độ đo mức tương tự đối tượng Sau cài đặt chạy thử nghiệm áp dụng với liệu 1000 sinh viên trường Đại học Hoa Lư Kết cho thấy chương trình bước đầu phân sinh viên vào cụm, việc áp dụng độ đo khác không khác biệt cụm kết 54 KẾT LUẬN Trong trình tìm hiểu thực luận văn tốt nghiệp với đề tài “ Một số độ tương tự tập mờ trực cảm (Vague set), thử nghiệm phân cụm liệu” dù thu kết định nhận thấy phân cụm liệu Khai phá liệu nói chung khai phá liệu mờ nói riêng nhiều thách thức thu hút nhiều quan tâm nghiên cứu Luận văn tập trung vào tìm hiểu trình bày vấn đề khái quát phân cụm liệu số thuật toán phân cụm liệu thông thường phân cụm liệu mờ Ngoài ra, luận văn trình bày cách biểu diễn hiệu tập mờ tập mờ trực cảm số độ đo tương tự tập mờ trực cảm Từ kiến thức tìm hiểu được, cài đặt thử nghiệm Chương trình phân cụm liệu sinh viên trường Đại học Hoa Lư dựa cách biểu diễn liệu tập mờ trực cảm áp dụng độ đo trình bày trên, kết thu chương trình phân cụm sinh viên, xây dựng biểu đồ so sánh kết phân cụm sử dụng độ đo khác Tuy nhiên, hạn chế mặt thời gian nên tìm hiểu xây dựng chương trình dựa thuật toán nên chưa có so sánh hoạt động thuật toán với Số thuộc tính biểu diễn liệu sinh viên nên mức độ chi tiết việc phân cụm chưa cao Trong thời gian tới, tiếp tục thử nghiệm cài đặt thêm thuật toán để có so sánh đánh giá khách quan phát triển chương trình trở thành sản phẩm áp dụng trực tiếp vào hoạt động Đại học Hoa Lư giúp nâng cao chất lượng đào tạo nhà trường 55 TÀI LIỆU THAM KHẢO Tiếng việt [1] Nguyễn Hoàng Cương, Bùi Công Cường, Nguyễn Doãn Phước, Phạm Xuân Minh, Chu Văn Hỷ, Hệ mờ ứng dụng Nhà xuất khoa học kỹ thuật, Hà Nội - 1998 Tiếng Anh [2] Atanassov, K., 1986 Intuitionistic fuzzy sets Fuzzy Sets Systems 20 (1), 87–96 [3] Chen, S.M., 1997 Similarity measures between vague sets and between elements IEEE Trans Syst Man Cybernet 27 (1), 153–158 [4] Dengfeng, L., Chuntian, C., 2002 New similarity measure of intuitionistic fuzzy sets and application to pattern recognitions Pattern Recognition Lett 23, 221–225 [5] Fan, L., Zhangyan, X., 2001 Similarity measures between vague sets J Software 12 (6), 922–927 (in Chinese) [6] Gau, W.L., Buehrer, D.J., 1993 Vague sets IEEE Trans Syst Man Cybernet 23 (2), 610–614 [7] Hong, D.H., Kim, C., 1999 A note on similarity measures between vague sets and between elements Inform Science 115, 83–96 [8] Zadeh, L.A., 1965 Fuzzy sets Inform Control 8, 338–356 [9] Zhizhen, L., Pengfei, S., 2003 Similarity measures on intuitionistic fuzzy sets Pattern Recognition Lett 24, 2687–2693 [10] Yanhong Li, David L Olson, Zheng Qin, 2006 Similarity measures between intuitionistic fuzzy (vague) sets: A comparative analysis 56 [11] Arning, R Agrawal, and P Raghavan Alinear method for deviation detection in larger databases, “In Proc 1996 Int Conf Data Mining and Knowledge Discovery (KDD-96)”, Portland, Oregon [12] P.S Bradley, U Fayyad, C Reina, 1998 Scaling Clustering Algorithms to Large Databases, “In Proc of 4th International conference on Knowledge Discovery and Dala Mining (Kdd-98)”, New York [13] Zeshui Xu, 2007 Some similarity measures of intuisionistic fuzzy sets and their applications to multiple attibute decision making Fuzzy optim Decis Making (2007) 6: 109-121 [...]... khoảng cách, dựa trên lý thuyết tập hợp, dựa trên hàm xác định mức phù hợp.Để tính toán được độ tương tự giữa các đối tượng dữ liệu thì cần phải xây dựng nên các độ đo mức tương tự giữa các đối tượng đó Nhằm đo khoảng cách giữa hai đối tượng dữ liệu trong tập mờ trực cảm để có thể phân cụm dữ liệu một cách chính xác 28 CHƯƠNG III THỬ NGHIỆM MỘT SỐ ĐỘ ĐO MỨC ĐỘ TƯƠNG TỰ TRONG BÀI TOÁN PHÂN CỤM 3.1... thuộc (không phải thành viên) của đối tượng trong một tập Trong chương tiếp theo luận văn sẽ trình bày đến độ tương tự giữa các tập mờ trực cảm 16 CHƯƠNG II ĐỘ TƯƠNG TỰ GIỮA CÁC TẬP MỜ TRỰC CẢM 2.1 Khoảng cách giữa các tập mờ trực cảm 2.1.1 Khoảng cách S C ( A, B ) Khoảng cách SC ( A, B ) giữa A  IFSs( X ) và B  IFSs( X ) với IFSs( X ) là tập mờ trực cảm X, được Chen đề xuất năm 1995 và được định... có sự tương đồng giữa A và B tương tự, s(A,B) có tất cả các thuộc tính mô tả được liệt kê trong định nghĩa 2.1 [12] Kết luận chương 2: Qua chương 2 luận văn đã trình bày khoảng cách giữa các tập mờ trực cảm, khoảng cách Hamming, khoảng cách Ơclid, khoảng cách Ơclid tổng quát, phần còn lại của chương luận văn trình bày những vấn đề về độ đo mức tương tự trong tập mờ trực cảm, độ đo mức tương tự dựa... 1.4: Số mờ trực cảm hình thang Số mờ tam giác M(a,b,c) 0 z a   M  z    b  a c  z c  b 0  za a zb bzc cz 1 0 a b c Hình 1.5: Số mờ trực cảm tam giác Kết luận chương 1: Như vậy qua chương 1 luận văn đã trình bày cơ sở lý thuyết tập mờ, các phép toán trên tập mờ, khoảng cách giữa các tập mờ Phần tiếp theo trình bày khái niệm tập mờ trực cảm, số mờ trực cảm và các phép toán trên số mờ. .. Chemeleon,… - Phương pháp phân cụm dựa trên lưới: Đây là phương pháp được ứng dụng trong phân cụm dư liệu nhiều chiều Phương pháp này sử dụng cấu trúc dữ liệu dạng lưới để phân cụm dữ liệu, trong đó tập dữ liệu sẽ được lượng hóa vào trong các ô, sau đó các thao tác phân cụm dữ liệu sẽ hoạt động dựa trên việc xây dựng các mức phân cấp của nhóm các đối tượng trong một ô chứ không di chuyển các đối tượng Ưu điểm... tránh được các trường hợp phản trực giác của SC , loại II của S H và S L , nhưng có các trường hợp phản trực cảm như loại I của S H mà lý do tương tự như trường hợp của khoảng cách S H 2.2 Độ đo mức tương tự Độ đo mức tương tự giữa các tập mờ trực cảm được Dengfeng và Chuntian định nghĩa như sau: 22 Định nghĩa 2.1 Một ánh xạ S : IFSs(X)  IFSs(X)  [0, 1] IFSs(X) là tập tất cả các IFSs trong X  x1... mờ trực cảm 15 Như đã trình bày ở trên, tập mờ đóng vai trò quan trọng trong việc phân cụm đối với các tập dữ liệu ràng buộc Trong cách biểu diễn tập mờ chỉ sử dụng đến một hàm thuộc để biểu thị tính thuộc (thành viên) của đối tượng vào một tập, ngoài cách biểu diễn trên thì có một cách định nghĩa khác được đưa ra nhằm tăng tính mô tả cho các đối tượng đó là tập mờ trực cảm, bằng cách sử dụng thêm một. .. lược phân cụm phân hoạch, phân cụm phân cấp hoặc phân cụm dựa trên cấu trúc và sẽ tinh chỉnh các mô hình để nhận ra các cụm Các thuật toán điển hình thuộc nhóm phương pháp này là: EM, COBWEB,… 30 - Phương pháp phân cụm có dữ liệu ràng buộc: Hầu hết các phương pháp phân cụm trên mặc dù phân cụm được với không gian dữ liệu lớn nhưng lại không cho phép phân cụm đối với cơ sở dữ liệu có ràng buộc Trong. .. mô tả các đối tượng người ta đã sử dụng thêm một hàm không thuộc để biểu thị cho độ không thuộc vào một tập của một đối tượng Tập mới này được gọi là tập mờ trực cảm 1.2.1 Định nghĩa tập mờ trực cảm Cho U là tập vũ trụ khởi tạo, U  u1 , u2 , , un  Một tập mờ trực cảm trên U được xác định bởi hàm thành viên tv ( u ) chỉ mức độ thành viên của u trong V và hàm không là thành viên f v chỉ mức độ không... tất cả các thuộc tính được mô tả trong định nghĩa 2.1 [12] 2.2.3 Độ đo mức tương tự dựa trên hàm xác định mức phù hợp Chen (1988) và Chen et.al (1995) giới thiệu một chức năng phù hợp để tính toán mức độ tương tự giữa các tập mờ Trong phần tiếp theo chúng ta mở rộng chức năng phù hợp để đối phó với các biện pháp tương tự của IFSS Cho A   (X) và B   (X) sau đó chúng tôi xác định mức tương tự giữa ... truy vn, kt qu tỡm kim v cỏc qui lut d liu cng ỳng n Trong khuụn kh ca mt lun thc s, tụi chn ti Mt s o mc tng t gia cỏc m trc cm (Vague sets), th nghim phõn cm d liu tỡm hiu v cỏc o mc tng... Vague set Sau ny ngi ta ó ch rng intuitionistic fuzzy set v Vague set ch l mt (trong lun ny chỳng tụi dch l m trc cm) Trong m trc cm cỏc tỏc gi ó da vo hai hm thnh viờn: Hm thnh viờn ỳng th hin... s dng lut Modus Ponnens hoc Modus Tollen Trong logic rừ, Modus Ponnen din t nh sau: Mnh (Lut hoc tri thc): P Q Mnh (s kin): P ỳng Kt lun: Q ỳng 10 Trong suy din m, lut c din t di dng sau:

Ngày đăng: 14/04/2016, 10:47

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan