Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)

64 407 0
Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)Nghiên cứu ứng dụng kỹ thuật tập thô trong phân lớp dữ liệu (LV thạc sĩ)

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - LÊ THỊ HẰNG LUẬN VĂN THẠCKỸ THUẬT HÀ NỘI – 2017 HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG - LÊ THỊ HẰNG NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TẬP THÔ TRONG PHÂN LỚP DỮ LIỆU CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 LUẬN VĂN THẠCKỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: TS VŨ VĂN THỎA HÀ NỘI – 2017 i LỜI CAM ĐOAN Tôi cam đoan công trình nghiên cứu riêng Các số liệu, kết nêu luận văn trung thực chưa công bố công trình TÁC GIẢ Lê Thị Hằng ii LỜI CẢM ƠN Em xin bày tỏ lòng kính trọng biết ơn sâu sắc đến TS Vũ Văn Thỏa, Thầy trực tiếp hướng dẫn tận tình bảo em suốt thời gian làm luận văn tốt nghiệp Ngoài kiến thức Thầy truyền đạt, em học Thầy phong cách làm việc khoa học, nghiêm túc đầy trách nhiệm Em xin chân thành cảm ơn toàn thể thầy giáo, cô giáo Học viện Công nghệ Bưu Viễn thông dìu dắt, bảo tận tình cho em suốt thời gian học tập trường Cuối cùng, em xin gửi lời cảm ơn tới gia đình, bạn bè, đồng nghiệp giúp đỡ tạo điều kiện để em hoàn thành tốt luận văn Mặc em cố gắng hoàn thành luận văn phạm vi khả cho phép chắn không tránh khỏi thiếu sót, kính mong nhận góp ý uý thầy cô bạn Hà Nội, tháng 06 năm 2017 Học viên Lê Thị Hằng iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC THUẬT NGỮ vi BẢNG CÁC HIỆU TỪ VIẾT TẮT .vii DANH MỤC BẢNG .viii DANH MỤC HÌNH ix MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ TẬP THÔ VÀ CÁC VẤN ĐỀ LIÊN QUAN 1.1 Hệ thông tin khái niệm liên quan 1.1.1 Hệ thông tin 1.1.2 Quan hệ không phân biệt 1.2 Tập thô 1.2.1 Xấp xỉ xấp xỉ 1.2.2 Các tính chất xấp xỉ 1.2.3 Thuật toán tìm tập xấp xỉ xấp xỉ 1.2.4 Khái niệm tập thô 1.3 Ma trận phân biệt hàm phân biệt 10 1.3.1 Ma trận phân biệt 10 1.3.2 Hàm phân biệt 10 1.4 Bảng định luật định 12 1.4.1 Bảng định 12 1.4.2 Luật định 13 1.4.3 Các độ đo đánh giá luật định 13 1.5 Ứng dụng tập thô giải toán phân lớp liệu 15 1.5.1 Bài toán phân lớp liệu 15 1.5.2 Phân lớp liệu dựa tập thô 16 iv 1.6 Kết luận chương 18 CHƯƠNG 2: NGHIÊN CỨU KỸ THUẬT SINH LUẬT QUYẾT ĐỊNH DỰA TRÊN TẬP THÔ 19 2.1 Thuật toán sinh luật định với tập rút gọn thuộc tính 19 2.2 Thuật toán sinh luật định dựa tập rút gọn thuộc tính sử dụng ma trận phân biệt 21 2.2.1 Thuật toán tìm tập rút gọn thuộc tính sử dụng ma trận phân biệt cho hệ thông tin 21 2.2.2 Thuật toán sinh luật định 02 23 2.3 Thuật toán sinh luật định có bổ sung thêm thuộc tính theo yêu cầu người dùng 24 2.3.1 Các khái niệm liên uan 24 2.3.2 Mô tả thuật toán 25 2.4 Kết luận chương 28 CHƯƠNG 3: PHÂN LOẠI KIỂU TẤN CÔNG TRONG BỘ DỮ LIỆU KDD CUP 99 DỰA TRÊN TẬP THÔ 29 3.1 Bộ liệu KDD Cup 99 toán phân loại kiểu công 29 3.1.1 Giới thiệu liệu KDD Cup 99 29 3.1.2 Các đặc tả liệu KDD Cup 99 30 3.1.3 Bài toán phân loại kiểu công liệu KDD Cup 99 35 3.2 Ứng dụng tập thô giải toán phân loại kiểu công liệu KDD Cup 99 35 3.2.1 Tìm tập rút gọn thuộc tính cho kiểu công liệu KDD Cup 99 35 3.2.2 Sinh luật định phân loại kiểu công liệu KDD Cup 99 37 3.3 Cài đặt thử nghiệm 43 3.3.1 Cài đặt thử nghiệm với nhãn lớp DOS 43 3.3.2 Cài đặt thử nghiệm với nhãn lớp U2R 46 v 3.4 Kết đánh giá 47 3.4.1 Kết thực với nhãn lớp DOS 47 3.4.2 Kết thực với nhãn lớp U2R 49 3.5 Kết luận chương 50 KẾT LUẬN 51 vi DANH MỤC THUẬT NGỮ Thuật ngữ tiếng Anh Thuật ngữ tiếng Việt Attribute Reduction Rút gọn thuộc tính Complete Decision Table Bảng định đầy đủ Consistent Decision Table Bảng định uán Core Tập lõi Decision Rule Luật định Decision Table Bảng định Inconsistent Decision Table Bảng định không uán Indiscernibility Relation Quan hệ không phân biệt Information System Hệ thông tin Lower Approximation Xấp xỉ Rough Set Tập thô Upper Approximation Xấp xỉ vii BẢNG CÁC HIỆU TỪ VIẾT TẮT hiệu, từ viết tắt IS  U , A,V , f  DT=(U, CD, V, f) Diễn giải Hệ thông tin Bảng định U Số đối tượng C Số thuộc tính điều kiện bảng định A Số thuộc tính hệ thông tin u a Giá trị đối tượng u thuộc tính a IND  B  Quan hệ B  không phân biệt  u B Lớp tương đương chứa u quan hệ IND  B  U/B Phân hoạch U sinh tập thuộc tính B (X) R - xấp xỉ X (X) R - xấp xỉ X BN B  X  B - miền biên X POSB(X) B - vùng dương X NEGB(X) B - vùng âm X RED C  Họ tất tập rút gọn bảng định CORE C  Tập lõi bảng định viii DANH MỤC BẢNG Bảng 1.1: Ví dụ hệ thông tin Bảng 1.2: Mô tả hệ thông tin .10 Bảng 1.3: Mô tả ma trận phân biệt 11 Bảng 1.4: Ví dụ bảng định 12 Bảng 1.5: Các độ đo luật định 14 Bảng 2.1: Bảng định gồm 10 đối tượng thuộc tính điều kiện, thuộc tính định 20 Bảng 2.2: Bảng định với đối tượng thuộc tính .21 Bảng 3.1: Nhãn lớp số mẫu xuất 10% liệu KDD Cup 99 [15] 30 Bảng 3.2: Các thuộc tính liệu KDD Cup 99 [15] .31 Bảng 3.3: Các thuộc tính tối ưu trích xuất MATLAB sử dụng thuật toán đề xuất [9] 37 Bảng 3.4: Thay lớp kết nối thuộc tính số 37 Bảng 5: Bảng thông tin thuộc tính thuộc nhãn lớp DOS 39 Bảng 3.6: Thay lớp kết nối thuộc tính số 40 Bảng 3.7: Bảng thông tin thuộc tính thuộc nhãn lớp U2R 41 Bảng 3.8: Bảng mô tả giới hạn giá trị độ đo luật định 47 Bảng 3.9: Danh sách 10 luật định đại diện cho 1509 luật thu .48 Bảng 3.10: Bảng mô tả giới hạn giá trị độ đo luật định .49 Bảng 3.11: Danh sách luật định đại diện cho 51 luật thu 49 39 Bảng 5: Bảng thông tin thuộc tính thuộc nhãn lớp DOS TT 23 Tên thuộc tính Service Count Mô tả Kiểu Dịch vụ mạng điểm đến ví dụ string http,telnet, vv Số lượng kết nối đến máy chủ tương tự giống kết nối hành giây float ua 29 Srv_serror_rate % kết nối có lỗi “SYN” từ dịch vụ float 30 Srv_rerror_rate % kết nối có lỗi “REJ” từ dịch vụ float 32 DTt_host_count Đếm kết nối có đích đến float 34 DTt_host_same _srv_rate % kết nối có 1host đích sử dụng float cácdịch vụ tương tự 35 DTt_host_diff_s % dịch vụ khác host float rv_rate hành 42 Attack Nhãn lớp String Thao tác thực tiền xử lý - Đếm số lượng dịch vụ mạng đánh số từ đến hết - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới DOS mã hóa 1; kiểu công khác mã hóa và và 40 3.2.2.2 Tiền xử lý liệu cho toán áp dụng với nhãn lớp U2R Bước 1: Lớp kết nối liệu KDD Cup 99 thuộc tính phi số Lớp kết nối thay thuộc tính số bảng 3.6 Bảng 3.6: Thay lớp kết nối thuộc tính số STT Nhãn lớp Normal DOS PROBE Giải thích Nhãn lớp Bình thường Tấn công từ chối dịch vụ Tấn công thăm dò R2L Tấn công từ xa U2R Tấn công chiếm quyền Root Bước 2: Căn vào bảng 3.3, tệp liệu thử nghiệm với nhãn U2R lúc xét thuộc tính 6, 11, 12, 14, 17, 24, 32, 33, 35, 36, 37, 40, 41, 42 Kiểu liệu thuộc tính chuyển từ liệu phi số sang liệu số, kiểu liệu xâu bảng 3.7 đây: 41 Bảng 3.7: Bảng thông tin thuộc tính thuộc nhãn lớp U2R TT Tên thuộc tính Mô tả Kiểu Flag Trạng thái bình thường lỗi kết nối float 11 Num_failed_log ins Số lần đăng nhập không thành công float 12 Logged_in đăng nhập thành công; ngược lại 14 Root_shell Bằng thu root shell; ngược lại float 17 Num_file_creati ons Số hoạt động tạo tập tin float 24 Serror_rate Số % kết nối có lỗi “SYN” float 32 Dst_host_count Đếm kết nối có đích đến float 33 Dst_host_srv_co Đếm kết nối có 1host đích sử dụng unt dịch vụ tương tự float float Thao tác thực tiền xử lý - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành đánh số từ tới khoảng khoảng khoảng khoảng khoảng khoảng 42 35 Dst_host_diff_sr % dịch vụ khác host v_rate hành float % kết nối đến host thời có cổng src float % kết nối đến dịch vụ tương tự đến từ host khác float float 36 Dst_host_same_ src_ port_rate 37 Dst_host_srv_di ff_host_rate 40 Dst_host_rerror _rate % kết nối đến host thời có lỗi RST 41 Dst_host_srv_re rror_rate % kết nối đến máy chủ hành float dịch vụ uy định có lỗi RST 42 Attack Nhãn lớp String - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới - Tìm giá trị Max giá trị Min - Chia đoạn [Min; Max] thành khoảng đánh số từ tới U2R mã hóa 1; kiểu công khác mã hóa và và 43 3.3 Cài đặt thử nghiệm 3.3.1 Cài đặt thử nghiệm với nhãn lớp DOS Với toán này, học viên xây dựng module hệ thống sau: - Module Tiền xử lý liệu; - Module Sinh luật định; - Module Phân lớp liệu Ngôn ngữ lập trình lựa chọn: - Giao diện hệ thống sử dụng Java; - Các module tính toán sử dụng ngôn ngữ lập trình Java Một số giao diện hệ thống xây dựng sau: Hình 3.1: Giao diện hệ thống 44 Hình 3.2: Tiền xử lý liệu với nhãn lớp DOS Hình 3.3: Sinh luật định với nhãn lớp DOS 45 Hình 3.4: Kết phân lớp với luật thuộc lớp DOS Hình 3.5: Kết phân lớp với luật thuộc lớp khác 46 3.3.2 Cài đặt thử nghiệm với nhãn lớp U2R Học viên xây dựng số giao diện hệ thống với nhãn lớp U2R sau: Hình 3.6: Tiền xử lý liệu với nhãn lớp U2R Hình 3.7: Sinh luật định với nhãn lớp U2R 47 Hình 3.8: Kết phân lớp với luật thuộc lớp khác 3.4 Kết đánh giá 3.4.1 Kết thực với nhãn lớp DOS - Trong tổng số 494.021 ghi liệu, có 391.458 ghi có nhãn DOS - Kết thực chương trình với 494.021 ghi sinh 1.509 luật khác (có nhãn lớp DOS nhãn lớp DOS), với 391.458 ghi có nhãn lớp DOS có 1.347 luật định sinh nhãn lớp DOS Bảng 3.8 mô tả chung luật định Bảng 3.8: Bảng mô tả giới hạn giá trị độ đo luật định Độ đo hỗ trợ Độ chắn Độ bao phủ (supp) (cer) (cov) Giá trị lớn 0.460138 1.00 0.580696 Giá trị nhỏ 2.0E-6 2.19E-4 3.0E-6 Giá trị độ đo Trong bảng 3.9 mô tả 10 luật uyết định đại diện cho 1.509 luật thu 48 Bảng 3.9: Danh sách 10 luật định đại diện cho 1509 luật thu Thứ tự Nội dung luật Độ đo hỗ trợ Độ chắn Độ bao phủ (supp) (cer) (cov) Attack 9400000 0.107753 0.135984 11 0 0 0.091026 0.114876 11 0 0 0.014018 0.067519 10 0 0 0.004901 0.023605 11 0 0 0.101457 0.999781 0.128039 9000000 0.460138 0.999248 0.580696 0000040 0.004012 0.998992 0.019325 0000200 0.008271 0.975645 0.039839 0000100 0.015149 0.974479 0.07297 10 0000000 0.087452 0.962183 0.421234 Đánh giá Một số luật định bảng 3.9 mô tả cụ thể sau: Luật 1: If (Service = 9, Count = 4, Srv_serror_rate=0, Srv_rerror_rate=0, DTt_host_count = 0, DTt_host_same_srv_rate = 0, DTt_host_diff_srv_rate = 0) then (Attack = 1) với độ chắn cer = 1.00, độ bao phủ cov = 0.135984 độ hỗ trợ (độ mạnh) supp = 0.107753 Luật 5: If (Service = 11, Count = 2, Srv_serror_rate=0, Srv_rerror_rate=0, DTt_host_count = 0, DTt_host_same_srv_rate = 0, DTt_host_diff_srv_rate = 0) then (Attack = 1) với độ chắn cer = 0.999781, độ bao phủ cov = 0.128039 độ hỗ trợ (độ mạnh) supp = 0.101457 Luật 6: If (Service = 9, Count = 0, Srv_serror_rate=0, Srv_rerror_rate=0, DTt_host_count = 0, DTt_host_same_srv_rate = 0, DTt_host_diff_srv_rate = 0) then (Attack = 1) với độ chắn cer = 0.999248, độ bao phủ cov = 0.580696 độ hỗ trợ (độ mạnh) supp = 0.460138 49 3.4.2 Kết thực với nhãn lớp U2R - Trong tổng số 494.021 ghi liệu, có 52 ghi có nhãn U2R - Kết thực chương trình với 494.021 ghi sinh 51 luật (có nhãn U2R nhãn U2R), với 52 ghi liệu có nhãn U2R có luật định sinh nhãn lớp U2R Bảng 3.10 mô tả chung luật định Bảng 3.10: Bảng mô tả giới hạn giá trị độ đo luật định Độ đo hỗ trợ Độ chắn Độ bao phủ (supp) (cer) (cov) Giá trị lớn 0.82709 1.0 0.961538 Giá trị nhỏ 2.0E-6 8.3E-5 2.0E-6 Giá trị độ đo Trong bảng 3.11 mô tả luật uyết định sinh nhãn lớp U2R đại diện cho 51 luật thu Bảng 3.11: Danh sách luật định đại diện cho 51 luật thu Thứ tự Nội dung luật Độ đo hỗ trợ Độ chắn Độ bao phủ (supp) (cer) (cov) Attack 000000000000 0.000101 0.000122 0.961538 010000000000 0.000002 0.018519 0.019231 000000110000 0.000002 0.000083 0.019231 000004000000 0.108922 0.108934 000001330000 0.000065 0.000065 000020110000 0.000006 0.000006 Như vây, đến nhận xét sau: - Khi xét luật định dựa nhiều thuộc tính điều kiện độ chắn tăng lên Tuy nhiên, độ hỗ trợ độ bao phủ suy giảm 50 - Để áp dụng luật định thực tế, cần có ý kiến chuyên gia để lựa chọn luật phù hợp theo nghĩa hài hòa độ đo Trong luận văn, học viên chưa có điều kiện kiểm nghiệm luật đề xuất theo ý kiến chuyên gia Để lựa chọn luật phù hợp cho giai đoạn cảnh báo phát sớm xâm nhập mạng, thường chọn ngưỡng cho độ đo Sau đó, dựa ý kiến chuyên gia chọn luật phù hợp để sử dụng 3.5 Kết luận chương Chương luận văn ứng dụng lý thuyết tập thô nghiên cứu hai chương trước để giải toán phân loại kiểu công liệu KDD Cup 99 Luận văn xây dựng chương trình cài đặt thử nghiệm phân loại hai kiểu công DoS U2R Các kết thử nghiệm chứng tỏ tính hiệu hướng tiếp cận tập thô việc giải toán phân lớp liệu 51 KẾT LUẬN Các kết đạt luận văn: Luận văn đạt số kết sau: (1) Khảo sát tổng quan lý thuyết tập thô ứng dụng tập thô giải toán phân lớp liệu (2) Khảo sát số thuật toán sinh luật định với tập rút gọn thuộc tính tìm dựa hướng tiếp cận tập thô (3) Xây dựng phương pháp phân loại kiểu công liệu KDD Cup 99 dựa tập thô (4) Xây dựng chương trình cài đặt thử nghiệm phân loại hai kiểu công DoS U2R liệu KDD Cup 99 dựa tập thô Với kết trên, học viên hoàn thành mục tiêu đề cho luận văn Hướng phát triển tiếp theo: Học viên tiếp tục nghiên cứu, tìm hiểu thuật toán, phương pháp rút gọn tập thuộc tính, phương pháp sinh tập luật định ứng dụng giải toán thực tế khác dựa lý thuyết tập thô Học viên tiếp tục hoàn thiện chương trình cài đặt thử nghiệm để giải trọn vẹn toán phân loại kiểu công liệu KDD Cup 99 dựa tập thô 52 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Ngọc Minh Châu, Nguyễn Xuân Thảo (2013) -“Một thuật toán tìm tập rút gọn thuộc tính sử dụng ma trận phân biệt được” - Tạp chí Khoa học Phát triển, T 11, S 5, Tr 729-734 Tiếng Anh [2] Allam A.A., Bakeir M.Y and Abo-Tabl E.A (2008) -“Some MethoDT for Generating Topologies by Relations”, Bull Malays Maths.Soc, V 2, No 31, pp 35-45 [3] Chan C.C (1998) – “A rough Sets approach to attribute genneralization in data mining” – Juornal of Information Science V 107, pp.69-176 [4] Gao J., Ma H., Han Zh (2015) - “Atribute Reduction Algorithm Based on Discernibility Matrix with Algegebraic Method” - IIICEC, pp 349-353 [5] Han J., Kamber M (2011) – “Data mining: Concepts and Techniques” - 3nd Edition, Morgan Kaufman Publishers [6] Pawlak Z (2002) –“Rough Set Theory and Its Applications” - Journal of Telecommunications and Information Technology, pp 7-10 [7] Olusola A.A., Oladele A.S and Abosede D.O (2010) –“Analysis of KDD’99 Intrusion Detection Dataset for Selection of Relevance Features” – WCECS, Vol [8] Rampure V., Tiwari A (2014) –“A Rough Set Based Classification Model for The Generation of Decision Rules” - International Journal of Database Theory and Application, V 7, No 5, pp 95-108 [9] Ranpure V., Tiwari A (2015) – “A Rough Set Based Feature Selection on KDD CUP 99 Data Set” - International Journal of Database Theory and Application, V 8, No 1, pp 149-156 [10] Siddiqui M.K and Naahid S (2013) – “Analysis of KDD CUP 99 Dataset using Clustering based Data Mining” - International Journal of Database Theory and Application, V 6, No 5, pp 23-34 53 [11] Tavallaee M., Bagheri E., Lu W and Ghorbani A.A (2009) –“A Detailed Analysis of the KDD CUP 99 Data Set ” – CISDA (IEEE 2009) [12] Vashist R., Gang M.L (2011) –“Rule Generation based on Reduct and Core: A Rough Set Approach” - International Journal of Computer Applicasion, V 29, No 9, pp 1-5 [13] Wang C.R and Ou F.F (2008) - “An Attribute Reduction Algorithm in Rough Set Theory Based on Information Entropy” - International Symposium on Computational Intelligence and Design, IEEE ISCID, pp 3-6 [14] Zhao W., Zhang Z (2005) –“An Email Classification Model Based on Rough Set Theory” - IEEE, pp 403-408 Trang WEB [15] http://kdd.ics.uci.edu/databases/kddcup99/kddcup99.html ... vấn đề ứng dụng kỹ thuật tập thô giải toán phân lớp liệu Chương 2: Nghiên cứu kỹ thuật sinh luật định dựa tập thô Chương luận văn tập trung khảo sát số thuật toán sinh luật định dựa tập thô thường... 1.5 Ứng dụng tập thô giải toán phân lớp liệu 15 1.5.1 Bài toán phân lớp liệu 15 1.5.2 Phân lớp liệu dựa tập thô 16 iv 1.6 Kết luận chương 18 CHƯƠNG 2: NGHIÊN CỨU... CHÍNH VIỄN THÔNG - LÊ THỊ HẰNG NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT TẬP THÔ TRONG PHÂN LỚP DỮ LIỆU CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI

Ngày đăng: 23/10/2017, 12:26

Tài liệu cùng người dùng

Tài liệu liên quan