BÀI TẬP LỚN MÔN KHAI PHÁ DỮ LIỆU

59 133 0
  • Loading ...
1/59 trang

Thông tin tài liệu

Ngày đăng: 11/05/2018, 09:51

báo cáo bài tập lớn môn khái phá dữ liệu dành cho các bạ sinh viên ngành khoa học máy tính hoặc ngành khác muốn nghiên cứu về dataminning hoặc làm về bài tập tiểu luận tốt nghiệp chỉ dẫn cho các bạn các khai phá về dữ liệu áp dụng làm về phần mềm tư vấn mua máy tính cho sinh viên Đề tài: Tìm hiểu định ID3 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN - - - - -o0o- - - - - BÁO CÁO BÀI TẬP LỚN MÔN: KHAI PHÁ DỮ LIỆU Đề tài: TÌM HIỂU CÂY QUYẾT ĐỊNH VÀ ID3 Giáo viên hướng dẫn : Trần Hùng Cường Lớp : KHMT4 – K9 Nhóm sinh viên thực : Nhóm Hà Nội, ngày 04 tháng 04 năm 2018 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN - - - - -o0o- - - - - BÁO CÁO BÀI TẬP LỚN MÔN: HỆ CHUYÊN GIA Đề tài: TÌM HIỂU CÂY QUYẾT ĐỊNH VÀ ID3 Giáo viên hướng dẫn : Trần Hùng Cường Lớp : KHMT4 – K9 Sinh viên thực : Vũ Văn Duy Hoàng Bá Vũ Nguyễn Thị Dịu Dương Đức Tuyến Dương Quang Nam Hà Nội, ngày 04 tháng 04 năm 2018 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 LỜI CẢM ƠN Ngày nay, công nghệ thông tin lĩnh vực thiếu đời sống người Đặc biệt sản phẩm công nghệ thông tin ngày đóng vai trò chun gia nhiều lĩnh vực y học, hóa học, dự báo, mã hóa tri thức lập luận chuyên gia đưa vào máy tính nhằm hỗ trợ người sử dụng Với đề tài “Tìm hiểu định ID3”, chúng em bước đầu làm quen, có cách nhìn nhận đầy đủ hệ thống tiến tới xây dựng phần mềm có khả chuyên gia người lĩnh vực cụ thể Các thuật toán hỗ trợ người sử dụng đưa định có mua máy tính hay khơng? Chỉ cần người sử dụng nhập vào yêu cầu hệ điều hành, mức thu nhập mình, yêu cầu cấu hình máy tính, hãng sản xuất,… Chúng em cố gắng tiếp thu lời góp ý thầy bạn để xây dựng chương trình sử dụng định Tuy vậy, tập lớn nhiều thiếu sót Rất mong thầy bạn đánh giá góp ý Chúng em xin gửi lời cảm ơn chân thành tới thầy Tràn Hùng Cường tận tình hướng dẫn nhóm em nắm bắt kiến thức môn học Khai phá liệu học kỳ Đặc biệt, chúng em xin cảm ơn thầy hướng dẫn nhận xét đánh giá quý báu thầy để chúng em hoàn thành tập lớn Chúng em xin gửi lời cảm ơn ý kiến đóng góp bạn sinh viên lớp để giúp chúng em hoàn thành tập lớn Chúng em xin chân thành cảm ơn! Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 MỤC LỤC CHƯƠNG 1: TÌM HIỂU ĐỀ TÀI BÀI TẬP LỚN 1.1 Mục đích chọn đề tài Với đề tài “ Tìm hiểu định ID3” giúp nhóm thực môn học Hệ chuyên gia, hiểu chất cách xây dựng bước để tạo nên hệ chuyên gia với sở tri thức động suy diễn để đáp ứng với nhu cầu ngày cao xã hội việc cơng nghệ thơng tin hóa 1.2 Lý chọn đề tài Ngày nay, CNTT lĩnh vực thiếu đời sống người Hầu nghành, lĩnh vực, CNTT có mặt Các sản phẩm phần mềm tạo phục vụ đem lại nhiều lợi ích kinh tế phần mềm quản lý , thương mại điện tử, dịch vụ mạng truyền thông… Một câu hỏi đặt cách ta mã hóa tri thức lập luận chuyên gia đưa vào máy tính nhằm hỗ trợ người sử dụng đưa định tư cho họ khơng có chun gia bên cạnh Để đáp ứng nhu cầu đòi hỏi có cơng cụ tư vấn giúp người dùng dễ dàng lựa chọn hay đưa định Nhóm định lựa chọn đề Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 tài “ Tìm hiểu định ID3” để hỗ trợ người sử dụng có thẻ định mua máy tính cho thân 1.3 Quy trình thực - Thu thập tập liệu mẫu từ thực tế - Sử dụng thuật giải ID3 để xây dựng định từ tập liệu mẫu - Từ định sinh tập luật - Thiết kế xây dựng, cài đặt suy diễn tư vấn mua máy tính - Sử dụng C# để phân tích tạo ID3 CHƯƠNG 2: CÂY QUYẾT ĐỊNH 2.1 Cây định 2.1.1 Cây định gì? Việc học định dựa liệu huấn luyện có dạng bảng, cột thuộc tính diều kiện thuộc tính mục tiêu( định), dòng dán nhãn giá trị thuộc tính mục tiêu Chẳng hạn với bảng liệu( Bảng 3.1) thuộc tính “Age” “Salary” thuộc tính điều kiện thuộc tính “Class” thuộc tính mục tiêu ID Age Salary Class 30 65 Good 23 15 Bad 40 75 Good 55 40 Bad 55 100 Good 45 60 Good Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Bảng 3.1 Dữ liệu huấn luyện Cây định công cụ phổ biến nhiều dạng ứng dụng, với chế rút trích dạng luật if- then dựa tập liệu mẫu Sau định nghĩa định Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Cây định dạng đặc biệt cáu trúc nhằm hỗ trợ cho tiến trình định Cây gồm thành phần: o Nút trong: Biểu diễn thuộc tính o Nhánh: Biểu diễn giá trị cụ thể thuộc tính o Nút lá: Đại diện cho giá trị dự đoán thuộc tính mục tiêu Hình 3.1.: Mơ tả định Age H35 Salary H40 Good H50 Good Hình 3.2 Cây định tương ứng với bảng 4.1 Dựa ta đưa định Chẳng hạn với mẫu x=(30,30,?) gán nhãn “Bad” Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 2.1.2 Các kiểu định Cây hồi quy( Regresstion tree) :Ước lượng hàm giá có giá trị số thực thay sử dụng thay sử dụng cho nhiệm vụ phan loại Cây phân loại ( Classification tree): Nếu biến cần tìm hiểu biến phân loại :giới (tính nam hay nữ ), kết trận đấu( thắng hay thua) 2.2 Thuật toán ID3 2.2.1 Thuật toán ID3 xây dựng định Với bảng liệu huấn luyện có nhiều thuộc tính điều kiện Vấn đề đặt lựa chọn thuộc tính làm gốc Để lựa chọn thuộc tính làm gốc ta đưa tiêu chuẩn để đánh giá, tiêu chuẩn độ lợi thơng tin (information Gain) thuộc tính Thuộc tính có độ lợi thông tin lớn chọn làm gốc Độ lợi thơng tin thuộc tính A, ký hiệu Gain( S, A) xác định qua công thức: Gain(S, A)=Entropy(S) -∑((|Sv | / |S|)* Entropy(Sv) ) Thuật toán ID3: Cho X tập vectơ đặc trưng( không gian đặc trưng): X={x1, x2, ,xn} C tập giá trị phân lớp C: X ─> C thực gán nhãn cho phần tử X D= { D = {(x1, c(x1)), (x2, c(x2)),…, (xn, c(xn))} ⊆ X × C} Nhiệm vụ: Dựa D, xây dựng định T xấp xỉ c Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 ID3( D, Atributes, Target) {  Tạo nút t cho  Nếu tất mẫu D thuộc lớp dương trả có nút gốc t dán nhãn “+”  Nếu tất mẫu D thuộc lớp âm trả có nút gốc t dán nhãn “-”  Đặt t nhãn phổ biến thuộc tính mục tiêu D  Nếu Atributes rỗng trả có nút gốc trỏ t  Trường hợp khác: • Đặt A* thuộc tính phân lớp tốt D • Thuộc tính định t A* • Với giá trị a A* thực hiện:  Bổ sung nhánh t ứng với A* = “a”  Đặt D_a tập D chứa mẫu mà A* = “a”  Nếu D_a rơng nhánh bổ sung nút với nhãn phổ biến D  Ngược lại, nhánh bổ sung ID3( D_a, • Trả t Atributes – { A*}, Target) } Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Sau mã giả cho thuật giải ID3: ID3( D, Atributes, Target) { t= createNode() IF IF ∀(x, c(x)) ∈ D: c(x) = THEN label(t) = ‘+’ return(t) ENDIF IF ∀(x, c(x)) ∈ D: c(x) = THEN label(t) = ‘-’ return(t) ENDIF label(t) = mostCommonClass(D, Target) IF Attributes = ∅ THEN return(t) ENDIF A* = argmaxA∈Attributes(Gain(D, A)) FOREACH a∈A* DO Da = {(x, c(x)) ∈ D: x| A* = a} IF Da = ∅ THEN t’ = createNode() label(t’) = mostCommonClass(D, Target) createEdge(t, a, t’) ELSE createEdge(t, a, ID3(Da, Attributes – {A*}, Target)) ENDIF ENDDO return(t) } 10 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 3.2.3 Nhánh OS = Mac OS SMAC OS = {3, 5, 9, 10, 15, 20, 21, 26, 28, 29, 30, 32, 40, 41} Ta có: Entropy(SMac OS) = Xét thuộc tính Age: Entropy(Syouth) = -(1/1)* log2(1/1) = Entropy(Smiddle-aged) = - (3/8)* log2(3/8) – (5/8)* log2(5/8) = 0.954 Entropy(Ssenior) = - (3/5)* log2(3/5) – (2/5)* log2(2/5) = 0.971 → Gain(SMAC OS , Age) = Entropy(S MAC OS) – (1/14) * Entropy(Syouth) – (8/14) * Entropy(Smiddle-aged) – (5/14) * Entropy(Ssenior) = – (1/14) * – (8/14) * 0.954 – (5/14) * 0.971 = 0.108 Xét thuộc tính Sex: Entropy(Smale) = - (4/7)* log2(4/7) – (3/7)* log2(3/7) = 0.985 Entropy(Sfemale) = - (3/7)* log2(3/7) – (4/7)* log2(4/7) = 0.985 → Gain(SLinux, Sex) = Entropy(SMAC OS) – (7/14) * Entropy(Smale) – (7/14) * Entropy(Sfemale) = – (7/14) * 0.985 – (7/14) * 0.985 = 0.015 Xét thuộc tính Income: Entropy(Shigh) = - (1/2)* log2(1/2) – (1/2)* log2(1/2) = Entropy(Smedium) = - (6/8)* log2(6/8) – (2/8)* log2(2/8) = 0.811 Entropy(Slow) = - (4/4) log2(4/4) = → Gain(SMAC OS, Income) = Entropy(SMAC OS ) – (2/14) * Entropy(Shigh) – (8/14) * Entropy(Smedium) – (4/14) * Entropy(Slow) = – (2/14) * 1– (8/14) * 0.811 – (4/14) * = 0.394 Xét thuộc tính Configuration: Entropy(Shigh) = - (4/6)* log2(4/6) – (2/6)* log2(2/6) = 0.918 Entropy(Smedium) = - (2/6)* log2(2/6) – (4/6)* log2(4/6) = 0.918 45 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Entropy(Slow) = - (1/2)* log2(1/2) – (1/2)* log2(1/2) = → Gain(SMAC OS , Configuration) = Entropy(SMAC OS ) – (6/14) * Entropy(Shigh) – (6/14) * Entropy(Smedium) – (2/14) * Entropy(Slow) = – (6/14) * 0.918 – (6/14) * 0.918 – (2/14) * = 0.070 Xét thuộc tính Manufacturers: Entropy(SAPPLE) = - (7/13)* log2(7/13) – (6/13)* log2(6/13) = 0.996 Entropy(SSONY) = - (1/1) log2(1/1) = → Gain(SMAC OS , Manufacturers) = Entropy(SMAC OS ) – (13/14) * Entropy(SAPPLE) – (1/14) * Entropy(SSONY) = – (13/14)*0.996 – (1/14)*0 = 0.075 Trong thuộc tính điều kiện ta thấy “Income” có độ lợi thơng tin lớn nên thuộc tính chọn làm gốc Bây ta tiếp tục xét nhánh Income 46 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Nhánh Income = high Smedium = {3, 29} Ta có: Entropy(SHigh) = Xét thuộc tính Age: Entropy(SMiddle-aged) = - (1/1)* log2(1/1) = Entropy(SSenior) = - (1/1)* log2(1/1) = → Gain(SHigh, Age) = Entropy(SHigh) – (1/2) * Entropy(SMiddle-aged) (1/2) * Entropy(SSenior) = – (1/2) * – (1/2) * =1 Xét thuộc tính Sex: Entropy(Sfemale) = - (1/2)* log2(1/2) – (1/2)* log2(1/2) = → Gain(SHigh, Sex) = Entropy(SHigh) – (2/2) * Entropy(Sfemale) = – (2/2) * =0 Xét thuộc tính Configuration: Entropy(Shigh) = - (1/1)* log2(1/1) = Entropy(Smedium) = - (1/1)* log2(1/1) = → Gain(Shigh, Income) = Entropy(Shigh) – (1/2) * Entropy(Shigh) – (1/2) * Entropy(Smedium) = – (1/2) * – (1/2) *0 =1 Xét thuộc tính Manufacturers: Entropy(SAPPLE) = - (1/2)* log2(1/2) – (1/2)* log2(1/2) = → Gain(Shigh, Manufacturers) = Entropy(Shigh) –(2/2) * Entropy(SAPPLE) = – (2/2)*1 =0 Có thuộc tính Age Configuration có độ lợi thơng tin nên ta chọn thuộc tính để làm gốc Chọn thuộc tính Age làm gốc Bây ta tiếp tục xét nhánh Age Nhánh Age = middle- age Smiddle-aged= { 29 } (NO) 47 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Do Entropy(Smiddle-aged) = nên nhánh dừng Nhánh Age = senior Ssenior = { } (YES) Do Entropy(Ssenior) = nên nhánh dừng Nhánh Income = medium Smedium = {5, 10, 20, 26, 28, 30, 40, 41} Ta có: Entropy(Smedium) = 0.811 Xét thuộc tính Age: Entropy(Syouth) = - (1/1)* log2(1/1) = Entropy(Smiddle-aged) = - (3/4)* log2(3/4) – (1/4)* log2(1/4) = 0.811 Entropy(Ssenior) = - (2/3)* log2(2/3) – (1/3)* log2(1/3) = 0.918 → Gain(Smedium, Age) = Entropy(Smedium) – (1/8) * Entropy(Syouth) – (4/8) * Entropy(Smiddle-aged) – (3/8) * Entropy(Ssenior) = 0.811 – (1/8) * – (4/8) * 0.811 – (3/8) * 0.918 = 0.061 48 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Xét thuộc tính Sex: Entropy(Smale) = - (4/5)* log2(4/5) – (1/5)* log2(1/5) = 0.722 Entropy(Sfemale) = - (2/3)* log2(2/3) – (1/3)* log2(1/3) = 0.918 → Gain(Smedium, Sex) = Entropy(Smedium) – (5/8) * Entropy(Smale) – (3/8) * Entropy(Sfemale) = 0.811 – (5/8) * 0.722 – (3/8) * 0.918 = 0.016 Xét thuộc tính Configuration: Entropy(Shigh) = - (3/4)* log2(3/4) – (1/4)* log2(1/4) = 0.811 Entropy(Smedium) = - (2/3)* log2(2/3) – (1/3)* log2(1/3) = 0.918 Entropy(Slow) = - (1/1)* log2(1/1) = → Gain(Smedium, Configuration) = Entropy(Smedium) – (4/8) * Entropy(Shigh) – (3/8) * Entropy(Smedium) – (1/8) * Entropy(Slow) = 0.811 – (4/8) * 0.811 – (3/8) * 0.918 – (1/8) * = 0.061 Xét thuộc tính Manufacturers: Entropy(SAPPLE) = - (6/7)* log2(6/7) – (1/7)* log2(1/7) = 0.592 Entropy(SSONY) = - (1/1)* log2(1/1) = → Gain(Smedium, Manufacturers) = Entropy(Smedium) – (7/8) * Entropy(SAPPLE) – (1/8) * Entropy(SSONY) = 0.811 – (7/8) * 0.592 – (1/8) * = 0.293 Trong thuộc tính điều kiện ta thấy “Manufacturers” có độ lợi thơng tin lớn nên thuộc tính chọn làm gốc Bây ta tiếp tục xét nhánh Manufacturers Nhánh Manufacturers = SONY SSONY= { 41 } (NO) 49 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Do Entropy(SSONY) = nên nhánh dừng Nhánh Manufacturers = APPLE SAPPLE= { 5, 10, 20, 26, 28, 30, 40 } Entropy(SAPPLE) = 0.592 Xét thuộc tính Age: Entropy(Syouth) = - (1/1)* log2(1/1) = Entropy(Smiddle-aged) = - (3/4)* log2(3/4) – (1/4)* log2(1/4) = 0.811 Entropy(Ssenior) = - (2/2)* log2(2/2) = → Gain(SAPPLE, Age) = Entropy(SAPPLE) – (1/7) * Entropy(Syouth) – (4/7) * Entropy(Smiddle-aged) – (2/7) * Entropy(Ssenior) = 0.592 – (1/7) * – (4/7) * 0.811 – (2/7) * = 0.129 Xét thuộc tính Sex: Entropy(Smale) = - (4/4)* log2(4/4) = Entropy(Sfemale) = - (2/3)* log2(2/3) – (1/3)* log2(1/3) = 0.918 → Gain(SAPPLE, Sex) = Entropy(SAPPLE) – (4/7) * Entropy(Smale) – (3/7) * Entropy(Sfemale) = 0.592 – (4/7) * – (3/7) * 0.918 = 0.199 Xét thuộc tính Configuration: 50 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Entropy(Shigh) = - (3/3)* log2(3/3) = Entropy(Smedium) = - (2/3)* log2(2/3) – (1/3)* log2(1/3) = 0.918 Entropy(Slow) = - (1/1)* log2(1/1) = → Gain(SAPPLE, Configuration) = Entropy(SAPPLE) – (3/7) * Entropy(Shigh) – (3/7) * Entropy(Smedium) – (1/7) * Entropy(Slow) = 0.592 – (3/7) * – (3/7) * 0.918 – (1/7) * = 0.199 Trong thuộc tính điều kiện ta thấy “Sex” “Configuration” có độ lợi thơng tin lớn nên chọn thuộc tính để làm gốc Chọn thuộc tính “Sex” làm gốc Nhánh Sex = male Smale= {5, 10, 28, 30} (YES) Do Entropy(Smale) = nên nhánh dừng Nhánh Sex = female Sfemale= {20, 26, 40} Entropy(Sfemale) = 0.918 Xét thuộc tính Age: Entropy(Ssenior) = - (1/1)* log2(1/1) = Entropy(Smiddle-aged) = - (1/2)* log2(1/2) – (1/2)* log2(1/2) = → Gain(Sfemale, Age) = Entropy(Sfemale) – (1/3) * Entropy(Syouth) – (2/3) * Entropy(Smiddle-aged) = 0.918 – (1/3) * – (2/3) * 1= 0.251 Xét thuộc tính congiguration Entropy(Smedium) = - (1/1)* log2(1/1) =0 51 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Entropy(Slow) =- (1/1)* log2(1/1)=0 Entropy(Shigh) =- (1/1)* log2(1/1)=0 → Gain(Sfemale, Còniguration) = Entropy(Sfemale) – (2/3) * Entropy(Smale) – (1/3) * Entropy(Sfemale) = 0.918 –0 = 0.918 Trong thuộc tính điều kiện ta thấy “configuration” có độ lợi thơng tin lớn nên thuộc tính chọn làm gốc Xét giá trị thuộc tính configuration: Entropy(Smedium) = - (1/1)* log2(1/1) =0 nhánh dừng (NO) Entropy(Slow) =- (1/1)* log2(1/1)=0 nhánh dừng (YES) Entropy(Shigh) =- (1/1)* log2(1/1)=0 nhánh dừng (YES) Nhánh Income = low Slow = {9, 15, 21, 32} (NO) Do Entropy(Slow) = nên nhánh dừng 52 Nhóm – Lớp KHMT4 – K9 hDELL hfemale hmale Đề tài: Tìm hiểu định ID3 Yess Nhánh Mac OS hoàn thành ta xây dựng định: hmedium hhigh hlow hHP Nhánh OS= “Mac OS”: hASUS hAPPLE hSONY SAMSUN G Yes Hình 4.2.3 Nhánh Mac OS 53 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Tập luật sinh cho nhánh Mac OS: • Rule 22: IF OS = Mac OS AND Income = low THEN Buy = No • Rule 23: IF OS = Mac OS AND Income = high AND Age = middle- age THEN Buy = No • Rule 24: IF OS = Mac OS AND Income = high AND Age = youth THEN Buy = No • Rule 25: IF OS = Mac OS AND Income = high AND Age = senior THEN Buy = Yes • Rule 26: IF OS = Mac OS AND Income = medium AND Manufacturers = ASUS THEN Buy = Yes • Rule 27: IF OS = Mac OS AND Income = medium AND Manufacturers = DELL THEN Buy = Yes • Rule 28: IF OS = Mac OS AND Income = medium AND Manufacturers = HP THEN Buy = Yes • Rule 29: IF OS = Mac OS AND Income = medium AND Manufacturers = SONY THEN Buy = No • Rule 30: IF OS = Mac OS AND Income = medium AND Manufacturers = APPLE AND Sex= male THEN Buy = Yes • Rule 31: IF OS = Mac OS AND Income = medium AND Manufacturers = APPLE AND Sex= female AND configuration = low THEN Buy = Yes • Rule 32: IF OS = Mac OS AND Income = medium AND Manufacturers = APPLE AND Sex= female AND configuration = high THEN Buy = Yes hhigh • Rule 33: IF OS = Mac OS AND Hmiddle-age Income = medium AND Hsenior hyouth AND Sex= female AND configuration = Manufacturers = APPLE medium THEN Buy = NO • Rule 34: IF OS = Mac OS ANDYesIncome = medium AND No No Manufacturers = SAMSUNG THEN Buy = Yes hmediu Sex No Yes Yes Yes 54 Nhóm – Lớp KHMT4 – K9 Age Đề tài: Tìm hiểu định ID3 hlo CHƯƠNG 4: XÂY DỰNG CHƯƠNG TRÌNH 4.1 Lập trình ngơn ngữ C# 4.1.1 Sơ lược phần mềm Chương trình TuVanMuaMayTinh viết tảng ngôn ngữ C# Sử dụng SQL server để lưu trữ liệu (Tập liệu huấn luyện tập luật sinh ra) IV.1.1.1 Ưu điểm - Có khả tự động tính tốn sinh định, từ tự động sinh tập luật để tự đưa câu trả lời - Linh hoạt thay đổi tập liệu huấn luyện - Đáp án xác - Gọn nhẹ, dễ dàng sử dụng - Dễ hiểu, định tự mở nhánh theo câu trả lời người dùng IV.1.1.2 Khuyết điểm - Máy tính cần cài đặt Net Framework SQL server để chạy chương trình 55 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 4.2 Hướng dẫn sử dụng 4.2.1 Hướng dẫn sử dụng Chương trình tính toán để tạo định Sau khởi tạo xong định 56 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Ví dụ chọn nhánh OS=Mac OS Trong nhánh Mac OS lại chọn Income=high 57 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 Tiếp tục chương trình lại hỏi Age, chọn Senior Cuối ta câu trả lời 58 Nhóm – Lớp KHMT4 – K9 Đề tài: Tìm hiểu định ID3 CHƯƠNG 5: TÀI LIỆU THAM KHẢO - Khai phá liệu- ThS Trần Hùng Cường - Khoa CNTT -ĐH Công Nghiệp Hà Nội - Wikipedia: Cây Quyết Định http://vi.wikipedia.org/wiki/C%C3%A2y_quy%E1%BA%BFt_ %C4%91%E1%BB%8Bnh Đề Tài Nghiên Cứu Cây Quyết Định http://doc.edu.vn/tai-lieu/de-tai-nghien-cuu-cay-quyet-dinh-decision-tree7608/ - Thuật Toán Quyết Đinh C-45 https://docs.google.com/presentation/d/1TUE1q1dPjmXdPgoqZ3nxJvf7LLNF9sragQnhIVebec/edit#slide=id.p14 - Học Máy -GV Phạm Ngọc Nam - Khoa CNTT- ĐH Tôn Đức Thắng - Đồ Án Xây Dựng Hệ Chuyên Gia- Đại Học Bách Khoa Hà Nội http://luanvan365.com/luan-van/do-an-xay-dung-he-chuyen-gia-chandoan-loi-phan-cung-may-tinh-30283/ - Luận văn thi trắc nghiệm HCG http://luanvan365.com/luan-van/luan-van-thi-trac-nghiem-co-ho-tro-cuahe-chuyen-gia-28432/ - Cây định với toán phân lớp (Decision Tree with Classification Problem) http://bis.net.vn/forums/t/378.aspx Phần mềm sử dụng - Phần mềm Visual Studio 59 Nhóm – Lớp KHMT4 – K9
- Xem thêm -

Xem thêm: BÀI TẬP LỚN MÔN KHAI PHÁ DỮ LIỆU, BÀI TẬP LỚN MÔN KHAI PHÁ DỮ LIỆU, CHƯƠNG 1: TÌM HIỂU ĐỀ TÀI BÀI TẬP LỚN, CHƯƠNG 3: KẾT QUẢ THỰC NGHIỆM, CHƯƠNG 4: XÂY DỰNG CHƯƠNG TRÌNH

Từ khóa liên quan

Gợi ý tài liệu liên quan cho bạn

Nhận lời giải ngay chưa đến 10 phút Đăng bài tập ngay