giới thiệu về khai phá dữ liệu sử dụng cây quyết định

Tiểu luận môn khai phá dữ liệu SỬ DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LỚP DỮ LIỆU

Tiểu luận môn khai phá dữ liệu SỬ DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LỚP DỮ LIỆU

Ngày tải lên : 09/04/2015, 22:02
... tài môn học Khai thác liệu CHƯƠNG - KHAI PHÁ DỮ LIỆU - KỸ THUẬT VÀ CƠNG CỤ Cơng nghệ khai phá liệu biết dạng tiến hóa công nghệ sở liệu Khai phá liệu có mục đích phát tri thức sở liệu Về kỹ thuật: ... Phân tích số liệu sử dụng cơng cụ Microsoft: 11 CHƯƠNG 2- SỬ DỤNG CÂY QUYẾT ĐỊNH ĐỂ PHÂN LỚP DỮ LIỆU 15 I.Tổng quan phân lớp liệu khai phá liệu 15 1.Phân lớp liệu ... phân cụm liệu sử dụng bước tiền xử lí cho thuật tốn khai phá liệu khác • Khai phá luật kết hợp: mục tiêu phương pháp phát đưa mối liên hệ giá trị liệu sở liệu Mẫu đầu giải thuật khai phá liệu tập...
  • 33
  • 748
  • 0
Giới thiệu về khai phá dữ liệu

Giới thiệu về khai phá dữ liệu

Ngày tải lên : 03/07/2015, 15:21
... tràn ngập liệu – Nhưng lại thiếu (cần) tri thức Khai phá liệu: Giúp tự động phân tích tập liệu lớn, lớn để khám phá tri thức Khai Phá Dữ Liệu Khai phá liệuĐịnh nghĩa p ệ ị g Khai phá liệu (Data ... môn học: Giới thiệu Khai phá liệu Giới thiệu công cụ WEKA ề Tiền xử lý liệu Phát luật kết hợp Các kỹ thuật phân lớp dự đoán Các kỹ thuật phân nhóm Khai Phá Dữ Liệu Tại cần khai p phá liệu? ệ Sự ... trình ( g dụng) p g (ứng ụ g) phân tích liệu mới, phức ệ ,p tạp Khai Phá Dữ Liệu 12 DM – Nhiều cách nhìn (quan điểm) Dữ liệu khai phá Dữ liệu quan hệ, kho liệu, liệu giao dịch, luồng liệu, liệu hướng...
  • 30
  • 317
  • 0
Tiểu luận môn khai phá dữ liệu MÔ HÌNH CÂY QUYẾT ĐỊNH THUẬT TOÁN C4.5

Tiểu luận môn khai phá dữ liệu MÔ HÌNH CÂY QUYẾT ĐỊNH THUẬT TOÁN C4.5

Ngày tải lên : 09/04/2015, 22:49
... Đây phương pháp sử dụng phổ biến số thuật toán học quy nạp, áp dụng thành cơng ứng dụng y khoa tài chẩn đốn bệnh hay đánh giá rủi ro tín dụng 1.1 Cây định số ứng dụng Cây định phương pháp phân ... Thuật toán C4.5 3.1 Giới thiệu C4.5 Với đặc điểm C4.5 thuật toán phân lớp liệu dựa định hiệu phổ biến ứng dụng khai phá sở liệu có kích thước nhỏ C4.5 sử dụng chế lưu trữ liệu thường trú nhớ, ... con: tập liệu đào tạo, tập liệu kiểm tra sử dụng để cắt tỉa tập liệu thử nghiệm sử dụng để cung cấp ước tính xác 19 Ảnh hưởng phương pháp giảm lỗi cắt tỉa học định Sử dụng liệu riêng biệt để cắt...
  • 29
  • 1.6K
  • 10
Giới thiệu về khai thác dữ liệu DM

Giới thiệu về khai thác dữ liệu DM

Ngày tải lên : 31/08/2012, 16:12
... ốn r i ro 14 … TH NÀO LÀ KHAI THÁC DL T i c n Khai thác d li u (KTDL)? Nh ng i tư ng s d ng KTDL ? S d ng KTDL âu nào? S d ng KTDL th ? T i c n nghiên c u KTDL? L ch s phát tri n KTDL ? … Xem ... excellent yes high yes fair yes medium no excellent no 13 TH NÀO LÀ KHAI THÁC DL Là q trình l p, khơng ph i plug - and – play Khai thác d li u q trình khơng t m thư ng c a vi c xác nh m u ti m ... kinh t ,… S quan tâm n ki n th c, v n m i M c tiêu môn h c : Cung c p khái ni m k thu t b n c a khai thác d li u (DM) Chuy n d li u v d ng phù h p Tìm tri th c t d li u Bi u di n, ánh giá tri...
  • 9
  • 753
  • 14
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho cơ sở dữ liệu về chế độ ăn kiêng Fiber.arff

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho cơ sở dữ liệu về chế độ ăn kiêng Fiber.arff

Ngày tải lên : 16/12/2013, 15:04
... Weka lấy liệu từ file có định dạng arff, phát sinh từ file bảng sở liệu  Cách sử dụng Weka thông qua giao diện đồ họa Page Lê Hồng Việt-HTTT6 -Khai phá liệu weka II Mơ tả tốn Với sở liệu Fiber,tạm ... Việt-HTTT6 -Khai phá liệu weka Xây dựng định Qui trình Train Test classifier - Dữ liệu để xây dựng mơ hình: liệu gốc (original dataset), liệu phải có thuộc tính phân lớp gọi categorical attribute - Dữ liệu ... IV.Tiến hành thực nghiệm sở liệu weka Với giao diện : Page Lê Hoàng Việt-HTTT6 -Khai phá liệu weka Gồm phần : +Explorer: Sử dụng menu lựa chọn Explorer sử dụng cho liệu vừa nhỏ +Experimeter: Cho...
  • 36
  • 4.3K
  • 27
Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho cơ sở dữ liệu về chế độ ăn kiêng Pima Indians Diabetes

Tiểu luận khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho cơ sở dữ liệu về chế độ ăn kiêng Pima Indians Diabetes

Ngày tải lên : 16/12/2013, 15:11
... Page BÁO CÁO KHAI PHÁ DỮ LIỆU Mở Weka chọn sở liệu Pima Indians Diabetes : 2.Phân lớp sử dụng định với J48 2.1 Sử dụng tất training cho - Nhấn vào tab Classify chọn thuật toán sử dụng cách nhấn ... trường cho phép s dụng tấtcảcác khảnăng WEKA đểMôi trường cho phép sử dụng tất khả WEKA để khám phá liệu Giao diện: Tạ Thị Thu Hương_CNPM6 Page BÁO CÁO KHAI PHÁ DỮ LIỆU • Khn dạng tập liệu - Weka ... CÁO KHAI PHÁ DỮ LIỆU I -Giới thiệu cơng cụ Weka • Weka công cụ phần mềm viết Java,phục vụ lĩnh vực học máy khai phá liệu • Các tính - Một tập hợp cơng cụ tiền xử lý liệu, các giải thuật học máy,khai...
  • 24
  • 859
  • 4
Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Tiểu luận Khai phá dữ liệu : sử dụng phần mềm WEKA cho bộ dữ liệu Tic Tac Toe

Ngày tải lên : 03/12/2013, 16:03
... với mẫu liệu Tic Tac Toe.arff Test set  Dữ liệu xây dựng mô hình  Dữ liệu để xây dựng mơ hình: liệu gốc (original dataset), liệu phải có thuộc tính phân lớp (categorical attribute) Dữ liệu gốc ... nghiệm Dữ liệu chia làm 10 Folds trình Train/Test Model thực lặp lại 10 lần Tại lần Train/Test Model, phần liệu dùng để Test phần lại dùng để Train Sử dụng công cụ KnowledgeFlow Xác định nguồn định ... kiểm định mẫu - Model)  Chia nhỏ tập liệu theo phương pháp CV (Cross-Validation) trình huấn luyện kiểm lỗi mơ hình phân lớp Đây kỹ thuật chủ yếu sử dụng xây dựng predictive Model Trong liệu...
  • 11
  • 1.1K
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Gamers với thuật toán phân lớp

Ngày tải lên : 03/12/2013, 16:07
... Tiền xử lý liệu: Trong qui trình khai phá liệu, công việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích ... I Mô tả Cho sở liệu người chơi Games , nghiên cứu gói liệu để rút phương hướng phát hành , thu phí thị trường phát triển game ngày Đây vấn đề quan tâm , đại phận giới trẻ Bộ liệu ghi người chơi ... Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mơ hình áp dụng cho liệu rời rạc (như luật kết hợp ) bạn phải thực việc rời rạc hóa liệu Trong tốn , bước tiền xử lý liệu cụ thể sau: -...
  • 16
  • 1.6K
  • 36
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Congressional Voting Records

Ngày tải lên : 03/12/2013, 16:07
... cần sử dụng khai phá liệu cần 4/17 thuộc tính, ta sử dụng thuộc tính này: adoption-of-the-budget-resolution anti-satellite-test-ban aid-to-nicaraguan-contras immigration III1- Tiền xử lý liệu Giới ... Giới thiệu tiền xử lý liệu (Data Preprocessing) - Trong qui trình khai phá liệu, cơng việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu ... Attribute Evaluator Để xác định phương pháp đánh giá mức • Attribute Evaluator Để xác định phương pháp đánh giá mức độ phù hợpcủa thuộc tính b Search Method Để xác định mộtphương pháp (thứ tự) xét thuộc...
  • 19
  • 1.1K
  • 5
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu meta data

Ngày tải lên : 03/12/2013, 16:08
... % 528 -Cây định -95% liệu để xây dựng, 5% liệu test 2011 Meta Data -90% d liệu ểxâydựng, 10% d liệu test -85% d liệu ểxâydựng, 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test ... iscrim,ITrule,IndCART,KNN,Kohonen,LVQ,LogDisc,NewId,QuaDisc,RBF,Smart} Norm_error real -Training data 3.TIến hành Weka -Đưa liệu vào Weka 2011 Meta Data -Sử dụng toàn liệu để training 2011 Meta Data -Nội dung kếtquả === Classifier model (full ... 15% liệu test 2011 Meta Data -70% d liệu ểxâydựng, 30% d liệu test 2011 Meta Data -50% d liệu ểxâydựng, 50% d liệu test 2011 Meta Data ...
  • 9
  • 1.4K
  • 16
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm Weka phân lớp cho khả năng phê duyệt tín dụng cho các ứng dụng thẻ tín dụng

Ngày tải lên : 03/12/2013, 16:10
... duyệt tín dụng cho ứng dụng thẻ tín dụng Tạo định khả phê duyệt ứng dụng thẻ tín dụng để hỗ trợ cho việc quản lý tín dụng hiệu IV TIẾN HÀNH THỰC NGHIỆM TRÊN WEKA Tiền xử lý liệu Dữ liệu ban đầu ... tín dụng cho ứng dụng thẻ tín dụng II XÂY DỰNG CƠ SỞ DỮ LIỆU Trong đề tài này, tập tin chứa ứng dụng thẻ tín dụng Tất tên thuộc tính giá trị thay biểu tượng vơ nghĩa để bảo vệ bí mật liệu, số liệu ... cách click vào , lúc bảng liệu xuất để bạn chỉnh sửa 2 Xây dựng định với J48 - Bước ta sử dụng tất liệu để trainning cho cây: Nhấn vào tab Classify chọn thuật toán sử dụng cách nhấn vào nút Choose;...
  • 19
  • 2K
  • 9
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu STATLOG (Vehicle Silhouettes)

Ngày tải lên : 03/12/2013, 16:11
... 11/2011 Vũ Tuấn Anh- Khai phá liệu -85% d liệu ểxâydựng, 15% test 13 11/2011 Vũ Tuấn Anh- Khai phá liệu -80% d liệu ểxâydựng, 20% test 14 11/2011 Vũ Tuấn Anh- Khai phá liệu -60% d liệu ểxâydựng, 40% ... Anh- Khai phá liệu a b c d < classified as 28 0 | a = van 19 0 | b = saab 0 26 | c = bus 16 | d = opel -Câyquyếtđịnh: -95% d liệu ểxâydựng, 5% test 11 11/2011 Vũ Tuấn Anh- Khai phá liệu -90% d liệu ểxâydựng, ... polygon) -Training data 11/2011 Vũ Tuấn Anh- Khai phá liệu 3.Tiến hành Weka -Đưa liệu vào Weka -Sử dụng toàn liệu để Training: 11/2011 Vũ Tuấn Anh- Khai phá liệu *Nội dung kếtquả === Run information...
  • 16
  • 791
  • 3
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu Abalone( bào ngư) với thuật toán phân lớp

Ngày tải lên : 03/12/2013, 16:20
... trình khai phá liệu, công việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu qua thu thập liệu (gọi liệu gốc original data) áp dụng (thích hợp) với mơ hình khai phá liệu ... Transformation: Chuyển đổi liệu cho phù hợp với mơ chuyển đổi liệu từ numeric qua nomial hay ordinal o Discretization (rời rạc hóa liệu) : Nếu bạn có liệu liên tục vài mơ hình áp dụng cho liệu rời rạc (như ... lý liệu bao gồm công việc như: o Filtering Attributes: Chọn thuộc tính phù hợp với mơ hình o Filtering samples: Lọc mẫu (instances, patterns) liệu cho mơ hình o Clean data: Làm liệu xóa bỏ liệu...
  • 15
  • 1.8K
  • 7
Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Tiểu luận Khai phá dữ liệu: Sử dụng phần mềm weka khai phá bộ dữ liệu bank-data

Ngày tải lên : 03/12/2013, 16:29
... “income” mơ hình khai phá luật kết hợp khơng làm việc với kiểu liệu liên tục Quá trình goi rời rạc hóa liệu (Discretization) Nạp liệu (Loading the Data) Thông thường, định dạng chuẩn file liệu Weka ... “income” ta lưu lại file liệu cuối có tên “bank-data-final.arff” B ,Khai phá luật kết hợp(Association rule mining) Bây giờ, với file liệu qua q trình lọc thuộc tính id rời rạc hóa liệu thuộc tính “children”, ... việc liệu nominal (như association rule mining) Sau kết thực thuật toán Apriori để phát luật kết hợp file liệu “bank-data-final.arff” Click vào tab "Associate" để mở giao diện thuật toán khai phá...
  • 28
  • 4.9K
  • 20
Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Tiểu luận KHAI PHÁ DỮ LIỆU: Sử dụng phần mềm Weka khai phá bộ dữ liệu Computer hardware với thuật toán phân lớp

Ngày tải lên : 03/12/2013, 17:09
... truyền Giải toán sử dụng phân lớp Giới thiệu tiền xử lý liệu (Data Preprocessing) Trong qui trình khai phá liệu, cơng việc xử lý liệu trước đưa vào mơ hình cần thiết, bước làm cho liệu có ban đầu ... CNPM – Sử dụng weka để phân lớp cho dataset Computer Hardware Quy trình thực huấn luyện phân lớp với mẫu liệu machine.arff Dữ liệu để xây dựng mơ hình: + Dữ liệu gốc (original dataset) tập liệu ... liệu có ban đầu qua thu thập liệu (gọi liệu gốc ordinal data) áp dụng (thích hợp) với mơ hình khai phá liệu (data mining model) cụ thể Các công việc cụ thể tiền xử lý liệu bao gồm công việc như:...
  • 17
  • 1.9K
  • 14
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu Sick-euthyroid

Ngày tải lên : 03/12/2013, 20:40
... Lưu lại liệu SE2.Ta sử dụng dataset để phân lớp Thuật toán phân lớp 1.Thực thuật toán Đối với dataset sử dụng thuật toán phân lớp: định J48 Với liệu chia thành 10 phần Page KHAI PHÁ DỮ LIỆU Kết ... WrapperSubsetEval, mục Classifier chọn NaiveBayes hình sau Page KHAI PHÁ DỮ LIỆU Trong mục Search Method chọn GredySteepWise Thu kết Page KHAI PHÁ DỮ LIỆU === Run information === Evaluator: weka.attributeSelection.WrapperSubsetEval ... T3_measured T3 TT4_measured T4U_measured FTI TBG_measured Page KHAI PHÁ DỮ LIỆU Sau trích chọn thuộc tính nhứng thuộc tính cần để sử dụng là: query_on_thyroxine, on_antithyroid_medication, thyroid_surgery,...
  • 30
  • 920
  • 9
Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Tiểu luận khai phá dữ liệu: sử dụng phần mềm weka cho bộ dữ liệu dataset El Nino

Ngày tải lên : 03/12/2013, 20:42
... Training set : gồm 783 mẫu liệu  Testing set : gồm 178080 mẫu dự liệu 12 thuộc tính III Thuật toán phân cụm K Mean Phân cụm kỹ thuật quan trọng khai phá liệu, thuộc lớp phương pháp Unsupervised Learning ... http://archive.ics.uci.edu/ml/datasets/El+Nino Bài toán thực : Khai phá liệu Weka với toán phân cụm Thuật toán: Simple K-Mean I .Giới thiệu El-Nino ban đầu tên dòng hải lưu chảy theo hướng nam ngồi ... Kỹ thuật phân cụm áp dụng nhiều lĩnh vực như: • Marketing: Xác định nhóm khách hàng (khách hàng tiềm năng, khách hàng giá trị, phân loại dự đoán hành vi khách hàng,…) sử dụng sản phẩm hay dịch...
  • 18
  • 1.1K
  • 1
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên Dataset SpamBase

Ngày tải lên : 03/12/2013, 20:56
... 2.1 Tiền xử lý liệu 2.1.1 Nạp liệu Thông thường, định dạng chuẩn file liệu Weka la file ARFF (Attribute Relation File Format), nhiên nhiều DBMS Spreadsheet cho phép tổ chức file liệu dạng file ... (P(Bk) P(A/Bk) )/(ΣP(Bi) P(A/Bi)) Phương pháp phân loại Naïve-Bayesian Phân loại Bayesian phương pháp phân loại sử dụng tri thức xác suất qua huấn luyện Phương pháp thích hợp với lớp tốn đòi hỏi phải ... Vì sử dụng cách thứ ba tổng hợp hai cách : P(X=w | C=spam) = ((s*ns)/Ns)/((ns*s)/Ns+(nn*n)/Nn)) Còn token xuất kho ngữ liệu mà không xuất kho ngữ liệu khơng thể kết luận token xuât kho ngữ liệu...
  • 17
  • 1.8K
  • 13
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Flags

Ngày tải lên : 03/12/2013, 21:01
... định J48 • Bước ta sử dụng tất liệu để training cho cây: - Nhấn vào tab Classify chọn thuật toán sử dụng cách nhấn vào nút Choose; thư mục thư mục Trees/J48:  - Để tiến hành trainning toàn liệu ... xong liệu click vào button để lưu lại bảng liệu Ta nhận thấy thuộc tính area population sau xử lý xong có số giá trị khơng sử dụng đến 1, 2, 3, để loại bỏ giá trị ta lưu bảng liệu lại với định ... 0 0 | h = brown - Đọc nội dung kết quả: - Kết trả theo vùng liệu: • Vùng Run Information: cho biết thông tin liệu nguồn + Đề án sử dụng: weka.classifiers.trees.J48 -C 0.25 -M + CSDL: flag1 +...
  • 30
  • 750
  • 4
Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Post-Operative Patient

Tiểu luận khai phá dữ liệu: Sử dụng weka để phân lớp trên dataset Post-Operative Patient

Ngày tải lên : 03/12/2013, 21:02
... Đức – Khai phá liệu -Lấy 80% liệu để xây dựng,20% liệu để test 12 2011 Phạm Minh Đức – Khai phá liệu -Lấy75% liệu để xây dựng,25% liệu để test 13 2011 Phạm Minh Đức – Khai phá liệu -Lấy60% liệu ... 0 0| d=I -Cây quyết ịnh 0.744 0.662 0.596 Phạm Minh Đức – Khai phá liệu -Lấy 95% liệu để xây dựng,5% liệu để test 10 2011 Phạm Minh Đức – Khai phá liệu -Lấy 90% liệu để xây dựng,10% liệu để test ... -Training data Phạm Minh Đức – Khai phá liệu 3.Tiến hành Weka -Đưa liệu vàoWeka 2011 Phạm Minh Đức – Khai phá liệu -Sử dụng toàn liệu để training 2011 Phạm Minh Đức – Khai phá liệu -Nội dung kết quả:...
  • 15
  • 585
  • 0