0
  1. Trang chủ >
  2. Công Nghệ Thông Tin >
  3. Cơ sở dữ liệu >

Bài giảng khai phá dữ liệu chương 1 phan mạnh thường

Bài giảng khai phá dữ liệu  chương 1   phan mạnh thường

Bài giảng khai phá dữ liệu chương 1 phan mạnh thường

... 2005 7 /12 /2 014 www.lhu.edu.vn Nội dung môn học Chương 1: Tổng quan khai phá liệu 7 /12 /2 014 Chương 2: Luật kết hợp Chương 3: Phân lớp liệu Chương 4: Chuỗi phổ biến Chương 5: Gom cụm liệu Chương ... thi máy 7 /12 /2 014 www.lhu.edu.vn Chương Tổng quan Nội dung Các khái niệm Các giai đoạn khai phá tri thức Ứng dụng khai phá liệu Các kỹ thuật khai phá Chương Tổng quan Các khái niệm  Dữ liệu (Data): ... khổng lồ  Dữ liệu từ Internet  Theo báo cáo IBM, có 80% liệu khai thác, 20% lại ẩn Database tri thức quý giá 7 /12 /2 014 www.lhu.edu.vn Chương Tổng quan Khai phá liệu gì?  Khai phá liệu (Datamining)...
  • 18
  • 285
  • 0
Bài giảng khai phá dữ liệu  chương 4   phan mạnh thường

Bài giảng khai phá dữ liệu chương 4 phan mạnh thường

... (8/ 14) Entropy(Sweak) - (6/ 14) Entropy(SStrong) = 0. 940 - (8/ 14) 0.811 - (6/ 14) 1.00 = 0. 048 25 Chương Phân lớp Thuộc tính phân lớp tốt nhất? S:[9+, 5-] E = 0. 940 Humidity S:[9+, 5-] E = 0. 940 Wind ... [3+, 4- ] E = 0.985 [6+, 1-] E = 0.592 [6+, 2-] E = 0.811 [3+, 3-] E = 1.00 Gain(S, Humidity) = 940 - (7/ 14) .985 - (7/ 14) .592 = 151 Gain(S, Wind) = 940 - (8/ 14) .811 - (6/ 14) 1.00 = 048 26 Chương ... 0 .40 0 41 Chương Phân lớp Dự đoán nhãn lớp với phân lớp Bayesian  P(X|buys_computer = “yes”) = 0.222 x 0.667 x 0.667 x 0. 044 = 0. 044  P(X|buys_computer = “no”) = 0.600 x 0 .40 0 x 0.200 x 0 .40 0...
  • 44
  • 238
  • 0
Bài giảng khai phá dữ liệu  chương 2   phan mạnh thường

Bài giảng khai phá dữ liệu chương 2 phan mạnh thường

... béo Vinamilk 2% lúa mì ID giao tác T1 T2 T3 T4 T5 Mat hang {111, 121 , 21 1, 22 1} {111, 21 1, 22 2, 323 } {1 12, 122 , 22 1, 411} {111, 121 } {111, 122 , 21 1, 22 1, 413} trắng Yomost 121 = sữa - 2% - Vinamilk ... 135 145 23 4 15 23 24 25 23 45 23 5 34 24 5 35 345 45 Thuật toán Apriori Ví dụ Áp dụng mẹo Apriori Cấp 123 45 123 4 123 124 12 125 13 14 123 5 124 5 1345 134 135 145 23 4 15 23 24 25 23 45 23 5 34 24 5 35 ... CSDL D 123 4 123 12 124 13 123 5 124 5 125 134 135 14 15 23 145 24 1345 23 4 25 23 45 23 5 34 35 24 5 45 345 Thuật toán Apriori Ví dụ Áp dụng mẹo Apriori Cấp 123 45 123 4 123 124 12 13 125 14 123 5 124 5 1345...
  • 52
  • 418
  • 1
Bài giảng khai phá dữ liệu  chương 3   phan mạnh thường

Bài giảng khai phá dữ liệu chương 3 phan mạnh thường

... D 10 C DC, DAC, DABC A B 20 30 40 DA D A B 50 60 70 DA DAB C 80 90 Chương Episodes luật Episode KẾT LUẬN  Khai phá luật Episode:  Dựa kỹ thuật luật kết hợp  Dữ liệu hướng thời gian  Hai cách ... xuất A (30 -30 ), tìm xuất theo sau B (40-40) • Sau lấy xuất thứ hai A (60-60) tìm xuất sau B (70-70) • Rồi tiếp tục với BA Chương Episodes luật Episode THUẬT TOÁN MINEPI  Tìm tất episodes (3/ 3): ... mua sản phẩm A THEN sau tuần khách hàng mua tiếp sản phẩm B C” Chương Episodes luật Episode CÁC KHÁI NIỆM CƠ BẢN  Dữ liệu: Dữ liệu tập R biến cố  Mỗi biến cố cặp (A, t), với • A  R loại biến...
  • 39
  • 324
  • 1
Bài giảng khai phá dữ liệu  chương 5   phan mạnh thường

Bài giảng khai phá dữ liệu chương 5 phan mạnh thường

... 377. 15 1414 .54 10 258 1614.88 159 3. 45 128.63 1166.02 10 250 155 2.60 1 655 .73 66. 35 1103.74 10260 150 4. 65 1703.68 18.40 1 055 .79 10272 1 456 .00 1 752 .33 30. 25 1007.14 10 253 1444.80 1763 .53 41. 45 9 95. 94 ... 10 252 359 7.90 3208.33 389 .57 2111. 65 3149.04 10267 353 6.60 328.27 2 050 . 35 3087.74 10 255 2490 .50 717.83 1004. 25 2041.64 10273 2037.28 1486. 25 1171. 05 551 .03 158 8.42 10263 1873.80 1334 .53 387 .55 ... 10 251 654 .06 255 4.27 832.19 2 05. 20 10269 642.20 256 6.13 844. 05 193.34 10262 58 4.00 2624.33 902. 25 1 35. 14 10 254 55 6.62 2 651 .71 929.63 107.76 10274 53 8.60 2669.73 947. 65 89.74 10 256 51 7.80 2690 .53 ...
  • 22
  • 292
  • 1
Tài liệu BÀI GiẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG 1. GIỚI THIỆU CHUNG VỀ KHAI PHÁ DỮ LIỆU pdf

Tài liệu BÀI GiẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG 1. GIỚI THIỆU CHUNG VỀ KHAI PHÁ DỮ LIỆU pdf

... tích cạnh tranh   Phát gian lận phát mẫu bất thường (ngoại lai) Ứng dụng khác  Khai phá Text (nhóm mới, email, tài liệu) khai phá Web  Khai phá liệu dòng  Phân tích DNA liệu sinh học February ... kiểu liệu     CSDL quan hệ Kho liệu CSDL giao dịch CSDL mở rộng kho chứa thông tin        CSDL quan hệ-đối tượng Dữ liệu không gian thời gian Dữ liệu chuỗi thời gian Dữ liệu dòng Dữ liệu ... từ liệu  Jim Gray, chuyên gia Microsoft, giải thưởng Turing 1998  “Chúng ta ngập liệu khoa học, liệu y tế, liệu nhân học, liệu tài chính, liệu tiếp thị Con người đủ thời gian để xem xét liệu...
  • 65
  • 2,327
  • 3
BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 1 GIỚI THIỆU CHUNG docx

BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 1 GIỚI THIỆU CHUNG docx

... Giới thiệu khai phá text Giới thiệu khai phá web Giới thiệu khai phá text       Khái niệm Sự cần thiết khai phá text Đặc trưng khai phá text Các toán khai phá text Một ví dụ toán khai phá ... biểu khái niệm khai phá liệu  Nội dung  Khai phá text = Khai phá liệu + Xử lý ngôn ngữ tự nhiên - XLNNTN (Natural Language Processing: NLP)  Các toán chung khai phá liệu cho liệu đặc thù  ... trưởng liệu Web  Tương tự liệu Text  Dữ liệu đa phương tiện 20  Hình minh họa tăng trưởng Web  http://news.netcraft.com/archives/category /web- server-survey/ (02/2 011 )  Khái niệm  Khai phá Web...
  • 25
  • 2,857
  • 23
Tài liệu BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU - CHƯƠNG 5. PHÂN LỚP docx

Tài liệu BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU - CHƯƠNG 5. PHÂN LỚP docx

... Married 80K Yes Phân lớp: Quá trình hai pha Phân lớp: Quá trình hai pha Các loại phân lớp Phân lớp nhị phân/ đa lớp:    |C|=2: phân lớp nhị phân |C|>2: phân lớp đa lớp Phân lớp đơn nhãn/ đa ... thuộc Thuộc lớp Ci lớp Ci Giá trị qua phân lớp đa lớp Thuộc lớp Ci Không thuộc lớp Ci TPi TNi FPi FNi 13 Đánh giá phân lớp đa lớp  Tương tự phân lớp hai lớp (nhị phân)  Độ xác Pri lớp Ci tỷ lệ ... gần Phân lớp k-NN: Ví dụ X (a) 1-nearest neighbor  X X (b) 2-nearest neighbor (c) 3-nearest neighbor Ba trường hợp hình vẽ - - 1-NN: Chọn lớp - : láng giềng có nhãn - nhiều 2-NN: Chọn lớp - :...
  • 63
  • 1,216
  • 0
Tài liệu BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG 6. PHÂN CỤM DỮ LiỆU pdf

Tài liệu BÀI GIẢNG NHẬP MÔN KHAI PHÁ DỮ LIỆU CHƯƠNG 6. PHÂN CỤM DỮ LiỆU pdf

... hình biểu diễn cụm tài liệu Vùng: Danh sách cụm vùng tài liệu thuộc cụm Phẳng: Các cụm tài liệu không giao Phân cấp: Các cụm tài liệu có quan hệ phân cấp cha- Phân cụm theo lô phân cụm tăng   ... Giới thiệu phân cụm Thuật toán phân cụm k-min Thuật toán phân cụm phân cấp Gán nhãn cụm Đánh giá phân cụm Bài toán phân cụm Web  Bài toán  Tập liệu D = {di}  Phân liệu thuộc D thành cụm    ... hình phân cụm phân vùng    Phân cụm đơn định phân cụm xác suất    Đơn định: Mỗi tài liệu thuộc cụm Xác suất: Danh sách cụm xác suất tài liệu thuộc vào cụm Phân cụm phẳng phân cụm phân cấp ...
  • 22
  • 1,531
  • 3
BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 2. KHAI PHÁ SỬ DỤNG WEB VÀ KHAI PHÁ CẤU TRÚC WEB docx

BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 2. KHAI PHÁ SỬ DỤNG WEB VÀ KHAI PHÁ CẤU TRÚC WEB docx

... (khoảng) 37 Khai phá cấu trúc Web  Hai toán điển hình  Khai phá liên kết Web Khai phá cấu trúc trang Web Khai phá liên kết Web      Mỗi trang Web đỉnh Liên kết trang Web hình thành cung ... Nội dung Khai phá sử dụng Web Khai phá cấu trúc web Khai phá sử dụng Web   Giới thiệu chung Phân tích mẫu truy nhập Web    Mang tính thói quen có tính cộng đồng Khai phá mẫu truy nhập ... trình khai phá sử dụng Web Quá trình khai phá sử dụng Web [Coo00]  Input: Dữ liệu sử dụng Web  Output: Các luật, mẫu, thống kê hấp dẫn  Các bước chủ yếu:    Tiền xử lý liệu Khám phá mẫu...
  • 45
  • 4,000
  • 27
BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 3 & 4 pdf

BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 3 & 4 pdf

... Email Networks, ICMOCCA2006: 14 4- 1 48 , Seoul, Korea & International Journal of Natural Sciences and Technology, 23 1(2): 17 3- 1 80, 2006 Mạng XH cộng đồng [For10] - - - - Câu lạc karate Zachary (được ... động người Web có tính ngẫu nhiên Là nội dung nghiên cứu thời Bibliography Webgraph Papers Dragomir R Radev, 03/ 4/ 2010 Toàn 2007 2008 2009 1 542 127 61 36 To 04/ 10 200 7-1 0 13 237  So many webgraph ... “Bibliography Webgraph Papers” by Dragomir R Radev  1601: http://clair.si.umich.edu/~radev/webgraph/webgraph-bib.html  5/2005 5/2007 5/2008 1/2009 8/2009 4/ 2010 11/2010 49 6 1212 136 1 145 7 147 1 1 542 1601...
  • 43
  • 3,944
  • 17
BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 5. BIỂU DIỄN WEB pdf

BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 5. BIỂU DIỄN WEB pdf

... (representation/indexing) Phạm vi tác động phương pháp biểu diễn văn   Tồn số phương pháp biểu diễn phổ biến   Không tồn phương pháp biểu diễn lý tưởng Chọn phương pháp biểu diễn phù hợp miền ứng dụng Một sơ ... Retrieval, HLT 1994: 36 4-3 69 Nghiên cứu biểu diễn văn  Nghiên cứu biểu diễn văn (Text + Web)    Luôn nội dung nghiên cứu thời Biểu diễn Web bổ sung số yếu tố cho biểu diễn Text Số công trình ... dung Giới thiệu Phân tích văn Biểu diễn Text Lựa chọn đặc trưng Thu gọn đặc trưng Biểu diễn Web Giới thiệu  Biểu diễn văn   Phù hợp đầu vào thuật toán khai phá liệu  Tác động tới chất lượng...
  • 38
  • 3,640
  • 15
BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 6. TÌM KIẾM WEB ppt

BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 6. TÌM KIẾM WEB ppt

... CHƯƠNG TÌM KIẾM VĂN BẢN VÀ MÁY TÌM KIẾM • Bài toán tìm kiếm văn – Khái niệm – Đánh giá – Tìm kiếm xấp xỉ • Máy tìm kiếm – – – – – – Công cụ tìm kiếm Internet Một số máy tìm kiếm điển ... http://searchengineland.com/the-state-of-search-engine-marketing-201 0-3 8826 2010 at 5:00pm ET) Mar 25, 25 MÁY TÌM KIẾM: THỊ TRƯỜNG Năm 2010: Kinh phí tiếp thị máy tìm kiếm •http://searchengineland.com/the-state-of-search-engine-marketing-201 0-3 8826 ... Tổ chức liệu • • Hệ thống file Các cấu trúc liệu 28 CÁC THÀNH PHẦN CƠ BẢN CỦA MÁY TÌM KIẾM Máy tìm kiếm Google 29 CÁC THÀNH PHẦN CƠ BẢN CỦA MÁY TÌM KIẾM Máy tìm kiếm AltaVista 30 MÁY TÌM KIẾM ASPSEEK...
  • 110
  • 3,703
  • 19
BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 7. PHÂN LỚP WEB doc

BÀI GIẢNG KHAI PHÁ DỮ LIỆU WEB (PGS. TS. HÀ QUANG THỤY) - CHƯƠNG 7. PHÂN LỚP WEB doc

... Married 80K Yes Phân lớp: Quá trình hai pha Phân lớp: Quá trình hai pha Các loại phân lớp Phân lớp nhị phân/ đa lớp:    |C|=2: phân lớp nhị phân |C|>2: phân lớp đa lớp Phân lớp đơn nhãn/ đa ... thiệu phân lớp Web Phân lớp học giám sát Phân lớp học bán giám sát Giới thiệu: Sơ đồ khai phá Web    Thuật toán KPDL: phân lớp, phân cụm, tóm tắt… Sử dụng thuật toán KPDL chung (phân lớp, phân ... thuộc Thuộc lớp Ci lớp Ci Giá trị qua phân lớp đa lớp Thuộc lớp Ci Không thuộc lớp Ci TPi TNi FPi FNi 14 Đánh giá phân lớp đa lớp  Tương tự phân lớp hai lớp (nhị phân)  Độ xác Pri lớp Ci tỷ lệ...
  • 67
  • 4,536
  • 17
Bài giảng khai phá dữ liệu

Bài giảng khai phá dữ liệu

... tích cạnh tranh   Phát gian lận phát mẫu bất thường (ngoại lai) Ứng dụng khác  Khai phá Text (nhóm mới, email, tài liệu) khai phá Web  Khai phá liệu dòng  Phân tích DNA liệu sinh học March ... kiểu liệu     CSDL quan hệ Kho liệu CSDL giao dịch CSDL mở rộng kho chứa thông tin        CSDL quan hệ-đối tượng Dữ liệu không gian thời gian Dữ liệu chuỗi thời gian Dữ liệu dòng Dữ liệu ... 18, 2013 25 Dữ liệu Mẫu • Dữ liệu (tập liệu) • • • tập F gồm hữu hạn trường hợp (sự kiện) KDD:phải gồm nhiều trường hợp Mẫu • • • Trong KDD: ngôn ngữ L để biểu diễn tập kiện (dữ liệu) thuộc vào...
  • 68
  • 611
  • 2

Xem thêm

Từ khóa: bài giảng khai phá dữ liệu web chương 1 giới thiệu chungbài giảng nhập môn khai phá dữ liệu chương 5 phân lớpbài giảng nhập môn khai phá dữ liệu chương 6 phân cụm dữ liệubài giảng khai phá dữ liệu web chương 2 khai phá sử dụng web và khai phá cấu trúc webbài giảng khai phá dữ liệu web chương 3 một số kiến thức toán học bổ trợ chương 4 một số bài toán xử lý ngôn ngữ tự nhiên nền tảngbài giảng khai phá dữ liệu web chương 5 biểu diễn webBáo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thơ nôm tứ tuyệt trào phúng hồ xuân hươngThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ