CÔNG NGHỆ TRI THỨC VÀ BÀI TOÁN KHAI PHÁ DỮ LIỆU TRONG KINH DOANH VỚI MICROSOFT TIME SERIES ALGORITHM

32 614 2
CÔNG NGHỆ TRI THỨC VÀ BÀI TOÁN KHAI PHÁ DỮ LIỆU TRONG KINH DOANH VỚI MICROSOFT TIME SERIES ALGORITHM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN  - Họ tên: TRẦN THỊ KIỀU DIỄM Mã HV: CH1101074 Lớp CH6 CÔNG NGHỆ TRI THỨC VÀ BÀI TOÁN KHAI PHÁ DỮ LIỆU TRONG KINH DOANH VỚI MICROSOFT TIME SERIES ALGORITHM Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01.01 KHÓA LUẬN TỐT NGHIỆP THẠC SĨ CHUYÊN ĐỀ CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG TP Hồ Chí Minh, Năm 2013 Trang 1/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hồng Kiếm ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN Họ tên: TRẦN THỊ KIỀU DIỄM Mã HV: CH1101074 Lớp CH6 CƠNG NGHỆ TRI THỨC VÀ BÀI TỐN KHAI PHÁ DỮ LIỆU TRONG KINH DOANH VỚI MICROSOFT TIME SERIES ALGORITHM Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01.01 GVPT: GS.TSKH Hồng Kiếm TP Hồ Chí Minh, Năm 2013 Trang 2/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT DANH MỤC CÁC HÌNH VẼ MỞ ĐẦU PHÁT BIỂU VẤN ĐỀ NGHIÊN CỨU: .6 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN: TỔNG LƯỢC KẾT QUẢ ĐÃ CÓ: PHẦN CƠNG NGHỆ TRI THỨC VÀ VAI TRỊ 1.1 1.2 KHÁI NIỆM CÔNG NGHỆ TRI THỨC VAI TRỊ CỦA CƠNG NGHỆ TRI THỨC PHẦN KHAI PHÁ DỮ LIỆU VÀ CÁC GIẢI THUẬT KHAI PHÁ DỮ LIỆU 2.1 ĐỊNH NGHĨA KHAI PHÁ DỮ LIỆU 2.2 Ý NGHĨA THỰC TẾ CỦA KHAI PHÁ DỮ LIỆU .9 2.3 KIẾN TRÚC ĐIỂN HÌNH CỦA KHAI PHÁ DỮ LIỆU 10 2.4 CÁC CHỨC NĂNG CHÍNH CỦA KHAI PHÁ DỮ LIỆU .10 2.4.1 Mô tả khái niệm (concept description) 10 2.4.2 Luật kết hợp (association rules) 10 2.4.3 Phân lớp dự đoán (classification & prediction) 10 2.4.4 Phân cụm (clustering) 11 2.5 NHỮNG KHÓ KHĂN TRONG KHAI PHÁ DỮ LIỆU .11 2.6 MỘT SỐ GIẢI THUẬT TRONG KHAI PHÁ DỮ LIỆU 11 PHẦN DATAMINING VỚI CÔNG CỤ BUSINESS INTELLIGENCE DEVELOPMENT STUDIO (BIDS) CỦA MICROSOFT SQL SERVER 2008 13 3.1 ĐỊNH NGHĨA BIDS 13 3.2 CÁC BƯỚC LÀM VIỆC VỚI BIDS 13 PHẦN SỬ DỤNG MƠ HÌNH KHAI PHÁ DỮ LIỆU MICROSOFT TIME SERIES ĐỂ DỰ ĐỐN TÌNH HÌNH KINH DOANH CỦA CƠNG TY LOCK&LOCK VIỆT NAM 17 4.1 GIỚI THIỆU MÔ HÌNH KHAI PHÁ DỮ LIỆU MICROSOFT TIME SERIES .17 4.2 PHÁT BIỂU BÀI TOÁN ỨNG DỤNG 18 4.3 XỬ LÝ DỮ LIỆU THÔ 19 4.3.1.Làm tích hợp liệu 19 4.3.2 Trích chọn chuyển đổi liệu 19 4.4 TIẾN TRÌNH KHAI PHÁ DỮ LIỆU 20 4.4.1 Tạo DB 20 4.4.2 Tạo Project BIDS 20 4.4.3 Tạo mơ hình khai phá Microsoft Time Series project 21 4.4.4 Cài đặt ứng dụng kết nối tới SQL C# 27 TÀI LIỆU THAM KHẢO 32 Trang 3/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT Số TT Từ Viết đầy đủ KDD Knowleadge Discovery in Database ANN Artificial Neural Network BIDS Business Intelligence Development Studio DS Data Source DSV Data Source View DB Database Trang 4/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm DANH MỤC CÁC HÌNH VẼ (Hình Mơ hình minh họa trình xử lý liệu cho tri thức) (Hình Kiến trúc điển hình khai phá liệu) 10 (Hình Thao tác kết nối với SQL server) 13 (Hình Thao tác tạo DB) 14 (Hình Thao tác Import liệu vào Database) 14 (Hình Thao tác tạo project) 15 (Hình Thao tác tạo DS) 15 (Hình Thao tác tạo DSV) 16 (Hình Thao tác tạo Mining Structures) 16 (Hình 10 Thao tác tạo DB cho ứng dụng) 20 (Hình 11 Thao tác tạo Data Source kiểm tra kết nối) 21 (Hình 12 Thao tác chọn Table đƣa vào DSV) 21 (Hình 13 Thao tác chọn DSV để khai phá) 22 (Hình 14 Thao tác chọn thuộc tính để khai phá) 23 (Hình 15 Mơ hình khai phá Time Series dạng charts) 24 (Hình 16 Mơ hình khai phá Time Series dạng charts cho thuộc tính QTY) 25 (Hình 17 Xem liệu QTY mơ hình khai phá Time Series) 26 (Hình 18 Mơ hình khai phá Time Series dạng Trees) 26 (Hình 19 Xem liệu mơ hình khai phá Time Series) 27 (Hình 20 Giao diện chƣơng trình minh họa liệu khai phá) 30 Trang 5/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm MỞ ĐẦU Phát biểu vấn đề nghiên cứu: Sự đời máy tính điện tử phát triển vƣợt bậc ngành cơng nghiệp máy tính với nhu cầu ngƣời máy tính ngày cao hơn, ngồi cơng việc tính tốn thơng thƣờng, ngƣời ta cịn mong đợi máy tính có khả xử lí thông minh hơn, giải công việc giống nhƣ ngƣời Trong báo cáo em xin trình bày khái niệm chung định nghĩa vai trị cơng nghệ tri thức ứng dụng thực tế lĩnh vực khai phá liệu để dự đốn tình hình kinh doanh cơng ty dựa vào liệu có năm trƣớc Ý nghĩa khoa học thực tiễn: Quá trình khai phá liệu – Data Mining, trình khám phá tri thức tiềm ẩn từ nguồn liệu có, tiến trình khái qt kiện rời rạc liệu thành tri thức mang tính khái quát, tính quy luật hỗ trợ cho tiến trình định Tổng lược kết có: Hiện nhà nghiên cứu phát triển phƣơng pháp, kỹ thuật phần mềm hỗ trợ tiến trình khai phá liệu, với số kỹ thuật ta tìm đƣợc tri thức mới, từ ứng dụng vào thực tế phục vụ cho nhu cầu cần thiết ngƣời Em xin chân thành cảm ơn thầy GS.TSKH Hoàng Kiếm tận tình giảng dạy giúp em hồn thành tốt báo cáo Trang 6/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm PHẦN CƠNG NGHỆ TRI THỨC VÀ VAI TRỊ 1.1 Khái niệm công nghệ tri thức - Khái niệm tri thức: tri thức kết trình nhận thức, học tập lập luận, tri thức khác với thông tin liệu chỗ tri thức cho ta cách giải vấn đề hay giải pháp để thực cơng việc - Khái niệm công nghệ tri thức: Công nghệ tri thức phƣơng pháp, kĩ thuật dùng để  Tiếp nhận, biểu diễn tri thức  Xây dựng hệ sở tri thức  Khai phá tri thức từ liệu có (khai phá liệu) 1.2 Vai trị cơng nghệ tri thức - Cơng nghệ tri thức đóng vai trò quan trọng việc phát triển Công nghệ thông tin, nâng cao hữu dụng máy tính, giúp ngƣời gần gũi với máy tính - Cơng nghệ tri thức cịn góp phần thúc đẩy nhiều ngành khoa học khác phát triển, khả phát triển khoa học dựa tri thức liên ngành… - Mơ hình minh họa Inputs TIẾP NHẬN, BIỂU DIỄN, TỐI ƢU HĨA CSTT MÁY TÍNH CÁC HỆ CƠ SỞ TRI THỨC Outputs KHAI THÁC DỮ LIỆU, KHÁM PHÁ TRI THỨC (Hình Mơ hình minh họa q trình xử lý liệu cho tri thức) Từ tập liệu Inputs, hệ sở tri thức đƣợc cài đặt máy tính giúp tìm đƣợc output cần thiết, tri thức hồn tốn đƣợc rút từ tập liệu Inputs Trang 7/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm PHẦN KHAI PHÁ DỮ LIỆU VÀ CÁC GIẢI THUẬT KHAI PHÁ DỮ LIỆU 2.1 Định nghĩa khai phá liệu - Khai phá liệu (hay data mining) tiến trình khám phá tri thức tiềm ẩn sở liệu, cụ thể tiến trình trích lọc, sản sinh tri thức bị che giấu khối liệu khổng lồ Có nhiều thuật ngữ đƣợc dùng có nghĩa tƣơng tự với từ Datamining nhƣ Knowledge Mining (khai phá tri thức), knowledge extraction (chắt lọc tri thức), data/patern analysis (phân tích liệu/mẫu), data archaeoloogy (khảo cổ liệu), datadredging (nạo vét liệu) - Khai phá liệu tiến trình khái quát kiện rời rạc kho liệu thành tri thức mang tính khái quát, tính quy luật hỗ trợ tích cực cho tiến trình định - Khai phá liệu bƣớc bảy bƣớc trình KDD (Knowleadge Discovery in Database) KDD đƣợc xem nhƣ trình khác theo thứ tự sau:  Làm liệu (data cleaning & preprocessing): Loại bỏ nhiễu liệu không cần thiết  Tích hợp liệu (data integration): q trình hợp liệu thành kho liệu (data warehouses & data marts) sau làm tiền xử lý (data cleaning & preprocessing)  Trích chọn liệu (data selection): trích chọn liệu từ kho liệu sau chuyển đổi dạng thích hợp cho q trình khai thác tri thức Q trình bao gồm việc xử lý với liệu nhiễu (noisy data), liệu không đầy đủ (incomplete data), v.v  Chuyển đổi liệu: Các liệu đƣợc chuyển đổi sang dạng phù hợp cho trình xử lý Trang 8/32 Chun đề: Cơng nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm  Khai phá liệu (data mining): Là bƣớc quan trọng nhất, sử dụng phƣơng pháp thông minh để chắt lọc mẫu liệu  Ƣớc lƣợng mẫu (knowledge evaluation): Quá trình đánh giá kết tìm đƣợc thơng qua độ đo  Biểu diễn tri thức (knowledge presentation): Quá trình sử dụng kỹ thuật để biểu diễn thể trực quan cho ngƣời dùng - Mục đích việc khai phá liệu khơng phải phát tri thức mà phát tri thức cần thiết phục vụ cho nhiệm vụ đề Ví dụ từ sở liệu bệnh nhân bị tiểu đƣờng ngƣời ta tìm đƣợc đặc điểm mà kết luận bệnh nhân có bị tiểu đƣờng hay khơng 2.2 Ý nghĩa thực tế khai phá liệu - Thực tế sở hữu lƣợng liệu khổng lồ nhƣng lại nghèo tri thức Data Mining đời nhƣ lối cho việc tìm kiếm tri thức hữu ích từ kho liệu khổng lồ - Tổng quát nhất, datamining cho ta ba lợi ích sau: cung cấp hỗ trợ định, dự báo, khái quát liệu từ tập liệu thô - Những tri thức rút đƣợc ứng dụng vào nhiều lĩnh vực khác sống, cụ thể nhƣ số ứng dụng sau:  Text mining & Web mining: giúp phân loại văn bản, mail hay Web  Phân tích liệu hỗ trợ định (data analysis & decision support)  Điều trị y học (medical treatment): giúp chuẩn đoán bệnh từ dấu hiệu đƣợc phát  Tài thị trƣờng chứng khoán (finance & stock market): dự đốn tăng giảm tình hình tài số chứng khốn Trang 9/32 Chun đề: Cơng nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm  Nhận dạng (pattern recognition): giúp ích cho tốn nhận dạng ngƣời hay nhận dạng vân tay tội phạm, … 2.3 Kiến trúc điển hình khai phá liệu (Hình Kiến trúc điển hình khai phá liệu) 2.4 Các chức khai phá liệu 2.4.1 Mô tả khái niệm (concept description) Là mô tả, tổng hợp tóm tắt khái niệm, đƣợc ứng dụng việc tóm tắt văn dài dựa vào tần số xuất số từ văn 2.4.2 Luật kết hợp (association rules) Là khám phá luật kết hợp tập liệu, luật kết hợp thể mối quan hệ thuộc tính mà ta nhận thấy đƣợc từ tần suất xuất với nhau, giúp ích cho lĩnh vực kinh doanh, y học,… 2.4.3 Phân lớp dự đốn (classification & prediction) Là q trình tìm tập mơ hình (hoặc chức năng) mơ tả phân biệt lớp liệu, đƣợc sử dụng cho mục đích dự đốn lớp số đối tƣợng Mơ hình đƣợc biểu diễn dạng luật IF-THEN, định hay mạng Nơron Trang 10/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm năm…Khi lựa chọn chu kỳ phù hợp cho kết khai phá tốt  AUTO DETECT PERIODICITY: Nếu đối gần chu kỳ nhỏ đƣợc thực hiện, gần chu kỳ lớn đƣợc thực hiện, nhiên đối số tự động thiết lập PERIODICITY HINT đƣợc thiết lập trƣớc  MINIMUM and MAXIMUM SERIES VALUE: giới hạn phạm vi dự đoán hợp lệ ví dụ doanh thu mặt hàng cơng ty khơng thể nhỏ  FORECAST METHOD: dung để định thuật toán dự báo ARIMA hay ARTXP, mặc định sử dụng hỗn hợp thuật toán lấy giá trị hỗn hợp dự đoán đƣợc  PREDICTION SMOOTHING: kiểm soát pha trộn thuật toán ARIMA ARTXP, giá trị gần ARIMA đƣợc thực hiện, ngƣợc lại ARTXP đƣợc thực gần  INSTABILITY SENSITIVITY: dùng để kiểm sốt tính bất ổn liệu khai phá đƣợc, đặt giá trị liệu dự báo bất ổn thơng báo, cịn ngƣợc lại chọn chế độ hồn tồn tắt  HISTORIC MODEL COUNT HISTORIC MODEL GAP: thiết lập thông số khoảng cách cho liệu, ví dụ dự đốn tháng HISTORIC_MODEL_GAP =  COMPLEXITY PENALTY MINIMUM SUPPORT: đối số đƣợc sử dụng hỗ trợ cho mơ hình định thuật toán ARTXP 4.2 Phát biểu toán ứng dụng Từ doanh thu bán hàng năm 2012 cơng ty Lock&Lock, áp dụng mơ hình khai phá Time Series để dự đoán số lƣợng sản phẩm doanh thu Trang 18/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hồng Kiếm cơng ty ngày tới năm 2013 mơ hình Clustering để gom cụm khách hàng theo doanh thu nhằm tìm kiếm nhóm khách hàng tiềm năng, nhƣ gom cụm sản phẩm nhằm xác định sản phẩm mang lại doanh thu cao cho công ty 4.3 Xử lý liệu thô 4.3.1.Làm tích hợp liệu Dữ liệu phân tích doanh thu bán hàng công ty Lock&Lock năm 2012 Sau q trình loại bỏ liệu nhiễu khơng cần thiết ta đƣợc bảng sau Cột cho biết tên Sản phẩm bán đƣợc năm 2012, DateTime ngày bán liên tục từ ngày 01/01/2012 đến ngày 31/12/2013, QTY số lƣợng mặt hàng tƣơng ứng, Grand Total doanh thu sản phẩm bán ngày tƣơng ứng 4.3.2 Trích chọn chuyển đổi liệu - Chọn thuộc tính DateTime để Group by; - Chọn Total, QTY để Sum theo DateTime - Kết truy vấn: Trang 19/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm 4.4 Tiến trình khai phá liệu 4.4.1 Tạo DB Tạo DB có tên SALE import vào DB ba bảng liệu nhƣ hình sau: (Hình 10 Thao tác tạo DB cho ứng dụng) 4.4.2 Tạo Project BIDS Trang 20/32 Chuyên đề: Công nghệ tri thức ứng dụng - GVPT: GS TSKH Hồng Kiếm Tạo Project có tên CH1101074 tạo New Data Sources SALE.ds (Hình 11 Thao tác tạo Data Source kiểm tra kết nối) - Tạo New Data Sources View SALE.dsv đƣa vào bảng liệu cần khai phá (Hình 12 Thao tác chọn Table đưa vào DSV) 4.4.3 Tạo mơ hình khai phá Microsoft Time Series project Trang 21/32 Chuyên đề: Công nghệ tri thức ứng dụng - GVPT: GS TSKH Hồng Kiếm Mơ hình Microsoft Time Series dự đốn số lƣợng doanh thu ngày tới năm 2013 dựa vào số lƣợng doanh thu năm 2012 Bƣớc thực hiện: - Sau chọn mơ hình khai phá Microsoft Time Series ta đến bƣớc chọn DSV (Hình 13 Thao tác chọn DSV để khai phá) - Chọn bảng liệu để đƣa vào khai phá: bảng Thong Ke Theo SL va Doanh thu: Trang 22/32 Chuyên đề: Công nghệ tri thức ứng dụng - GVPT: GS TSKH Hồng Kiếm Đối với mơ hình khai phá theo thời gian ta phải chọn khóa DateTime, Input QTY (số lƣợng) Grand Total (Doanh thu) năm 2012 Output QTY Grand Total cần dự đốn tƣơng lai, ta chọn thuộc tính nhƣ hình sau: (Hình 14 Thao tác chọn thuộc tính để khai phá) - Tiếp theo ta xem lại nội dung kiểu liệu thuộc tính đƣa vào Trang 23/32 Chuyên đề: Công nghệ tri thức ứng dụng - GVPT: GS TSKH Hồng Kiếm Đặt tên cho mơ hình khai phá Finish Chọn Mining Model Viewer để xem kết khai phá dạng Charts (Hình 15 Mơ hình khai phá Time Series dạng charts) Phân tích liệu từ biểu đồ Chart:  Trục ngang (trục hoành) cho biết mốc thời gian, trục đứng (trục tung) tỉ lệ số lƣợng doanh thu, ta biểu diễn chung nên Trang 24/32 Chun đề: Cơng nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm không hiển thị giá trị cụ thể mà hiển thị % giá trị đại lƣơng chênh lệch lớn  Đƣờng thẳng phân cách liệu có (nét liền) liệu dự đốn ngày tới (nét đứt), màu xanh biểu diễn cho Grand Total màu đỏ QTY, ta xem thuộc tính riêng biệt cách chọn thuộc tính nhƣ sau (Hình 16 Mơ hình khai phá Time Series dạng charts cho thuộc tính QTY) Ý nghĩa Button:  Show historic predictions: hiển thị dự đoán lịch sử kết thực tế  Show Deviations: độ lệch dự đoán, độ lệch lớn ngày dự đoán xa  Prediction steps: xác định số bƣớc dự đoán tƣơng lai đƣợc hiển thị Ta xem kết QTY ngày 24/12 khung Mining Legend Dự đoán: 96218.235, thực tế: 92572, độ lệch: ±3.9% Trang 25/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm (Hình 17 Xem liệu QTY mơ hình khai phá Time Series) Ta xem kết Decision tree (Hình 18 Mơ hình khai phá Time Series dạng Trees) Ý nghĩa mơ hình Decision tree ta xem Mining Legend sau: Node gốc All, node 1(xanh nhạt) đƣợc tính từ gốc cho biết QTY -6 < 72742.977 khoảng Date Time >= 4/6/2012 6:33:45 AM and Date Time < 9/15/2012 7:01:52 AM với số trƣờng hợp 34 Trang 26/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hồng Kiếm (Hình 19 Xem liệu mơ hình khai phá Time Series) d Kết luận: Với tập liệu thô, công cụ Business Intelligence Development Studio (BIDS) đóng vai trị gần nhƣ chun gia phân tích mà nhờ vào ta dễ dàng đánh giá đƣợc xu hƣớng kinh doanh tới nhƣ đƣa chiến lƣợc thu hút khách hàng nhằm nâng cao hiệu kinh tế Tuy nhiên mơ hình Microsoft Time Series có nhƣợc điểm liệu DateTime phải liệu liên tục, mẫu tin mà thông tin cần Predict bị khuyết ta phải giá trị phải điền vào chỗ khuyết thơng qua đối số missing value substitution, lí q trình thực khai phá, mơ hình khơng tự động chọn giá trị mặc định cho đối missing value substitution mà để ngƣời thực thi tự chọn giá trị phù hợp điền vào, chọn giá trị: Previous để lấy giá trị ngày trƣớc điền vào ngày bị khuyết, Mean để điền giá trị trung bình, Value chọn số cần thiết để điền vào Nếu ngày dự báo xa độ xác thấp, ngồi độ xác dự báo cịn phụ thuộc vào liệu khứ, liệu nhiều độ xác cao 4.4.4 Cài đặt ứng dụng kết nối tới SQL C# Để kết nối tới SQL Server C# ta phải thêm vào reference Trang 27/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm System.Data.SqlClient; // để sử dụng kiểu liệu SQL System.Data; //để tạo biến kiểu DataTable Thiết kế class kết nối tới SQL server nhƣ sau: public class ConnectSQL { private SqlConnection connection; private SqlCommand command; private SqlDataReader reader; private SqlDataAdapter adapter; public string connectionString { get; set; } public ConnectSQL() { } public ConnectSQL(string connectionString) { this.connectionString = connectionString; } private void OpenConnection() //hàm mở kết nối tới SQL { connection = new SqlConnection(connectionString); connection.Open(); } public DataTable ExecuteCommandText(string CmdText) { try { OpenConnection(); command = new SqlCommand(); command.CommandType = CommandType.Text; command.CommandText = CmdText; command.Connection = connection; adapter = new SqlDataAdapter(command); DataTable result = new DataTable(); adapter.Fill(result); adapter = null; return result; Trang 28/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hồng Kiếm } catch (Exception ex) //bắt lỗi khơng kết nối { throw new Exception("Loi: " + ex.Message); } finally { connection.Close(); //Đóng kết nối connection.Dispose(); } } } Thiết kế hàm main thực thi: static void Main() { Application.EnableVisualStyles(); Application.SetCompatibleTextRenderingDefault(false); Application.Run(new Form1()); String connectionString = "server = (local);database = SALE;Integrated Security = true;"; //đường dẫn đến CSDL ConnectSQL conn = new ConnectSQL(connectionString); DataTable data = conn.ExecuteCommandText("Select * from SL_DT"); foreach (DataRow Row in data.AsEnumerable())//đọc dòng liệu vào bảng data { Console.WriteLine("{0} \t {1} \t {2}", Row[0], Row[1], Row[2]); //số cột bảng liệu cần xem } Console.WriteLine("Press Enter to Exit!"); Console.ReadLine(); } Giao diện chƣơng trình minh họa Trang 29/32 Chun đề: Cơng nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm (Hình 20 Giao diện chương trình minh họa liệu khai phá) Giao diện cho phép ta xem bảng liệu cần khai phá:  Button Xem liệu khai phá: xem bảng SL_DT  Button Time Series Chart: xem mơ hình khai phá dạng Chart  Button Time Series Tress: xem mơ hình khai phá dạng tree Trang 30/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN  Kết luận: o Đã đạt đƣợc: Áp dụng thành cơng mơ hình khai phá liệu Microsoft Time Series với công cụ Business Intelligence Development Studio Microsoft SQL Server 2008 để dự đoán doanh thu cơng ty Lock&Lock Việt Nam Mơ hình minh họa trực quan, liệu phân tích rõ ràng o Chƣa đạt đƣợc: Microsoft SQL Server 2008 phần mềm cung cấp nhiều Tool giúp ích cho q trình phân tích, khai phá liệu đặc biệt lĩnh vực kinh doanh, thời gian hạn chế nên em chƣa thể trình bày chi tiết mơ hình khai phá liệu nhƣ tìm hiểu hết đặc tính ƣu việt  Hướng phát triển: tiếp tục nghiên cứu, khám phá ứng dụng mơ hình khai phá liệu phục vụ cho công việc sống, cài đặt chƣơng trình biểu diễn liệu khai phá đƣợc sử dụng ngôn ngữ C# cách trực quan Trang 31/32 Chuyên đề: Công nghệ tri thức ứng dụng GVPT: GS TSKH Hoàng Kiếm TÀI LIỆU THAM KHẢO Tài liệu Tiếng Anh [1] Data Mining with Microsoft SQL Server 2008 Jamie MacLennan, ZhaoHui Tang, Bogdan Crivat (từ trang 127 đến trang 318, từ trang 498 đến trang 539) Tài liệu Tiếng Việt [2] Giáo trình Chuyên đề Khai phá liệu Nhà kho liệu (2004) – PGS.TS Đỗ Phúc - Đại học Quốc Gia Thành Phố Hồ Chí Minh [3] Giáo trình Khai phá liệu, Trung tâm nghiên cứu phát triển công nghệ thông tin, Đại học Quốc gia thành phố Hồ Chí Minh – GS.TSKH.Hồng Kiếm - PGS.TS.Đỗ Phúc (2005) [4] Websites: http://www.ibm.com/developerworks/vn/library/data/2013Q1/ba-socialmedia-spss-text-mining/index.html [5] Websites: http://www.youtube.com/watch?v=kMeRN9Qp7O4 [6] Websites: http://doc.edu.vn/tai-lieu/khoa-luan-nghien-cuu-ky-thuat-khaipha-du-lieu-va-ung-dung-trong-he-thong-ban-sach-truc-tuyen-6095/ [7] Websites: http://bis.net.vn/forums [8] Websites: http://text.123doc.vn/text-doc/338118-cac-thuat-toan-khai-thac-dulieu.htm [9] Websites: http://biatlink.wordpress.com/2013/04/29/sql-server-request-failedor-the-service-did-not-respond-in-a-timely-fashion/ Trang 32/32 ... biểu diễn tri thức  Xây dựng hệ sở tri thức  Khai phá tri thức từ liệu có (khai phá liệu) 1.2 Vai trị cơng nghệ tri thức - Cơng nghệ tri thức đóng vai trị quan trọng việc phát tri? ??n Công nghệ thông... HÌNH KHAI PHÁ DỮ LIỆU MICROSOFT TIME SERIES ĐỂ DỰ ĐỐN TÌNH HÌNH KINH DOANH CỦA CÔNG TY LOCK&LOCK VIỆT NAM 4.1 Giới thiệu mơ hình khai phá liệu Microsoft Time Series Một time series chuỗi liệu. .. PHẦN KHAI PHÁ DỮ LIỆU VÀ CÁC GIẢI THUẬT KHAI PHÁ DỮ LIỆU 2.1 ĐỊNH NGHĨA KHAI PHÁ DỮ LIỆU 2.2 Ý NGHĨA THỰC TẾ CỦA KHAI PHÁ DỮ LIỆU .9 2.3 KIẾN TRÚC ĐIỂN HÌNH CỦA KHAI

Ngày đăng: 04/07/2015, 03:19

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan