Nghiên cứu luật kết hợp và ứng dụng trong công tác quản lý kho hàng tại siêu thị metro

26 303 0
Nghiên cứu luật kết hợp và ứng dụng trong công tác quản lý kho hàng tại siêu thị metro

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 126 -1- BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG LÊ VĂN ĐÔNG NGHIÊN CỨU LUẬT KẾT HỢP VÀ ỨNG DỤNG TRONG CÔNG TÁC QUẢN LÝ KHO HÀNG TẠI SIÊU THỊ METRO Chuyên ngành : KHOA HỌC MÁY TÍNH Mã số : 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2011 Footer Page of 126 Header Page of 126 -2- Công trình ñược hoàn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TSKH TRẦN QUỐC CHIẾN Phản biện : TS HUỲNH CÔNG PHÁP Phản biện : TS TRƯƠNG CÔNG TUẤN Luận văn ñược bảo vệ Hội ñồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp Đại học Đà Nẵng vào ngày 10 tháng 09 năm 2011 Có thể tìm hiểu luận văn tại: • Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng • Trung tâm Học liệu, Đại học Đà Nẵng Footer Page of 126 Header Page of 126 -3- MỞ ĐẦU Lý chọn ñề tài Trong năm gần ñây, phát triển mạnh mẽ công nghệ thông tin ñã làm cho khả thu thập lưu trữ thông tin hệ thống thông tin tăng cách nhanh chóng Bên cạnh ñó, việc tin học hóa cách ạt nhanh chóng hoạt ñộng sản xuất, kinh doanh nhiều lĩnh vực hoạt ñộng khác ñã tạo cho lượng liệu cần lưu trữ xử lý khổng lồ Trong bối cảnh ñó, việc nghiên cứu ñề phương pháp, công cụ hỗ trợ người khám phá, phân tích, tổng hợp thông tin nhằm ñể tìm rút tri thức hữu ích, qui luật tiềm ẩn hỗ trợ tiến trình ñịnh nhu cầu thiết Từ ñó giúp cho nhà quản lý có nhìn tổng quan liệu, ñưa nhận ñịnh, ñịnh, dự ñoán mang tính chiến lược Hiện vấn ñề khai phá luật kết hợp ñược ñề cập ñang trở thành khuynh hướng quan trọng khai phá liệu Luật kết hợp luật ngầm ñịnh số quan hệ kết hợp tập ñối tượng mà ñối tượng ñộc lập hoàn toàn với Do ñây hướng ñi tiềm năng, có nhiều khả phát triển tương lai, nên em ñã chọn ñề tài : “Nghiên cứu luật kết hợp ứng dụng công tác quản lý kho hàng siêu thị Metro” ñợt thực Luận văn tốt nghiệp Footer Page of 126 Header Page of 126 -4- Đối tượng phạm vi nghiên cứu Đối tượng Lý thuyết Kỹ thuật khai phá liệu Nghiệp vụ quản lý kho hàng Siêu thị Dữ liệu Cơ sở liệu: mặt hàng, khách hàng Các văn bản, qui ñịnh liên quan ñến công tác quản lý siêu thị Công nghệ Công cụ lập trình: Visual Studio C# Cơ sở liệu: Microsoft SQL Server 2005 Phạm vi Nghiên cứu kiến thức phương pháp phát luật kết hợp Nghiên cứu trình tác nghiệp hệ thống Xây dựng Hệ hỗ trợ ñịnh phục vụ cho công tác quản lý Mục tiêu nhiệm vụ Mục tiêu Ứng dụng luật kết hợp vào công tác quản lý kho hàng Giúp cho nhà quản lý ñưa nhận ñịnh, dự ñoán mang tính chiến lược Nhiệm vụ Nghiên cứu sở lý thuyết Nghiên cứu kỹ thuật khai phá liệu Footer Page of 126 Header Page of 126 -5- Nghiên cứu phát triển thuật giải tìm tập mục phổ biến, luật kết hợp, luật phân lớp, luật gom cụm liệu Ứng dụng thuật toán vào sở liệu quản lý kho hàng Triển khai xây dựng ứng dụng Xây dựng sở liệu mẫu Xây dựng ứng dụng Phương pháp nghiên cứu Tham khảo tài liệu liên quan, báo cáo khoa học Lập kế hoạch, lên quy trình, tiến ñộ thực Nghiên cứu kỹ thuật khai phá liệu luật kết hợp vào việc quản lý kho hàng siêu thị Ý nghĩa khoa học thực tiễn ñề tài Ý nghĩa khoa học Ứng dụng tin học công tác quản lý Ý nghĩa thực tiễn Giải ñược công việc tác nghiệp Hỗ trợ ñưa ñịnh, dự ñoán mang tính chiến lược cho người quản lý Giúp nhà quản lý có nhìn tổng quan liệu Tên ñề tài “NGHIÊN CỨU LUẬT KẾT HỢP VÀ ỨNG DỤNG TRONG CÔNG TÁC QUẢN LÝ KHO HÀNG TẠI SIÊU THỊ METRO” Footer Page of 126 Header Page of 126 -6- Cấu trúc luận văn Nội dung luận văn ñược chia thành chương sau: Chương 1: Cơ sở lý thuyết khai phá liệu luật kết hợp Chương 2: Ứng dụng khai phá luật kết hợp công tác quản lý kho hàng siêu thị Footer Page of 126 Header Page of 126 -7- CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ KHAI PHÁ DỮ LIỆU VÀ LUẬT KẾT HỢP 1.1 TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 1.1.1 Định nghĩa khai phá liệu Khai phá liệu tiến trình khám phá tri thức tiềm ẩn CSDL, cụ thể hơn, ñó tiến trình lọc, sản sinh tri thức mẫu tiềm ẩn, chưa biết, thông tin hữu ích từ CSDL lớn 1.1.2 Các ứng dụng khai phá liệu Phát tri thức khai phá liệu liên quan ñến nhiều ngành, nhiều lĩnh vực: thống kê, trí tuệ nhân tạo, CSDL, thuật toán, tính toán song song… Đặc biệt phát tri thức khai phá liệu gần gũi với lĩnh vực thống kê, sử dụng phương pháp thống kê ñể mô hình hóa liệu phát mẫu Khai phá liệu có nhiều ứng dụng thực tế, ví dụ như: Bảo hiểm, tài thị trường chứng khoán; Thống kê, phân tích liệu hỗ trợ ñịnh; Điều trị y học chăm sóc y tế; Sản xuất chế biến; Text mining Web mining; Lĩnh vực khoa học 1.1.3 Các bước quy trình khai phá liệu Quy trình khai phá liệu thường tuân theo bước sau: Bước thứ nhất: Hình thành, xác ñịnh ñịnh nghĩa toán Bước thứ hai: Thu thập tiền xử lý liệu Bước thứ ba: Khai phá liệu, rút tri thức Bước thứ tư: Phân tích kiểm ñịnh kết Bước thứ năm: Sử dụng tri thức phát ñược Footer Page of 126 Header Page of 126 -8- Tóm lại, khám phá tri thức trình kết xuất tri thức từ kho liệu mà ñó khai phá liệu công ñoạn quan trọng 1.1.4 Nhiệm vụ khai phá liệu Quá trình khai phá liệu trình phát mẫu thông tin Trong ñó giải thuật khai phá tìm kiếm mẫu ñáng quan tâm theo dạng xác ñịnh luật, phân lớp, hồi quy, ñịnh, … 1.1.4.1 Phân lớp (phân loại – classification) 1.1.4.2 Hồi quy (regression) 1.1.4.3 Phân nhóm (clustering) 1.1.4.4 Tổng hợp (summarization) 1.1.4.5 Mô hình hóa phục thuộc (dependency modeling) 1.1.4.6 Phát biến ñổi ñộ lệch (change and deviation dectection) 1.1.5 Các phương pháp khai phá liệu 1.1.5.1 Các thành phần giải thuật khai phá liệu 1.1.5.2 Phương pháp suy diễn/ quy nạp 1.1.5.3 Phương pháp ứng dụng K – láng giềng gần 1.1.5.4 Phương pháp sử dụng ñịnh luật 1.1.5.5 Phương pháp phát luật kết hợp 1.1.6 Lợi khai phá liệu so với phương pháp 1.1.6.1 Học máy (Machine Learning) 1.1.6.2 Phương pháp hệ chuyên gia 1.1.6.3 Phát kiến khoa học Footer Page of 126 Header Page of 126 -9- 1.1.6.4 Phương pháp thống kê 1.1.7 Lựa chọn phương pháp 1.1.8 Thách thức ứng dụng nghiên cứu kỹ thuật khai phá liệu Ở ñây, ta ñưa số khó khăn việc nghiên cứu ứng dụng kỹ thuật khai phá liệu Tuy nhiên, có khó khăn nghĩa việc giải hoàn toàn bế tắc mà muốn nêu lên ñể khai phá ñược liệu ñơn giản, mà phải xem xét tìm cách giải vấn ñề Ta liệt kê số khó khăn sau: 1.1.8.1 Các vấn ñề CSDL Đầu vào chủ yếu hệ thống khám phá tri thức liệu thô sở, phát sinh khai phá liệu từ ñây Do liệu thực tế thường ñộng, không ñầy ñủ, lớn bị nhiễu Trong trường hợp khác, người ta CSDL có chứa thông tin cần thiết cho việc khai phá hay không làm ñể giải với dư thừa thông tin không thích hợp 1.1.8.2 Một số vấn ñề khác • “Quá phù hợp” • Đánh giá tầm quan trọng thống kê • Khả biểu ñạt mẫu • Sự tương tác người sử dụng tri thức sẵn có Footer Page of 126 Header Page 10 of 126 - 10 - 1.2 LUẬT KẾT HỢP TRONG KHAI PHÁ DỮ LIỆU 1.2.1 Vài nét khai phá luật kết hợp 1.2.2 Một số ñịnh nghĩa Định nghĩa 1.1: Luật kết hợp Hạng mục (item) mặt hàng giỏ hàng hay thuộc tính Tập hạng mục (itemset) tập mặt hàng giỏ hàng hay tập thuộc tính, I = {i , i 2, , i m } Ví dụ : tập I = { sữa, bánh mì, ngũ cốc, sữa chua} Giao dịch (Transation) tập hạng mục ñược mua giỏ hàng (có TID mã giao dịch) Giao dịch t tập hạng mục cho t ⊆ Ι Ví dụ: t = {bánh mì, sữa chua, ngũ cốc} Cơ sở liệu giao dịch tập giao dịch, ví dụ sở liệu giao dịch D = {t1 , t 2, t n} Một luật kết hợp mệnh ñề kéo theo có dạng X→Y, ñó X, Y ⊆ I, thỏa mãn ñiều kiện X∩Y=∅ Các tập X Y ñược gọi tập hạng mục (itemset) Tập X gọi nguyên nhân, tập Y gọi hệ Định nghĩa 1.2: Độ hỗ trợ Độ hỗ trợ tập hạng mục X sở liệu giao dịch D tỷ lệ số giao dịch chứa X tổng số giao dịch D, ký hiệu Support(X ) hay Supp(X) Ta có: ≤ Supp(X) ≤ với tập hợp X Độ hỗ trợ luật kết hợp X→Y là: Supp(X→Y) = Supp(X∪Y) Footer Page 10 of 126 Header Page 12 of 126 - 12 - 1.2.5.3 Thuật toán Apriori 1.2.5.4 Thuật toán Apriori -TID 1.2.5.5 Thuật toán Apriori –Hybrid 1.2.5.6 Thuật toán FP-Growth 1.2.5.7 Thuật toán tìm luật kết hợp với ñịnh Một số ñịnh nghĩa Định nghĩa 1.4 : Cây ñịnh cấu trúc phân cấp nút nhánh Trong ñó có loại nút : - Nút gốc - Nút nội : mang tên thuộc tính CSDL - Nút : mang tên lớp Một ñịnh biểu diễn phép tuyển kết hợp, ràng buộc ñối với giá trị thuộc tính Mỗi ñường ñi từ nút gốc ñến nút tương ứng với kết hợp kiểm tra giá trị thuộc tính * Phát biểu vấn ñề : Cho bảng liệu A gồm n dòng với thuộc tính: (X1 , X2 , , X N, Y), ñó Y thuộc tính output (thuộc tính cần dự báo) X 1, X 2, , XN thuộc tính input Giả sử Y ñã ñược rời rạc hóa thành k giá trị y1 , y2 , , yk (nghĩa giá trị Y dòng A phải y1, y2 , , yk ) Gọi n y1 số dòng bảng A thỏa ñiều kiện Y = y1 , ký hiệu tương tự cho n y , , n y k Đương nhiên ta có n y i phải lớn hay ( n y1 + n y + + n y k ) = n Khi ñó ta có ñịnh nghĩa sau: Footer Page 12 of 126 Header Page 13 of 126 - 13 - Định nghĩa 1.5 : Độ phân tán thông tin bảng A giá trị khoảng từ ñến 1, ñược tính bởi: = I( n y1 , n y , , n y k ) − − n y1 n y1 + n y + + n y k ny2 n y1 + n y2 + + n y k − n yk n y1 + n y2 + + n yk log k log k log k n y1 n y1 + n y + + n y k n y2 n y1 + n y2 + + n y k n yk n y1 + n y2 + + n yk Trong ñó, ta qui ước log k = Nhận xét: Hàm I không thay ñổi giá trị ta hoán vị n y i Hàm I ñạt giá trị lớn (bằng 1) n y1 = n y = = n y k , nghĩa dòng bảng A ñược phân tán ñều cho trường hợp (rời rạc) thuộc tính output Y Hàm I ñạt giá trị nhỏ (bằng 0) có n y i ñó n (tổng số dòng bảng A), ñương nhiên n y i lại phải Khi ñó, ta nói bảng A không phân tán thông tin cả, có nghĩa bảng A ñể dự báo Footer Page 13 of 126 Header Page 14 of 126 - 14 - Định nghĩa 1.6 : Gọi n y m giá trị lớn n y1 , n y , , n y k , gọi ym giá trị trội thuộc tính output Y, ñó ta có ñộ trội output bảng A nym n Định nghĩa 1.7 : Gọi X thuộc tính input bảng A, giả sử X ñã ñược rời rạc hóa thành m giá trị x1 , x 2, , x m Phép tách A dựa vào thuộc tính X, ký hiệu TX, tạo thành m bảng A: TX = {A1, A2 , , Am}, ñó: - A1 , A2 , , Am tạo thành phân m hoạch A, nghĩa Ai∩Aj = ∅, ∀i, j =1,2, ,m, i ≠ j U A = A i i =1 - Ai tập hợp dòng A có giá trị X x i, nghĩa Ai = {t∈A|t.X = x i}, ∀i = 1, 2, , m Định nghĩa 1.8 : Gọi TX phép tách ñịnh A nghĩa 1.7 Với i từ ñến m, gọi ny1i số dòng bảng Ai thỏa ñiều kiện Y = y1, ký hiệu tượng tự cho , , nyAki nyA2i Độ phân tán thông tin phép tách TX , ký hiệu E(TX), giá trị từ ñến 1, ñược tính bởi: E(TX) =  k Ai   ∑ ny j  m Ai Ai Ai   j =1 × I (n y1 n y , , n y k )  ∑  k i =1  ∑ ny j   j =1  Footer Page 14 of 126 Header Page 15 of 126 - 15 - Trong ñó: - n yAji số dòng bảng Ai thỏa ñiều kiện Y=yj k - ∑n j =1 Ai yj số dòng bảng Ai k - ∑n j =1 yj số dòng bảng A A A A - I (n y1i n y2i , , n yki ) ñộ phân tán thông tin bảng Ai Một phép tách TX ñược gọi “tốt” bảng Ai tạo thành có ñộ phân tán thông tin thấp, hay nói theo nghĩa phương pháp gom cụm, bảng Ai cụm có ña số phần tử (dòng) có giá trị Y giống Từ ñó, phép tách TX tốt E(TX) thấp, ngược lại Giải thuật xây dựng ñịnh * Phát biểu toán: Cho bảng liệu A gồm n dòng với thuộc tính (X 1, X2 , , XN , Y), ñó Y thuộc tính Output (thuộc tính cần dự báo) X 1, X 2, , X N thuộc tính input Tất thuộc tính A ñều có giá trị rời rạc w ngưỡng ñộ tin cậy chấp nhận ñược * Input: - Bảng liệu A gồm n dòng với thuộc tính (X1 , X2 , , XN, Y), ñó Y thuộc tính Output (thuộc tính cần dự báo) X1, X2 , , XN thuộc tính input Tất thuộc tính A ñều có giá trị rời rạc - w: ngưỡng ñộ tin cậy chấp nhận ñược * Output: - Các luật sinh từ ñịnh Footer Page 15 of 126 Header Page 16 of 126 - 16 - * Các bước thực hiện: Bước 1: Xác ñịnh thuộc tính X m X1, X 2, , XN thỏa E( T X m ) bé Bước 2: Thực phép tách T(X m) bảng A, ta có tầng thứ ñịnh với nút gốc X m Bước 3: Với bảng Ai (tạo thành từ phép tách bước 2) - Nếu bảng có ñộ trội output lớn hay w bảng nút ñịnh Giá trị trội kết luận nút lá, ñộ trội output ñộ tin cậy kết luận - Nếu bảng có ñộ trội output bé w cột (mọi thuộc tính) ñều có giá trị bảng dòng (nghĩa bảng tách ñược nữa) bảng nút lá, kết luận nút “Không ñủ sở ñể kết luận output” - Nếu bảng có ñộ trội output bé w thực lại thao tác tương tự ñã làm với bảng A bước 1, bước bước Ưu ñiểm ñịnh Chuyển ñổi từ ñịnh sang luật Tri thức ñịnh ñược rút trích biểu diễn thành dạng luật IF – THEN (NẾU – THÌ) Khi ñã xây dựng ñược ñịnh, ta dễ dàng chuyển ñịnh thành tập luật tương ñương, luật tương ñương với ñường ñi từ gốc ñến nút Giai ñoạn chuyển ñổi từ ñịnh sang luật thường bao gồm bước sau : Footer Page 16 of 126 Header Page 17 of 126 - 17 - - Cắt tỉa - Lựa chọn - Sắp xếp - Ước lượng, ñánh giá Ví dụ minh họa * Phát biểu toán : Giả sử doanh nghiệp ñã ñưa số tiêu chí ñể phân loại khách hàng VIP không VIP: có khối lượng giao dịch trung bình tháng ñạt từ 3,000,000 VND trở lên, có tần suất giao dịch trung bình 10 lần tháng Vấn ñề ñặt doanh nghiệp cần xác ñịnh ñặc trưng chung nhóm khách hàng VIP, ñể từ ñó làm sở dự báo khách hàng (mới) có tiềm trở thành khách hàng VIP hay không? Giả sử doanh nghiệp dựa vào thuộc tính (của khách hàng) ñể chọn ñặc trưng gồm: Tuổi, giới tính, khoảng thu nhập, TT Hôn nhân Khảo sát giá trị thuộc tính nhóm khách hàng ñã ñược phân loại theo tiêu chí trên, ta có bảng liệu sau ñã rời rạc thuộc tính sau: Footer Page 17 of 126 Header Page 18 of 126 - 18 - Bảng 1.5: Bảng sau rời rạc thuộc tính khách hàng STT Tuổi Giới tính Thu nhập TT Là KH VIP Hôn nhân 1 0 3 1 1 1 1 1 10 1 11 12 1 13 14 15 16 3 17 1 0 18 0 19 1 1 20 1 Trong bảng trên, thuộc tính ñã ñược rời rạc hóa theo cách: - Tuổi: Bằng tuổi nhỏ 25, tuổi từ 25 ñến 40, tuổi lớn 40 - Giới tính: Bằng nữ, nam Footer Page 18 of 126 Header Page 19 of 126 - 19 - - Thu nhập: Bằng thu nhập 30 triệu VND/năm, từ 30 triệu VND ñến 50 triệu VND/năm, 50 triệu VND/năm, - TT HN: Bằng chưa lập gia ñình, ngược lại - Là KH VIP: Bằng không thuộc loại khách hàng VIP, ngược lại Khi ñó, ñặc trưng chung mà doanh nghiệp cần tìm phân lớp hay gom cụm có ñịnh hướng (trên bảng liệu ñã có trên) mà kết ñược biểu diễn dạng luật kết hợp E(X)→E(Y) Trong ñó: Y thuộc tính “Là KH VIP” E(Y) ñiều kiện “Y=1” (hoặc chí Y =0), nghĩa dòng t bảng ñược gọi thỏa E(Y) giá trị cột Y 1, X tập (hoặc tập của) thuộc tính lại (Tuổi, Giới tính, Thu nhập, TT Hôn nhân), E(X) ñiều kiện mô tả ñặc trưng chung X Đương nhiên luật kết hợp ñược chọn phải có ñộ phổ biến, ñộ tin cậy ñộ quan trọng ñủ tốt Áp dụng thuật toán cho bảng liệu (mục bảng 1.5), với ngưỡng ñộ tin cậy cho trước w 0.7 * Kết tập luật ta thu ñược ví dụ : Luật (Giới tính =0) → (là KH VIP =0) Luật (Giới tính = 1,Tuổi = 1) → (Là KH VIP = 0) Luật (Giới tính = 1,Tuổi = 2,TT Hôn nhân= 0) → (Là KHVIP = 1) Luật (Giới tính = 1,Tuổi = 2,TT Hôn nhân = 1, Thu nhập = 1) → (Là KH VIP = 0) Luật (Giới tính = 1,Tuổi = 3,Thu nhập = 1) → (Là KH VIP = 1) Footer Page 19 of 126 Header Page 20 of 126 - 20 - Các luật 1, 2, , tìm ñược từ ví dụ ñược biểu diễn lại dạng ñịnh sau: Giới tính =0 =1 Là KH VIP =0 Tuổi =1 =3 =2 Là KH VIP =0 Thu nhập TT Hôn nhân =0 Là KH VIP =1 =1 =1 Thu nhập =1 Là KH VIP =0 Hình 1.3 : Sơ ñồ ñịnh Footer Page 20 of 126 Là KH VIP =1 Header Page 21 of 126 - 21 - CHƯƠNG ỨNG DỤNG KHAI PHÁ LUẬT KẾT HỢP TRONG CÔNG TÁC QUẢN LÝ KHO HÀNG TẠI SIÊU THỊ 2.1 Phát biểu vấn ñề Đề tài nghiên cứu lý thuyết khai phá liệu, tìm hiểu luật kết hợp áp dụng thuật toán ñịnh ñể khai phá sở liệu quản lý kho hàng siêu thị ñã có với mong muốn tìm kết khai phá thú vị, hữu ích nhằm giúp cho nhà quản lý có nhìn tổng quan hơn, nắm bắt ñược mã loại hàng mang lại lợi nhuận cho doanh nghiệp Những kết ñạt ñược phạm vi luận văn chưa có ý nghĩa thiết thực vào công việc quản lý góp phần nhỏ hỗ trợ giúp cho người quản lý ñưa ñược nhận ñịnh ñúng ñắn hơn, mang tính chiến lược Bài toán cụ thể ñặt ñây : Xây dựng Hệ hỗ trợ ñịnh dựa mã loại hàng ñể ñưa ñánh giá, nhận ñịnh việc doanh thu mã loại hàng ñó có ảnh hưởng ñến lợi nhuận doanh nghiệp 2.2 Cơ sở liệu quản lý kho hàng siêu thị • Xác ñịnh thực thể : Thực thể Khách hàng : dbo.Khachhang Thực thể Hóa ñơn : dbo.Hoadon Thực thể Hàng hóa : dbo.Hanghoa Thực thể Loại hàng : dbo.Loaihang Thực thể Chi tiết hóa ñơn : dbo.Chitiethoadon • Sơ ñồ quan hệ thực thể : Footer Page 21 of 126 Header Page 22 of 126 - 22 - • Bảng mô tả chi tiết ràng buộc toàn vẹn liệu thực thể liệu mẫu cho thực thể: • Sơ ñồ quan hệ thực thể 2.3 Rời rạc thuộc tính Bảng doanh thu trước rời rạc thuộc tính mã loại hàng ñã chọn (loại hàng 1, loại hàng 2, loại hàng 3, loại hàng 4, loại hàng 5) lợi nhuận thu ñược tương ứng Trong bảng ta có 347 giao dịch (dựa bảng chi tiết hóa ñơn), giao dịch có thuộc tính Bảng 2.6 : Bảng doanh thu trước rời rạc Loaihang1 Loaihang2 Loaihang3 Loaihang4 Loaihang5 LoiNhuan Từ bảng doanh thu trên, ta tiến hành rời rạc thuộc tính bảng theo phương thức sau : - Các loại hàng : loại hàng 1, loại hàng 2, loại hàng 3, ñược rời rạc theo trung bình doanh thu : + : doanh thu + : có doanh thu thấp mức trung bình doanh thu + : có doanh thu cao mức trung bình doanh thu - Lợi nhuận : + : lợi nhuận thấp mức trung bình lợi nhuận Footer Page 22 of 126 Header Page 23 of 126 - 23 - + : lợi nhuận cao mức trung bình lợi nhuận Bảng kết sau ñã rời rạc thuộc tính ñược xuất file Excel Sheet1 sau: Bảng 2.7 : Bảng kết sau ñã rời rạc thuộc tính Footer Page 23 of 126 Header Page 24 of 126 - 24 - 2.4 Chương trình Demo minh họa 2.5 Kết thử nghiệm nhận xét ñánh giá • Kết thử nghiệm: Kết khai thác luật kết hợp phương pháp phân lớp với ñịnh bảng doanh thu gồm 347 giao dịch, giao dịch gồm thuộc tính Kết thử nghiệm ñạt ñược cho mã loại hàng là: 1, 2, 3, 4, Bảng 2.8 : Bảng kết thử nghiệm Ngưỡng tin STT cậy cho trước • Số giao Số luật thu dịch ñược 0.6 347 12 0.7 347 47 0.8 347 59 0.9 347 67 Nhận xét ñánh giá kết : - Từ bảng kết thử nghiệm ta nhận thấy số lượng giao dịch giá trị ngưỡng tin cậy tỷ lệ thuận với số luật thu ñược, nghĩa giá trị ngưỡng tin cậy thấp số luật thu ñược ít, giá trị ngưỡng tin cậy tăng lên số luật thu ñược tăng theo Footer Page 24 of 126 Header Page 25 of 126 - 25 - - Thông thường người ta thường chọn luật có ñộ tin cậy ñủ tốt (ñộ tin cậy cao) ñể ñánh giá, luật có ñộ tin cậy thấp ñể tham khảo bỏ qua KẾT LUẬN a) Đánh giá kết Kết ñạt ñược Về mặt lý thuyết: • Nắm ñược kiến thức khám phá tri thức khai phá liệu • Nắm ñược thuật toán tìm luật kết hợp như: Apriori, Apriori-TID, Apriori-Hybrid, FP-Growth, phân lớp với ñịnh • Cài ñặt thuật toán tìm luật kết hợp phương pháp phân lớp với ñịnh • Hiểu rõ lập trình C#, truy vấn liệu SQL Về mặt ứng dụng: • Xây dựng ñược hệ hỗ trợ ñịnh phục vụ cho công tác quản lý Những hạn chế • Chỉ minh họa hệ thống sở liệu siêu thị Walmart, chưa minh họa nhiều sở liệu khác • Hệ thống ñơn giản, chưa có nhiều chức Footer Page 25 of 126 Header Page 26 of 126 - 26 - b) Hướng phát triển • Tiếp tục hoàn thiện ñề tài, xây dựng hệ thống nhiều chức hơn, thử nghiệm ñánh giá kỹ thuật toán liệu lớn • Đưa thêm phương pháp khác khai phá liệu vào việc phân tích mô hình, gom cụm ñể phân lớp liệu từ ñó phân tích liệu xác ñưa luật có xác suất lớn • Khai phá liệu kho liệu với luật kết hợp ña chiều, nhiều mức • Tìm hiểu công cụ hỗ trợ hiển thị kết thuật toán dạng ñồ họa ñồ thị, biểu ñồ, Footer Page 26 of 126 ... tính chiến lược cho người quản lý Giúp nhà quản lý có nhìn tổng quan liệu Tên ñề tài “NGHIÊN CỨU LUẬT KẾT HỢP VÀ ỨNG DỤNG TRONG CÔNG TÁC QUẢN LÝ KHO HÀNG TẠI SIÊU THỊ METRO Footer Page of 126... - 21 - CHƯƠNG ỨNG DỤNG KHAI PHÁ LUẬT KẾT HỢP TRONG CÔNG TÁC QUẢN LÝ KHO HÀNG TẠI SIÊU THỊ 2.1 Phát biểu vấn ñề Đề tài nghiên cứu lý thuyết khai phá liệu, tìm hiểu luật kết hợp áp dụng thuật toán... Chương 1: Cơ sở lý thuyết khai phá liệu luật kết hợp Chương 2: Ứng dụng khai phá luật kết hợp công tác quản lý kho hàng siêu thị Footer Page of 126 Header Page of 126 -7- CHƯƠNG CƠ SỞ LÝ THUYẾT VỀ

Ngày đăng: 20/05/2017, 04:27

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan