Nghiên cứu phần tử ngoại lai trong cơ sở dữ liệu và ứng dụng

27 836 1
Nghiên cứu phần tử ngoại lai trong cơ sở dữ liệu và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Nghiên cứu phần tử ngoại lai trong cơ sở dữ liệu và ứng dụng

BỘ GIÁO DỤC ĐÀO TẠO VIỆN KHOA HỌC CÔNG NGHỆ VIỆT NAM VIỆN CÔNG NGHỆ THÔNG TIN Phạm Hạ Thủy NGHIÊN CỨU PHẦN TỬ NGOẠI LAI TRONG SỞ DỮ LIỆU ỨNG DỤNG Chuyên ngành: Bảo đảm toán học cho máy tính hệ thống tính toán Mã số: 62.46.35.01 TÓM TẮT LUẬN ÁN TIẾN SĨ Hà Nội – 2007 Công trình được hoàn thành tại: Viện Công nghệ Thông tin - Viện Khoa học Công nghệ Việt Nam Người hướng dẫn khoa học: 1- PGS.TS. Vũ Đức Thi 2- PGS.TS. Lê Hải Khôi Phản biện 1: PGS.TS. Nguyễn Thanh Thuỷ Phản biện 2: GS.TS. Đặng Huy Ruận Phản biện 3: PGS.TS. Nguyễn Xuân Huy Luận án được bảo vệ trước Hội đồng chấm luận án cấp Nhà nước, họp tại: Viện Công Nghệ Thông tin - Viện Khoa họ c Công nghệ Việt Nam Vào hồi 15h 30’ giờ ngày 26 tháng 08 năm 2007 thể tìm hiểu luận án tại: - Thư viện Viện Công Nghệ Thông tin - Thư viện Quốc gia Hà Nội CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ LIÊN QUAN ĐẾN LUẬN ÁN 1. Phạm Hạ Thuỷ (2001), "Thiết kế phần mềm kiểm toán trên nền sở dữ liệu của Kiểm toán Nhà nước", Tạp chí Tin học điều khiển T17( 3),p.61-64. 2. Phạm Hạ Thuỷ (2005), "Ứng dụng cây quyết định vào việc xác định rủi ro kiểm toán", Tạp chí Kiểm toán Số T60 (8), p.32-35. 3. Phạm Hạ Thuỷ (2005), “Phát hiện phần tử ngoại lai theo luật hợp thành ứng dụng trong việc phát hiện sai sót trong chứng từ kế toán”, Tạp chí Tin học Tài chính, số 29, p. 24-25. 4. Phạm Hạ Thuỷ (2005), “ Xác định phần tử ngoại lai trong sở dữ liệu quan hệ”, Tạp chí Tin học điều khiển,T21(4),p.352-360. 5. Phạm Hạ Thuỷ - Hoàng Xuân Huấn (2006), "Phát hiện phần tử ngoại lai trong sở dữ liệu nhờ phân tích hồi qui", Tạp chí Tin học Điều khiển, T22(1), p.45- 52. 6. Vũ Đức Thi - Phạm Hạ Thuỷ (2007), " Phụ thuộc hàm xấp xỉ phần tử ngoại lai đối với phụ thuộc hàm", Tạp chí Tin học Điều khiển, T23(1), p.80-85. Một số báo cáo tại các hội thảo quốc gia về CNTT 1. Vũ Đức Thi - Phạm Hạ Thuỷ, " Find out Strong Dependencies over Relational Database", Hội thảo khoa học quốc gia lần thức ba " Nghiên cứu phát triển ứng dụng công nghệ thông tin truyền thông" - ICT.rda'06 được tổ chức tại Hà Nội tháng 5/2006. 2. Vũ Đức Thi- Phạm Hạ Thuỷ, "Kiểm tra một quan hệ thoả phụ thuộc hàm xấp xỉ loại 2 phát hiện phần tử ngo ại lai đối với phụ thuộc hàm xấp xỉ", Hội thảo quốc gia " Một số vấn đề chọn lọc của công nghệ thông tin" lần thứ 9 được tổ chức tại Đà lạt tháng 6/ 2006; 1 MỞ ĐẦU Phát hiện phần tử ngoại lai (Outlier Detection) là một trong nội dung của khám phá tri thức trong sở dữ liệu (KDD), là công việc cần thiết trong tổ chức những kho dữ liệu lớn (Data Warehouse) trong quá trình tích hợp làm sạch dữ liệu. Việc phát hiện phần tử ngoại lai trong CSDL vai trò quan trọng để giải quyết nhiều bài toán thực tế: phân tích dữ liệu nhằm phát hiện những hiện tượng bấ t thường, những gian lận, sai sót trong hoạt động quản lý tài chính, sản xuất kinh doanh; trong việc kiểm tra ngăn chặn những gian lận trong giao dịch điện tử; trong việc tổ chức kiểm soát, làm sạch dữ liệu trong tổ chức quản lý khai thác những kho dữ liệu lớn Việc giải quyết bài toán phát hiện phần tử ngoại lai trong sở dữ liệu (CSDL) ý nghĩa cả về mặt lý thuyế t tổ chức sở dữ liệu thực tế ứng dụng hiện nay. Lý thuyết về phát hiện phần tử ngoại lai cũng gắn liền với sự phát triển của khai phá dữ liệu (Data mining) với các công trình nghiên cứu của Barnett Lewis (1994), của Arning, Agrawal, Raghavan (1996), E. Knorr (1998, 2002), K. Penny I. Jollife (2001), A. Nicholson (2002), J. Hardin D. Jocke (2004) nhiều tác giả khác. Gần đây phần tử ngoại lai vẫn là tâm điểm nghiên cứu của nhiều tác giả. Càng ngày càng nhiều nghiên cứ u ứng dụng việc phát hiện phần tử ngoại lai vào trong các lĩnh vực khác nhau của đời sống xã hội: phòng chống tội phạm máy tính; kiểm soát mạng; xử lý nhiễu, phát hiện mẫu, phát hiện dị thường làm sạch dữ liệu trong học máy nghiên cứu y học Tuy nhiên các phương pháp phát hiện phần tử ngoại lai của các tác giả đi trước mới chỉ đề xuất cho các tập dữ liệu nói chung, ch ưa đi sâu vào các loại dữ liệu cấu trúc cụ thể. Mặt khác việc phát hiện phần tử ngoại lai chỉ mới dựa trên việc xử lý các phần tử trong nội bộ của tập dữ liệu. Vai trò của các ràng buộc, luật biết trước (các thông tin bên ngoài tính chất qui định, định hướng) mà các phần tử của tập dữ liệu buộc phải tuân theo chưa được đặt ra (mà trong thực t ế những bài toán phát hiện hiên tượng gian lận, sai sót (hiện tượng ngoại lai) trong 2 các lĩnh vực kế toán, kiểm toán, quản lý kinh tế thì lại chủ yếu là dựa vào các qui định, các luật biết trước). Điều này làm hạn chế đến hiệu quả của việc phát hiện khi áp dụng vào những trường hợp CSDL cụ thể hoặc đối với mục tiêu nhằm phát hiện những phần tử vi phạm những luật (các ràng buộc hoặc qui tắc) được cho trước. Hoạ t động kiểm toán của Kiểm toán Nhà nước hiện nay là việc kiểm tra, đánh giá xác nhận tính đúng đắn, trung thực của báo cáo tài chính; việc tuân thủ pháp luật; tính kinh tế, hiệu lực hiệu quả trong quản lý, sử dụng ngân sách, tiền tài sản nhà nước. Hiện nay hoạt động kiểm toán nhà nước ở Việt nam được tiến hành chủ yếu bằng cách thủ công. Việc kiểm tra đánh giá mất rất nhi ều công sức thời gian, nhiều rủi ro xẩy ra (sự bỏ sót, đánh giá sai lệch…).Vì vậy việc nghiên cứu về mặt lý thuyết các vấn đề về tổ chức các sở dữ liệu (chứng từ, tài liệu kế toán), phân tích dữ liệu, mô hình hoá, xây dựng các thuật toán, phương pháp giải quyết các bài toán phân tích, kiểm tra, kiểm soát thông tin, phát hiện phần tử ngoại lai trong các CSDL, đặc biệt là trong các CSDL dạng quan hệ là hết sức c ần thiết ý nghĩa trong việc xây dựng các phần mềm dùng cho kiểm toán. Luận án "Nghiên cứu phần tử ngoại lai trong sở dữ liệu ứng dụng" được thực hiện nhằm mục tiêu đề xuất một số những mô hình, thuật toán mới trong xử lý file dữ liệu trong hệ thống CSDL liên quan đến việc phát hiện phần tử ngoại lai trong CSDL quan hệ ý nghĩa trong việc ứng dụng vào l ĩnh vực hoạt động quản lý tài chính kiểm toán nhà nước. Những nội dung được lựa chọn nghiên cứu của Luận án là những mô hình, phương pháp tổ chức, xử lý file dữ liệu trong CSDL quan hệ; những phương pháp, thuật toán sử dụng trong lĩnh vực khám phá tri thức khai thác dữ liệu liên quan đến việc phát hiện những phẩn tử ngoại lai. Trọng tâm của Luận án là giải quyết bài toán phát hiện phần t ử ngoại lai trong CSDL, song bên cạnh đó Luận án cũng tiến hành nghiên cứu đề xuất những vấn đề lý thuyết trong CSDL quan hệ như 3 thuật toán tìm khóa của một quan hệ, các điều kiện để quan hệ ở dạng chuẩn 2NF, việc phát hiện những phần tử ngoại lai (theo nghĩa vi phạm các ràng buộc về phụ thuộc hàm, các dạng chuẩn ). Đồng thời Luận án cũng đề xuất một số thuật toán tìm luật kết hợp, xây dựng cây quyết định, xây dựng mô hình lấy mẫu phục vụ cho mục đích phát hiệ n phần tử ngoại lai. Một số mục tiêu cụ thể của Luận án được đặt ra là: - Nghiên cứu phần tử ngoại lai trong sở dữ liệu lớn dựa trên phụ thuộc hàm, khoá các dạng chuẩn nhằm giải quyết một số bài toán cụ thể về phát hiện phần tử ngoại lai trong sở dữ liệu quan hệ; - Hoàn thiện thêm lý thuyết về phụ thu ộc mạnh trong sở dữ liệu quan hệ ứng dụng phụ thuộc mạnh trong việc phát hiện phần tử ngoại lai; - Nghiên cứu phụ thuộc xấp xỉ loại 2 ứng dụng vào việc phát hiện phần tử ngoại lai; - Cải tiến thuật toán xây dựng cây phân lớp thuật toán tìm luật kết hợp phân lớp; - Nghiên cứu, đề xuất một số mô hình ứng dụng phát hiệ n phần tử ngoại lai vào thực tiễn hoạt động kiểm toán quản lý tài chính. Với việc hoàn thành các mục tiêu đã đặt ra, Luận án đã đạt được một số kết quả, đóng góp một phần trong việc phát triển lý thuyết về tổ chức xử lý các file dữ liệu trong sở dữ liệu khai thác dữ liệu. Luận án ý nghĩa thực tế trong việc giải quyết mộ t số bài toán trong lĩnh vực kiểm toán quản lý tài chính trong bối cảnh công cuộc tin học hoá đang được triển khai mạnh mẽ trong các lĩnh vực này. Luận án gồm 151 trang được bố cục thành 4 chương cùng với phần mở đầu, kết luận giới thiệu tài liệu tham khảo. Chương 1. Lý thuyết sở các công trình nghiên cứu liên quan, Luận án trình bày một số lý thuyết công trình nghiên cứu của các tác giả đi trướ c làm sở cho việc nghiên cứu. 4 Chương 2. Phát hiện phần tử ngoại lai trong sở dữ liệu quan hệ, Luận án trình bày những kết quả nghiên cứu của tác giả về lý thuyết phát hiện phần tử ngoại lai trong CSDL quan hệ. Chương 3. Cây quyết định chọn mẫu xác định ngoại lai, Luận án trình bày kết quả nghiên cứu của tác giả về một số thuật toán cải tiến xây dựng cây quyết định, phát hi ện luật kết hợp phân lớp; mô hình chọn mẫu thống kê phát hiện phần tử ngoại lai trong CSDL quan hệ. Chương 4. Ứng dụng trong thực tế hoạt động kiểm toán, Luận án trình bày một số mô hình ứng dụng kết quả nghiên cứu về phát hiện phần tử ngoại lai trong CSDL quan hệ vào hoạt động kiểm toán phân tích kinh tế. 5 CHƯƠNG 1 LÝ THUYẾT SỞ CÁC CÔNG TRÌNH NGHIÊN CỨU LIÊN QUAN Trong nội dung của chương này, Luận án trình bày một số lý thuyết công trình nghiên cứu của các tác giả đi trước làm sở cho việc nghiên cứu, bao gồm: một số nội dung bản về CSDL quan hệ: các khái niệm về quan hệ, tiên đề Amstrong, phụ thuộc hàm, khoá, dạng chuẩn của quan hệ; một số vấn đề lý thuyết về khai thác dữ liệ u: phát hiện phần tử ngoại lai; khai thác tìm kiếm luật kết hợp; xây dựng cây quyết định. Các khái niệm về phụ thuộc hàm, khoá các dạng chuẩn của quan hệ được tác giả của luận án sử dụng để xây dựng khái niệm về phần tử ngoại lai đối với phụ thuộc hàm, khoá các dạng chuẩn cũng như các thuật toán dùng để phát hiện phần tử ngoại lai trong từ ng trường hợp. Khái niệm phần tử ngoại lai trong một tập dữ liệu dùng để chỉ những phần tử sự khác biệt so với đa số các phần tử còn lại của tập dữ liệu. nhiều phương pháp nghiên cứu về phần tử ngoại lai, tuy nhiên các phương pháp phát hiện phần tử ngoại lai của các tác giả đi trước mới chỉ đề xuất cho các t ập dữ liệu nói chung, chưa đi sâu vào các loại dữ liệu cấu trúc cụ thể. Việc phát hiện phần tử ngoại lai chỉ mới dựa trên việc xử lý các phần tử trong nội bộ của tập dữ liệu, vai trò của các ràng buộc, luật biết trước (các thông tin bên ngoài tính chất qui định, định hướng) mà các phần tử của tập dữ liệu buộc phải tuân theo chưa được đặ t ra. Điều này làm hạn chế đến hiệu quả của việc phát hiện khi áp dụng vào những trường hợp CSDL cụ thể hoặc đối với mục tiêu nhằm phát hiện những phần tử vi phạm những luật (các ràng buộc hoặc qui tắc) được cho trước. Trong thực tế những bài toán phát hiện gian lận, sai sót trong các lĩnh vực kế toán, kiểm toán, quản lý kinh tế thì lại chủ yếu là dự a vào các qui định, các luật biết trước. Vì vậy việc nghiên cứu, đề xuất những mô hình, phương pháp phát hiện phần tử ngoại lai cho những mô hình dữ liệu cụ thể, đặc biệt là đối với mô hình 6 dữ liệu quan hệ là việc cần thiết Trong Luận án này, chúng tôi đưa ra một số phương pháp phát hiện phần tử ngoại lai trong sở dữ liệu quan hệ dựa theo phụ thuộc hàm, khóa các dạng chuẩn ý nghĩa trong việc giải quyết một số bài toán cụ thể của thực tế. Phân lớp dữ liệu (data classification) là một phương pháp quan trọng cho nhiều ứng dụng khai phá dữ liệu nói chung việ c phát hiện phần tử ngoại lai nói riêng. Phân lớp dữ liệu ý nghĩa làm tăng hiệu quả đối với quá trình phát hiện phần tử ngoại lai khi chúng ta tiến hành phân lớp dữ liệu thành các tập con mà trong mỗi tập con những đặc trưng riêng. Các phần tử ngoại lai trong từng tập khác nhau sẽ khả năng xuất hiện khác nhau. nhiều thuật toán dùng cho việc xây dựng cây quyết định phân lớp. Chúng tôi giới thi ệu một số phương pháp thuật toán phổ biến được sử dụng như ID3, C4.5 của R. Quinlan (1990, 1993); phương pháp phân lớp dựa trên cây quyết định luật kết hợp của Bing Liu, Hsu, Ma (1998); phương pháp dựa trên cây quyết định phụ thuộc hàm xấp xỉ của Kwok-Wa Lam Victor C.S.Lee (2004). Trong Luận án chúng tôi đề xuất một số cải tiến đối với các thuật toán này ý nghĩa làm giảm khối lượng tính toán. CHƯƠNG 2 PHÁT HIỆN PH ẦN TỬ NGOẠI LAI TRONG SỞ DỮ LIỆU QUAN HỆ Đây là chương trọng tâm, trình bày những kết quả nghiên cứu chính của Luận án. Các nội dung chính bao gồm: 1. Mô hình phát hiện phần tử ngoại lai dựa theo luật Trong nội dung được trình bày chúng tôi đưa ra mô hình phát hiện phần tử ngoại lai dựa theo luật (Rules – Based) trong CSDL quan hệ. Các ràng buộc, qui tắc đối với CSDL quan hệ được đề cập ở đây nhiều loạ i khác nhau bao gồm các luật qui định về sự phụ thuộc dữ liệu: phụ thộc hàm, khoá đối với đồ quan hệ hoặc file dữ liệu; phụ thuộc tương quan giữa các thuộc tính; một hệ ràng buộc cho trước mà 7 các phần tử của tập dữ liệu phải tuân theo; các luật qui định về các dạng chuẩn của đồ quan hệ 2.Phần tử ngoại lai đối với phụ thuộc hàm, khóa của quan hệ Khái niệm về phần tử ngoại lai đối với phụ thuộc hàm, khóa là các khái niệm mới mà chúng tôi đưa ra cùng với việc giải quyết vấn đề tìm các phần tử trong một bảng dữ liệu vi phạm các điều kiện của phụ thuộc hàm, khóa đối với một quan hệ. Hiện tượng vi phạm này cũng thường xảy ra trong thực tế đối với quá trình cập nhật dữ liệu vào các bảng dữ liệu sau khi một sở dữ liệu đã được thiết kế xong (sai sót hoặc cố tình khi cập nhật dữ liệu). Các hiện tượng này cần được phát hiện xử lý. Việc ứng dụng lý thuyết về phát hiện phần tử ngoại lai đối với phụ thuộc hàm, khóa vào thực tế họat động kiểm toán được chúng tôi trình bày chi tiết trong Chương 4. Giả sử X→ Y là một phụ thuộc hàm được giả thiết đúng trên quan hệ r. Những cặp phần tử (t i , t j ) với t i , t j ∈ r mà t i (X) = t j (X) nhưng t i (X) ≠ t j (Y) được gọi là cặp ngoại lai đối với phụ thuộc hàm X→Y. Cho bảng dữ liệu r được giả thiết là một quan hệ trên đồ quan hệ (R,F); B được giả thiết là tập các khoá của r. Cặp phần tử (t i , t j ) với t i , t j ∈ r (i ≠ j) là một cặp ngoại lai đối với khoá nếu như đối với một khoá K∈ B, ta t i (K) = t j (K). Theo qui ước bảng dữ liệu được giả thiết là một quan hệ thì không thể 2 bộ trùng nhau hoàn toàn, do vậy nếu 2 bộ trùng nhau trên khoá thì chúng thể trùng nhau trên toàn bộ R tức chúng là ngoại lai đối với quan hệ. Hoặc chúng không bằng nhau trên các thuộc tính còn lại (R \ K). Như vậy chúng lại là cặp ngoại lai theo phụ thuộc hàm. Hiện tượng này thường xảy ra trong thực tế do quá trình cập nhật dữ liệu sai do cố ý hoặc không cố ý. Trong kết quả nghiên cứu chúng tôi đưa ra chứng minh Định lý 2.1 mệnh đề 2.1. về dấu hiệu nhận biết các cặp phần tử ngoại lai đối với phụ thuộc hàm, khóa của một quan hệ r. Dấu hiệu nhận biết được dựa [...]... kinh doanh Luận án "Nghiên cứu phần tử ngoại lai trong sở dữ liệu ứng dụng " đã hoàn thành các mục tiêu được đặt ra, giá trị về mặt lý thuyết về phát hiện phần tử ngoại lai trong sở dữ liệu và việc ứng dụng để giải quyết một số bài toán thực tế trong hoạt động kiểm toán quản lý kinh tế Những đóng góp của Luận án bao gồm: - Nghiên cứu phần tử ngoại lai trong sở dữ liệu quan hệ dựa trên... hiện các phần tử ngoại lai theo luật trong dữ liệu báo cáo tài chính (chủ yếu ở dạng CSDL quan hệ) mà đã được chúng tôi nghiên cứu trình bày trong các Chương 2, Chương 3 21 Các ứng dụng được nghiên cứu áp dụng bao gồm: - Phát hiện sai sót gian lận trong kê khai thuế chi phí nguyên vật liệu Phương pháp dựa trên kết quả nghiên cứu về phát hiện phần tử ngoại lai đối với phụ thuộc hàm hệ ràng... rủi ro Mặc còn những hạn chế nhưng Luận án "Nghiên cứu phần tử ngoại lai trong sở dữ liệu ứng dụng" đóng góp về mặt lý thuyết trong tổ chức, xử lý sở dữ liệu ý nghĩa thực tế trong việc giải quyết một số bài toán trong lĩnh vực kiểm toán quản lý tài chính trong bối cảnh công cuộc tin học hoá đang được triển khai mạnh mẽ trong các lĩnh vực này ... kiểm tra bằng thủ công thực hiện trên những mẫu đại diện của tập dữ liệu tổng thể liên quan đến việc chọn mẫu để phát hiện phần tử ngoại lai Tuy nhiên trong các kết quả nghiên cứu trước đây về phần tử ngoại lai thì việc lấy mẫu chưa được đặt ra Trong nội dung của Luận án, chúng tôi đề xuất một số phương pháp lấy mẫu để phát hiện phần tử ngoại lai ý nghĩa trong việc áp dụng vào họat động kiểm toán... phụ thuộc hàm, khóa các dạng chuẩn Đưa ra một số định lý thuật toán nhằm giải quyết một số bài toán cụ thể về phát hiện phần tử ngoại lai trong sở dữ liệu quan hệ; - Hoàn thiện thêm lý thuyết về mối quan hệ giữa họ các phụ thuộc mạnh họ các phụ thuộc hàm thông thường trong đồ quan hệ việc ứng dụng phụ thuộc mạnh phát hiện phần tử ngoại lai; - Đề xuất khái niệm một số tính chất... này cũng được ứng dụng trong việc chọn mẫu kiểm toán (nội dung của ứng dụng được chúng tôi trình bày trong Chương 4 của Luận án) CHƯƠNG 4 ỨNG DỤNG VÀO THỰC TẾ HOẠT ĐỘNG KIỂM TOÁN Trong nội dung của chương, chúng tôi giới thiệu một số ứng dụng các kết quả nghiên cứu của mình vào hoạt động kiểm toán thông qua việc phân tích các sở dữ liệu dạng quan hệ Trong lĩnh vực quản lý tài chính, kiểm toán... đơn trong một quan hệ cho trước Khái niệm phần tử ngoại lai đối với phụ thuộc mạnh được trình bày trong Mục 2.7.6 Việc xác định phần tử ngoại lai đối với một phụ 13 thuộc mạnh được đưa về việc tìm phần tử ngoại lai đối với các phụ thuộc hàm vế trái chỉ một phần tử còn vế phải là vế phải của phụ thuộc hàm mạnh ban đầu Thuật toán được đề xuất: Thuật toán 12- Xác định các cặp phần tử ngoại lai đối... bất thường trong sản xuất kinh doanh thông qua phân tích các báo cáo tài chính dữ liệu kế toán; xây dựng mô hình xác định rủi ro kiểm toán thông qua việc sử dụng cây quyết định; xây dựng một số phương pháp lấy mẫu kiểm toán; mô hình ứng dụng phụ thuộc mạnh trong kiểm toán phân tích hoạt động sản xuất kinh doanh Lý thuyết về phát hiện phần tử ngoại lai trong sở dữ liệu được trình bày trong luận... kết hợp này ý nghĩa trong nhiều ứng dụng thực tế của hoạt động kiểm toán Các khái niệm thuật toán được chúng tôi đưa ra trong Mục 2.5 Chương 2 nhằm giải quyết bài toán về phát hiện phần tử ngoại lai đối với một hệ các luật kết hợp trong một quan hệ -Thuật toán 5- Xác định phần tử ngoại lai đối với hệ ràng buộc dạng phụ thuộc hàm 4 Phần tử ngoại lai đối với các dạng chuẩn Trong thực tế sau khi... tượng bất thường trong hoạt động sản xuất kinh doanh của các doanh nghiệp thông qua dữ liệu báo cáo tài chính của doanh nghiệp, trong hoạt động kiểm toán tại Kiểm toán Nhà nước (xem Mục 4.2 Chương 4 Luận án) CHƯƠNG 3 CÂY QUYẾT ĐỊNH CHỌN MẪU XÁC ĐỊNH NGOẠI LAI Phân lớp dữ liệu là một phương pháp quan trọng cho nhiều ứng dụng khai thác dữ liệu nói chung việc phát hiện phần tử ngoại lai nói riêng Việc . hiện phần tử ngoại lai trong cơ sở dữ liệu quan hệ; - Hoàn thiện thêm lý thuyết về phụ thu ộc mạnh trong cơ sở dữ liệu quan hệ và ứng dụng phụ thuộc mạnh trong việc phát hiện phần tử ngoại lai; . niệm phần tử ngoại lai trong một tập dữ liệu dùng để chỉ những phần tử có sự khác biệt so với đa số các phần tử còn lại của tập dữ liệu. Có nhiều phương pháp nghiên cứu về phần tử ngoại lai, . phần tử ngoại lai trong cơ sở dữ liệu quan hệ”, Tạp chí Tin học và điều khiển,T21(4),p.352-360. 5. Phạm Hạ Thuỷ - Hoàng Xuân Huấn (2006), "Phát hiện phần tử ngoại lai trong cơ sở dữ liệu

Ngày đăng: 03/04/2014, 17:10

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan