Ứng dụng cây quyết định mờ trong khai phá dữ liệu

4 238 1
Ứng dụng cây quyết định mờ trong khai phá dữ liệu

Đang tải... (xem toàn văn)

Thông tin tài liệu

Ứng dụng cây quyết định mờ trong khai phá dữ liệu Cao Hùng Cường Trường Đại học Công nghệ Luận văn ThS chuyên ngành: Công nghệ thông tin; Mã số: 1 01 10 Người hướng dẫn: PGS.TS. Hồ Thuần Năm bảo vệ: 2007 Abstract: Mô tả lý thuyết về khai phá dữ liệu (KPDL), cây quyết định và độ đo mờ nói chung, kỹ thuật về KPDL. Trình bày thuật toán quy nạp cây quyết định mờ: biểu diễn của nhận thức không chắc chắn trong bài toán phân loại, định lượng nhận thức không chắc chắn, luật phân loại mờ và nhập nhằng phân loại, quy nạp cây quyết định mờ, đưa ra những ưu khuyết điểm của thuật toán. Giới thiệu về cài đặt thuật toán và chương trình mô phỏng thuật toán quy nạp xây dựng cây quyết định mờ Keywords: Cây quyết định, Công nghệ thông tin, Cơ sở dữ liệu, Khai phá dữ liệu Content MỞ ĐẦU Trong vài thập kỷ gần đây, cùng với sự phát triển nhanh chóng của công nghệ, mà định luật Moore là một minh chứng, là sự bùng nổ chóng mặt của lượng thông tin trên thế giới. Các công cụ lưu trữ thông tin cổ điển như sổ sách, tài liệu không còn đáp ứng được nhu cầu lưu trữ thông tin nữa và việc sử dụng công cụ lưu trữ thông tin mới như băng từ, ổ cứng, là điều tất yếu. Bên cạnh sự phát triển nhanh chóng về dung lượng cũng như độ tin cậy của các thiết bị kỹ thuật số nhằm lưu trữ thông tin, một câu hỏi được đặt ra là làm thế nào để xử lý lượng thông tin khổng lồ đó? Rõ ràng việc xử lý thông tin nhằm rút ra tri thức nằm trong đó đã vượt quá khả năng xử lý đơn thuần của con người. Ví dụ như một chuyên gia phân tích thị trường có thể mất hàng năm trời để tính toán mô hình quyết định dựa trên hàng ngàn thông số dữ liệu trong khi thị trường thay đổi nhanh chóng đòi hỏi phải ra quyết định kịp thời. Chính vì thế người ta nghĩ đến việc xử lý dữ liệu tự động bằng máy tính nhằm khai thác tri thức tiềm ẩn bên trong. Điều này là nền tảng ra đời của một môn khoa học mới được gọi khai phá dữ liệu. Khai phá dữ liệu được ứng dụng vào rất nhiều mặt trong cuộc sống, có thể kể đến một số ứng dụng như:  Y học: phân tích phản ứng phụ của thuốc, phân tích gen, chẩn đoán bệnh,  Tài chính: phán đoán xu hướng của thị trường chứng khoán, phát hiện gian lận tài chính,  Phân tích xu hướng mua, phán đoán tâm lý khách hàng,  Kỹ thuật số: mã hóa dữ liệu, ước lượng thông tin, References [1] R.L.P. Chang and T. Pavlidis, Fuzzy decision tree algorithms, IEEE Trans. Systems Man Cybernet. SMC-7 (1977) 28 35. [2] K.J. Cios and L.M. Sztandera, Continuous ID3 algorithm with fuzzy entropy measures, Proc. IEEE lnternat. Con/i on Fuzz Systems (San Diego, CA, 8 12 March 1992) 469 476. [3] M.R. Civanlar and H.J. Trussell, Constructing membership functions using statistical data, Fuzzy Sets and Systems 18 (1986) 1 14. [4] A. De Luca and S. Termin, A definition of a nonprobabilistic entropy in the setting of fuzzy sets theory, InJorm. and Control 20 (1972) 301-312. [5] M.M. Gupta, Twenty-five years of fuzzy sets and systems: A tribute to Professor Lotfi A. Zadeh, Fuzzy Sets and Systems 40 (1991) 409-413. [6] C. Hagg, Possibility and cost in decision analysis, Fuzzy Sets and Systems 1 (1978) 81 86. [7] M. Higashi and G.J. Klir, Measures of uncertainty and information based on possibility distributions, lnternat. J. Gen. Systems 9 (1983) 43 58. [8] G.J. Klir, Where do we stand on measures of uncertainty, ambiguity, fuzziness and the like? Fuzzy Sets and Systems 24 (1987) 141 160. [9] G.J. Klir, and T.A. Folger, Fuzzy Sets, Uncertainty, and lnformation (Prentice-Hall, Englewood Cliffs, N J, 1988). [10] G.J. Klir and M. Mariano, On the uniqueness of possibilistic measure of uncertainty and information, Fuzzy Sets and Systems 24 (1987) 197-219. [11] T. Kohonen, Self-Organization and Associative Memory (Springer, Berlin, 1988). [12] B. Kosko, Fuzzy entropy and conditioning, Inform. Sci. 30 (1986) 165 174. [13] B. Kosko, Neural Networks and Fuzzy Systems (Prentice-Hall, Englewood Cliffs, N J, 1992). [14] C.C. Lee, Fuzzy logic in control systems: fuzzy logic controller, Part II, IEEE Trans. Systems Man Cybernet. 20 (1990) 419-435. [15] C T. Lin and C.S.G. Lee, Neural-network-based fuzzy logic control and decision system, IEEE Trans. Comput. 12 (1991) 1320-1336. [16] W. Meier, R. Weber and H J. Zimmermann, Fuzzy data analysis - methods and industrial applications, Fuzzy Sets and Systems 61 (1994) 19- 28. [17] J.R. Quinlan, Induction of decision trees, Mach. Learning 1(1)(1986) 81 106. [18] J.R. Quinlan, Decision trees as probabilistic classifiers, Proc. 4th lnternat. Workshop on Machine Learning (Morgan Kauffman, LosAltos, CA, 1987) 31 37. [19] J.R. Quinlan, Simplifying decision trees, lnternat. J. Man Mach. Studies 27 (1987) 221 234. [20] J.R. Quinlan, Decision trees and decision making, 1EEE Trans. Systems Man Cybernet. 20 (1990) 339 346. [21] D. Ruan and E.E. Kerre, Fuzzy implication operators and generalized fuzzy method of cases, Fuzzy Sets and Systems 54 (1993) 23-37. [22] S.R. Safavian and D. Landgrebe, A survey of decision tree classifier methodology, IEEE Trans. Systems Man Cybernet. 21 (1991) 66(~674. [23] C.E. Shannon, A mathematical theory of communication, Bell System Tech. J. 27 (1948) 379 423; 623-656. [24] T. Tani and M. Sakoda, Fuzzy modeling by ID3 algorithm and its application to prediction of heater outlet Nhiệt độ, Proc.IEEE lnternat. Conj'. on Fuzz), Systems (San Diego, CA, 8-12 March 1992) 923 930. [25] R. Weber, Automatic knowledge acquisition for fuzzy control applications, Proc. lnternat. Symp. on Fuzzy Systems (lizuka, Japan, 12 15 July 1992) 9 12. [26] R. Weber, Fuzzy-ID3: a class of methods for automatic knowledge acquisition, Proc. 2nd Internat (lizuka, Japan, 17 22 July 1992) 265 268. [27] L.A. Zadeh, Fuzzy Sets, Inform. and Control 8 (1965) 338 353. [28] L.A. Zadeh, Fuzzy Sets as a basis for a theory of possibility, Fuzzy Sets and Systems 1 (1978) 3 28. [29] Yufei Yuan, Michael J.Shaw, Induction of fuzzy decision trees . quy nạp xây dựng cây quyết định mờ Keywords: Cây quyết định, Công nghệ thông tin, Cơ sở dữ liệu, Khai phá dữ liệu Content MỞ ĐẦU Trong vài thập kỷ gần đây, cùng với sự phát triển nhanh. ẩn bên trong. Điều này là nền tảng ra đời của một môn khoa học mới được gọi khai phá dữ liệu. Khai phá dữ liệu được ứng dụng vào rất nhiều mặt trong cuộc sống, có thể kể đến một số ứng dụng. thuyết về khai phá dữ liệu (KPDL), cây quyết định và độ đo mờ nói chung, kỹ thuật về KPDL. Trình bày thuật toán quy nạp cây quyết định mờ: biểu diễn của nhận thức không chắc chắn trong bài

Ngày đăng: 25/08/2015, 11:59

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan