Tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tín dụng cho ngân hàng ABBank

62 150 1
Tiếp cận phân cụm chuỗi thời gian mờ trong dự báo tín dụng cho ngân hàng ABBank

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LƯU ĐỨC DŨNG TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TÍN DỤNG CHO NGÂN HÀNG ABBANK LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN, 2017 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ` LƯU ĐỨC DŨNG TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TÍN DỤNG CHO NGÂN HÀNG ABBANK Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học : PGS TS Lê Bá Dũng Thái Nguyên, 2017 MỤC LỤC MỤC LỤC DANH MỤC HÌNH ẢNH DANH MỤC BẢNG BIỂU MỞ ĐẦU CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VỀ TẬP MỜ 11 1.1 Tập mờ 11 1.1.1 Định nghĩa tập mờ 11 1.1.2 Một số khái niệm tập mờ 13 1.1.3 Biểu diễn tập mờ 14 1.2 Các phép toán tập mờ hệ luật mờ 15 1.2.1 Phần bù tập mờ 15 1.2.2 Phép hợp tập mờ 16 1.2.3 Phép giao tập mờ 16 1.2.4 Tích Descartes tập mờ 17 1.2.5 Tính chất phép toán tập mờ 18 1.2.6 Hệ luật mờ 19 1.3 Lập luận xấp xỉ tập mờ 19 1.3.1 Logic mờ 19 1.3.2 Quan hệ mờ 20 1.3.2.1 Khái niệm quan hệ rõ 20 1.3.2.2 Các quan hệ mờ 20 1.3.2.3 Các phép toán quan hệ mờ 21 1.3.3 Suy luận xấp xỉ suy diễn mờ 22 1.4 Số học mờ 23 1.4.1 Số mờ 23 1.4.1.1 Khái niệm số mờ 23 1.4.1.2 Dạng số mờ thường dùng 25 1.4.2 Biến ngôn ngữ giá trị ngôn ngữ 25 1.5 Giải mờ 26 1.5.1 Phương pháp điểm cực đại 27 1.5.2 Phương pháp điểm trọng tâm 28 CHƯƠNG 2: KHÁI NIỆM VỀ CHUỖI THỜI GIAN MỜ VÀ CÁC PHƯƠNG PHÁP 30 2.1 Khái niệm chuỗi thời gian mờ 30 2.1.1 Định nghĩa chuỗi thời gian mờ 30 2.1.2 Một số định nghĩa liên quan đến chuỗi thời gian mờ 31 2.2 Một số thuật toán dự báo hình chuỗi thời gian mờ 32 2.2.1 Thuật toán Song & Chissom 32 2.2.2 Thuật toán Chen 33 2.3 Một số phương pháp chia khoảng 34 2.3.1 Phương pháp độ dài dựa phân bố giá trị 35 2.3.2 Phương pháp độ dài dựa giá trị trung bình 35 2.4 Thuật toán hình dự báo dựa chuỗi thời gian mờ Jens Rúni Poulsen (hay Jens Poulsen) 36 2.5 Thuật toán phân cụm mờ - Thuật toán K-means 40 CHƯƠNG 3: DỰ BÁO TÍN DỤNG ỨNG DỤNG CHUỖI THỜI GIAN MỜ SỬ DỤNG KỸ THUẬT PHÂN CỤM 46 3.1 Ứng dụng phương pháp chuỗi thời gian mờ cải tiến cho dự báo tín dụng 47 3.2 Tiếp cận phương pháp cho dự báo thời gian mờ 47 3.3 Đánh giá phương pháp tiếp cận 54 3.4 Kết luận 60 TÀI LIỆU THAM KHẢO 61 DANH MỤC HÌNH ẢNH Hình 1.1 Hàm thuộc 𝝁𝑨𝒙 có mức chuyển đổi tuyến tính 12 Hình 1.2 Hàm thuộc tập B 12 Hình 1.3 Miền xác định miền tin cậy tập mờ A 13 Hình 1.4 Biểu diễn tập mờ chiều cao 15 Hình 1.5 Tập bù 𝑨 tập mờ A 15 Hình 1.6 Hợp hai tập mờ có tập 16 Hình 1.7 Giao hai tập mờ có tập vũ trụ 17 Hình 1.8 Các loại hàm thành viên số mờ 24 Hình 1.9 Phân loại hàm thành viên số mờ 24 Hình 1.10 Số mờ hình thang 25 Hình 1.11 Số mờ hình tam giác 25 Hình 1.12 Những tập mờ thuộc biến ngôn ngữ nhiệt độ 26 Hình 1.13 Giải mờ phương pháp điểm cực đại 28 Hình 1.14 Giải mờ phương pháp điểm trọng tâm 29 Hình 2.1 Các thiết lập để xác định ranh giới cụm ban đầu 40 Hình 2.2 Tính toán trọng tâm cụm 41 Hình 2.3 Các bước thực thuật toán K- means 42 Hình 2.4 Thuật toán K-means chi tiết 43 Hình 2.5 Ví dụ số hình dạng cụm liệu khám phá Kmeans 45 Hình 3.1 Tín dụng tập mờ giá trị dự báo qua năm 53 Hình 3.2 Giá trị dự báo hình dự báo đề xuất so với giá trị nợ tín dụng thực tế 59 DANH MỤC BẢNG BIỂU Bảng 1.1 Bảng biểu diễn tập mờ A 13 Bảng 2.1 Cơ sở ánh xạ 35 Bảng 3.1 Số liệu nợ tín dụng Ngân hàng ABBANK 48 Bảng 3.4 Số liệu tín dụng tập mờ giá trị dự báo qua năm 53 Bảng 3.5 Kết dự báo 56 Bảng 3.6 Phân tích kết dự báo qua sai số tiêu chuẩn 57 Bảng 3.7 Bảng so sánh kết dự báo hình 58 Bảng 3.8 Bảng sai số dự báo hình 59 Bảng 3.9 Bảng so sánh thước đo sai số hình 60 LỜI CAM ĐOAN Tôi xin cam đoan luận văn nghiên cứu thực Các thông số, bảng biểu kết sử dụng luận văn hoàn toàn có thật chưa công bố luận văn khác Thái Nguyên, ngày 14 tháng 04 năm 2017 Tác giả luận văn Lưu Đức Dũng MỞ ĐẦU Nghiên cứu chuỗi thời gian nói chung, chuỗi thời gian mờ nói riêng nghiên cứu, ứng dụng mạnh mẽ thành công nhiều lĩnh cực năm gần [4, 5, 6, 7] Các lớp toán lĩnh vực dự báo tín dụng, thị trường chứng khoán, dự báo hệ thống điều khiển… sử dụng giải theo phương pháp truyền thống phương pháp thống kê, quy hoạch tuyến tính, … Phương pháp nghiên cứu chuỗi thời gian mờ hình thành có nhiều khả vượt trội việc tuyến tính hóa, dự báo, phân tích, đánh giá liệu, áp dụng thành công cho số lĩnh vực khoa học, kỹ thuật, kinh tế… Nhiều hình chuỗi thời gian mờ (FTS) [6,7] đề xuất tài liệu khoa học thập kỷ qua Trong số hình chuỗi thời gian mờ xác tìm thấy tài liệu hình bậc cao Tuy nhiên, ba vấn đề cần phải giải liên quan đến hình bậc cao Đầu tiên, phương pháp dự báo để cung cấp tỷ lệ xác đạt yêu cầu cho đầu giải mờ (dự báo) Thứ hai, liệu trở nên sử dụng tăng thứ bậc Thứ ba, dự báo xác nhạy cảm với phân vùng khoảng lựa chọn Nhằm giải vấn đề đề với gợi ý thầy hướng dẫn đề tài cho luận văn tốt nghiệp với tiêu đề là: “Tiếp cận phân cụm chuỗi thời gian mờ dự báo tín dụng cho ngân hàng ABBANK” Nội dung luận văn ứng dụng phương pháp chuỗi thời gian mờ cho dự báo tín dụng trình bày chương sau: Chương 1: Cơ sở lý thuyết tập mờ Chương 2: Khái niệm chuỗi thời gian mờ phương pháp Chương 3: Dự báo tín dụng ứng dụng chuỗi thời gian mờ sử dụng kỹ thuật phân cụm TÀI LIỆU THAM KHẢO Luận văn hoàn thành hướng dẫn tận tình thầy giáo PGS TS Lê Bá Dũng, em xin đặc biệt bày tỏ lòng biết ơn chân thành thầy Em chân thành cảm ơn thầy, cô giáo Viện Công nghệ thông tin, Trường Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên tham gia giảng dạy, giúp đỡ em suốt trình học tập nâng cao trình độ kiến thức Tuy nhiên điều kiện thời gian khả có hạn nên luận văn tránh khỏi thiếu sót Em kính mong thầy cô giáo bạn đóng góp ý kiến để đề tài hoàn thiện 10 Đối tượng phạm vi nghiên cứu 1.1 Đối tượng - Tập trung tìm hiểu, tiếp cận chuỗi thời gian mờ lý thuyết, cấu trúc, phương pháp học hạn chế - Sau áp dụng phương pháp để đánh giá để đạt kết tối ưu cho dự báo tín dụng 1.2 Phạm vi nghiên cứu - Tìm hiểu tổng quan chuỗi thời gian mờ - Tìm hiểu, so sánh phương pháp ứng dụng chuỗi thời gian mờ - Trình bày phương pháp để dự báo tín dụng dựa kỹ thuật phân cụm K-means Hướng nghiên cứu đề tài - Nắm bắt kiến thức phương pháp phân tích, đánh giá - Tiếp tục tìm hiểu sâu phương pháp khai phá liệu - Một số hình mờ, ứng dụng cho việc dự báo tín dụng - Cài đặt thực nghiệm, ứng dụng vào toán cụ thể thực tiễn 48 Trên bảng 3.1 số liệu tín dụng cho vay Ngân hàng ABBANK từ 2003 đến 2016 thu thập để xây dựng trình dự báo qua phân cụm Năm nợ Tín dụng (tỷ đồng) 2003 158 2004 179 2005 906 2006 1131 2007 6858 2008 6539 2009 12883 2010 19877 2011 19916 2012 18756 2013 23647 2014 25969 2015 30915 2016 36026 Bảng 3.1 Số liệu nợ tín dụng Ngân hàng ABBANK từ 2003 đến 2016 49 Trình tự thực phương pháp tiếp cận kết thí nghiệm thực qua bước sau: Bước 1: Áp dụng thuật toán phân cụm K-means để phân chia liệu chuỗi thời gian khứ từ 2003 đến 2016: {158}, {179}, {906}, {1.131}, {6.858}, {6.539}, {12.883}, {19.877}, {19.916}, {18.756}, {23.647}, {25.969}, {30.915}, {36.026} thành 11 nhóm xếp liệu cụm theo thứ tự tăng dần, kết sau: Cụm 1: {158, 179, 906} Cụm 2: {1.131} Cụm 3: {6.539} Cụm 4: {6.858} Cụm 5: {12.883} Cụm 6: {18.756} Cụm 7: {19.877}, {19.916} Cụm 8: {23.647} Cụm 9: {25.969} Cụm 10: {30.915} Cụm 11: {36.026} Bước 2: Tính tâm cụm cluster_centerm cho cụm clusterm theo công thức (3.2) sau tính giá trị giới hạn dưới, giới hạn giá trị trung bình thể bảng (3.2) 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑐𝑒𝑛𝑡𝑒𝑟𝑚 = đó: dj bán kính r số cụm ∑𝑟𝑗=1 𝑑𝑗 𝑟 (3.2) 50 Cụm Dữ liệu Tâm cụm Giới hạn Giới hạn Giá trị trung bình {158, 179, 906} 414 56 772.7 414.3 {1131} 1131 772.7 3835 2303.8 {6539} 6539 3835 6698.5 5266.8 {6858} 6858 6698.5 9870.5 8284.5 {12883} 12883 9870.5 15819.5 12845 {18756} 18756 15819.5 19326.3 17572.9 19897 19326.3 21771.8 20549 {19877, 19916} {23647} 23647 21771.8 24808 23289.9 {25969} 25969 24808 28442 26625 10 {30915} 30915 28442 33470.5 30956.3 11 {36026} 36026 33470.5 38581.5 36026 Bảng 3.2 Các giá trị tính từ cụm hình thành Bước 3: Tinh chỉnh tâm cụm theo quy tắc sau cho giới hạn tâm cụm_m giới hạn tâm cụmm+1 liền kề bảng 3.3: 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑢𝐵𝑜𝑢𝑛𝑑𝑚 = 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑐𝑒𝑛𝑡𝑒𝑟𝑚 + 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑐𝑒𝑛𝑡𝑒𝑟𝑚+1 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑙𝐵𝑜𝑢𝑛𝑑𝑚+1 = 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑢𝐵𝑜𝑢𝑛𝑑𝑚 (3.3) (3.4) 51 Giải thích: 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑙𝐵𝑜𝑢𝑛𝑑𝑚+1 giới hạn cụm m+1 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑢𝐵𝑜𝑢𝑛𝑑𝑚 giới hạn cụm m Trong đó: m = 1, 2,… k - Bởi cụm trước cụm cụm tiếp sau cụm cuối cùng, giới hạn 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑙𝐵𝑜𝑢𝑛𝑑1 cụm giới hạn 𝑐𝑙𝑢𝑠𝑡𝑒𝑟_𝑢𝐵𝑜𝑢𝑛𝑑𝑘 cụm cuối tính sau: cluster _ uBoundk = cluster _ centerk + (cluster _ centerk - cluster _ lBoundk ) cluster _ lBound1 = cluster _ center1 - (cluster _ uBound1 - cluster _ center1 ) u1 = [56,733) u2 = [733,3835) u3 = [3835,6699) u4 = [6699,9871) u5 = [9871,15820) u6 = [15820,19326) u7 = [19326,21772) u8 = [21772,24808) u9 = [24808,28442) u10 = [28442,33471) u11 = [33471,38582) Bảng 3.3 Các giá trị cận cận cụm Bước 4: Định nghĩa tập mờ Ai dựa khoảng giá trị năm khứ thể bảng 3.1, giá trị ngôn ngữ số liệu tín dụng đại diện tập mờ qua sử dụng hàm tam giác Các tập mờ trường hợp biểu diễn A1, A2 … An thể 52 giá trị mờ cụm với hàm thuộc 𝜇𝑖 cần tính An+1 số liệu năm dự báo Như toán dự báo tín dụng là: A1  A2 A2  A3 … An-1  An Tìm An+1 hay Aj = ? Các tập mờ Ai, i = 1,2,…,11 định nghĩa thông qua hàm thuộc, để đơn giản có dạng hình nón nhận giá trị 0, 0.5 1, viết sau: A = 1/u + 0.5/u + 0/u + + 0/u + 0/u 1 10 11 A = 0.5/u + 1/u + 0.5/u + + 0/u + 0/u 2 10 11 A = 0/u + 0.5/u + 1/u + 0.5/u + + 0/u + 0/u 3 10 11 A = 0/u + 0/u + 0.5/u + 1/u + 0.5/u + + 0/u + 0/u 4 10 11 A = 0/u + 0/u +… + 0.5/u + 1/u + 0.5/u + + 0/u + 0/u 5 10 A = 0/u + 0/u +… + 0.5/u + 1/u + 0.5/u + + 0/u + 0/u 6 10 A = 0/u + 0/u +… + 0.5/u + 1/u + 0.5/u + + 0/u + 0/u 7 10 A = 0/u + 0/u +… + 0.5/u + 1/u + 0.5/u + + 0/u + 0/u 8 10 A = 0/u + 0/u + + 0.5/u + 1/u + 0.5/u + 0/u 9 10 A = 0/u + 0/u + + 0.5/u + 1/u + 0.5/u 10 10 11 11 A = 0/u + 0/u + + 0/u + 0.5/u + 1/u 11 10 11 Bước 5: Giải mờ giá trị dự báo 1.5 0.5 + 𝑎1 𝑎2 𝑡𝑗 = 0.5 0.5 + + 𝑎𝑗−1 𝑎𝑗 𝑎𝑗+1 , 𝑖𝑓, 𝑗 = , 𝑖𝑓, ≤ 𝑗 ≤ 𝑛 − 1.5 { 0.5 + 𝑎𝑛−1 𝑎𝑛 , 𝑖𝑓, 𝑗 = 𝑛 (3.5) 11 11 11 11 53 Trong công thức (3.5) sử dụng để tính giá trị dự báo giá trị aj-1, aj, aj+1 giá trị trung bình khoảng mờ Aj-1, Aj, Aj+1 Các giá trị dùng để tính giá trị dự báo tín dụng tj Bảng 3.4 kết tính giá trị dự báo qua năm Năm Tín dụng Tập Dự báo thực tế Năm Tín dụng Tập Dự báo thực tế mờ tín dụng mờ tín dụng 2003 158 A1 570 2010 19877 A7 20287 2004 179 A1 570 2011 19916 A7 20287 2005 906 A1 570 2012 18756 A6 16644 2006 1131 A2 1152 2013 23647 A8 23243 2007 6858 A4 7856 2014 25969 A9 26603 2008 6539 A3 4280 2015 30915 A10 30787 2009 12883 A5 12001 2016 36026 A11 34161 2017 ? 39533 Bảng 3.4 Số liệu tín dụng tập mờ giá trị dự báo qua năm 4 SO DO TAO CAC CUM x 10 CAC GIA TRI DU BAO o VA THUC _ 3.5 2.5 1.5 0.5 0 10 DU LIEU TIN DUNG QUA CAC NAM 12 14 Hình 3.1 Tín dụng tập mờ giá trị dự báo qua năm 54 3.3 Đánh giá phương pháp tiếp cận Trong phần này, so sánh độ xác giá trị dự báo hình tiếp cận nghiên cứu với hình khác thực sở sai số giá trị dự báo Với Yt giá trị quan sát (thực tế) Ft giá trị dự báo tương ứng với thời điểm t, sai số dự báo xác định: 𝑒𝑡 = 𝑌𝑡 − 𝐹𝑡 , 𝑡 = 1, 𝑛 (3.6) Khi ta có công thức tính phần trăm sai số: 𝑌𝑡 − 𝐹𝑡 𝑃𝐸𝑡 = ( 𝑌𝑡 ) × 100 (3.7) Việc tính toán sai số dự báo thực qua tiêu chuẩn khác để xác định hiệu cho khả dự báo nó:  Sai số trung bình (MBE - Mean Bias Error): 𝑛 𝑀𝐵𝐸 = ∑(𝑒𝑡 ) 𝑛 (3.8) 𝑖=1  Sai số tuyệt đối trung bình (MAE - Mean Absolute Error): 𝑛 𝑀𝐴𝐸 = ∑ |𝑒𝑡 | 𝑛 (3.9) 𝑡=1  Sai số bình phương trung bình (MSE - Mean Squared Error): 𝑛 𝑀𝑆𝐸 = ∑ 𝑒𝑡2 𝑛 (3.10) 𝑖=1  Sai số phần trăm trung bình (MPE-Mean Percentage Error): 55 𝑛 𝑀𝑃𝐸 = ∑ 𝑃𝐸𝑡 𝑛 (3.11) 𝑡=1  Sai số phần trăm tuyệt đối (MAPE-Mean Absolute Percentage Error): 𝑛 𝑀𝐴𝑃𝐸 = ∑ |𝑃𝐸𝑡 | (3.12) 𝑛 𝑡=1  Sai số bình phương trung bình gốc (RSME - Root Mean Square Error) 𝑛 𝑅𝑀𝑆𝐸 = √ ∑ 𝑒𝑡2 𝑛 (3.13) 𝑖=1 Với n số năm cần thiết để dự báo cho tín dụng So sánh sai số phương pháp tiếp cận với phương pháp khác Lấy số liệu thực dự báo qua phân cụm để tính tiêu chuẩn sai số 56 nợ Tín dụng Tín dụng thực tế (tỷ đồng) theo dự báo 2003 158 570 2004 179 570 2005 906 570 2006 1131 1152 2007 6858 7856 2008 6539 4280 2009 12883 12001 2010 19877 20287 2011 19916 20287 2012 18756 16644 2013 23647 23243 2014 25969 26603 2015 30915 30787 2016 36026 34161 2017 ? 39533 Năm Bảng 3.5 Kết dự báo 57 Dưới bảng phân tích kết dự báo hình tiếp cận phân cụm chuỗi thời gian mờ cho dự báo tín dụng qua sai số tiêu chuẩn: Năm Tín Tín Phần trăm dụng dụng sai số thực tế dự báo (PEt) |Pet| Sai số (et) |et| Sai số bình phương (et2) t Yt Ft ((YtFt)/Yt)*100 |((YtFt)/Yt)|*100 Yt-Ft |Yt-Ft| (Yt-Ft)2 10 11 12 13 14 158 179 906 1131 6858 6539 12883 19877 19916 18756 23647 25969 30915 36026 570 570 570 1152 7856 4280 12001 20287 20287 16644 23243 26603 30787 34161 -260.76 -218.44 37.09 -1.86 -14.55 34.55 6.85 -2.06 -1.86 11.26 1.71 -2.44 0.41 5.18 260.76 218.44 37.09 1.86 14.55 34.55 6.85 2.06 1.86 11.26 1.71 2.44 0.41 5.18 -412 -391 336 -21 -998 2259 882 -410 -371 2112 404 -634 128 1865 412 391 336 21 998 2259 882 410 371 2112 404 634 128 1865 169744 152881 112896 441 996004 5103081 777924 168100 137641 4460544 163216 401956 16384 3478225 -404.93 599.01 4749 11223 16139037 Tổng Bias MAE MSE MPE MAPE RMSE = 4749/14 = 11223/14 = 16139037/14 = -404.93/14 = 599.01/14 = √1152788.36 = 339.21 = 801.64 = 1152788.36 = -28.92 = 42.79 = 1073.68 Bảng 3.6 Phân tích kết dự báo qua sai số tiêu chuẩn 58 So sánh kết dự báo hình tiếp cận với hình dự báo khác Naive (dự báo thô), Moving averages (phương pháp bình quân di động), phương pháp dự báo nhân (Causal models or regression), giá trị dự báo hình xác định sau:  hình dự báo thô (Naive): giá trị dự báo với giá trị trước 𝐹𝑡+1 = 𝑌𝑡 , 𝑡 = 1, 𝑛  hình dự báo bình quân di động (Moving averages): 𝐹𝑡+1 = Y𝑡 + Y𝑡−1 + ⋯ + Y𝑡−(𝑘−1) , 𝑘 = 1, 𝑛 𝑘  hình dự báo nhân (Causal models or regression): 𝑌𝑡 = 𝛼 + 𝛽𝑋𝑡 + 𝜀𝑡 , 𝑡 = 1, 𝑛 𝐹𝑡 = 𝑎 + 𝑏𝑋𝑡 Kết so sánh thể bảng 3.7 đây: Moving Tín dụng hình Averages t Năm thực tế tiếp cận Naive (3 MA) Regression 2003 158 570 2004 179 570 158 2005 906 570 179 2063 2006 1131 1152 906 414 4732 2007 6858 7856 1131 739 7401 2008 6539 4280 6858 2965 10070 2009 12883 12001 6539 4843 12738 2010 19877 20287 12883 8760 15407 2011 19916 20287 19877 13100 18076 10 2012 18756 16644 19916 17559 20745 11 2013 23647 23243 18756 19516 23414 12 2014 25969 26603 23647 20773 26082 13 2015 30915 30787 25969 22791 28751 14 2016 36026 34161 30915 26844 31420 Bảng 3.7 Bảng so sánh kết dự báo hình 59 t 10 11 12 13 14 hình Moving Năm tiếp cận Naive Averages (3 MA) Regression 2003 -412 2004 -391 21 2005 336 727 -1157 2006 -21 225 717 -3601 2007 -998 5727 6119 -543 2008 2259 -319 3574 -3531 2009 882 6344 8040 145 2010 -410 6994 11117 4470 2011 -371 39 6816 1840 2012 2112 -1160 1197 -1989 2013 404 4891 4131 233 2014 -634 2322 5196 -113 2015 128 4946 8124 2164 2016 1865 5111 9182 4606 Bảng 3.8 Bảng sai số dự báo hình 40000 35000 30000 25000 nợ tín dụng (thực tế) Dự báo tiếp cận 20000 Naive Moving Averages (3MA) 15000 Regression 10000 5000 10 11 12 13 14 Hình 3.2 Giá trị dự báo hình dự báo tiếp cận so với giá trị nợ tín dụng thực tế 60 So sánh kết tất hình dự báo thể bảng 3.9, nhận thấy sai số dự báo nhỏ trường hợp áp dụng hình dự báo tiếp cận cho phân cụm chuỗi thời gian mờ Các sai số bao gồm: sai số trung bình (MBE - Mean Bias Error), sai số tuyệt đối trung bình (MAE Mean Absolute Error), sai số bình phương trung bình (MSE - Mean Squared Error), sai số phần trăm trung bình (MPE-Mean Percentage Error), sai số phần trăm tuyệt đối (MAPE-Mean Absolute Percentage Error), sai số bình phương trung bình gốc (RSME - Root Mean Square Error): Thước đo Bias MAE MSE MPE MAPE RMSE hình tiếp cận Naive 339.21 2759.08 801.64 2986.62 1152788.36 15683706.15 -28.92 25.29 42.79 26.99 1073.68 3960.27 Moving Averages (3 MA) 5837.55 5837.55 21723546.82 41.41 41.41 4660.85 Regression 481.50 2043.50 6626596.07 153.23 227.38 2574.22 Bảng 3.9 Bảng so sánh thước đo sai số hình 3.4 Kết luận Tiếp cận đến phương pháp cho dự báo chuỗi thời gian mờ với độ xác cao Thuật toán K-means phương pháp tiếp cận đơn giản thực dễ dàng cách sử dụng phần mềm toán học Matlab Phương pháp thực dựa liệu khứ tín dụng Ngân hàng ABBANK để có nghiên cứu so sánh với phương pháp có Từ bảng 3.7 3.9 ta thấy phương pháp tiếp cận nghiên cứu có tỷ lệ xác dự báo cao phương pháp trình bày trước 61 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Lê Bá Dũng, Các hệ sở tri thức (knowledge based system) ứng dụng, Bài giảng ĐHBK Hà Nội – Genetic computer school joint education program [2] Bùi Công Cường, Nguyễn Doãn Phước, “Lý thuyết mờ công nghệ tính toán mềm”, Hệ mờ mạng nơron ứng dụng, Nhà xuất Khoa học Kỹ thuật, pp.53-89, 2006 [3] Nguyễn Công Điều “Một thuật toán cho hình chuỗi thời gian mờ heuristic dự báo chứng khoán”, Khoa học Công nghệ, Viện KH&CN VN 2011, 49(4) (2011) 11-25 Tiếng Anh [4] S M Chen (2002), “Forecasting Enrollments based on hightorder Fuzzy Time Series”, Int Journal: Cybernetic and Systems, N.33, pp 1-16 [5] Moddy J., Darken C J.: Fast learning in network of locally tuned processing units Neural Comput., 1, 1989, pp 281-294 [6] Jens Rúni Poulsen, “Fuzzy Time Series Forecasting”, AAUE, zovember 2009 [7] Q Song, B.S Chissom, (1993), “Fuzzy Time Series and its Model”, Fuzzy set and system, vol 54, pp 269-277 [8] S.M Chen, (1996), “Forecasting Enrollments based on Fuzzy Time Series,” Fuzzy set and system, vol 81, pp 311-319 62 [9] K Huarng , “Effective length of interval to improve forecasting in fuzzy time series”, Fuzzy set and Systems, (2001) vol 123, pp 387-394 [10] J R H Wang, S M Chen, C H Lee, “Handing forecasting problems using fuzzy time series”, Fuzzy Sets and Systems, 100 (1998) 217228 [11] T A Jilani, S M A Burney, C Ardil, “ Fuzzy metric approach for fuzzy time series forecasting based on frequency density based partitioning”, In: Proceedings of World Academy of Science, Engineering and Technology 23 (2009) 1307-6884 [12] Zhang, Z and Zhu, Q “Fuzzy Time Series Forecasting Based On K-Means Clustering” Open Journal of Applied Sciences, (2012) vol 2, pp 100-103 ... tài cho luận văn tốt nghiệp với tiêu đề là: Tiếp cận phân cụm chuỗi thời gian mờ dự báo tín dụng cho ngân hàng ABBANK Nội dung luận văn ứng dụng phương pháp chuỗi thời gian mờ cho dự báo tín dụng. .. toán phân cụm mờ - Thuật toán K-means 40 CHƯƠNG 3: DỰ BÁO TÍN DỤNG ỨNG DỤNG CHUỖI THỜI GIAN MỜ SỬ DỤNG KỸ THUẬT PHÂN CỤM 46 3.1 Ứng dụng phương pháp chuỗi thời gian mờ cải tiến cho dự. .. ` LƯU ĐỨC DŨNG TIẾP CẬN PHÂN CỤM CHUỖI THỜI GIAN MỜ TRONG DỰ BÁO TÍN DỤNG CHO NGÂN HÀNG ABBANK Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng

Ngày đăng: 06/10/2017, 16:01

Tài liệu cùng người dùng

Tài liệu liên quan