Ứng dụng cây quyết định để dự đoán chỉ số nhóm nợ hỗ trợ quản lý rủi ro tín dụng

72 1.1K 6
Ứng dụng cây quyết định để dự đoán chỉ số nhóm nợ hỗ trợ quản lý rủi ro tín dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  NGUYỄN THỊ TÂM MINH ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ DỰ ĐOÁN CHỈ SỐ NHĨM NỢ HỖ TRỢ QUẢN LÝ RỦI RO TÍN DỤNG LUẬN VĂN THẠC SĨ Hà Nội, 2011 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  NGUYỄN THỊ TÂM MINH ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ DỰ ĐỐN CHỈ SỐ NHĨM NỢ HỖ TRỢ QUẢN LÝ RỦI RO TÍN DỤNG Ngành : Cơng nghệ thông tin Chuyên ngành : Hệ thống thông tin Mã số : 60 48 05 LUẬN VĂN THẠC SĨ HƯỚNG DẪN KHOA HỌC: TS NGUYỄN HÀ NAM Hà Nội, 2011 MỤC LỤC CHƢƠNG I LÝ THUYẾT VỀ RỦI RO TÍN DỤNG I Tín dụng rủi ro tín dụng 1 Khái niệm rủi ro tín dụng Những nguyên nhân phát sinh rủi ro tín dụng [5] Phân loại nhóm nợ Nguyên tắc vay vốn 5 Điều kiện vay vốn Căn xác định định mức cho vay Đối tƣợng áp dụng II Các mơ hình phân tích đánh giá rủi ro tín dụng Mơ hình định tính Các mơ hình lƣợng hóa rủi ro tín dụng 12 CHƢƠNG II 16 CÂY QUYẾT ĐỊNH 16 I Cây định 16 Định nghĩa định 16 Các kiểu định 17 Ví dụ 17 Ƣu điểm định 20 Vấn đề xây dựng định 20 Rút luật từ định 21 II Một số thuật toán xây dựng 21 Thuật toán CLS 21 Thuật toán ID3 22 Thuật toán C4.5 29 Thuật toán SLIQ [1] 38 Cắt tỉa định 45 CHƢƠNG III 51 ỨNG DỤNG CÂY QUYẾT ĐỊNH DỰ ĐOÁN CHỈ SỐ NHÓM NỢ 51 Xử lý liệu cho toán dự đoán rủi ro tín dụng 51 Phƣơng pháp lấy mẫu liệu 55 Dự đoán số nhóm nợ sử dụng định C4.5 57 Đánh giá kết dự đoán số nhóm nợ sử dụng định C4.5 61 KẾT LUẬN 68 TÀI LIỆU THAM KHẢO 69 70 CHƢƠNG I LÝ THUYẾT VỀ RỦI RO TÍN DỤNG Trong kinh tế thị trường, hệ thống ngân hàng ví hệ thần kinh kinh tế Hệ thống ngân hàng quốc gia hoạt động thông suốt, lành mạnh hiệu tiền đề để nguồn lực tài luân chuyển, phân bổ sử dụng hiệu quả, kích thích tăng trưởng kinh tế cách bền vững Tuy nhiên, kinh tế thị trường, rủi ro kinh doanh tránh khỏi, mà đặc biệt rủi ro hoạt động ngân hàng có phản ứng dây truyền, lây lan ngày có biểu phức tạp Sự sụp đổ ngân hàng ảnh hưởng tiêu cực đến đời sống kinh tế, trị, xã hội nước lan rộng sang qui mô quốc tế Rủi ro kinh doanh ngân hàng có xu hướng tập trung chủ yếu vào danh mục tín dụng Khi ngân hàng rơi vào trạng thái tài khó khăn nghiêm trọng, ngun nhân thường phát sinh từ hoạt động tín dụng ngân hàng Vậy, rủi ro, nguyên nhân rủi ro nội dung rủi ro tín dụng gì? I Tín dụng rủi ro tín dụng Khái niệm rủi ro tín dụng Tín dụng ngân hàng quan hệ tín dụng ngân hàng, tổ chức tín dụng tổ chức kinh tế, cá nhân theo nguyên tắc hoàn trả Việc hoàn trả nợ gốc tín dụng có nghĩa việc thực giá trị hàng hố thị trường, cịn việc hồn trả lãi vay tín dụng việc thực giá trị thặng dư thị trường Trong quan hệ tín dụng có hai đối tượng tham gia ngân hàng cho vay người vay Rủi ro tín dụng  Khoản lỗ tiềm tàng vốn có tạo ngân hàng cấp tín dụng  Những thiệt hại, mát mà ngân hàng gánh chịu người vay vốn hay người sử dụng vốn không trả hạn, không thực nghĩa vụ cam kết hợp đồng tín dụng lý Những nguyên nhân phát sinh rủi ro tín dụng [5] Thơng thường rủi ro tín dụng xảy nguyên nhân sau: - Khách hàng vay vốn gặp nguy tai nạn bất ngờ thua lỗ kinh doanh nên khơng có tiền trả nợ dẫn đến nợ - Bị ảnh hưởng tình hình kinh tế nước giới - Do thân ngân hàng chạy theo lợi nhuận, vi phạm nguyên tắc cho vay, phân tích đánh giá khách hàng sai, định cho vay thiếu thông tin xác thực Phân loại nhóm nợ Nợ hạn khoản nợ mà phần toàn nợ gốc lãi hạn Nợ cấu lại thời hạn trả nợ khoản nợ mà ngân hàng chấp thuận điều chỉnh kỳ hạn trả nợ gia hạn nợ cho khách hàng ngân hàng đánh giá khách hàng suy giảm khả trả nợ gốc lãi thời hạn ghi hợp đồng tín dụng ngân hàng có đủ sở để đánh giá khách hàng có khả trả đầy đủ nợ gốc lãi theo thời hạn trả nợ cấu lại Ngân hàng (NH) thực phân loại nợ sau - Nhóm (nợ đủ tiêu chuẩn) : + Nợ hạn, chưa đến thời hạn tốn NH đánh giá có đủ khả thu hồi đầy đủ gốc lãi hạn + Khách hàng khơng cịn nợ khác hạn - Nhóm (nợ cần ý) : + Nợ hạn từ đến 90 ngày + Nợ cấu lại thời hạn trả nợ hạn + Những khoản nợ đánh giá có khả thu hồi đầy đủ gốc lãi có dấu hiệu khách hàng bị suy giảm khả trả nợ - Nhóm (nợ tiêu chuẩn) : + Các khoản nợ hạn từ 90 đến 180 ngày + Các khoản nợ cấu lại thời hạn trả nợ bị hạn 90 ngày + Nợ đánh giá khơng có khả thu hồi đầy đủ gốc lãi đến hạn, có khả tổn thất phần nợ gốc lãi - Nhóm (nợ nghi ngờ) : + Các khoản nợ hạn từ 181 đến 360 ngày + Các khoản nợ được cấu lại thời hạn trả nợ bị hạn từ 90 đến 180 ngày + Các khoản nợ đánh giá có khả tổn thất cao - Nhóm (nợ có khả bị vốn): + Nợ hạn 360 ngày + Các khoản nợ khoanh chờ phủ xử lý + Các khoản nợ cấu lại thời hạn trả nợ bị hạn 180 ngày + Các khoản nợ đánh giá khơng có khả thu hồi Trường hợp khách hàng trả đầy đủ nợ gốc lãi theo kỳ hạn cấu lại tối thiểu vòng (01) năm khoản nợ trung dài hạn, ba (03) tháng khoản nợ ngắn hạn NH đánh giá có khả trả đầy đủ nợ gốc lãi thời hạn theo thời hạn cấu lại, NH phân loại lại khoản nợ vào nhóm Trường hợp khách hàng có nhiều (01) khoản nợ với NH mà có khoản nợ bị chuyển sang nhóm nợ rủi ro cao NH bắt buộc phải phân loại khoản nợ lại khách hàng vào nhóm nợ rủi ro cao tương ứng với mức độ rủi ro Trường hợp khoản nợ (kể khoản nợ hạn khoản nợ cấu lại thời hạn trả nợ hạn theo thời hạn nợ cấu lại) mà NH có đủ sở để đánh giá khả trả nợ khách hàng bị suy giảm NH chủ động tự định phân loại khoản nợ vào nhóm nợ rủi ro cao tương ứng với mức độ rủi ro Nợ xấu (NPL) khoản nợ thuộc nhóm 3, Tỷ lệ nợ xấu tổng dư nợ tỷ lệ để đánh giá chất lượng tín dụng NH NH sử dụng dự phòng rủi ro để bù đắp tổn thất khoản nợ:  Tỷ lệ trích lập dự phịng cụ thể nhóm nợ quy định sau: Nhóm 1: 0%; Nhóm 2: 5%; Nhóm 3: 20%; Nhóm 4: 50%; Nhóm 5: 100% Riêng khoản nợ khoanh chờ phủ xử lý trích lập dự phịng cụ thể theo khả tài NH  Đối với khoản nợ xấu (NPL), NH phải thực việc phân loại nợ, đánh giá khả trả nợ khách hàng sở hàng tháng để phục vụ cho công tác quản lý chất lượng rủi ro tín dụng  NH phải xây dựng hệ thống xếp hạng tín dụng nội để hỗ trợ cho việc phân loại nợ, quản lý chất lượng tín dụng phù hợp với phạm vi hoạt động, tình hình thực tế NH Hệ thống xếp hạng tín dụng nội tối thiểu phải bao gồm: - Các sở pháp lý liên quan đến thành lập ngành nghề kinh doanh khách hàng - Các tiêu kinh tế tổng hợp liên quan đến tình hình kinh doanh, tài chính, tài sản, khả thực nghĩa vụ theo cam kết - Uy tín NH giao dịch trước - Tiêu chí đánh giá khách hàng chi tiết, cụ thể, có hệ thống (đánh giá yếu tố ngành nghề địa phương) sở xếp hạng cụ thể khách hàng  NH sử dụng dự phòng để xử lý rủi ro tín dụng khoản nợ trường hợp sau đây: - Khách hàng tổ chức, doanh nghiệp bị giải thể, phá sản theo quy định pháp luật; cá nhân bị chết tích - Các khoản nợ thuộc nhóm quy định Riêng khoản nợ khoanh chờ phủ xử lý, NH sử dụng dự phịng (nếu có) để xử lý rủi ro tín dụng Nguyên tắc vay vốn - Sử dụng vốn vay mục đích thoả thuận hợp đồng tín dụng - Phải hoàn trả tiền vay vốn lãi hạn thoả thuận hợp đồng tín dụng Điều kiện vay vốn Các khách hàng muốn vay vốn Ngân hàng phải có điều kiện sau đây: - Có lực pháp luật dân sự, lực hành vi dân chịu trách nhiệm dân theo quy định pháp luật - Mục đích sử dụng vay vốn hợp pháp - Có khả tài đảm bảo trả nợ thời hạn cam kết - Có dự án đầu tư, phương án sản xuất kinh doanh, dịch vụ khả thi có hiệu Thực quy định bảo đảm tiền vay theo quy định phủ hướng dẫn Ngân hàng Nhà nước Việt Nam Căn xác định định mức cho vay - Nhu cầu vay vốn khách hàng - Mức vốn tự có khách hàng tham gia vào dự án, phương án sản xuất, kinh doanh, dịch vụ, đời sống - Tỷ lệ cho vay tối đa so với giá trị tài sản bảo đảm tiền vay theo quy định bảo đảm tiền vay ngân hàng - Khả hồn trả nợ khách hàng vay - Khả nguồn vốn ngân hàng không qua mức ủy quyền phán cho vay tổng giám đốc NH cho vay Đối tƣợng áp dụng  Ngân hàng cho vay đối tượng sau: - Giá trị vật tư, hàng hố, máy móc, thiết bị khoản chi phí để khách hàng thực dự án sản xuất, kinh doanh dịch vụ - Số tiền vay trả cho tổ chức tín dụng thời gian thi công chưa bàn giao đưa tài sản cố định vào sử dụng cho vay trung dài hạn để đầu tư tài sản cố định mà khoản lãi tính giá trị tài sản cố định  Ngân hàng khơng cho vay đối tượng sau: - Số tiền thuế phải nộp - Số tiền để trả nợ gốc lãi vay cho tổ chức tín dụng khác - Số tiền vay trả cho tổ chức tín dụng cho vay vốn II Các mơ hình phân tích đánh giá rủi ro tín dụng Mơ hình định tính Phân tích tín dụng Đối với đơn xin vay, cán tín dụng cần phải trả lời câu hỏi sau: - Người xin vay tín nhiệm khơng, anh (chị) biết họ nào? - Hợp đồng tín dụng có ký kết cách đắn hợp lệ, nhằm bảo vệ ngân hàng người gửi tiền, người xin vay có khả hồn trả nợ vay mà không cần đến sức ép nào? - Trường hợp khách hàng không trả nợ, liệu NH thu hồi nợ tài sản hay thu nhập người vay cách nhanh chóng với chi phí rủi ro thấp? Những nội dung cần sâu vào phân tích Người vay tín nhiệm? Điều liên quan đến việc nghiên cứu chi tiết “6 khía cạnh – 6C” người xin vay là: tư cách (Character), lực (Capacity), thu nhập (Cash), bảo đảm (Collateral), điều kiện (Conditions), kiểm soát (Control) Tất tiêu phải đánh giá tốt, khoản vay xem khả thi Tư cách người vay: cán tín dụng phải chắn người xin vay có - mục đích rõ ràng có thiện chí trả nợ đến hạn, có tỏ thái độ trách nhiệm việc sử dụng vốn vay Năng lực người vay: cán tín dụng phải chắn người xin - vay phải có đủ lực hành vi lực pháp lý để ký kết hợp đồng tín dụng - Thu nhập người vay: người vay có khả tạo đủ tiền để trả nợ? Nhìn chung người vay có ba khả để tạo tiền là: (i) luồng tiền từ doanh thu bán hàng hay từ thu nhập, (ii) bán lý tài sản, (iii) tiền từ phát hành chứng khoán nợ hay chứng khoán vốn Bất nguồn thu từ ba khả sử dụng để trả nợ vay cho NH Tuy nhiên khả thứ ưu tiên - Bảo đảm tiền vay: người vay có sở hữu giá trị hay tài sản có chất lượng để hỗ trợ cho khoản vay - Các điều kiện: phải biết xu hướng hành công việc kinh doanh ngành nghề người vay, kinh tế thay đổi có ảnh hưởng đến khoản tín dụng - Kiểm soát: tập trung vào vấn đề thay đổi luật pháp quy chế có ảnh hưởng xấu đến người vay? Hợp đồng tín dụng ký kết đắn hợp lệ? Nội dung hợp đồng tín dụng phải đáp ứng nhu cầu vốn người vay theo kế hoạch trả nợ thuận lợi Cán tín dụng phải có khả cố vấn tài cho khách hàng, đồng thời hướng dẫn khách hàng hoàn thành đơn xin vay Một hợp đồng tín dụng hợp lệ phải bảo vệ quyền lợi ngân hàng cách quy định điều khoản giới hạn hoạt động người vay, hoạt động đe dọa khả thu hồi vốn vay NH Quá trình cưỡng Hình 4.3 Giao diện Weka phân tích thuộc tính tuổi khách hàng Các giá trị lại tập liệu giá trị rời rạc đầy đủ giá trị Vì khơng cần xử lý liệu Tập liệu gọi tập A1 Phƣơng pháp lấy mẫu liệu Tập liệu phân bố không đồng điều ảnh hưởng đến chất lượng học máy thuật tốn phân lớp Có ba chiến lược lấy mẫu sau giải pháp cho liệu phân bố không đồng lớp a) Lấy mẫu lên: việc tăng số ví dụ lớp thiểu số tập liệu làm cho tập liệu cân Một số phương pháp lấy mẫu lên phổ biến sau: Lấy mẫu lên ngẫu nhiên đơn giản (radom oversimpling): nhân đơi số ví dụ lớp thiểu số tập liệu ngẫu nhiên Lấy mẫu lên thiểu số nhân tạo: Chawla đưa phương pháp lấy mẫu lên thông minh vào năm 2002, gọi kỹ thuật lấy mẫu lên thiểu số nhân tạo (Synthetic Minority Over-sampling Technique – SMOTE) SMOTE thêm mới, 55 tạo mẫu lớp thiểu số ngoại suy ví dụ lớp thiểu số tồn từ trước đơn giản nhân đôi ví dụ ban đầu Kỹ thuật trước hết tìm k hàng xóm lân cận lớp thiểu số (khuyến cáo k=5) Các mẫu nhân tạo sau sinh điều khiển số tất hàng xóm lân cận, phụ thuộc số lượng ví dụ lấy mẫu lên mong muốn Lấy mẫu lên SMOTE-đường biên: năm 2005, Han đưa sửa đổi SMOTE Chawla gọi SMOTE – đường biên Kỹ thuật chọn ví dụ thiểu số xem xét đường biên vùng định thiểu số không gian đặc trưng thực SMOTE để lấy lên ví dụ lấy tất tập ngẫu nhiên Lấy mẫu lên dựa vào cụm: có nhiều tập mẫu lớp rời rạc không gian đặc trưng tạo thành không cân lớp Điều dẫn đến giảm giá trị phân lớp liệu lấy mẫu lên dựa vào cụm loại bỏ chúng mà không cần loại bỏ liệu b)Lấy mẫu xuống (undersampling): việc loại bớt ví dụ lớp đa số tập liệu để tập liệu có phân bố lớp đồng Một số phương pháp lấy mẫu phổ biến sau: Lấy mẫu xuống ngẫu nhiên đơn giản (radom understampling) đơn giản loại bỏ ví dụ lớp đa số tập liệu cách ngẫu nhiên để tập liệu cân Lựa chọn mặt: năm 1997 Kubat & Matwin đề xuất kỹ thuật gọi lựa chọn mặt Lựa chọn mặt lấy mẫu xuống lớp đa số cách loại bỏ bớt ví dụ lớp đa số mà coi dư thừa nhiễu c) Kết hợp hai chiến lược trên: Kết hợp hai phương pháp trên: thực đồng thời lấy mẫu lên lớp thiểu số lấy mẫu xuống với mẫu đa số 56 Trong thực nghiệm, người ta thường áp dụng kỹ thuật khai phá tập liệu có kích thước nhỏ tập liệu tốn Để bảo đảm kết khơng khác biệt so với sử dụng liệu gốc toán, phương pháp lấy mẫu thường sử dụng sau: Lấy mẫu kết hợp ngẫu nhiên: thực nghiệm lấy mẫu lên xuống kết hợp chúng cho thấy phương pháp lấy mẫu kết hợp thu kết tốt Hợp lớp tập liệu Trong toán dự đoán rủi ro tín dụng có nhóm nợ tương ứng với lớp cần dự đoán cho mẫu liệu Mặt khác, thực tế ngân hàng phân loại nợ thành nhóm nợ xấu nợ tốt Nợ xấu gồm nhóm 3,4,5 Nợ tốt gồm nhóm 1,2 Vì tơi hợp tập liệu lớp thành tập liệu lớp Tập liệu hợp gọi tập A2 STT Lớp Tổng Số ghi Tỷ lệ tập liệu (%) 1491 276 115 133 75 2090 71.34% 13.21% 5.5% 6.36% 3.59% 100% Bảng 4.2 Tóm tắt tập liệu A1 STT Lớp Số ghi Tỷ lệ tập liệu (%) Tổng 1767 323 2090 84.55% 15.45% 100% Bảng 4.3 Tóm tắt tập liệu A2 Dự đốn số nhóm nợ sử dụng định C4.5 57 Quá trình tạo thực theo chiến lược chia để trị Tập liệu mẫu chia thành tập liệu nhỏ thực đệ quy thuật toán tạo Trong C4.5 thuật tốn tốt nay, cải tiến từ thuật toán ID3 cho phép xử lý tập liệu có thuộc tính số (numeric atributes) làm việc với tập liệu bị thiếu bị nhiễu Tôi sử dụng phần mềm Weka để tiến hành đánh giá thuật toán với tốn dự đốn rủi ro tín dụng a) Thực nghiệm với tập liệu A1 Tập liệu đầu vào tập liệu xử lý Gồm 2090 ghi, gồm 11 thuộc tính thuộc tính lớp Số lớp tập liệu 05 lớp – tương ứng với nhóm số nợ Lớp chiếm 70,9091% tổng số ghi tập liệu, lớp chiếm 8.0861% tổng số ghi tập liệu, lớp chiếm 7.8469% tổng số ghi tập liệu, lớp chiếm 6.3158% tổng số ghi tập liệu, lớp chiếm 6.8421% tổng số ghi tập liệu Thực nghiệm với C4.5 khơng cắt tỉa Nếu sử dụng thuật tốn C4.5 khơng cắt tỉa để dự đốn số nhóm nợ ta kết sau: Cây sinh gồm: 230 lá, kích thước 278 Số mẫu phân lớp 1520 chiếm 72.7273% Số mẫu phân lớp sai 570 chiếm 27.2727% Một số độ đo với lớp thu sau: TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.957 0.768 0.756 0.957 0.845 0.67 0.181 0.023 0.543 0.181 0.272 0.69 0.27 0.019 0.449 0.27 0.337 0.688 0.03 0.009 0.19 0.03 0.052 0.617 0.107 0.006 0.381 0.107 0.167 0.638 58 Bảng 4.3 Độ đo thực nghiệm C4.5 không cắt tỉa tập liệu A1 a b c d e < - - classified as 1427 28 23 a=1 217 50 b=2 71 31 c=3 117 4 d=4 55 e=5 Bảng 4.4 Ma trận Confusion Trong Ma trận Confusion Dự đốn mẫu tích cực Dự đốn mẫu khơng tích cực Mẫu tích cực thực tế Mẫu tích cực (TP) Mẫu khơng tích cực sai (FN) Mẫu khơng tích cực thực tế Mẫu tích cực sai (FP) Mẫu khơng tích cực (TN) TPrate : tỷ lệ mẫu tích cực (Positive) đúng, TPrate =TP/(TP+FN) Fprate : tỷ lệ mẫu tích cực sai, FPrate=FP /(TN+FP) PPvalue : giá trị dự đốn mẫu tích cực ; PPvalue=TP/(TP+FP) NPValue : giá trị dự đốn mẫu khơng tích cực ; NPValue=TN/(TN+FN) Nếu lớp tích cực xem xét hai độ đo quan trọng TPrate, PPValue TPrate định nghĩa Recall(R)=TPrate =TP/(TP+FN) Giá trị dự đốn mẫu tích cực định nghĩa precision (P) : P = PPvalue = TP/(TP+FP) Về nguyên tắc, F-measure biểu diễn trung bình điều hịa recall precision : F-measure = 2/(1/R+1/P) Giá trị cao giá trị recall precision cao ROC Area : diện tích vùng ROC( Receiver Oprerating Characteristic) 59 Thực nghiệm với C4.5 cắt tỉa Nếu sử dụng định C4.5 cắt tỉa để dự đốn số nhóm nợ thực cắt tỉa thu kết sau : Cây sinh gồm 274 kích thước 366 Số mẫu phân lớp 1526 chiếm 73.0144 % Số mẫu phân lớp sai 564 chiếm 26.9856 % Một số độ đo thu lớp: TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.961 0.77 0.757 0.961 0.847 0.671 0.181 0.023 0.549 0.181 0.272 0.689 0.27 0.017 0.477 0.27 0.344 0.695 0.03 0.008 0.211 0.03 0.053 0.619 0.107 0.006 0.381 0.107 0.167 0.639 Bảng 4.5 Độ đo thực nghiệm C4.5 cắt tỉa tập liệu A1 a b c d e < - - classified as 1433 28 19 a=1 217 50 b=2 72 31 c=3 117 4 d=4 55 e=5 Bảng 4.6 Ma trận Confusion b) Thực nghiệm với tập liệu A2 Thực nghiệm C4.5 không cắt tỉa tập liệu hợp A2, ta thu số kết sau : Cây sinh gồm 54 kích thước 66 Số mẫu phân lớp 1807 chiếm 86.4593 % Số mẫu phân lớp sai 283 chiếm 13.5407 % Một số độ đo thu lớp: 60 TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.966 0.69 0.884 0.966 0.923 0.703 A 0.31 0.034 0.625 0.31 0.414 0.703 B Bảng 4.7 Một số độ đo thực nghiệm C4.5 không cắt tỉa tập A2 a b < - - classified as 1707 60 a=A 223 100 b=B Bảng 4.8 Ma trận Confusion thực nghiệm C4.5 tập A2 Thực nghiệm định C4.5 cắt tỉa tập liệu A2, ta thu số kết sau : Cây định dự đốn sinh gồm 64 kích thước 86 Số mẫu phân lớp 1647 chiếm 86.555 % Số mẫu phân lớp sai 443 chiếm 13.445 % Một số độ đo thu lớp: TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.968 0.697 0.884 0.968 0.924 0.704 A 0.303 0.032 0.636 0.303 0.411 0.704 B Bảng 4.9 Một số độ đo thực nghiệm C4.5 cắt tỉa tập A2 a b < - - classified as 1711 56 a=A 225 98 b=B Bảng 4.10 Ma trận Confusion thực nghiệm C4.5 cắt tỉa tập A2 Đánh giá kết dự đốn số nhóm nợ sử dụng định C4.5 Tập liệu ban đầu tốn gồm lớp, lớp 1,2 chiếm đa số tập liệu lớp 3,4,5 nhóm nợ xấu chiếm thiểu số tập liệu Nhóm nợ xấu điều đáng quan tâm với tốn rủi ro tín dụng Để đánh giá kỹ thuật khai phá sử dụng độ đo trung bình độ đo lớp 1-2, 61 3-4-5 Đặt độ đo trung bình lớp 1-2 độ đo trung bình lớp I ( ví dụ Fmeasurei) độ đo trung bình độ đo 03 lớp 3-4-5 độ đo trung bình lớp II ( ví dụ F-measureii) Đối với tập liệu hợp độ đo độ đo lớp hợp tương ứng Tôi sử dụng độ phân lớp xác độ đo Recall, F-measure ROC Area để đánh giá kỹ thuật khai phá Kết thực nghiệm sau : Tỷ lệ dự đốn xác (%) RecallI FmeasureI ROC AreaI RecallII F-measureII ROC AreaII X1 72.727% 0.569 0.5585 0.68 0.136 0.185 0.648 X2 73.014% 0.571 0.5595 0.68 0.136 0.188 0.651 X3 86.459% 0.966 0.923 0.703 0.31 0.414 0.703 X4 86.555% 0.968 0.924 0.704 0.303 0.414 0.704 X1 : Sử dụng C4.5 không cắt tỉa tập liệu A1 X2 : Sử dụng C4.5 cắt tỉa tập liệu A1 X3 : Sử dụng C4.5 không cắt tỉa tập liệu hợp A2 X4 : Sử dụng C4.5 cắt tỉa tập liệu hợp A2 Dựa vào kết thực nghiệm ta nhận thấy sử dụng C4.5 cắt tỉa không cắt tỉa tập liệu tỷ lệ dự đốn xác, giá trị độ đo RecallI, F-measureI, ROCI, F-measureII, ROCII, ngang cao chút sử dụng C4.5 cắt tỉa Như với toán dự đốn số nhóm nợ sử dụng định C4.5 cắt tỉa cho kết tốt Nếu đưa tốn dự đốn rủi ro tín dụng từ lớp toán dự đoán rủi ro lớp dựa vào kết thực nghiệm ta thấy độ xác cao hơn, giá trị độ đo RecallI, F-measureI, ROC I tăng lên đáng kể, RecallII, F-measureII, ROCII 62 cao Vậy toán dự đoán số nhóm nợ tập liệu hợp tốt tập liệu lớp Kết thực nghiệm sử dụng định C4.5 tập liệu chuyển thành luật để đánh giá chất lượng nút định Mỗi luật có dạng sau : IF THEN (x/y) : điều kiện giá trị thuộc tính mẫu liệu, kết luận lớp (nhóm nợ) cần dự đốn, (x/y): x tổng số mẫu liệu tập liệu thỏa mãn điều kiện, y tổng số mẫu liệu tập liệu thỏa mãn điều kiện khơng có kết luận lớp Trường hợp y=0 (x/y) viết (x) Một số luật kết luận nhóm nợ xấu sử dụng định C4.5 không cắt tỉa tập liệu A1: Luật 4.1 IF DURTYPE = AND RESIDENT = AND PURPOSE = AND APRLIMIT = '(-inf116800000]' AND INCOME = N AND POSITION = O THEN (4.0/1.0) Luật 4.2 IF DURTYPE = AND RESIDENT = AND PURPOSE = AND APRLIMIT = '(116800000-231600000]' AND TYPE = AND JOB = THEN (5.11/2.11) Luật 4.3 IF DURTYPE = AND RESIDENT = AND PURPOSE = AND APRLIMIT = '(805600000-920400000]' AND POSITION = O THEN (3.0) Luật 4.5 IF DURTYPE = AND RESIDENT = AND PURPOSE = 11 AND JOB = THEN (4.0) Luật 4.6 IF DURTYPE = AND RESIDENT = AND PURPOSE = 11 AND JOB = 17 THEN (3.0/1.0) Luật 4.7 63 IF DURTYPE = AND APRLIMIT = '(-inf-116800000]' AND TYPE = AND POSITION =O THEN (2.0) Luật 4.8 IF DURTYPE = AND APRLIMIT = '(-inf-116800000]' AND TYPE = AND POSITION = N AND AGE = '(-inf-29]' THEN (7.0/1.0) Luật 4.9 IF DURTYPE = AND APRLIMIT = '(-inf-116800000]' AND TYPE = AND POSITION = N AND AGE = '(47-56]' AND RESIDENT = AND JOB = THEN (5.0/2.0) Luật 4.10 IF DURTYPE = AND APRLIMIT = '(-inf-116800000]' AND TYPE = AND POSITION = N AND AGE = '(56-inf)' THEN (4.0/2.0) Luật 4.11 IF DURTYPE = AND APRLIMIT = '(116800000-231600000]' AND POSITION = O AND AGE = '(-inf-29]' THEN (1.0) Luật 4.12 IF DURTYPE = AND APRLIMIT = '(116800000-231600000]' AND POSITION = O AGE = '(29-38]' THEN (2.0) Luật 4.13 IF DURTYPE = AND APRLIMIT = '(116800000-231600000]' AND POSITION = N AND RESIDENT = AND JOB = THEN (5.0) Luật 4.14 IF DURTYPE = AND APRLIMIT = '(116800000-231600000]' AND POSITION = N AND RESIDENT = AND JOB = AND AGE = '(29-38]' THEN (4.0) Luật 4.15 IF DURTYPE = AND APRLIMIT = '(116800000-231600000]' AND POSITION = N AND RESIDENT = AND JOB = 17 64 THEN (3.0/1.0) Luật 4.16 IF DURTYPE = AND APRLIMIT = '(116800000-231600000]' AND POSITION = N AND RESIDENT = AND JOB = 18 THEN (25.0/12.0) Luật 4.17 IF DURTYPE = AND APRLIMIT = '(576000000-690800000]' AND TYPE = AND POSITION = N AND GTVALUE = THEN (2.0/1.0) Luật 4.18 IF DURTYPE = AND APRLIMIT = '(576000000-690800000]' AND TYPE = AND INCOME = N AND JOB = THEN (10.0/3.0) Luật 4.19 IF DURTYPE = AND APRLIMIT = '(690800000-805600000]' AND GTVALUE = AND POSITION = N AND JOB = AND RESIDENT = THEN (3.0) Luật 4.20 IF DURTYPE = AND APRLIMIT = '(690800000-805600000]' AND GTVALUE = AND POSITION = N AND JOB = 17 THEN (3.0) Luật 4.21 IF DURTYPE = AND APRLIMIT = '(690800000-805600000]' AND GTVALUE = AND POSITION = N AND JOB = 18 AND AGE = '(47-56]' THEN (6.0/2.0) Luật 4.22 IF DURTYPE = AND APRLIMIT = '(805600000-920400000]' AND TYPE = AND GTVALUE = THEN (5.0/1.0) Luật 4.23 IF DURTYPE = AND APRLIMIT = '(920400000-1035200000]' AND RESIDENT = THEN (6.0/2.0) Luật 4.24 65 IF DURTYPE = AND APRLIMIT = '(1035200000-inf)' AND GTVALUE = AND PURPOSE = AND MARRIED = THEN (12.0/7.0) Khi cấp tín dụng cho khách hàng, ngân hàng vào tiêu chí: nguồn trả nợ khách, tài sản chấp, mục đích sử dụng vốn vay Trong đó, nguồn trả nợ khách tiêu chí chủ yếu gây nên rủi ro tín dụng Các luật 4.17; luật 4.19; luật 4.20; luật 4.21; luật 4.22; luật 4.24 trường hợp GTVALUE nằm mức cao GTVALUE=1 tài sản chấp khách hàng bất động sản đô thị, GTVALUE=2 tài sản chấp khách hàng bất động sản nông thơn Trường hợp có tài sản đảm bảo cao thường gây rủi ro, mà sử dụng định C4.5 không cắt tỉa thu số luật có giá trị Đây xem tri thức với chuyên gia ngân hàng Thực nghiệm định C4.5 không cắt tỉa với tập liệu hợp A2, thu số luật nhóm nợ xấu sau: Luật 4.25 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND TYPE = THEN B (5.0/1.0) Luật 4.26 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND TYPE = THEN B (17.0/2.0) Luật 4.27 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND TYPE = THEN B (8.0/3.0) Luật 4.28 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND TYPE = AND JOB = AND RESIDENT = THEN B (22.33/5.0) Luật 4.29 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND TYPE = AND JOB = THEN B (1.01) 66 Luật 4.30 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND TYPE = AND JOB = 18 THEN B (61.38/24.0) Luật 4.31 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND JOB = AND RESIDENT = THEN B (9.0/1.0) Luật 4.32 IF DURTYPE = AND PURPOSE = AND GTVALUE = AND JOB = 18 AND MARRIED = THEN B (15.0/2.0) Như trình bày thực tế nợ xấu xảy thường nguồn trả nợ khách hàng có vấn đề, chủ yếu tập trung khoản vay trung dài hạn Trong luật có luật 4.26; luật 4.27; luật 4.28; luật 4.29; luật 4.30; luật 4.31; luật 4.32 có tài sản đảm bảo mức cao, tài sản đảm bảo cao không xem nhân tố rủi ro sản phẩm vay Vậy luật tri thức chuyên gia ngân hàng 67 KẾT LUẬN Luận văn trình bày nội dung: khai phá liệu, kỹ thuật khai phá liệu, đặc biệt thuật toán định trình bày chi tiết, sau vận dụng lý thuyết rủi ro để giải tốn dự đốn số nhóm nợ khách hàng biết thông tin cần thiết, thông tin – liệu xử lý cho phù hợp Từ đánh giá kết dự đoán đưa số luật hỗ trợ chuyên gia ngân hàng quản lý rủi ro tín dụng Tuy nhiên nhiều vấn đề luận văn cần phải tiếp tục nghiên cứu tìm hiểu như: nghiên cứu để tăng tính xác cho tốn dự đoán rủi ro, nghiên cứu toán dự đoán số nhóm nợ khối liệu lớn, nghiên cứu phương pháp khai phá liệu khác từ chọn mơ hình thích hợp để phát triển đưa tốn áp dụng vào thực tế 68 TÀI LIỆU THAM KHẢO [1] Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques (2001) [2] Michael J.A Berry - Gordon S Linoff, Data Mining Techniques For Marketing, Sales, and Customer Relationship Management Second Edition, 2009 [3] Knowledge Discovery in Databases G.piatetsky - Shapiro and W.J Frawley AAAI/MIT Press, 1991 [4] Võ Huỳnh Tâm - Trần Ngân Bình, "Giáo trình trí tuệ nhân tạo", chương 9, Nhà xuất Cần Thơ, 2006 [5] TS Phạm Tiến Thành, Quản lý rủi ro tín dụng góc độ ngân hàng, 2011 [6] Wikipedia - Bách khoa toàn thư mở - Cây định, 2011 http://en.wikipedia.org/wiki/Decision tree [7] Nguyễn Văn Chức, Cây định với toán phân lớp, 2011 69 ... LÝ THUYẾT VỀ RỦI RO TÍN DỤNG I Tín dụng rủi ro tín dụng 1 Khái niệm rủi ro tín dụng Những nguyên nhân phát sinh rủi ro tín dụng [5] Phân loại nhóm nợ ... NGUYỄN THỊ TÂM MINH ỨNG DỤNG CÂY QUYẾT ĐỊNH ĐỂ DỰ ĐOÁN CHỈ SỐ NHĨM NỢ HỖ TRỢ QUẢN LÝ RỦI RO TÍN DỤNG Ngành : Công nghệ thông tin Chuyên ngành : Hệ thống thông tin Mã số : 60 48 05 LUẬN VĂN... Tín dụng rủi ro tín dụng Khái niệm rủi ro tín dụng Tín dụng ngân hàng quan hệ tín dụng ngân hàng, tổ chức tín dụng tổ chức kinh tế, cá nhân theo nguyên tắc hoàn trả Việc hoàn trả nợ gốc tín dụng

Ngày đăng: 25/03/2015, 10:23

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • I. Tín dụng và rủi ro tín dụng.

  • 1. Khái niệm rủi ro tín dụng

  • 2. Những nguyên nhân phát sinh rủi ro tín dụng [5]

  • 3. Phân loại nhóm nợ

  • 4. Nguyên tắc vay vốn

  • 5. Điều kiện vay vốn

  • 6. Căn cứ xác định định mức cho vay

  • 7. Đối tượng áp dụng

  • II. Các mô hình phân tích đánh giá rủi ro tín dụng

  • 1. Mô hình định tính

  • 1.2 Kiểm tra tín dụng

  • 1.3 . Xử lý tín dụng có vấn đề

  • 2. Các mô hình lượng hóa rủi ro tín dụng

  • I. Cây quyết định

  • 1. Định nghĩa cây quyết định

  • 2. Các kiểu cây quyết định

  • 3. Ví dụ

  • 4. Ưu điểm của cây quyết định

  • 5. Vấn đề xây dựng cây quyết định

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan