Tiểu luận môn Hệ hỗ trợ quyết định KHAI THÁC DỮ LIỆU TÀI CHÍNH KẾ TOÁN TỔNG QUAN VỀ MỘT SỐ XU HƯỚNG NGHIÊN CỨU HIỆN NAY

23 469 0
Tiểu luận môn Hệ hỗ trợ quyết định KHAI THÁC DỮ LIỆU TÀI CHÍNH KẾ TOÁN TỔNG QUAN VỀ MỘT SỐ XU HƯỚNG NGHIÊN CỨU HIỆN NAY

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh MỤC LỤC DANH MỤC HÌNH ẢNH .2 TÓM TẮT CHƯƠNG 1: GIỚI THIỆU CHƯƠNG 2: TÀI LIỆU TÌM KIẾM CHƯƠNG 3: CÁC PHƯƠNG PHÁP SỬ DỤNG 3.1 Mạng Nơ ron 3.2 Thuật toán di truyền 3.3 Cây định 3.4 Lý thuyêt tập thô 3.5 Cơ sở lý luận CHƯƠNG 4: LĨNH VỰC ÁP DỤNG VÀ NGHIÊN CỨU 4.1 Dự báo phá sản 10 4.2 Sự quan tâm rủi ro tài 14 4.3 Gian lận quản lý 15 4.4 Dự đoán hiệu suất doanh nghiệp 16 4.5 Ước tính rủi ro tín dụng 16 CHƯƠNG 5: ĐÁNH GIÁ VÀ HƯỚNG NGHIÊN CỨU TƯƠNG LAI 17 Bảng Lĩnh vực ứng dụng 18 5.1 Phương pháp mơ hình 18 Bảng Mơ hình l{m việc 19 5.2 Dữ liệu 20 Bảng Cỡ mẫu 20 5.3 Số liệu hiệu suất 21 CHƯƠNG 6: KẾT LUẬN 22 TÀI LIỆU THAM KHẢO 23 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh DANH MỤC HÌNH ẢNH Bảng Lĩnh vực ứng dụng 18 Bảng Mơ hình l{m việc 19 Bảng Cỡ mẫu 20 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh TĨM TẮT Cơng cụ khai ph| liệu trở nên quan trọng ng{nh t{i v{ kế to|n Khả ph}n loại v{ dự đo|n cho phép sử dụng cho c|c mục đích dự b|o ph| sản, mối quan t}m tình trạng v{ dự đo|n khủng hoảng t{i , ph|t gian lận quản lý , dự to|n rủi ro tín dụng , v{ dự đo|n hiệu suất cơng ty Nghiên cứu n{y nhằm mục đích cung cấp cho nh{ nước nghệ thuật xem xét c|c t{i liệu liên quan v{ để hội nghiên cứu có liên quan CHƯƠNG 1: GIỚI THIỆU Khai th|c liệu – DataMining (Khai ph| liệu) l{ lĩnh vực vinh danh khoa học m|y tính Nó xuất cuối năm 80 c|c kh|i niệm v{ phương ph|p từ c|c lĩnh vực trí tuệ nh}n tạo, chứng nhận quyền, hệ thống sở liệu v{ thống kê, khai ph| liệu nhằm mục đích kh|m ph| thơng tin ẩn có gi| trị, phức tạp v{ không rõ r{ng từ lượng lớn liệu Vì lý n{y , thuật ngữ tương đương cho khai ph| liệu l{ Kh|m ph| tri thức sở liệu Knowledge Discovery in Databases ( KDD ) bình đẳng hóa thường gặp văn học Dữ liệu t{i thu thập nhiều tổ chức ng}n h{ng , c|c quan chứng kho|n , quan thuế , quan kế to|n v{ kiểm to|n viên lớn chuyên sở liệu , vv v{ số trường hợp l{ công bố công khai Áp dụng kỹ thuật Khai ph| liệu liệu t{i góp phần giải ph|p ph}n loại v{ dự đo|n c|c vấn đề v{ tạo thuận lợi cho qu| trình định Ví dụ điển hình vấn đề ph}n loại t{i doanh nghiệp ph| sản , ước tính rủi ro tín dụng , b|o c|o lo ngại , khủng hoảng t{i v{ dự đo|n hiệu suất công ty Tầm quan trọng Khai ph| liệu t{i v{ kế to|n đ~ cơng nhận nhiều tổ chức Viện Kế to|n công Mỹ đ~ x|c định khai ph| liệu l{ mười công nghệ h{ng đầu cho ng{y mai v{ Viện GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh Kiểm to|n nội đ~ liệt kê khai ph| liệu l{ bốn ưu tiên nghiên cứu ( Koh , 2004) Nghiên cứu khai ph| liệu t{i kế to|n v{ ứng dụng c|c kết l{ lĩnh vực nghiên cứu tương đối Mục đích nghiên cứu n{y l{ cung cấp cho nh{ nước nghệ thuật đ|nh gi| nỗ lực nghiên cứu việc |p dụng khai ph| liệu t{i v{ kế to|n Đ|nh gi| n{y giới thiệu người đọc chủ đề cụ thể liên quan đến mục tiêu v{ phương ph|p l{m việc nghiên cứu Đặc biệt l{ nghiên cứu n{y cố gắng giải c|c c}u hỏi sau: - Cụ thể c|c lĩnh vực ứng dụng t{i m{ phương ph|p khai ph| liệu đ~ |p dụng l{ ? - Phương ph|p khai ph| liệu n{o đ~ |p dụng v{ mở rộng ? L{m phương ph|p tốt phương ph|p truyền thống trước đ}y ? - Phương ph|p hoạt động c|c loại liệu? L{ cỡ mẫu lớn đạt yêu cầu ? C|c phương ph|p lựa chọn tính |p dụng có ? - C|c số liệu hiệu suất tương đối c}n nhắc l{ gì? Một nghiên cứu giúp c|c nh{ nghiên cứu để tr|nh chồng chéo nỗ lực v{ điểm chuẩn thực h{nh chống lại ph|t triển Mục đích kh|c nghiên cứu n{y l{ để khu vực m{u mỡ để biết thêm công việc nghiên cứu khu vực Phần lại b{i b|o n{y tổ chức sau: - Phần nói T{i liệu tham khảo tìm kiếm thu thập - Phần mơ tả ngắn gọn phương ph|p khai ph| liệu |p dụng c|c t{i liệu thu thập - Phần đề cập đến c|c ứng dụng cụ thể v{ nghiên cứu GVHD:PGS.TS Đỗ Phúc - HV: Nguyễn Đạt Thịnh Cuối cùng, mục vấn đề thẩm định v{ nghiên cứu tương lai quan trọng b|o c|o - Phần l{ phần kết luận CHƯƠNG 2: TÀI LIỆU TÌM KIẾM Đối với việc tìm kiếm c|c nghiên cứu liên quan đến việc |p dụng c|c kỹ thuật khia ph| liệu kế to|n t{i , chúng tơi đ~ nghiên cứu c|c tạp chí bốn nh{ xuất : Elsevier,Emerald, Kluwer v{ Wiley B{i viết liên quan đ~ tìm thấy c|c tạp chí: - Asia Pacific Financial Markets (Thị trường t{i Ch}u Á Th|i Bình Dương) - Decision Support Systems (Hệ hỗ trợ định) - European Journal of Operational Research (Tạp chí Ch}u Âu hoạt động nghiên cứu) - Expert Systems with Applications (Hệ thống chuyên gia v{ c|c ứng dụng) - Expert Systems with Applications - Intelligent Systems in Accounting (Hệ thống thông minh Kế to|n) - Finance & Management (T{i v{ quản lý) - International Journal of Accounting Information Systems (Tạp chí quốc tế hệ thống thông tin kế to|n) - Journal of Forecasting (Tạp chí dự b|o) - Knowledge Based Systems - Management Decision - Managerial Auditing Journal - Managerial Finance - Neural Networks, - Omega The International Journal of Management Science GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh CHƯƠNG 3: CÁC PHƯƠNG PHÁP SỬ DỤNG Thuật ngữ phương ph|p khai th|c liệu l{ viết tắt số lượng lớn c|c thuật to|n, mơ hình v{ kỹ thuật xuất ph|t từ thẩm thấu số liệu thống kê , học m|y , sở liệu v{ trực quan Một số c|c phương ph|p đ~ |p dụng để kiểm tra liệu t{i Phương ph|p khai ph| liệu phổ biến đề cập đến nghiên cứu n{y l{ mạng nơ ron , thuật to|n di truyền , C}y Quyết định , Lý thuyết tập thô, trường hợp sở lý luận v{ lập trình to|n học 3.1 Mạng Nơ ron Mạng Nơ ron l{ công nghệ trưởng th{nh với lý thuyết th{nh lập v{ khu vực ứng dụng công nhận Mạng Nơ ron bao gồm số tế b{o nơ ron , tức l{ đơn vị xử lý liên kết với Liên kết kết nối g|n gi| trị số gọi l{ "trọng lượng" Mỗi tế b{o nơ ron nhận tín hiệu từ tế b{o nơ ron kết nối Nếu đầu v{o cường độ tín hiệu kết hợp vượt qu| ngưỡng, c|c nơ ron bị ch|y Gi| trị đầu v{o chuyển c|c chức chuyển giao c|c tế b{o nơ ron C|c tế b{o nơ ron xếp th{nh c|c lớp Một mạng lưới lớp bao gồm đầu v{o ( ) v{ đầu ( cuối ) lớp Giữa c|c lớp đầu v{o v{ đầu tồn nhiều lớp ẩn C|c loại mạng nơ ron kh|c có số lượng c|c lớp kh|c Sơ đồ tự tổ chức có lớp đầu v{o v{ đầu , mạng nơ ron lan truyền ngược có thêm nhiều lớp ẩn Sau c|c kiến trúc mạng x|c định , mạng phải huấn luyện Trong mạng lan truyền ngược mơ hình |p dụng cho c|c lớp đầu v{o v{ đầu cuối x|c định theo lớp Sản lượng so s|nh với kết mong muốn v{ c|c lỗi truyền ngược trở lại mạng nơ ron c|ch điều chỉnh trọng lượng c|c kết nối Qu| trình n{y lặp lặp lại tỷ lệ lỗi chấp nhận đạt tới C|c mạng nơ ron lan truyền ngược đ~ trở nên phổ biến cho c|c dự đo|n v{ ph}n loại c|c vấn đề GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh Sơ đồ tự tổ chức l{ nhóm v{ phương ph|p trực quan học không gi|m s|t Đối với vector đầu v{o , đầu có tế b{o nơ ron kích hoạt Vector trọng số người chiến thắng cập nhật để tương ứng với vector đầu v{o Như vậy, đầu v{o tương tự |nh xạ tới c|c tế b{o nơ ron đầu tương tự l}n cận tạo th{nh cụm Hai cấu trúc liên kết sơ đồ tự tổ chức thường sử dụng l{ lưới hình chữ nhật, tế b{o nơ ron có bốn nút l|ng giềng v{ mạng tinh thể hình lục gi|c, nơi tế b{o thần kinh có s|u nút l|ng giềng Một bất lợi quan trọng mạng nơ ron l{ chúng hoạt động hộp đen l{ khó khăn người để giải thích c|ch đạt định Tuy nhiên , c|c thuật to|n đ~ đề xuất để trích xuất c|c quy tắc comprehendible từ mạng nơ ron Một phê bình kh|c mạng nơ ron l{ số thông số c|c cấu trúc liên kết mạng phải x|c định thực nghiệm Có vẻ l{ Mạng nơ ron thu hút quan t}m nhiều nh{ nghiên cứu c|c lĩnh vực quan t}m Cấu trúc v{ nguyên tắc l{m việc cho phép họ để đối phó với vấn đề m{ giải ph|p hiệu không |p dụng thuật to|n Kể từ họ học hỏi từ c|c ví dụ v{ kh|i qu|t để quan s|t ph}n loại c|c mơ hình trước khơng thấy Họ có khả để đối phó với c|c liệu khơng đầy đủ, khơng rõ r{ng v{ ồn {o Không giống c|c kỹ thuật thống kê truyền thống chúng không mang tiên c|c tính chất ph}n phối liệu, khơng phải họ giả định c|c biến đầu v{o độc lập 3.2 Thuật toán di truyền Thuật to|n di truyền (GA) |p dụng ý tưởng từ tiến hóa tự nhiên nơi c| nh}n thích hợp tồn Quy định liên quan đến vấn đề m~ hóa tập hợp c|c chuỗi số bao gồm c|c bit C|c chuỗi tạo th{nh quần thể GA cho phép c|c chuỗi với gi| trị tập thể cao để tồn v{ sinh sôi nảy nở đổi d}n số GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh Một nhiễm sắc thể l{ chuỗi ký tự đại diện cho điểm không gian giải ph|p D}n số l{ tập hợp c|c nhiễm sắc thể Sau tạo ngẫu nhiên d}n số ban đầu nhiễm sắc thể đ|nh gi| c|ch sử dụng chức đ|nh gi| lực người dùng định nghĩa Vai trò chức đ|nh gi| lực l{ để đ|nh gi| hiệu hoạt động nhiễm sắc thể Ba bước khai th|c |p dụng cho c|c nhiễm sắc thể - Sinh sản - nơi m{ c|c c| nh}n tự sinh sôi nảy nở c|ch t|i tạo th}n với x|c suất tương tự gi| trị lực chúng - Giao nhau, nơi hai nhiễm sắc thể trao đổi số bit tạo nhiễm sắc thể - Đột biến , hoạt động nhiễm sắc thể c|ch thay đổi nhiều bit X|c suất đột biến l{ thấp 3.3 Cây định C}y định l{ phương ph|p ph}n loại v{ dự đo|n, m{ liên tục quan s|t chia th{nh nhóm loại trừ lẫn Phương ph|p tìm kiếm c|c thuộc tính tốt t|ch mẫu v{o lớp học c| nh}n Nhóm liên tục chia nhóm qu| nhỏ khơng có kh|c biệt ý nghĩa thống kê tồn c|c tập ứng cử viên Nếu c}y định trở nên qu| lớn, cuối tỉa 3.4 Lý thuyêt tập thô Lý thuyết tập thô giới thiệu Pawlak ( 1982) Mức độ lý thuyết tập hợp với kh|i niệm th{nh viên nguyên tố tập Cho lớp C , xấp xỉ C bao gồm c|c mẫu chắn thuộc C xấp xỉ C bao gồm c|c mẫu m{ định nghĩa l{ không thuộc C Lý thuyết tập thơ sử dụng để mơ tả phụ thuộc c|c thuộc tính , để đ|nh gi| tầm quan trọng c|c thuộc tính, để đối phó với c|c liệu không phù hợp v{ xử lý không chắn ( Dimitras et al.1999 ) 3.5 Cơ sở lý luận GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh Cơ sở lý luận l{ vấn đề lý luận phương ph|p giải Để giải vấn đề , cố gắng để lấy trường hợp tương tự từ sở trường hợp Vấn đề quan trọng l{ biện ph|p tương tự v{ việc thu hồi c|c trường hợp tương tự Kỹ thuật phù hợp v{ phổ biến l{ l|ng giềng gần , học tập quy nạp v{ kiến thức hướng dẫn Trong phiên đơn giản nó, b{i to|n l|ng giềng gần đ|nh gi| giống hai trường hợp c|ch tính to|n khoảng c|ch Euclide chúng C|ch tiếp cận n{y giả định tất c|c tính n{y có liên quan Vì đ}y l{ luôn , c|c thuật to|n cải thiện giới thiệu tính trọng số đ~ đề xuất CHƯƠNG 4: LĨNH VỰC ÁP DỤNG VÀ NGHIÊN CỨU Do khả dự đo|n v{ ph}n loại chúng, kỹ thuật khai ph| liệu đ~ sử dụng để tạo thuận lợi cho qu| trình kiểm to|n, dự đo|n hiệu suất cơng ty, v{ để tạo điều kiện ước lượng rủi ro tín dụng Trong lĩnh vực kiểm to|n, kỹ thuật khai ph| liệu ph|t triển l{ đóng góp đầy hứa hẹn C|c kiện gần đ}y cho thấy vấn đề đ|ng kể qu| trình kiểm to|n Sự sụp đổ Enron v{ Arthur Andersen v{ " s|ch nấu ăn " thực h{nh kế to|n |p dụng dường rộng r~i, cung cấp chứng cho việc thay đổi nhu cầu qu| trình kiểm to|n ( Koskivaara , 2004) Theo b|o c|o Kiểm to|n Tiêu chuẩn 56 (SAS 56) AICPA , kiểm to|n viên ph|t triển / kỳ vọng riêng v{ so s|nh kỳ vọng với số lượng ghi tỷ lệ Trong việc ho{n th{nh nhiệm vụ n{y, kiểm to|n viên sử dụng c|c thủ tục ph}n tích m{ so s|nh mối quan hệ c|c liệu dự kiến với c|c mối quan hệ quan s|t thực tế Thủ tục ph}n tích cho phép việc kiểm tra tính x|c c}n t{i khoản m{ không cần kiểm tra c|c giao dịch c| nh}n GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh Fraser ph}n loại c|c kỹ thuật đ|nh gi| ph}n tích khơng định lượng quét, định lượng đơn giản xu hướng , tỷ lệ kiểm tra hợp lý chẳng hạn ph}n tích quy hồi v{ mạng Nơ ron (Fraser et al.1997 ) (Koskivaara, 2004) Một xu hướng đại kiểm to|n l{ để nắm lấy c|c kh|i niệm rủi ro kinh doanh , nhấn mạnh c|c mục tiêu chiến lược doanh nghiệp kinh doanh Trong c|ch tiếp cận từ xuống kiểm to|n viên hiểu mục tiêu chiến lược v{ hoạt động xuống để qu| trình kinh doanh Kỹ thuật khai ph| liệu mạng Nơ ron , Giải thuật di truyền , Cơ sở lý luận v{ logic mờ tạo thuận lợi cho phương ph|p tiếp cận dựa rủi ro kiểm to|n n{y ( Calderon v{ cộng , 2002) Những b{i b{o nói đến lĩnh vực ứng dụng cụ thể lĩnh vực kiểm to|n bao gồm Dự b|o ph| sản, dự b|o động liên tục v{ t{i v{ gian lận quản lý 4.1 Dự báo phá sản Dự b|o ph| sản dường l{ chủ đề phổ biến việc |p dụng c|c kỹ thuật khai ph| liệu liệu t{i Doanh nghiệp ph| sản g}y thiệt hại kinh tế cho nh{ quản lý , c|c nh{ đầu tư , c|c chủ nợ v{ người lao động với chi phí x~ hội Những dự đo|n lý ph| sản l{ vấn đề quan trọng t{i Dự b|o ph| sản c|ch sử dụng liệu b|o c|o t{i thu hút nguồn gốc từ cơng việc Altman năm 1968 Altman cho thất bại công ty l{ qu| trình thời gian d{i v{ liệu b|o c|o t{i phải bao gồm c|c tín hiệu cảnh b|o cho ph| sản xảy Bằng c|ch |p dụng nhiều kỹ thuật ph}n tích biệt ơng đ~ ph|t triển mơ hình dự đo|n ph| sản Kể từ nghiên cứu Altman nhiều nh{ nghiên cứu ph|t triển mơ hình thay c|ch sử dụng kỹ thuật thống kê (Ohlson 1980 used Logit, Zmijewski 1984 used Probit) Trong năm qua nỗ lực nghiên cứu 10 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh đ~ thực để x}y dựng c|c mơ hình sử dụng kỹ thuật khai ph| liệu Lin v{ McClean (2001 ) đ~ cố gắng dự đo|n thất bại công ty c|ch sử dụng phương ph|p kh|c Hai số c|c phương ph|p thống kê ( Ph}n tích tín hiệu v{ Hồi quy logic ) Trong hai phương ph|p lại l{ kỹ thuật m|y học ( C}y đinh - C5.0 v{ Mạng nơ ron) Ngo{i họ đề xuất thuật to|n lai Mẫu họ bao gồm liệu 1133 công ty Vương quốc Anh 690 công ty không thất bại v{ 106 công ty thất bại sử dụng tập huấn luyện Trong 289 cơng ty đ~ khơng thất bại v{ 48 công ty sử dụng tập kiểm tra Khơng có nỗ lực đ~ thực để phù hợp với c|c công ty thất bại v{ khơng thất bại 37 tiêu t{i có nguồn gốc từ bảng c}n đối v{ b|o c|o thu nhập đ~ lựa chọn l{ c|c biến đầu v{o Hai phương ph|p lựa chọn tính đ~ sử dụng l{m giảm c|c biến đầu v{o đến c|ch sử dụng ph|n xét người v{ 15 c|ch sử dụng ANOVA C|c t|c giả b|o c|o kết tốt cho Mạng Nơ ron v{ c}y định mơ hình cho hai dựa ph|n xét người v{ lựa chọn tính ANOVA Cuối , c|c t|c giả đề xuất thuật to|n lai sử dụng độ ưu tiên có trọng số ph}n loại kh|c Hiệu suất nhỉnh b|o c|o cho c|c mơ hình lai TUng et al (2004) sử dụng mơ hình lai tích hợp Mạng nơ ron v{ hệ thống mờ Mơ hình gọi l{ "Generic Fuzzy Neural Network " l{ sở nguyên tắc bao gồm c|c quy tắc luật mờ IF-THEN tự điều chỉnh c|c thơng số c|c quy tắc mờ sử dụng thuật to|n học có nguồn gốc từ c|c mơ hình mạng nơ ron Ưu điểm mạng nơ ron mờ đ~ đề cập l{ khả mơ hình hóa vấn đề c|ch sử dụng dễ hiểu mơ hình ngơn ngữ cấp cao thay biểu thức to|n học phức tạp Mơ hình n{y đ~ |p dụng để dự đo|n ph| sản ng}n h{ng Biến đầu v{o l{ biến 11 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh t{i , đ~ tìm thấy l{ quan trọng nghiên cứu trước đ}y Mẫu chứa liệu 2555 ng}n h{ng không ph| sản v{ 548 ng}n h{ng ph| sản 20 % liệu đ~ sử dụng tập huấn luyện v{ 80% kiểm tra Để giảm loại lỗi mẫu c}n bao gồm số lượng tương đương c|c ng}n h{ng thất bại v{ không thất bại T|c giả b|o c|o hiệu suất 93% sử dụng liệu từ b|o c|o t{i có sẵn , 85% sử dụng b|o c|o thu năm trước v{ 75% b|o c|o hai năm trước c|c ghi có sẵn Mơ hình sản xuất tập khoảng 50 luật mờ IF-THEN, mơ tả tương t|c c|c biến đầu v{o lựa chọn v{ t|c động chúng sức khỏe t{i c|c ng}n h{ng quan s|t Shin v{ Lee (2002) đề xuất mơ hình dựa giải thuật di truyền C|c t|c giả nhấn mạnh thực tế l{ tr|i ngược với Mạng nơ ron, giải thuật di truyền sản xuất c|c quy tắc Giải thuật di truyền đ~ |p dụng để tìm ngưỡng cho nhiều biến công ty coi l{ nguy hiểm Mơ hình n{y sử dụng cấu trúc quy tắc có chứa điều kiện, điều kiện số gọi l{ biến tiêu t{i C|c điều kiện kết hợp hợp lý Tập liệu chứa 264 thất bại v{ 264 doanh nghiệp không thất bại Trong tiêu t{i đ~ chọn l{ biến đầu v{o, 90% mẫu sử dụng để đ{o tạo v{ 10% để x|c nhận Việc thực b|o c|o chung l{ khoảng 80% Kim v{ Han (2003) đ~ x}y dựng mơ hình định lượng dựa c|c chun gia giải vấn đề kiến thức C|c chuyên gia l{m việc với kiến thức chủ quan họ đ|nh gi| kiện v{ định lượng Mơ hình n{y sử dụng phương ph|p giải thuật di truyền để trích xuất c|c quy tắc định từ c|c chuyên gia dự đo|n ph| sản uy tín Mơ hình theo phương ph|p c|c chuyên gia ng}n h{ng thương mại H{n Quốc Để dự đo|n c|c chuyên gia đ|nh gi| yếu tố nguy ph| sản lớn Trong mô hình nhiễm sắc thể chứa ph}n đoạn đại diện cho 12 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh ph}n loại công ty theo yếu tố nguy Một phận thứ nhiễm sắc thể ph}n loại c|c công ty ng}n h{ng ph| sản không bị ph| sản Mẫu liệu chứa 772 cơng ty, nửa số đ~ bị ph| sản C|c chuyên gia đ|nh gi| yếu tố rủi ro cho c|c công ty n{y Qu| trình tiến hóa di truyền chiết xuất 11 quy tắc ph| sản Ngo{i quy tắc đ~ chiết xuất c|ch sử dụng mạng nơ ron lan truyền ngược v{ cảm ứng học tập quy nạp Nội quy chiết xuất với giải thuật di truyền b|o c|o l{ có độ x|c tốt so với dự đo|n mạng nơ ron v{ học tập quy hồi Dimitras et al (1998) |p dụng lý thuyết tập thô cho mục đích dự b|o ph| sản Tập huấn luyện chứa liệu cho 40 doanh nghiệp thất bại v{ 40 không thất bại c|c công ty Hy lạp khoảng thời gian năm năm Tập thử nghiệm chứa 19 thất bại v{ 19 doanh nghiệp không thất bại Một người quản lý tín dụng ng}n h{ng Hy Lạp lựa chọn 12 tiêu t{i v{o c|c bảng thông tin v{ rời rạc c|c gi| trị liên tục Ph}n tích tập thơ sản xuất 54 reducts, có chứa 5-7 thuộc tính, người quản lý ng}n h{ng lựa chọn reduct v{ c|c thuộc tính cịn lại l{ xo| bỏ, phải đồng Cuối cùng, c|c quy tắc định nguồn gốc Kết phương ph|p n{y đ~ so s|nh với kết ph}n tích ph}n biệt v{ ph}n tích logit v{ đ~ tìm thấy để chiến thắng McKee (2003) so s|nh kết thu c|ch sử dụng lý thuyết tập thơ có ý kiến kiểm to|n viên thực tế với mục đích dự b|o ph| sản Mẫu liệu bao gồm 146 bị ph| sản v{ 145 công ty không bị ph| sản phù hợp với Mỹ 11 yếu tố tiên đo|n đ~ lựa chọn, 10 số l{ tiêu t{i v{ l{ ý kiến kiểm to|n trước Tập thô sản xuất 87 reducts, sử dụng 4-6 biến v{ reducts lựa chọn Hai mơ hình nguyên tắc định ph|t triển C|c kết c|c mơ hình so s|nh với tỷ lệ tín hiệu kiểm to|n viên thực tế v{ đ~ tìm thấy gần T|c giả kết luận c|c mơ hình 13 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh ph|t triển nghiên cứu n{y cung cấp khơng có lợi so s|nh tiên đo|n đ|ng kể so với c|c phương ph|p h{nh kiểm to|n viên Park.V{ Han (2002) nghiên cứu sở lý luận ph|t triển mơ hình để dự đo|n ng}n h{ng ph| sản Đo khoảng c|ch sử dụng tính trọng Trọng lượng tính to|n c|ch sử dụng c|c hương ph|p Ph}n tích qu| trình ph}n cấp (AHP) C|c mẫu bao gồm 1072 thất bại v{ 1072 cơng ty khơng thất bại 13 biến t{i phi t{i v{ 15 biến đ~ lựa chọn cho đầu v{o C|c t|c giả cho AHP / CBR thực tốt so với sở lý luận túy, sở lý luận hồi quy logit v{ sở lý luận 4.2 Sự quan tâm rủi ro tài Theo SAS 59, kiểm to|n viên phải đ|nh gi| khả / kh|ch h{ng để tiếp tục l{m năm ngo{i c|c liệu t{i Nếu có dấu hiệu cho thấy c|c công ty kh|ch h{ng phải đối mặt với khó khăn t{i chính, dẫn đến thất bại, kiểm to|n viên phải đưa b|o c|o liên tục Việc đ|nh gi| tình trạng hoạt động liên tục l{ nhiệm vụ dễ d{ng Nghiên cứu b|o c|o có tỷ lệ nhỏ tương đối c|c công ty không đủ điều kiện đ~ sở hoạt động liên tục ( Koh 2004) Để tạo thuận lợi cho kiểm to|n viên b|o c|o liên tục ph|t h{nh nhiệm vụ, kỹ thuật thống kê v{ m|y học đ~ đề xuất Koh (2004) so s|nh mạng nơ ron lan truyền ngược, C}y Quyết định v{ phương ph|p hồi quy logistic nghiên cứu dự đo|n hoạt động liên tục C|c liệu bao gồm 165 c|c công ty quan t}m mẫu liệu v{ 165 công ty không quan t}m phù hợp tiêu t{i lựa chọn đ~ sử dụng l{ c|c biến đầu v{o T|c giả b|o c|o Quyết định C}y vượt trội so với hai phương ph|p kh|c Tan v{ Dihardjo (2001 dựa nghiên cứu trước Tan, để dự b|o khủng hoảng t{i cho tập đo{n tín dụng Úc c|ch sử dụng mạng Nơ ron lan truyền ngược Trong nghiên cứu trước 14 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh ơng Tan sử dụng liệu t{i theo quý v{ cố gắng dự b|o gặp nạn sở quý Tan v{ Dihardjo cải thiện phương ph|p c|ch giới thiệu kh|i niệm "ph|t sớm" Khi mơ hình dự đo|n liên minh tín dụng gặp rủi ro quý cụ thể v{ tập đo{n thực gặp rủi ro quý tiếp theo, tối đa l{ bốn quý, quý d|n nh~n l{ "Early Detector" Phương ph|p cải tiến n{y thực tốt so với trước loại II lỗi tốc độ 13 tiêu t{i đ~ sử dụng l{ c|c biến đầu v{o v{ mẫu 2.144 quan s|t sử dụng Kết so s|nh với người mơ hình Probit v{ đ~ tìm thấy nhỉnh đặc biệt l{ tỷ lệ lỗi loại Konno v{ Kobayashi (2000) đề xuất phương ph|p để đ|nh gi| doanh nghiệp c|ch sử dụng c|c kỹ thuật lập trình to|n học Phương ph|p n{y thực khơng có giả định ph}n phối c|c liệu Ba lựa chọn thay dựa ph}n biệt đối xử ph}n biệt đối xử, ph}n biệt đối xử bề mặt bậc hai v{ ph}n biệt đối xử bề mặt sử dụng tiêu t{i bắt nguồn từ b|o c|o t{i đ~ sử dụng l{ c|c biến đầu v{o Mẫu liệu chứa 455 doanh nghiệp Phương ph|p tính to|n điểm số cho doanh nghiệp 4.3 Gian lận quản lý Gian lận quản lý l{ gian lận c}n nhắc cam kết c|c nh{ quản lý thơng qua b|o c|o t{i sai lệch Gian lận quản lý bị thương quan thuế , cổ đông v{ chủ nợ Spathis (2002) đ~ ph|t triển hai mơ hình để x|c định b|o c|o t{i giả mạo từ số liệu công bố công khai Biến đầu v{o cho c|c mơ hình chứa tiêu t{i Mơ hình thứ hai thêm v{o biến đầu v{o để phù hợp với mối quan hệ khủng hoảng t{i v{ thao t|c b|o c|o t{i Phương ph|p sử dụng l{ hồi quy logistic v{ c|c mẫu liệu chứa 38 FFS v{ 38 công ty không FFS Đối với hai mơ hình kết cho thấy biến với hệ số quan trọng v{o mơ hình 15 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh 4.4 Dự đoán hiệu suất doanh nghiệp Lam (2003 ) đ~ ph|t triển mơ hình để dự đo|n tỷ lệ lợi nhuận vốn chủ sở hữu cổ đông phổ thông Cô sử dụng mạng nơ ron lan truyền ngược v{ c|c quy tắc suy từ trọng lượng c|c kết nối c|ch |p dụng c|c thuật to|n GLARE Dữ liệu đầu v{o bao gồm 15 tỷ lệ b|o c|o t{i v{ biến ph}n tích kỹ thuật Trong thử nghiệm thêm 11 biến kinh tế vĩ mô thu nhận Mẫu liệu chứa 364 công ty Back v{ c|c cộng (2001 ) đ~ ph|t triển hai mơ hình cho c|c cụm cơng ty theo hiệu suất họ Cả hai mơ hình sử dụng SOM Mơ hình hoạt động liệu t{i 160 cơng ty Bằng c|ch sử dụng c|c kỹ thuật khai th|c văn bản, mô hình thứ hai ph}n tích b|o c|o h{ng năm c|c CEO c|c công ty C|c t|c giả kết luận có kh|c biệt c|c kết ph}n nhóm hai phương ph|p Kloptchenko cộng 2004 nỗ lực nghiên cứu vấn đề đề cập trước Hai mơ hình ph|t triển, ph}n tích tiêu t{i v{ ph}n tích kh|c b|o c|o c|c gi|m đốc điều h{nh Trong nghiên cứu n{y l{ phương ph|p kh|c nhau, thử nghiệm Phù hợp với Tiêu Clustering , đ~ sử dụng để ph}n tích c|c b|o c|o Bằng c|ch so s|nh c|c kết chất lượng v{ c|c phương ph|p định lượng c|c t|c giả kết luận c|c b|o c|o văn có xu hướng dự đo|n thay đổi ng{y 4.5 Ước tính rủi ro tín dụng Nhiệm vụ ph}n tích rủi ro tín dụng trở nên đòi hỏi nhiều số lượng gia tăng ph| sản v{ ch{o h{ng cạnh tranh c|c chủ nợ Kỹ thuật khai ph| liệu đ~ |p dụng để tạo điều kiện lập dự to|n rủi ro tín dụng Huang et al (2003) thực ph}n tích xếp hạng tín dụng c|ch sử dụng Hỗ trợ M|y móc (SVM), kỹ thuật m|y học Hai liệu đ~ sử dụng; có chứa 74 cơng ty H{n Quốc v{ 16 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh kh|c có 265 cơng ty kh|c Mỹ Đối với hai tập hợp liệu loại đ|nh gi| x|c định Hai mơ hình cho liệu H{n Quốc v{ hai mơ hình cho liệu Mỹ, người có vector đầu v{o kh|c x}y dựng SVM v{ NNS lan truyền ngược sử dụng để dự đo|n xếp hạng tín dụng SVM i hình th{nh tốt ba bốn mơ hình Một xem xét nghiên cứu l{ để giải thích mạng nơ ron Phương ph|p Garson sử dụng để đo tầm quan trọng tương đối c|c gi| trị đầu v{o Mues et (2004) sử dụng sơ đồ định sử dụng để x}y dựng quy tắc đ|nh gi| rủi ro tín dụng Sơ đồ định có lợi mang tính lý thuyết c}y định họ tr|nh lặp lại đẳng cấu Hai liệu, chứa liệu Đức v{ hai liệu Benelux sử dụng Một mạng nơ ron đ~ sử dụng để thực việc ph}n loại C|c phương ph|p khai th|c quy tắc Neurorule v{ khoan xương đ~ |p dụng để trích xuất c|c quy tắc từ mạng Ngo{i C4.5,C4.5 quy tắc v{ Entropy dựa đồ thị Quyết định, phương ph|p đ~ sử dụng để sản xuất c}y định v{ quy tắc Hiệu suất Neurorule v{ khoan xương so s|nh với hiệu suất Mạng nơ ron lan truyền ngược v{ hiệu hoạt động c|c phương ph|p kh|c Cuối c|c quy tắc đ~ hình dung theo hình thức sơ đồ định CHƯƠNG 5: ĐÁNH GIÁ VÀ HƯỚNG NGHIÊN CỨU TƯƠNG LAI T{i kế to|n l{ lĩnh vực ứng dụng phổ biến cho khai ph| liệu Việc ph}n loại v{ khả dự đo|n phương ph|p khai ph| liệu cho phép chúng sử dụng cho c|c mục đích dự b|o ph| sản, mối quan t}m v{ dự đo|n khủng hoảng t{i , ph|t gian lận quản lý , dự to|n rủi ro tín dụng , v{ dự đo|n hiệu suất công ty Kiểm to|n viên , c|c chuyên gia chấm điểm tín dụng v{ c|c nh{ đầu tư tạo điều kiện cơng việc v{ đạt thời gian v{ chi phí qu| trình định 17 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh Dự b|o ph| sản dường thu hút quan t}m hầu hết c|c nh{ nghiên cứu từ gần nửa số giấy tờ đề cập đến chủ đề n{y C|c lĩnh vực ứng dụng c|c t{i liệu kiểm tra mô tả bảng Kiểm tra việc thu thập văn học l{m ph|t sinh để thảo luận phương ph|p l{m việc , liệu sử dụng v{ số liệu hiệu suất chủ đề Lĩnh vực ứng dụng Bài báo Ph| sản Mối quan t}m v{ nguy t{i Dự b|o hiệu suất cơng ty Dự b|o rủi ro tín dụng Gian lận quản lý Bảng Lĩnh vực ứng dụng 5.1 Phương pháp mơ hình C|c phương ph|p khai ph| liệu bao gồm loạt c|c phương ph|p có nguồn gốc từ thống kê , trí tuệ nh}n tạo v{ sở liệu Trong c|c t{i liệu thu thập mạng Nơ ron l{ mơ hình sử dụng nhiều Bảng cho thấy c|c mơ hình l{m việc Mơ hình Bài báo Mạng Nơ ron Tập thô C}y định Giải thuật di truyền Lai tạo Cơ sở lý luận Lập trình to|n học Hồi quy Logistic 18 GVHD:PGS.TS Đỗ Phúc Support Vector Machines HV: Nguyễn Đạt Thịnh Bảng Mô hình l{m việc Mặc dù nhiều nh{ nghiên cứu nhấn mạnh thực tế l{ mơ hình lai m{ kết hợp c|c đặc điểm v{ lợi mơ hình cụ thể cải thiện hiệu suất diễn giải mơ hình lai sử dụng hai trường hợp Một hướng nghiên cứu tương lai ph|t triển v{ ứng dụng c|c mơ hình lai Một hướng cải tiến mơ hình l{ tăng cường c|c mơ hình có với c|c thuật to|n tiên tiến Biến x|c RST , Ph}n tích qu| trình ph}n cấp CBR v{ Giải thuật di truyền m{ sử dụng phương ph|p m|y học l{ ví dụ trường hợp n{y Thiết kế kiến trúc mạng nơ ron l{ vấn đề Số lượng tế b{o nơ ron , số lượng c|c lớp v{ c|c chức chuyển đổi x|c định tùy tiện v{ chủ quan Phương ph|p đề xuất kiến trúc mạng Nơ ron tối ưu cho trường hợp cụ thể ph|t triển Mặc dù lời trích mạng Nơ ron l{ hoạt động hộp đen, có hai trường hợp nỗ lực đ~ thực để giải thích c|c mơ hình ( thuật to|n GLARE , Neurorule , Trepan ) Nỗ lực nghiên cứu hướng tới việc giải thích mơ hình định Mạng nơ ron lan truyền ngược Trong bốn trường hợp mơ hình Trí tuệ nh}n tạo quy chuẩn mơ hình thống kê Phương ph|p trí tuệ nh}n tạo có lợi mặt lý thuyết m{ họ không |p đặt giả định tùy ý c|c biến đầu v{o Tuy nhiên , kết b|o c|o c|c phương ph|p trí tuệ nh}n tạo tốt c|c kết phương ph|p thống kê Trong số trường hợp mơ hình thống kê b|o c|o thực tốt Nỗ lực nghiên cứu bổ sung l{ cần thiết để thực ưu điểm c|c mơ hình lý thuyết trí tuệ nh}n tạo 19 GVHD:PGS.TS Đỗ Phúc HV: Nguyễn Đạt Thịnh 5.2 Dữ liệu C|c liệu sử dụng c|c t{i liệu thu thập chủ yếu l{ tiêu t{i bắt nguồn từ b|o c|o t{i Trong t|m trường hợp, c|c vector đầu v{o bao gồm từ tiêu t{i Trong trường hợp có tỷ lệ t{i khơng sử dụng c|c vector đầu v{o Nhiều t|c giả đề cập đến cần thiết phải l{m phong phú thêm vector đầu v{o với nhiều thông tin Biến kinh tế vĩ mơ bao gồm : Thơng tin định tính việc đạt c|c mục tiêu chiến lược công ty , ý kiến kiểm to|n trước, kinh nghiệm quản lý , thông tin thị trường v{ nhiều yếu tố kh|c sử dụng để nắm bắt c|c yếu tố trị , x~ hội v{ công nghệ kinh tế Trong hai b{i b|o kỹ thuật khai th|c văn sử dụng để ph}n loại v{ dự đo|n hiệu suất công ty Như công nhận c|c t|c giả , số c|c giấy tờ kiểm tra kích thước mẫu khơng đạt yêu cầu lớn Mẫu nhỏ thiên vị c|c kết Hơn có kh|c biệt quan trọng kích thước huấn luyện , thử nghiệm v{ x|c nhận mẫu Bảng mơ tả kích thước mẫu Cỡ mẫu Bài báo > 1000 >500 >200

Ngày đăng: 20/05/2015, 22:54

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan