Luận văn thạc sĩ công nghệ thông tin Dự đoán kết quả học tập của sinh viên trường nghề sử dụng phương pháp hồi quy bayes

56 798 6
Luận văn thạc sĩ công nghệ thông tin Dự đoán kết quả học tập của sinh viên trường nghề sử dụng phương pháp hồi quy bayes

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỤC LỤC TRANG PHỤ BÌA LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC MỞ ĐẦU CHƢƠNG I: KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN TRI THỨC 1.1 Khai phá liệu 1.1.1 Khái niệm 1.1.2 Khai phá liệu phát tri thức 1.1.3 Quá trình phát tri thức từ sở liệu 1.1.3.1 Xác định toán 1.1.3.2 Thu thập tiền xử lý 1.1.3.3 Khai phá liệu rút tri thức 1.1.3.4 Phát biểu đánh giá kết 1.1.3.5 Sử dụng tri thức phát 1.2 Các phƣơng pháp khai phá liệu 1.2.1 Phƣơng pháp quy nạp 1.2.2 Cây định luật 1.2.3 Khai phá luật kết hợp 1.2.3.1 Giới thiệu 1.2.3.2 Các khái niệm 1.2.3.3 Thuật toán khai phá liệu luật kết hợp 1.2.4 Mạng Neuron 11 1.2.5 Giải thuật di truyền 11 1.3 Ứng dụng khai phá liệu 12 CHƢƠNG II: HỆ HỖ TRỢ RA QUYẾT ĐỊNH VÀ MƠ HÌNH HỖ TRỢ QUYẾT ĐỊNH 13 2.1 Hệ hỗ trợ định 13 2.1.1 Khái niệm 13 2.1.2 Các thành phần hệ hỗ trợ định 14 2.1.3 Phân loại hệ hỗ trợ định 15 2.2 Mơ hình hỗ trợ định 17 2.2.1 Vai trị mơ hình tốn học 17 2.2.2 Các mơ hình tốn học hỗ trợ định 18 2.3 Vận dụng phƣơng pháp toán học để phân lớp liệu 19 2.3.1 Khái niệm phân lớp 19 2.3.2 Các bƣớc để giải toán phân lớp 20 2.3.3 Phƣơng pháp phân lớp Naive Bayesian 21 2.3.3.1 Định lý Bayes 21 2.3.3.2 Mơ hình Phân lớp Naive Bayes (NBC) 22 2.3.3.3 Các bƣớc thực thuật toán Naive Bayes 23 2.3.3.4 Thuật toán phân loại KQHT Naive Bayes 27 2.3.3.5 Một số ƣu điểm phƣơng pháp Naive Bayes 28 CHƢƠNG III: PHÂN TÍCH HỒI QUY 29 3.1 Khái niệm phân tích hồi quy 29 3.1.1 Khái niệm 29 3.1.2 Một số dạng hàm phân tích hồi quy 29 3.1.3 Mơ hình hồi quy đơn 31 3.2 Phân tích phƣơng sai hồi quy 33 3.3 Hồi quy tuyến tính đa biến 35 3.3.1 Mơ hình hồi quy 35 3.3.2 Phƣơng trình hồi quy 35 3.3.3 Phân tích phƣơng sai hồi quy 36 3.4 Phân tích hồi quy tuyến tính SPSS 37 3.4.1 Phân tích hồi quy tuyến tính đơn biến SPSS 39 3.4.2 Phân tích hồi quy tuyến tính đa biến SPSS 40 CHƢƠNG IV: BÀI TỐN VÀ CHƢƠNG TRÌNH ỨNG DỤNG PHÂN LỚP BAYES ĐỂ DỰ ĐOÁN KẾT QUẢ HỌC TẬP 43 4.1 Bài toán 43 4.3 Chƣơng trình ứng dụng 50 4.3 Kết thực nghiệm 53 KẾT LUẬN 54 DANH SÁCH CÁC TỪ VIẾT TẮT DANH SÁCH CÁC HÌNH DANH SÁCH CÁC BẢNG TÀI LIỆU THAM KHẢO -1- MỞ ĐẦU Khai phá liệu (Data mining) lĩnh vực khoa học tiềm năng, mang lại nhiều lợi ích thiết thực Mục đích việc khai phá liệu tìm đƣợc mối tƣơng quan tiềm ẩn sở liệu mà phƣơng pháp phân tích liệu truyền thống chƣa làm đƣợc hay xử lý chƣa thật tốt Trong đó, khai phá liệu phát tri thức trở thành lĩnh vực nghiên cứu sôi động, thu hút quan tâm nhiều ngƣời khắp lĩnh vực khác nhƣ hệ sở liệu, thống kê, chiết xuất thông tin, nhận dạng, học máy, trí tuệ nhân tạo, v.v Việc nghiên cứu khai phá liệu lĩnh vực giáo dục đào tạo chƣa đƣợc quan tâm mức Trƣớc đây, có số nhà nghiên cứu sử dụng hồ sơ học sinh, sinh viên, đặc biệt thông tin điểm để dự báo kết học tập tồn khố giai đoạn Một số phƣơng pháp dự báo thƣờng đƣợc sử dụng: Đại số logic, Hồi quy tuyến tính, Cây định (Decision Tree), mạng Bayes (Bayesian Network),… Hồi quy Bayes đƣợc áp dụng cho toán dự đoán dùng công thức Bayes để phân lớp, phƣơng pháp mang lại nhiều kết khả quan Đây phƣơng pháp học phân lớp có giám sát dựa xác suất Kết học tập đƣợc xem mức độ thành công học tập học sinh xem xét mối quan hệ với mục tiêu xác định, chuẩn kiến thức kỹ đạt đƣợc so với công sức thời gian mà ngƣời học bỏ Dựa vào kỹ thuật nghiên cứu trên, tơi định chọn đề tài: “Dự đốn kết học tập sinh viên trường nghề sử dụng phương pháp Hồi quy Bayes” luận văn kết hợp kỹ thuật phân lớp Naive Bayes hệ hỗ trợ định dự đoán kết cuối của sinh viên trƣờng nghề Kết học tập học sinh đƣợc đánh giá xếp loại theo thứ hạng khác sau sử dụng phƣơng pháp hồi quy để phân tích yếu tố ảnh hƣởng đến kết học tập sinh viên Luận văn gồm có chƣơng: Chương 1: Khai phá liệu phát tri thức Chương 2: Hệ hỗ trợ định mơ hình hỗ trợ định -2- Chương 3: Phân tích hồi quy Chương 4: Bài tốn chƣơng trình ứng dụng phân lớp bayes để dự đoán kết học tập -3- CHƢƠNG I KHAI PHÁ DỮ LIỆU VÀ PHÁT HIỆN TRI THỨC 1.1 Khai phá liệu Ƣớc tính khoảng 20 tháng, lƣợng thông tin giới lại tăng gấp đơi Chính vậy, lƣợng liệu mà ngƣời thu thập lƣu trữ đƣợc kho liệu lớn, nhiều vƣợt khả quản lý Thời gian này, ngƣời ta bắt đầu đề cập đến khái niệm khủng hoảng phân tích liệu tác nghiệp để cung cấp thông tin với yêu cầu chất lƣợng ngày cao cho ngƣời định tổ chức tài chính, thƣơng mại, khoa học, Đúng nhƣ John Naisbett cảnh báo “Chúng ta chìm ngập liệu mà đói tri thức” Với khối lƣợng liệu tăng nhanh khổng lồ nhƣ vậy, rõ ràng phƣơng pháp thủ cơng truyền thống áp dụng để phân tích liệu không hiệu quả, tốn dễ dẫn đến sai lệch Do để khai phá hiệu sở liệu lớn cần phải có kỹ thuật mới, kỹ thuật khai phá liệu (Data Mining) Khai phá liệu lĩnh vực khoa học mới, nhằm tự động hóa khai thác thơng tin, tri thức hữu ích, tiềm ẩn sở liệu cho tổ chức, doanh nghiệp, từ thúc đẩy khả sản xuất, kinh doanh, cạnh tranh tổ chức, doanh nghiệp Các kết nghiên cứu với ứng dụng thành công khai phá liệu, khám phá tri thức cho thấy khai phá liệu lĩnh vực khoa học tiềm năng, mang lại nhiều lợi ích, đồng thời có ƣu hẳn so với cơng cụ phân tích liệu truyền thống Hiện nay, khai phá liệu đƣợc ứng dụng rộng rãi lĩnh vực nhƣ: Phân tích liệu hỗ trợ định, điều trị y học, tin-sinh học, thƣơng mại, tài chính, bảo hiểm, text mining, web mining Do phát triển nhanh chóng phạm vi áp dụng phƣơng pháp tìm kiếm tri thức, nên có nhiều quan điểm khác khai phá liệu [7] 1.1.1 Khái niệm Khai phá liệu [7] q trình trích xuất thơng tin có giá trị tiềm ẩn bên lƣợng lớn liệu đƣợc lƣu trữ sở liệu, kho liệu… Hiện -4- nay, ngồi thuật ngữ khai phá liệu, ngƣời ta cịn dùng số thuật ngữ khác có ý nghĩa tƣơng tự nhƣ: khai phá tri thức từ sở liệu (knowlegde mining from databases), trích lọc liệu (knowlegde extraction), phân tích liệu/mẫu (data/pattern analysis), khảo cổ liệu (data archaeology), nạo vét liệu (data dredging) Nhiều ngƣời coi khai phá liệu thuật ngữ thông dụng khác khám phá tri thức sở liệu (Knowlegde Discovery in Databases – KDD) nhƣ 1.1.2 Khai phá liệu phát tri thức Yếu tố thành công nhiều hoạt động biết sử dụng thơng tin có hiệu Điều có nghĩa từ liệu có sẵn phải tìm thơng tin tiềm ẩn mà trƣớc chƣa đƣợc phát hiện, tìm xu hƣớng phát triển yếu tố tác động lên chúng Thực cơng việc q trình phát tri thức sở liệu mà kỹ thuật cho phép ta lấy đƣợc tri thức từ kỹ thuật khai phá liệu Nếu quan niệm tri thức mối quan hệ mẫu phần tử liệu trình phát tri thức tồn q trình chiết xuất tri thức từ sở liệu, trải qua nhiều giai đoạn khác nhƣ: Tìm hiểu phát đề, thu thập tiền xử lý liệu, phát tri thức, minh hoạ đánh giá tri thức phát đƣa kết vào thực tế Khai phá liệu có điểm khác mặt ngữ nghĩa so với phát tri thức từ sở liệu nhƣng thực tế ta thấy khai phá liệu giai đoạn phát tri thức chuỗi giai đoạn trình phát tri thức sở liệu Tuy nhiên giai đoạn đóng vai trị chủ chốt giai đoạn tạo nên tính đa ngành phát tri thức sở liệu 1.1.3 Quá trình phát tri thức từ sở liệu Phát tri thức từ sở liệu trình có sử dụng nhiều phƣơng pháp cơng cụ tin học nhƣng q trình mà ngƣời làm trung tâm Do khơng phải hệ thống phân tích tự động mà hệ thống bao gồm nhiều hoạt động tƣơng tác thƣờng xuyên ngƣời sở liệu, tất nhiên với hỗ trợ công cụ tin học -5- Nguồn [7] Hình 1.1: Quá trình phát tri thức từ sở liệu 1.1.3.1 Xác định tốn Đây q trình mang tính định hình với mục đích xác định đƣợc lĩnh vực yêu cầu phát tri thức xây dựng toán tổng kết Trong thực tế sở liệu đƣợc chuyên hoá phân chia theo lĩnh vực khác nhƣ: Sản phẩm, kinh doanh, tài chính, v.v…Với tri thức phát đƣợc có giá trị lĩnh vực nhƣng lại không mang nhiều ý nghĩa với lĩnh vực khác Vì việc xác định lĩnh vực định nghĩa toán giúp định hƣớng cho giai đoạn thu thập tiền xử lý liệu 1.1.3.2 Thu thập tiền xử lý Các sở liệu thu đƣợc thƣờng chứa nhiều thuộc tính nhƣng lại khơng đầy đủ, khơng nhất, có nhiều lỗi giá trị đặc biệt Vì giai đoạn thu thập tiền xử lý liệu trở nên quan trọng trình phát tri thức từ sở liệu Có thể nói giai đoạn chiếm từ 70%-80% giá thành tồn tốn Ngƣời ta chia giai đoạn tiền xử lý liệu nhƣ: Gom liệu, chọn liệu, làm sạch, mã hố liệu, làm giàu, đánh giá trình diễn liệu -6- 1.1.3.3 Khai phá liệu rút tri thức Là trích mẫu mơ hình ẩn dƣới liệu, giai đoạn quan trọng bao gồm công đoạn nhƣ: chức năng, nhiệm vụ mục đích khai phá liệu, dùng phƣơng pháp khai phá nào? Thơng thƣờng tốn khai phá liệu bao gồm: Các tốn mang tính mơ tả – đƣa tính chất chung liệu, tốn dự báo – bao gồm việc phát suy diễn dựa liệu có 1.1.3.4 Phát biểu đánh giá kết Các tri thức phát từ sở liệu cần đƣợc tổng hợp dƣới dạng báo cáo phục vụ cho mục đích hỗ trợ định khác Do nhiều phƣơng pháp khai thác đƣợc áp dụng nên kết có mức độ tốt, xấu khác Việc đánh giá kết thu đƣợc cần thiết, tri thức phát từ sở liệu cần đƣợc tổng hợp dƣới dạng báo cáo phục vụ cho mục đích hỗ trợ định khác Do nhiều phƣơng pháp khai thác đƣợc áp dụng nên kết có mức độ tốt, xấu khác Việc đánh giá kết thu đƣợc cần thiết, giúp tạo sở cho định chiến lƣợc Thông thƣờng, chúng đƣợc tổng hợp, so sánh biểu đồ đƣợc kiểm nghiệm 1.1.3.5 Sử dụng tri thức phát Củng cố, tinh chế tri thức đƣợc phát Kết hợp tri thức thành hệ thống Giải xung đột tiềm tàng tri thức khai thác đƣợc Sau tri thức đƣợc chuẩn bị sẵn sàng cho ứng dụng Các kết trình phát tri thức đƣợc đƣa vào ứng dụng lĩnh vực khác Do kết dự báo mơ tả nên chúng đƣợc đƣa vào hệ thống hỗ trợ định nhằm tự động hoá trình [7] -7- 1.2 Các phƣơng pháp khai phá liệu 1.2.1 Phƣơng pháp quy nạp Một sở liệu kho thông tin nhƣng thơng tin quan trọng đƣợc suy diễn từ kho thơng tin Có hai kỹ thuật để thực việc suy diễn quy nạp  Phương pháp suy diễn: Nhằm rút thông tin kết logic thông tin sở liệu Phƣơng pháp suy diễn dựa kiện xác để suy tri thức từ thông tin cũ Mẫu chiết xuất đƣợc cách sử dụng phƣơng pháp thƣờng luật suy diễn  Phương pháp quy nạp: Phƣơng pháp quy nạp suy thông tin đƣợc sinh từ sở liệu Có nghĩa tự tìm kiếm, tạo mẫu sinh tri thức bắt đầu với tri thức biết trƣớc Các thông tin mà phƣơng pháp đem lại thông tin hay tri thức cấp cao diễn tả đối tƣợng sở liệu Phƣơng pháp liên quan đến việc tìm kiếm mẫu CSDL Trong khai phá liệu, quy nạp đƣợc sử dụng định tạo luật 1.2.2 Cây định luật Cây định: Cây định mô tả tri thức dạng đơn giản nhằm phân đối tƣợng liệu thành số lớp định Các nút đƣợc gán nhãn tên thuộc tính, cạnh đƣợc gán giá trị thuộc tính, mơ tả lớp khác Các đối tƣợng đƣợc phân lớp theo đƣờng cây, qua cạnh tƣơng ứng với giá trị, thuộc tính đối tƣợng tới Tạo luật: Các luật đƣợc tạo nhằm suy diễn số mẫu liệu có ý nghĩa mặt thống kê Các luật có dạng Nếu P Q, với P mệnh đề với phần CSDL, Q mệnh đề dự đoán Cây định luật có ƣu điểm hình thức mơ tả đơn giản, mơ hình suy diễn dễ hiểu ngƣời sử dụng Tuy nhiên, giới hạn mơ tả luật biểu diễn đƣợc số dạng chức giới hạn độ xác mơ hình -8- 1.2.3 Khai phá luật kết hợp 1.2.3.1 Giới thiệu Khai phá luật kết hợp [8]: Là tìm mẫu phổ biến, kết hợp, tƣơng quan, hay cấu trúc nhân tập đối tƣợng sở liệu giao tác, sở liệu quan hệ, kho thông tin khác 1.2.3.2 Các khái niệm - Gọi I = {I1, I2, , Im} tập m thuộc tính riêng biệt, thuộc tính gọi mục - Gọi D sở liệu chứa n giao dịch, ghi T giao dịch chứa tập mục, X  I T đƣợc gán nhãn với định danh - Ta nói rằng, giao dịch T  D hỗ trợ tập X  I chứa tất mục X - Một tập mục X đƣợc gọi tập mục k phần tử (k-itemset) lực lƣợng X k (tức |X|=k) Định nghĩa 1: Độ hỗ trợ X, ký hiệu support(X), tỷ lệ phần trăm giao dịch hỗ trợ X tổng giao dịch D, nghĩa là: Định nghĩa 2: Một luật kết hợp có dạng R: X => Y, X, Y tập mục, X, Y  I - X đƣợc gọi tiên đề - Y đƣợc gọi hệ luật Hai thông số quan trọng luật kết hợp độ hỗ trợ (support) độ tin cậy (confidence) Định nghĩa 3: Độ hỗ trợ (support) luật kết hợp X => Y tỷ lệ phần trăm số lƣợng giao dịch chứa X Y với tổng số giao dịch có sở liệu Đơn vị tính % -40- : điểm cắt trục tung; : Hệ số hồi quy; R: hệ số tƣơng quan; p: ý nghĩa thống kê; Ta viết phƣơng trình tuyến tính đơn sau: KQHT = 1.889 + 0.37 (Đ_HK1) KQHT = 1.537 + 0.413 (Đ_HK4) KQHT = 1.220 + 0.486 (Đ_HK3) KQHT = 1.652 + 0.367 (Đ_HK4) KQHT = 1.145 + 0.646 (Đ_HK5) KQHT = 2.851 - 0.086 (NO) KQHT = 2.426 + 0.204 (GT) KQHT = 2.278 + 0.361 (DT) KQHT = 2.150 + 0.232 (KTGĐ) Nhìn vào bảng phân tích đơn biến ta thấy hệ số tƣơng quan R Đ_HK5 cao (0.765) đến Đ_HK2 (0.682)> Đ_HK4 (0.577)> Đ_HK3 (0.560)> Đ_HK1 (0.502)> KTGĐ (0.274)> DT (0.179)> GT (0.124)> NO (0.052) Nhƣ điểm học kì yếu tố có ảnh hƣởng nhiều đến KQHT Trị số R2 tƣơng tự nhƣ Trong thống kê trị số R2 đƣợc diễn dịch nhƣ sau: Sự thay đổi Đ_HK5 giải thích đƣợc 58.6% thay đổi KQHT Sự thay đổi Đ_4 giải thích đƣợc 33.3% thay đổi KQHT Tƣơng tự Đ_HK3 giải thích đƣợc 31.4%, Đ_HK2 giải thích đƣợc 46.5%, Đ_HK1 giải thích đƣợc 25.2% thay đổi KQHT KTGĐ giải thích đƣợc 7.5%, GT giải thích đƣợc 12.4%, DT giải thích đƣợc 3.2% NO giải thích đƣợc 0.3% thay đổi KQHT 3.4.2 Phân tích hồi quy tuyến tính đa biến SPSS Mơ hình hồi quy tuyến tính đa biến [2] có dạng: y= + 1x1i+ 2x2i + 3x3i + + + kxki + i Với ví dụ ta viết phƣơng trình tuyến tính đa biến với yếu tố: (X1= Đ_HK1, X2= Đ_HK2, X3= Đ_HK3, X4= Đ_HK4, X5= Đ_HK5, X6= NO, X7=GT, X8=DT, X9=KTGĐ) nhƣ sau: KQHT = (NO)+ + (Đ_HK1)+ GT)+ DT)+ (Đ_HK4)+ KTGĐ) + Đ_HK3)+ (Đ_HK4)+ (Đ_HK5)+ -41- Trong phân tích hồi quy tuyến tính đa biến, ta cần biết mức độ ảnh hƣởng yếu tố lên biến kết cục y (KQHT ví dụ này) Muốn biết mức độ ảnh hƣởng cần lƣu ý đến trị số sau: a) Hệ số tƣơng quan R (coefficient of correlation): yếu tố có R lớn ảnh hƣởng nhiều b) Bình phƣơng R (R square): yếu tố có R2 lớn mối quan hệ yếu tố biến y chặt chẽ c) Hệ số hồi quy (regression coefficient): yếu tố có cao ảnh hƣởng nhiều hơn, nhiên yếu tố có đơn vị khác nên so sánh mức ảnh hƣởng yếu tố Nếu muốn so sánh phải đổi yếu tố có đơn vị độ lệch chuẩn, lúc ta có hệ số hồi quy chuẩn hóa: (Với Sx độ lệch chuẩn x tƣơng ứng Sy độ lệch chuẩn y) Dựa vào công thức trên, ta tính đƣợc hệ số hồi quy chuẩn d) Trị số p (p value) nhỏ mức ảnh hƣởng mạnh Ta đƣa tất biến vào lúc để phân tích đa biến Ta đƣợc bảng sau: -42- Ta đƣợc phƣơng trình hồi quy đa biến nhƣ sau: KQHT = 0.242 + 0.202 (Đ_HK1) + 0.180 (Đ_HK2) + 0.157 (Đ_HK3) + 0.229 (Đ_HK4) + 0.299 (Đ_HK5) – 0.144 (NO) – 0.128 (GT) + 0.187(DT) – 0.071(KTGĐ) Hệ số tƣơng quan chung R=0,953 tất yếu tố giải thích đƣợc gần 91% (R2=0,909) thay đổi KQHT Nhìn vào trị số p (cột cuối cùng-Sig.), điểm học kì có giá trị thống kê với p=0,000 Nhƣ phân tích biến riêng lẻ (phân tích đơn biến) điểm học kì có ý nghĩa thống kê Trong phân tích đa biến điểm học kì có ý nghĩa độc lập giải thích thay đổi KQHT Kết luận: Điểm học kì yếu tố độc lập có ý nghĩa dự đoán KQHT, yếu tố khác nhƣ nơi ở, giới tính, dân tộc, kinh tế gia đình ảnh hƣởng KQHT -43- CHƢƠNG IV BÀI TỐN VÀ CHƢƠNG TRÌNH ỨNG DỤNG PHÂN LỚP BAYES ĐỂ DỰ ĐOÁN KẾT QUẢ HỌC TẬP 4.1 Bài toán Bài toán dự đoán kết học tập sinh viên với liệu đầu vào điểm trung bình học kỳ, số thông tin cá nhân sinh viên nhƣ nơi ở, giới tính, kinh tế gia đình… với liệu đầu vào mơ hình đƣa kết dự đoán sinh viên đạt đƣợc suốt q trình đào tạo mơ hình phân tích yếu tố ảnh hƣởng đến kết học tập để học sinh có lộ trình phƣơng pháp học tốt 4.2 Xây dựng chƣơng trình dự đốn Dữ liệu vào để dự đoán đƣợc kết học tập sở liệu lấy từ học kỳ trƣớc, gồm thông tin điểm môn học, nơi ở, dân tộc, kinh tế gia đình Chƣơng trình hồn thiện giúp sinh viên dự đốn đƣợc kết cuối tồn khóa học Chƣơng trình gồm phần: Phần 1: Thu thập thơng tin cần thiết sinh viên (bao gồm: Điểm học kì (Đ_HK1), Điểm học kì (Đ_HK2), Điểm học kì (Đ_HK3), Điểm học kì (Đ_HK4), Điểm học kì (Đ_HK5), nơi (NO), giới tính (GT), dân tộc (DT), kinh tế gia đình (KTGĐ) Phần 2: Thực dự đoán kết học tập, gồm bƣớc sau:  Bước 1: Kiểm tra thơng tin đầu vào trùng huấn luyện cho kết dự đốn  Bước 2: Nếu thơng tin đầu vào không trùng huấn luyện mẫu dùng thuật toán Naive Bayes để dự đoán a Dữ liệu Input/ Output toán dự đoán kết học tập Input: Giá trị biến ngơn ngữ (Điểm học kì 1, Điểm học kì 2, Điểm học kì 3, Điểm học kì 4, Điểm học kì 5, Nơi ở, giới tính, dân tộc, kinh tế gia đình) Output: Mức độ kết học tập (giỏi (G), (K), trung bình (TBK), trung bình (TB), yếu (y)) -44- b Cơ sở liệu toán  Xác định liệu đầu vào: yếu tố ảnh hƣởng đến kết học tập sinh viên gồm: - Điểm đầu vào học kỳ (Điểm học kì 1, Điểm học kì 2, Điểm học kì 3, Điểm học kì 4, Điểm học kì 5,…) gồm lớp: Giỏi, Khá, Trung bình khá, Trung bình Và thơng tin cá nhân: - Nơi gồm lớp: Sinh viên thành phố (TP), Sinh viên tỉnh - Giới tính gồm lớp: nam, nữ - Dân tộcgồm lớp: kinh, khác - Kinh tế gia đình gồm lớp: cao, khá, trung bình, thấp  Xác định liệu đầu ra: - Kết học tập sinh viên dự đốn là: Giỏi, Khá, Trung bình khá, Trung bình, Yếu  Các biến ngơn ngữ lƣợng hóa: Điểm đầu vào: DiemTB>=8.0: lớp Giỏi (G) DiemTB>=6.5 DiemTB=5.0 DiemTB=3.5 DiemTB

Ngày đăng: 27/11/2014, 14:20

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan