ỨNG DỤNG KHAI PHÁ dữ LIỆU TRONG VIỆC PHÂN TÍCH, ĐÁNH GIÁ kết QUẢ học tập của học SINH TRƯỜNG TRUNG cấp NGHIỆP vụ và CÔNG NGHỆ hải PHÒNG

77 687 4
ỨNG DỤNG KHAI PHÁ dữ LIỆU TRONG VIỆC PHÂN TÍCH, ĐÁNH GIÁ kết QUẢ học tập của học SINH TRƯỜNG TRUNG cấp NGHIỆP vụ và CÔNG NGHỆ hải PHÒNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KS TRẦN ĐỨC QUỲNH ỨNG DỤNG KHAI PHÁ DỮ LIỆU TRONG VIỆC PHÂN TÍCH, ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH TRƯỜNG TRUNG CẤP NGHIỆP VỤ & CƠNG NGHỆ HẢI PHỊNG LUẬN VĂN THẠC SĨ KỸ THUẬT HẢI PHÒNG – 2015 BỘ GIAO THÔNG VẬN TẢI BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KS TRẦN ĐỨC QUỲNH ỨNG DỤNG KHAI PHÁ DỮ LIỆU TRONG VIỆC PHÂN TÍCH, ĐÁNH GIÁ KẾT QUẢ HỌC TẬP CỦA HỌC SINH TRƯỜNG TRUNG CẤP NGHIỆP VỤ & CÔNG NGHỆ HẢI PHỊNG LUẬN VĂN THẠC SĨ KỸ THUẬT NGÀNH: CƠNG NGHỆ THÔNG TIN; MÃ SỐ: 60480201 CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN Người hướng dẫn: TS Trần Thị Hương HẢI PHÒNG – 2015 LỜI CẢM ƠN Luận văn hoàn thành, trước hết em xin chân thành cảm ơn TS Trần Thị Hương, hướng dẫn em việc chuẩn bị kiến thức tổng quan phương pháp nghiên cứu đề tài ứng dụng khai phá liệu khám phá tri thức Đồng thời em gửi lời cám ơn đến thày cô bạn khóa học, trao đổi, chia sẻ thông tin kiến thức liên quan để em có điều kiện nghiên cứu hồn thành đề tài khoa học Đối với em, kiến thức mang tính chất vừa tổng quan vừa sâu rộng, nhiều hạn chế trình độ hiểu biết lực thân, tài liệu tham khảo thời gian có hạn, cố gắng làm việc, nghiên cứu tích cực đề tài em khơng thể tránh sai sót cịn có vấn đề chưa hồn thiện Kính mong góp ý dẫn tận tình thầy cơ, bạn để đề tài em hoàn thiện Em xin trân trọng cảm ơn.LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu riêng Các kết nêu luận văn trung thực chưa công bố cơng trình khác Tơi xin cam đoan thơng tin trích dẫn luận văn rõ nguồn gốc Ngày tháng năm 2015 TÁC GIẢ MỤC LỤC Chữ viết tắt CSDL KPDL KDD Giải thích Cơ sở liệu Khai phá liệu (Datamining) - Knowledge discovery and Datamining (Kỹ thuật phát PCDL ĐTB; TB SPMN CBMA tri thức khai phá liệu ) Phân cấp liệu Điểm trung bình; Trung bình Ngành Sư phạm mầm non Ngành Chế biến ăn DANH MỤC CÁC HÌNH Số hình 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 1.11 1.12 1.13 1.14 1.15 1.16a,b 1.17 1.18 Tên hình Quá trình khám phá tri thức Các lĩnh vực liên quan đến khám phá tri thức CSDL Trực quan hóa kết KPDL Oracle Mối quan hệ hệ thống CSDL hệ thống khai KPDL Ví dụ phân cụm liệu Ví dụ phân cụm đối tượng dựa khoảng cách Ví dụ phân cụm ngơi nhà dựa kích cỡ Các chiến lược phân cụm phân cấp Ví dụ phân cụm theo mật độ (1) Ví dụ phân cụm theo mật độ (2) Cấu trúc phân cụm dựa lưới Ví dụ phân cụm dựa mơ hình Các cách mà cụm đưa Các thiết lập để xác định ranh giới cụm ban đầu Tính tốn trọng tâm cụm Tâm cụm có phần tử ngoại lai, khơng có phần tử ngoại lại Các bước AGNES Ví dụ bước thuật tốn AGNES 1.19 1.20 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 Các bước DIANA Hình dạng cụm khám phá thuật toán DBSCAN Mơ hình mạng LAN hể thống quản lý CSDL Mơ hình hệ thống tự động quản lý CSDL Sơ đồ use case đặc tả chức hệ thống Sơ đồ luồng liệu mức khung cảnh Sơ đồ liệu mức đỉnh Sơ đồ minh họa cập nhật thông tin học sinh Sơ đồ minh họa cập nhật thông tin lớp Sơ đồ minh họa cập nhật thông tin môn học Sơ đồ minh họa cập nhật thông tin điểm học tập Sơ đồ Class Diagram Các table sử dụng chương trình Sơ đồ use case đặc tả 30 32 45 46 47 49 49 51 51 51 52 53 55 3.1 3.2 3.3 chức hệ thống Các bước thực thuật toán k-mean Giao diện chương trình Màn hình khởi động chương trình 58 62 62 Trang 12 13 14 15 16 18 19 20 20 21 23 24 25 26 28 29 MỞ ĐẦU Lí chọn đề tài Sau trình học tập nghiên cứu, thân em lĩnh hội kiến thức bổ ích, với dạy dỗ bảo tận tình Thày bạn khóa học, em có định hướng việc tìm hiểu ứng dụng kiến thức Kỹ thuật phát tri thức khai phá liệu (KDD - Knowledge discovery and Datamining) Ngày nay, lượng liệu ngày tăng lên khiến cho bị ngập khối liệu khổng lồ đó, liệu thực có giá trị lại nằm khối liệu Do vậy, khai phá liệu (Data mining) đời để giúp ta chọn lọc thơng tin có giá trị từ khối liệu thô khổng lồ ta nhận Vậy khai phá liệu hiểu đơn giản trình chọn lọc hay khai phá tri thức từ khối liệu lớn Khai phá liệu cần sử dụng kiến thức từ nhiều ngành nhiều lĩnh vực khác thống kê, trí tuệ nhân tạo, CSDL, tính tốn song song,…Đặc biệt, gần gũi với lĩnh vực thống kê, sử dụng phương pháp thống kê để mơ hình hóa liệu phát mẫu Tổng quan khai phá liệu dùng để: Cung cấp tri thức, hỗ trợ định dựa số liệu dựa thống kê Dự báo tình hình số liệu xử lý thuật toán Khái quát liệu dạng mơ hình, sơ đồ luồng, sơ đồ thực thể… Ngồi ra, ứng dụng khai phá liệu vơ đa dạng, dùng trong: Bảo hiểm, tài thị trường chứng khốn: phân tích tình hình tài cơng ty dựa báo cáo tài chính; dựa vào liệu thị trường chứng khoán để dự đoán giá cổ phiếu; phát gian lận… Thống kê, phân tích liệu hỗ trợ định Trong Y học: dựa vào mối liên hệ triệu chứng để chẩn đoán bệnh hướng điều trị Mạng viễn thơng: phân tích gọi điện thoại để dự đoán hành vi người dùng nhằm nâng cao chất lượng dịch vụ Bán hàng: phân tích mặt hàng để dự đốn nhu cầu người dùng để đưa hướng phát triển cho nhà sản xuất… Ngoài ra, khai thác liệu ứng dụng vào nhiều lĩnh vực khác đời sống giúp đưa giải pháp hiệu cho vấn đề nan giải đời sống Trong thuật tốn k-mean lựa chọn phù hợp với mục tiêu nghiên cứu Phân cụm đặc biệt hiệu ta thông tin cụm, ta quan tâm tới thuộc tính cụm mà ta chưa biết biết thơng tin Phân cụm coi công cụ độc lập để xem xét phân bố liệu, làm bước tiền xử lý cho thuật toán khác Phân cụm liệu kỹ thuật để khai thác liệu có hiệu Phân cụm liệu ứng dụng nhiều lĩnh vực khác như: kinh tế, bảo hiểm, quy hoạch đô thị, nghiên cứu địa chất… Theo nghiên cứu cho thấy chưa có phương pháp phân cụm tổng quát giải trọn vẹn cho tất dạng cấu trúc cụm liệu Hơn nữa, phương pháp phân cụm cần có cách thức biểu diễn cấu trúc cụm liệu, với cách thức biểu diễn khác có tương ứng thuật tốn phân cụm phù hợp Vì phân cụm liệu vấn đề khó mở, phải giải nhiều vấn đề cách trọn vẹn phù hợp với nhiều dạng liệu khác nhau, đặc biệt liệu hỗn hợp ngày tăng hệ quản trị liệu thách thức lớn lĩnh vực khai phá liệu Lĩnh vực giáo dục ngành có khối lượng liệu lớn, cần phân tích để đưa chiến lược phát triển phù hợp thực chưa khai thác có hiệu Hiện tại, thân làm việc ban tuyển sinh thuộc phòng đào tạo trường, nên nhận thấy việc phân tích, đánh giá kết học tập học sinh cần thiết, để từ đề xuất biện pháp nhằm nâng cao chất lượng giáo dục 10 - Dbo.BANGDIEM (MaHS, MaMon, DiemCuoiky, Ghichu…) Dbo.CHUYENLOP (TuLop, DenLop, Ngaychuyen) Dbo.GIAOVIEN (MaGV) Dbo.HOCSINH (MaHS, TenHS, GioiTinh…) lưu trữ lí lịch học sinh Dbo.LOAINGUOIDUNG (MaloaiND, TenloaiND) Dbo.LOP (MaLop, TenLop, Makhoilop, MaNH, Siso… ) lưu trữ Danh sách - lớp Dbo.MONHOC(STT, MaMon, TenMonHoc )lưu trữ môn học trường Dbo.NAMHOC (MaNH, TenNH) Dbo.NGUOIDUNG (MaND, MaloaiND, TenDN, Matkhau, Trang thai) Dbo.PHANLOP (STT, MaHS, MaLOP) Dbo.QUYDINH (KHOA) MaHS MaMonHoc DTBM DTB MaHS TenHocSinh Email … TenLop DenLop NgayChuyen DTB STT MaHocSinh MaLop Khoa MaGiaoVien MaNamHoc TenMonHoc MaLop TenLop MaND MaLoaiND …… …… …… MaNamhoc MaLoaiND Hình 2.11 Các table sử dụng chương trình 63 Tổng kết chương Nội dung trình bày gồm: - Tổng quan sở cần nghiên cứu - Thực trạng việc phân tích đánh giá kết học tập học sinh - Khảo sát hệ thống thực tế Với hệ thống thực tế quản lý liệu cách chồng chéo vậy, việc ứng dụng khai phá liệu nhằm chắt lọc thơng tin có ích việc làm cần thiết Cụ thể phân cụm liệu ứng dụng vào phân tích đánh giá kết học tập học sinh chắn cải thiện đáng kể 64 CHƯƠNG XÂY DỰNG HỆ THỐNG THỬ NGHIỆM 3.1 Giải pháp xây dựng hệ thống Tiến hành phân tích thiết kế trình bày phần trước Sử dụng ngơn ngữ lập trình CShap 2013; Cơ sở liệu hệ thống sử dụng lưu trữ SQL Server 2008 Hệ thống với quy trình khai phá liệu ứng dụng thuật toán dùng khai phá liệu thuật toán K-Mean để thực xử lý Khai phá liệu (Data mining) xu hướng nghiên cứu phổ biến lĩnh vực học máy công nghệ tri thức Trong thực tế, có nhiều thành tựu nghiên cứu Data mining áp dụng hiệu Một hướng quan trọng Data mining phân cụm liệu (Data Clustering) Phân cụm liệu trình tìm kiếm để phân cụm liệu, mẫu liệu từ tập sở liệu lớn Phân cụm liệu phương pháp học khơng giám sát, học quan sát Phân cụm liệu sử dụng bước tiền xử lý cho thuật toán khai phá liệu khác phân loại mô tả đặc điểm, với tác dụng phát cụm Tóm lại, phân cụm liệu q trình chia tập liệu ban đầu thành cụm liệu cho đối tượng cụm tương tự (Similar) đối tượng cụm khác không tượng tự (Dissimilar) Số cụm liệu phân xác định trước theo kinh nghiệm tự động xác định Thuật toán áp dụng luận văn k-mean, thuật tốn với độ phức tạp tính tốn O(tkn) tức mức trung bình, t số lần lặp, k số cụm, n số đối tượng tập liệu vào Do phù hợp với tốn phân cụm liệu 65 + Mơ tả thuật toán k-mean: - Input: * Tập đối tượng X={x i = 1, 2, …, N}, x i ∈ Rd * Số cụm: K - Output: * Các cụm Ci (i = ÷ K) tách rời hàm tiêu chuẩn E đạt giá trị tối thiểu Thuật toán hoạt động tập vectơ d chiều, tập liệu X gồm N phần tử : X = {xi i = 1,2,…, N} * K-mean lặp lại nhiều lần trình: - Gán liệu - Cập nhật lại vị trí trọng tâm * Q trình lặp dừng lại trọng tâm hội tụ đối tượng phận cụm + Khái quát thuật toán - Hàm đo độ tương tự sử dụng khoảng cách Euclidean (1.8) Trong cj trọng tâm cụm - Hàm khơng âm, giảm có thay đổi hai bước: gán liệu định lại vị trí tâm + Các bước thuật toán k-mean Bước Khởi tạo Chọn K trọng tâm {C i} (i = ÷ K) Bước Tính tốn khoảng cách S i(t ) = { x j : x j − ci(t ) ≤ x j − ci(*t ) Bước Cập nhật lại trọng tâm 66 for all i* = 1, … k } (1.9) Ci( t +1) = S i( t ) x ∑x j (t ) j ∈S i (1.10) Bước Điều kiện dừng Lặp lại bước khơng có thay đổi trọng tâm cụm * Sơ đồ mô tả bước thuật toán: Bắt đầu Số cụm K Kết thúc Trọng tâm + Khoảng cách đối tượng đến trọng tâm Khơng có đối tượng chuyển nhóm Nhóm đối tượng vào cụm Hình 3.1 Các bước thực thuật toán k-mean 67 Xác định toán Dữ liệu vào (Input): Dữ liệu thu thập từ ĐTB, điểm tổng kết cuối học kì, cuối năm học học sinh Dữ liệu (Output): Các cụm học sinh phân nhóm theo kết ĐTB hay số môn, phân cụm theo ĐTB học kỳ, ĐTB năm Dựa vào kết phân cụm người quản lí có định hướng cho việc dạy học giáo viên học sinh, đánh giá lực học tập nhóm học sinh dựa CSDL đưa vào Áp dụng thuật tốn k-mean có ưu điểm đơn giản, dễ hiểu dễ cài đặt Được sử dụng phổ biến kỹ thuật phân cụm Tư tưởng thuật tốn k-mMeans tìm cách phân nhóm đối tượng (objects) cho vào K cụm (K số cụm xác định trước, K nguyên dương) cho tổng bình phương khoảng cách đối tượng đến tâm nhóm (centroid) nhỏ Tuy nhiên, số hạn chế k-mean hiệu thuật tốn phụ thuộc vào việc chọn số nhóm K (phải xác định trước) chi phí cho thực vịng lặp tính tốn khoảng cách lớn số cụm K liệu phân cụm lớn Ứng dụng thuật toán vào phân cụm đánh giá kết học tập, với thuộc tính sau: (Họ tên, Ngành học, Số cụm, Lớp, Mơn học, Điểm trung bình) Tiến hành hành phân cụm thao tác xử lý thuật toán để có kết Ví dụ: Ta có CSDL 32 phần tử (học sinh) Số cụm chọn k = Mỗi phần tử (học sinh) mô tả thuộc tính Họ tên, Ngành học, Số cụm, Lớp, Mơn học, Điểm trung bình Dữ liệu cho kết phân cụm đối tượng (Lớp thuộc ngành có kết học tập cao, Lớp thuộc ngành có kết học tập cao, thấp, trung bình) 68 - Chọn ngành, ví dụ ngành SPMN, số cụm k = - Chọn môn học Thực phân cụm đánh giá kết học sinh cách chọn chức “Thực phân tích – đánh giá” Kết hiển thị theo mục: + Kết phân cụm theo số phần tử tương ứng tỷ lệ + Kết tương ứng cụm + Giá trị điểm trung bình + Thống kê theo lớp Cụm (Tâm cụm; Số phần tử; Tỷ lệ) với thông tin sau: Họ tên Ng Ngọc Thu Ng Thanh Trúc Ng Ngọc Hân Phạm Thị Dịu …… Lớp Môn học Điểm TB SPMNA1 SPMNA1 SPMNA2 SPMNA2 …… Kỹ GT Pháp luật Tiếng Anh Tiếng Anh …… ……… Thống kê theo lớp, giá trị điểm TB tương ứng cụm Lớp SPMNA1 Điểm TB Số HS 13 TB lớn TB nhỏ Tương tự với cụm Sau có số liệu thống kế cụ thể, tiến hành thu thập số liệu đưa dự báo Ví dụ: Dự báo kết số liệu cụ thể STT Số phần tử Điểm TB Dự báo 40.62 Min -> max -> kết Thấp Tỷ lệ % Cụm (học sinh) 13 Cụm 18.75 -> Trung bình Cụm 13 40.62 -> Cao Từ đó: Truy vấn đến trường khác như: Giáo viên giảng dạy lớp, Ngành học, Môn học, Lớp học, Học sinh ….để bổ sung vào cơng tác đánh gía chất lượng đào tạo Nhà trường 69 3.2 Yêu cầu cài đặt thuật toán Trước hết ta phải cài SQL server 2008 Tạo CSDL convert liệu có sẵn từ phần mềm ứng dụng quản lý điểm học sinh Cài đặt Visual Studio 2013 Ultimate Kết nối CSDL SQL server 2008 Ngoài ý việc lưu (Restone), phục hồi liệu (Back up) cần thiết Lựa chọn thuật toán thuật toán phân cụm liệu tìm hiểu chương thuật tốn k-means có tốc độ tương đối nhanh, thích hợp với liệu số khơng có phần tử nhiễu Dữ liệu điểm học sinh trường học đáp ứng tốt yêu cầu thuật toán k-means (dữ liệu số, điểm số khoảng từ 0-10, phẫn tử nhiễu) Vì vậy, đề tài ứng dụng chọn thuật toán k-means để áp dụng cho toán 3.3 Giao diện chương trình Hình 3.2 Giao diện chương trình 70 Màn hình khởi động: Hình 3.3 Màn hình khởi động chương trình Phân cụm liệu: thực việc phân cụm liệu Nhằm đưa chiến lược phát triển phù hợp, đồng thời cung cấp chất lượng giáo dục tốt hỗ trợ hoạt động quản lí chưa thực quan tâm mức khai thác có hiệu + Các chức chương trình Gồm chức chính: • Phân cụm theo điểm trung bình năm • Phân cụm theo điểm trung bình mơn học Trong cho phép chọn lại: Khối lớp cần phân tích số cụm cần phân tích •Trong phần Phân cụm theo điểm trung bình mơn học cho phép chọn mơn nhiều mơn • Hai mơn hai nhóm mơn lúc 3.4 Kết luận hướng phát triển Phân cụm liệu việc phân tích, đánh giá kết học tập học sinh dựa điểm trung bình mơn học, điểm trung bình học kỳ … bước đầu nhiều giúp cho Ban giám hiệu nhà trường, nhà quản lý giáo dục có nhìn nhiều chiều, đa dạng nhiều góc cạnh điểm số học sinh từ thu 71 số kết : việc phân lớp, lựa chọn học sinh giỏi để bồi dưỡng, phát học sinh yếu để phụ đạo … đề kế họach giảng dạy, tăng tăng tiết, định hướng việc làm cho học sinh v.v… Trong trình tìm hiểu hoàn thành luận văn tốt nghiệp với đề tài “Ứng dụng khai phá liệu việc phân tích, đánh giá kết học tập học sinh trường Trung cấp nghiệp vụ cơng nghệ Hải Phịng”, dù đạt số kết định kiến thức, thực tế (chương trình phân tích, đánh giá kết học tập học sinh qua phân cụm liệu sử dụng khối trường Trung cấp chuyên nghiệp địa bàn), thân nhận thấy phân cụm khai phá liệu lĩnh vực nghiên cứu rộng lớn đầy triển vọng bao hàm nhiều phương pháp kỹ thuật, xu hướng nghiên cứu, tiếp cận khác Đề tài cố gắng tập trung tìm hiểu, nghiên cứu, trình bày số kỹ thuật thuật toán phân cụm liệu phổ biến, dựa phương pháp có, cài đặt thử nghiệm thuật tốn k-means vào chương trình Chuẩn bị phát triển thành toán cấp độ cao với sở liệu lớn hơn, bao quát hơn, nhiều chọn lựa phân cụm dựa trên: loại mơ hình trường trung cấp chuyên nghiệp vùng miền khác nhau, trường nằm địa bàn theo đơn vị hành tỉnh, thành phố,… Tiếp tục tìm hiểu nghiên cứu tiếp phương pháp, cách tiếp cận phân cụm liệu chọn lựa thuật toán tối ưu để giải toán đưa 3.4.1 Các kết đạt luận văn Phân cụm liệu việc phân tích, đánh giá kết học tập học sinh dựa điểm trung bình mơn học, điểm trung bình học kỳ… bước đầu giúp cho Ban giám hiệu nhà trường, nhà quản lý giáo dục có nhìn nhiều chiều hơn, đa dạng hơn, nhiều góc cạnh điểm số học sinh từ thu số kết như: việc phân lớp, lựa chọn học sinh giỏi để bồi dưỡng, phát học sinh yếu để phụ đạo đề kế hoạch giảng dạy… Một số kết đạt luận văn: 72 - Giới thiệu khái quát toán phân cụm hệ thống - Trình bày số thuật tốn, thuật tốn K-Mean với tính phân cụm Đã phân tích nội dung kiến thức bản, tảng phát triển thuật toán - Xây dựng phần mềm thử nghiệm phân cụm đánh giá kết học tập Trên sở điểm trung bình mơn học, điểm trung bình học kỳ, năm học sinh, lớp, khối gom cụm liệu nhằm phân tích điểm số để đưa nhìn đa dạng hơn, đa chiều hơn, nhiều góc độ khác điểm số giúp cho Ban giám hiệu, hệ thống quản lý giáo dục có thêm sở để đánh giá đắn nhất, xác tình hình học tập học sinh, hoạt động giảng dạy giáo viên từ đề định hướng, hoạch định cho nhà trường việc nâng cao chất lượng giáo dục đáp ứng yêu cầu Đề tài cố gắng tập trung tìm hiểu, nghiên cứu, trình bày số kỹ thuật thuật toán phân cụm liệu phổ biến, dựa phương pháp có, cài đặt thử nghiệm thuật tốn k-means vào chương trình + Phân cụm liệu điểm phần mềm WEKA (Thuật toán khai thác liệu Java) Các học sinh có học lực tập trung cụm cụm Các học sinh có học lực trung bình tập trung cụm 1, cụm cụm Số học sinh có học lực trung bình chiếm tỷ lệ tương đối cao (khoảng 60%), từ cho thấy Nhà trường cần có biện pháp thúc đẩy việc dạy học để đạt kết cao Phần mềm WEKA việc đưa trọng tâm cụm, thống kê số lượng tỷ lệ phần tử cụm cung cấp cơng cụ đưa hình ảnh trực quan cụm liệu Phân cụm liệu điểm phần mềm SPSS: Số học sinh có học lực khoảng gần 100 em tập trung cụm 3, cụm (khoảng 35%) Kết phân cụm SPSS tương đương với kết phân 73 cụm WEKA + Đánh giá kết thử nghiệm: Các chương trình WEKA, SPSS thường đưa trọng tâm cụm thống kê số phần tử tỷ lệ cụm Kết chưa hỗ trợ tốt cho việc phân tích đánh giá kết học tập học sinh SPSS khơng có số liệu cụ thể đối tượng thống kê,… Với chương trình ứng dụng em xây dựng phần hỗ trợ tốt đưa thông tin cụm, danh sách học sinh tương ứng cụm, giá trị trung bình lớn nhất, nhỏ 3.4.2 Kiến nghị hướng phát triển Qua thấy việc phân tích, đánh giá kết học tập học sinh đòi hỏi phải có đầu tư, nghiên cứu, tìm tịi… nhằm đưa phân tích, đánh giá đắn nhất, xác kết học tập học sinh từ đề định hướng, hoạch định cho nhà trường việc bồi dưỡng chuyên môn nghiệp vụ cho đội ngũ giáo viên kiến thức cho học sinh KẾT LUẬN VÀ KIẾN NGHỊ Phân cụm liệu việc phân tích, đánh giá kết học tập học sinh dựa điểm trung bình mơn học, điểm trung bình học kỳ… bước đầu giúp cho Ban giám hiệu nhà trường, nhà quản lý giáo dục có nhìn nhiều chiều hơn, đa dạng hơn, nhiều góc cạnh điểm số học sinh từ thu số kết như: việc phân lớp, lựa chọn học sinh giỏi để bồi dưỡng, phát học sinh yếu để phụ đạo,… đề kế hoạch giảng dạy phù hợp Đề tài cố gắng tập trung tìm hiểu, nghiên cứu, trình bày số kỹ thuật thuật toán phân cụm liệu phổ biến, dựa phương pháp có, cài đặt thử nghiệm thuật tốn k-means vào chương trình Trong trình tìm hiểu hoàn thành luận văn với đề tài “Ứng dụng khai phá liệu việc phân tích đánh giá kết học tập học sinh trường Trường trung cấp nghiệp vụ cơng nghệ Hải Phịng” dù đạt số kết 74 định kiến thức, thực tế (chương trình Phân tích, đánh giá kết học tập học sinh qua phân cụm liệu), song thân nhận thấy phân cụm khai phá liệu lĩnh vực nghiên cứu rộng lớn, nhiều triển vọng bao hàm nhiều phương pháp, kỹ thuật, nhiều hướng nghiên cứu, tiếp cận khác Với mà luận văn thực đạt được, hướng phát triển sau luận văn sau: - Về thực tiễn: phát triển thành toán cấp độ sở với số liệu lớn hơn, bao quát hơn, nhiều lựa chọn phân cụm dựa trên: loại hình giáo dục khác ngồi cơng lập, trường vùng miền khác nhau, … - Về lý thuyết: tiếp tục nghiên cứu tiếp phương pháp, cách tiếp cận phân cụm liệu như: phân cụm thống kê, phân cụm khái niệm, phân cụm mờ, phân cụm mạng KOHONEN … tìm kiếm, so sánh chọn lựa thuật toán tối ưu để giải đưa Mặc dù cố gắng tập trung nghiên cứu tham khảo nhiều tài liệu, báo, tạp chí khoa học ngồi nước, trình độ lực cịn có nhiều hạn chế nên khơng thể tránh khỏi thiếu sót, em mong bảo đóng góp nhiều Quý thầy cô nhà khoa học… 75 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Hoàng Anh Tú Giáo trình “Khai thác liệu ứng dụng” 2009 (Đại học KHTN Tp Hồ Chí Minh) [2] An Hồng Sơn Luận văn thạc sĩ “Nghiên cứu số phương pháp phân cụm mờ ứng dụng” 2008 (Đại học Thái Nguyên) [3] Vũ Lan Phương “Nghiên cứu cài đặt số giải thuật phân cụm phân lớp” 2006 (Đại học Bách Khoa hà Nội) Tiếng Anh [4] Andrew Moore: “K-mean and Hierarchical Clustering – Tutorial Slides” Nov 2001 http://www-2.cs.cmu.edu/~awm/tutorials/kmeans.html 76 [5] Dr Osmar R.Zaiane “Principples of knowledge discovery in databases” Fall 2001 (University of Alberta) [6] Patrick André Pantel “Clustering by Committee” Thesis Doctor of Philosophy, Spring 2003 (University of Alberta), 15 – 25p [7] http://home.dei.polimi.it/matteucc/Clustering/tutorial_html/index.html 77 ... Khai phá liệu việc phân tích, đánh giá kết học tập học sinh trường Trung cấp nghiệp vụ cơng nghệ Hải Phịng” Mục đích việc đánh giá kết học tập học sinh giúp “thúc đẩy học sinh rèn luyện, học tập. .. thống quản lý sở liệu việc phân tích đánh giá kết học tập học sinh trường Trung cấp nghiệp vụ cơng nghệ Hải Phịng 2.1.1 Cơ sở liệu giáo viên học sinh sinh viên Công việc quản lý liệu giáo viên học. .. đánh giá kết học tập học sinh trường Trung cấp nghiệp vụ cơng nghệ Hải Phịng Việc phân tích, đánh giá kết học tập khâu quan trọng công tác quản lý chất lượng dạy học nhà trường, với việc phân tích,

Ngày đăng: 16/04/2016, 13:50

Từ khóa liên quan

Mục lục

  • LỜI CẢM ƠN

  • Em xin trân trọng cảm ơn.LỜI CAM ĐOAN

  • MỤC LỤC

  • DANH MỤC CÁC HÌNH

  • MỞ ĐẦU

  • CHƯƠNG 1. TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU VÀ KỸ THUẬT PHÂN CỤM DỮ LIỆU TRONG KHAI PHÁ DỮ LIỆU DATAMINING

    • 1.1. Khai phá dữ liệu và phát hiện tri thức

      • 1.1.1. Khai phá dữ liệu

      • 1.1.2. Quá trình khám phá tri thức

      • 1.1.3. Khai phá dữ liệu và ứng dụng

      • 1.1.4. Các kỹ thuật áp dụng trong khai phá dữ liệu

      • 1.1.5. Những chức năng chính của khai phá dữ liệu

      • 1.1.6. Ứng dụng của khai phá dữ liệu

      • Hình 1.4. Mối quan hệ giữa hệ thống CSDL và hệ thống khai phá dữ liệu

        • 1.2. Một số kỹ thuật phân cụm dữ liệu

          • 1.2.1. Khái niệm và mục tiêu của phân cụm dữ liệu

            • 1.2.1.1. Phân cụm dữ liệu là gì?

            • 1.2.1.2. Các mục tiêu của phân cụm dữ liệu

            • 1.3. Những kỹ thuật phân cụm dữ liệu

              • 1.3.1. Phương pháp phân cụm phân hoạch (Partitioning Methods)

              • 1.3.2. Phương pháp phân cụm phân cấp (Hierarchical Methods)

              • 1.3.3. Phương pháp phân cụm dựa trên mật độ (Density-Based Methods)

              • 1.3.4. Phương pháp phân cụm dựa trên lưới (Grid-Based Methods)

              • 1.3.5. Phương pháp phân cụm dựa trên mô hình (Model-Based Clustering Methods)

                • 1.3.6. Phương pháp phân cụm có dữ liệu ràng buộc (Binding data Clustering Methods)

                • 1.4. Một số thuật toán phân cụm dữ liệu

                  • 1.4.1. Các thuật toán phân cụm phân hoạch

                    • 1.4.1.1. Thuật toán k-mean

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan