Huấn luyện mạng nơron RBF với mốc cách đều và ứng dụng

48 290 0
Huấn luyện mạng nơron RBF với mốc cách đều và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Mạng nơron nhân tạo được biết đến như một giải pháp tốt cho vấn đề này. Ban đầu, khái niệm “Nơron nhân tạo” được biết đến lần đầu vào khoảng đầu thế kỷ 20 trong nỗ lực của con người nhằm chế tạo ra các bộ máy có khả năng suy nghĩ và học hỏi như loài người bằng việc mô phỏng mạng nơron sinh học trong bộ não của chúng ta. Trải qua nhiều năm phát triển và nghiên cứu, cơ sở lý thuyết và thực nghiệm về mạng nơron nhân tạo đã có nhiều bước tiến đáng kể. Trong khoảng 30 năm trở lại đây, với việc có thêm khả năng tính toán mạnh mẽ từ máy vi tính mà mạng nơron nhân tạo được coi là một trong những công cụ có thể giải quyết tốt bài toán nội suy hàm nhiều biến và trong thực tế hiện nay, mạng nơron nhân tạo đã được ứng dụng rất nhiều trong các ứng dụng nội suy hàm nhiều biến như phân lớp, nhận dạng mẫu…. Mạng nơron nhân tạo có nhiều loại, trong đó có mạng nơron RBF sau này được gọi tắt là mạng RBF được coi là một trong những loại nơron nhân tạo tốt nhất để giải quyết bài toán nội suy hàm nhiều biến. Mạng RBF đã được chú trọng nghiên cứu và đã có khá nhiều thuật toán huấn luyện mạng RBF được áp dụng nhiều trong các ứng dụng cho thấy kết quả rất khả quan.

MỤC LỤC Chương 3: Ứng dụng thuật toán lặp pha huấn luyện mạng RBF vào việc giải toán nội suy xấp xỉ với liệu nhiễu trắng CHƯƠNG BÀI TOÁN NỘI SUY, XẤP XỈ HÀM SỐ MẠNG NƠRON RBF 10 Nội dung chương bao gồm: 10 1.1BÀI TOÁN NỘI SUY XẤP XỈ HÀM SỐ 10 1.1.1Bài toán nội suy 10 1.1.1.1 Nội suy hàm biến 10 Hình 1: Minh họa toán nội suy hàm biến 10 1.1.1.2 Bài toán nội suy hàm nhiều biến .11 1.1.2Bài toán xấp xỉ 11 1.1.3Các phương pháp giải toán nội suy xấp xỉ hàm số 12 Bài toán nội suy hàm biến nghiên cứu nhiều từ kỷ 18 Ban đầu giải phương pháp sử dụng đa thức nội suy: đa thức Lagrange, đa thức Chebysept nhiên số mốc nội suy lớn nội suy đa thức thường xãy tượng phù hợp trội (over-fitting) bậc đa thức thường tăng theo số mốc nội suy Để giải tượng phù hợp trội, thay tìm đa thức nội suy người ta tìm đa thức xấp xỉ, thường giải phương pháp xấp xỉ bình phương tối thiểu Gauss Một phương pháp khác đề xuất vào đầu kỷ 20 phương pháp nội suy Spline Trong hàm nội suy xác định nhờ ghép trơn hàm nội suy dạng đơn giản (thường dùng đa thức bậc thấp) đoạn Phương pháp hay áp dụng nhiều kỹ thuật 12 Tuy nhiên, trình bày trên, ứng dụng mạnh mẽ nội suy hàm nhiều biến thực tế ngày đòi hỏi phải giải toán nội suy hàm nhiều biến Cùng với phát triển mạnh mẽ ngành Công Nghệ Thông Tin, toán nội suy xấp xỉ hàm nhiều biến quan tâm có nghiên cứu đột phá khoảng 30 năm trở lại đây, với cách tiếp cận chủ yếu như: 12 Học dựa mẫu: Thuật ngữ T.Mitchell dùng để phương pháp k-láng giêngf agần nhất, phương pháp hồi quy trọng số địa phương 12 Mạng nơron MLP .12 Mạng nơron RBF .12 Để hiểu rõ hơn, xin xem thêm [3] 12 1.2MẠNG NƠRON NHÂN TẠO .12 1) Hàm ngưỡng 15 .15 .15 Hình 4: Đồ thị hàm ngưỡng 15 2) Hàm tuyến tính .15 .15 .15 Hình 5: Đồ thị hàm tuyến tính 15 3) Hàm sigmoid 15 .15 .15 Hình 6: Đồ thị hàm sigmoid 15 4) Hàm tank 16 .16 .16 Hình 7: Đồ thị hàm tank 16 5) Hàm bán kính (Gauss) 16 .16 .16 Hình 8: Đồ thị hàm Gauss 16 1.3MẠNG NƠRON RBF 17 Hình 10: Minh họa ảnh hưởng hàm bán kính .18 Hình 11: Kiến trúc mạng RBF 19 CHƯƠNG 2: 20 THUẬT TOÁN LẶP HDH HUẤN LUYỆN MẠNG RBF 20 Nội dung chương bao gồm: 20 CHƯƠNG 3: 26 ỨNG DỤNG THUẬT TOÁN LẶP MỘT PHA HUẤN LUYỆN MẠNG RBF VÀO VIỆC GIẢI QUYẾT BÀI TOÁN NỘI SUY XẤP XỈ VỚI DỮ LIỆU NHIỄU TRẮNG .26 Nội dung chương bao gồm: 26 CHƯƠNG XÂY DỰNG PHẦN MỀM MÔ PHỎNG 32 Nội dung chương bao gồm: 32 Lập trình sinh nhiễu trắng theo phân phối chuẩn .32 Lập trình giải toán hồi quy tuyến tính kNN 32 Tổng quan phần mềm .32 Các mô tả lập trình chương nêu phương án lập trình để giải toán nhỏ đề cập trên, cụ thể cách sinh nhiễu trắng theo phân phối chuẩn lập trình giải toán hồi quy tuyến tính kNN 32 4.1LẬP TRÌNH SINH NHIỄU TRẮNG THEO PHÂN PHỔI CHUẨN 32 Để xây dựng phân phối chuẩn từ hàm phân phối rand() C++, dựa theo phương pháp Box Muller (xem chi tiết [9]) trình bày : 32 4.1.1Phương pháp Box-Muller .32 4.1.2Sinh nhiễu trắng từ hàm rand() C++ 33 Như vậy, với việc dùng hàm rand() C++ tạo dãy phân phối đều, ta tính dãy phân phối chuẩn N(0,1), phần tử dãy nhân với tham số phương sai trừ khoảng sai số trung bình tổng chúng với kỳ vọng, ta dãy số thể nhiễu trắng với kỳ vọng phương sai theo thiệt lập ban đầu 33 4.2LẬP TRÌNH GIẢI HỆ PHƯƠNG TRÌNH CỦA BÀI TOÁN HỒI QUY TUYẾN TÍNH KNN 33 4.3GIỚI THIỆU PHẦN MỀM XẤP XỈ NỘI SUY VỚI DỮ LIỆU NHIỄU 34 4.3.1Tổng quan phần mềm .34 4.3.2Tổ chức liệu .34 Các mốc nội suy Error: Reference source not found thể dạng mảng số thực Các giá trị Error: Reference source not found, khóa luận xét trường hợp đầu chiều, nên cho dạng số thực 34 4.3.3Giao diện chức 36 Mặc dù Demo, phần mềm thiết kế để tiện cho việc nghiên cứu lẫn ứng dụng thực tế Phần mềm có chức 36 Nhập liệu (có nhiễu trắng) theo cách 36 Thủ công 36 Nhập từ file input 36 Xuất liệu mô tả mạng nơron RBF huấn luyện file output 36 Đưa sai số huấn luyện giao diện 36 Giao diện chương trình gồm Tab : Tab ‘Nhập theo file’ Tab ‘Tự nhập’; Tab thể cách nhập liệu Người dùng tùy theo việc muốn nhập liệu theo kiểu mà chọn Tab Sau xin giới thiệu giao diện chức phần mềm theo Tab .36 4.3.3.1 Tab “Nhập liệu theo file” 36 Để nhập liệu theo file, ta chọn Tab ‘Nhập theo file’, có giao diện 36 36 4.3.3.2 Tab “Tự nhập” .38 Để nhập liệu theo cách thủ công, ta chọn Tab ‘Tự nhập’, giao diện 38 38 CHƯƠNG 6: 47 BẢNG DANH MỤC CÁC HÌNH MINH HỌA Chương 3: Ứng dụng thuật toán lặp pha huấn luyện mạng RBF vào việc giải toán nội suy xấp xỉ với liệu nhiễu trắng CHƯƠNG BÀI TOÁN NỘI SUY, XẤP XỈ HÀM SỐ MẠNG NƠRON RBF 10 Nội dung chương bao gồm: 10 1.1BÀI TOÁN NỘI SUY XẤP XỈ HÀM SỐ 10 1.1.1Bài toán nội suy 10 1.1.1.1 Nội suy hàm biến 10 Hình 1: Minh họa toán nội suy hàm biến 10 1.1.1.2 Bài toán nội suy hàm nhiều biến .11 1.1.2Bài toán xấp xỉ 11 1.1.3Các phương pháp giải toán nội suy xấp xỉ hàm số 12 Bài toán nội suy hàm biến nghiên cứu nhiều từ kỷ 18 Ban đầu giải phương pháp sử dụng đa thức nội suy: đa thức Lagrange, đa thức Chebysept nhiên số mốc nội suy lớn nội suy đa thức thường xãy tượng phù hợp trội (over-fitting) bậc đa thức thường tăng theo số mốc nội suy Để giải tượng phù hợp trội, thay tìm đa thức nội suy người ta tìm đa thức xấp xỉ, thường giải phương pháp xấp xỉ bình phương tối thiểu Gauss Một phương pháp khác đề xuất vào đầu kỷ 20 phương pháp nội suy Spline Trong hàm nội suy xác định nhờ ghép trơn hàm nội suy dạng đơn giản (thường dùng đa thức bậc thấp) đoạn Phương pháp hay áp dụng nhiều kỹ thuật 12 Tuy nhiên, trình bày trên, ứng dụng mạnh mẽ nội suy hàm nhiều biến thực tế ngày đòi hỏi phải giải toán nội suy hàm nhiều biến Cùng với phát triển mạnh mẽ ngành Công Nghệ Thông Tin, toán nội suy xấp xỉ hàm nhiều biến quan tâm có nghiên cứu đột phá khoảng 30 năm trở lại đây, với cách tiếp cận chủ yếu như: 12 Học dựa mẫu: Thuật ngữ T.Mitchell dùng để phương pháp k-láng giêngf agần nhất, phương pháp hồi quy trọng số địa phương 12 Mạng nơron MLP .12 Mạng nơron RBF .12 Để hiểu rõ hơn, xin xem thêm [3] 12 1.2MẠNG NƠRON NHÂN TẠO .12 1) Hàm ngưỡng 15 .15 .15 Hình 4: Đồ thị hàm ngưỡng 15 2) Hàm tuyến tính .15 .15 .15 Hình 5: Đồ thị hàm tuyến tính 15 3) Hàm sigmoid 15 .15 .15 Hình 6: Đồ thị hàm sigmoid 15 4) Hàm tank 16 .16 .16 Hình 7: Đồ thị hàm tank 16 5) Hàm bán kính (Gauss) 16 .16 .16 Hình 8: Đồ thị hàm Gauss 16 1.3MẠNG NƠRON RBF 17 Hình 10: Minh họa ảnh hưởng hàm bán kính .18 Hình 11: Kiến trúc mạng RBF 19 CHƯƠNG 2: 20 THUẬT TOÁN LẶP HDH HUẤN LUYỆN MẠNG RBF 20 Nội dung chương bao gồm: 20 CHƯƠNG 3: 26 ỨNG DỤNG THUẬT TOÁN LẶP MỘT PHA HUẤN LUYỆN MẠNG RBF VÀO VIỆC GIẢI QUYẾT BÀI TOÁN NỘI SUY XẤP XỈ VỚI DỮ LIỆU NHIỄU TRẮNG .26 Nội dung chương bao gồm: 26 CHƯƠNG XÂY DỰNG PHẦN MỀM MÔ PHỎNG 32 Nội dung chương bao gồm: 32 Lập trình sinh nhiễu trắng theo phân phối chuẩn .32 Lập trình giải toán hồi quy tuyến tính kNN 32 Tổng quan phần mềm .32 Các mô tả lập trình chương nêu phương án lập trình để giải toán nhỏ đề cập trên, cụ thể cách sinh nhiễu trắng theo phân phối chuẩn lập trình giải toán hồi quy tuyến tính kNN 32 4.1LẬP TRÌNH SINH NHIỄU TRẮNG THEO PHÂN PHỔI CHUẨN 32 Để xây dựng phân phối chuẩn từ hàm phân phối rand() C++, dựa theo phương pháp Box Muller (xem chi tiết [9]) trình bày : 32 4.1.1Phương pháp Box-Muller .32 4.1.2Sinh nhiễu trắng từ hàm rand() C++ 33 Như vậy, với việc dùng hàm rand() C++ tạo dãy phân phối đều, ta tính dãy phân phối chuẩn N(0,1), phần tử dãy nhân với tham số phương sai trừ khoảng sai số trung bình tổng chúng với kỳ vọng, ta dãy số thể nhiễu trắng với kỳ vọng phương sai theo thiệt lập ban đầu 33 4.2LẬP TRÌNH GIẢI HỆ PHƯƠNG TRÌNH CỦA BÀI TOÁN HỒI QUY TUYẾN TÍNH KNN 33 4.3GIỚI THIỆU PHẦN MỀM XẤP XỈ NỘI SUY VỚI DỮ LIỆU NHIỄU 34 4.3.1Tổng quan phần mềm .34 4.3.2Tổ chức liệu .34 Các mốc nội suy Error: Reference source not found thể dạng mảng số thực Các giá trị Error: Reference source not found, khóa luận xét trường hợp đầu chiều, nên cho dạng số thực 34 4.3.3Giao diện chức 36 Mặc dù Demo, phần mềm thiết kế để tiện cho việc nghiên cứu lẫn ứng dụng thực tế Phần mềm có chức 36 Nhập liệu (có nhiễu trắng) theo cách 36 Thủ công 36 Nhập từ file input 36 Xuất liệu mô tả mạng nơron RBF huấn luyện file output 36 Đưa sai số huấn luyện giao diện 36 Giao diện chương trình gồm Tab : Tab ‘Nhập theo file’ Tab ‘Tự nhập’; Tab thể cách nhập liệu Người dùng tùy theo việc muốn nhập liệu theo kiểu mà chọn Tab Sau xin giới thiệu giao diện chức phần mềm theo Tab .36 4.3.3.1 Tab “Nhập liệu theo file” 36 Để nhập liệu theo file, ta chọn Tab ‘Nhập theo file’, có giao diện 36 36 4.3.3.2 Tab “Tự nhập” .38 Để nhập liệu theo cách thủ công, ta chọn Tab ‘Tự nhập’, giao diện 38 38 CHƯƠNG 6: 47 MỞ ĐẦU Nội suy xấp xỉ hàm số toán quen thuộc quan trọng lĩnh vực khoa học đời sống từ xưa đến Trường hợp hàm số biến nhà toán học Lagrange nghiên cứu giải tốt việc dùng hàm nội suy đa thức từ kỷ 18 Trường hợp hàm nhiều biến khó khăn xử lý toán học tính ứng dụng trước chưa nhiều nên công cụ giải toán hàm nhiều biến hạn chế Ngày nay, với phát triển mạnh mẽ máy vi tính mà toán nội suy xấp xỉ hàm nhiền biến trở thành vấn đề thời tính ứng dụng lớn để giải vấn đề thực tiễn phân lớp, nhận dạng mẫu Mạng nơron nhân tạo biết đến giải pháp tốt cho vấn đề Ban đầu, khái niệm “Nơron nhân tạo” biết đến lần đầu vào khoảng đầu kỷ 20 nỗ lực người nhằm chế tạo máy có khả suy nghĩ học hỏi loài người việc mô mạng nơron sinh học não Trải qua nhiều năm phát triển nghiên cứu, sở lý thuyết thực nghiệm mạng nơron nhân tạo có nhiều bước tiến đáng kể Trong khoảng 30 năm trở lại đây, với việc có thêm khả tính toán mạnh mẽ từ máy vi tính mà mạng nơron nhân tạo coi công cụ giải tốt toán nội suy hàm nhiều biến thực tế nay, mạng nơron nhân tạo ứng dụng nhiều ứng dụng nội suy hàm nhiều biến phân lớp, nhận dạng mẫu… Mạng nơron nhân tạo có nhiều loại, có mạng nơron RBF - sau gọi tắt mạng RBF - coi loại nơron nhân tạo tốt để giải toán nội suy hàm nhiều biến Mạng RBF trọng nghiên cứu có nhiều thuật toán huấn luyện mạng RBF áp dụng nhiều ứng dụng cho thấy kết khả quan Cùng với nhu cầu huấn luyện mạng RBF nghiên cứu thực Hoàng Xuân Huấn cộng (xem [1]) để xây dựng thuật toán huấn luyện nhanh mạng RBF cho đời thuật toán lặp đặt tên là thuật toán HDH Kết thực nghiệm cho thấy thuật toán lặp HDH gồm có hai pha, nội suy hàm nhiều biến cho sai số tốc độ tính toán tốt so với thuật toán hành khác Đặc biệt huấn luyện liệu cách thuật toán cần dùng pha giảm tiếp phần lớn thời gian tính toán (xem [2]) Ngoài ứng dụng thực tế với toán nội suy người ta lên vấn đề quan trọng khác, các yếu tố khách quan, bất khả kháng mà nảy sinh sai số kết đo mốc nội suy Việc tiến hành xây dựng hệ thống nội suy xấp xỉ dựa liệu sai lệch làm cho hiệu bị thấp Đây toán đặt từ lâu thu hút nhiều nghiên cứu, cải tiến tận Nhiều nghiên cứu tiến hành để vừa nội suy xấp xỉ tốt vừa khử nhiễu, phương pháp biết đến phương pháp hồi quy tuyến tính k hàng xóm gần nhất, (từ xin gọi tắt phương pháp kNN) việc xây dựng hàm tuyến tính bậc để cực tiểu hóa sai số k điểm gần so với điểm cần tìm giá trị nội suy Nhược điểm phương pháp tính giá trị hồi quy điểm định trước, với điểm cần tính toán lại phải hồi quy lại từ đầu, xây dựng nên hệ thống cho phép đưa kết nội suy hàm số điểm tùy ý Với toán nội suy xấp xỉ liệu nhiễu này, Hoàng Xuấn Huấn nảy ý tưởng ứng dụng thuật toán lặp HDH pha để giải quyết, cụ thể miền giá trị mốc nội suy ban đầu, ta xây dựng nên mốc nội suy cách (từ xin gọi lưới nội suy cho gọn), sau dùng phương pháp hồi quy tuyến tính kNN để tính giá trị nút lưới nội suy mới, cuối dùng thuật toán lặp HDH pha để huấn luyện mạng nơron RBF liệu cách này, ta mạng nơron RBF vừa khử nhiễu vừa nội suy xấp xỉ tốt Phương pháp kết hợp ưu điểm khử nhiễu phương pháp kNN với ưu điểm tốc độ tính tổng quát thuật toán lặp HDH pha đồng thời loại bỏ tính bất tiện phương pháp kNN nêu hạn chế thuật toán HDH pha liệu đầu vào phải có mốc nội suy cách Từ ý tưởng ban đầu đến thực tế, với vô số câu hỏi cần lời đáp, chia lưới cách đủ? Nếu thưa sai số có lớn không? Nếu dày liệu thời gian huấn luyện có đạt yêu cầu không? Các yếu tố ảnh hưởng đến hiệu huấn luyện để từ điều chỉnh làm tăng chất lượng mạng?… đề tài thú vị để tìm hiểu Dưới giúp đỡ, bảo tận tình thầy Hoàng Xuân Huấn, tiến hành thực khóa luận tốt nghiệp, nội dung nghiên cứu thực nghiệm để cụ thể hóa kiểm chứng hiệu phương pháp này, lấy tên đề tài là: “Huấn luyện mạng nơron RBF với mốc cách ứng dụng” Nội dung khóa luận sâu nghiên cứu vấn đề sau: - Khảo cứu mạng nơron RBF - Khảo cứu nghiên cứu thuật toán lặp HDH pha với liệu cách - Tìm hiểu nhiễu trắng phân phối chuẩn cách xây dựng - Khảo cứu phương pháp hồi quy tuyến tính kNN Xây dựng phần mềm mô hệ thống nội suy hàm nhiều biến với liệu có nhiễu dựa việc kết hợp phương pháp kNN thuật toán lặp HDH pha Thông qua lý thuyết lẫn thực nghiệm, nghiên cứu đặc điểm, cải tiến hiệu phương pháp này, ưu điểm so với phương pháp khác Để trình bày nội dung nghiên cứu cách logic, nội dung khóa luận chia làm phần chương chính: - Chương 1: Bài toán nội suy xấp xỉ hàm số mạng nơron RBF: Chương cung cấp nhìn tổng thể khái niệm xuyên suốt khóa luận, bao gồm: toán nội suy xấp xỉ hàm nhiều biến, mạng RBF - Chương 2: Thuật toán lặp HDH huấn luyện mạng nơron RBF Chương mô tả phương pháp huấn luyện mạng RBF thuật toán HDH hai pha với liệu ngẫu nhiên đặc biệt thuật toán HDH pha với liệu cách làm tảng cho phương pháp Chương 3: Ứng dụng thuật toán lặp pha huấn luyện mạng RBF vào việc giải toán nội suy xấp xỉ với liệu nhiễu trắng Chương khảo cứu nhiễu trắng phương pháp hồi quy tuyến tính kNN Từ trình bày ý tưởng để áp dụng thuật toán HDH pha liệu không cách có nhiễu cách thay liệu đầu vào ban đầu liệu với mốc nội suy cách kết đo khử nhiễu thông qua phương pháp kNN Nó với chương thực nghiệm hai chương trọng tâm khóa luận - Chương 4: Xây dựng phần mềm mô Chương trình bày phương pháp giải toán nhỏ sinh nhiễu trắng theo phân phối chuẩn, hồi quy tuyến tính kNN để đưa phương hướng lập trình cho chúng Đồng thời trình bày tổng quan giao diện, chức phần mềm - Chương 5: Kết thí nghiệm Chương trình bày trình kết nghiên cứu thực nghiệm, bao gồm việc xây dựng phần mềm mô phỏng, nghiên cứu tính tổng quát với hàm, liệu với Rút kết luận đặc điểm, cách chọn lưới liệu, chọn k … để hoàn thiện phương pháp Đồng thời so sánh sai số phương pháp với sai số phương pháp khác công bố tạp chí khoa học quốc tế có uy tín - Chương 6: Tổng kết phương hướng phát triển đề tài Chương tổng kết lại làm khóa luận phương hướng phát triển cho đề tài CHƯƠNG BÀI TOÁN NỘI SUY, XẤP XỈ HÀM SỐ MẠNG NƠRON RBF Nội dung chương bao gồm: • • • • Phát biểu toán nội suy xấp xỉ hàm số Mạng Nơron nhân tạo Mạng Nơron RBF Bài toán nội suy xấp xỉ với liệu có nhiễu trắng 1.1 BÀI TOÁN NỘI SUY XẤP XỈ HÀM SỐ 1.1.1 Bài toán nội suy 1.1.1.1 Nội suy hàm biến Bài toán nội suy hàm biến tổng quát đặt sau: Một hàm số y=f(x) ta chưa xác định mà biết điểm x0 = a < x1 < x2 < … < xn-1 < xn = b với giá trị yi= f(xi) Ta cần tìm biểu thức giải tích ϕ (x) để xác định gần giá trị y ≈ ϕ ( x ) điểm Error: Reference source not found hàm f(x) cho điểm xi hàm số trùng với giá trị yi biết Về phương diện hình học, ta cần tìm hàm ϕ (x) có dạng biết cho đồ thị qua điểm(xi,yi) với i=0,1, ,n f(x) (x) f(x0) x0 xn x1 Hình 1: Minh họa toán nội suy hàm biến Trong ứng dụng thực tế hàm f(x) thường hàm thực nghiệm khó tính N nên giá trị yi lấy cách đo điểm cố định x i Các điểm { xi } i =0 gọi mốc nội suy 10 Error: Reference source not found (4) Để giải hệ này, ta đưa chúng dạng phép nhân ma trận Đặt P ma trận vecto x (n+1) : Error: Reference source not found Z ma trận Error: Reference source not found ; coi Error: Reference source not found = Error: Reference source not found 1Error: Reference source not found Y ma trận Error: Reference source not found Khi này, (3) (4) tương đương với : Error: Reference source not found (Z.P-Y) = Error: Reference source not found Tương đương với ZT.Z.P = ZT.Y Đặt A=ZT.Z ; B = ZT.Y ta có : A.P=B Đây hệ phương trình tuyến tính với P ma trận vecto cần tìm, A ma trận vuông, ta việc dùng phương pháp Crammer để giải : Error: Reference source not found = Error: Reference source not found Với Ai ma trận A với cột thứ i thay ma trận vecto B 4.3 GIỚI THIỆU PHẦN MỀM XẤP XỈ NỘI SUY VỚI DỮ LIỆU NHIỄU 4.3.1 Tổng quan phần mềm Đây phần mềm xây dựng huấn luyện mạng nơron RBF nội suy xấp xỉ hàm nhiều biến từ liệu nhiễu Tôi chọn lập trình ngôn ngữ C++, IDE Visual C++ 2010 Release Candidate, Framework.NET Sản phẩm dịch dạng Windows Form, chạy hệ điều hành Windows với điều kiện cài đặt Microsoft.NET Framework version 2.0 Redistributable Package, tên file dotnetfx.exe, dung lượng 22MB ; tải miễn phí địa chỉ: http://www.microsoft.com/downloads/details.aspx?FamilyID=0856eacb-43624b0d-8edd-aab15c5e04f5&displaylang=en 4.3.2 Tổ chức liệu Các mốc nội suy Error: Reference source not found thể dạng mảng số thực Các giá trị Error: Reference source not found, khóa luận xét trường hợp đầu chiều, nên cho dạng số thực Tôi lập trình theo cách hướng đối tượng, đối tượng quan trọng viết thành lớp đặt file header để dễ dàng chỉnh sửa trao đổi với người quan tâm, gồm:  Class mangnoron (mô mạng nơron RBF)  Class bosinhphanphoichuan (mô máy sinh phân phổi chuẩn Gauss) 34  Class hambk (mô hàm bán kính, class dùng class mangnoron)  Class matran (mô ma trận, dùng cho việc tính định thức)  Class maytinh (mô hàm số từ xâu nhập vào) Phương pháp kNN-HDH thuật toán cấu thành nên HDH-1 kNN viết dạng phương thức class mangnoron Để giảm bớt yêu cầu nhớ chương trình, số bước có tính đệ quy hay phải khai báo biến nhiều lần đơn giản hóa, ví dụ việc tính chuẩn Mahalanobis thuật toán HDH-1 Thay khởi tạo ma trận A tính Error: Reference source not found ta việc tính Error: Reference source not found 35 4.3.3 Giao diện chức Mặc dù Demo, phần mềm thiết kế để tiện cho việc nghiên cứu lẫn ứng dụng thực tế Phần mềm có chức • Nhập liệu (có nhiễu trắng) theo cách o Thủ công o Nhập từ file input • Xuất liệu mô tả mạng nơron RBF huấn luyện file output • Đưa sai số huấn luyện giao diện Giao diện chương trình gồm Tab : Tab ‘Nhập theo file’ Tab ‘Tự nhập’; Tab thể cách nhập liệu Người dùng tùy theo việc muốn nhập liệu theo kiểu mà chọn Tab Sau xin giới thiệu giao diện chức phần mềm theo Tab 4.3.3.1 Tab “Nhập liệu theo file” Để nhập liệu theo file, ta chọn Tab ‘Nhập theo file’, có giao diện Hình 16 Giao diện nhập liệu theo file Giao diện đơn giản, TextBox,Combo Box để nhập tham số huấn luyện thuât toán kNN-HDH hình trên, phần nhập liệu gồm có button, button để chọn file input, output ghi nhãn, button “Start” để bắt đầu việc huấn luyện File input file txt gồm số thực xếp theo quy ước : • Dòng n – số chiều mốc nội suy 36 • Dòng thứ hai m – số mốc nội suy • Dòng thứ i+2, (Error: Reference source not found) có (n+1) số thực tương ứng với số Error: Reference source not found (tại dòng thứ i+2) để thể mốc nội suy n chiều giá trị đo mốc File output file txt bao gồm liệu mô tả mạng RBF sau huấn luyện, xếp sau: • Dòng thứ Error: Reference source not found • Các dòng tiếp theo, dòng dùng để mô tả hàm bán kính Cụ thể với Error: Reference source not found o Dòng 3*k+2 gồm n số thực tương ứng với số Error: Reference source not found với Error: Reference source not found tâm hàm bán kính thứ k o Dòng 3*k+3 tham số độ rộng hàm bán kính thứ k o Dòng 3*k+4 hệ số Error: Reference source not found Mỗi nhấn button ‘Start’, phần mềm lấy liệu từ file input làm liệu huấn luyện huấn luyện mạng nơron RBF theo liệu này, sau truyền liệu số mô tả mạng RBF file output 37 4.3.3.2 Tab “Tự nhập” Để nhập liệu theo cách thủ công, ta chọn Tab ‘Tự nhập’, giao diện Hình 17 Giao diện nhập liệu thủ công Vì số lượng mốc nội suy lớn, Tab thay nhập mốc, người dùng chọn miền giá trị cho mốc nội suy (Nếu muốn nhập chi tiết mốc nội suy, người dùng chọn cách nhập theo file trình bày trên) Cụ thể người dùng chọn số chiều n Vỡi n chọn label “chiều 1”, “chiều 2” … dần n tăng ẩn bớt n giảm Cùng với textbox để người dùng nhập giá trị max chiều ẩn theo, người dùng tạo miền giá trị cho mốc nội suy cách Chương trình tạo mốc nội suy ngẫu nhiên nằm miền Số mốc tạo ngẫu nhiên mặc định 100, người dùng tự nhập vào TextBox “số mốc ngẫu nhiên” Sau có mốc nội suy rồi, giá trị đo mốc nội suy giá trị hàm số cần nội suy xấp xỉ (nhập TextBox “biểu thức”) cộng với sai số sinh từ dãy phân phối chuẩn (có kỳ vọng mặc định =0 nhiễu trắng) phương sai điền TextBox “phương sai” (mặc định 0,25) Sau xây dựng xong liệu huấn luyện, phần mềm huấn luyện mạng RBF theo thuât toán kNN-HDH với tham số người dùng điền vào giao diện Button “Chọn file output” dùng người dùng muốn xuất liệu mô tả mạng RBF sau huấn luyện file Thứ tự liệu xuất file giống mô tả nêu 38 4.3.2.1 Vì giao diện làm với mục đích giúp người dùng dễ dàng kiểm chứng kết thực nghiệm, nên sau huấn luyện mạng RBF xong, sai số trung bình mốc huấn luyện lấy trung bình cộng tổng bình phương kết đưa TextBox “TB cộng bình phương sai số” Ngoài ra, checkBox Heuristic người dùng tích vào muốn áp dụng heuristic “ăn gian” thí nghiệm CHƯƠNG 5: KẾT QUẢ THÍ NGHIỆM Nội dung chương bao gồm: • Thí nghiệm thay đổi kích thước lưới • Thí nghiệm việc chọn k • Thí nghiệm tăng số chiều • So sánh hiệu với thuật toán khác Để làm bật đặc điểm phương pháp này, thiết lập module để thực heuristic, tạm gọi “ăn gian” để giả thiết phương pháp kNN hoàn hảo, vừa hồi quy vừa khử nhiễu với sai số 5.1 THÍ NGHIỆM VỀ VIỆC THAY ĐỔI KÍCH THƯỚC LƯỚI Vì mạng RBF huấn luyện liệu ngẫu nhiên ban đầu 39 mà lưới liệu cách thiết lập sau hồi quy từ liệu ban đầu, thuật toán HDH-1 có tốc độ tính toán nhanh tồn nghi ngờ sai số huấn luyện lớn, dựa vào tính chất thuật toán HDH-1 pha trình bày cuối chương lưới liệu dày xấp xỉ tốt dẫn đến quan ngại phương pháp ta phải thiết lập lưới liệu dày đặc cho sai số chấp nhận Thí nghiệm cho kết bất ngờ kích thước hợp lý lưới liệu Hàm số dùng làm thí nghiệm hàm Các hàm lấy từ thí nghiệm [10] để tiện so sánh phần sau Dữ liệu ban đầu gồm có mốc nội suy phân bố ngẫu nhiên miền giá trị đầu vào D: Error: Reference source not found; ta thử trường hợp số mốc nội suy m=100 m=200 Kết đo mốc giá trị hàm số thực cộng với sai số (nhiễu trắng) Dãy sai số phân bố theo phân phối chuẩn có phương sai 0.25 Bảng so sánh sai số phương pháp khởi tạo lưới liệu kích cỡ khác nhau, trường hợp dùng không dùng heuristic Kích thước lưới liệu lần tăng tăng gấp đôi chiều, số mốc cách lưới tạo sau nhiều gấp lần số mốc cách lưới tạo trước Hình 18 Sai số chọn kích cỡ khác lưới liệu cho liệu 100 mốc ngẫu nhiên, không áp dụng heuristic “ăn gian” 40 Hình 19 Sai số chọn kích cỡ khác lưới liệu cho liệu 200 mốc ngẫu nhiên, không áp dụng heuristic “ăn gian” Hình 20 Sai số áp dụng kích cỡ khác lưới liệu cho liệu ngẫu nhiên 100 mốc, có heuristic “ăn gian” 41 Hình 21 Sai số chọn kích cỡ khác lưới liệu cho liệu 200 mốc ngẫu nhiên, có áp dụng heuristic “ăn gian” Ta thấy dù lần thiết lập số nút lưới tăng gấp lần so với lần thiêt lập trước, sai số tổng quát không giảm nhiều Thử với số hàm số khác, ta thấy tượng mật độ lưới liệu thưa cho sai số lớn, nhiên cho mật độ dày đặc lên hiệu lớn khoảng định, lưới liệu dày đặc đến mức đó, tiếp tục làm dày đặc sai số không giảm so với gia tăng số mốc cách cần huấn luyện Đặc biệt, sai số đặt mật độ nút lưới mức thứ (10 x 10 với m=100) hay (14 x 14 với m=200) tốt nhiều đặt mức thứ nhất, không tồi với mức kế tiếp, độ dày đặc tăng lên lần mức Chú ý số nút lưới lưới xấp xỉ với m mốc nội suy liệu ban đầu Nhận xét: Thí nghiệm cho thấy lưới liệu cần khởi tạo dày đặc lo ngại ban đầu Thực nghiệm cho thấy cần số nút lưới liệu xấp xỉ số mốc nội suy ban đầu cho hiệu huấn luyện nói chung hợp lý Tùy thuộc vào ứng dụng cụ thể mà tùy chỉnh kích thước lưới liệu, ví dụ tăng kích thước để làm giảm sai số, thời gian huấn luyện nằm khoảng cho phép, đặc điểm huấn luyện nhanh phương pháp Ta thấy rõ khác làm thí nghiệm việc áp dụng không áp dụng heuristic, điều cho thấy tầm ảnh hướng lớn bước hồi quy kNN 5.2 THÍ NGHIỆM VỀ VIỆC CHỌN K 42 Trong phương pháp này, việc chọn k hồi quy tuyến tính kNN cho tốt coi quan trọng Vì phương pháp kNN không hồi quy mà làm nhiệm vụ khử nhiễu Nếu hồi quy không tốt tạo lưới liệu mà giá trị nút lưới khác xa so với giá trị thực khử nhiễu từ làm cho việc nội suy xấp xỉ nhiều Việc chọn k phương pháp kNN toán mở, người ta đưa khuyến nghị nên chọn k lớn số chiều n Thí nghiệm đưa vài kết luận thú vị việc chọn k Tại thí nghiệm này, ta xét hàm số Dễ thấy hàm tỷ lệ với nhau, nội dung thí nghiệm xét cách chọn k dựa vào độ lớn miền giá trị hàm Tham số m chọn 200, theo kết thí nghiệm 5.1, ta chọn lưới liệu có kích thước 14 x 14, xét trường hợp k=4,6,8,10,12,14,16 Kết lần thử nghiệm so sánh kèm với kết kích hoạt heuristic “ăn gian” Hình 22 Bảng so sánh sai số phương pháp kNN-HDH áp dụng cho hàm y1 với cách chọn k khác 43 Hình 23 Bảng so sánh sai số phương pháp kNN-HDH áp dụng cho hàm y2 với cách chọn k khác Tại đây, ta thầy hàm y2 đạt giá trị tốt với k=6 tăng dần k sai số tồi nhiều Trong hàm y1 tăng k tốt Điều giải thích sau: Sai số chênh lệch thi thử với k khác với k khác hiệu phương pháp kNN khác Ta thấy dùng heuristic sai số không đổi Đặc điểm phương pháp hồi quy kNN k lớn hiệu khử nhiễu tốt, đồng thời, phải hồi quy nút xa hiệu hồi quy bị Ngược lại k nhỏ hiệu hồi quy tốt (trừ trường hợp k nhỏ không đủ để hồi quy sai số tăng vọt thấy biểu đồ), nhiên giảm k khả khử nhiễu trắng lại phải nội suy với mốc không trung hòa nhiễu trắng Nhận xét: Giá trị k tốt phải cân hiệu hồi quy hiệu khử nhiễu, tùy theo toán cụ thể để chọn k lớn hay k nhỏ Xét ví dụ trên, ta thấy miền giá trị y1 nhỏ y2 nhiễu có ảnh hưởng lớn đến kết hồi quy, công việc khử nhiễu phải đặt ưu tiên so với toán với hàm y2, k lớn tốt Biểu đồ cho thấy k lớn tốt xét đến k=30, đặt nặng nhiệm vụ khử nhiễu so với hồi quy sai số lại tăng lên 0,03 44 Ngược lại, toán với hàm y2 tỷ lệ miền giá trị với nhiễu trắng lớn so với toán hàm y ưu tiên khử nhiễu không đặt nặng toán với hàm y1, chọn k nhỏ so với trường hợp với hàm y cho hiệu tốt 5.3 THÍ NGHIỆM KHI TĂNG SỐ CHIỀU Một phần quan trọng phương pháp hồi quy kNN, vừa có vai trò hồi quy mốc để thuật toán lặp pha HDH dựa vào để huấn luyện, vừa có vai trò khử nhiễu, hồi quy kNN tốt sai số giảm nhiều, mức độ tốt mà ta mong đợi hồi quy xác hàm số cần nội suy xấp xỉ nút lưới (Tức heuristic thành thực) Xét số chiều vecto đầu vào, ta thấy: Do tính chất phương pháp kNN Việc chọn k thường khuyến nghị nên chọn k>n, sau thỏa mãn điều kiện k>n, “k hợp lý” nên đủ thấp để hồi quy cho sai số nhỏ Vì vậy, số chiều n tăng, “k hợp lý” tăng theo Mặt khác, k tăng việc khử nhiễu lại tốt Vì vậy, với dải nhiễu, số chiều tăng việc khử nhiễu tốt, qua nâng cao tính hiệu phương pháp kNN-HDH Trong trình thí nghiệm đây, thử với hàm số nhiều biến, sai số sau chọn k thích hợp, lại gần với sai số áp dụng heuristic “ăn gian”, cụ thể kết sau: Ta thử nghiệm với hàm số • Error: Reference source not found • Error: Reference source not found • Error: Reference source not found • Error: Reference source not found • Error: Reference source not found Kết thực nghiệm sau: Hình 24: Bảng so sánh sai số phương pháp kNN-HDH dùng không dùng Heuristic, với số chiều tăng dần u1 (1 chiều) u2 (2 chiều) u3 (2 chiều) u4 (3 chiều) u5 (4 chiều) K=16 Heuristic K=6 Heuristic K=5 Heuristic K=6 Heuristic K=8 Heuristic 0.0065 0.0001 0.0807 0.0232 0.1302 0.0752 0.4576 0.3333 0.8162 0.6312 45 Tại ta thấy với số chiều tăng dần, sai số không dùng heuristic lúc tiến lại lại gần sai số dùng heuristic, tức việc hồi quy kNN hiệu ta tăng số chiều mốc nội suy, nhận định 5.4 SO SÁNH HIỆU QUẢ VỚI PHƯƠNG PHÁP KHÁC Chương xin so sánh hiệu phương pháp kNN-HDH với phương pháp nội suy xấp xỉ hàm nhiều biến với liệu nhiễu tác giả Tomohiro Ando công bố tạp chí Journal of Statistical Planning and Inference năm 2008 [10] Tại báo này, tác giả dùng phương pháp GIC, NIC, MIC để thử với hàm số u2, u3 trên, miền giá trị Error: Reference source not found Ta so sánh kết phương pháp kNN-HDH với phương pháp tốt tác già phương pháp GIC, trường hợp số mốc nội suy ban đầu m=100 m=200 Vì thời gian có hạn, cộng với việc thuật toán GIC cài đặt phức tạp nên khóa luận chưa cài đặt thuật toán GIC mà lấy liệu kết tác giả để so sánh với phương pháp kNN-HDH Hình 25: Bảng so sánh kết với phương pháp GIC m=100 GIC 0.38873 1.18925 kNN-HDH 0.1175 0.4599 GIC 0.14857 0.34603 kNN-HDH 0.0892 0.2846 m=200 Nhận xét: Với kết này, ta thấy phương pháp kNN-HDH cho sai số tốt phương pháp GIC, tác giả Tomohiro Ando thử với hàm biến, chưa thử với hàm nhiều biến vốn ưu điểm phương pháp kNN-HDH 46 CHƯƠNG 6: TỔNG KẾT PHƯƠNG HƯỚNG PHÁT TRIỂN Nội dung chương bao gồm: • Tổng kết • Phuơng hướng phát triển đề tài 6.1 Tổng kết Đến hoàn thành khóa luận tốt nghiệp với đề tài “Huấn luyện mạng nơron RBF với mốc cách ứng dụng” với mục đích mô phương pháp ứng dụng thuật toán HDH-1 vào việc xây dựng hệ thống nội suy xấp xỉ hàm nhiều biến với liệu nhiễu nghiên cứu thực nghiệm nhằm tìm đặc điểm, lý giải đưa cách hoàn thiện phương pháp Những công việc làm được: • Tìm hiểu kiến trúc mạng RBF, đặc điểm mạng RBF, từ hiểu phương pháp huấn luyện mạng RBF, thuật toán HDH-2 HDH-1 • Tìm hiểu nhiễu trắng phương pháp sinh nhiễu trắng • Tìm hiểu phương pháp hồi quy tuyến tính kNN • Hiểu ý tưởng phương pháp kNN-HDH lập trình mô thành công, phần mềm tiện cho nghiên cứu lẫn ứng dụng • Phát đặc điểm bản, quan trọng phương pháp kNN-HDH, đưa cải tiến lớn, cho thấy hiệu cao phương pháp Đó là: o Lưới liệu cần có số nút xấp xỉ với số mốc nội suy liệu ban đầu o K chọn với mục đích cân tính khử nhiễu tính hồi quy, cụ thể dựa tỷ lệ miền giá trị hàm số nhiễu trắng o Khi thực nghiệm nên áp dụng phương pháp heuristic “ăn gian”, nhằm tách riêng bước hồi quy tuyến tính kNN thuật toán HDH-1 Như làm bật đặc điểm phương pháp o Khi số chiều lớn, hiệu tốt khử nhiễu tốt tối ưu sai số hồi quy o Các kết thí nghiệm giải thích khớp với tảng lý thuyết 47 6.2 Phương hướng phát triển đề tài Do phương pháp hoàn toàn mới, thời gian nghiên cứu lại có hạn nên số điều chưa sâu Đây điều dùng để làm phương hương phát triển cho đề tài Đó là: • Cần thêm nhiều mô phương pháp khác để so sánh với phương pháp kNN-HDH để chứng minh ưu điểm nó, đặc biệt tốc độ huấn luyện trường hợp nhiều chiều • Áp dụng phương pháp kNN-HDH vào ứng dụng cụ thể như: Xử lý ảnh, nhận dạng giọng nói … 48 ... gian huấn luyện pha chiếm phần lớn Với trường hợp mốc huấn luyện mốc cách đều, thuật toán lặp hai pha bỏ pha thứ này, trở thành thuật toán pha Thuật toán huấn luyện mốc cách thường áp dụng với ứng. .. có mạng nơron RBF - sau gọi tắt mạng RBF - coi loại nơron nhân tạo tốt để giải toán nội suy hàm nhiều biến Mạng RBF trọng nghiên cứu có nhiều thuật toán huấn luyện mạng RBF áp dụng nhiều ứng dụng. .. thể hóa kiểm chứng hiệu phương pháp này, lấy tên đề tài là: Huấn luyện mạng nơron RBF với mốc cách ứng dụng Nội dung khóa luận sâu nghiên cứu vấn đề sau: - Khảo cứu mạng nơron RBF - Khảo cứu

Ngày đăng: 22/08/2017, 10:51

Từ khóa liên quan

Mục lục

  • Chương 3: Ứng dụng thuật toán lặp một pha huấn luyện mạng RBF vào việc giải quyết bài toán nội suy xấp xỉ với dữ liệu nhiễu trắng.

  • CHƯƠNG 1 BÀI TOÁN NỘI SUY, XẤP XỈ HÀM SỐ VÀ MẠNG NƠRON RBF

  • Nội dung chương này bao gồm:

  • 1.1 BÀI TOÁN NỘI SUY VÀ XẤP XỈ HÀM SỐ

  • 1.1.1 Bài toán nội suy.

  • 1.1.1.1 Nội suy hàm một biến.

    • Hình 1: Minh họa bài toán nội suy hàm một biến

    • 1.1.1.2 Bài toán nội suy hàm nhiều biến.

    • 1.1.2 Bài toán xấp xỉ

    • 1.1.3 Các phương pháp giải bài toán nội suy và xấp xỉ hàm số

    • Bài toán nội suy hàm một biến đã được nghiên cứu nhiều từ thế kỷ 18. Ban đầu nó được giải quyết bằng phương pháp sử dụng đa thức nội suy: đa thức Lagrange, đa thức Chebysept... tuy nhiên khi số mốc nội suy lớn thì nội suy bằng đa thức thường xãy ra hiện tượng phù hợp trội (over-fitting) do bậc của đa thức thường tăng theo số mốc nội suy. Để giải quyết hiện tượng phù hợp trội, thay vì tìm đa thức nội suy người ta chỉ tìm đa thức xấp xỉ, thường được giải quyết bằng phương pháp xấp xỉ bình phương tối thiểu của Gauss. Một phương pháp khác được đề xuất vào đầu thế kỷ 20 đó là phương pháp nội suy Spline. Trong đó hàm nội suy được xác định nhờ ghép trơn các hàm nội suy dạng đơn giản (thường dùng đa thức bậc thấp) trên từng đoạn con. Phương pháp này hay được áp dụng nhiều trong kỹ thuật.

    • Tuy nhiên, như đã trình bày ở trên, các ứng dụng mạnh mẽ nhất của nội suy hàm nhiều biến trong thực tế ngày nay đòi hỏi phải giải quyết được bài toán nội suy hàm nhiều biến. Cùng với sự phát triển mạnh mẽ của ngành Công Nghệ Thông Tin, bài toán nội suy xấp xỉ hàm nhiều biến được quan tâm và có những nghiên cứu đột phá trong khoảng 30 năm trở lại đây, với các cách tiếp cận chủ yếu như:

    • Học dựa trên mẫu: Thuật ngữ này được T.Mitchell dùng để chỉ các phương pháp k-láng giêngf agần nhất, phương pháp hồi quy trọng số địa phương

    • Mạng nơron MLP

    • Mạng nơron RBF

    • Để hiểu rõ hơn, xin xem thêm trong [3]

    • 1.2 MẠNG NƠRON NHÂN TẠO

      • 1) Hàm ngưỡng

      • Hình 4: Đồ thị hàm ngưỡng

      • 2) Hàm tuyến tính

Tài liệu cùng người dùng

Tài liệu liên quan