Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

55 1K 12
Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tài liệu tham khảo công nghệ thông tin Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lê Xuân Minh Hoàng HUẤN LUYỆN MẠNG NƠRON RBF VỚI MỐC CÁCH ĐỀU VÀ ỨNG DỤNG KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ thơng tin HÀ NỘI - 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Lê Xuân Minh Hoàng HUẤN LUYỆN MẠNG NƠRON RBF VỚI MỐC CÁCH ĐỀU VÀ ỨNG DỤNG KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Cơng nghệ thơng tin Cán hướng dẫn: PGS.TS Hoàng Xuân Huấn HÀ NỘI – 2010 LỜI CẢM ƠN Tôi muốn bày tỏ cảm ơn sâu sắc tới thầy Hồng Xn Huấn, thuộc mơn Khoa học máy tính, khoa Cơng nghệ thơng tin, trường Đại học Công nghệ, ĐHQGHN nhận hướng dẫn tin tưởng để giao cho đề tài thú vị Trong thời gian thực khóa luận, thầy kiên nhẫn, nhiệt tình hướng dẫn giúp đỡ tơi nhiều Chính hiểu biết sâu rộng kinh nghiệm nghiên cứu khoa học thầy hiều lần định hướng giúp tránh khỏi sai lầm giúp vượt qua gặp bế tắc thực khóa luận Tơi muốn bày tỏ cảm ơn tới các thầy, môn, thầy, cô khoa, trường tạo điều kiện giúp đỡ để thực hồn thành khóa luận Nếu khơng có kiến thức đào tạo năm vừa qua, tơi khơng thể hồn thành khóa luận TĨM TẮT NỘI DUNG Mặc dù nghiên cứu từ lâu, đến toán nội suy xấp xỉ hàm nhiều biến cịn có cơng cụ tốn học để giải Mạng Nơron nhân tạo phương pháp hay để giải toán nội suy, xấp xỉ hàm nhiều biến Năm 1987 M.J.D Powell đưa cách tiếp cận để giải toán nội suy hàm nhiều biến sử dụng kỹ thuật hàm sở bán kính (Radial Basis Function - RBF), năm 1988 D.S Bromhead D Lowe đề xuất kiến trúc mạng Nơron RBF trở công cụ hữu hiệu để giải toán nội suy xấp xỉ hàm nhiều biến(xem [11]) Năm 2006 Hoàng Xuân Huấn cộng (xem [1]) đưa thuật toán lặp hai pha để huấn luyện mạng nơron RBF cho kết tốt nhiên nhược điểm sai số lớn liệu phân bố không Khi áp dụng phương pháp liệu cách cho ta thuật toán lặp pha HDH với thời gian tính tổng quát tốt nhiều (xem [2]) Nội dung khóa luận ứng dụng thuật toán huấn luyện mạng nơron RBF với mốc cách để đưa phương pháp nội suy xấp xỉ hàm nhiều biến với liệu có nhiễu trắng chứng minh hiệu thông qua việc xây dựng phần mềm nội suy hàm số MỤC LỤC Lê Xuân Minh Hoàng .1 HÀ NỘI - 2010 Lê Xuân Minh Hoàng HÀ NỘI – 2010 LỜI CẢM ƠN .3 Chương : Ứng dụng thuật toán lặp pha huấn luyện mạng RBF vào việc giải toán nội suy xấp xỉ với liệu nhiễu trắng 15 CHƯƠNG BÀI TOÁN NỘI SUY, XẤP XỈ HÀM SỐ VÀ MẠNG NƠRON RBF 17 Nội dung chương bao gồm : 17 1.1BÀI TOÁN NỘI SUY VÀ XẤP XỈ HÀM SỐ 17 1.1.1Bài toán nội suy .17 1.1.1.1 Nội suy hàm biến .17 Hình : Minh họa toán nội suy hàm biến 17 1.1.1.2 Bài toán nội suy hàm nhiều biến 18 1.1.2Bài toán xấp xỉ 18 1.1.3Các phương pháp giải toán nội suy xấp xỉ hàm số 19 Bài toán nội suy hàm biến nghiên cứu nhiều từ kỷ 18 Ban đầu giải phương pháp sử dụng đa thức nội suy: đa thức Lagrange, đa thức Chebysept nhiên số mốc nội suy lớn nội suy đa thức thường xãy tượng phù hợp trội(over-fitting) bậc đa thức thường tăng theo số mốc nội suy Để giải tượng phù hợp trội, thay tìm đa thức nội suy người ta tìm đa thức xấp xỉ, thường giải phương pháp xấp xỉ bình phương tối thiểu Gauss Một phương pháp khác đề xuất vào đầu kỷ 20 phương pháp nội suy Spline Trong hàm nội suy xác định nhờ ghép trơn hàm nội suy dạng đơn giản (thường dùng đa thức bậc thấp) đoạn Phương pháp hay áp dụng nhiều kỹ thuật .19 Tuy nhiên, trình bày trên, ứng dụng mạnh mẽ nội suy hàm nhiều biến thực tế ngày địi hỏi phải giải tốn nội suy hàm nhiều biến Cùng với phát triển mạnh mẽ ngành Cơng Nghệ Thơng Tin, tốn nội suy xấp xỉ hàm nhiều biến quan tâm có nghiên cứu đột phá khoảng 30 năm trở lại đây, với cách tiếp cận chủ yếu : 19 Học dựa mẫu : Thuật ngữ T.Mitchell dùng để phương pháp k-láng giêngf agần nhất, phương pháp hồi quy trọng số địa phương 19 Mạng nơron MLP .19 Mạng nơron RBF 19 Để hiểu rõ hơn, xin xem thêm [3] 19 1.2MẠNG NƠRON NHÂN TẠO 19 1) Hàm ngưỡng 23 .23 .23 Hình 4: Đồ thị hàm ngưỡng 23 2) Hàm tuyến tính .23 .23 .23 Hình 5: Đồ thị hàm tuyến tính .23 3) Hàm sigmoid 23 .23 .23 Hình 6: Đồ thị hàm sigmoid 23 4) Hàm tank 24 .24 .24 Hình 7: Đồ thị hàm tank 24 5) Hàm bán kính (Gauss) 24 .24 .24 Hình 8: Đồ thị hàm Gauss 24 1.3MẠNG NƠRON RBF 25 Hình 10: Minh họa ảnh hưởng hàm bán kính 27 Hình 11: Kiến trúc mạng RBF 28 CHƯƠNG : 29 THUẬT TOÁN LẶP HDH HUẤN LUYỆN MẠNG RBF 29 Nội dung chương bao gồm : 29 CHƯƠNG : 34 ỨNG DỤNG THUẬT TOÁN LẶP MỘT PHA HUẤN LUYỆN MẠNG RBF VÀO VIỆC GIẢI QUYẾT BÀI TOÁN NỘI SUY XẤP XỈ VỚI DỮ LIỆU NHIỄU TRẮNG 34 Nội dung chương bao gồm : 34 CHƯƠNG XÂY DỰNG PHẦN MỀM MÔ PHỎNG 40 Nội dung chương bao gồm : 40 Lập trình sinh nhiễu trắng theo phân phối chuẩn 40 Lập trình giải tốn hồi quy tuyến tính kNN 40 Tổng quan phần mềm .40 Các mơ tả lập trình chương nêu phương án lập trình để giải toán nhỏ đề cập trên, cụ thể cách sinh nhiễu trắng theo phân phối chuẩn lập trình giải tốn hồi quy tuyến tính kNN 40 4.1LẬP TRÌNH SINH NHIỄU TRẮNG THEO PHÂN PHỔI CHUẨN 40 Để xây dựng phân phối chuẩn từ hàm phân phối rand() C++, dựa theo phương pháp Box Muller (xem chi tiết [9]) trình bày : 40 4.1.1Phương pháp Box-Muller 40 4.1.2Sinh nhiễu trắng từ hàm rand() C++ 41 Như vậy, với việc dùng hàm rand() C++ tạo dãy phân phối đều, ta tính dãy phân phối chuẩn N(0,1), phần tử dãy nhân với tham số phương sai trừ khoảng sai số trung bình tổng chúng với kỳ vọng, ta dãy số thể nhiễu trắng với kỳ vọng phương sai theo thiệt lập ban đầu 41 4.2LẬP TRÌNH GIẢI HỆ PHƯƠNG TRÌNH CỦA BÀI TỐN HỒI QUY TUYẾN TÍNH KNN 41 4.3GIỚI THIỆU PHẦN MỀM XẤP XỈ NỘI SUY VỚI DỮ LIỆU NHIỄU 42 4.3.1Tổng quan phần mềm 42 http://www.microsoft.com/downloads/details.aspx? FamilyID=0856eacb-4362-4b0d-8edd-aab15c5e04f5&displaylang=en 43 4.3.2Tổ chức liệu 43 Các mốc nội suy thể dạng mảng số thực Các giá trị , khóa luận xét trường hợp đầu chiều, nên cho dạng số thực 43 Class mangnoron (mô mạng nơron RBF) 44 Class bosinhphanphoichuan (mô máy sinh phân phổi chuẩn Gauss) 44 Class hambk (mơ hàm bán kính, class dùng class mangnoron) 44 Class matran (mơ ma trận, dùng cho việc tính định thức) .44 Class maytinh (mô hàm số từ xâu nhập vào) 44 Phương pháp kNN-HDH thuật toán cấu thành nên HDH-1 kNN viết dạng phương thức class mangnoron 44 Để giảm bớt yêu cầu nhớ chương trình, số bước có tính đệ quy hay phải khai báo biến nhiều lần đơn giản hóa, ví dụ việc tính chuẩn Mahalanobis thuật tốn HDH-1 Thay khởi tạo ma trận A 44 .44 tính .44 ta việc tính 44 4.3.3Giao diện chức 44 Mặc dù Demo, phần mềm thiết kế để tiện cho việc nghiên cứu lẫn ứng dụng thực tế Phần mềm có chức 44 Nhập liệu (có nhiễu trắng) theo cách 44 Thủ công 44 Nhập từ file input .44 Xuất liệu mô tả mạng nơron RBF huấn luyện file output .44 Đưa sai số huấn luyện giao diện 44 Giao diện chương trình gồm Tab : Tab ‘Nhập theo file’ Tab ‘Tự nhập’; Tab thể cách nhập liệu Người dùng tùy theo việc muốn nhập liệu theo kiểu mà chọn Tab Sau xin giới thiệu giao diện chức phần mềm theo Tab .44 4.3.3.1 Tab “Nhập liệu theo file” 44 Để nhập liệu theo file, ta chọn Tab ‘Nhập theo file’, có giao diện 45 .45 4.3.3.2 Tab “Tự nhập” 46 Để nhập liệu theo cách thủ công, ta chọn Tab ‘Tự nhập’, giao diện 46 .46 CHƯƠNG 5: .48 CHƯƠNG 6: .57 [3] T.M Mitchell, Machine learning, McGraw-Hill, 1997 .59 [4] J Shlens, A Tutorial on Principal Component Analysis, April 22, 2009 59 [5] D.S Broomhead and D Lowe Multivariable functional interpolation and adaptive networks Complex Systems, vol 2, 321-355, 1988 59 [6] Đặng Thị Thu Hiền, Luận án tiến sỹ cơng nghệ thơng tin, chun ngành Khoa học máy tính, mã số : 62.48.0101, Đại học Công nghệ, ĐHQG Hà Nội, 2009 59 [7]William M.K Trochim, Measurement Error 59 http://www.socialresearchmethods.net/kb/measerr.php 59 [8]Wikipedia®, Normal distribution 59 http://en.wikipedia.org/wiki/Normal_distribution [9]G.E.P Box and Mervin E Muller, A Note on the Generation of Random Normal Deviates, Ann Math Statist Volume 29, Number (1958), 610-611 59 [10]Tomohiro Ando, Sadanori Konishi and Seiya Imoto, Nonlinear regression modeling via regularized radial basis function network, Journal of Statical Planning and Inference, 2008, trang 16-18 .59 .59 BẢNG DANH MỤC CÁC HÌNH MINH HỌA Lê Xuân Minh Hoàng .1 HÀ NỘI - 2010 Lê Xuân Minh Hoàng HÀ NỘI – 2010 LỜI CẢM ƠN .3 Chương : Ứng dụng thuật toán lặp pha huấn luyện mạng RBF vào việc giải toán nội suy xấp xỉ với liệu nhiễu trắng 15 CHƯƠNG BÀI TOÁN NỘI SUY, XẤP XỈ HÀM SỐ VÀ MẠNG NƠRON RBF 17 Nội dung chương bao gồm : 17 1.1BÀI TOÁN NỘI SUY VÀ XẤP XỈ HÀM SỐ 17 1.1.1Bài toán nội suy .17 1.1.1.1 Nội suy hàm biến .17 Hình : Minh họa toán nội suy hàm biến 17 1.1.1.2 Bài toán nội suy hàm nhiều biến 18 1.1.2Bài toán xấp xỉ 18 1.1.3Các phương pháp giải toán nội suy xấp xỉ hàm số 19 Bài toán nội suy hàm biến nghiên cứu nhiều từ kỷ 18 Ban đầu giải phương pháp sử dụng đa thức nội suy: đa thức Lagrange, đa thức Chebysept nhiên số mốc nội suy lớn nội suy đa thức thường xãy tượng phù hợp trội(over-fitting) bậc đa thức thường tăng theo số mốc nội suy Để giải tượng phù hợp trội, thay tìm đa thức nội suy người ta tìm đa thức xấp xỉ, thường giải phương pháp xấp xỉ bình phương tối thiểu Gauss Một phương pháp khác đề xuất vào đầu kỷ 20 phương pháp nội suy Spline Trong hàm nội suy xác định nhờ ghép trơn hàm nội suy dạng đơn giản (thường dùng đa thức bậc thấp) đoạn Phương pháp hay áp dụng nhiều kỹ thuật .19 Tuy nhiên, trình bày trên, ứng dụng mạnh mẽ nội suy hàm nhiều biến thực tế ngày địi hỏi phải giải tốn nội suy hàm nhiều biến Cùng với phát triển mạnh mẽ ngành Cơng Nghệ Thơng Tin, tốn nội suy xấp xỉ hàm nhiều biến quan tâm có nghiên cứu đột phá khoảng 30 năm trở lại đây, với cách tiếp cận chủ yếu : 19 Học dựa mẫu : Thuật ngữ T.Mitchell dùng để phương pháp k-láng giêngf agần nhất, phương pháp hồi quy trọng số địa phương 19 Mạng nơron MLP .19 Mạng nơron RBF 19 Để hiểu rõ hơn, xin xem thêm [3] 19 1.2MẠNG NƠRON NHÂN TẠO 19 1) Hàm ngưỡng 23 .23 .23 Hình 4: Đồ thị hàm ngưỡng 23 2) Hàm tuyến tính .23 .23 .23 Hình 5: Đồ thị hàm tuyến tính .23 3) Hàm sigmoid 23 .23 .23 Hình 6: Đồ thị hàm sigmoid 23 4) Hàm tank 24 .24 .24 Hình 7: Đồ thị hàm tank 24 5) Hàm bán kính (Gauss) 24 .24 .24 Hình 8: Đồ thị hàm Gauss 24 1.3MẠNG NƠRON RBF 25 Hình 10: Minh họa ảnh hưởng hàm bán kính 27 Hình 11: Kiến trúc mạng RBF 28 CHƯƠNG : 29 THUẬT TOÁN LẶP HDH HUẤN LUYỆN MẠNG RBF 29 Nội dung chương bao gồm : 29 CHƯƠNG : 34 ỨNG DỤNG THUẬT TOÁN LẶP MỘT PHA HUẤN LUYỆN MẠNG RBF VÀO VIỆC GIẢI QUYẾT BÀI TOÁN NỘI SUY XẤP XỈ VỚI DỮ LIỆU NHIỄU TRẮNG 34 Nội dung chương bao gồm : 34 CHƯƠNG XÂY DỰNG PHẦN MỀM MÔ PHỎNG 40 Nội dung chương bao gồm : 40 Lập trình sinh nhiễu trắng theo phân phối chuẩn 40 Lập trình giải tốn hồi quy tuyến tính kNN 40 Tổng quan phần mềm .40 Các mơ tả lập trình chương nêu phương án lập trình để giải toán nhỏ đề cập trên, cụ thể cách sinh nhiễu trắng theo phân phối chuẩn lập trình giải tốn hồi quy tuyến tính kNN 40 4.1LẬP TRÌNH SINH NHIỄU TRẮNG THEO PHÂN PHỔI CHUẨN 40 10 Từ … sinh theo phân phối miền hay viết dạng với phân phối miền Để sinh r, từ … Ta định nghĩa hàm U(R) tính xác suất để sinh cặp (x,y) cho : Đặt , ta có : ; với p ta có bán kính R để X,Y tọa độ điểm nằm hình trịn bán kính R Khi p có giá trị phân bố đều, đặt , ; có giá trị phân bố đều, từ ta xây dựng dãy phân bố chuẩn độc lập : 4.1.2 Sinh nhiễu trắng từ hàm rand() C++ Như vậy, với việc dùng hàm rand() C++ tạo dãy phân phối đều, ta tính dãy phân phối chuẩn N(0,1), phần tử dãy nhân với tham số phương sai trừ khoảng sai số trung bình tổng chúng với kỳ vọng, ta dãy số thể nhiễu trắng với kỳ vọng phương sai theo thiệt lập ban đầu 4.2 LẬP TRÌNH GIẢI HỆ PHƯƠNG TRÌNH CỦA BÀI TỐN HỒI QUY TUYẾN TÍNH KNN Từ hệ (3),(4) 3.2.2 : (3) Và (4) 41 Để giải hệ này, ta đưa chúng dạng phép nhân ma trận Đặt P ma trận vecto x (n+1) : Z ma trận ; coi =1 Y ma trận Khi này, (3) (4) tương đương với : (Z.P-Y) = Tương đương với ZT.Z.P = ZT.Y Đặt A=ZT.Z ; B = ZT.Y ta có : A.P=B Đây hệ phương trình tuyến tính với P ma trận vecto cần tìm, A ma trận vuông, ta việc dùng phương pháp Crammer để giải : = Với Ai ma trận A với cột thứ i thay ma trận vecto B 4.3 GIỚI THIỆU PHẦN MỀM XẤP XỈ NỘI SUY VỚI DỮ LIỆU NHIỄU 4.3.1 Tổng quan phần mềm Đây phần mềm xây dựng huấn luyện mạng nơron RBF nội suy xấp xỉ hàm nhiều biến từ liệu nhiễu Tơi chọn lập trình ngơn ngữ C++, IDE Visual C+ + 2010 Release Candidate, Framework NET Sản phẩm dịch dạng Windows Form, chạy hệ điều hành Windows với điều kiện cài đặt Microsoft NET Framework version 2.0 Redistributable Package, tên file dotnetfx.exe, dung lượng 22MB ; tải miễn phí địa chỉ: 42 http://www.microsoft.com/downloads/details.aspx? FamilyID=0856eacb-4362-4b0d-8edd-aab15c5e04f5&displaylang=en 4.3.2 Tổ chức liệu Các mốc nội suy thể dạng mảng số thực Các giá trị , khóa luận xét trường hợp đầu chiều, nên cho dạng số thực Tôi lập trình theo cách hướng đối tượng, đối tượng quan trọng viết thành lớp đặt file header để dễ dàng chỉnh sửa trao đổi với người quan tâm, gồm : 43 • Class mangnoron (mơ mạng nơron RBF) • Class bosinhphanphoichuan (mơ máy sinh phân phổi chuẩn Gauss) • Class hambk (mơ hàm bán kính, class dùng class mangnoron) • Class matran (mơ ma trận, dùng cho việc tính định thức) • Class maytinh (mơ hàm số từ xâu nhập vào) Phương pháp kNN-HDH thuật tốn cấu thành nên HDH-1 kNN viết dạng phương thức class mangnoron Để giảm bớt yêu cầu nhớ chương trình, số bước có tính đệ quy hay phải khai báo biến nhiều lần đơn giản hóa, ví dụ việc tính chuẩn Mahalanobis thuật tốn HDH-1 Thay khởi tạo ma trận A tính ta việc tính 4.3.3 Giao diện chức Mặc dù Demo, phần mềm thiết kế để tiện cho việc nghiên cứu lẫn ứng dụng thực tế Phần mềm có chức • Nhập liệu (có nhiễu trắng) theo cách o Thủ cơng o Nhập từ file input • Xuất liệu mô tả mạng nơron RBF huấn luyện file output • Đưa sai số huấn luyện giao diện Giao diện chương trình gồm Tab : Tab ‘Nhập theo file’ Tab ‘Tự nhập’; Tab thể cách nhập liệu Người dùng tùy theo việc muốn nhập liệu theo kiểu mà chọn Tab Sau xin giới thiệu giao diện chức phần mềm theo Tab 4.3.3.1 Tab “Nhập liệu theo file” 44 Để nhập liệu theo file, ta chọn Tab ‘Nhập theo file’, có giao diện Hình 16 Giao diện nhập liệu theo file Giao diện đơn giản, TextBox,Combo Box để nhập tham số huấn luyện tht tốn kNN-HDH hình trên, phần nhập liệu gồm có button, button để chọn file input, output ghi nhãn, button “Start” để bắt đầu việc huấn luyện File input file txt gồm số thực xếp theo quy ước : • Dịng n – số chiều mốc nội suy • Dịng thứ hai m – số mốc nội suy • Dịng thứ i+2, ( ) có (n+1) số thực tương ứng với số (tại dòng thứ i+2) để thể mốc nội suy n chiều giá trị đo mốc File output file txt bao gồm liệu mô tả mạng RBF sau huấn luyện, xếp sau: • Dịng thứ • Các dịng tiếp theo, dịng dùng để mơ tả hàm bán kính Cụ thể với o Dịng 3*k+2 gồm n số thực tương ứng với số với tâm hàm bán kính thứ k o Dịng 3*k+3 tham số độ rộng hàm bán kính thứ k o Dòng 3*k+4 hệ số 45 Mỗi nhấn button ‘Start’, phần mềm lấy liệu từ file input làm liệu huấn luyện huấn luyện mạng nơron RBF theo liệu này, sau truyền liệu số mơ tả mạng RBF file output 4.3.3.2 Tab “Tự nhập” Để nhập liệu theo cách thủ công, ta chọn Tab ‘Tự nhập’, giao diện Hình 17 Giao diện nhập liệu thủ cơng Vì số lượng mốc nội suy lớn, Tab thay nhập mốc, người dùng chọn miền giá trị cho mốc nội suy (Nếu muốn nhập chi tiết mốc nội suy, người dùng chọn cách nhập theo file trình bày trên) Cụ thể người dùng chọn số chiều n Vỡi n chọn label “chiều 1”, “chiều 2” … dần n tăng ẩn bớt n giảm Cùng với textbox để người dùng nhập giá trị max chiều ẩn theo, người dùng tạo miền giá trị cho mốc nội suy cách Chương trình tạo mốc nội suy ngẫu nhiên nằm miền Số mốc tạo ngẫu nhiên mặc định 100, người dùng tự nhập vào TextBox “số mốc ngẫu nhiên” Sau có mốc nội suy rồi, giá trị đo mốc nội suy giá trị hàm số cần nội suy xấp xỉ (nhập TextBox “biểu thức”) cộng với sai số sinh từ dãy phân phối chuẩn (có kỳ vọng mặc định =0 nhiễu trắng) phương sai điền TextBox “phương sai” (mặc định 0,25) 46 Sau xây dựng xong liệu huấn luyện, phần mềm huấn luyện mạng RBF theo thuât toán kNN-HDH với tham số người dùng điền vào giao diện Button “Chọn file output” dùng người dùng muốn xuất liệu mô tả mạng RBF sau huấn luyện file Thứ tự liệu xuất file giống mô tả nêu 4.3.2.1 Vì giao diện làm với mục đích giúp người dùng dễ dàng kiểm chứng kết thực nghiệm, nên sau huấn luyện mạng RBF xong, sai số trung bình mốc huấn luyện lấy trung bình cộng tổng bình phương kết đưa TextBox “TB cộng bình phương sai số” Ngoài ra, checkBox Heuristic người dùng tích vào muốn áp dụng heuristic “ăn gian” thí nghiệm 47 CHƯƠNG 5: KẾT QUẢ THÍ NGHIỆM Nội dung chương bao gồm: • Thí nghiệm thay đổi kích thước lưới • Thí nghiệm việc chọn k • Thí nghiệm tăng số chiều • So sánh hiệu với thuật tốn khác Để làm bật đặc điểm phương pháp này, thiết lập module để thực heuristic, tạm gọi “ăn gian” để giả thiết phương pháp kNN hoàn hảo, vừa hồi quy vừa khử nhiễu với sai số Để mô heuristic này, lệnh “ăn gian” viết phần mềm, kích hoạt, phần mềm, tính giá trị nội suy yi nút lưới xi ,thay dùng phương pháp kNN để tính hàm gán , ta dùng hàm số cần nội suy xấp xỉ để gán giá trị 5.1 THÍ NGHIỆM VỀ VIỆC THAY ĐỔI KÍCH THƯỚC LƯỚI Vì mạng RBF huấn luyện khơng phải liệu ngẫu nhiên ban đầu mà lưới liệu cách thiết lập sau hồi quy từ liệu ban đầu, thuật tốn HDH-1 có tốc độ tính tốn nhanh tồn nghi ngờ sai số huấn luyện lớn, dựa vào tính chất thuật tốn HDH-1 pha trình bày cuối chương lưới liệu dày xấp xỉ tốt dẫn đến quan ngại phương pháp ta phải thiết lập lưới liệu dày đặc cho sai số chấp nhận Thí nghiệm cho kết bất ngờ kích thước hợp lý lưới liệu Hàm số dùng làm thí nghiệm hàm Các hàm lấy từ thí nghiệm [10] để tiện so sánh phần sau 48 Dữ liệu ban đầu gồm có mốc nội suy phân bố ngẫu nhiên miền giá trị đầu vào D : ; ta thử trường hợp số mốc nội suy m=100 m=200 Kết đo mốc giá trị hàm số thực cộng với sai số (nhiễu trắng) Dãy sai số phân bố theo phân phối chuẩn có phương sai 0.25 Bảng so sánh sai số phương pháp khởi tạo lưới liệu kích cỡ khác nhau, trường hợp dùng khơng dùng heuristic Kích thước lưới liệu lần tăng tăng gấp đôi chiều, số mốc cách lưới tạo sau nhiều gấp lần số mốc cách lưới tạo trước Hình 18 Sai số chọn kích cỡ khác lưới liệu cho liệu 100 mốc ngẫu nhiên, không áp dụng heuristic “ăn gian” 49 Hình 19 Sai số chọn kích cỡ khác lưới liệu cho liệu 200 mốc ngẫu nhiên, không áp dụng heuristic “ăn gian” Hình 20 Sai số áp dụng kích cỡ khác lưới liệu cho liệu ngẫu nhiên 100 mốc, có heuristic “ăn gian” 50 Hình 21 Sai số chọn kích cỡ khác lưới liệu cho liệu 200 mốc ngẫu nhiên, có áp dụng heuristic “ăn gian” Ta thấy dù lần thiết lập số nút lưới tăng gấp lần so với lần thiêt lập trước, sai số tổng quát không giảm nhiều Thử với số hàm số khác, ta thấy tượng mật độ lưới liệu thưa cho sai số lớn, nhiên cho mật độ dày đặc lên hiệu lớn khoảng định, lưới liệu dày đặc đến mức đó, tiếp tục làm dày đặc sai số không giảm so với gia tăng số mốc cách cần huấn luyện Đặc biệt, sai số đặt mật độ nút lưới mức thứ (10 x 10 với m=100) hay (14 x 14 với m=200) tốt nhiều đặt mức thứ nhất, không tồi với mức kế tiếp, độ dày đặc tăng lên lần mức Chú ý số nút lưới lưới xấp xỉ với m mốc nội suy liệu ban đầu Nhận xét : Thí nghiệm cho thấy lưới liệu cần khởi tạo dày đặc lo ngại ban đầu Thực nghiệm cho thấy cần số nút lưới liệu xấp xỉ số mốc nội suy ban đầu cho hiệu huấn luyện nói chung hợp lý Tùy thuộc vào ứng dụng cụ thể mà tùy chỉnh kích thước lưới liệu, ví dụ tăng kích thước để làm giảm sai số, thời gian huấn luyện nằm khoảng cho phép, đặc điểm huấn luyện nhanh phương pháp Ta thấy rõ khác làm thí nghiệm việc áp dụng không áp dụng heuristic, điều cho thấy tầm ảnh hướng lớn bước hồi quy kNN 51 5.2 THÍ NGHIỆM VỀ VIỆC CHỌN K Trong phương pháp này, việc chọn k hồi quy tuyến tính kNN cho tốt coi quan trọng Vì phương pháp kNN khơng hồi quy mà làm nhiệm vụ khử nhiễu Nếu hồi quy không tốt tạo lưới liệu mà giá trị nút lưới khác xa so với giá trị thực khử nhiễu từ làm cho việc nội suy xấp xỉ nhiều Việc chọn k phương pháp kNN cịn tốn mở, người ta đưa khuyến nghị nên chọn k lớn số chiều n Thí nghiệm đưa vài kết luận thú vị việc chọn k Tại thí nghiệm này, ta xét hàm số Dễ thấy hàm tỷ lệ với nhau, nội dung thí nghiệm xét cách chọn k dựa vào độ lớn miền giá trị hàm Tham số m chọn 200, theo kết thí nghiệm 5.1, ta chọn lưới liệu có kích thước 14 x 14, xét trường hợp k=4,6,8,10,12,14,16 Kết lần thử nghiệm so sánh kèm với kết kích hoạt heuristic “ăn gian” Hình 22 Bảng so sánh sai số phương pháp kNN-HDH áp dụng cho hàm y1 với cách chọn k khác 52 Hình 23 Bảng so sánh sai số phương pháp kNN-HDH áp dụng cho hàm y2 với cách chọn k khác Tại đây, ta thầy hàm y2 đạt giá trị tốt với k=6 tăng dần k sai số tồi nhiều Trong hàm y1 tăng k tốt Điều giải thích sau : Sai số chênh lệch thi thử với k khác với k khác hiệu phương pháp kNN khác Ta thấy dùng heuristic sai số khơng đổi Đặc điểm phương pháp hồi quy kNN k lớn hiệu khử nhiễu tốt, đồng thời, phải hồi quy nút xa hiệu hồi quy bị Ngược lại k nhỏ hiệu hồi quy tốt (trừ trường hợp k nhỏ không đủ để hồi quy sai số tăng vọt thấy biểu đồ) , nhiên giảm k khả khử nhiễu trắng lại phải nội suy với mốc khơng trung hịa nhiễu trắng Nhận xét : Giá trị k tốt phải cân hiệu hồi quy hiệu khử nhiễu, tùy theo toán cụ thể để chọn k lớn hay k nhỏ Xét ví dụ trên, ta thấy miền giá trị y1 nhỏ y2 nhiễu có ảnh hưởng lớn đến kết hồi 53 quy, cơng việc khử nhiễu phải đặt ưu tiên so với toán với hàm y2, k lớn tốt Biểu đồ cho thấy k lớn tốt xét đến k=30, đặt nặng nhiệm vụ khử nhiễu so với hồi quy sai số lại tăng lên 0,03 Ngược lại, toán với hàm y2 tỷ lệ miền giá trị với nhiễu trắng lớn so với toán hàm y1 ưu tiên khử nhiễu không đặt nặng tốn với hàm y1, chọn k nhỏ so với trường hợp với hàm y1 cho hiệu tốt 5.3 THÍ NGHIỆM KHI TĂNG SỐ CHIỀU Một phần quan trọng phương pháp hồi quy kNN, vừa có vai trị hồi quy mốc để thuật tốn lặp pha HDH dựa vào để huấn luyện, vừa có vai trò khử nhiễu, hồi quy kNN tốt sai số giảm nhiều, mức độ tốt mà ta mong đợi hồi quy xác hàm số cần nội suy xấp xỉ nút lưới (Tức heuristic thành thực) Xét số chiều vecto đầu vào, ta thấy : Do tính chất phương pháp kNN Việc chọn k thường khuyến nghị nên chọn k>n, sau thỏa mãn điều kiện k>n, “k hợp lý” nên đủ thấp để hồi quy cho sai số nhỏ Vì vậy, số chiều n tăng, “k hợp lý” tăng theo Mặt khác, k tăng việc khử nhiễu lại tốt Vì vậy, với dải nhiễu, số chiều tăng việc khử nhiễu tốt, qua nâng cao tính hiệu phương pháp kNN-HDH Trong q trình thí nghiệm đây, thử với hàm số nhiều biến, sai số sau chọn k thích hợp, lại gần với sai số áp dụng heuristic “ăn gian”, cụ thể kết sau : Ta thử nghiệm với hàm số • • • • • Kết thực nghiệm sau : 54 Hình 24 : Bảng so sánh sai số phương pháp kNN-HDH dùng không dùng Heuristic, với số chiều tăng dần u1 (1 chiều) u2 (2 chiều) u3 (2 chiều) u4 (3 chiều) u5 (4 chiều) K=16 Heuristic K=6 Heuristic K=5 Heuristic K=6 Heuristic K=8 Heuristic 0.0065 0.0001 0.0807 0.0232 0.1302 0.0752 0.4576 0.3333 0.8162 0.6312 Tại ta thấy với số chiều tăng dần, sai số không dùng heuristic lúc tiến lại lại gần sai số dùng heuristic, tức việc hồi quy kNN hiệu ta tăng số chiều mốc nội suy, nhận định 5.4 SO SÁNH HIỆU QUẢ VỚI PHƯƠNG PHÁP KHÁC Chương xin so sánh hiệu phương pháp kNN-HDH với phương pháp nội suy xấp xỉ hàm nhiều biến với liệu nhiễu tác giả Tomohiro Ando công bố tạp chí Journal of Statistical Planning and Inference năm 2008 [10] Tại báo này, tác giả dùng phương pháp GIC, NIC, MIC để thử với hàm số u2, u3 trên, miền giá trị Ta so sánh kết phương pháp kNN-HDH với phương pháp tốt tác già phương pháp GIC, trường hợp số mốc nội suy ban đầu m=100 m=200 Vì thời gian có hạn, cộng với việc thuật tốn GIC cài đặt phức tạp nên khóa luận tơi chưa cài đặt thuật tốn GIC mà lấy liệu kết tác giả để so sánh với phương pháp kNN-HDH Hình 25: Bảng so sánh kết với phương pháp GIC m=100 GIC kNN-HDH m=200 0.38873 0.1175 1.18925 0.4599 GIC kNN-HDH 0.14857 0.0892 0.34603 0.2846 Nhận xét : Với kết này, ta thấy phương pháp kNN-HDH cho sai số tốt phương pháp GIC, tác giả Tomohiro Ando thử với hàm biến, chưa thử với hàm nhiều biến vốn ưu điểm phương pháp kNN-HDH 55 ... gian huấn luyện pha chiếm phần lớn Với trường hợp mốc huấn luyện mốc cách đều, thuật toán lặp hai pha bỏ pha thứ này, trở thành thuật toán pha Thuật toán huấn luyện mốc cách thường áp dụng với ứng. .. có mạng nơron RBF - sau gọi tắt mạng RBF - coi loại nơron nhân tạo tốt để giải toán nội suy hàm nhiều biến Mạng RBF trọng nghiên cứu có nhiều thuật toán huấn luyện mạng RBF áp dụng nhiều ứng dụng. .. mạng RBF - Chương : Thuật toán lặp HDH huấn luyện mạng nơron RBF Chương mô tả phương pháp huấn luyện mạng RBF thuật toán HDH hai pha với liệu ngẫu nhiên đặc biệt thuật toán HDH pha với liệu cách

Ngày đăng: 23/11/2012, 15:03

Hình ảnh liên quan

số trùng với giá trị yi đã biế t. Về phương diện hình học, ta cần tìm hàm ϕ(x) có dạng - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

s.

ố trùng với giá trị yi đã biế t. Về phương diện hình học, ta cần tìm hàm ϕ(x) có dạng Xem tại trang 17 của tài liệu.
Hình 2: Minh họa một Neuron thần kinh sinh học - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 2.

Minh họa một Neuron thần kinh sinh học Xem tại trang 20 của tài liệu.
Hình 3: Cấu tạo một Nơron nhân tạo - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 3.

Cấu tạo một Nơron nhân tạo Xem tại trang 21 của tài liệu.
Hình 5: Đồ thị hàm tuyến tính - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 5.

Đồ thị hàm tuyến tính Xem tại trang 23 của tài liệu.
Hình 4: Đồ thị hàm ngưỡng - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 4.

Đồ thị hàm ngưỡng Xem tại trang 23 của tài liệu.
Hình 8: Đồ thị hàm Gauss - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 8.

Đồ thị hàm Gauss Xem tại trang 24 của tài liệu.
Hình 7: Đồ thị hàm tank - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 7.

Đồ thị hàm tank Xem tại trang 24 của tài liệu.
Hình 9: Kiến trúc mạng Nơron truyền tới - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 9.

Kiến trúc mạng Nơron truyền tới Xem tại trang 25 của tài liệu.
Hình 10: Minh họa sự ảnh hưởng của hàm bán kính - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 10.

Minh họa sự ảnh hưởng của hàm bán kính Xem tại trang 27 của tài liệu.
Hình 11: Kiến trúc của mạng RBF - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình 11.

Kiến trúc của mạng RBF Xem tại trang 28 của tài liệu.
Hình trên thể hiện hàm mật độ với 4 tập tham số khác nhau, ta thấy đường có μ=-2 đối xứng với đường x=-2 nằm lệch hẳn ra khỏi 3 đường còn lại đối xứng qua  đường thẳng x=0 - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình tr.

ên thể hiện hàm mật độ với 4 tập tham số khác nhau, ta thấy đường có μ=-2 đối xứng với đường x=-2 nằm lệch hẳn ra khỏi 3 đường còn lại đối xứng qua đường thẳng x=0 Xem tại trang 36 của tài liệu.
Hình trên thể hiện trong trường hợp dữ liệu nội suy có 2 chiều, lưới các mốc nội suy mới (các hình tròn) được xây dựng dựa trên miền giá trị của các mốc nội suy cũ  (hình tam giác - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Hình tr.

ên thể hiện trong trường hợp dữ liệu nội suy có 2 chiều, lưới các mốc nội suy mới (các hình tròn) được xây dựng dựa trên miền giá trị của các mốc nội suy cũ (hình tam giác Xem tại trang 39 của tài liệu.
Bảng dưới đây so sánh sai số của phương pháp này khi khởi tạo lưới dữ liệu ở các kích cỡ khác nhau, và ở 2 trường hợp dùng và không dùng heuristic - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

Bảng d.

ưới đây so sánh sai số của phương pháp này khi khởi tạo lưới dữ liệu ở các kích cỡ khác nhau, và ở 2 trường hợp dùng và không dùng heuristic Xem tại trang 49 của tài liệu.
Hình 22 Bảng so sánh sai số của phương pháp kNN-HDH khi áp dụng cho hàm y1 với các cách chọ nk khác nhau - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

i.

̀nh 22 Bảng so sánh sai số của phương pháp kNN-HDH khi áp dụng cho hàm y1 với các cách chọ nk khác nhau Xem tại trang 52 của tài liệu.
Hình 23 Bảng so sánh sai số của phương pháp kNN-HDH khi áp dụng cho hàm y2 với các cách chọ nk khác nhau - Huấn luyện mạng nơron rbf với mốc cách đều và ứng dụng

i.

̀nh 23 Bảng so sánh sai số của phương pháp kNN-HDH khi áp dụng cho hàm y2 với các cách chọ nk khác nhau Xem tại trang 53 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan