Sử dụng mạng noron cho nhận dạng ký tự Tiếng Việt

58 8 0
  • Loading ...
1/58 trang

Thông tin tài liệu

Ngày đăng: 23/11/2016, 21:04

1 LỜI CẢM ƠN Xin chân thành cảm ơn Thầy giáo, PGS.TS Lê Bá Dũng tận tình dạy, hướng dẫn suốt thời gian nghiên cứu thực luận văn Tôi xin chân thành cảm ơn Thầy giáo Viện Công nghệ Thông tin Thầy giáo Trường Đại học sư phạm Hà Nội giảng dạy, giúp đỡ suốt thời gian học tập Xin cảm ơn tất anh chị học viên Cao học khóa 15 – Khoa học máy tính, cảm ơn cán công chức, giảng viên Trường Đại học sư phạm Hà Nội tạo điều kiện tốt cho suốt hai năm học qua Xin cảm ơn bạn bè, đồng nghiệp, gia đình tạo điều kiện thuận lợi bảo nhiều thời gian thực luận văn để có kết ngày hôm Hà Nội, tháng 11/2013 Người viết luận văn Nguyễn Đức Thịnh LỜI CAM ĐOAN Tôi xin cam đoan đề tài luận văn “Sử dụng mạng noron cho nhận dạng ký tự tiếng Việt” công trình nghiên cứu thân Các số liệu, kết nghiên cứu nêu luận văn trung thực không chép y nguyên từ công trình khác Tôi xin chịu trách nhiệm luận văn Hà Nội, tháng 11/2013 Người viết luận văn Nguyễn Đức Thịnh MỤC LỤC Trang LỜI CẢM ƠN LỜI CAM ĐOAN MỤC LỤC DANH MỤC CÁC TỪ TIẾNG ANH VIẾT TẮT DANH MỤC CÁC HÌNH LỜI NÓI ĐẦU CHƢƠNG MỘT SỐ VẤN ĐỀ VỀ MẠNG NƠRON 10 1.1 Mạng Nơron sinh học 10 1.2 Mạng Nơ-ron nhân tạo 11 1.2.1 Nơ-ron nhân tạo 11 1.2.2 Mạng nơ-ron nhân tạo 17 1.2.2.1 Mạng truyền thẳng 18 1.2.2.2 Mạng hồi quy (Recurrent Neutral Network) 20 1.3 Đặc trƣng mạng nơron 21 1.4 Mạng KOHONEN 24 1.4.1 Giới thiệu mạng Nơron Kohonen 24 1.4.2 Cấu trúc mạng nơron Kohonen 25 1.4.3 Thực mạng nơron Kohonen 27 1.4.3.1 Chuẩn hóa đầu vào 27 1.4.3.2 Tính toán đầu cho nơron 28 1.4.3.3 Chọn nơron chiến thắng 28 1.4.3.4 Quá trình học mạng nơron Kohonen 29 1.4.4 Kết luận 33 CHƢƠNG MỘT SỐ VẤN ĐỀ NHẬN DẠNG KÝ TỰ SỬ DỤNG MẠNG NƠRON 35 2.1 Nhận dạng ký tự 35 2.1.1 Giới thiệu nhận dạng ký tự 35 2.1.2 Mô hình tổng quát hệ nhận dạng ký tự 38 2.2 Một số phƣơng pháp nhận dạng ký tự 38 2.2.1 Đối sánh mẫu 38 2.2.2 Phương pháp tiếp cận cấu trúc 39 2.2.3 Mô hình Markov ẩn (HMM - Hidden Markov Model) 40 2.2.4 Máy véc tơ tựa (SVM) 40 2.2.5 Mạng nơron 41 2.2.5.1 Những toán thích hợp 41 2.2.5.2 Các lĩnh vực ứng dụng mạng nơron 41 CHƢƠNG ỨNG DỤNG MẠNG KOHONEN CHO NHẬN DẠNG KÝ TỰ 43 3.1 Bài toán 43 3.1.1 Phát biểu toán 43 3.1.2 Ý tưởng toán 43 3.2 Xác định tham số mạng cho nhận dạng ký tự 43 3.2.1 Các bước giải toán sử dụng mạng nơron Kohonen 43 3.2.1.1 Xây dựng giao diện vẽ 44 3.2.1.2 Xây dựng mạng nơron Kohonen 44 3.2.1.3 Xử lý liệu (phân tích ảnh) 45 3.2.1.4 Huấn luyện mạng nơron Kohonen 46 3.2.1.5 Nhận dạng mạng nơron Kohonen 48 3.2.1.6 Kết luận 48 3.2.2 Giao diện chương trình 49 3.2.3 Quá trình nhận dạng 50 3.3 Tính toán huấn luyện mạng Nơron 50 3.3.1 Tính toán đầu mạng KOHONEN 50 3.3.2 Huấn luyện mạng nơron Kohonen 52 3.4 Kết chƣơng trình 54 3.5 Kết đạt đƣợc, hƣớng phát triển 56 3.5.1 Kết 56 3.5.2 Hướng phát triển 56 KẾT LUẬN 57 TÀI LIỆU THAM KHẢO 58 DANH MỤC CÁC TỪ TIẾNG ANH VIẾT TẮT STT Từ viết tắt Từ viết tƣờng minh HMM Hiden Markov Model LVQ Learning Vector Quantization MLP Multi Layer Perception OCR Optical Character Recognation PDA Personal Digital Assistant RFID Radio Frequency Identification SOM Self Organizing Maps SVM Support Vector Machine DANH MỤC CÁC HÌNH Hình 1.1 Mô hình nơron sinh học Hình 1.2 Mô hình nơron Hình 1.3 Mạng truyền thẳng lớp Hình 1.4 Mạng truyền thẳng nhiều lớp Hình 1.5 Mạng lớp có nối ngược Hình 1.6 Mạng nhiều lớp có nối ngược Hình 1.7 Cấu trúc mạng Kohonen Hình 1.8 Mạng Kohonen điển hình Hình 1.9 Huấn luyện mạng Kohonen Hình 2.1 Mô hình tổng quát hệ nhận dạng ký tự Hình 3.1 Quá trình tìm giới hạn ký tự Hình 3.2 Quá trình lấy mẫu xuống Hình 3.3 Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị Hình 3.4 Quá trình huấn luyện mạng nơron kohonen Hình 3.5 Giao diện chương trình mô Hình 3.6 Nhận dạng ký tự N Hình 3.7 Nhận dạng ký tự Ô Hình 3.8 Nhận dạng ký tự Á PHẦN MỞ ĐẦU Công nghệ thông tin trở lên quan trọng sống hàng ngày Trong công nghệ thông tin, trí tuệ nhân tạo quan tâm nhiều xã hội Nó giải pháp mang đến hy vọng mô não người Nghiên cứu mô trí não, cụ thể tế bào thần kinh (Neural) ước muốn từ lâu nhân loại Với khoảng 15 tỷ Neural não người, Neural nhận hàng vạn tín hiệu từ khớp thần kinh coi chế sinh vật phức tạp Bộ não người có khả giải nhiều vấn đề như: nghe, nhìn, nói, hồi ức thông tin, phân biệt, phân tích mẫu dựa số thông tin có Neural thần kinh yếu tố giúp làm công việc Bộ não phân công công việc xủ lí cho hàng tỉ Neural có liên quan, điều khiển mối liên hệ Neural Neural không ngừng nhận truyền thông tin lẫn Cơ chế hoạt động Neural [1] bao gồm: liên kết (association), tổng quát hóa (generation), tự tổ chức (Self Orgazation) Các Nơron tự liên kết với thành mạng xử lý Mỗi mạng gồm hàng vạn phần tử Nơron khác Mỗi phần tử Nơron có khả liên kết với hàng nghìn Nơron khác Hiện nay, mạng Nơron đưa vào ứng dụng rộng rãi nhiều lĩnh vực Và toán nhận dạng toán sử dụng tính mạng Nơron nhiều Bài toán nhận dạng với trợ giúp mạng Nơron ngày không dừng mức độ nghiên cứu mà trở thành lĩnh vực để áp dụng vào thực tế Các toán nhận dạng nghiên cứu nhiều tập trung vào nhận dạng mẫu hình học (vân tay, mặt người, hình khối …), nhận dạng tiếng nói nhận dạng chữ viết Chúng ứng dụng nhiều lĩnh vực y học, dự báo thời tiết, dự báo cháy rừng, …, lĩnh vực tự động hóa điều khiển rô-bốt, điều khiển thiết bị giọng nói,… Trong số toán nhận dạng này, nhận dạng chữ viết ứng dụng phổ biến Nhận dạng chữ viết ứng dụng trình tự động hóa công việc văn phòng nhập liệu, lưu trữ văn bản, sách báo, phân loại thư tín,…, công việc nhàm chán đòi hỏi nhiều thời gian người Nhận dạng mạng Nơron ứng dụng hàng loạt lĩnh vực quan trọng sống, phục vụ lợi ích trực tiếp thiết thực cho công việc người Mục đích luận văn là: Trình bày kết nghiên cứu lý thuyết phục vụ cho chủ đề: “Nhận dạng chữ viết tay Tiếng Việt sử dụng mạng Nơron” Tuy nhiên, hạn chế mặt thời gian độ phức tạp toán mà khuôn khổ, thời lượng luận văn, sâu nghiên cứu đưa chương trình mô nhận dạng ký tự viết tay Tiếng Việt rời rạc trực tuyến sử dụng mạng Nơron Kohonen 10 CHƢƠNG MỘT SỐ VẤN ĐỀ VỀ MẠNG NƠRON 1.1 Mạng Nơron sinh học Bộ não người có khoảng 1010 tế bào thần kinh liên kết chặt chẽ với gọi nơ-ron Mỗi nơ-ron gồm có ba phần: Thân nơ-ron với nhân bên (soma), đầu sợi trục thần kinh (axon) hệ thống tế bào hình (dendrite) Tế bào hình có nhiệm vụ mang tín hiệu điện tới tế bào thân, tế bào thân thực gộp (Sum) phân ngưỡng (Thresholds) tín hiệu đến Sợi trục thần kinh làm nhiệm vụ đưa tín hiệu thân Trong thực tế có nhiều dây thần kinh vào chúng bao phủ diện tích lớn (0.25 mm2) để nhận tín hiệu từ nơ-ron khác Đầu thần kinh rẽ nhánh nhằm chuyển giao tín hiệu từ thân nơ-ron tới nơ-ron khác Các nhánh đầu thần kinh nối với khớp thần kinh (synapse) Các khớp thần kinh nối với thần kinh vào nơ-ron khác Sự xếp nơ-ron mức độ mạnh yếu khớp thần kinh định trình hóa học phức tạp, thiết lập chức mạng nơ-ron, nơ-ron sửa đổi tín hiệu khớp, nơ-ron nhân tạo gọi trọng số Có thể nói, mạng nơ-ron sinh học hoạt động chậm nhiều so với linh kiện điện tử (10-3 giây so với 10-9 giây), não thực nhiều công việc nhanh nhiều so với máy tính thông thường Do cấu trúc song song mạng nơ-ron sinh học thể toàn nơ-ron thực đồng thời thời điểm Mạng nơ-ron nhân tạo có đặc điểm Các mạng nơ-ron nhân tạo chủ yếu thực nghiệm máy tính mạnh có vi mạch tích hợp lớn, thiết bị quang, xử lý song song Điều 44 3.2.1.1 Xây dựng giao diện vẽ - Xây dựng giao diện đồ họa, cho phép người sử dụng dùng chuột vẽ ký tự cần nhận dạng - Tìm giới hạn trên, dưới, trái, phải ký tự sau vẽ - Cắt bỏ tất khoảng trống xung quanh ký tự vẽ, thu ảnh có hoàn toàn ký tự Như toán quy xử lý ảnh có ký tự mà không quan tâm ký tự vẽ vị trí Hình 3.1: Quá trình tìm giới hạn ký tự - Thực lấy mẫu xuống ảnh ký tự cách ánh xạ ký tự vào lưới có kích thước 10* 10 Bằng cách ta quy ký tự kích thước cố định, không cần quan tâm đến kích thước ký tự vẽ vào to hay nhỏ Hình 3.2: Quá trình lấy mẫu xuống 3.2.1.2 Xây dựng mạng nơron Kohonen Một việc quan trọng việc định cỡ mạng Việc định cỡ đầu vào phụ thuộc vào việc định cỡ lưới lấy mẫu xuống, Nếu ta chia 45 ảnh ký tự thành ma trận có kích thước lớn ký tự biểu diễn cách chi tiết Tuy nhiên, việc dẫn đến chi phí xử lý ma trận lớn Ngược lại, ta dùng ma trận kích thước nhỏ để biểu diễn ảnh ký tự dẫn đến việc mát thông tin Để cho cân hợp lý, ta chuẩn hóa cỡ ma trận 10*10, tức ảnh biểu diễn 100 phần tử Lớp đầu vào gồm 100 noron nhận giá trị từ 100 thành phần tương ứng véctơ đầu vào Dữ liệu đầu vào có từ việc véctơ hóa từ ma trận điểm ảnh ký tự phương pháp chia lưới Lớp đầu có số nơron với số mẫu nhập vào 3.2.1.3 Xử lý liệu (phân tích ảnh) Quá trình phân tích ảnh trình tìm đặc tính ký tự Các điểm ảnh giá trị đầu vào cho trình huấn luyện trình kiểm tra Quá trình phân tích dựa việc nhận dạng từ ảnh người sử dụng vẽ vào phương pháp tìm điểm đen RGB(0,0,0) điểm trắng RGB(255,255,255) Kết thu ma trận điểm ảnh Sau ma trận ánh xạ thành véctơ đầu vào có kích thước 100 phần tử Trước đưa vào mạng véctơ xử lý làm điểm ảnh thành véctơ gồm phần tử 0.5 -0.5 Hình 3.3: Quá trình ánh xạ từ ma trận điểm sang ma trận giá trị 46 3.2.1.4 Huấn luyện mạng nơron Kohonen.[2] Một mạng nơron xây dựng phải huấn luyện không gian đầu vào chuẩn bị trước Khi hoạt động, mạng nơron đọc giá trị huấn luyện Sự phức tạp tham số cho việc huấn luyện mạng: Việc chọn giá trị cho tham số (tốc độ học, số lần lặp cần thiết, giá trị ngưỡng lỗi ) dựa vào kinh nghiệm qua lần tiến hành thực nghiệm Mục đích trình huấn luyện hiệu chỉnh trọng số W cho giống với véctơ đầu vào Thực hiệu chỉnh véctơ trọng số ứng với ký tự mẫu Kết thu ma trận trọng số W giống với tập véctơ đầu vào Huấn luyện bao gồm bước: Thiết lập tham số đầu vào Tất mẫu đầu vào lấy mẫu hình ảnh ký tự xuống lưới kích thước 10*10 Ta ma trận hai chiều kích thước 10*10 có giá trị tương ứng với giá trị điểm ảnh Chuyển thành véctơ đầu vào có kích thước 10* 10 Đưa véctơ đầu vào vào mạng Thực tìm ma trận trọng số tốt theo sơ đồ thuật toán 47 Hình 3.4: Quá trình huấn luyện mạng nơron Kohonen 48 3.2.1.5 Nhận dạng mạng nơron Kohonen.[2] Quá trình nhận dạng diễn theo bước sau: Bước 1: Người sử dụng vẽ ký tự cần nhận dạng Bước 2: Ký tự lấy mẫu xuống lưới kích thước 10*10 Ta ma trận hai chiều kích thước 10* 10 có giá trị tương ứng với giá trị điểm ảnh Bước 3: Chuyển ma trận điểm ảnh thành véctơ đầu vào có kích thước 10* 10 bao gồm giá trị 0.5, - 0.5 Bước 4: Véctơ đầu vào đưa vào mạng nơron để tìm nơron chiến thắng Bước 5: Thiết lập mảng chứa ký tự tập mẫu, với số mạng tương ứng với số nơron đầu Bước 6: Ánh xạ nơron chiến thắng vào mảng để tìm ký tự tương ứng với nơron chiến thắng Bước 7: Hiển thị kết nhận dạng tương ứng với ký tự vẽ 3.2.1.6 Kết luận Có nhiều phương pháp để giải toán nhận dạng ký tự tiếng Việt Nếu áp dụng mạng nơron để giải quyết, thông thường người ta hay sử dụng mạng dẫn tiến đa lớp thuật toán lan truyền ngược cho việc thực nhận dạng Nhưng thấy số khó khăn vấn đề tìm số nơron lớp, lớp ẩn nhiều công thức tính toán hơn, lại phải xét lớp mạng Trong đó, mạng nơron Kohonen mạng phổ biến, có cấu trúc đơn giản hơn, bước thực rõ ràng, dễ dàng lựa chọn hiệu chỉnh tham số đầu vào, trình huấn luyện mạng nhanh, dễ hội tụ Các ký tự sau vẽ, lấy mẫu xuống đưa vào đầu mạng nơron Có nơron đầu vào cho điểm ảnh hình ảnh lấy mẫu xuống Vì hình ảnh lấy mẫu xuống có kích thước 10*10 nên có 100 nơron đầu vào Số nơron đầu số ký tự mẫu 49 Ngoài yếu tố đầu vào đầu có kết nối nơron Các trọng số không tất kết nối Mỗi kết nối định trọng số Trọng số yếu tố xác định đầu mạng nơron ứng với mẫu đầu vào Để xác định tổng số kết nối phải nhân số nơron đầu vào với số nơron đầu Mạng có kết nối đầy đủ nghĩa đầu vào kết nối với tất đầu Quá trình đào tạo trình tìm giá trị xác cho trọng số 3.2.2 Giao diện chương trình Hình 3.5: Giao diện chƣơng trình mô Một số chức chƣơng trình Vẽ chữ: Vùng để vẽ ký tự lên Tập mẫu: Chứa ký tự mẫu dùng để huấn luyện Mẫu: Tải tập ký tự mẫu tạo sẵn file: sample.xls Ghi: Ghi lại tập ký tự mẫu vào file: sample.xls 50 Học: Huấn luyện mạng Xóa mẫu: Xóa ký tự mẫu chọn Thêm ký tự: Dùng để thêm ký tự vào tập mẫu Nhận dạng: Nhận dạng ký tự vẽ vào Xóa chữ: Xóa ký tự vẽ vùng vẽ chữ Ma trận: Hiển thị ảnh ký tự lên lưới 3.2.3 Quá trình nhận dạng.[2] Chú ý: Mỗi lần ký tự vẽ để huấn luyện hay để nhận dạng, phải lấy mẫu xuống Chúng ta tải tập huấn luyện từ file tạo sẵn sample.xls cách nhấn nút "Mẫu" tự nhập mẫu để huấn luyện cách vẽ ký tự vào vùng vẽ ký tự nhấn "Thêm ký tự", có hộp thoại xuất hiện, nhắc bạn đánh vào ký tự tương ứng để nhận dạng ký tự tương ứng với ký tự vừa vẽ Sau nhập xong tập mẫu nhấn nút "Học" để huấn luyện cho mạng nơron Kohonen Quá trình huấn luyện hoàn thành, thực nhận dạng ký tự cách vẽ ký tự nhấn nút "Nhận dạng" Khi ký tự hiển thị lưới kích thước 10*10 Có thể xóa ký tự cách nhấn nút "Xóa ký tự", xóa mẫu tập mẫu cách chọn ký tự cần xóa nhấn nút "Xóa" Có thể ghi lại tập mẫu cách nhấn nút "Ghi", tập mẫu tạo lưu vào file sample.xls 3.3 Tính toán huấn luyện mạng Nơron 3.3.1 Tính toán đầu mạng KOHONEN.[2] Quá trình nhận dạng bắt đầu mà người sử dụng vẽ ký tự nhấn vào nút nhận dạng Đầu tiên ký tự lấy mẫu xuống thành hình ảnh kích thước 10*10 Hình ảnh lấy mẫu xuống phải từ mảng hai chiều 51 đến véctơ đầu vào mà dùng để đưa vào mạng Mạng nơron yêu cầu làm điểm đầu vào Vì gán giá trị 0.5 -0.5 cho điểm ảnh Một mảng 100 giá trị đưa vào đầu vào Điều thực cách gửi mảng đầu vào đến phương thức "winner" mạng Kohonen Nó trả lại nơron chiến thắng 100 đầu vào lưu số nguyên "best" Nơron chiến thắng hữu ích, không cho bạn thấy ký tự thực nhận dạng Để xếp nơron với ký tự nhận dạng được, hình ảnh ký tự mà mạng đào tạo phải đưa vào mạng nơron chiến thắng xác định Ví dụ, muốn đưa hình ảnh huấn luyện cho ký tự Ô vào mạng, nơron chiến thắng nơron #4, phải biết nơron #4 nơron học để nhận dạng mẫu ký tự Ô Điều thực cách gọi phương thức "mapNeurons" Phương thức "mapNeurons" trả lại mảng ký tự Chỉ số phần tử mảng tương ứng với nơron nhận dạng ký tự Phần lớn công việc thực tế thực mạng nơron thực phương thức "winner" Đầu tiên phương thức thực chuẩn hóa đầu vào, tính giá trị đầu cho nơron Nơron có giá trị lớn chọn nơron chiến thắng Đầu tiên biến "biggest" thiết lập giá trị nhỏ để chưa có nơron chiến thắng Trọng số nơron đầu tính cách lấy tích vô hướng trọng số nơron đầu đến nơron đầu vào Tích vô hướng tính cách nhân giá trị đầu vào với trọng số nơron đầu vào đầu Những trọng số định trình huấn luyện Đầu giữ giá trị lớn thiết lập nơron chiến thắng 52 Ta thấy tính kết từ mạng nơron trình nhanh Trên thực tế, xác định trọng số nơron phần phức tạp trình 3.3.2 Huấn luyện mạng nơron Kohonen Học trình lựa chọn ma trận trọng số nơron nhận mẫu đầu Một mạng Kohonen học cách liên tục đánh giá tối ưu hóa ma trận trọng số Để làm điều này, ma trận trọng số khởi tạo phải định Nó chọn giá trị ngẫu nhiên Khi ma trận trọng số khởi tạo ngẫu nhiên trình huấn luyện bắt đầu Đầu tiên, đánh giá ma trận trọng số để xác định mức lỗi hành Lỗi xác định trình ánh xạ đầu vào huấn luyện đến đầu tốt Lỗi tính toán phương thức "evaluateErrors" lớp KohonenNetwork Nếu mức lỗi nhỏ, nhỏ 10%, trình hoàn thành Quá trình huấn luyện bắt đầu người sử dụng nhấn vào nút: "Học" Quá trình tính số nơron đầu vào đầu Đầu tiên số nơron đầu vào định từ kích thước hình ảnh lấy mẫu xuống 100 Còn số đầu tương ứng với số ký tự mẫu Bây kích thước mạng nơron xác định, tập huấn luyện mạng nơron phải cấu trúc Tập huấn luyện cấu trúc để giữ số lượng xác số mẫu Với chương trình thử nghiệm demo thử với mẫu ký tự 150 mẫu độ xác nhận dạng ký tự > 85% Tiếp theo, hình ảnh đầu vào lấy mẫu xuống chép đến tập huấn luyện Đây vòng lặp cho tất mẫu đầu vào Cuối mạng cấu trúc tập huấn luyện đưa vào Với tập huấn luyện giao, phương thức "learn" gọi Nó điều chỉnh ma trận trọng số mạng huấn luyện 53 Phương thức học lặp với số vòng lặp không xác định Nhưng chắn ràng nhiều lần lặp Khi số mẫu huấn luyện phù hợp với nơron đầu ra, huấn luyện xảy nhanh Một thủ tục có tên "evaluateErrors" gọi để đánh giá trọng số làm việc tốt Điều xác định cách nhìn vào liệu huấn luyện đến nơron đầu tốt Nếu có nhiều nơron đầu kích hoạt cho mẫu huấn luyện tập trọng số không tốt Một tỷ lệ lỗi tính toán dựa tập huấn luyện truyền đến nơron đầu tốt Một lỗi xác định, phải xem có mức lỗi tốt từ trước đến không Nếu thỏa mãn lỗi đưa vào mức lỗi tốt trọng số nơron trì cách chép để lưu lại Tổng số nơron chiến thắng sau tính toán Điều cho phép ta xác định trường hợp nơron đầu kích hoạt Ngoài ra, tỷ lệ lỗi mức chấp nhận (10%) trình huấn luyện dừng Nếu nơron chiến thắng nơron buộc phải trở thành nơron chiến thắng Bây ma trận trọng số đánh giá, điều chỉnh dựa lỗi Các giá trị điều chỉnh tính toán lỗi xác định Quá trình hiệu chỉnh ma trận trọng số gồm hai bước tính toán lỗi điều chỉnh ma trận trọng số lỗi 10% Trên phương pháp huấn luyện mạng nơron Phương pháp điều chỉnh tính toán lỗi tập tin "KohonenNetwork.java" 54 3.4 Kết chƣơng trình Hình 3.6: Nhận dạng ký tự N Hình 3.7: Nhận dạng ký tự Ô 55 Hình 3.8: Nhận dạng ký tự Á 56 3.5 Kết đạt đƣợc, hƣớng phát triển 3.5.2 Kết đạt đƣợc - Nắm kiến thức mạng nơron nhân tạo mạng nơron Kohonen - Nắm đượcquy trình chung việc xây dựng hệ thống nhận dạng chữ viết - Sử dụng phương pháp tính tích vô hướng hai vector để tìm nơron thắng - Đưa phương pháp trích chọn đặc trưng cho nhận dạng ký tự quang (cụ thể chữ viết tay chuột) - Phát triển thành công phần mềm nhận dạng ký tự quang (cụ thể chữ viết tay chuột) - Chương trình ứng dụng bước đầu thử nghiệm, độ xác tập mẫu (150 mẫu) khoảng 85% 3.5.2 Hướng phát triển Bên cạnh kết đạt được, có vấn đề chưa đề cập, giải luận văn Trong thời gian tới, tiếp tục nghiên cứu hoàn thiện đề tài với mục tiêu đặt sau: Nâng cao hiệu độ xác hệ thống nhận dạng ký tự viết tay rời rạc tiếng Việt trực tuyến Xây dựng hệ thống nhận dạng chữ viết tay tiếng Việt sử dụng mạng nơron Luận văn phát triển cho nhận dạng văn viết tay 57 KẾT LUẬN Hiện nay, nước thực nghiên cứu khoa học chuyển dần sang hướng xây dựng hệ thống thông minh, mạng nơron lên giải pháp đầy hứa hẹn Nó thể ưu điểm bật so với hệ thống khác khả mềm dẻo, linh hoạt tính toán thô, điểm khác biệt quan trọng óc người với máy thông minh nhân tạo Nhưng mà đòi hỏi độ phức tạp cao thiết kế cài đặt hệ thống ứng dụng để đạt tính tốt Khả cải thiện không ngừng tương lai với phát triển mạch tích hợp phần cứng cỡ lớn nhớ ngày lớn cho phần mềm máy tính Một điều dễ nhận thấy mạng nơron mô trực tiếp não người mặt cấu trúc mục tiêu trình học quy tắc học đưa túy mang tính toán học chưa thực sự bắt chước mặt thần kinh sinh học trình học xảy não người Trong trình nghiên cứu ban đầu mức mô rời rạc, độ xác 85 % nên cần chỉnh sửa nâng cấp nghiên cứu Hướng phát triển sử dụng nhận dạng cho văn không dừng lại mức ký tự đề tài nghiên cứu Nhận dạng ảnh không viết tay Hi vọng nhận tham gia góp ý bạn bè, đồng nghiệp thầy cô để đề tài phát triển ứng dụng nhiều thực tiễn 58 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Lê Bá Dũng, Bài giảng lớp cao học “Mạng nơ ron ứng dụng”, ĐHCNTT& TT Thái nguyên, năm 2012 [2] Trịnh Thị Phương Thảo, Nhận dạng chữ viết tay Tiếng Việt sử dụng mạng Nơron, LV thạc sỹ, Trường Đại học Công nghệ thông tin Truyền thông, ĐHTN, năm 2011 [3] Lê Tiến Công, Nhận dạng ký tự số mạng Neuron, LV thạc sỹ, HV Kỹ thuật quân sự, năm 2009 [4] Lương Mạnh Bá, Nguyễn Thanh Thuỷ Nhập môn xử lý ảnh số, Nhà xuất Khoa học kỹ thuật, Hà Nội, năm 1999 Tiếng Anh [5] Amritha Sampath, Tripti C and Govindaru V Freeman code based online handwritten character recognition for malayalam using backpropagation neural networks Rajagiri School of Engineering and Technology, Kochi, India, 2012 [6] Dr Pankaj Agarwal Hand-Written Character Recognition Using Kohonen Network Dept of Computer Sc, IMS Engineering College, Ghaziabad, U.P, India, 2011 [7] L Behera and I Kar Intelligent systems and control: Principles and applications Oxford University Press , India , 2009 [8] C M Bishop Neural networks for pattern recognition Oxford University Press , USA, 1995 [9] J Mantas An over view of character recognition methodologies Pattern recognition, (6 ):4 – , 1986
- Xem thêm -

Xem thêm: Sử dụng mạng noron cho nhận dạng ký tự Tiếng Việt, Sử dụng mạng noron cho nhận dạng ký tự Tiếng Việt, Sử dụng mạng noron cho nhận dạng ký tự Tiếng Việt

Gợi ý tài liệu liên quan cho bạn

Nạp tiền Tải lên
Đăng ký
Đăng nhập