Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng

142 471 0
  • Loading ...
1/142 trang
Tải xuống

Thông tin tài liệu

Ngày đăng: 20/03/2015, 08:47

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NHA TRANG KHOA CÔNG NGHỆ THÔNG TIN HUỲNH MINH TRÍ TÌM HIỂU VÀ NÂNG CAO HIỆU QUẢ NHẬN DẠNG CHỮ VIẾT TAY RỜI RẠC DỰA TRÊN CÁC KỸ THUẬT LẤY ĐẶC TRƯNG VÀ PHÁT TRIỂN ỨNG DỤNG ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC Ngành Công nghệ thông tin CÁN BỘ HƯỚNG DẪN: ThS. Nguyễn Đình Cường Nha Trang – 2014 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN 1 MỤC LỤC MỤC LỤC 1 DANH MỤC CÁC CỤM TỪ VIẾT TẮT 4 DANH MỤC CÁC BẢNG 5 DANH MỤC CÁC HÌNH 6 DANH MỤC CÁC SƠ ĐỒ, BIỂU ĐỒ 8 MỞ ĐẦU 10 CHƯƠNG 1. TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY 11 1.1. Giới thiệu về bài toán nhận dạng chữ viết tay 11 1.2. Sơ lược về một số nghiên cứu trước đây 12 1.3. Quy trình thực hiện nhận dạng chữ viết tay 16 1.3.1. Sơ đồ tổng quát 16 1.3.2. Các giai đoạn thực hiện 18 CHƯƠNG 2. CÁC KỸ THUẬT RÚT TRÍCH ĐẶC TRƯNG TRONG BÀI TOÁN NHẬN DẠNG CHỮ VIẾT TAY 33 2.1. Ảnh hưởng giai đoạn rút trích đặc trưng đối với hiệu quả bài toán 33 2.2. Một số kỹ thuật rút trích đặc trưng đang được sử dụng 33 2.2.1. Kỹ thuật Zoning 33 2.2.2. Kỹ thuật Coutour profile 34 2.2.3. Kỹ thuật Projection 35 2.2.4. Kỹ thuật wavelet Haar 35 2.2.5. Kỹ thuật Diagonal based 37 2.2.6. Kỹ thuật Twelve Direction 40 2.2.7. Kỹ thuật tiếp cận cấu trúc 41 2.2.8. Kỹ thuật Hotspot 43 2.2.9. Kỹ thuật 40-Point 45 2.2.10. Kỹ thuật Background Directional Distribution 47 2 2.2.11. Kỹ thuật Shadow 48 2.2.12. Kỹ thuật Chain code histogram 50 2.2.13. Kỹ thuật Intersection 51 2.2.14. Kỹ thuật Straight line fitting 52 2.3. Giới thiệu kỹ thuật rút trích đặc trưng mới 53 2.4. Vấn đề cải tiến giai đoạn rút trích đặc trưng 57 2.4.1. Xu hướng cải tiến giai đoạn rút trích đặc trưng 57 2.4.2. Những cải tiến của một số kỹ thuật đã nêu 58 CHƯƠNG 3. MÔ HÌNH SVM (SUPPORT VECTOR MACHINE) 60 3.1. Giới thiệu mô hình SVM 60 3.2. Cơ sở toán học của mô hình SVM 62 3.2.1. Bài toán phân lớp nhị phân hoàn toàn 62 3.2.2. Bài toán phân lớp nhị phân không hoàn toàn 66 3.2.3. Vấn đề phân lớp đa lớp sử dụng mô hình SVM 68 3.2.4. Hàm nhân trong mô hình SVM 69 3.3. Nhận xét về mô hình SVM 70 CHƯƠNG 4. CHƯƠNG TRÌNH THỬ NGHIỆM CÁC KỸ THUẬT LẤY ĐẶC TRƯNG 71 4.1. Giới thiệu về các bộ dữ liệu 71 4.1.1. Bộ dữ liệu MNIST 71 4.1.2. Bộ dữ liệu MyCharacter 72 4.2. Môi trường và công cụ cài đặt 75 4.2.1. Môi trường cài đặt 75 4.2.2. Giới thiệu bộ công cụ CSharp-2.6 75 4.2.3. Cách thức sử dụng bộ công cụ CSharp-2.6 77 4.3. Các chương trình thử nghiệm 81 4.3.1. Điều kiện thí nghiệm 81 4.3.2. Giai đoạn tiền xử lý các bộ dữ liệu 81 3 4.3.3. Các kỹ thuật trích chọn đặc trưng đã sử dụng 81 4.3.4. Kết quả các thí nghiệm trước đây 82 4.3.5. Kết quả và phân tích các thí nghiệm hiện tại 83 4.3.6. Một vài nhận xét rút ra từ các thí nghiệm 113 CHƯƠNG 5. CÀI ĐẶT ỨNG DỤNG ĐỌC BẢNG ĐIỂM SINH VIÊN 115 5.1. Đặc tả ứng dụng 115 5.1.1. Đặc tả hệ thống 115 5.1.2. Đặc tả dữ liệu 119 5.1.3. Các chức năng của ứng dụng 124 5.2. Đánh giá ứng dụng và khả năng phát triển của ứng dụng 132 5.2.1. Kết quả thực hiện ứng dụng 132 5.2.2. Khả năng phát triển của ứng dụng 134 CHƯƠNG 6. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 135 6.1. Kết luận của đề tài 135 6.2. Hướng phát triển của đề tài 136 TÀI LIỆU THAM KHẢO 138 4 DANH MỤC CÁC CỤM TỪ VIẾT TẮT Từ viết tắt Giải thích SVM Support Vector Machine 5 DANH MỤC CÁC BẢNG Bảng 2.1. Cách phân giá trị gradient vào các bin 41 Bảng 4.1. So sánh ưu nhược điểm của một số kỹ thuật rút trích đặc trưng 113 Bảng 5.1. Mô tả vật lý của lược đồ quan hệ Subject 121 Bảng 5.2. Mô tả vật lý của lược đồ quan hệ Record 121 Bảng 5.3. Mô tả vật lý của lược đồ quan hệ Student 121 Bảng 5.4. Mô tả vật lý của lược đồ quan hệ RecordDetail 122 Bảng 5.5. Kết quả chạy ứng dụng trên một số bảng điểm 132 6 DANH MỤC CÁC HÌNH Hình 1.1. Cách xét góc nghiêng của ký tự 23 Hình 1.2. Cách tính tham số ρ và θ 25 Hình 1.3. Các khuôn mẫu để xét điểm đen cần lược bỏ 30 Hình 2.1. Cách phân vùng trong kỹ thuật Zoning 34 Hình 2.2. Cách lấy chu tuyến của ký tự 34 Hình 2.3. Cách lấy bản đồ chiếu của ký tự 35 Hình 2.4. Cách phân bốn tiểu vùng của wavelet Haar 37 Hình 2.5. Minh họa quá trình phân vùng và lấy đường chéo 38 Hình 2.6. Cách phân giá trị gradient vào 6 bin 42 Hình 2.7. Cách đặt vị trí các hotspot 43 Hình 2.8. Cách chia 16 vùng trong kỹ thuật 40-Point 45 Hình 2.9. Cách lấy vùng 29, 30 và 31 46 Hình 2.10. Cách lấy các vùng từ 33 đến 40 47 Hình 2.11. La bàn 8 hướng trong Background Directional Distribution 47 Hình 2.12. Các mặt nạ tương ứng với 8 hướng 48 Hình 2.13. Cách tính hình chiếu cho kỹ thuật Shadow 49 Hình 2.14. Cách xác định độ dài hình chiếu 49 Hình 2.15. La bàn 8 hướng trong Chain code histogram 50 Hình 2.16. Các giá trị nhãn bin và mốc tính bin 54 Hình 2.17. Vị trí của 5 vùng đặc biệt 54 Hình 2.18. Vị trí 5 vùng đặc biệt đối với hai mẫu dữ liệu 55 7 Hình 2.19. Vị trí bốn tiểu vùng trong một vùng 55 Hình 2.20. Phân vùng kích thước 30 × 20 58 Hình 3.1. Minh họa bài toán SVM trong không gian 2 chiều 61 Hình 3.2. Vị trí siêu phẳng trong không gian 2 chiều 63 Hình 4.1. Một số mẫu trích từ bộ dữ liệu MNIST 72 Hình 4.2. Một số mẫu trích từ bộ dữ liệu MyCharacter 74 Hình 5.1. Minh họa một bảng điểm sinh viên 119 Hình 5.2. Vùng cần lấy thông tin 126 Hình 5.3. Minh họa một ô điểm đã được cắt ra 127 Hình 5.4. Giao diện màn hình sử dụng 130 Hình 5.5. Giao diện màn hình cập nhật cơ sở dữ liệu 131 Hình 5.6. Giao diện xem bảng điểm đã có trong cơ sở dữ liệu 132 Hình 5.7. Điểm số ghi lọt ra ngoài khung điểm 133 Hình 5.8. Điểm được chỉnh sửa ngay trên bảng điểm 134 8 DANH MỤC CÁC SƠ ĐỒ, BIỂU ĐỒ Sơ đồ 1.1. Cấu trúc chung của một hệ thống nhận dạng 16 Sơ đồ 1.2. Vị trí của giai đoạn huấn luyện 31 Sơ đồ 2.1. Thuật toán Diagonal based 39 Sơ đồ 2.2. Thuật toán Hotspot 44 Sơ đồ 4.1. Quá trình biên dịch bộ công cụ CSharp-2.6 77 Sơ đồ 5.1. Cấu trúc hệ thống nhận dạng bảng điểm sinh viên 116 Sơ đồ 5.2. Mô hình quan niệm dữ liệu của hệ thống 120 Sơ đồ 5.3. Cấu trúc bộ xử lý bảng điểm 125 Biểu đồ 4.1. Kết quả trên MyCharacter của Diagonal based 84 Biểu đồ 4.2. Kết quả trên MNIST của Diagonal based 85 Biểu đồ 4.3. Thí nghiệm Twelve Direction trên MyCharacter và MNIST 87 Biểu đồ 4.4. Tìm xương ký tự đối với Twelve Direction 88 Biểu đồ 4.5. Kích thước ma trận chuẩn hóa đối với Twelve Direction 90 Biểu đồ 4.6. Việc lấy trung bình đối với Twelve Direction 91 Biểu đồ 4.7. Kết quả trên MyCharacter và MNIST của Hotspot 93 Biểu đồ 4.8. Việc tìm xương ký tự đối với Hotspot 94 Biểu đồ 4.9. Kết quả trên MyCharacter và MNIST của 40-Point 96 Biểu đồ 4.10. Việc tìm xương ký tự đối với 40-Point 97 Biểu đồ 4.11. So sánh bốn kỹ thuật lấy đặc trưng 99 Biểu đồ 4.12. Kích thước ma trận chuẩn hóa với Dense Distribution 101 Biểu đồ 4.12. Việc phân bin và xét phân bố đối với Dense Distribution 103 Biểu đồ 4.13. Việc chọn nhãn bin đối với Dense Distribution 104 [...]... lựa chọn đề tài Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng trong đồ án tốt nghiệp này Một cách khái quát, bài toán nhận dạng chữ viết tay rời rạc bao gồm các bước tiền xử lý ảnh ký tự, rút trích đặc trưng, huấn luyện và nhận dạng Ở mỗi một bước đều có những thuật toán riêng để áp dụng, với những điều kiện và hoàn cảnh cụ... hưởng đến hiệu quả nhận dạng cuối cùng Trong đó, để nâng cao hiệu quả của bộ nhận dạng, nhiều nhà nghiên cứu đã chọn cải tiến kỹ thuật rút trích đặc trưng, vì nhận dạng thực chất là một quá trình làm thế nào để có thể phân biệt được các vector đặc trưng từ các mẫu dữ liệu của các lớp Một kỹ thuật rút trích đặc trưng được coi là càng tốt khi thông qua kỹ thuật đó, giữa các vector đặc trưng của các mẫu... nét sẽ được ghi nhận để phục vụ cho quá trình nhận dạng) và nhận dạng chữ viết tay off-line (nhận dạng trên hình ảnh đã được scan, chụp lại từ các ký tự) 1.2 Sơ lược về một số nghiên cứu trước đây Trong suốt những năm qua, công tác nghiên cứu lý thuyết và ứng dụng trên bài toán nhận dạng chữ viết tay nói riêng và chữ viết nói chung đã và đang phát triển rất mạnh Hàng loạt các bài báo, các đồ án tốt nghiệp... nhằm tìm hiểu và nâng cao hiệu quả của bài toán nhận dạng chữ viết tay rời rạc thông qua việc cải thiện các kỹ thuật rút trích đặc trưng ký tự, đồng thời trên nền tảng đó đề xuất ra một kỹ thuật rút trích đặc trưng mới Bên cạnh đó, đồ án cũng trình bày và nắm bắt nội dung của mô hình SVM (Support Vector Machine) – một trong những mô hình nhận dạng đang được sử dụng phổ biến hiện nay Sau đó, sử dụng. .. luyện, và cũng có thể là các thông số của mô hình Support Vector Machine  Nhận dạng: là bộ sẽ dựa trên cơ sở dữ liệu nhận dạng và các đặc trưng của bộ dữ liệu nhận dạng (Test Set) để đưa ra quyết định một vector đặc trưng từ một mẫu của Test Set sẽ tương ứng với ký tự nào 18  Kết quả nhận dạng: thu nhận kết quả có được từ bộ Nhận dạng và đưa vào lưu trữ ở dạng văn bản, hiển thị lên màn hình,… 1.3.2 Các. .. họ đã sử dụng ba bộ dữ liệu là chữ viết Hindi (tiếng Ấn Độ), chữ viết tiếng Anh và một số ký tự đặc biệt, được nhận dạng bằng mạng nơ ron nhân tạo lan truyền ngược lỗi Kết quả đạt được trong nghiên cứu này là 97% Hallale S.B và Salunke G.D cũng đưa ra nghiên cứu về kỹ thuật lấy đặc trưng trên các ký tự viết tay tiếng Anh (chữ cái và chữ số)[17] Họ cũng chọn việc phân các giá trị gradient vào 12 bin,... đa dạng của các ký tự viết tay phụ thuộc rất nhiều đến từng người Nói cách khác, tương ứng với mỗi một người sẽ có một bộ ký tự viết tay cho riêng họ trong ngôn ngữ mà họ sử dụng Hai bài toán đã và đang được nghiên cứu hết sức rộng rãi trong việc nhận dạng chữ viết tay là nhận dạng on-line (nhận dạng ngay trong quá trình người viết viết ra ký tự đó, có thể là trên các thiết bi khác nhau, khi đó các. .. J và đồng nghiệp đã nêu ra các bước cần thực hiện trong bài toán nhận dạng chữ viết tay gồm số hóa ảnh ký tự, tiền xử lý, phân đoạn, rút trích đặc trưng, phân lớp và hậu xử lý Các kỹ thuật lấy đặc trưng được đề cập gồm hai hướng tiếp cận là đặc trưng toàn cục hay thống kê (global or statistical features) và đặc trưng cấu trúc hay hình học (structural or topological features) Bên cạnh đó, các kỹ thuật. .. được giới thiệu Dưới đây là một vài nghiên cứu trong số đó Phạm Anh Phương, trong nghiên cứu ở [3] đã giới thiệu một số kỹ thuật lấy đặc trưng đơn giản nhưng hiệu quả cho bài toán nhận dạng chữ viết tay Các kỹ thuật được giới thiệu gồm kỹ thuật Zoning (trọng số vùng), Projection (hình chiếu), Contour profile (trích chọn chu tuyến) và wavelet Haar, được thực hiện trên bộ dữ 13 liệu MNIST Kết quả nghiên... đặc trưng cần phải tránh được tổn thất thông tin, thêm vào đó là thu gọn kích thước dữ liệu để đảm bảo nâng cao hiệu quả của bộ nhận dạng Sau đây là một số kỹ thuật trích chọn đặc trưng:  Kỹ thuật trọng số vùng (Zoning)  Kỹ thuật bản đồ chiếu (Projection)  Kỹ thuật trích chọn chu tuyến (Countour profile)  Kỹ thuật wavelet Haar  Kỹ thuật Hotspot Trong chương 2 sẽ trình bày cụ thể một số kỹ thuật . tài Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng trong đồ án tốt nghiệp này. Một cách khái quát, bài toán nhận dạng. DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NHA TRANG KHOA CÔNG NGHỆ THÔNG TIN HUỲNH MINH TRÍ TÌM HIỂU VÀ NÂNG CAO HIỆU QUẢ NHẬN DẠNG CHỮ VIẾT TAY RỜI RẠC DỰA TRÊN CÁC KỸ THUẬT LẤY ĐẶC TRƯNG. nhằm tìm hiểu và nâng cao hiệu quả của bài toán nhận dạng chữ viết tay rời rạc thông qua việc cải thiện các kỹ thuật rút trích đặc trưng ký tự, đồng thời trên nền tảng đó đề xuất ra một kỹ thuật
- Xem thêm -

Xem thêm: Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng, Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng, Tìm hiểu và nâng cao hiệu quả nhận dạng chữ viết tay rời rạc dựa trên các kỹ thuật lấy đặc trưng và phát triển ứng dụng

Từ khóa liên quan

Gợi ý tài liệu liên quan cho bạn