Nâng cao chất lượng hệ thống nhập điểm tự động theo Form

84 350 0
Nâng cao chất lượng hệ thống nhập điểm tự động theo Form

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CNTT & TRUYỀN THÔNG  Vũ Thị Hồng Thƣ NÂNG CAO CHẤT LƢỢNG HỆ THỐNG NHẬP ĐIỂM TỰ ĐỘNG THEO FORM LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2012 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CNTT & TRUYỀN THÔNG  Vũ Thị Hồng Thƣ NÂNG CAO CHẤT LƢỢNG HỆ THỐNG NHẬP ĐIỂM TỰ ĐỘNG THEO FORM Chuyên ngành: Khoa học máy tính Mã số: 60.48.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH NGƯỜI HƯỚNG DẪN KHOA HỌC TS. Nguyễn Thị Hồng Minh Thái Nguyên - 2012 i Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn LỜI CAM ĐOAN Tôi xin cam đoan kết quả trong luận văn là sản phẩm của riêng cá nhân tôi. Trong toàn bộ nội dung của luận văn, những điều được trình bày hoặc là của cá nhân hoặc là được tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp. Tôi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan của mình. Thái Nguyên, ngày 10 tháng 10 năm 2012 Người cam đoan Vũ Thị Hồng Thƣ ii Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỤC LỤC Trang Trang bìa Trang phụ bìa LỜI CAM ĐOAN i MỤC LỤC ii DANH MỤC CÁC BẢNG v DANH MỤC CÁC HÌNH VẼ, ẢNH CHỤP vi MỞ ĐẦU 1 Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG FORM MẪU 3 1.1. Khái quát về xử lý ảnh 3 1.1.1. Xử lý ảnh là gì? 4 1.1.2. Các vấn đề cơ bản của xử lý ảnh 6 1.1.2.1. Một số khái niệm cơ bản 6 1.1.2.2. Biểu diễn ảnh trong máy tính 10 1.1.2.3. Phân loại ảnh 11 1.1.2.4. Quan hệ giữa các điểm ảnh 12 1.2. Nhận dạng form mẫu 14 1.2.1. Form mẫu và biểu diễn form mẫu 14 1.2.1.1. Khái niệm form mẫu 14 1.2.1.2. Biểu diễn form mẫu 14 1.2.1.3. Phân tách vùng chứa dữ liệu 17 1.2.1.4. Tách dòng và tách kí tự 18 1.2.1.5. Trích rút đặc trưng 19 1.2.2. Nhận dạng chữ viết trong form 20 1.2.2.1. Sơ đồ tổng quát của một hệ nhận dạng chữ 20 1.2.2.2. Một số thuật toán nhận dạng chữ 21 iii Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Chương 2: MỘT SỐ KỸ THUẬT NÂNG CAO CHẤT LƢỢNG NHẬN DẠNG FORM ĐIỂM 30 2.1. Kỹ thuật nâng cao chất lƣợng ảnh form 30 2.1.1. Tăng, giảm độ sáng 30 2.1.2. Tăng, giảm độ tương phản 31 2.1.3. Tách ngưỡng 32 2.1.3.1. Phương pháp ngưỡng toàn cục 32 2.1.3.2. Phương pháp ngưỡng tự động 34 2.1.4. Loại bỏ nhiễu 35 2.1.4.1. Nhiễu ảnh 36 2.1.4.2. Một số kiểu nhiễu 36 2.1.4.3. Phương pháp lọc nhiễu 37 2.1.5. Các phép biến đổi hình học 47 2.1.5.1. Phép dịch ảnh 47 2.1.5.2. Phép quay ảnh 47 2.1.5.3. Phóng to hoặc thu nhỏ 49 2.2. Một số kỹ thuật hiệu chỉnh form mẫu 50 2.2.1. Hiệu chỉnh độ dịch chuyển 50 2.2.2. Hiệu chỉnh góc lệch 52 2.2.2.1. Phương pháp chiếu nghiêng 52 2.2.2.2. Phương pháp biến đổi Hough 54 2.2.2.3. Phương pháp người láng giềng gần nhất 60 2.3. Một số kỹ thuật nâng cao chất lƣợng chữ viết trong form 61 2.3.1. Khử nhiễu 61 2.3.2. Làm trơn chữ 61 2.3.3. Làm đầy chữ 63 2.3.4. Làm mảnh chữ 63 2.3.5. Xoay văn bản đi một góc 64 iv Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn Chương 3: THIẾT KẾ CHƢƠNG TRÌNH VÀ KẾT QUẢ THỬ NGHIỆM 65 3.1. Bài toán 65 3.2. Phân tích, thiết kế chƣơng trình 65 3.2.1. Chuyển đổi sang ảnh nhị phân 66 3.2.2. Loại bỏ nhiễu 67 3.2.3. Tách dòng và trích rút vùng cần lấy dữ liệu 68 3.2.4. Tách ký tự trên một dòng 69 3.2.5. Mô tả chương trình chính 70 3.3. Kết quả chƣơng trình 73 PHẦN KẾT LUẬN 74 DANH MỤC TÀI LIỆU THAM KHẢO 75 v Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn DANH MỤC CÁC BẢNG Số hiệu bảng Tên bảng Trang 2.1 Mặt nạ thông thấp 40 2.2 Mặt nạ thông cao 41 3.1 Biểu đồ và ngưỡng tối ưu 65 3.2 Kết quả chuyển đổi ảnh xám sang ảnh nhị phân 66 3.3 Kết quả thực nghiệm 72 vi Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn DANH MỤC CÁC HÌNH VẼ, ẢNH CHỤP Số hiệu hình vẽ Tên hình vẽ Trang 1.1 Quá trình xử lý ảnh 4 1.2 Các bước cơ bản trong xử lý ảnh 4 1.3 Mô hình màu RGB 8 1.4 Mô hình màu CMY 8 1.5 Ảnh nhị phân có kích thước 88 10 1.6 Lân cận các điểm ảnh của toạ độ (x,y) 11 1.7 Ví dụ mô tả cấu trúc vật lý, logic của tài liệu 15 1.8 Mẫu bảng điểm thu nhận từ máy quét 16 1.9 Ảnh được tách thành 2 vùng để xử lý 17 1.10 Bức ảnh trước khi điều chỉnh kích thước 18 1.11 Bức ảnh sau khi điều chỉnh kích thước thành 75 19 1.12 Sơ đồ quá trình nhận dạng chữ 19 1.13 Chữ P 21 1.14 Quá trình nhận dạng theo cấu trúc 23 1.15 Điểm kết thúc và chạc ba 24 1.16 Cấu trúc mạng nơron 25 1.17 Lược đồ thuật toán huấn luyện mạng 26 1.18 Lược đồ thuật toán BackPropagation 28 2.1 Tăng, giảm độ sáng 30 2.2 Tăng, giảm độ tương phản 31 2.3 Ảnh gốc và ảnh thu được qua lọc trung bình 38 2.4 Ảnh gốc và ảnh thu được qua lọc thông thấp 39 2.5 Sơ đồ lọc thông cao 40 2.6 Ảnh gốc và ảnh thu được qua lọc thông cao 41 2.7 Ảnh gốc và ảnh thu được qua lọc trung vị 43 2.8 Ví dụ bộ lọc giữ biên 44 vii Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 2.9 Các toán tử gờ sai phân 45 2.10 Hệ tọa độ khi xoay ảnh 47 2.11 Ảnh xoay -10 o 47 2.12 Ảnh xoay sau khi suy ngược từ ảnh gốc 48 2.13 (a) là ảnh mẫu (b) là ảnh cần nhận dạng 49 2.14 Mô hình biểu đồ tần suất của ảnh mẫu và ảnh cần nhận dạng 50 2.15 Kết quả chiếu ngang và chiếu dọc của một trang tài liệu 52 2.16 Ảnh gốc (a) và ảnh khi bị nghiêng 5 0 53 2.17 Phép chiếu ngang của hình 2.16 53 2.18 Mảng chỉ số [a, b] và các giá trị 55 2.19 Ví dụ biến đổi Hough cho đường thẳng 55 2.20 Đường thẳng Hough trong tọa độ cực 56 2.21 Áp dụng biến đổi Hough phát hiện góc 57 2.22 Biểu đồ minh hoạ phương pháp người láng giềng gần nhất 59 2.23 Làm trơn biên chữ 61 2.24 Các điểm lân cận gradient 62 2.25 Làm mảnh chữ 63 3.1 Lược đồ thuật toán nhận dạng kí tự 64 3.2 Ảnh trước khi lọc nhiễu 66 3.3 Ảnh sau khi được lọc nhiễu 66 3.4 Ảnh gốc cần tách thành các dòng riêng biệt 67 3.5 Dòng thứ nhất được tách ra từ ảnh gốc ở hình 3.3 67 3.6 Dòng thứ 2 được tách ra từ ảnh gốc ở hình 3.3 67 3.7 Dòng thứ 3 được tách ra từ ảnh gốc ở hình 3.3 67 3.8 Dòng thứ 4 được tách ra từ ảnh gốc ở hình 3.3 67 3.9 Dòng thứ 5 được tách ra từ ảnh gốc ở hình 3.3 68 3.10 Kết quả của việc tách kí tự trên dòng 1 68 3.11 Kết quả của việc tách kí tự trên dòng 3 68 3.12 Form đăng nhập 69 3.13 Form cho phép người dùng cập nhật điểm từ file ảnh 69 3.14 Kết quả hiển thị file ảnh của form điểm 70 3.15 Dữ liệu điểm được cập nhật vào CSDL quản lý thi 71 1 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn MỞ ĐẦU Một trong những giai đoạn khó khăn nhất của công nghệ thông tin là làm cho máy tự động thu nhận, hiểu được ngôn ngữ tự nhiên của chữ viết và tiếng nói. Trong đó nhận dạng chữ viết là một lĩnh vực được nghiên cứu phổ biến, nó đã được nghiên cứu từ hơn nửa thập kỷ qua. Ngày nay nhận dạng chữ viết đã nhận được sự quan tâm đáng kể và nhận dạng chữ viết tay là một đề tài rất quan trọng trong những ứng dụng khác nhau như tình báo, kỹ thuật robot, Đã có nhiều thuật toán nhận dạng được đưa ra, luôn được cải tiến và phát triển để đáp ứng được nhu cầu của xã hội. Các nghiên cứu về nhận dạng chữ viết tay đã đạt được nhiều thành quả thiết thực tại nhiều nước trên thế giới. Tuy nhiên, ở Việt Nam vẫn còn ít người nghiên cứu. Cùng với sự phát triển nhanh chóng về phần cứng máy tính, các phần mềm càng trở nên đa dạng, phong phú, hoàn thiện hơn và hỗ trợ hiệu quả hơn cho con người. Ngày nay, các phần mềm mô phỏng nghiệp vụ phức tạp ngày càng nhiều, hỗ trợ cho người sử dụng một cách thuận tiện, thời gian xử lý công việc nhanh chóng và một số nghiệp vụ được tự động hóa cao. Hiện nay, công việc quản lý điểm, quản lý thi trong công tác đào tạo của các trường đã được đơn giản hóa rất nhiều nhờ vào việc sử dụng phần mềm. Tuy nhiên, một vấn đề làm mất không ít thời gian là nhập điểm thi từ phiếu điểm vào trong cơ sở dữ liệu, đặc biệt là đối với những trường trung học phổ thông có số lượng học sinh nhiều và các kỳ thi là thường xuyên (thi khảo sát đầu năm, thi giữa kỳ I, thi hết học kỳ I, thi giữa kỳ II, thi hết học kỳ II, thi nghề phổ thông, thi thử tốt nghiệp, và thi tốt nghiệp trung học phổ thông) thì đây thực sự là một công việc có khối lượng lớn và dễ gây ra nhầm lẫn. Xuất phát từ thực tế đó, luận văn “Nâng cao chất lượng hệ thống nhập điểm tự động theo Form” có tính thời sự và có ý nghĩa thực tiễn cao. [...]... thuật nâng cao chất lượng ảnh form, chữ viết trong form và một số kỹ thuật hiệu chỉnh form mẫu Chương 3: Chương trình thử nghiệm Chương 3 trình bầy về thiết kế hệ thống Nâng cao chất lượng hệ thống nhập điểm tự động theo Form và các kết quả của chương trình thử nghiệm Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 3 Chương 1 KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG FORM MẪU... - Hải Phòng Hệ thống nhập điểm tự động đã giải quyết được những khó khăn và bất tiện của chương trình quản lý thi hiện có để lại Nội dung của luận văn gồm có 3 chương: Chương 1: Khái quát về xử lý ảnh và nhận dạng form mẫu Chương 1 giới thiệu khái quát về xử lý ảnh và form mẫu, một số thuật toán nhận dạng chữ viết trong form Chương 2: Một số kỹ thuật nâng cao chất lượng nhận dạng form điểm Chương 2... hơn Các công đoạn chính của hệ thống nhập điểm tự động bao gồm: - Phiếu điểm viết tay của giáo viên tại trường trung học phổ thông Thụy Hương - Kiến Thụy - Hải Phòng qua máy quét thu được hình ảnh và đưa vào máy tính - Phân vùng ảnh thành 2 vùng cần thiết: Số báo danh và điểm thi - Nhận dạng điểm viết tay tương ứng với số báo danh dựa trên 2 vùng được trích rút từ form điểm - Cập nhật vào cơ sở dữ... 183mm ứng với màn hình CGA 200 điểm ảnh theo chiều dọc Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là ≈ 1mm.[2] Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board Distance) giữa điểm ảnh p, q được xác định như sau: D8(p,q) = max (| x-s | , | y-t |) 1.2 Nhận dạng form mẫu 1.2.1 Form mẫu và biểu diễn form mẫu 1.2.1.1 Khái niệm form mẫu Form mẫu là form dùng để nhập dữ liệu, có cấu trúc... lớn gấp 3 lần một ảnh đa cấp xám cùng kích thước 1.1.2.4 Quan hệ giữa các điểm ảnh Một ảnh số giả sử được biểu diễn bằng hàm f(x, y) Tập con các điểm ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q Chúng ta nêu một số các khái niệm sau: a) Các lân cận của điểm ảnh Giả sử có điểm ảnh p tại toạ độ (x, y) p có 4 điểm lân cận gần nhất theo chiều đứng và ngang (có thể coi như lân cận 4 hướng chính:... duyệt theo chiều ngang để tìm số điểm cắt theo chiều ngang Gọi Hi là số điểm cắt ngang của dòng thữ i Như vậy H 1 H2, , HWChar sẽ là dãy các điểm cắt ngang Tương tự như vậy, gọi Vi là số điểm cắt dọc tại cột thứ i Như vậy V1 V2, , VHChar sẽ là dãy các điểm cắt dọc Bỏ qua các điểm 0 ở đầu và cuối 2 dãy, ta có 2 dãy con H = H 1, H2, , Hni và V1, V2 , , Vni sẽ là dãy các điểm cắt dọc như chỉ ra trong hình... song nếu chất lượng quét tồi, các điểm chữ bị mất nhiều, trọng tâm bị lệch do đó sẽ ảnh hưởng đến chất lượng nhận dạng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 22  Kỹ thuật nhận dạng dựa vào đối sánh các điểm cắt dọc và cắt ngang Kỹ thuật này nhằm khắc phục một số nhược điểm của kỹ thuật trên Giả sử chữ cô lập có kích thước WChar và HChar Chúng ta duyệt theo chiều...2 Mục đích của luận văn là xây dựng hệ thống nhập điểm tự động Đây là một hê thông co kha năng phân tích hì nh anh , nhận dạng chữ viết trên phiếu ̣ ́ ́ ̉ ̉ điểm được đưa vào chương trình dưới dạng file ảnh Từ đó xác định các thông tin liên quan như: Họ tên học sinh, lớp, điểm các môn thi, Cuối cùng chương trình sẽ cập nhật các thông tin trên vào cơ sở... giải càng cao thì càng rõ nét và ngược lại Ví dụ một ảnh số có độ phân giải là 800600 Pixel nghĩa là có 800 điểm theo chiều ngang và 600 điểm theo chiều dọc.[1] Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn 8 * Ảnh: Là tập hợp hữu hạn các điểm ảnh, thường được biểu diễn bằng một mảng hai chiều I(n,m) với n là số hàng, m là số cột Ta ký hiệu P(x,y) là một điểm ảnh tại... vì chữ A có 2 điểm nối (chạc 3) mà chữ R chỉ có một Cuối cùng ta có một phân hoạch không gian theo yêu cầu và chuyển sang bước trích chọn đặc trưng  Trích chọn các đặc trưng Các đặc trưng của ký tự cần trích chọn bao gồm các điểm kết thúc, các chạc ba Điểm kết thúc chỉ có duy nhất 1 trong các 8 láng giềng là đen (a,b) Điểm chạc ba thỏa mãn các điều kiện c,d,e (a) (b) (c) (d) Hình 1.15 : Điểm kết thúc . việc có khối lượng lớn và dễ gây ra nhầm lẫn. Xuất phát từ thực tế đó, luận văn Nâng cao chất lượng hệ thống nhập điểm tự động theo Form có tính thời sự và có ý nghĩa thực tiễn cao. 2 Số. thuật nâng cao chất lượng ảnh form, chữ viết trong form và một số kỹ thuật hiệu chỉnh form mẫu. Chương 3: Chương trình thử nghiệm. Chương 3 trình bầy về thiết kế hệ thống Nâng cao chất lượng hệ. TRƢỜNG ĐẠI HỌC CNTT & TRUYỀN THÔNG  Vũ Thị Hồng Thƣ NÂNG CAO CHẤT LƢỢNG HỆ THỐNG NHẬP ĐIỂM TỰ ĐỘNG THEO FORM LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2012

Ngày đăng: 08/11/2014, 21:53

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan