Phát hiện độ dịch chuyển của phiếu điểm

100 102 0
Phát hiện độ dịch chuyển của phiếu điểm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO SƠN PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - 2015 ĐẠI HỌC THÁ I NGUYÊN ii ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG ĐÀO SƠN PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: PGS.TS ĐỖ NĂNG TOÀN Thái Nguyên - 2015 i LỜI CAM ĐOAN Tôi xin cam đoan kết luận văn sản phẩm riêng cá nhân tơi Trong tồn nội dung luận văn, điều trình bày cá nhân tổng hợp từ nhiều nguồn tài liệu Tất tài liệu tham khảo có xuất xứ rõ ràng trích dẫn hợp pháp Tơi xin hoàn toàn chịu trách nhiệm theo quy định cho lời cam đoan Người cam đoan Đào Sơn Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ ii LỜI CẢM ƠN Trước hết em xin gửi lời cảm ơn sâu sắc đến thầy hướng dẫn khoa học PGS.TS Đỗ Năng Toàn dẫn khoa học, định hướng nghiên cứu tận tình hướng dẫn tơi suốt trình làm luận văn Em xin cảm ơn Thầy viện Công Nghệ Thông Tin, Thầy Cô trường Đại học Công Nghệ Thông Tin Truyền Thông - Đại học Thái Nguyên quan tâm bảo trực tiếp giảng dạy, giúp đỡ suốt q trình học tập nghiên cứu Tơi xin chân cảm ơn lãnh đạo phòng, ban trường Cao đẳng Cơ khí – Luyện kim tạo điều kiện cho học tập nghiên cứu đề tài Cuối cùng, tơi xin cảm ơn gia đình bạn bè, người ủng hộ động viên để yên tâm nghiên cứu luận văn Đào Sơn Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC HÌNH ẢNH .v MỞ ĐẦU Chương : KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG BIỂU MẪU 1.1 KHÁI QUÁT VỀ ẢNH XỬ LÝ 1.1.1 Xử lý ảnh 1.1.2 Mô tả ảnh 1.1.2.1 Picture Element: phần tử ảnh 1.1.2.2 Grey level: mức xám 1.1.2.3 Quan hệ điểm ảnh 1.1.3 Các vấn đề xử lý ảnh 11 1.1.3.1 Kỹ thuật tăng, giảm độ sáng 12 1.1.3.2 Kỹ thuật tăng, giảm độ tương phản 13 1.1.3.3 Tách ngưỡng 14 1.1.3.4 Chuyển đổi sang ảnh nhị phân 14 1.1.3.5 Loại bỏ nhiễu 17 1.2 NHẬN DẠNG PHIẾU ĐIỂM 21 1.2.1 Biểu diễn phiếu điểm 21 Số hóa Trung tâm Học liệu ĐHTN http://www.lrctnu.edu.vn/ 1.2.1.1 Cấu trúc vật lý 22 1.2.1.2 Cấu trúc logic 23 1.2.2 Phân tách vùng chứa liệu 24 1.2.3 Tách dòng tách kí tự 27 Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ 1.2.3.1 Giải thuật Horizontal Projection 27 1.2.3.2.Giải thuật Vertical Projection 27 1.2.4 Trích rút đặc trưng 28 Chương : KỸ THUẬT PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM 29 2.1 KHỬ NHIỄU 29 2.1.1 Nhiễu ảnh 29 2.1.2 Khử nhiễu 30 2.1.2.1 Lọc tuyến tính (Linear Filter) 30 2.1.2.2 Lọc phi tuyến (NonLinear Filter) 36 2.1.2.3 Mặt nạ gờ sai phân làm nhăn (Unharp Masking and Crispering) 40 2.1.2.4 Lọc thông thấp, thông cao lọc dải thông 40 2.2 PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM DỰA VÀO HISTOGRAM 42 2.3 PHÁT HIỆN ĐỘ DỊCH CHUYỂN PHIẾU ĐIỂM THEO VĂN BẢN MẪU 50 Chương : CHƯƠNG TRÌNH THỬ NGHIỆM 55 3.1 Bài toán 55 3.2 Phân tích tốn 55 3.3 Chương trình thử nghiệm 56 PHẦN KẾT LUẬN 64 TÀI LIỆU THAM KHẢO 66 Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ DANH MỤC HÌNH ẢNH Hình 1.1: Q trình xử lý ảnh Hình 1.1: Các bước xử lý ảnh Hình 1.3: Ví dụ lược đồ xám Hình 1.4: Lân cận điểm ảnh toạ độ (x,y) Hình 1.5 Ảnh gốc Hình 1.6 Ảnh giảm độ sáng Hình 1.7 Ảnh tăng cường độ sáng Hình 1.8 Ảnh gốc Hình 1.9 Ảnh giảm độ tương phản Hình 1.10 Ảnh tăng độ tương phản Hình 1.11 Mơ thuật tốn lọc trung vị để loại bỏ nhiễu Hình 1.12 Mơ tả phép quay ảnh Hình 1.13: Tổng quan trình tạo ảnh tài liệu Hình 1.14 Mẫu phiếu điểm thu nhận từ máy quét Hình 1.15 Bức ảnh trước điều chỉnh kích thước Hình 1.16 Bức ảnh sau điều chỉnh kích thước thành 7x5 Hình 2.1: Ảnh gốc ảnh thu qua lọc tuyến tính Hình 2.2: Ví dụ lọc giữ biên Hình 2.3: Các tốn tử gờ sai phân Hình 2.4: Sơ đồ lọc thơng cao Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ Hình 2.5: Một số nhân chập lọc thơng cao Hình 2.6: Ảnh qua lọc thơng cao (ảnh gốc 2.1) Hình 2.7 Mơ hình histogram dọc phiếu điểm mẫu Hình 2.8 Mơ hình histogram dọc phiếu điểm cần nhận dạng Hình 2.9 Mơ hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng xếp trục tọa độ Hình 2.10 (a) ảnh mẫu (b) ảnh cần nhận dạng Hình 2.11 Mơ hình histogram dọc phiếu điểm mẫu Hình 2.12 Mơ hình histogram dọc phiếu điểm cần nhận dạng Hình 2.13 Mơ hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng xếp trục tọa độ Hình 2.14 Xây dựng lưới tựa hình chữ nhật Hình 3.1: Giao diện chương trình thử nghiệm Hình 3.2: Menu File Hình 3.3: Menu Basic Hình 3.4: Menu Filter Hình 3.5: Menu Skew Detection Hình 3.6: Một mẫu phiếu điểm sau scan chưa xử lý Hình 3.7: Phiếu điểm sau chỉnh độ nghiêng bị dịch chuyển Hình 3.8: Kết sau hiệu chỉnh Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ MỞ ĐẦU Hiện nay, việc quản lý, thu nhận xử lý thông tin với khối lượng ngày lớn, nhiều lúc với phần mềm thủ công không đem lại hiệu mong muốn, tốn nhiều thời gian công sức Nhằm đem lại xác nhanh chóng, đỡ tốn công sức người Trong năm gần nhiều nhà nghiên cứu phát triển mạnh mẽ toán nhập liệu tự động Nhập liệu tự động việc nạp thông tin vào máy thông qua tác động thủ công người.Tuy nhiên thực tế để cài hệ nhập liệu tự động cụ thể gặp nhiều khó khăn Trong hầu hết sở giáo dục đào tạo nước ta trang bị phần mềm quản lý đào tạo nhằm nâng cao chất lượng giảng dạy quản lý học sinh, sinh viên, giúp giảm bớt phần lớn công việc đội ngũ cán quản lý giáo dục Tuy nhiên việc lưu trữ, cập nhật vào hệ thống phần mềm quản lý giáo dục thủ cơng, khơng làm tốn nhiều công sức đội ngũ giáo vụ mà có nhiều sai sót đặc biệt với trường có số lượng mơn học số sinh viên lớn Từ lý trên, để khắc phục phần nhược điểm em chọn đề tài “PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM” với mong muốn phần giải phần khó khăn Thay phải nhập thủ cơng, việc nhập trở nên dễ dàng, thuận tiện Các cơng đoạn bao gồm: - Phiếu điểm viết tay giảng viên qua máy quét thu hình ảnh đưa vào máy tính - Áp dụng kỹ thuật tiền xử lý ảnh (nâng cao chất lượng ảnh, chuyển sang ảnh nhị phân, loại bỏ nhiễu, ) Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ theo cơng thức N MG rid (i, j) là: 0 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 1/4 1/4 1/8 1/8 0 0 1/8 1/8 0 0 1/8 1/8 1/2 0 1/8 1/8 1/2 1/2 0 1/2 1/3 1/3 1/3 1/2 1/2 đó, độ lệch văn so với mẫu tính theo công thức là: S * 1/  1/  1/  / 44   0,3125 16 Chương CHƯƠNG TRÌNH THỬ NGHIỆM 3.1 Bài toán Yêu cầu đặt chương trình thử nghiệm đầu vào đọc form tài liệu dạng ảnh ( phiếu điểm với góc nghiêng ảnh không 15 ) Thực thao tác phóng to, thu nhỏ … phát độ dịch chuyển phiếu điểm Đầu chương trình xuất file ảnh xử lý 3.2 Phân tích tốn Ta vẽ sơ đồ sau: Chương Trình Chức Lọc nhiễu Hiệu chỉnh độ lệch Đầu vào: đọc file ảnh (bảng điểm) Xử lí: lọc nhiễu, hiệu chỉnh độ lệch Đầu ra: xuất file ảnh hiệu chỉnh 3.3 Chương trình thử nghiệm Chương trình cài đặt bàng cơng cụ Visual C# Chương trình có giao diện hình sau: Hình 3.1: Giao diện chương trình thử nghiệm 3.2.1 Menu File Menu File, chương trình chứa chức Open (mở tệp ảnh), Save (lưu tệp ảnh), Exit (thốt khỏi chương trình) Hình 3.2: Menu File 3.2.2 Menu Basic Menu Basic gồm có chức To Gray (chuyển sang ảnh xám) To Binary (chuyển sang ảnh nhị phân) Hình 3.3: Menu Basic 3.2.3 Menu Filter Menu Filter người dùng lọc nhiễu ba lọc lọc trung bình khơng gian (Space medium Filter), lọc thông thấp (Spacial Low- Pass) lọc đồng hình (Homomorphic Filter) Hình 3.4: Menu Filter 3.2.4 Menu Skew Detection Với chức phát độ dịch chuyển, người dùng tìm độ dịch chuyển phiếu điểm sau scan hiệu chỉnh lại ảnh cho xác với độ dịch chuyển phát hiện, điều khiển độ dịch chuyển phiếu điểm để kiểm tra độ xác thuật toán với độ dịch chuyển khác Hình 3.5: Menu Skew Detection Sau chọn file ảnh (định dạng bmp, jpg, png ) click chuột chọn chức Skew Detection, chương trình hiển thị độ dịch chuyển ảnh bị dịch chuyển thông báo không xác định độ dịch chuyển cho văn với trường hợp đặc biệt Chương trình gồm có menu File, Basic, Filter Skew Detection chủ yếu có hai chức chương trình lọc ảnh phát độ dịch chuyển phiếu điểm theo số kỹ thuật nghiên cứu chương Ngồi ra, cơng cụ có chức thao tác ảnh Rotate Image (quay ảnh), Zoom In (phóng to) Zoom Out (thu nhỏ), Undo (quay trở lại ảnh gốc) Save (lưu ảnh thành file ổ cứng) Chức quay ảnh cho phép người dùng quay lại ảnh cho xác sau phát độ dịch chuyển, điều khiển độ dịch chuyển văn để kiểm tra độ xác thuật tốn với độ dịch khác nhau, người dùng nhập góc quay sử dụng chức dò độ lệch để kiểm tra tính xác thuật tốn, chương trình cài đặt thuật tốn phát độ dịch chuyển ảnh văn thuật toán phát độ dịch chuyển dựa vào Histogram Các chức phóng to, thu nhỏ cho phép người dùng tăng giảm kích thước ảnh trước sau thao tác cho phù hợp với tầm quan sát Chức Save ảnh cho phép lưu lại ảnh sau lọc ảnh hay hiệu chỉnh độ dịch chuyển từ ảnh đầu vào Áp dụng chương trình thử nghiệm hiệu chỉnh độ nghiêng Kết thu sau: Thuật toán Số lượng bảng điểm Kết Tỷ lệ 30 29 97% 30 24 80% Phát độ dịch chyển theo dựa vào Histogram Phát độ dịch chuyển lưới hình chữ nhật vàn mẫu Với kết thực nghiệm trên, ta thấy với tập liệu mẫu phương pháp phát độ dịch chuyển dựa vào Histogram cho kết cao Các hình hình giao diện chương trình trước sau hiệu chỉnh độ dịch chuyển Hình 3.6: Một mẫu phiếu điểm sau scan chưa xử lý Hình 3.7: Phiếu điểm sau chỉnh độ nghiêng bị dịch chuyển Hình 3.8: Kết sau hiệu chỉnh PHẦN KẾT LUẬN Ngày nay, phát triển nhu cầu đòi hỏi xã hội, lượng lớn thông tin cần phải nhập vào máy để xử lý Trong số thông tin cần nhập phiếu điểm dạng viết tay sngày có chiều hướng gia tăng sở giáo dục muốn lưu trữ phiếu điểm để giảm tải phải lưu trữ văn giấy cho phù hợp với thực tế đạt hiệu kinh tế Hơn nữa, phát triển nhanh chóng công nghệ thông tin hai lĩnh vực: Phần cứng phần mềm cho phép kỹ thuật nhập liệu tự động phát triển theo nhiều phương hướng khác đạt thành công định Chẳng hạn, ngày mua scanner quét nhiều trang (ADF) với tốc độ cao giá lại rẻ chẳng khác scanner quét trang so với trước Kỹ thuật nhập liệu tự động liên quan chặt chẽ với đồ hoạ, nhận dạng thuật xử lý ảnh Trong hệ thống nhập liệu tự động, chất lượng phiếu điểm thu nhận trình quét liên quan mật thiết chất lượng nhận dạng phiếu Những vấn đề thường gặp phải q trình thu nhận là: Độ lệch, độ dịch chuyển, xoay, biến dạng v.v phiếu điểm, đối tượng hình học dùng để đánh dấu phiếu Xuất phát từ thực tế đó, luận văn nhằm nghiên cứu số kỹ thuật xử lý ảnh giúp nâng cáo chất lượng ảnh đầu vào nhằm nâng cao chất lượng hệ thống nhận dạng phiếu điểm đạt số kết cụ thể sau:  Trình bày khái quát xử lý ảnh xử lý form tài liệu (phiếu điểm)  Hệ thống hóa số kỹ thuật nâng cao chất lượng nhận dạng phiếu điểm liên qua đến việc khử nhiễu hiệu chỉnh độ dịch chuyển  Cài đặt thử nghiệm chương trình hiệu chỉnh độ dịch chuyển phiếu điểm Luận văn đáp ứng yêu cầu thực tiễn: nâng cao chất lượng ảnh phiếu điểm đầu vào nhằm nâng cao chất lượng hệ thống nhận dạng phiếu điểm mẫu, từ áp dụng vào lĩnh vực tự động thu thập liệu từ mẫu đơn/báo biểu, tự động xử lý hoá đơn, tự động phục hồi copy tài liệu từ ảnh quét, … Do thời gian có hạn khả nhiều hạn chế nên luận văn khó tránh khỏi sai sót định, mong góp ý thầy bạn bè để luận văn hoàn thiện TÀI LIỆU THAM KHẢO Tiếng Việt Đỗ Năng Toàn, Phạm Việt Bình (2007), Giáo trình xử lý ảnh, NXB KH kỹ thuật Đỗ Năng Toàn, Phạm Văn Dũng, Phạm Việt Bình (2005), “Ứng dụng chu tuyến phát góc nghiêng văn bản”, Kỷ yếu Hội thảo Quốc gia lần thứ - Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông, Đà Nẵng 18-20/08 /2004, Nxb KH&KT, Hà Nội 2005, 432-441 Đỗ Năng Tồn, Ngơ Quốc Tạo, Một số phương pháp nâng cao hiệu nhận dạng phiếu điều tra dạng dấu phục vụ cho thiết kế hệ nhập liệu tự động markread, Tạp chí Tin học Điều khiển học, Tập 15, số 4, năm 1999 Lương Mạnh Bá, Nguyễn Thanh Thuỷ (2008), Nhập môn xử lý ảnh số, NXB Khoa học kỹ thuật Tiếng Anh Pelin Corgel, Oguzhan Oztas, Handwritten character recognition system using artificial Neural Networks, Computer Engineering Department, Engineering Faculty, Istanbul University, Avcilar, Istanbul, TURKEY Marti and H Bunke, Text Line Segmentation and word recognition in a system for general writer Independent Handwriting Recognition, IEEE (February 5, 2001) Wojciech Kacalak, New methods for handwriting recognition using artificial neural networks, Technical university of Koszalin, Department of Mechanical Engineering, Raclawicka 15-17, 75-620 Koszalin,Poland Adrian Low (1991), Introductory Computer Vision and Image Processing, Copyright (c) 1991 by McGrow Hill Book Company (UK) Limited A.K Das, B.Chada A fast algorithm for skew detection of document images using morphological Proc of International Journal on Document Analysis and Recognition, vol.4, 2001 10 H F Jiang, C.C Han, C.K Fan A fast Aproach to the Detecion and Correction of Skew Document Pattern Reconigtion Letter, vol.18, 1997 11 N Liolios, N Fakotkis and G Kokkinakis Improved Document Dkew Detection based on text line connection component clustering Proc of International Conference on Image Processing, Thessaloniki, vol.1, 2001 12 X, Jaing, H, Bunke, D, Widmer-Kljajo Skew detection of document image by focused nearest-neighbour-clustering Proc Of the 5th International Conference on Document Analysis and Recognition, 1999 ... thấp, thông cao lọc dải thông 40 2.2 PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM DỰA VÀO HISTOGRAM 42 2.3 PHÁT HIỆN ĐỘ DỊCH CHUYỂN PHIẾU ĐIỂM THEO VĂN BẢN MẪU 50 Chương : CHƯƠNG... nhược điểm em chọn đề tài “PHÁT HIỆN ĐỘ DỊCH CHUYỂN CỦA PHIẾU ĐIỂM” với mong muốn phần giải phần khó khăn Thay phải nhập thủ cơng, việc nhập trở nên dễ dàng, thuận tiện Các công đoạn bao gồm: - Phiếu. .. hình histogram dọc phiếu điểm mẫu Hình 2.12 Mơ hình histogram dọc phiếu điểm cần nhận dạng Hình 2.13 Mơ hình histogram phiếu điểm mẫu phiếu điểm cần nhận dạng xếp trục tọa độ Hình 2.14 Xây dựng

Ngày đăng: 31/12/2018, 19:13

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan