Tìm hiểu phương pháp tiền xử lý và phương pháp phân đoạn ảnh ứng dụng phân đoạn chứng minh nhân dân

50 3 0
  • Loading ...
1/50 trang

Thông tin tài liệu

Ngày đăng: 15/03/2019, 10:04

1 MỤC LỤC CHƢƠNG 1:TỔNG QUAN VỀ XỬ ẢNH ,TIỀN XỬ PHÂN ĐOẠN ẢNH 1.1 Tổng Quan Về Xử Ảnh 1.2 Tổng quan phân đoạn ảnh 1.3 Tổng quan tiền xử ảnh CHƢƠNG 2:MỘT SỐ PHƢƠNG PHÁP TIỀN XỬ ẢNH 2.1 Nhị phân ảnh 2.1.1 Phân loại phƣơng pháp xác định ngƣỡng T 10 2.1.2 Một số phƣơng pháp xác định ngƣỡng T 11 2.1.3 Nhận xét 15 2.2 Hiệu chỉnh độ nghiêng trang văn 17 2.2.1 Phƣơng pháp dựa biến đổi Hough 18 2.2.2 Phƣơng pháp láng giềng gần (nearest neighbours) 19 2.2.3 Phƣơng pháp sử dụng chiếu nghiêng (project profile) 21 2.2.4 Nhận xét 22 2.3 Các tốn tử hình thái (Morphological operations) 23 CHƢƠNG 3:PHƢƠNG PHÁP PHÂN ĐOẠN CHỨNG MINH NHÂN DÂN 27 3.1 Giới thiệu toán 27 3.2 Tách trƣờng thông tin mặt trƣớc 29 3.2.1 Tiền xử ảnh 30 3.2.2 Tách trƣờng Số CMND 33 3.2.3 Tách trƣờng thơng tin lại 37 3.3 Tách trƣờng thông tin mặt sau 42 3.3.1 Tiền xử ảnh 43 3.3.2 Xác định cấu trúc bảng 43 3.3.3 Tách trƣờng thông tin 45 CHƢƠNG 4:CÀI ĐẶT THỬ NGHIỆM 46 KẾT LUẬN 48 TÀI LIỆU THAM KHẢO 49 Danh mục thuật toán Thuật toán 2.1 Nhị phân ảnh Thuật toán 2.2 Phƣơng pháp phân ngƣỡng Niblack 11 Thuật toán 2.3 Phƣơng pháp phân ngƣỡng Otsu 13 Thuật toán 2.4 Hiệu chỉnh độ nghiêng ảnh tài liệu 17 Thuật toán 2.5 Xoay ảnh 17 Thuật tốn 2.6 Xác định góc nghiêng dựa vào biến đổi Hough 19 Thuật toán 2.7 Phƣơng pháp láng giềng gần 20 Thuật toán 2.8 Sử dụng chiếu nghiêng để xác định góc nghiêng 22 Thuật tốn 3.1 Xác định vùng Trƣờng Số CMND 33 33.Thuật tốn 3.2 Tìm tách trƣờng Số CMND 35 Thuật toán 3.3 Phân đoạn vùng Số CMND 35 Thuật toán 3.4 Ƣớc lƣợng bề dày đƣờng lƣợn sóng 36 Thuật toán 3.5 Tách ký tự thuộc dòng 39 Thuật toán 3.6 Xoá phần tiêu đề 40 Thuật tốn 3.7 Tìm đƣờng kẻ ngang ảnh 44 LỜI CẢM ƠN Trƣớc hết em xin chân thành cảm ơn thầy giáo khoa công nghệ thông tin trƣờng đại học dân lập Hải Phòng dã trang bị cần thiết để em thực đề tài Đặc biệt em xin bày tỏ lòng kính trọng biết ơn sâu sắc tới thầy giáo hƣớng dẫn PGS.TS Ngô Quốc Tạo ngƣời tận tình hƣớng dẫn ,chỉ bảo tạo điều kiện thuận lợi giúp em trình thực tập Mặc dù cố gắng với tận tâm thầy giáo hƣớng dẫn xong trình độ có hạn ,nội dung đề tài mẻ với em nên khó tránh khỏi sai xót q trình tiếp nhận kiến thức.Em mong đƣợc dẫn thầy cô góp ý bạn bè để thời gian tới em xây dựng đồ án cách hồn thiện Sinh viên Trần Văn Toàn Mở Đầu Xử ảnh chuyên ngành quan trọng lâu đời ngành Công Nghệ Thông Tin.XLA đƣợc áp dụng cho nhiều lĩnh vực khác nhƣ y học ,vật ,hóa học,truy tìm tội phạm…Mục đích chung việc XLA thƣờng (1)xử ảnh ban đầu để có đƣợc ảnh theo yêu cầu cụ thể,(2)phân tích ảnh để thu đƣợc thơng tin đặc trƣng ảnh nhằm hỗ trợ cho việc phân loại nhận biết ảnh,(3)phân đoạn ảnh để nhận biết đƣợc thành phần ảnh nhằm hiểu đƣợc kết cấu ảnh có mức độ cao hơn.Để xử đƣợc ảnh phải trải qua nhiều bƣớc,nhƣng phần em xin trình bày bƣớc quan trọng xử ảnh tiền xử ảnh bƣớc phân đoạn ảnh Hiện có nhiều thuật toán đƣợc đề xuất để giải toán tiền xử phân đoạn ảnh Phân đoạn ảnh hầu hết thuật tốn dựa vào hai thuộc tính quan trọng mổi điểm ảnh so với điểm lân cận khác giống nhau.Các phƣơng pháp dựa khác điểm ảnh đƣợc gọi phƣơng pháp biên (boundary-based methods) phƣơng pháp dựa giống điểm ảnh đƣợc gọi phƣơng pháp miền Tiền xử ảnh bƣớc quan trọng xử ảnh.ở bƣớc hình ảnh mức thấp chƣa đƣợc xử lý.Với mục đích cải thiện liệu hình ảnh ngăn chặn biến dạng không mong muốn tăng cƣờng nội dung thơng tin hình ảnh …nhiều phƣơng pháp tiền xử hình ảnh đƣợc đề xuất Dƣới em xin trình bày số phƣơng pháp cho trình CHƢƠNG 1:TỔNG QUAN VỀ XỬ ẢNH ,TIỀN XỬ PHÂN ĐOẠN ẢNH 1.1 Tổng Quan Về Xử Ảnh Trong xã hội lồi ngƣời,ngơn ngữ phƣơng tiện trao đổi thơng tin phổ biên q trình giao tiếp.Bên cạnh ngơn ngữ,hình ảnh cách trao đổi thơng tin mang tính xác biểu cảm cao đặc biệt không bị cảm giác chủ quan đối tƣợng giao tiếp chi phối Thơng tin hình ảnh phong phú ,đa dạng xử máy tính Chính vậy,trong năm gần kết hợp ảnh đồ họa trở lên chặt chẽ lĩnh vực xử thông tin Cũng nhƣ xử liệu hình ảnh đồ họa,việc xử ảnh số lĩnh vực tin học ứng dụng Việc xử liệu đò họa đè cập đến hình ảnh nhân tạo,các ảnh đƣợc xem xét nhƣ cấu trúc liệu đƣợc tạo chƣơng trình XLA số thao tác ảnh tự nhiên thông qua phƣơng pháp kỹ thuật mã hóa.Ảnh sau đƣợc thu nhận thiết bị thu nhận ảnh đƣợc biến đổi thành ảnh số theo phƣơng phá số hóa đƣợc nhúng thiết bị kỹ thuật khác đƣợc biểu diễn máy tinhsduwowis dạng ma trận chiều chiều Mục đích việc XLA đƣợc chia làm  Biến đổi ảnh làm tăng chất lƣợng ảnh  Tự động nhận dạng ,đoán ảnh,đánh giá nội dung ảnh Phƣơng pháp biến đổi đƣợc sử dụng việc xử ảnh chụp từ không trung Một ứng dụng khác việc biên đổi ảnh mã hóa ảnh ,trong cac ảnh đƣợc xử để lƣu trữ truyền Các phƣơng pháp nhận dạng ảnh đƣợc xử dụng xử tế bào,nhiễm sắc thể,nhận dạng chữ Thực chất cơng việc nhận dạng phân loại đối tƣợng thành lopws đối tƣợng chƣa biết toán nhận dạng ảnh toán lớn,có nhiều ý nghĩa thực tiễnvà ta cos thể thấy để công việc nhận dạng trở lên dễ dàng ảnh phải đƣợc tách thành đối tƣợng riêng biệt mục đích tốn phân đoạn ảnh Nếu ohaan đoạn ảnh khơng tốt dẫn đến sai lầm trình nhận dạng ảnh Quá trình XLA 1.2 Tổng quan phân đoạn ảnh Để phân biệt đối tƣợng ảnh,chúng ta cần phân biệt đối tƣợng cần quan tâm với phần lại ảnh ,hay gọi ảnh.những đối tƣợng đƣợc tƣợng đƣợc tìm thấy nhờ kỹ thuật phân đoạn ảnh.Mỗi đối tƣợng ảnh đƣợc gọi vùng hay miền,đƣờng bao quanh đối tƣợng gọi đƣờng biên.Mỗi vugf ảnh phải có đặc tính đồng nhấ.Hình dáng đối tƣợng đƣợc miêu tả tham số đƣờng biên tham số vùng mà chiếm giữ Có thể thấy kỹ thuật phát biên phân vùng ảnh hai tốn đối ngẫu nhau.Dò biên để phân vùng đƣợc ảnh ngƣợc lại phân vùng đƣợc ảnh ta phát đƣợc biên Có nhiều kỹ thuật phân đoạn ảnh ,nhìn chung ta chia thành ba lớp khác nhau: Các kỹ thuật cục bộ:dựa vào thc tính cục điểm anhrvaf láng giềng Các kỹ thuật tồn thể:phân ảnh dựa thơng tin chung tồn ảnh(vd sử dụng lƣợc đồ xám ảnh) Các kỹ thuật tách (split),hợp(merge) growing sử dụng khái niệm đồng gần hình học 1.3 Tổng quan tiền xử ảnh Hình ảnh tiền xử hình ảnh chƣa đƣợc chỉnh sửa phƣơng diện nào.Ở bƣớc hình ảnh đƣợc cải thiện độ tƣơng phản,khử nhiễu,khử bóng, khử độ lệch…và với mục đích làm cho ảnh trở lên tốt thƣờng đƣợc thực hiên nhũng lọc.Có nhiều phƣơng pháp để xử ảnh giai đoạn đƣợc trình bày va dƣới em xin đƣợc trình bày số phƣơng pháp cụ thể tiền xử ảnh CHƢƠNG 2:MỘT SỐ PHƢƠNG PHÁP TIỀN XỬ ẢNH Đầu vào hệ thống xử ảnh thƣờng tệp ảnh đƣợc thu nhận từ thiết bị nhƣ: máy quét, máy ảnh, thiết bị ghi hình hay thiết bị thu nhận hình ảnh khác Các ảnh thƣờng có chất lƣợng thấp (bị lẫn nhiễu, chi tiết đối tƣợng, hay bị lệch so với ảnh gốc góc bất kỳ,…) Nguyên nhân do: thiết bị thu nhận không đảm bảo, điều kiện thu nhận không tốt (độ sáng thay đổi, thu nhận di chuyển,…) hay trình lƣu bị mát thông tin Để bƣớc xử thu đƣợc kết tốt cần phải có q trình tiền xử để nâng cao chất lƣợng ảnh đầu vào Q trình bao gồm cơng đoạn khơi phục tăng cƣờng ảnh: Khôi phục ảnh nhằm mục đích loại bỏ hay giảm thiểu ảnh hƣởng môi trƣờng tác động lên ảnh Bao gồm bƣớc: lọc ảnh, khử nhiễu, xoay ảnh,… nhằm giảm bớt biến dạng ảnh đƣa ảnh trạng thái gần nhƣ ban đầu Tăng cƣờng ảnh làm tăng lƣợng thông tin ảnh mà làm bật đặc trƣng ảnh giúp cho công việc phía sau đƣợc hiệu Cơng đoạn bao gồm việc nhƣ: lọc độ tƣơng phản, làm trơn ảnh, nhị phân ảnh,… Trong thao tác nhị phân ảnh, chỉnh độ nghiêng xóa nhiễu thao tác thƣờng đƣợc áp dụng Trong phần chƣơng trình bầy số thuật tốn thao tác 2.1 Nhị phân ảnh Ảnh nhận đƣợc từ thiết bị thu nhận hình ảnh nhƣ máy ảnh hay camera thƣờng ảnh mầu hay ảnh đa cấp xám, thành phần ảnh phức tạp (mầu sắc, kết cấu…) Do muốn làm bật đặc trƣng ảnh phải chuyển dạng ảnh nhị phân, ảnh có hai mầu (đen trắng) – tƣơng ứng với tiền cảnh (đối tƣợng “quan tâm”) Nhị phân ảnh (hay gọi phân ngƣỡng) thao tác chuyển từ ảnh đa cấp xám (hoặc ảnh mầu) ảnh nhị phân (Thuật toán 2.1) Thuật toán 2.1 Nhị phân ảnh INPUT: Ảnh mầu ảnh đa cấp xám OUTPUT: Ảnh nhị phân Xác định ngƣỡng T Chuyển ảnh dạng nhị phân Nhƣ vậy, thuật toán nhị phân ảnh xác định ngƣỡng T để phân tách đối tƣợng ảnh Giả sử với ảnh đầu vào I(x, y), có giá trị điểm (x,y) g(x, y) (đối với ảnh đa cấp xám: g(x, y) € [0, 255]) Khi giá trị điểm ảnh (x, y) ảnh nhị phân I'(x, y) đƣợc xác định nhƣ sau: Việc xác định ngƣỡng T thích hợp ln q trình khó khăn dễ gây lỗi (Hình 1) Điều đặc biệt khó khăn độ tƣơng phản đối tƣợng thấp hay ảnh có độ chiếu sáng khơng đồng thu nhận Nếu ngƣỡng T thấp đối tƣợng thu đƣợc bị xóa chi tiết ảnh, ngƣợc lại ngƣỡng T q cao chứa điểm ảnh nhiễu 10 Hình Nhị phân ảnh Có nhiều phƣơng pháp để xác định ngƣỡng phân tách T Ngƣỡng T đƣợc xác định cho toàn ảnh (ngƣỡng tổng quát) hay đƣợc xác định cho điểm ảnh cụ thể (ngƣỡng cục bộ) Trong phần phân loại giới thiệu số phƣơng pháp xác định ngƣỡng T 2.1.1 Phân loại phƣơng pháp xác định ngƣỡng T Căn vào phƣơng pháp đƣợc áp dụng, chia làm nhóm sau [13]: Các phƣơng pháp dựa vào hình dạng histogram (Histogram ShapeBased Thresholding Methods) Căn vào hình dáng histogram nhƣ: đỉnh, khe độ cong (peaks, valleys and curvatures) để xác định ngƣỡng Vị trí lấy ngƣỡng khe lõm hai đỉnh hay điểm cách xa đƣờng thẳng nối hai đỉnh 36 Chuyển ảnh đa cấp xám: IGray1 = IGreen Nhị phân ảnh: IBin1 = Sauvola(IGray1, w=15, k=0.0125) Ƣớc lƣợng bề dày đƣờng lƣợn sóng: thick Làm mờ đƣờng lƣợn sóng: IGray2 = Median(IGray1, thick+1, thick+3) Nhị phân ảnh: IBin2 = Sauvola(IGray2, w=15, k=0.1) Hinh Phân đoạn vùng Số CMND Để ƣớc lƣợng đƣợc bề dày đƣờng lƣợn sóng cần phân đoạn “thơ” cho đƣợc đƣờng lƣợn sóng Sau “đo” bề dày đƣờng lƣợn sóng tất lát dọc để thống kê chọn lấy bề dày thích hợp (Thuật tốn 3.4) Từ làm mờ đƣờng lƣợn sóng phép lọc trung vị (median filter), cuối phân đoạn “tinh” để khử thành phần (Hinh 5) Thuật toán 3.4 Ƣớc lƣợng bề dày đƣờng lƣợn sóng Input: Ảnh nhị phân vùng Số CMND: IBin1(w, h) Output: Bề dày đƣờng lƣợn sóng: thick Process: 37 3.2.3 Tách trƣờng thơng tin lại Các trƣờng thơng tin lại (bao gồm trƣờng: Họ tên, Ngày sinh, Nguyên quán, Nơi thƣờng trú) đƣợc phân bố dòng, dòng cách nằm bên dƣới dòng “GCMND” Số CMND, việc tách trƣờng thơng tin lại thực chất việc tách lấy dòng thơng tin Để tách dòng này, từ ảnh nhị phân thu đƣợc bƣớc tiền xử vị trí dòng “GCMND” xác định bƣớc trên, xác định cửa sổ “mặt nạ” dòng sau cố gắng lọc lấy đối tƣợng (ký tự) thuộc mặt nạ dòng Cụ thể, thuật tốn bao gồm bƣớc sau:  Tìm mặt nạ dòng: Xác định vị trí dòng  Tách đối tƣợng thuộc dòng: Phân tích thành phần liên thơng để tìm đối tƣợng thuộc mặt nạ dòng  Xố phần tiêu đề nhiễu: Loại bỏ phần tiêu đề trƣờng thơng tin đối tƣợng nhiễu, dòng khơng có ký tự  Lấy lại ký tự bị mất: thuộc dòng nhƣng khơng đƣợc xét thuộc mặt nạ dòng 1/ Tìm mặt nạ dòng Vị trí dòng thơng tin lại đƣợc xác định thơng qua vị trí tƣơng đối chúng so với dòng “GCMND” xác định đƣợc Để thuận tiện, biểu diễn dòng hình chữ nhật – gọi mặt nạ dòng – (xem Hinh 6), đó: + dx, dy: khoảng vùng mặt nạ dòng tiêu đề “GCMND” theo phƣơng ngang phƣơng dọc, tƣơng ứng Trong đó, dx cố định (vì đƣợc in theo mẫu), có dy thay đổi dòng thơng tin dập/in vào thay đổi so với dòng sở (dịch lên dịch xuống): dy [dy1, dy2] 38 + wline, hline, dline: kích thƣớc khoảng cách hình chữ nhật cố định Nhƣ vậy, để xác định mặt nạ dòng cần xác định dy cách dựa vào phân bố điểm ảnh vùng mặt nạ: Trong đó: count(y) số lƣợng điểm ảnh vùng mặt nạ, tƣơng ứng với vị trí y Hinh Mặt nạ dòng mặt trƣớc 2/ Tách đối tƣợng thuộc dòng Từ ảnh nhị phân thu đƣợc bƣớc tiền xử lý, tách lấy đối tƣợng (các thành phần liên thông), đối tƣợng đƣợc biểu diễn hình chữ nhật bao quanh nó, đó: xb, yb: Toạ độ điểm trái đối tƣợng wb, hb: Kích thƣớc đối tƣợng Để việc lọc đối tƣợng đƣợc xác, chia đối tƣợng làm lớp, dựa kích thƣớc đối tƣợng: Nhỏ: Lớp đối tƣợng dấu ký tự, dấu chấm đƣờng sở, nhiễu, … (wb < wmin hb < hmin) 39 Lớn: Lớp đối tƣợng ảnh chân dung đƣờng viền (wb > wmax hb > hmax) Vừa: Gồm đối tƣợng lại, lớp đối tƣợng ký tự Từ đối tƣợng thuộc lớp vừa, lọc lấy đối tƣợng thuộc mặt nạ dòng Một đối tƣợng đƣợc cho thuộc mặt nạ dòng tâm nằm hình chữ nhật mặt nạ dòng Lúc dòng đƣợc biểu diễn danh sách đối tƣợng Tuy nhiên, danh sách có ký tự tiêu đề trƣờng, nhiễu, thiếu ký tự phần thơng tin, cần bƣớc hậu xử Thuật toán 3.5 Tách ký tự thuộc dòng Input: Mặt nạ dòng: LMask = {bMaskk} Ảnh nhị phân: IBin Output: Danh sách ký tự thuộc dòng: LLine = {LChark} Process: Tách lấy thành phần liên thông từ IBin: LCCs = {bCCsi} Chia LCCs lớp: a Nhỏ: LSmall = {bCCsi | wbCCsi < wmin OR hbCCsi < hmin} b Lớn: LLarge = {bCCsi | wbCCsi > wmax OR hbCCsi > hmax} c Vừa: LMean = {bMeani} = {bCCsi | bCCsiLSmall AND bCCsi LLarge} Lọc lấy ký tự thuộc dòng: LChark = {bMeani | (xMeani, yMeani) bMaskk} Trong đó: xMeani = xbMeani + wbMeani / yMeani = ybMeani + hbMeani / 3/ Xoá tiêu đề Trong dòng tìm đƣợc trên, có dòng có chứa phần tiêu đề (tƣơng ứng với trƣờng thơng tin), dòng thứ 1, 2, 4, Để loại bỏ phần tiêu đề cần xác định vị trí phân tách phần tiêu đề phần thơng tin dòng 40 Do phần thơng tin đƣợc dập/in vào mẫu có sẵn (đã có phần tiêu đề) nên phần hai phần có đặc điểm khác sau: + Chiều cao trung bình ký tự phần tiêu đề thƣờng nhỏ chiều cao trung bình ký tự phần thông tin + Theo phƣơng dọc, phần thơng tin bị lệch so với phần tiêu đề (dịch lên dịch xuống) + Theo phƣơng ngang, phần thông tin phần tiêu đề thƣờng có khoảng cách lớn khoảng cách ký tự (các từ) dòng + Ký tự cuối phần tiêu đề chữ in thƣờng, ký tự phần thông tin chữ in hoa nên có khác lớn chiều cao Từ đặc điểm tính đƣợc hàm “khoảng cách” phần tiêu đề phần thông tin: distance() = dh + dy + dd + dc Trong đó: +dh: Chêch lệch độ cao trung bình phần tiêu đề phần thơng tin + dy: Tổng chênh lệch đƣờng baseline đƣờng mean line phần tiêu đề phần thông tin + dd: Khoảng cách phần tiêu đề phần thông tin + dc: Chênh lệch độ cao hai ký tự tiếp giáp phần tiêu đề phần thông tin Nhƣ vậy, dựa vào hàm khoảng cách để xác định vị trí phân tách phần tiêu đề phần thơng tin (Thuật tốn 3.6) Thuật toán 3.6 Xoá phần tiêu đề Input: Mặt nạ dòng: LChar = {bChark} Độ dài phần tiêu đề: [dTitle1, dTitle2] Output: Danh sách ký tự thuộc phần thông tin: LInfo = {bInfok} Process: Sắp xếp LChar theo chiều tăng dần xbChari Tìm vị trí phân tách: 41 Tính hàm khoảng cách: distance(xSpliti) Chọn vị trí phân tách: split = arg{max(distance(xSpliti))} Xoá phần tiêu đề: LInfo = {bChark | xbChark > split} Hinh Xoá phần tiêu đề 4/ Lấy lại ký tự bị Trong trình tách lấy đối tƣợng thuộc dòng, số ký tự thuộc dòng nhƣng không đƣợc chọn, nguyên nhân do: + Các ký ựt nằm ngồi vùng mặt nạ dòng (khơng đƣợc dập/in vào vùng thông tin đƣợc định trƣớc) lƣợng thông tin nhiều nên “tràn” khỏi vùng đƣợc định trƣớc (Hinh 8a) +Các ký tự thuộc vùng mặt nạ dòng nhƣng tâm khơng nằm mặt nạ dòng, ký tự hai dòng dính dính vào đƣờng viền (Hinh 8b) 42 b) Hai ký tự dính Hinh Kết lấy lại ký tự bị Từ nguyên nhân trên, có giải pháp khác để lấy lại ký tự bị mất: +Với nguyên nhân thứ nhất: Mở rộng mặt nạ dòng hai phía, lấy lại ký tự nhƣ bƣớc +Với nguyên nhân thứ hai: Tìm phần giao hình bao dòng với đối tƣợng, phần giao có chiều cao lớn nửa chiều cao dòng ký tự bị 3.3 Tách trƣờng thông tin mặt sau Hinh Các vùng thông tin cần tách mặt sau Mặt sau CMND có cấu trúc dạng bảng, trƣờng thông tin đƣợc phân bổ vào ô bảng: trƣờng Dân tộc ô cùng, trƣờng Ngày cấp Nơi cấp ô dƣới 43 bên phải (Hinh 9) Do vậy, để tách đƣợc trƣờng thông tin yêu cầu cần xác định đƣợc cấu trúc bảng sau tách trƣờng thơng tin này, thuật toán gồm bƣớc: +Tiền xử ảnh: Khử thành phần ảnh +Xác định cấu trúc bảng: Tìm đƣờng kẻ ngang/dọc tạo lại cấu trúc bảng +Tách trƣờng thông tin: Tách lấy dòng thơng tin loại bỏ phần tiêu đề dòng 3.3.1 Tiền xử ảnh Mặt sau CMND đơn giản mặt trƣớc, khơng có hoa văn phức tạp mà chữ đen trắng Tuy nhiên lại có dấu mầu đỏ, dấu đè lên trƣờng Ngày cấp Nơi cấp Mặt khác, trình sử dụng ảnh bị suy thoái chất lƣợng: bị ố, mốc,… hay bị nghiêng giống nhƣ mặt trƣớc Do đó, cần thao tác tiền xử ảnh để khử thành phần dấu mầu đỏ nhƣ chỉnh độ nghiêng (Hinh 10), cụ thể gồm thao tác sau: +Chuyển ảnh mầu ảnh đa cấp xám: cách tách lấy kênh mầu Red Điều khơng loại bỏ đƣợc dấu mầu đỏ, mà đƣợc đặc trƣng nét bút +Nhị phân ảnh: Vì mặt sau có cấu trúc đơn giản nên cần áp dụng phƣơng pháp phân ngƣỡng Sauvola để khử + Căn chỉnh độ nghiêng: Áp dụng phƣơng pháp nhƣ mặt trƣớc 3.3.2 Xác định cấu trúc bảng Trong phần tách lấy vùng thông tin yêu cầu từ ảnh nhị phân thu đƣợc bƣớc trƣớc thông qua việc xác định cấu trúc bảng Cấu trúc bảng đƣợc tạo đƣờng kẻ ngang dọc liền nét nhƣng q trình sử dụng đƣờng kẻ bị mờ đứt nét Mặt khác, lúc dập/in thông tin lăn tay, ký tự dấu vân tay chờm lên đƣờng kẻ, gây khó khăn cho việc xác định cấu trúc bảng Nhƣ vậy, để xác định đƣợc cấu trúc bảng cần xác định đƣợc đƣờng kẻ ngang dọc bảng Vì đƣờng kẻ ngang dọc có tính chất nhƣ nên phần trình bầy thuật toán xác định đƣờng kẻ ngang bảng, việc xác định đƣờng kẻ dọc tƣơng tự 44 Thuật tốn 3.7 Tìm đƣờng kẻ ngang ảnh Input: Ảnh nhị phân: IBin Output: Danh sách đƣờng kẻ ngang ảnh: LLine = {yLinek} Process: Áp dụng phép biến đổi hình thái IBin: a erosion 15x1: Xoá đƣờng kẻ dọc nét bút ký tự b dilation 1x3: Làm dày đƣờng kẻ ngang c closing 51x1: Nối đƣờng ngang bị đứt Tách lấy thành phần liên thông: LCCs = {bCCsi} Các đƣờng kẻ ngang ảnh: Thuật toán xác định đƣờng kẻ ngang cấu trúc bảng đƣợc chia làm hai phần chính: +Đầu tiên áp dụng phép biến đổi hình thái để làm bật đƣờng kẻ ngang, sau phân tích thành phần liên thông để tách lấy đƣờng kẻ ngang ảnh (Thuật tốn 3.7) Các đƣờng kẻ đƣờng kẻ ngang bảng khơng, có đƣờng kẻ đƣợc tạo dấu chấm gần đƣờng sở đƣờng gạch chân chữ ký,… (Hinh 11b) + Dựa vào khoảng cách tƣơng đối đƣờng kẻ ngang, tìm đƣờng kẻ ngang bảng từ đƣờng kẻ ngang ảnh, cách loại bỏ đƣờng kẻ ngang bảng bổ sung đƣờng ngang thiếu (Hinh 11c) +Sau xác định đƣợc đƣờng kẻ ngang dọc bảng (tức xác định đƣợc cấu trúc bảng), tách lấy vùng chứa trƣờng thơng tin cần tìm từ ảnh: vùng Dân tộc nằm đƣờng kẻ ngang thứ thứ hai; vùng Ngày cấp Nơi cấp nằm đƣờng kẻ ngang thứ tƣ thứ sáu, đƣờng kẻ dọc thứ ba thứ bốn (Hinh 11d) Từ vùng này, bƣớc tách lấy trƣờng thơng tin cần tìm 45 a) Ảnh nhị phân đầu vào b) Các đƣờng kẻ ngang ảnh c) Các đƣờng kẻ bảng d) Các vùng thông tin Hinh 11 Xác định cấu trúc bảng 3.3.3 Tách trƣờng thông tin Việc tách cách trƣờng thông tin mặt sau tƣơng tự nhƣ mặt trƣớc 46 CHƢƠNG 4:CÀI ĐẶT THỬ NGHIỆM 4.1.Hệ thống chƣơng trình gồm có phần  Giao diện chƣơng trình  Load ảnhPhân đoạn ảnh Tách Cây Tứ PhânPhân đoạn ảnh theo Single-Link  Phân đoạn ảnh theo K-Means 4.2.Giao diện phân đoạn ảnh dựa vào phƣơng pháp tách tứ phân 47 4.3.Giao diên phân đoạn ảnh dựa vào phƣơng pháp Single-Link 4.4.Giao diện phân đoạn ảnh dựa vào phƣơng pháp K-Means 48 KẾT LUẬN 5.1 Nội dung đồ án 5.1.1 Các kết đạt đƣợc Trong trình nghiên cứu tài liệu thực đồ án dƣới định hƣớng thầy hƣớng dẫn em thấy thân đạt đƣợc số kết sau: Tìm hiểu đƣợc cách tổng quan vấn đề XLA phân đoạn ảnh hay tiền xử ảnh Em có cách nhìn có hệ thống phƣơng pháp phần phân đoạn ảnh tiền xử ảnh Đồng thời biết đƣợc điểm mạnh ,yếu phƣơng pháp đƣa cách lựa chọn phƣơng pháp phù hợp với loại ảnh Ngồi ra,trong q trình nghiên cứu em tự tích lũy thêm cho kiến thức tốn học ,về kỹ thuật lập trình , quan trọng rèn luyện kỹ để thực nghiên cứu khoa học 5.1.2 Một số hạn chế cần khắc phục Bên cạnh kết đạt đƣợc em tự thấy đồ án số hạn chế Chƣa đƣa đƣợc phƣơng pháp phân đoạn hồn tồn Trong khn khổ đồ án tốt nghiệp ,em trình bày lạicấc kiến thức tìm hiểu đƣợc chƣa đề xuất phƣơng pháp hồn tồn Do thời gian có hạn nên trình bày thuật tốn phân đoạn chƣ ađƣợc hệ thống khoa học.có nhiều thuật tốn đƣợc trình bày sơ lƣợc Đồ án chƣa đƣợc ứng dụng thực tế thuật tốn phân đoạn 5.2 Cơng việc Dựa kết bƣớc đầu đạt đƣợc đồ án ,em có đề xuất số cải tiến thuật toán Trong tƣơng lai Hầu hết thuật toán đƣợc xử ảnh tĩnh em hi vọng tìm hiểu đƣợc phat triển thêm thuật tốn ứng dụng ảnh động hay video Bên cạnh em tiếp tục tìm hiểu thêm thuật toán lĩnh vực phân đoạn ảnh hay tiền xử anh 49 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nghị định số: 577-TTg “Đặt giấy chứng minh quy định thể lệ cấp phát giấy chứng minh”, Chính phủ, Hà Nội, ngày 27 tháng 11 năm 1957 [2] Nghị định số: 05/1999/NĐ-CP “Về chứng minh nhân dân”, Chính phủ, Hà Nội, ngày 03 tháng 02 năm 1999 [3] Nghị định số: 170/2007/NĐ-CP “Sửa đổi, bổ sung số điều nghị định số 05/1999/NĐ-CP ngày 03 tháng 02 năm 1999 phủ chứng minh nhân dân”, Hà Nội, ngày 19 tháng 11 năm 2007 Tiếng Anh [4] K Kpalma and J Ronsin, “An Overview of Advances of Pattern Recognition Systems in Computer Vision”, 2007 [5] Anoop M Namboodiri and Anil Jain, “Document Structure and Layout Analysis”, in Digital Document Processing: Major Directions and Recent Advances B B Chaudhuri (ed.), Springer-Verlag, London, (ISBN:978-1-84628-501-1), Jan 2007 [6] Toyohide WATANABE, “Document Analysis and Recognition”, IEICE TRANS INF & SYST., vol.e82-d, no.3 [7] G Nagy, S Seth and M Viswanathan, "A Prototype Document Image-Analysis System for Technical Journals", Computer 25, (1992), 10–22 [8] Baird, U.S and Jones, S.E and Fortune, S.J.: Image Segmentation by ShapeDirected Covers in Proceedings of International Conference on Pattern Recognition, Atlantic City, NJ (1990), 820-825 [9] Pavlidis, T and Zhou, J.: Page Segmentation by White Streams Proceedings of International Conference on Document Analysis and Recognition, Saint-Malo, France (1991), 945-953 [10] Breuel, T.M.: Two Geometrie Algorithms for Layout Analysis, in Proceedings of the Fifth International Workshop on Document Analysis Systems, Princeton, NY 50 (2002), LNCS 2423, 188-199 [11] O‟Gorman, L.: The Document Spectrum for Page Layout Analysis IEEE Transactions on Pattern Analysis and Machine Intelligence 15 (1993), 1162-1173 [12] Kise, K and Sato, A and Iwata, M.: Segmentation of Page Images using the Area Voronoi Diagram Computer Vision and Image Understanding 70 (1998), 370382 [13] Mehmet Sezgin & Bülent Sankur, “Survey over image thresholding techniques and quantitative performance evaluation”, Journal of Electronic Imaging 13(1), 146– 165 (January 2004) [14] W Niblack, “An Introduction to Digital Image Processing”, pp 115-116, Prentice Hall, 1986 [15] Z Zhang and C L Tan, “Restoration of images scanned from thick bound documents”, Proc Int conf Image Processing., vol 1, 2001, pp.1074-1077 [16] N Otsu, „„A threshold selection method from gray-level histograms‟‟ IEEE Trans Syst Man Cybern 9(1), 62–66 (1979) [17] Yichao Ma, Chunheng Wang, Baihua Xiao, et Ruwei Dai “Usage-oriented performance evaluation for text localization algorithms” In Document Analysis and Recognition, 2007 ICDAR 2007 Ninth International Conference on, volume 2, page(s) 1033-1037, 2007 [18] Xian-Sheng Hua, Liu WenYin, and Hong-Jiang Zhang, “An Automatic Performance Evaluation Protocol for Video Text Detection Algorithms” In IEEE Transactions on circuits and systems for video technology, vol.14, no.4, avril 2004 [19] Vasant Manohar , Padmanabhan Soundararajan , Matthew Boonstra, Harish Raju, Dmitry Goldgof, Rangachar Kasturi, and John Garofolo, “Performance Evaluation of Text Detection and Tracking in Video” In Document analysis systems VII, vol 3872, pages 576-587, 2006 ... ảnh …nhiều phƣơng pháp tiền xử lý hình ảnh đƣợc đề xuất Dƣới em xin trình bày số phƣơng pháp cho trình 5 CHƢƠNG 1:TỔNG QUAN VỀ XỬ LÝ ẢNH ,TIỀN XỬ LÝ VÀ PHÂN ĐOẠN ẢNH 1.1 Tổng Quan Về Xử Lý Ảnh. .. phƣơng pháp để xử lý ảnh giai đoạn đƣợc trình bày va dƣới em xin đƣợc trình bày số phƣơng pháp cụ thể tiền xử lý ảnh 8 CHƢƠNG 2:MỘT SỐ PHƢƠNG PHÁP TIỀN XỬ LÝ ẢNH Đầu vào hệ thống xử lý ảnh thƣờng... khơng thay đổi Dựa vào tính chất để nối ký tự dòng văn ảnh với 27 CHƢƠNG 3:PHƢƠNG PHÁP PHÂN ĐOẠN CHỨNG MINH NHÂN DÂN 3.1 Giới thiệu toán Giấy chứng minh nhân dân hay chứng minh thƣ (CMND) loại
- Xem thêm -

Xem thêm: Tìm hiểu phương pháp tiền xử lý và phương pháp phân đoạn ảnh ứng dụng phân đoạn chứng minh nhân dân , Tìm hiểu phương pháp tiền xử lý và phương pháp phân đoạn ảnh ứng dụng phân đoạn chứng minh nhân dân

Gợi ý tài liệu liên quan cho bạn

Nhận lời giải ngay chưa đến 10 phút Đăng bài tập ngay