BIẾN ĐỔI HOUGH VÀ ỨNG DỤNG PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN

58 915 6
BIẾN ĐỔI HOUGH VÀ ỨNG DỤNG PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BIẾN ĐỔI HOUGH VÀ ỨNG DỤNG PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN

BỘ GIÁO DỤC ĐÀO TẠO BỘ QUỐC PHÒNG HỌC VIỆN KỸ THUẬT QUÂN SỰ NGUYỄN THỊ HỒNG HÀ BIẾN ĐỔI HOUGH ỨNG DỤNG PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN Chuyên ngành: Khoa học máy tính LUẬN VĂN THẠC SĨ KỸ THUẬT Hà Nội - năm 2011 bộ Giáo dục đào tạo Bộ Quốc phòng Học viện Kỹ thuật Quân sự Nguyễn thị hồng hà Biến đổi hough ứng dụng phát hiện góc nghiêng văn bản Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 luận văn thạc sĩ kỹ thuật Hà Nội - Năm 2011 công trình đợc hoàn thành tại học viện kỹ thuật quân sự Cán bộ hớng dẫn chính: TS. Trần Nguyên Ngọc Cỏn b chm phn bin 1: Cỏn b chm phn bin 2: Luận văn thạc sĩ đợc bảo vệ tại: hội đồng chấm luận văn thạc sĩ học viện kỹ thuật quân sự Ngày . tháng . năm 2011 HC VIN K THUT QUN S CNG HềA X HI CH NGHA VIT NAM PHềNG SAU I HC c lp T do Hnh phỳc H Ni, ngy thỏng nm 2011 NHIệM Vụ LUậN VĂN THạC Sĩ Họ tên học viên: Nguyễn Thị Hồng Hà Giới tính: Nữ Ngày, tháng, năm sinh: 27/11/1985 Nơi sinh: Hải Dơng Chuyên ngành: Khoa học máy tính Mã số: 60 48 01 I- TÊN Đề TàI: biến đổi hough ứng dụng phát hiện nghiêng văn bản II- NHIệM Vụ NộI DUNG: S dng thut toỏn bin i Hough trong bi toỏn phỏt hin gúc nghiờng vn bn. Chng trỡnh c vit bng ngụn ng Matlab trờn b cụng c Image Processing Toolbox xõy dng, thit k chng trỡnh theo thut toỏn ó nghiờn cu. III- NGàY GIAO NHIệM Vụ : IV- NGàY HOàN THàNH NHIệM Vụ: . V- CáN Bộ HƯớNG DẫN: TS. Trần Nguyên Ngọc CáN Bộ HƯớNG DẫN CHủ NHIệM Bộ MÔN (Học hàm, học vị, họ tên chữ ký) QL CHUYÊN NGàNH Nội dung đề cơng luận văn thạc sĩ đã đợc Hội đồng chuyên ngành thông qua. Ngày tháng năm 2011 TRƯởNG PHòNG SĐH TRƯởNG KHOA QL NGàNH MỤC LỤC Trang phụ bìa . Nhiệm vụ luận văn Mục lục Tóm tắt luận văn Danh mục các ký hiệu . Danh mục các bảng . Danh mục các hình vẽ . DANH MỤC CÁC BẢNG Bảng 2.1: so sánh kết quả độ nghiêng văn bản quét của tài liệu khác nhau tính toán góc ban đầu sử dụng phương pháp Base – point …………………………13 Bảng 2.2: so sánh kết quả độ nghiêng văn bản quét của tài liệu khác nhau tính toán góc ban đầu sử dụng phương pháp Scanline. …………………………26 DANH MỤC CÁC HÌNH VẼ Hình 1.1: Các giai đoạn chính trong xử lý ảnh 5 Hình 2.1: Hộp bao quanh điểm cơ sở của một ký tự. 12 Hình 2.2: Quét tài liệu từ sách với phương pháp Base – poin. 14 Hình 2.3: Ảnh quét từ bài thi với phương pháp Base – point. 15 Hình 2.4: Ảnh quét từ danh mục điện thoại với phương pháp Base – point. 16 Hình 2.5: Ảnh quét từ danh mục điện thoại với phương pháp Base – point 17 Hình 2.6: Quét tài liệu từ sách với phương pháp scanline 22 Hình 2.7: Ảnh quét từ bài thi với phương pháp scanline 23 Hình 2.8: Ảnh quét từ danh mục điện thoại với phương pháp scanline 24 Hình 2.9: Ảnh quét từ danh mục điện thoại với phương pháp scanline 25 Hình 2.10: Đại diện dòng bình thường 28 Hình 3.1: Đường thẳng Hough trong tọa độ cực 38 Hình 4.1: Biến đổi Hough phát hiện góc nghiêng 41 Hình 4.2: Giao diện chính chương trình 42 MỞ ĐẦU Ngày nay, do sự thịnh hành của máy tính cá nhân, phương tiện đã làm cho kỹ thuật chế bản điện tử trở nên vô cùng phổ biến, số lượng những tài liệu lưu trữ trên giấy đã tăng đến một số lượng đáng kể. Hàng tỷ tỷ những trang giấy được tạo ra mỗi năm dưới nhiều hình thức khác nhau như sách, tạp chí, bản tin, báo, thư từ, biểu mẫu, bảng ghi nhớ, … trên khắp thế giới. Mặc khác, việc lưu trữ, phân phối, phục hồi những thông tin trên giấy là một công việc đòi hỏi nhiều công sức, thậm chí không thể thực hiện được một cách thủ công. Trong khi quét văn bản, bị nghiêng là không tránh khỏi đối với các văn bản in, viết tay, văn bản hình ảnh… Phát hiện độ nghiêng là một trong những vấn đề đầu tiên được áp dụng để quét các văn bản khi chuyển đổi dữ liệu sang dạng số. Một hệ thống xử lý ảnh văn bản thường phải giải quyết bài toán phát hiện góc nghiêng như một bước đầu tiên tất yếu của công đoạn tiền xử lý. Chính vì vậy, cùng với sự phát triển của xử lý ảnh nói chung xử lý, nhận dạng văn bản nói riêng, bài toán phát hiện góc nghiêng văn bản cũng được quan tâm ngày càng nhiều dưới nhiều góc độ khác nhau. Có rất nhiều hướng tiếp cận bài toán như: thuật toán dựa vào phân tích hình chiếu, phân tích láng giềng, biến đổi Hough, phương pháp dùng các phép toán hình thái, biến đổi Fourier… Sử dụng biến đổi Hough phát hiện góc nghiêng văn bản là một kỹ thuật phân biệt tốt các ký tự chữ cái những đối tượng không phải chữ cái như nhiễu, đối tượng đồ hoạ, đường thẳng… do đó độ chính xác của kỹ thuật này cũng được cải thiện hơn. Xuất phát từ những yêu cầu trên, em chọn đề tài nghiên cứu: “Biến đổi Hough ứng dụng phát hiện góc nghiêng văn bản”. Các thuật toán phát hiện độ nghiêng được thực hiện. Bước đầu tiên là quét dòng cơ bản phát hiện độ nghiêng. Trong phương thức này, hình ảnh ước lượng ở nhiều góc cạnh phương sai về số lượng các điểm ảnh màu đen ước lượng mỗi dòng được xác định. Các góc mà tại đó phương sai lớn nhất tìm thấy là góc nghiêng. Bước thứ 2 là dựa trên biến đổi Hough. Biến đổi Hough là thực hiện trên ảnh văn bản đã quét phương sai trong các giá trị ρ là tính toán cho mỗi giá trị của θ . Góc mà cho giá trị phương sai lớn nhất là góc nghiêng. Bước thứ 3 là dựa trên phương thức base-point. Sau khi Base-point liên tiếp trong từng dòng văn bản trong khoảng thời gian thích hợp như một vùng đã được chọn làm mẫu cho khớp đường thẳng .Tỷ lệ trung bình của đường cơ bản được tính toán, tương ứng với mức độ nghiêng của toàn bộ văn bản hình ảnh. Chương trình được viết bằng ngôn ngữ Matlab trên bộ công cụ Image Processing Toolbox để xây dựng, mẫu nhận dạng được thu thập từ các văn bản in, viết tay quét vào bằng máy quét ảnh với các kích cỡ định dạng khác nhau, thiết kế chương trình theo thuật toán đã nghiên cứu. Chương 1 ĐẶT VẤN ĐỀ 1.1. Bài toán xử lý văn bản các ứng dụng trong thực tế Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan trọng nhất. Con người sử dụng hệ thống thị giác để xem hoặc có được thông tin mà thị giác thu được, cảm nhận . xử lý hiểu nó sau đó suy ra kết luận từ việc cảm nhận thông tin. Các lĩnh vực xử lý ảnh tập trung vào tự động hoá quá trình thu tập xử lý thông tin thị giác. Quá trình tiếp nhận phân tích thông tin thị giác của máy tính kỹ thuật số được gọi là xử lý ảnh kỹ thuật số. Một bức ảnh có thể được mô tả như là một hàm 2 chiểu I: I = f ( x , y) (1.1) Trong đó: x y là toạ độ không gian. Biên độ f tại bất kỳ cặp toạ độ (x,y) được gọi là cường độ I hoặc giá trị màu xám của ảnh. Khi toạ độ không gian giá trị biên độ, số lượng là hữu hạn rời rạc. Ảnh gọi là ảnh số. Xử lý ảnh số có thể được phân thành các nhánh con khác nhau dựa trên định nghĩa. • Đầu vào ra là ảnh • Đầu vào có thể là hình ảnh mà kết quả đầu ra được trích chọn từ những thuộc tính hình ảnh. Sau đây là danh sách các chức năng xử lý khác nhau dựa trên hình ảnh ở trên hai lớp. [...]... toán phát hiện góc nghiêng văn bản Một số thuật toán tiêu biểu sẽ được trình bày chi tiết hơn trong chương 2 Chương 2 CÁC THUẬT TOÁN PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN Có nhiều phương pháp khác nhau để phát hiện góc nghiêng hình ảnh văn bản quét Trong chương này chúng tôi nghiêng cứu 3 thuật toán phát hiện góc nghiêng văn bản tiêu biêu nhất là: Phát hiện góc nghiêng dựa vào phương pháp Base-point, dựa vào biến. .. Trong khi quét văn bản, nghiêng là không tránh khỏi khi văn bản hình ảnh được đưa vào Góc nghiêng là sự sai lệch bất kỳ của hình ảnh từ văn bản gốc, mà không song song với chiều ngang hoặc dọc Góc nghiêng văn bản là một trong những nhiệm vụ quan trọng cần được sửa chữa trong xử lý văn bản Góc nghiêng văn bản là một bài toán kinh điển trong xử lý ảnh văn bản Một hệ thống xử lý ảnh văn bản thường phải... phải giải quyết bài toán phát hiện góc nghiêng như một bước đầu tiên tất yếu Chính vì vậy, cùng với sự phát triển của xử lý ảnh nói chung xử lý ảnh văn bản nói riêng, bài toán góc nghiêng văn bản cũng được quan tâm ngày càng nhiều dưới nhiều góc độ khác nhau Có rất nhiều hướng tiếp cận cho bài toán góc nghiêng văn bản từ trước tới nay Các thuật toán phát hiện góc nghiêng thường được xây dựng... nhẵn cao • điểm nhất chọn là giá trị nguyên của các góc nghiêng Giá trị góc thực tính – trong tất cả giá trị thực góc trong t0 ± của các số nguyên có giá trị là góc lựa chọn tính trung bình nó Điều này, giá trị trung bình đại diện cho góc nghiêng cuối cùng của văn bản 2.3 Phát hiện góc nghiêng dựa vào phương pháp Scanline Có nhiều phương pháp khác nhau để phát hiện góc nghiêng hình ảnh văn bản. .. phương pháp Scanline Bảng 2.2: So sánh kết quả độ nghiêng văn bản quét của tài liệu khác nhau tính toán góc ban đầu sử dụng phương pháp Scanline Góc => Các hình văn bản quét Hình 2.7 (a) Hình 2.7 (c) Hình 2.8 (a) Hình 2.8 (c) Hình 2.9 (a) Hình 2.9 (c) Tính góc nghiêng θ (¿¿ s) ¿ -8 6 -7 15 16 -18 Góc nghiêng ban đầu (θ) -8 6 -7 15 16 -18 2.3.2 Biến đổi Hough Thuật toán dùng biến đổi Hough thường xác định... nghiêng thường được xây dựng cho các hệ thống phân tích ảnh văn bản khác nhau nên chỉ giải quyết cho những loại ảnh văn bản cụ thể Có thể chia ra một số hướng tiếp cận cơ bản cho bài toán góc nghiêng văn bản như sau: - Các thuật toán dựa vào phương pháp Base - point - Các thuật toán dựa vào biến đổi Hough (Hough Transform) - Các thuật toán dựa vào biến đổi Fourier (Fourier Transform) - Các thuật toán phân... thường xác định một số điểm đen dùng biến đổi Hough tác động lên các điểm đó Biến đổi Hough ánh xạ một đường thẳng trong mặt phẳng thành các cặp (r,ϕ) trong không gian Hough với r là khoảng cách từ gốc tọa độ tới đường thẳng đó ϕ là góc nghiêng của đường thẳng đó so với trục hoành Góc nghiêng văn bản tương ứnggóc có tổng số điểm nằm trên những đường thẳng cùng lệch góc lớn nhất Thông thường để... là: Phát hiện góc nghiêng dựa vào phương pháp Base-point, dựa vào biến đổi Fourier phát hiện góc nghiêng dựa vào phương pháp Scanline 2.1 Phát hiện góc nghiêng dựa vào phương pháp Base-point Đầu tiên chúng ta sẽ thảo luận về các phương pháp pháp hiện góc nghiêng bằng cách sử dụng thuật toán staight line phù hợp Các bước liên quan cộng thêm tiêu chuẩn khác nhau mà nó tăng hiệu quả của các thuật toán... Việc xác định góc nghiêng văn bản sẽ được xác định nhờ phép biến đổi Hough cho những điểm giữa đáy của hình chữ nhật nhỏ nhất bao quanh đối tượng ảnh cho các đối tượng ảnh có kích thước chủ đạo Kết luận Nội dung chương 1 đã giới thiệu tổng quan các bước tiền xử lý văn bản, vai trò của nó trong việc nhận dạng văn bản Bước đầu tiếp cận với bài toán phát hiện góc nghiêng văn bản Qua nghiên cứu có rất... một số hạn chế ứng dụng như: việc nhận dạng tự động của các chữ số trong bức ảnh chụp của tấm giấy phép ôtô trở thành một vấn để kỹ thuật đơn thuần, cách đọc dựa trên camera của văn bản ví dụ, trong hệ thống hỗ trợ cho người mù, chỉ bắt đầu hiển thị kết quả sơ bộ 1.3 Bài toán phát hiện góc nghiêng văn bản Xử lý văn bản hình ảnh có nhiều nhiệm vụ khác nhau có các phương pháp để thực hiện các nhiệm . góc nghiêng văn bản tiêu biêu nhất là: Phát hiện góc nghiêng dựa vào phương pháp Base-point, dựa vào biến đổi Fourier và phát hiện góc nghiêng dựa vào. được cải thiện hơn. Xuất phát từ những yêu cầu trên, em chọn đề tài nghiên cứu: Biến đổi Hough và ứng dụng phát hiện góc nghiêng văn bản . Các

Ngày đăng: 17/04/2013, 12:52

Hình ảnh liên quan

Pj (xj,yj) khụng tỡm thấy trong bất kỳ nhúm cơ sở nào, đưa Pj vào G(k) - BIẾN ĐỔI HOUGH VÀ ỨNG DỤNG PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN

j.

(xj,yj) khụng tỡm thấy trong bất kỳ nhúm cơ sở nào, đưa Pj vào G(k) Xem tại trang 21 của tài liệu.
Bảng 2.1: so sỏnh kết quả độ nghiờng văn bản quột của tài liệu khỏc nhau tớnh toỏn gúc ban đầu sử dụng phương phỏp Base – point. - BIẾN ĐỔI HOUGH VÀ ỨNG DỤNG PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN

Bảng 2.1.

so sỏnh kết quả độ nghiờng văn bản quột của tài liệu khỏc nhau tớnh toỏn gúc ban đầu sử dụng phương phỏp Base – point Xem tại trang 21 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan