Xác định góc nghiêng văn bản

61 419 0
Xác định góc nghiêng văn bản

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trong số các thông tin con người thu nhận từ thế bên ngoài, cố đến hơn 80% được ghi nhận bằng mắt tức là ở dạng ảnh. VI vậy xử lý ảnh là một ngành khoa học đã và đang và sẽ phát triển mạnh cò ứng dụng rộng rãi trong khoa học và đới sống thực tiễn. Các hệ thống xử lý ảnh cho phép con người thu nhận lưu trữ, phân tích và nhận dạng ảnh. Một bộ phận quan trọng của xử lý ảnh là xử lý văn bản. Một trong những nhiên vụ và là đối tượng chính của xử lý ảnh văn bản là tự động hoá công việc văn phòng.

Xác định góc nghiêng vàn bản Đồ án tốt nghiệp Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 1 Mục lục Mục lục 1 lời mở đầu 4 Lời cảm ơn 5 Chương 1 7 Tổng quan về xử lý ảnh và bài toán phát hiện góc 7 nghiêng 7 1.1.Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh 7 1.1.1.Xử lý ảnh là gì? 7 1.1.2Các vấn đề cơ bản trong xử lý ảnh 10 1.2.Bài toán phát hiện góc nghiêng 13 1.2.1Thuật toán dựa vào hình chiếu 14 1.2.2Các thuật toán dựa vào biến đổi Hough ( Hough Transform) 15 1.2.3Các thuật toán phân tích láng giềng 16 1.2.4Phương pháp dùng phép toán hình thái 18 Chương 2 19 Biên và các phương pháp dò biên 19 2.1.Biên của đối tượng ảnh 19 2.2.Các phương pháp dò biên trực tiếp 20 2.2.1.Phương pháp Gradient 20 2.2.1.1.Kỹ thuật Gradient 22 2.2.1.l.l.Toán tửRobert 22 2.2.1.1.2.Toán tử Prewitt 24 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 2 2.2.1.1.3.Toán tử Sobel 24 2.2.I.2.Kỹ thuật la bàn 25 2.2.2.Phương pháp Laplace 25 2.3.Phương pháp dò biên tổng quát 27 ° • • • • • ° «00000» 29 2.3.2.Phương pháp dò biên tổng quát 30 Chương 3 31 Biến đổi hough và bài toán phát hiện góc nghiêng văn 31 bản 31 3.1.Phát hiện góc nghiêng văn bản từ biên của đối tượng 32 3.2.Biến đổi Hough và phát hiện góc nghiêng văn bản 34 3.2.1Đường thẳng Hough trong toạ độ cực 34 3.2.2áp dụng biến đổi Hough trong phát hiện góc nghiêng văn bản 35 3.3.Chỉnh sửa góc nghiêng văn bản 37 3.4Thuật toán phát hiện góc nghiêng văn bản 38 Chương 4 41 chương trình phát hiện góc nghiêng văn bản 41 4.1 Sơ đồ chức năng của chương trình 41 4.2.Thiết kê Menu 42 } 48 } 49 { 49 { 49 } 49 } 49 { 49 { 49 } 49 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 3 } 50 { 50 { 51 } 51 // 52 { 53 } 53 { 53 } 53 } 53 { 53 { 54 } 54 } 54 { 55 } 55 { 55 { 56 { 56 } 58 { 58 Kết luận 59 Tài liệu tham khảo 60 Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 4 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp lời mở đầu Trong số các thông tin con người thu nhận từ thế bên ngoài, cố đến hơn 80% được ghi nhận bằng mắt tức là ở dạng ảnh. VI vậy xử lý ảnh là một ngành khoa học đã và đang và sẽ phát triển mạnh cò ứng dụng rộng rãi trong khoa học và đới sống thực tiễn. Các hệ thống xử lý ảnh cho phép con người thu nhận lưu trữ, phân tích và nhận dạng ảnh. Một bộ phận quan trọng của xử lý ảnh là xử lý văn bản. Một trong những nhiên vụ và là đối tượng chính của xử lý ảnh văn bản là tự động hoá công việc văn phòng. Một trong những vấn đề đầu tiên và kinh điển trong xử lý ảnh văn bản là bài toán góc nghiêng văn bản. Nguyên nhân đẫn đến văn bản bị nghiêng một góc xuất phát từ quá trình quét ảnh hoặc copy ảnh. Do đặt ảnh vào bệ máy quét và máy in là một công đoạn được thực hiện bằng tay lên ảnh có thể bị lệch so với bệ máy một góc mà mắt thường không nhận thấy được, đẫn đến ảnh bị lệch đi một góc tương ứng. Văn bản bị lệch có ảnh hưởng rất lớn đến các quá trình xử lý ảnh tiếp theo, vì vậy việc phát hiện và chỉnh sửa góc nghiêng văn bản là nhiệm vụ quan trong đấu tiên trong xử lý ảnh văn bản. Từ hai thập kỷ gần đây, cùng với sự phát triển của xử lý ảnh văn bản, đã có nhiều phương pháp và thuật toán cho bài toán góc nghiêng văn bản. Một trong những cách tiếp cận phổ biến và dễ hiểu nhất là phương pháp hình chiếu. Phương pháp này tính histogram cho các góc khác nhau và góc lệch văn bản tương ứng là góc có histogram lớn nhất. Một thuật toàn khác phát hiện góc nghiêng văn bản là dùng biến đổi Hough. Biến đôi Hough là dụng cho một số điểm ảnh đại diện của các đối tượng và dùng một mảng tích luỹ để ước lượng góc nghiêng văn bản. Trong khi đó một số thuật toán xác định góc nghiêng văn bản bằng cách gom các nhóm đối tượng láng giềng trong ảnh vào sử dụng một vector chí phương cho mỗi nhóm. Ngoài các phương pháp tiếp cận phổ biến trên bài toán góc nghiêng văn Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 5 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp bản còn được giải quyết theo một số phương pháp khác như phương pháp dùng phép toán hình thái, phương pháp dùng logic mờ, phương pháp biến đổi Fourire V.V Đồ án tốt nghiệp này đề cập đến một phương pháp giải quyết bài toán góc nghiêng văn bản. Con người thường căn cứ vào một số đối tượng chủ đạo trong các văn bản để kết luận góc nghiêng và góc nghiêng nếu có là góc của đường thẳng nối các điểm giữa đáy của một đối tượng chủ đạo đó. Thực tế này gợi ý cho ta một phương pháp phát hiện góc nghiêng văn bản là chí dựa vào những đồi tượng có kích thước chủ đạo trong ảnh để ước lượng góc nghiêng. Các đối tượng ảnh có kích thước chủ đạo được xác định thông qua việc phân loại đối tượng dựa trên các biểu đồ tần xuất kích thước của chúng. Góc nghiêng văn bản được xác định bằng cách áp dụng biến đổi Hough lên điểm giữa đáy của hình chữ nhật ngoại tiếp các đối tượng có kích thước chủ đạo trong ảnh. Việc xác định các hình chữ nhật này dựa vào biên hay chu tuyến ngoài của các đối tượng. Thuật toán phát hiện góc nghiêng văn bản được trình bày ở đây là làm việc với ảnh PCX (trắng đen). Luận văn được chia thành bốn chương: > Chương 1: Tổng quan về xử lý ảnh và bài toán phát hiện góc nghiêng. > Chương 2: Biên của và các phương pháp dò biên. > Chương 3: Biến đổi Hough và bài toán phát hiện góc nghiêng văn bản. > Chương 4: Chương trình phát hiện góc nghiêng văn bản Lời cảm ơn Trong suốt quá trình làm khoá luận tốt nghiệp vừa qua, dưới sự giúp đỡ, Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 6 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp chỉ bảo nhiệt tình của thấy giáo hướng dẫn TS Đỗ Năng Toàn khoá luận tốt nghiệp của em đã được hoàn thành. Mặc dù đã cố gắng hết sức cùng với sự tận tâm của thầy giáo hướng dẫn song do trình độ còn hạn chế, nội dung đề tài còn quá mới mẻ đối với em nên em khó tránh khỏi những thiếu sót trong quá trình làm khoá luận. Để hoàn thành được khoá luận này. Em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo Đỗ Năng Toàn, người đã tận tình hướng dẫn em trong suốt quá trình tìm hiểu, xây dựng và phát triển bài toán khoá luận tốt nghiệp này. Và em cũng xin chân thành cảm ơn các thầy cô giáo trong khoa Công Nghệ Thông Tin trường Đại Học Dân Lập Hải Phòng đã giúp đỡ, tạo điều kiện tốt nhất để chúng em hoàn thành tốt khoá luận của mình. Em xin được gửi lời cảm ơn của mình tới gia đình và bạn bè, những người đã động viên giúp đỡ em trong quá trình làm khoá luận tốt nghiệp. Cuối cùng em rất mong nhận được sự chỉ dẫn của các thầy cô và sự góp ý của các bạn để chương trình của em được hoàn thiện hơn. Hải Phòng ngày tháng năm2004 Sinh viên thực hiện Cao Thi Thu Thuỷ Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 7 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp Chương 1 Tổng quan về xử lý ảnh và bài toán phát hiện góc nghiêng 1.1. Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh 1.1.1. Xử lý ảnh là gì? Xử lý ảnh là đối tượng nghiên cứu của lĩnh vực thị giác máy, là quá trình biến đổi từ một cảnh ban đầu sang một ảnh mới với các đặc tính và tuân theo ý muốn của người sử dụng. Xử lý ảnh có thể gồm quá trình phân tích, phân lóp các đối tượng, làm tăng chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay quá trình biên dịch các thông tin hình ảnh của ảnh. Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng. Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử lý ảnh số bao gồm các phương pháp và kĩ thuật để biến đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên. Mục đích của xử lý ảnh gồm: • Biến đổi ảnh, làm tăng chất lượng ảnh. • Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá các nội dung của ảnh. Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh thành những phần có ý nghĩa, để phân biệt đối tượng này với đối tượng khác. Dựa vào đó ta có thể mô tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê một số phương pháp nhận dạng cơ bản như nhận dạng cạnh của các đối tượng trên ảnh, tách cạnh, phân đoạn hình ảnh V.V kỹ thuật này được dùng Camera Sensor Thu nhân Số hoá Phân tích ảnh ảnh Nhận dạng Hệ quyết định Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 8 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp nhiều trong y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ trong văn bản. Hình 1: Các giai đoạn chính trong xử lý ảnh ❖ Sơ lược vê ảnh nhị phản: Trong quá trình xử lý ảnh một ảnh thu nhập vào máy tính phải được mã hoá. Hình ảnh khi lưu trữ dưới dạng tập tin phải được số hoá. Tiêu chuẩn đặt ra là ảnh phải được lưu trữ thế nào sao cho các ứng dụng khác nhau có thể thao tác trên các loại dữ liệu này. Một số dạng ảnh đã được chuẩn hoá như GIF, BMP, PCX nhìn chung mỗi kiểu lưu trữ ảnh đều có điểm riêng. Tuỳ theo vùng các giá trị xám của điểm ảnh, mà các ảnh được phân chia ra thành ảnh màu, ảnh xám, ảnh nhị phân. Khi trên một ảnh chỉ có giá trị 0 hoặc 1 thì ta nói đó là ảnh nhị phân hoặc ảnh đen trắng và các điểm ảnh của nó gọi là điểm ảnh nhị phân. Việc xử lý ảnh nhị phân là một bước tiền xử lý của các ảnh để phân đoạn và tách ra các đặc tính, đây là một phương pháp quan trọng của kĩ thuật xử lý ảnh số. Nhờ vậy, ta có thể biết được mối quan hệ giữa các điểm ảnh cũng như thực hiện các phép biến đổi ảnh không tuyến tính đạt hiệu quả; Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 9 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp trong quá trình xử lý ảnh các phép biến đổi này làm cho việc đánh giá ảnh trở lên đơn giản. Việc đếm các điểm ảnh trên ảnh nhị phân đã qua biến đổi tạo điều kiện thuận lợi cho việc tách ra các đặc tính. Bằng cách sử dụng các ảnh nhị phân đã qua xử lý như là những mặt nạ đối với các ảnh xám, ta có thể tách ra các vùng đáng quan tâm của một ảnh xám từ tập hợp các ảnh. Để tạo ra một ảnh nhị phân, một ảnh đa cấp xám cần phải được biến đổi thành một ảnh nhị phân nhờ một quá trình phân đoạn thích hợp. Muốn thế phương pháp đơn giản nhất là phương pháp tách ngưỡng. Các giá trị nằm ở trên ngưỡng được gán giá trị trị 1 còn ở bên dưới ngưỡng thì được gán giá trị 0. Tác động xử lý ảnh nhị phân có thể được thực hiện một cách rất hiệu quả bằng chương trình trên một máy tính. Nhiều hệ thống xử lý ảnh hiện đại, được dùng cho việc xử lý ảnh nhị phân, trong đó thường là có trang bị các phần cứng đặc biệt để đạt được tốc độ xử lý cao. Đối với một ảnh thu được từ thực tế, không phải bao giờ cũng có được giá trị đúng của các điểm ảnh. Có thể quá trình thu nhận ảnh từ thiết bị ngoại vi đã xuất hiện nhiều lần và độ tương phản kém. Vì thế, thông thường để thực hiện một phép xử lý, đó là loại bỏ nhiễu và làm trơn ảnh đảm bảo cho quá trình xử lý tiếp theo được chính xác hơn. Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 10 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp § 1.1.2 Các vấn đề cơ bản trong xử lý ảnh > ảnh và điểm ảnh ảnh là một mảng số thực hai chiều (Ij j) có kích thước (m * n), trong đó mỗi phần tử I j j (i=l_______m , j = 1 n) biểu đố mức xám của ảnh tại vi trí (i, j )tương ứng. ảnh được gọi là nhị phân nếu các giá trị chỉ nhận 0 hoặc 1 > Các điểm 4 và 8 láng giềng Các điểm 4, 8-láng giềng: Giả sử (i,j) là một điểm ảnh, khi đó các điểm 4- láng giềng là: N 4 = (i+i,j); (i, j+i)} Màn hình đồ hoạ Camera Bộ xử lý tương tự Bộ nhớ ảnh íCT Bộ nhớ ngoài Máy chủ Bộ xử lý ảnh số Màn hình Bàn phím Máy in Hình2 : Các thành phần chính của hệ thống xử lý ảnh [...]... hiện góc nghiêng Góc nghiêng văn bản là một bài toán kinh điển trong xử lý ảnh văn bản Một hệ thống xử lý ảnh văn bản thường phải giải quyết bài toán góc nghiêng như một bước đầu tiên và cũng không thể tránh khỏi Chính vì vậy, cùng với sự phát Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 13 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp triển của xử lý ảnh nói chung và xử lý ảnh văn bản nói... ảnh văn bản nói riêng, bài toán góc nghiêng văn bản cũng được quan tâm ngày càng nhiều và dưới nhiều góc độ khác nhau Các thuật toán phát hiện góc nghiêng văn bản thường được xây dựng cho các hệ thống phân tích ảnh văn bản cụ thể vì vậy thường chỉ giải quyết cho một số loại văn bản sau đây Sau đây là một số hướng tiếp cận phổ biến cho bài toán phát hiện góc nghiêng văn bản 1.2.1 Thuật toán dựa vào hình... dựng được thuật toán xác định góc nghiêng văn bản, trước hết ta phải dùng kỹ thuật dò biên để xác định chu tuyến cho các đối tượng ảnh Các hình chữ nhật chứa các đối Cao Thị Thu Thuỷ -Khoa CNTT- Đại học dân lập Hải Phòng 31 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp tượng này được lưu lại cho các quá trình xử lý tiếp theo Dựa váo sơ đò phân bố các kích thước của các đối tượng, xác định các ngưỡng kích... Phòng 16 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp phần tử mảng tích luỹ sẽ cho biết nhóm láng giềng và vector định hướng cho góc bằng với chỉ số của phần tử mảng đó Góc lệch của văn bản là góc tương ứng với phàn tử Histogam lớn nhất Việc gom các đối tượng thành các cặp láng giềng gần nhất mục đích để gom các cặp ký tự kề nhau trong các dòng văn bản và vector giữa các đối tượng này cho biết góc của... hiện góc nghiêng văn bản ý tưởng chính của phương pháp này là tính Histogram cho tất cả các góc lệch Histogram của một góc là số điểm đen trong ảnh sao cho các điểm này nằm trên những đường thẳng có cùng một hướng tương ứng với góc đó Sau đó, dùng một hàm chi phí áp dụng cho các giá trị Histogram này Góc nghiêng văn bản tương ứng với góc có giá trị hàm chi phí cực đại Các thuật toán phát hiện góc nghiêng. .. Đại học dân lập Hải Phòng 33 Xác định góc nghiêng vàn bản Đồ án tốt nghiệp tượng ảnh, ta được một hình chữ nhật ngoại tiếp đối tượng ảnh đó và điểm giữa đáy của hình chữ nhật sẽ được xác định từ các giá trị top, lef, bot, rig tương ứng 3.2 Biến đổi Hough và phát hiện góc nghiêng văn bản 3.2.1 Đường thẳng Hough trong toạ độ cực Mỗi đường thẳng trong toạ độ cực được xác định bởi cặp (r, (p) như hình... dụng cho các điểm đại diện là điểm giữa đáy của hình chữ nhật ngoại tiếp các đối tượng này Cuối cùng góc nghiêng văn bản sẽ được ước lượng từ mảng tích luỹ trong quá trình áp dụng biến đổi Hough 3.1 Phát hiện góc nghiêng văn bản từ biên của đối tượng Như đã nói ở các phần trên, góc nghiêng được xác định dựa vào biến đổi Hough Và ở đây, ta chỉ áp dụng biến đổi Hough cho những điểm giữa đáy của hình... thái Một số thuật toán xác định góc nghiêng sử dụng các phép toán hình thái í tưởng chủ đạo của phương pháp này xuất phát từ đặc điểm của phép đóng ảnh là có phả năng gắn các đối tượng gần nhau Các thuật toán này thường dùng phép đòng nhiều lần với mục đích nối các dòng văn bản với nhau Giai đoạn tiếp theo là dùng các vector chỉ phương của các dòng xác định góc nghiêng cho văn bản tương tự như trong... tự năm trên các dòng văn bản khác Vì vậy thuật toán sẽ đưa ra một góc lệch sai cho văn bản Cũng theo hướng cải tiến của ơ gorman, Liobios đé xuất một phương pháp gom các láng giềng theo số lượng nhiều nhất có thể Phương pháp này tương tự như giải quyết bài toán xác định các dòng cho một văn bản Vì vậy, hạn chế chính của ơ Gorman là sự phụ thuộc vào cả khoảng cách tứ cấc dòng văn bản lẫn phông chữ tức... đối tượng Vì vậy vector định hướng sẽ phản ánh chính xác hơn góc lệch của các dòng văn bản Tuy nhiên phương pháp của ơ Gorman vẫn gặp khó khăn vì các ký tự được chia thành nhiều phần và đặc biệt với những góc nghiêng khá lớn Khi khoảng cách giữa các ký tự trong văn bản lớn thì rất có thể các láng giềng tìm được trong thuật toán không phải là các ký tự nằm trên cùng một dòng văn bản, thay vào đó là các . trong phát hiện góc nghiêng văn bản 35 3.3.Chỉnh sửa góc nghiêng văn bản 37 3.4Thuật toán phát hiện góc nghiêng văn bản 38 Chương 4 41 chương trình phát hiện góc nghiêng văn bản 41 4.1 Sơ đồ. đổi hough và bài toán phát hiện góc nghiêng văn 31 bản 31 3.1.Phát hiện góc nghiêng văn bản từ biên của đối tượng 32 3.2.Biến đổi Hough và phát hiện góc nghiêng văn bản 34 3.2.1Đường thẳng Hough. công thức: xp=x*k yp=y*k 1.2. Bài toán phát hiện góc nghiêng Góc nghiêng văn bản là một bài toán kinh điển trong xử lý ảnh văn bản. Một hệ thống xử lý ảnh văn bản thường phải giải quyết bài toán góc nghiêng như một bước

Ngày đăng: 08/10/2014, 15:19

Tài liệu cùng người dùng

Tài liệu liên quan