Giáo trình môn Xử lý ảnh

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG BÀI GIẢNG MÔN HỌC XỬ LÝ ẢNH Người soạn : PGS TS ĐỖ NĂNG TOÀN Hà Nội, Tháng 06 năm 2010 LỜI NÓI ĐẦU Khoảng mười năm trở lại đây, phần cứng máy tính thiết bị liên quan có tiến vượt bậc tốc độ tính toán, dung lượng chứa, khả xử lý v.v giá giảm đến mức máy tính thiết bị liên quan đến xử lý ảnh không thiết bị chuyên dụng Khái niệm ảnh số trở nên thông dụng với hầu hết người xã hội việc thu nhận ảnh số thiết bị cá nhân hay chuyên dụng với việc đưa vào máy tính xử lý trở nên đơn giản Trong hoàn cảnh đó, xử lý ảnh lĩnh vực quan tâm trở thành môn học chuyên ngành sinh viên ngành công nghệ thông tin nhiều trường đại học nước Tuy nhiên, tài liệu giáo trình điều khó khăn Hiện có số tài liệu tiếng Anh tiếng Pháp, tài liệu tiếng Việt Với mong muốn đóng góp vào nghiệp đào tạo nghiên cứu lĩnh vực này, biên soạn giáo trình Xử lý ảnh dựa đề cương môn học duyệt Cuốn sách tập trung vào vấn đề xử lý ảnh nhằm cung cấp tảng kiến thức đầy đủ chọn lọc nhằm giúp người đọc tự tìm hiểu xây dựng chương trình ứng dụng liên quan đến xử lý ảnh Giáo trình chia làm chương: Chương 1, trình bày Tổng quan xử lý ảnh, khái niệm bản, sơ đồ tổng quát hệ thống xử lý ảnh vấn đề xử lý ảnh Chương 2, trình bày vấn đề liên quan đến thu nhận ảnh, bao gồm thiết bị thu nhận ảnh bản, trình lấy mẫu lượng tử hóa, số phương pháp biểu diễn ảnh, số định dạng ảnh phổ dụng Chương 3, trình bày kỹ thuật nâng cao chất lượng ảnh dựa vào thao tác với điểm ảnh, nâng cao chất lượng ảnh thông qua việc xử lý điểm ảnh lân cận điểm ảnh xét Chương trình bày kỹ thuật nâng cao chất lượng ảnh nhờ vào việc lọc nhiễu Chương 4, trình bày kỹ thuật việc phát biên đối tượng ảnh theo hai khuynh hướng: Phát biên trực tiếp phát biên gián tiếp Chương thể kỹ thuật phân vùng ảnh, khâu quan trọng hỗ trợ cho việc trích chọn thuộc tính ảnh để tiến tới hiểu ảnh Chương 6, trình bày vấn đề kỹ thuật liên quan đến nhận dạng ảnh, theo tiếp cận không gian, tiếp cận cấu trúc tiếp cận mạng nơron Và cuối Chương với kỹ thuật nén ảnh, vấn đề quan tâm xử lý ảnh Giáo trình biên soạn dựa kinh nghiệm giảng dạy tác giả nhiều năm khóa đại học cao học ĐH Công nghệ - ĐHQG Hà Nội, ĐH Khoa học tự nhiên – ĐHQG Hà Nội, Khoa Công nghệ thông tin – ĐH Thái Nguyên, Khoa Công nghệ thông tin – Học viện Công nghệ BCVT v.v Cuốn sách làm tài liệu tham khảo cho sinh viên hệ kỹ sư, cử nhân bạn quan tâm đến vấn đề nhận dạng xử lý ảnh Các tác giả bày tỏ lòng biết ơn chân thành tới bạn đồng nghiệp Viện Công nghệ thông tin, Khoa Công nghệ thông tin – Học viện Công nghệ BCVT, Khoa Công nghệ thông tin - ĐH Thái Nguyên, Khoa Công nghệ thông tin - ĐH Công nghệ - ĐHQG Hà Nội, Khoa Toán – Cơ – Tin, ĐH Khoa học tự nhiên, ĐHQG Hà Nội động viên, góp ý giúp đỡ để hoàn chỉnh nội dung sách Xin cám ơn Lãnh đạo Khoa Công nghệ thông tin – Học viện Công nghệ BCVT, Ban Giám đốc Học viện Công nghệ BCVT hỗ trợ tạo điều kiện đời giáo trình Mặc dù cố gắng tài liệu chắn không tránh khỏi sai sót Chúng xin trân trọng tiếp thu tất ý kiến đóng góp bạn đọc bạn đồng nghiệp để có chỉnh lý kịp thời Thư góp ý xin gửi về: Đỗ Năng Toàn, Viện Công nghệ thông tin 18 Hoàng Quốc Việt, Cầu Giấy, Hà Nội Điện thoại: 04.3.7567935 Email: dntoan@ioit.ac.vn Hà Nội, ngày 28 tháng 06 năm 2010 TÁC GIẢ MỤC LỤC LỜI NÓI ĐẦU .2 Chương 1: NHẬP MÔN XỬ LÝ ẢNH 1.1 TỔNG QUAN VỀ HỆ THỐNG XỬ LÝ ẢNH .7 1.2 NHỮNG VẤN ĐỀ CƠ BẢN TRONG XỬ LÝ ẢNH 1.2.1 Một số khái niệm 1.2.2 Nắn chỉnh biến dạng 1.2.3 Khử nhiễu 1.2.4 Chỉnh mức xám 1.2.5 Phân tích ảnh 1.2.6 Nhận dạng 1.2.7 Nén ảnh 10 Chương 2: THU NHẬN ẢNH 11 2.1 CÁC THIẾT BỊ THU NHẬN ẢNH 11 2.2 LẤY MẪU VÀ LƯỢNG TỬ HOÁ 11 2.2.1 Giai đoạn lấy mẫu 11 2.2.2 Lượng tử hóa 12 2.3 MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN ẢNH 12 2.3.1 Mô hình Raster 12 2.3.2 Mô hình Vector 13 2.4 CÁC ĐỊNH DẠNG ẢNH CƠ BẢN 13 2.4.1 Định dạng ảnh IMG 13 2.4.2 Định dạng ảnh PCX 14 2.4.3 Định dạng ảnh TIFF 15 2.4.4 Định dạng file ảnh BITMAP 16 2.5 KỸ THUẬT TÁI NHẬN ẢNH 17 2.5.1 Kỹ thuật chụp ảnh 17 2.5.2 Kỹ thuật in ảnh 18 2.6 KHÁI NIỆM ẢNH ĐEN TRẮNG, ẢNH MÀU 19 2.6.1 Phân loại ảnh số 20 2.6.2 Màu sắc 20 Chương 3: XỬ LÝ NÂNG CAO CHẤT LƯỢNG ẢNH 29 3.1 CẢI THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ ĐIỂM 29 3.1.1 Giới thiệu 29 3.1.2 Tăng giảm độ sáng 29 3.1.3 Tách ngưỡng 29 3.1.4 Bó cụm 30 3.1.5 Cân histogram 30 3.1.6 Kỹ thuật tìm tách ngưỡng tự động 31 3.1.7 Biến đổi cấp xám tổng thể 32 3.2 CẢI THIỆN ẢNH SỬ DỤNG CÁC TOÁN TỬ KHÔNG GIAN 34 3.2.1 Phép nhân chập mẫu 34 3.2.2 Một số mẫu thông dụng 35 3.2.3 Lọc trung vị 36 3.2.4 Lọc trung bình 37 3.2.5 Lọc trung bình theo k giá trị gần 39 3.3 KHÔI PHỤC ẢNH 39 3.3.1 Nhiễu mô hình nhiễu 39 3.3.2.Các loại nhiễu 40 3.3.3.Các kỹ thuật lọc nhiễu 40 Chương 4: CÁC PHƯƠNG PHÁP PHÁT HIỆN BIÊN 43 4.1 KHÁI QUÁT VỀ BIÊN VÀ PHÂN LOẠI CÁC KỸ THUẬT DÒ BIÊN 43 4.1.1 Giới thiệu 43 4.1.2 Kỹ thuật phát biên Gradient 43 4.1.2.1 Kỹ thuật Prewitt 44 4.1.2.2 Kỹ thuật Sobel 45 4.1.2.3 Kỹ thuật la bàn 46 4.1.3 Kỹ thuật phát biên Laplace 46 4.1.4 Kỹ thuật Canny 47 4.2 PHƯƠNG PHÁP PHÁT HIỆN BIÊN CỤC BỘ 48 4.2.1 Biên độ biến đổi mức xám 48 4.2.2 Phát biên dựa vào trung bình cục 49 4.3 DÒ BIÊN THEO QUY HOẠCH ĐỘNG 51 4.3.1 Một số khái niệm 51 4.3.2 Chu tuyến đối tượng ảnh 52 4.3.3 Thuật toán dò biên tổng quát 54 4.4.CÁC PHƯƠNG PHÁP KHÁC 56 4.4.1 Các phép toán hình thái 56 4.4.2 Một số tính chất phép toán hình thái 57 4.4.3 Xấp xỉ xấp xỉ đối tượng ảnh 61 4.4.4 Thuật toán phát biên dựa vào phép toán hình thái 62 Chương 5: PHÂN VÙNG ẢNH 64 5.2 PHÂN VÙNG ẢNH THEO NGƯỠNG BIÊN ĐỘ 65 5.2.1 Thuật toán đẳng liệu 66 5.2.2 Thuật toán đối xứng 66 5.2.3 Thuật toán tam giác 67 5.3 PHÂN VÙNG THEO MIỀN ĐỒNG NHẤT 68 5.3.1 Giới thiệu 68 5.3.2 Phương pháp tách tứ phân (quad tree) 69 5.3.3 Các phương pháp phân vùng hợp 73 5.3.4 Phương pháp tách hợp (split-merge) 74 5.4 PHÂN VÙNG DỰA THEO ĐƯỜNG BIÊN 74 5.4.1 Phát biên 74 5.4.2 Làm mảnh biên 75 5.4.3 Nhị phân hóa đường biên 75 5.4.4 Miêu tả đường biên 76 5.5 PHÂN VÙNG THEO KẾT CẤU BỀ MẶT 76 5.4.1 Phương pháp thống kê 76 5.4.2 Phương pháp cấu trúc 78 5.4.3 Tiếp cận theo tính kết cấu 79 Chương 6: NHẬN DẠNG ẢNH 80 6.1 GIỚI THIỆU 80 6.2 NHẬN DẠNG DỰA THEO MIỀN KHÔNG GIAN 81 6.2.1 Phân hoạch không gian 81 6.2.2 Hàm phân lớp hay hàm định 81 6.2.3 Nhận dạng thống kê 82 6.2.4 Một số thuật toán nhận dạng tiêu biểu tự học 83 6.2.4.1 Thuật toán dựa vào khoảng cách lớn 83 6.2.4.2 Thuật toán K trung bình (giả sử có K lớp) 84 6.2.4.3 Thuật toán ISODATA 84 6.3 NHẬN DẠNG DỰA THEO CẤU TRÚC 85 6.3.1 Biểu diễn định tính 85 6.3.2 Phương pháp định dựa vào cấu trúc 85 6.4 NHẬN DẠNG DỰA THEO MẠNG NƠRON 86 6.4.1 Mạng Hopfield 86 6.4.2 Mạng Kohonen 88 Chương 7: NÉN DỮ LIỆU ẢNH 91 7.1 GIỚI THIỆU 91 7.2 CÁC PHƯƠNG PHÁP NÉN THẾ HỆ THỨ NHẤT 92 7.2.1 Phương pháp mã hóa loạt dài 92 7.2.2 Phương pháp mã hóa Huffman 92 7.2.3 Phương pháp LZW 94 7.2.4 Phương pháp mã hóa khối 98 7.2.5 Phương pháp thích nghi 99 7.2.6 Biến đổi Cosin chuẩn nén JPEG 100 7.3 CÁC PHƯƠNG PHÁP NÉN THẾ HỆ THỨ HAI 105 7.3.1 Phương pháp Kim tự tháp Laplace (Pyramide Laplace) 105 7.3.2 Phương pháp mã hóa dựa vào biểu diễn ảnh 105 7.3.2.1 Mã hóa dựa vào vùng gia tăng 106 7.3.2.2 Phương pháp tách – hợp 106 TÀI LIỆU THAM KHẢO 108 Chương 1: NHẬP MÔN XỬ LÝ ẢNH 1.1 TỔNG QUAN VỀ HỆ THỐNG XỬ LÝ ẢNH Con người thu nhận thông tin qua giác quan, thị giác đóng vai trò quan trọng Những năm trở lại với phát triển phần cứng máy tính, xử lý ảnh đồ hoạ phát triển cách mạnh mẽ có nhiều ứng dụng sống Xử lý ảnh đồ hoạ đóng vai trò quan trọng tương tác người máy Quá trình xử lý ảnh xem trình thao tác ảnh đầu vào nhằm cho kết mong muốn Kết đầu trình xử lý ảnh ảnh “tốt hơn” kết luận Ảnh “Tốt hơn” Ảnh XỬ LÝ ẢNH Kết luận Hình 1.1 Quá trình xử lý ảnh Ảnh xem tập hợp điểm ảnh điểm ảnh xem đặc trưng cường độ sáng hay dấu hiệu vị trí đối tượng không gian xem hàm n biến P(c1, c2, , cn) Do đó, ảnh xử lý ảnh xem ảnh n chiều Sơ đồ tổng quát hệ thống xử lý ảnh: Hệ định Thu nhận ảnh (Scanner, Camera,Sensor) Tiền xử lý Trích chọn đặc điểm Đối sánh rút kết luận Hậu xử lý Lưu trữ Hình 1.2 Các bước hệ thống xử lý ảnh 1.2 NHỮNG VẤN ĐỀ CƠ BẢN TRONG XỬ LÝ ẢNH 1.2.1 Một số khái niệm * Ảnh điểm ảnh: Điểm ảnh xem dấu hiệu hay cường độ sáng vị trí đối tượng không gian ảnh xem tập hợp điểm ảnh * Mức xám, màu Là số giá trị có điểm ảnh ảnh Chương 1: Nhập môn xử lý ảnh 1.2.2 Nắn chỉnh biến dạng Ảnh thu nhận thường bị biến dạng thiết bị quang học điện tử P’i ×f(Pi) Pi Ảnh thu nhận Ảnh mong muốn Hình 1.3 Ảnh thu nhận ảnh mong muốn Để khắc phục người ta sử dụng phép chiếu, phép chiếu thường xây dựng tập điểm điều khiển Giả sử (Pi, Pi’) i = 1, n có n tập điều khiển Tìm hàm f: Pi a f (Pi) cho n ∑ f ( Pi ) − Pi ' i =1 → Giả sử ảnh bị biến đổi bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc tuyến tính Khi hàm f có dạng: f (x, y) = (a1x + b1y + c1, a2x + b2y + c2) Ta có: [ φ = ∑ ( f ( Pi ) − Pi ' ) = ∑ (a1 xi + b1 yi + c1 − xi' ) + (a xi + b2 yi + c2 − yi' ) n n i =1 i =1 2 ] Để cho φ → ⎧ ∂φ =0 ⎪ a ∂ ⎪ ⎪ ∂φ =0⇔ ⎨ b ∂ ⎪ ⎪ ∂φ =0 ⎪ ⎩ ∂c1 n n n ⎧ n ' a x b x y c x + + = ⎪∑ i ∑ i i ∑ i ∑ x i x i i =1 i =1 i =1 ⎪ i =1 n n n n ⎪ ' a x y b y c y + + = ⎨∑ i i ∑ i ∑ i ∑ y i x i i =1 i =1 i =1 ⎪ i =1 n n ⎪ n ' ⎪∑ a1 x i + ∑ b1 y i + nc1 = ∑ x i i =1 i =1 ⎩ i =1 Giải hệ phương trình tuyến tính tìm Tương tự tìm a1, b1, c1 a2, b2, c2 ⇒ Xác định hàm f 1.2.3 Khử nhiễu Có loại nhiễu trình thu nhận ảnh • Nhiễu hệ thống: nhiễu có quy luật khử phép biến đổi Chương 1: Nhập môn xử lý ảnh • Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục phép lọc 1.2.4 Chỉnh mức xám Nhằm khắc phục tính không đồng hệ thống gây Thông thường có hướng tiếp cận: • Giảm số mức xám: Thực cách nhóm mức xám gần thành bó Trường hợp có mức xám chuyển ảnh đen trắng Ứng dụng: In ảnh màu máy in đen trắng • Tăng số mức xám: Thực nội suy mức xám trung gian kỹ thuật nội suy Kỹ thuật nhằm tăng cường độ mịn cho ảnh 1.2.5 Phân tích ảnh Là khâu quan trọng trình xử lý ảnh để tiến tới hiểu ảnh Trong phân tích ảnh việc trích chọn đặc điểm bước quan trọng Các đặc điểm đối tượng trích chọn tuỳ theo mục đích nhận dạng trình xử lý ảnh Có thể nêu số đặc điểm ảnh sau đây: • Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v • Đặc điểm biến đổi: Các đặc điểm loại trích chọn việc thực lọc vùng (zonal filtering) Các vùng gọi “mặt nạ đặc điểm” (feature mask) thường khe hẹp với hình dạng khác (chữ nhật, tam giác, cung tròn v.v ) • Đặc điểm biên đường biên: Đặc trưng cho đường biên đối tượng hữu ích việc trích trọn thuộc tính bất biến dùng nhận dạng đối tượng Các đặc điểm trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử Laplace v.v Việc trích chọn hiệu đặc điểm giúp cho việc nhận dạng đối tượng ảnh xác, với tốc độ tính toán cao dung lượng nhớ lưu trữ giảm xuống 1.2.6 Nhận dạng Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại phân nhóm mẫu vấn đề quan trọng thị giác máy, ứng dụng nhiều ngành khoa học khác Tuy nhiên, câu hỏi đặt là: mẫu (pattern) gì? Watanabe, người đầu lĩnh vực định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu thực thể (entity), xác định cách ang (vaguely defined) gán cho tên gọi đó” Ví dụ mẫu ảnh vân tay, ảnh vật chụp, chữ viết, khuôn mặt người ký đồ tín hiệu tiếng nói Khi biết mẫu đó, để nhận dạng phân loại mẫu có thể: Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt (discriminant analyis), mẫu đầu vào định danh thành phần lớp xác định Chương 1: Nhập môn xử lý ảnh Hoặc phân loại mẫu (unsupervised classification hay clustering) mẫu gán vào lớp khác dựa tiêu chuẩn đồng dạng Các lớp thời điểm phân loại chưa biết hay chưa định danh Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây: 1o Thu nhận liệu tiền xử lý 2o Biểu diễn liệu 3o Nhận dạng, định Bốn cách tiếp cận khác lý thuyết nhận dạng là: 1o Đối sánh mẫu dựa đặc trưng trích chọn 2o Phân loại thống kê 3o Đối sánh cấu trúc 4o Phân loại dựa mạng nơ-ron nhân tạo Trong ứng dụng rõ ràng dùng có cách tiếp cận đơn lẻ để phân loại “tối ưu” cần sử dụng lúc nhiều phương pháp cách tiếp cận khác Do vậy, phương thức phân loại tổ hợp hay sử dụng nhận dạng có kết có triển vọng dựa thiết kế hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp Việc giải toán nhận dạng ứng dụng mới, nảy sinh sống không tạo thách thức thuật giải, mà đặt yêu cầu tốc độ tính toán Đặc điểm chung tất ứng dụng đặc điểm đặc trưng cần thiết thường nhiều, chuyên gia đề xuất, mà phải trích chọn dựa thủ tục phân tích liệu 1.2.7 Nén ảnh Nhằm giảm thiểu không gian lưu trữ Thường tiến hành theo hai cách khuynh hướng nén có bảo toàn không bảo toàn thông tin Nén không bảo toàn thường có khả nén cao khả phục hồi Trên sở hai khuynh hướng, có cách tiếp cận nén ảnh: • Nén ảnh thống kê: Kỹ thuật nén dựa vào việc thống kê tần xuất xuất giá trị điểm ảnh, sở mà có chiến lược mã hóa thích hợp Một ví dụ điển hình cho kỹ thuật mã hóa *.TIF • Nén ảnh không gian: Kỹ thuật dựa vào vị trí không gian điểm ảnh để tiến hành mã hóa Kỹ thuật lợi dụng giống điểm ảnh vùng gần Ví dụ cho kỹ thuật mã nén *.PCX • Nén ảnh sử dụng phép biến đổi: Đây kỹ thuật tiếp cận theo hướng nén không bảo toàn vậy, kỹ thuật thướng nến hiệu *.JPG tiếp cận theo kỹ thuật nén • Nén ảnh Fractal: Sử dụng tính chất Fractal đối tượng ảnh, thể lặp lại chi tiết Kỹ thuật nén tính toán để cần lưu trữ phần gốc ảnh quy luật sinh ảnh theo nguyên lý Fractal 10 Chương 7: Nén liệu ảnh Bảng từ mã gán cho kí tự mã Huffman “0” 10 “-” 0110 “6” 010 “4” 11110 “.” 001 “+” 11011 “” 000 “1” 111111 “3” 1110 “8” 111110 “5” 1100 “7” 110101 “2” 0111 “9” 110100 7.2.3 Phương pháp LZW Khái niệm nén từ điển Jacob Lempel Abraham Ziv đưa lần vào năm 1997, sau phát triển thành họ giải thuật nén từ điển LZ Năm 1984, Terry Welch cải tiến giải thuật LZ thành giải thuật hiệu đặt tên LZW Phương pháp nén từ điển dựa việc xây dựng từ điển lưu chuỗi ký tự có tần suất lặp lại cao thay từ mã tương ứng gặp lại chúng Giải thuật LZW hay giải thuật trước kỹ thuật tổ chức từ điển cho phép nâng cao tỉ lệ nén Giải thuật nén LZW sử dụng cho tất loại file nhị phân Nó thường dùng để nén loại văn bản, ảnh đen trắng, ảnh màu, ảnh đa mức xám… chuẩn nén cho dạng ảnh GIF TIFF Mức độ hiệu LZW không phụ thuộc vào số bít màu ảnh Phương pháp Giải thuật nén LZW xây dựng từ điển lưu mẫu có tần suất xuất cao ảnh Từ điển tập hợp cặp từ vựng nghĩa Trong đó, từ vựng từ mã xếp theo thứ tự định Nghĩa chuỗi liệu ảnh Từ điển xây dựng đồng thời với trình đọc liệu Sự có mặt chuỗi từ điển khẳng định chuỗi xuất phần liệu đọc Thuật toán liên tục “tra cứu” cập nhật từ điển sau lần đọc ký tự liệu đầu vào Do kích thước nhớ vô hạn để đảm bảo tốc độ tìm kiếm, từ điển giới hạn 4096 phần tử dùng để lưu lớn 4096 giá trị từ mã Như độ dài lớn từ mã 12 bits (4096 = 212) Cấu trúc từ điển sau: 94 Chương 7: Nén liệu ảnh - 256 từ mã theo thứ tự từ 0…255 chữa số nguyên từ 0…255 Đây mã 256 kí tự bảng mã ASCII - Từ mã thứ 256 chứa mã đặc biệt “mã xóa” (CC – Clear Code) Mục đích việc dùng mã xóa nhằm khắc phục tình trạng số mẫu lặp ảnh lớn 4096 Khi ảnh quan niệm nhiều mảnh ảnh, từ điển từ điển gồm nhiều từ điển Cứ hết mảnh ảnh người ta lại gửi mã xóa để báo hiệu kết thúc mảnh ảnh cũ, bắt đầu mảnh ảnh đồng thời khởi tạo lại từ điển cho mảnh ảnh Mã xóa có giá trị 256 - Từ mã thứ 257 chứa mã kết thúc thông tin (EOI – End Of Information) Mã có giá trị 257 Như biết, file ảnh GIF chứa nhiểu ảnh Mỗi ảnh mã hóa riêng Chương trình giải mã lặp lặp lại thao tác giải mã ảnh gặp mã kết thúc thông tin dừng lại - Các từ mã lại (từ 258 đến 4095) chứa mẫu thương lặp lại ảnh 512 phần tử từ điển biểu diễn bit Các từ mã từ 512 đến 1023 biểu diễn 10 bit, từ 1024 đến 2047 biểu diễn 11 bit từ 2048 đến 4095 biểu diễn 12 bit Ví dụ minh họa chế nén LZW Cho chuỗi đầu vào “ABCBCABCABCD” (Mã ASCII A 65, B 66, C 67) Từ điển ban đầu gồm 256 kí tự Đầu vào Đầu A(65) Thực A có từ điển => Đọc tiếp B(66) 65 Thêm vào từ điển mã 258 đại diện cho chuỗi AB C(67) 66 Thêm vào từ điển mã 259 đại diện cho chuỗi BC B 67 Thêm vào từ điển mã 260 dại diện cho chuỗi CB C A BC có từ điển => Đọc tiếp 259 B Thêm vào từ điển mã 261 đại diện cho chuỗi BCA AB có từ điển => Đọc tiếp C 258 Thêm vào từ điển mã 262 đại diện cho chuỗi ABC A 67 Thêm vào từ điển mã 263 đại diện cho chuỗi CA B AB có từ điển => Đọc tiếp C ABC có từ điển = > Đọc tiếp D 262 Thêm vào từ điển mã 263 đại diện cho chuỗi ABCD Chuỗi đầu 65 – 66 – 667 – 259 – 258 – 67 – 262 Đầu vào có kích thước: 12x8 = 96 bits Đầu có kích thước là: 4x8+3x9 = 59 bits Tỉ lệ nén 96: 59 ≅ 1,63 95 Chương 7: Nén liệu ảnh Thuật toán - Giá trị cờ INPUT = TRUE liệu đầu vào ngược lại - Chức hàm: + Hàm InitDictionary(): hàm có chức khởi tạo từ điển Đặt giá trị cho 256 phần tử Gán mã xóa (Clear Code) cho phần tử thứ 256 mã kết thúc thông tin (End Of Information) cho phần tử thứ 257 Xóa giá trị tất phẩn tử lại + Hàm Output(): gửi chuỗi bit file Chuỗi có độ dài 9,10,11 12 tùy thuộc vào vị trí từ điển từ mã gửi Các chuỗi bit nối tiếp vào với + Hàm GetNextChar(): trả kí tự từ chuỗi kí tự đầu vào Hàm cập nhật giá trị cờ INPUT xá định xem liệu đầu vào hay không + Hàm AddtoDictionary(): gọi có mẫu xuất Hàm cập nhật mẫu vào phần tử từ điển Nếu từ điển đầy gửi mã xóa (Clear Code) gọi đến hàm InitDictionary() để khởi tạo lại từ điển + Hàm Code(): trả từ mã ứng với chuỗi Sơ đồ thuật toán nén LZW Tư tưởng đoạn mã hiểu sau: liệu đầu vào tiếp tục đọc Một chuỗi tạo từ chuỗi cũ (chuỗi ban đầu trống, chuỗi phải chuỗi tồn từ điển) kí tự vừa đọc vào Sau kiểm tra xem chuỗi có từ điển chưa Mục đích công việc hi vọng kiểm tra xem chuỗi có số kí tự lớn tồn từ điển Nếu tồn ta lại tiếp tục đọc kí tự lặp lại công việc Nếu chưa có từ điển, gửi chuỗi cũ thêm chuỗi vào từ điển Có thể xem lại phần ví dụ để hiểu rõ 96 Chương 7: Nén liệu ảnh Giải nén liệu nén LZW Giải thuật giải nén gần ngược lại với giải thuật nén Với giải thuật nén, từ mã ứng với chuỗi ghi tệp chuỗi ghép chuỗi với kí tự vùa đọc chưa có mặt từ điển Người ta cập nhật vào từ điển từ mã ứng với chuỗi tạo chuỗi cũ với kí tự vừa đọc Kí tự đồng thời kí tự chuỗi tương ứng với từ mã ghi Đây điểm mấu chốt cho phép xây dựng thuật toán giải nén Thuật toán mô tả sau: While(GetnextCode != EOI) Begin if FIRST_CODE /*Mã mảnh ảnh*/ Then Begin OutBuff(code); OldStr:= code; End; if code = CC /*Mã xóa*/ Then Begin InitDictionary(); FIST_CODE = TRUE; End; NewStr:= DeCode(code); OutBuff(NewStr); OldString = OldStr + FirstChar(NewStr); AddtoDictionary(OldStr); OldString:= NewStr; End; + Giá trị cờ FIRST_CODE = TRUE mã vừa đọc mã mảnh ảnh Mã có cách xử lí khác so với mã + Mã CC báo hiệu hết mảnh ảnh Mã EOF báo hiệu hết toàn thông tin ảnh + Chức hàm: - GetNextCode(): hàm đọc thông tin đầu vào (dữ liệu nén) trả mã tương ứng Chúng ta nhớ lại rằng, liệu nén gồm chuỗi từ mã nối tiếp Ban đầu bit, sau tăng lên 10 bit 11, 12 bit Nhiệm vụ hàm đơn giản Để biết thời điểm thời, từ mã dài bit phải theo dõi từ điển cập nhật độ dài từ mã phần tử thứ 512,1024, 2048 - OutBuff(): hàm gửi chuỗi giá trị giải mã vùng nhớ đệm - DeCode(): hàm tra cứu từ điển trả chuỗi kí tự tương ứng với từ mã 97 Chương 7: Nén liệu ảnh - FirstChar(): lấy kí tự chuỗi Kí tự vừa xác định nối tiếp vào chuỗi kí tự cũ (đã giải mã bước trước) ta chuỗi kí tự có mặt từ điển nén Chuỗi thêm vào từ điển giải nén - OutPut(): gửi chuỗi bít file Chuỗi bít có độ dài 9, 10, 11 12 tùy thuộc vào vị trí từ điển từ mã gửi Các chuỗi bit nối tiếp vào với Trường hợp ngoại lệ cách xử lý Đối với giải thuật LZW tồn trường hợp sinh chương trình giải nén không giải mã Giả sử c ký tự, S chuỗi có độ dài lớn Nếu mã k từ điển chứa giá trị cS Ngay sau k’ dùng thay cho cSc Trong chương trình giải nén, k’ xuất trước định nghĩa Rất may từ mã vừa đọc trường hợp có nội dung trùng với tổ hợp từ mã cũ với kí tự Điều giúp cho trình cài đặt chương trình khắc phục trường hợp ngoại lệ cách dễ dàng 7.2.4 Phương pháp mã hóa khối Phương pháp lúc đầu phát triển cho ảnh số mức xám, sau hoàn thiện thêm phương pháp thích nghi mở rộng cho ảnh số đa cấp xám Cho ảnh số I(x, y) kích thước MxN Người ta chia nhỏ ảnh số thành khối hình chữ nhật kích thước kx1, (k, 1) nhỏ so với M, N Như ảnh gốc coi gồm khối xếp cạnh có N x M/(k x 1) khối Ta dùng phương pháp mã hóa Huffman cho khối ảnh gốc, nghĩa gán cho từ khối từ mã nhị phân phần Một khó khăn gặp phải dùng mã hóa tới ưu Huffman số lượng khối lớn Giải pháp dùng mã hóa gần tối ưu, đơn giản để thực mã hóa Giả thiết khối độc lập số cấu hình 2kl Gọi p(I, k, l) xác suất xuất cấu hình I, entropy tương ứng là: Giá trị H(k,l) diễn giải số bit / khối Các từ mã gán cho khối k×l tạo điểm trắng (cấu hình trội) “0” Các từ mã gán cho khối k x l khác gồm k×l màu (“1” cho đen, “0” cho trắng) tiếp sau bit tiền tố “1” Việc mã hóa theo số khối sử dụng nhiều phương pháp khác phương pháp dùng biến đổi trình bày mục 8.3 để giảm bớt không gian lưu trữ Thuật toán Giả sử p(0, k, x) xác suất khối tạo điểm trắng biết, tỷ số nén tính dễ dàng Xác suất thiết lập mô hình lý thuyết cho khối đặc biệt Do vậy, ta chia khối làm hai loại: khối chiều khối hai chiều +Khối chiều: Xác suất P(0, k, l) tính nhờ vào mô hình trình Morkov bậc Quá trình biểu diễn nhiều ma trận dịch chuyển trạng thái Π: 98 Chương 7: Nén liệu ảnh Với: - p(t/t) xác suất có điền kiện trắng sang trắng - p(d/d) xác suất có điều kiện đen sang đen Các xác suất khác có ý nghĩa tương tự Như vậy: p(0,k,1) = p(t)p(t/t)k-1 Điều giải thích sau: xác suất xuất khối k x gồm điểm trắng xác suất xuất điểm trắng k -1 dịch chuyển trắng sang trắng Dựa vào quan hệ trên, ta tính tỉ số nén Cr +Khối hai chiều: Xác suất p(0, k, l) khối toàn trắng tính cách tương tự trên: p(0,k,l) = p(t)p(t/t)k-1[p(t/t).p(t/X = t, Y = t)l-1]k-1 Mối quan hệ tương đương: p(0,k,l) = p(t)p(t/t)k+l+2p(t/X = t, Y = t)(l–1)(k-1) Và tỷ số nén cho công thức: Thực tế, cài đặt người ta hay chọn khối vuông giá trị thích hợp k từ đến 7.2.5 Phương pháp thích nghi Thuật ngữ “thích nghi” thường dùng để thích hợp từ mã theo nghĩa Như phương pháp RLC trên, thay dùng chiều dài từ mã cố định m bit, người ta dùng chiều dài biến đổi sở có phương pháp RLC thích hợp Trong phương pháp mã hóa khối, người ta sử dụng chiều dài khối cố định gồm k x l điểm ảnh Tuy nhiên, với ảnh không nhất, phương pháp mã hóa bộc lộ nhiều nhược điểm Vì rằng, với ảnh không đồng nhất, không ảnh định thích nghi với điều kiện cục Một cải tiến cho vấn đề cố định kích thước khối, kích thước coi hàm tác động trung bình theo hàng (với l = 1) hay theo nhóm hàng (l > 1) Tác động quan tâm giống phương pháp dịch chuyển điểm trắng sang đen hàng 99 Chương 7: Nén liệu ảnh Một cách lý thuyết người ta tính giá trị tối ưu k(kotp): N số điểm ảnh hàng Trên sở này, người ta áp dụng mã hóa khối tự động thích nghi cho số ứng dụng - Mã đoạn hay khối k×1 tự động thích nghi với tác động cục - Mã đoạn hay khối k×1 tự động thích nghi chiều - Mã khối k×1 tự động thích nghi chiều 7.2.6 Biến đổi Cosin chuẩn nén JPEG JPEG viết tắt Joint Photographic Expert Group (nhóm chuyên gia phát triển ảnh này) Chuẩn JPEG công nhận chuẩn ảnh quốc tế năm 1990 phục vụ ứng dụng truyền ảnh cho lĩnh vực y học, khoa học, kỹ thuật, ảnh nghệ thuật… Chuẩn JPEG sử dụng để mã hóa ảnh đa mức xám, ảnh màu Nó không cho kết ổn định với ảnh đen trắng Chuẩn JPEG cung cấp giải thuật cho hai loại nén nén không mát thông tin nén mát thông tin Trong phần đây, trình bày chi tiết dạng nén biến đổi chấp nhận mát thông tin dùng biến đổi Cosin chuẩn JPEG: Biến đổi Cosin (Sequential DTC - based) Biến đổi Cosin kỹ thuật đơn giản dùng phổ biến đáp ứng hầu hết đặc tính cần thiết cho hần lớn ứng dụng Mã hóa JPEG bao gồm nhiều công, sSơ đồ thuật toán nén giải nén mô tả đây: Sơ đồ thuật toán nén JPEG Quá trình giải nén làm ngược lại, người ta giải mã phần ảnh nén tương ứng với phương pháp nén sử dụng phần nén nhờ thông tin liên quan ghi phần header file nén Kết thu hệ số lượng tử Các hệ số khôi 100 Chương 7: Nén liệu ảnh phục giá trị tước lượng tử hóa tương tự hóa Tiếp đem biến đổi Cosin ngược ta ảnh ban đầu với độ trung thực định Sơ đồ thuật toán giải nén JPEG Bảng mã bảng lượng tử sơ đồ giải nén dựng lên nhờ thông tin ghi phần cấu trúc đầu tệp (Header) file ảnh nén Quá trình nén chịu trách nhiệm tạo ghi lại thông tin Phần phân tích tác dụng khối sơ đồ + Phần khối Chuẩn nén JPEG phân ảnh khối 8x8 Công đoạn biến đổi nhanh Cosin hai chiều cho khối 8x8 tỏ hiệu Biến đổi Cosin cho khối có kích thước giảm phần tính toán chung việc tính hệ số C ij cho tầng (8 = 23), số hệ số là: +2 + = Nếu với ảnh 1024 x 1024, phép biến đổi nhanh Cosin chiều theo hàng ngang hàng dọc ta phải qua 10 tầng (1024 = 210) Số hệ số C ij là: 512 + 256 + 128 + 64 + + + + = 1021 Thời gian tính toán hệ số C ij với toàn ảnh 1024 x 1024 lớn gấp 150 lần so với thời gian tính toán hệ số cho khối Biến đổi Cosin khối có kích thước nhỏ làm tăng độ xác tính toán với số dấu phẩy tĩnh, giảm thiểu sai số làm tròn sinh Do điểm ảnh hàng xóm có độ tương quan cao hơn, phép biến đổi Cosin cho khối nhỏ tập trung lượng số hệ số biến đổi Việc loại bớt số hệ số lượng thấp khối tạo mát thông tin cục giúp nâng cao chất lượng ảnh Ảnh chia làm B khối: Các khối xác định số (m,n) với m = [0…MB-1] n = [0…NB-1], m thứ tự khối theo chiều rộng, n thứ tự khối theo chiều dài Phân tích khối thực chất xác định tương quan tọa độ riêng khối với tọa độ thực điểm ảnh 101 Chương 7: Nén liệu ảnh ảnh ban đầu Nếu ảnh ban đầu kí hiệu Image[i,j] ma trận biểu diễn khối (m,n) x[u, v] tính: x[u,v] = Image[mk + u,nl + v] + Biến đổi Biến đổi công đoạn lớn phương pháp nén sử dụng phép biến đổi Nhiệm vụ công đoạn biến đổi tập trung lượng vào số hệ số biến đổi Công thức biến đổi cho khối là: Trong đó: Thuật toán biến đổi nhanh Cosin hai chiều cho khối trường hợp bao gồm 16 phép biến đổi nhanh Cosin chiều Đầu tiên, người ta biến đổi nhanh Cosin chiều cho dãy điểm ảnh hàng Lần lượt thực cho hàng Sau đem biến đổi nhanh Cosin chiều theo cột ma trận vừa thu sau phép biến đổi Cũng thực cho cột Ma trận cuối ma trận hệ số biến đổi khối tương ứng Trong sơ đồ giải nén ta phải dùng phép biến đổi Cosin ngược Công thức biến đổi ngược cho khối 8×8: đó: 102 Chương 7: Nén liệu ảnh + Lượng tử hóa Khối lượng tử hóa sơ đồ nén đóng vai trò quan định tỉ lệ nén chuẩn nén j Đầu vào khối lượng tử hóa ma trận hệ số biến đổi Cosin khối điểm ảnh Để giảm số lượng tử, người ta tìm cách quy hệ số khối khoảng phân bố Chuẩn nén j sử dụng lượng tử hóa Giả sử hệ số có hàm tính xác suất xuất Chúng ta chỉnh lại hệ số yj phép gán: Với µj trung bình cộng hệ số thứ j σj độ lệch hệ số thư j Như đồng mức định mức tạo lại cho tất hệ số Do đó, hệ số biểu diễn số lượng bit Có nhiều cách tiếp cận để tính mức định mức tạo lại Lloyd – Max đưa giải thuật sau: Trong trình cài đặt tạo lượng tử hóa, Lloyd Max có nhiều cải tiến để tính toán dễ dàng Xác định d1 công thức bước 2a tiến hành theo phương pháp Newton-Raphson Sau bước mô tả toàn công việc khối lượng từ hóa tác động lên hệ số biến đổi Cosin: 103 Chương 7: Nén liệu ảnh Thành phần chiều không lượng tử hóa Đến đây, ta chuyển sang bước nén + Nén liệu Đầu vào khối nén gồm hai thành phần: thành phần hệ số chiều thành phần hệ số xoay chiều Thành phần hệ số chiều Ci(0, 0) với i = 0,1,…,63 chứa phần lớn lượng tín hiệu hình ảnh Người ta không nén trực tiếp giá trị Ci(0, 0) mà xác định độ lệch Ci(0, 0): di = Ci+1(0, 0) – Ci(0, 0) di có giá trị nhở nhiều so với Ci nên biểu diễn dấu phẩy động theo chuẩn IEE754 thường chưa nhiều chuỗi bit nên cho hiệu suất nén cao Giá trị C0(0, 0) độ lệch d1, ghi tệp tạm Tệp nén phương pháp nén Huffman Thành phần hệ số xoay chiều C1(m, n) với 1≤m≤7, 1≤n≤7 chứa thông tin chi tiết ảnh Để nâng cao hiệu nén cho hệ số khối, người ta xếp chúng lại theo thứ tự ZigZag Tác dụng xếp lại theo thứ tự ZigZag tạo nhiều loại hệ số giống Chúng ta biết lượng khối hệ số giảm dần từ góc bên trái xuống góc 104 Chương 7: Nén liệu ảnh bên phải nên việc xếp lại hệ số theo thứ tự ZigZag tạo điều kiện cho hệ số xấp xỉ (cùng mức lượng tử) nằm dòng Mỗi khối ZigZag mã hóa theo phương pháp RLE Cuối khối đầu RLE, ta đặt dấu kết thúc khối EOB (End Of Block) Sau đó, khối dồn lại mã hóa lần phương pháp mã Huffman Nhờ có dấu kết thúc khối nên phân biệt hai khối cạnh giải mã Huffman Hai bảng mã Huffman cho hai thành phần hệ số tất nhiên khác Để giải nén được, phải ghi lại thông tin như: kích thước ảnh, kích thước khối, ma trận Y, độ lệch tiêu chuẩn, mức tạo lại, hai bảng mã Huffman, kích thước khối nén chiều, kích thước khối nén xoay chiều… ghi nối tiếp vào hai file nén thành phần hệ số Cài đặt giải thuật cho nén thực phức tạp Chúng ta phải nắm kiến thức nén RLE, Huffman, biến đổi Cosin, xây dựng lượng tử hóa Lloyd-Max…Nén giải nén j chậm bù lại, thời gian truyền mạng nhanh kích thước tệp nén nhỏ Với ưu điểm ISO chấp nhận chuẩn ảnh quốc tế biết đến mã số ISO 10918-1 7.3 CÁC PHƯƠNG PHÁP NÉN THẾ HỆ THỨ HAI 7.3.1 Phương pháp Kim tự tháp Laplace (Pyramide Laplace) Phương pháp tổ hợp hai phương pháp: Mã hóa thích nghi biến đổi Tỷ số nén cao, thường 10/1 Về nguyên tắc, phương pháp dựa vào mô hình phân cấp quan sát người Bắt đầu từ ảnh gốc x(m, n) qua lọc dải thấp ta thu tín hiệu x1(m, n) Bộ lọc thiết kế để tính trung bình cục dựa vào đáp ứng xung chiều gần với đường cong Gauss Bộ lọc đòng vai trò “dự đoán” với sai số e1(m, n) tính bởi: e1(m, n) = x(m, n) – x1(m, n) (7.31) Như mã hóa x1(m, n) e1(m, n) tương đương với mã hóa x(m, n) Với cách biến đổi e1(m, n) thuộc loại dải cao Vì mắt người cảm nhận tín hiệu với tần số cao nên ta dùng lượng bit để mã hóa cho Mặt khác tín hiệu x1(m, n) thuộc loại dải thấp, nên theo lý thuyết lấy mẫu số mẫu Quá trình lặp lại cách dùng lọc thấp khác ta thu tín hiệu xi(m, n), i=1,2,… Với lần lặp kích thước ảnh giảm lượng fi /fi+1 Theo cách này, ta có cấu trúc xếp chồng tự cấu trúc Kim tự tháp mà kích thước giảm dần từ gốc đến đỉnh Nhân chập Gauss dùng có kích thước 5x5 Các tín hiệu sau lượng hóa mẫu hóa Theo kết công bố [6] với lọc giải thấp chiều tách với trọng số: g(0) = 0,7, g(-1) = g(1) = 0,25 g(-2) = g(2) = 0,1 Tỉ số nén dao động từ 6/1 đến 32/1 Tuy nhiên, tỉ số nén cao ảnh kết có biến dạng 7.3.2 Phương pháp mã hóa dựa vào biểu diễn ảnh Như biết, xử lý ảnh tùy theo ứng dụng mà ta cần toàn ảnh hay đặc tính quan trọng ảnh Các phương pháp phân vùng ảnh chương sáu 105 Chương 7: Nén liệu ảnh hợp vùng, tách, tách hợp hữu ích để nén ảnh Có thể có nhiều phương pháp khác, song đề cập đến hai phương pháp: vùng gia tăng phương pháp tách hợp 7.3.2.1 Mã hóa dựa vào vùng gia tăng Kỹ thuật vùng gia tăng thực chất hợp vùng có tính chất Kết ảnh phân đoạn giống ô trò xếp chữ (Puzzle) Tuy nhiên, cần lưu ý tất đường bao thu không tạo nên ảnh giống ảnh gốc Việc xác định tính chất miền đồng xác định độ phức tạp phương pháp Để đơn giản, tiêu chuẩn chọn khoảng mức xám Như vậy, miền đồng tập hợp điểm ảnh có mức xám thuộc khoảng chọn Cũng cần lưu ý thêm rằng, ảnh gốc có đường bao kết cấu (Texture) Trong miền texture, độ xám biến đổi chậm Do vậy, không ý chia ảnh thành nhiều miền gây nên bao giả Giải pháp để khắc phục tượng ta dùng lọc thích hợp hay lọc trung vị Sau giai đoạn này, ta thu ảnh phân đoạn với đường viền kín, độ rộng pixel Để loại bỏ đường bao giả, ta dùng phương pháp gradient (xem chương năm) Sau thu đường bao đúng, người ta tiến hành mã hóa (xấp xỉ) đường bao đường cong hình học, ví dụ đoạn thẳng hay đường cong Nếu ảnh gốc có độ phân giải không thích hợp, người ta dùng khoảng 1,3 bit cho điểm biên Phương pháp thể ưu điểm: mô hình tham số Các tham số số vùng, độ xác mô tả Tuy nhiên, tham số khoảng mức xám quan trọng có ảnh hưởng đến tỉ số nén Một tham số không phần quan trọng số điểm đường bao bị coi giả Thường số điểm không vượt 20 điểm 7.3.2.2 Phương pháp tách – hợp Cũng chương sáu, phương pháp tách – hợp khắc phục số nhược điểm phương pháp phân vùng dựa vào tách vùng hay hợp vùng Trong phương pháp mã hóa này, người ta thay tiêu chuẩn chọn vùng đơn giản tiêu chuẩn khác hiệu Nguyên tắc chung phương pháp mô hình biên – texture Nhìn chung đường biên dễ nhạy cảm với mắt người, texture nhạy cảm Người ta mong muốn đường phân ranh vùng đồng với đường bao Lưu ý cần định phân vùng phần ảnh cho không vắt chéo đường bao Đây tiêu chuẩn kiểm tra quan trọng Các đường bao thường nhận lọc thông cao, đẳng hướng Để quản lý điểm thuộc vùng tốt hơn, tiêu chuẩn kiểm tra thứ hai xem xét dấu: “các điểm nằm phía đường bao có dấu” Nhìn chung, phương pháp gồm hai giai đoạn giai đoạn đầu thực việc tách vùng, giai đoạn sau thực việc hợp vùng Quá trình tách thực trước Người ta chia ảnh gốc thành vùng nhỏ kích thước 9×9 Tiếp theo, tiến hành xấp xỉ vùng ảnh đa thức có bậc nhỏ Sau trình tách ta thu số vùng ảnh hình vuông liên tiếp chúng tạo nên miền gốc lớn không thiết vuông Như vậy, trường hợp phải xấp 106 Chương 7: Nén liệu ảnh xỉ nhiều đa thức giống Rõ dàng việc mã hóa riêng biệt đa thức điều kiện hiệu người nghĩ đến hợp vùng để giảm độ dư thừa Quá trình hợp tiến hành sau: hai vùng xấp xỉ đa thức tương tự, người ta hợp chúng làm dùng đa thức xấp xỉ Nếu mức độ thay đổi thấp, ta có nhiều cặp vùng tương tự Để nhận kết không phụ thuộc vào lần hợp đầu, người ta xây dựng đồ thị “vùng kế cận” Các nút đồ thị vùng liên hệ biểu diễn mối không tương đồng Sự liên hệ với mức không tương đồng thấp hai vùng cần hợp lại Sau bước hợp này, đồ thị cập nhật lại trình hợp lặp lại tiêu chuẩn thỏa mãn Quá trình hợp dừng định chất lượng ảnh nén hay tiêu chuẩn khác Ta thấy phương pháp phức tạp song bù lại cho tỉ số nén cao 60 107 TÀI LIỆU THAM KHẢO [1] Đỗ Năng Toàn, Phạm Việt Bình (2008), Giáo trình xử lý ảnh – ĐH Thái Nguyên, Nxb Khoa học kỹ thuật, 2008 [2] Phạm Việt Bình, Cao Lê Mạnh Hà, Đỗ Năng Toàn (2005), “Một cách tiếp cận phát biên ảnh đa cấp xám”, Kỷ yếu Hội thảo Quốc gia lần thứ - Một số vấn đề chọn lọc Công nghệ Thông tin Truyền thông, Hải Phòng 25-27/08 /2005, Nxb KH&KT, Hà Nội 2006, 92-102 [3] Nguyễn Quốc Trung (2004), Xử lý tín hiệu lọc số, Nxb Kỹ thuật, 2004 [4] Lương Mạnh Bá, Nguyễn Thanh Thủy (2003), Nhập Môn Xử lý ảnh số, Nxb Khoa học Kỹ thuật, 2003 [5] Nguyễn Kim Sách (1997), Xử lý ảnh Video số, Nxb Khoa học Kỹ thuật, 1997 [6] J.R.Paker (1997), Algorithms for Image processing and Computer Vision John Wiley & Sons, Inc [7] Randy Crane (1997), A simplified approach to image processing, Prentice-Hall, Inc [8] John C.Russ (1995), The Image Procesing Handbook CRC Press, Inc [9] Adrian Low (1991), Introductory Computer Vision and Image Processing, Copyright (c) 1991 by McGrow Hill Book Company (UK) Limited [10] Anil K.Jain (1989), Fundamental of Digital Image Processing Prentice Hall, Engwood cliffs [11] T Pavlidis (1982), Algorithms for Graphics and Image Processing, Computer Science Press 108 [...]... Vector đều tập trung từ chuyển đổi từ ảnh Raster RASTER Vecter hóa VECTOR Raster hóa RASTER Hình 2.2 Sự chuyển đổi giữa các mô hình biểu diễn ảnh 2.4 CÁC ĐỊNH DẠNG ẢNH CƠ BẢN Hiện nay trên thế giới có trên 50 khuôn dạng ảnh thông dụng Sau đây là một số định dạng ảnh hay dùng trong quá trình xử lý ảnh hiện nay 2.4.1 Định dạng ảnh IMG Ảnh IMG là ảnh đen trắng, phần đầu của ảnh IMG có 16 byte chứa các thông... DIỄN ẢNH Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng trong các thiết bị kỹ thuật khác nhau Quá trình lưu trữ ảnh nhằm 2 mục đích: • Tiết kiệm bộ nhớ • Giảm thời gian xử lý Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng kích thước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng... Rylander Để tạo ảnh, mỗi phần tử của ảnh gốc sẽ được so sánh với phần tử tương ứng của ma trận Dither Nếu lớn hơn, phần tử ở đầu ra sẽ sáng và ngược lại 2.6 KHÁI NIỆM ẢNH ĐEN TRẮNG, ẢNH MÀU Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị cường độ sáng Để có thể xử lý ảnh bằng máy tính người ta cần thiết phải số hóa ảnh Trong quá trình số hóa, ta 19 Chương 2: Thu nhận ảnh biến đổi tín... THU NHẬN ẢNH 2.1 CÁC THIẾT BỊ THU NHẬN ẢNH Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông dụng Raster, Vector và có thể cho ảnh đen trắng hoặc ảnh màu Các thiết bị thu nhận ảnh Raster thông thường là camera, scanner Còn các thiết bị thu nhận ảnh Vector thông thường là sensor hoặc bàn số hoá digitalizer hoặc được chuyển đổi từ ảnh Raster Nhìn chung các hệ thống thu nhận ảnh thực... ứng với hai mức sáng đen và trắng (còn gọi là ảnh nhị phân) • Ảnh xám (ảnh đa mức xám): Các phần tử ảnh chứa thông số về cường độ sáng đã được mã hoá thành N mức (8, 256 hoặc nhiều hơn) tương ứng với 3 bít, 8 bít hoặc hơn nữa, ảnh xám có một đặc trưng là lược đồ xám (histogram) Ảnh xám được gọi là ảnh grayscale • Ảnh mầu: Mỗi phần tử ảnh được lưu trữ trong ảnh dưới dạng một cấu trúc có 3 trường chứa... 2: Thu nhận ảnh If H > 240 and H = θ? Max: Min; ∀ (i,j) *Ứng dụng: Nếu Min = 0, Max = 1 kỹ thuật chuyển ảnh thành ảnh đen trắng được ứng dụng khi quét và nhận dạng văn bản có thể xảy ra sai sót nền thành ảnh hoặc ảnh thành nền dẫn đến ảnh bị đứt nét hoặc dính 29 Chương 3: Xử lý nâng cao chất lượng ảnh 3.1.4 Bó cụm Kỹ thuật nhằm giảm bớt số mức xám của ảnh bằng cách nhóm lại số mức xám gần nhau thành 1 nhóm Nếu chỉ có 2 nhóm thì... là giá trị cường độ sáng của ảnh tại pixel đó Ảnh có thể được biểu diễn với các độ phân giải khác nhau Một pixel có thể được lưu trữ trên 1, 4, 8 hay 24 bit tùy thuộc vào các mức cường độ sáng cần phân biệt của ảnh và số lượng thành phần mầu cơ bản chứa trong ảnh đó 2.6.1 Phân loại ảnh số Người ta thường chia ảnh số ra làm ba loại chính là: • Ảnh đen trắng: Mỗi phần tử ảnh nhận một trong hai giá trị... dạng do ảnh IMG là ảnh đen trắng, do vậy chỉ cần 1 bít cho 1 pixel thay vì 4 hoặc 8 như đã nói ở trên Toàn bộ ảnh chỉ có những điểm sáng và tối tương ứng với giá trị 1 hoặc 0 Tỷ lệ nén của kiểu định dạng này là khá cao 2.4.2 Định dạng ảnh PCX Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển Nó sử dụng phương pháp mã hoá loạt dài RLE (Run – Length – Encoded) để nén dữ liệu ảnh Quá trình nén... bmiColors[1]; } BITMAPINFO, *PBITMAPINFO; 2.5 KỸ THUẬT TÁI NHẬN ẢNH 2.5.1 Kỹ thuật chụp ảnh Phương pháp sao chụp ảnh là phương pháp đơn giản, giá thành thấp, chất lượng cao Sau bước chụp là kỹ thuật phòng tối nhằm tăng cường ảnh như mong muốn Ví dụ kỹ thuật 17 Chương 2: Thu nhận ảnh phòng tối như: phóng đại ảnh, thu nhỏ ảnh , tùy theo ứng dụng Kỹ thuật chụp ảnh màn hình màu khá đơn giản Nó bao gồm các bước sau:

Giáo trình môn Xử lý ảnh

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan