Nén ảnh động dùng wavelet

LUN VN Nộn nh ng dựng Wavelet Bộ giáo dục đào tạo TRờNG ĐạI Học BáCH KHOA Hà Nội Luận văn thạc sĩ khoa học nén ảnh động dùng wavelet Ngành: Điện tử viễn thông Nguyễn Hữu phát Ngời hớng dẫn khoa học: PGS TS Hồ Anh Tuý Hà nội 2005 Mục lục Trang Lời nói đầu Chơng TổNG QUAN Về NéN ảNH Video THEO CHUẩN MPEG 1.1 Khái niệm Video phơng pháp nén Video 1.1.1 Khái niệm Video 1.1.1.1 Không gian mầu (Color Space) 1.1.1.2 Các cấu số hoá tín hiệu Video 1.1.2 Các phơng pháp nén Video 1.1.2.1 Giảm tốc độ dòng bit 1.1.2.2 Nén dòng tín hiệu Video số theo không gian 10 1.1.2.3 Nén dòng tín hiệu theo thời gian 11 1.1.2.4 Nén hỗn hợp sử dụng tổ hợp phơng pháp 11 1.1.3 Tham số nén Video 11 1.2 Giới thiệu chung chuẩn MPEG 12 1.3 Các khái niệm nén Video theo chuẩn MPEG 14 1.3.1 Cấu trúc phân cấp Video theo chuẩn MPEG 14 1.3.2 Phân loại frame Video 17 1.3.3 Nhóm ảnh (GOP: Group Of Picture) 19 1.4 Phơng pháp nén ảnh Video theo chuẩn MPEG 21 1.4.1 Mô hình tổng quát mã hoá Video theo chuẩn MPEG 21 1.4.2 Lấy mẫu thông tin màu 22 1.4.3 Lợng tử hoá 23 1.4.4 Nội suy ảnh 23 1.4.5 Dự đoán bù chuyển động 24 1.4.5.1 Đánh giá chuyển động (motion estimation) 24 1.4.5.2 Bù chuyển động (Motion Compensation) 24 1.4.6 Biến đổi Cosine rời rạc 26 1.4.7 Mã VLC 27 1.5 Quá trình nén Video theo chuẩn MPEG-1 27 1.5.1 Tham số đặc trng 27 1.5.2 Quá trình mã hoá 28 1.5.3.Quá trình giải mã 32 1.6 Quá trình nén Video theo chuẩn MPEG-2 33 1.6.1 Tham số đặc trng 36 1.6.2 Mô hình mã hoá Non-scalable theo MPEG-2 37 1.6.3 Mô hình mã hoá scalable theo MPEG-2 38 Chơng M hoá SCALABLE VIDEO 42 2.1 Băng lọc 1/2 pixel biến đổi ngợc theo thời gian - tính toán bù chuyển động 42 2.1.1 Giới thiệu 44 2.1.2 Thuật toán 46 2.1.2.1 Mô hình Video phổ biến 46 2.1.2.2 Quét luỹ tiến Video với véctơ chuyển động xác 1/2 điểm ảnh 49 2.1.2.3 Di chuyển cục mở rộng 51 2.1.3 Ba tham số mã hoá băng sử dụng IMCTF 54 2.1.4 Kết thực nghiệm 55 2.1.5 Tóm tắt kết luận 59 2.2 Mã hoá scalable video 61 2.2.1 Khái quát 62 2.2.1.1 Mã hoá lai truyền thống 63 2.2.1.1.1.Mã hoá Scalable SNR 63 2.2.1.1.2 Phân giải mã Scalable 66 2.2.1.2 Embedded Coding and Fine Granularity Scalability 66 2.2.1.3 Mã hoá sử dụng băng chiều mã hoá Wavelet 69 2.2.2 Hệ thống tổng quan 70 2.2.3 Băng mã hoá chiều 71 2.2.4 Tỷ lệ dòng bít mã hoá 74 2.2.4.1.Hệ thống dòng bít 74 2.2.4.2 Lựa chọn dòng bít mã hoá truyền dẫn 78 2.2.5 Kết thực nghiệm 81 2.2.5.1 So sánh với mã hoá Nonscalable 81 2.2.5.2 So sánh mã hoá LZC 3D-SPIHT 83 2.2.5.3 Mã hoá tốc độ đa phân giải 86 2.2.6 Tóm tắt kết luận 91 Chơng Đối tợng-cơ sở m hoá SCALABLE 95 3.1 Đối tợng - Cơ sở mã hoá 97 3.1.1 Mặt phẳng đối tợng Video 97 3.1.2 Công cụ mã hoá cho đối tợng Video 98 3.1.2.1 Định dạng mã hoá 98 3.1.2.2 Cấu trúc mã hoá 99 3.2 Đối tợng-Cơ sở mã hoá sử dụng EZBC 100 3.2.1 Tổng quan 101 3.2.2 Miền Cơ sở biến đổi Wavelet rời rạc 102 3.2.3 Đối tợng-Cơ sở mã hoá mặt phẳng bít EZBC 103 3.3 Kết thực nghiệm 104 3.4 Tóm tắt kết luận 106 Chơng 4: Chơng trình thử nghiệm đánh giá kết 111 4.1 Xây dựng chơng trình 111 4.1.1 Khái quát chung 111 4.1.2 Cấu trúc chơng trình 111 4.2 Đánh giá kết thử nghiệm 112 4.2.1 Dữ liệu thử nghiệm 112 4.2.2 Kết thử nghiệm 112 4.2.3 Nhận xét tỷ số nén,chất lợng nén 115 Kết luận 118 ứng dụng luận văn 118 Hớng phát triển cho tơng lai 119 TàI LIệU THAM KHảO 120 PHụ LụC 122 THUậT NGữ tiếng anh 122 Lời nói đầu Trong năm gần phát triển mạnh mẽ Internet nên vấn đề truyền liệu mạng đặc biệt truyền ảnh âm đợc quan tâm Do việc nén liệu đặc biệt liệu phim ảnh cần thiết hết Trong phạm vi luận văn tập trung vào việc nén liệu video Đối với nén ảnh động, chuẩn MPEG(Moving Photographic Experts Group) đợc xác lập ISO IEC Đây kỹ thuật nén ảnh động mang lại nhiều thành công Nó đạt tỷ lệ nén cao 10:1 mà mắt thờng khó phân biệt đợc Tuy nhiên cha phải tỷ lệ cao tối u Sự đời Wavelet mở công nghệ Đó chuẩn MJPEG2000 Sự đời MJPEG2000 mở tơng lai cho kỹ thuật nén ảnh với tính cao Kỹ thuật Wavelet đợc nghiên cứu nhiều phần mềm nh Matlap Mục đích luận văn nhằm nghiên cứu số phơng pháp nén ảnh động đợc quan tâm Luận văn đợc trình bày thành bốn chơng phụ lục Chơng Một tổng quan nén ảnh động Chơng giới thiệu số chuẩn nén ảnh động MPEG1,MPEG2,MPEG4 MPEG7 Đồng thời trình bày cấu trúc video Chơng Hai trình bày phơng pháp nén Scalable video Chơng đề cập đến thuật toán LZC 3D-SPIHT Chơng Ba sâu vào nghiên cứu đối tợng mã hoá video dựa biến đổi Wavelet Chơng Bốn nêu khái quát cách thiết kế cài đặt chơng trình Chơng mang tính chất minh hoạ cho đợc trình bày chơng trớc Phần phụ lục nêu số chơng trình nguồn thông dụng viết Visual C + + Do thời gian có hạn nên nghiên cứu đợc phần kỹ thuật nén ảnh động chắn không tránh khỏi thiếu sót Cuối xin chân thành cảm ơn giúp đỡ nhiệt tình hiệu PGS TS Hồ Anh Tuý giúp đỡ hoàn thành luận văn Hà nội ngày 20/10/2005 Đồ án cao học ĐTVT 2003 Chơng TổNG QUAN Về NéN ảNH Video THEO CHUẩN MPEG 1.1 Khái niệm Video phơng pháp nén Video 1.1.1 Khái niệm Video Video biểu diễn điện tử chuỗi ảnh liên tiếp Những ảnh ảnh tĩnh đợc gọi frame Chuỗi frame xuất với tốc độ nhanh cho ta cảm giác chuyển động liên tục (tối thiểu 25frame/giây) Mặc dù frame có khác nhau, cần thiết phải có tốc độ frame cao để đạt đợc cảm giác chuyển động thực Tốc độ frame độ phân giải frame nhân tố quan trọng ảnh hởng trực tiếp đến chất lợng Video Trong truyền hình, độ phân giải truyền hình 720x576 tốc độ frame 25 30 Hz 1.1.1.1 Không gian mầu (Color Space) Dựa theo lý thuyết ảnh màu, cảm thụ màu mắt sở màu bản: màu đỏ (Red), màu lục (Green) màu lam (Blue) Trong hệ màu RGB, màu đợc mô tả điểm bên hình lập phơng đơn vị, với gốc toạ độ (0, 0, 0) màu đen; thành phần R (đỏ), G (lục), B (lam) biểu diễn cho trục Một hệ thống biểu diễn màu khác đợc sử dụng lĩnh vực truyền hình nhằm giúp việc số hóa đợc thuận lợi hệ màu YUV, miêu tả ảnh Video gồm thành phần độ chói (Y) sắc màu (UV) Hệ màu nhằm đạt đợc hiệu suất truyền cao hơn, giữ nguyên tính tơng thích với hệ số truyền hình màu đen trắng Thành phần chói (luminance) cung cấp giá trị mức xám ảnh, hai thành phần lại mang thông tin màu sắc (chrominance) để chuyển đổi từ ảnh xám sang ảnh màu Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Chuyển đổi RGB sang YUV đợc thực theo chuẩn CCIR 601 nh sau: Y = 0.299R + 0.587G + 0.114B U = 0.493 (B - Y) V = 0.877 (R - Y) đó: Y thành phần chói U, V hai thành phần màu Đặc biệt: R = G = B Y = R = G = B U = V = Một định dạng màu khác là, tơng tự YUV Y, CB, CR với Y tơng tự nh hai thành phần nh sau: CB = U/2 + 0.5 CR = V/1.6 + 0.5 Do đó, màu CB, CR nằm khoảng [0, 1] Với u điểm hệ YCBCR đợc áp dụng rộng rãi việc số hoá Video 1.1.1.2 Các cấu số hoá tín hiệu Video Hình 1.1 Cấu trúc lấy mẫu Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Trong truyền hình, frame chuỗi Video có độ phân giải 720 x 576 điểm có tốc độ frame 25 30Hz Mỗi ảnh chuỗi Video đợc lấy số hoá nh hình 1.1 Cấu trúc 4: 2: Giả sử dòng ngang TV gồm 720 điểm ảnh Hình 1.2 Cấu trúc lấy mẫu 4: 2: Việc lấy mẫu diễn nh sau: - Điểm đầu lấy mẫu tín hiệu chói (Y) lấy mẫu màu (CB, CR) - Điểm lấy mẫu tín hiệu chói (Y) không lấy mẫu tín hiệu Khi giải mã, màu suy từ điểm ảnh trớc Tuần tự nh vậy, lần lấy mẫu Y, có lần lấy mẫu CR, lần lấy mẫu CB Cấu trúc 4: 1: Hình 1.3 Cấu trúc lấy mẫu 4: 1: Điểm ảnh lấy mẫu đủ Y, CR, CB, điểm lấy mẫu Y, không lấy mẫu tín hiệu màu Khi giải mã, mầu điểm ảnh phải suy từ điểm ảnh đầu Tuần tự nh vậy, lần lấy mẫu Y, có lần lấy mẫu CR, lần lấy mẫu CB Cấu trúc lấy mẫu 4: 2: Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Lấy mẫu tín hiệu Y tất điểm ảnh dòng, tín hiệu màu Y, có màu CR CB cách theo hàng Hình 1.4 Cấu trúc lấy mẫu 4: 2: Cấu trúc lấy mẫu 4: 4: Lấy mẫu tín hiệu Y, CR, CB tất điểm ảnh dòng Hình 1.5 Cấu trúc lấy mẫu 4: 4: 1.1.2 Các phơng pháp nén Video Mục tiêu việc nén tín hiệu Video biểu diễn nguồn tín hiệu Video số bit đợc mà đảm bảo yêu cầu chất lợng cảm thụ Với tín hiệu Video, giới hạn dải thông tín hiệu tơng tự khoảng 6MHz, tín hiệu Video số hoá theo tiểu chuẩn CCIR 601 với tốc độ bit 270Mbit/s chiếm dải thông không dới 189MHz, tức lớn 31,5 lần so với dải thông tín hiệu tơng tự Chính vậy, giảm dải thông vấn đề quan trọng với công nghệ Video số Về giảm dải thông đợc thực cách: - Giảm tốc độ dòng bit (bit Rate Reduction - BRR) Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 - Nén dòng tín hiệu Video số theo không gian, tức giảm độ d thừa số frame (spatial redundancy) - Nén dòng tín hiệu theo thời gian, tức giảm độ d thừa theo thời gian (temporal redundancy) - Nén hỗn hợp sử dụng tổ hợp phơng pháp 1.1.2.1 Giảm tốc độ dòng bit Có hai phơng pháp giảm tốc độ dòng bit Cách thứ dựa đặc điểm sinh lý mắt ngời Mắt ngời không nhạy cảm với tín hiệu màu nên phơng pháp này, ngời ta giảm bớt độ phân giải tín hiệu màu Cách thứ hai dựa ý nghĩa bit lợng tử hoá điểm ảnh Với bit lợng tử hoá, bit byte đợc chia làm hai nhóm: nhóm có ý nghĩa (MMB-More Meaning Bit) nhóm ý nghĩa (LMB-Less Meaning Bit) Việc ta cắt giảm bit nhóm LMB không ảnh hởng nhiều tới chất lợng ảnh Tuy nhiên, phơng pháp không đợc chấp nhận giải pháp giảm dải thông tại, nên không đợc đề cập đến Phần lớn định dạng số thành phần sử dụng tần số lấy mẫu 13.5MHz tín hiệu chói Theo chuẩn CCIR 601, tín hiệu màu đợc lấy màu đợc lấy mẫu với tần số nh tín hiệu chói, có định dạng 4: 4: 4.Định dạng đợc sử dụng thiết bị dựng phim phi tuyến đồ hoạ vi tính liên quan đến phim nhựa Tốc độ bit định dạng cho hệ PAL là: Với lợng tử hoá bit: (720 + 720 +720) x 576 x x 25 = 249 Mbit/s Với lợng tử hóa 10 bit: (720 + 720 +720) x 576 x 10 x 25 = 311 Mbit/s Trong đó: 720 x 576 độ phân giải hình (576 số dòng /frame) 25 tốc độ chuyển ảnh (25 frames/s) Nguyễn Hữu Phát Đồ án cao học ĐTVT 2003 Hiện nay, thiết bị sử dụng kỹ thuật số thị trờng thiết bị Video chuyên dụng thờng sử dụng chuẩn CCIR 601 4: 2: Theo định dạng số hoá này, tín hiệu Video thành phần đợc lấy mẫu với tần số 13.5 MHz tín hiệu chói, 6,75 MHz hai tín hiệu màu Tốc độ dòng liệu định dạng đợc tính nh sau: Khi lấy mẫu bit: (720 +360 +360) x 576 x x 25 = 166 Mbit/s 10 bit: (720 +360 +360) x 576 x 10 x 25 = 207 Mbit/s Nh vậy, so với phơng pháp lẫy mẫu không cắt giảm (4: 4: 4), phơng pháp cho phép cắt giảm đợc 33% tốc độ dòng bit Với định dạng 4: 1: 4: 2: 0, tốc độ dòng bit đợc cắt giảm nhiều Với bit lấy mẫu, tốc độ dòng bit tính cho PAL là: (720 +180 +180) x 576 x x 25 = 124.4 Mbit/s tức giảm đợc 50% so với nguyên mẫu 4: 4: 1.1.2.2 Nén dòng tín hiệu Video số theo không gian Gần nh tất ảnh chứa số lợng lớn giá trị liệu thông tin giống Trong hệ thống không giảm liệu, liệu giống đợc lặp lại để tạo lại vùng ảnh (ví dụ, bầu trời xanh), có thông tin d thừa dòng liệu Để giảm độ d thừa frame, ta sử dụng phơng pháp nén ảnh Các phơng pháp nén ảnh chia làm loại: Nén không tổn hao (lossless compression): phơng pháp nén mà tín hiệu gốc đối chiếu với tín hiệu đợc nén (mã hoá), sau giải nén (giải mã) phân biệt Nén có tổn hao (lossy compression): phơng pháp nén mà tín hiệu gốc có khác biệt với tín hiệu đợc khôi phục sau nén giải nén Chất lợng hình ảnh thiết bị dùng phơng pháp nén không tổn hao tốt, so sánh đợc với chất lợng ảnh không nén Tuy nhiên, tỉ số nén phơng pháp thấp Chính vậy, u điểm việc Nguyễn Hữu Phát 10 Đồ án cao học ĐTVT 2003 nén tín hiệu không đợc phát huy cách tối đa, giá thành thiết bị cao Để nâng tỉ số nén, phát huy tối đa u điểm việc nén tín hiệu, phơng pháp nén có tổn hao đợc sử dụng hầu hết thiết bị Có hai định dạng nén đợc áp dụng rộng rãi thiết bị truyền hình, nén Video JPEG MPEG, phiên 1.1.2.3 Nén dòng tín hiệu theo thời gian Các frame Video có quan hệ mật thiết với nhau, chí frame thay đổi chút so với frame trớc sau Để giảm bớt thông tin truyền tải, ngời ta truyền phần thông tin sai lệch kết hợp với thông tin cũ Có nhiều phơng pháp khác để xác định thay đổi frame, phơng pháp xác định véctơ chuyển động Ngoài nhiều phơng pháp khác, giải thuật có chất lợng cao, nhng mức độ tính toán phức tạp giai đoạn nghiên cứu 1.1.2.4 Nén hỗn hợp sử dụng tổ hợp phơng pháp Để đạt đợc hiệu nén cao mà đảm bảo chất lợng hình ảnh, ngời ta sử dụng tổ hợp phơng pháp Phơng pháp nén Video theo chuẩn MPEG phơng pháp nén tổ hợp phơng pháp 1.1.3 Tham số nén Video Tham số nén Video đợc đề cập đến định dạng ảnh tỉ số nén, tỉ số nén cho phép đánh giá hiệu hệ thống nén Khi so sánh tỉ số nén hệ thống nén khác nhau, định dạng ảnh hệ thống nén phải giống Định dạng bao gồm: Số dòng/ảnh số pixel/dòng Nguyễn Hữu Phát 11 Đồ án cao học ĐTVT 2003 Số frame/s Và cấu trúc lấy mẫu bao gồm: 4: 4: 4, 4: 2: 2, 4: 2: 0, 4: 1: 1, độ phân giải mẫu 8/10 bit (hoặc 12 bit) Tốc độ bit ảnh gốc (trớc nén) rút từ công thức: Tỉ số nén = Tốc độ liệu ảnh gốc Tốc độ liệu ảnh nén Ví dụ: với tốc độ bit liệu ảnh gốc 166 Mbit/s áp dụng vào máy ghi hình đĩa PDR-100 (Tektronix), giả sử chất lợng nén tơng đơng 24Mbit/s, tỉ số nén 166/24 = 6.92 1.2 Giới thiệu chung chuẩn MPEG Chuẩn MPEG (Moving Picture Expert Group) đợc xây dựng phát triển tổ chức ISO IEC (International Electrotechnical Commission) với mục đích mã hoá tín hiệu hình ảnh âm cho DSM (Digital Storage Media), DSS (Digital Satellite System), HDTV (High Definition Television), VideoConferencing, Internet Video, ứng dụng Video số Chuẩn MPEG ngày đợc sử dụng rộng rãi nhiều ứng dụng lu trữ, truyền thông đa phơng tiện, đợc biết đến với chuẩn MPEG-1, MPEG-2, MPEG-4, MPEG-7 MPEG-1 (~1992): mã ISO/IEC 11172, chuẩn MPEG nhằm mục đích nén Video có kích thớc khuôn hình 320x240 cho dòng liệu có tốc độ từ đến 1.5 Mb/s ứng dụng DSM (nh công nghệ ghi VCD), vô tuyến truyền hình MPEG-2 (~1995): mã ISO/IEC 13818, chuẩn dành cho giải pháp cao dùng studio số, DVD, truyền hình số HDTV Khác với MPEG-1 tín hiệu Video quét liên tục (progressive), MPEG-2 áp dụng cho quét liên tục quét xen kẽ (interlace) Tốc độ dòng liệu lên tới 15 Mb/s Nguyễn Hữu Phát 12 Đồ án cao học ĐTVT 2003 MPEG-4 (~1998): mã ISO/IEC 14496, chuẩn chủ yếu dành cho ứng dụng đa phơng tiện tơng tác, phân loại khung cảnh đa phơng tiện thành đối tợng nội dung media, tập trung vào dồn kênh, đồng liệu với đối tợng media để truyền qua mạng MPEG-4 sử dụng tốc độ bit (Video) thấp: 5ữ64 Kb/s Vai trò nén đợc đề cập phiên MPEG-7 (~2001): MPEG-7 chuẩn mô tả thông tin nhiều loại phơng tiện Mô tả cho khả tìm kiếm nhanh hiệu theo yêu cầu ngời dùng Tuy nhiên, chuẩn MPEG-7 đợc mô tả phần nội dung giống nh MPEG-4, đợc gọi thức Giao thức mô tả nội dung đa phơng tiện (Multimedia Content Description Interface) MPEG-7 đặc trng cho tập tiêu chuẩn biểu diễn nhiều loại thông tin multimedia khác MPEG-7 chuẩn nén Sơ đồ giới thiệu chuẩn nén công nghệ nén xem hình 1.6: Hình 1.6 Các chuẩn, công nghệ nén, truyền thông đa phơng tiện Nguyễn Hữu Phát 13 Đồ án cao học ĐTVT 2003 1.3 Các khái niệm nén Video theo chuẩn MPEG 1.3.1 Cấu trúc phân cấp Video theo chuẩn MPEG Cấu trúc dòng bit Video đợc chia thành phân cấp lớp (layer) để hỗ trợ quản lý lỗi, truy cập ngẫu nhiên, dựng hình (editting) đồng với dòng bit audio Block: Là khối kích thớc 8x8 điểm ảnh tín hiệu chói màu đợc dùng để biến đổi DCT Macroblock: Một Macroblock nhóm khối DCT (theo nội dung thông tin) ảnh gốc Header Marcroblock chứa thông tin khối độ chói độ màu, thông tin bù chuyển động Có ba loại Macroblock (phân loại theo phơng pháp mã hoá Macroblock): u Skipped MB: sử dụng dự đoán từ frame giải mã trớc với véctơ chuyển động Không có thông tin Macroblock đợc giải mã nh đợc truyền đến nơi nhận u Inter MB: sử dụng dự đoán bù chuyển động từ frame trớc Do đó, cần truyền kiểu MB, địa MB, vectơ chuyển động, hệ số DCT kích thớc bớc lợng tử u Intra MB: không dùng dự đoán từ frame trớc Nên cần truyền kiểu MB, địa MB, hệ số DCT kích thớc bớc lợng tử đến nơi nhận Slice: Slice cung cấp khả phòng ngừa sai lệch liệu Khi gặp lỗi dòng bit ảnh, giải mã khôi phục cách đợi Slice mà huỷ bỏ toàn ảnh Slice chứa header nhiều Macroblock liên tiếp Kích thớc Slice cực đại toàn cảnh, kích thớc cực tiểu Macroblock Header Slice chứa thông tin vị trí ảnh hệ số thang độ lợng tử hoá Nguyễn Hữu Phát 14 Đồ án cao học ĐTVT 2003 Picture (frame): Một ảnh tơng ứng với frame Video Có ba kiểu ảnh là: ảnh I, P B Các ảnh không độc lập nhau, nên thứ tự dòng bit (tức thứ tự cảnh đợc truyền, lu trữ khôi phục) không theo thứ tự hiển thị, mà thứ tự cho phép giải mã giải mã dòng bit Lớp ảnh bao gồm phần header nhiều Slice Header thị xếp để truyền frame, cho phép giải mã hiển thị frame theo bậc, kiểu ảnh thông tin mã hoá GOP (Group Of Picture): Một nhóm ảnh điểm truy nhập ngẫu nhiên (random access point), đơn vị mã hoá nhỏ mà đợc giải mã độc lập, bao gồm phần header ảnh Header chứa thông tin thời gian dựng hình (editting) Một nhóm ảnh GOP hình thành từ liên kết nhiều frame I, frame P, và/hoặc frame B Cấu trúc GOP đợc biểu diễn thông qua hai tham số: n (số frame GOP) m (khoảng cách dự đoán), thông thờng n=15, m = Mỗi GOP bắt đầu frame I Thứ tự ảnh dòng mã thứ tự mà qua trình giải mã đa chúng trở lại bình thờng Đặc biệt, ảnh B dòng giải mã đợc đa hình; ảnh mã cuối nhóm ảnh (trong thứ tự trình diễn) ảnh I P Chuỗi Video (Video sequence): Là lớp cao phân cấp mã hoá Chuỗi chứa header, nhiều GOP mã kết thúc chuỗi Thông tin quan trọng chứa header kích thớc theo chiều ngang đứng ảnh, tỉ lệ pixel, tốc độ bit ảnh chuỗi, tốc độ ảnh kích thớc tối thiểu nhớ cho giải mã, để khởi gán trạng thái giải mã Chuỗi Video thông tin header tạo thành dòng bit mã hoá, đợc gọi dòng sơ cấp Video ES (elementary stream) Nguyễn Hữu Phát 15 Đồ án cao học ĐTVT 2003 Hình 1.7 Các lớp video theo chuẩn MPEG Hình 1.8 Cấu trúc dòng liệu MPEG Nguyễn Hữu Phát 16 Đồ án cao học ĐTVT 2003 1.3.2 Phân loại frame Video Căn vào đặc tính Video có d thừa không gian d thừa thời gian để đa hai phơng pháp nén giảm độ d thừa không gian (mã hoá intraframe) nén giảm độ d thừa thời gian tơng ứng (mã hoá intrerframe), chia frame Video thành loại là: frame I, frame P, frame B Frame I (Intra Coded Picture): Frame I frame nhóm ảnh chuỗi Video, frame đợc mã hoá tơng tự nh mã hoá ảnh tĩnh theo chuẩn JPEG Các frame I đợc mã hoá độc lập, không cần tham chiếu đến frame khác chuỗi Video Mã hoá frame I làm giảm độ d thừa không gian cho tỉ lệ nén vừa phải Frame I dùng làm điểm truy cập ngẫu nhiên chuỗi cho giải mã, dùng nh nh frame tham chiếu (reference frame) để dự đoán frame khác Frame P (Predictive Code Picture): Qua frame I, mã hoá dự đoán thuận (forward predection) frame Frame đợc dự đoán gọi frame P (predicted frame), frame P đợc dự đoán từ frame trớc Nh vậy, frame P đợc dự đoán từ frame I P trớc Việc mã hoá ảnh P có sử dụng bù chuyển động Thông tin ớc lợng chuyển động khối nằm véctơ chuyển động véctơ xác định Macroblock (MB) đợc sử dụng từ ảnh gốc Frame P cho hệ số nén cao hơn, sử dụng làm frame so sánh, tham chiếu cho việc bù chuyển động cho frame P B khác Nguyễn Hữu Phát 17 Đồ án cao học ĐTVT 2003 Hình 1.9 Nội suy bù chuyển động Frame B (Bidirectionally Predicted 0icture): Bộ mã hoá sử dụng đồng thời dự đoán thuận ngợc Những frame gọi frame dự đoán nội suy chiều (Bi-directional Interpolated Prediction), hay frame B Không nh frame I (đợc dự đoán độc lập) frame P (đợc dự đoán dựa vào frame I P trớc đó), frame B đợc dự đoán chiều dựa vào cặp frame I P, P P, P I (với frame I nhóm ảnh tiếp theo) Việc sử dụng thông tin lấy từ ảnh tơng lai hoàn toàn thực đợc thời điểm mã hoá mã hoá sẵn sàng truy cập tới ảnh phía sau Frame B cho tỉ lệ nén cao nhất, không đợc dùng làm frame tham chiếu Theo phơng pháp nén này, frame I gọi frame intra (sử dụng kỹ thuật mã hoá intraframe), frame P B gọi frame Inter (sử dụng kỹ thuật mã hoá interframe) Nguyễn Hữu Phát 18 [...]... pháp nén ảnh có thể chia làm 2 loại: Nén không tổn hao (lossless compression): là phơng pháp nén mà tín hiệu gốc đối chiếu với tín hiệu đợc nén (mã hoá), sau đó giải nén (giải mã) thì không có sự phân biệt Nén có tổn hao (lossy compression): là phơng pháp nén mà tín hiệu gốc có sự khác biệt với tín hiệu đợc khôi phục sau khi nén và giải nén Chất lợng hình ảnh của các thiết bị dùng phơng pháp nén. .. một phơng pháp nén tổ hợp của các phơng pháp trên 1.1.3 Tham số nén Video Tham số nén Video đợc đề cập đến ở đây là định dạng ảnh và tỉ số nén, tỉ số nén cho phép đánh giá hiệu quả của hệ thống nén Khi so sánh tỉ số nén của các hệ thống nén khác nhau, thì định dạng ảnh của các hệ thống nén trên phải giống nhau Định dạng bao gồm: Số dòng /ảnh và số pixel/dòng Nguyễn Hữu Phát 11 Đồ án cao học ĐTVT 2003... 1: 1, độ phân giải của mẫu là 8/10 bit (hoặc 12 bit) Tốc độ bit của ảnh gốc (trớc khi nén) có thể rút ra từ công thức: Tỉ số nén = Tốc độ dữ liệu ảnh gốc Tốc độ dữ liệu ảnh nén Ví dụ: với tốc độ bit dữ liệu ảnh gốc 166 Mbit/s ở trên áp dụng vào máy ghi hình đĩa PDR-100 (Tektronix), và giả sử chất lợng nén tơng đơng 24Mbit/s, thì tỉ số nén là 166/24 = 6.92 1.2 Giới thiệu chung về chuẩn MPEG Chuẩn MPEG... chất lợng ảnh không nén Tuy nhiên, tỉ số nén của phơng pháp này rất thấp Chính vì vậy, các u điểm của việc Nguyễn Hữu Phát 10 Đồ án cao học ĐTVT 2003 nén tín hiệu không đợc phát huy một cách tối đa, giá thành thiết bị vẫn còn rất cao Để nâng tỉ số nén, phát huy tối đa u điểm của việc nén tín hiệu, phơng pháp nén có tổn hao đợc sử dụng trong hầu hết các thiết bị hiện nay Có hai định dạng nén đợc áp... đó Việc mã hoá ảnh P có sử dụng bù chuyển động Thông tin ớc lợng chuyển động của các khối nằm trong véctơ chuyển động véctơ này xác định một Macroblock (MB) nào đó đợc sử dụng từ ảnh gốc Frame P cho hệ số nén cao hơn, và có thể sử dụng làm một frame so sánh, tham chiếu cho việc bù chuyển động cho các frame P và B khác Nguyễn Hữu Phát 17 Đồ án cao học ĐTVT 2003 Hình 1.9 Nội suy bù chuyển động Frame B... toàn bộ ảnh Slice chứa header và một hoặc nhiều Macroblock liên tiếp Kích thớc Slice cực đại có thể là toàn cảnh, kích thớc cực tiểu có thể là một Macroblock Header của Slice chứa thông tin về vị trí của nó trong ảnh và hệ số thang độ của bộ lợng tử hoá Nguyễn Hữu Phát 14 Đồ án cao học ĐTVT 2003 Picture (frame): Một ảnh tơng ứng với một frame của Video Có ba kiểu ảnh chính là: ảnh I, P và B Các ảnh này... thờng Đặc biệt, ảnh B trong dòng giải mã đợc đa ngay ra màn hình; ảnh mã cuối cùng của nhóm ảnh (trong thứ tự trình diễn) là ảnh I hoặc P Chuỗi Video (Video sequence): Là lớp cao nhất của phân cấp mã hoá Chuỗi chứa một header, một hoặc nhiều GOP và một mã kết thúc chuỗi Thông tin quan trọng nhất chứa trong header là kích thớc theo chiều ngang và đứng của mỗi ảnh, tỉ lệ pixel, tốc độ bit của ảnh trong chuỗi,... định véctơ chuyển động Ngoài ra còn nhiều phơng pháp khác, những giải thuật này có chất lợng cao, nhng mức độ tính toán phức tạp và còn đang trong giai đoạn nghiên cứu 1.1.2.4 Nén hỗn hợp sử dụng tổ hợp các phơng pháp trên Để đạt đợc hiệu quả nén cao mà vẫn đảm bảo chất lợng hình ảnh, ngời ta sử dụng tổ hợp các phơng pháp trên Phơng pháp nén Video theo chuẩn MPEG là một phơng pháp nén tổ hợp của các... dựa vào cặp frame I và P, hoặc P và P, hoặc P và I (với frame I của nhóm ảnh tiếp theo) Việc sử dụng thông tin lấy từ ảnh trong tơng lai hoàn toàn có thể thực hiện đợc vì tại thời điểm mã hoá thì bộ mã hoá đã sẵn sàng truy cập tới ảnh phía sau Frame B cho tỉ lệ nén cao nhất, và không đợc dùng làm frame tham chiếu Theo phơng pháp nén này, frame I gọi là frame intra (sử dụng kỹ thuật mã hoá intraframe),... một tập tiêu chuẩn biểu diễn nhiều loại thông tin multimedia khác nhau MPEG-7 không phải là chuẩn nén Sơ đồ giới thiệu các chuẩn nén và các công nghệ nén xem hình 1.6: Hình 1.6 Các chuẩn, các công nghệ nén, truyền thông đa phơng tiện Nguyễn Hữu Phát 13 Đồ án cao học ĐTVT 2003 1.3 Các khái niệm cơ bản trong nén Video theo chuẩn MPEG 1.3.1 Cấu trúc phân cấp Video theo chuẩn MPEG Cấu trúc dòng bit Video

Nén ảnh động dùng wavelet

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan