DỮ LIỆU ĐA PHƯƠNG TIỆN PART 2

56 154 0
DỮ LIỆU ĐA PHƯƠNG TIỆN PART 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

DỮ LIỆU ĐA PHƯƠNG TIỆN Part 2: Các giải thuật nén GV: TS Đinh Đồng Lưỡng Mục đích nén liệu  Vấn đề: Dữ liệu đa phương tiện thường có kích thước lớn  Dữ liệu văn (text) page with 80 characters/line and 64 lines/page and byte/char results in 80 * 64 * * = 41 kbit/page  Dữ liệu ảnh (Still image) 24 bits/pixel, 1280 x 728 pixel/image results in 1280 x 728 x 24 bit color ≈ 22Mbit  Dữ liệu âm (audio) CD quality, sampling rate 44,1 KHz, 16 bits per sample results in 44,1 x 16 = 706 kbit/s Stereo: 1,412 Mbit/s  Dữ liệu ảnh động âm Full-size frame 1024 x 768 pixel/frame, 24 bits/pixel, 30 frames/s results in 1024 x 768 x 24 x 30 = 566 Mbit/s More realistic: 360 x 240 pixel/frame, 360 x 240 x 24 x 30 = 60 Mbit/s => Cần giảm kích thước liệu lưu trữ truyền thông Minh họa Image properties Audio properties Phân loại nén liệu Nén không mát thông tin (Lossless Compression)  The original object can be reconstructed perfectly  Compression rates of 2:1 to 50:1 are typical  Example: Huffman coding  Nén có mát thông tin (Lossy Compression)  There is a difference between the original object and the reconstructed object  Physiological and psychological properties of the ear and eye can be taken into account  Higher compression rates are possible than with lossless compression (typically up to 100:1) Lossless Compression Simple Lossless Algorithms: Pattern Substitution Example 1: ABC -> 1; EE -> Example 2: Note that in this example both algorithms lead to the same compression rate Some algorithms: Lossless compression  Run length Coding (RLC)  Huffman  Lempel Ziv – Wench (LZW) Run Length Coding Principle Replace all repetitions of the same symbol in the text (”runs“) by a repetition counter and the symbol Example Text: AAAABBBAABBBBBCCCCCCCCDABCBAABBBBCCD Encoding: 4A3B2A5B8C1D1A1B1C1B2A4B2C1D As we can see, we can only expect a good compression rate when long runs occur frequently Examples are long runs of blanks in text documents, leading zeroes in numbers or strings of „white“ in gray-scale images Run Length Coding for Binary Files When dealing with binary files we are sure that a run of “1“s is always followed by a run of “0“s and vice versa It is thus sufficient to store the repetition counters only! Example 000000000000000000000000000011111111111111000000000 000000000000000000000000001111111111111111110000000 000000000000000000000001111111111111111111111110000 000000000000000000000011111111111111111111111111000 000000000000000000001111111111111111111111111111110 000000000000000000011111110000000000000000001111111 000000000000000000011111000000000000000000000011111 000000000000000000011100000000000000000000000000111 000000000000000000011100000000000000000000000000111 000000000000000000011100000000000000000000000000111 000000000000000000011100000000000000000000000000111 000000000000000000001111000000000000000000000001110 000000000000000000000011100000000000000000000111000 011111111111111111111111111111111111111111111111111 011111111111111111111111111111111111111111111111111 011111111111111111111111111111111111111111111111111 011111111111111111111111111111111111111111111111111 011111111111111111111111111111111111111111111111111 011000000000000000000000000000000000000000000000011 28 26 23 22 20 19 19 19 19 19 19 20 22 1 1 1 14 18 24 26 30 3 3 50 50 50 50 50 18 22 26 26 26 26 23 20 3 3 3 46 Variable Length Coding Classical character codes use the same number of bits for each character When the frequency of occurrence is different for different characters, we can use fewer bits for frequent characters and more bits for rare characters Example Code 1: A B C D E (binary) Encoding of ABRACADABRA with constant bit length (= Bits): 0000100010100100000100011000010010000001 000101001000001 Code 2: A B Encoding: R 01 01 C 10 D 11 10 11 01 Phương pháp ước lượng chuyển động  Ước lượng chuyển động (motion estimation) thực dạng khung hình khác Độ tương quan khung hình xác định dựa véc tơ chuyển động (motion vector)  Ước lượng chuyển động xác tạo tỷ lệ nén cao chất lượng video tốt  Ước lượng chuyển động thực khối ảnh có kích thước 16x16 điểm ảnh Kích thước khối ảnh nhỏ tăng độ xác ước lượng chuyển động độ phức tạp tính tốn cao  Véc tơ chuyển động xác định sai khác chuyển động hai khung hình lớn ngưỡng cho trước Phương pháp ước lượng chuyển động  Kỹ thuật đối sánh khối ảnh (Block Matching) dùng để ước lượng chuyển động  Mỗi khối ảnh khung hình so sánh với khối ảnh nằm khu vực tìm kiếm khung hình trước  Khu vực tìm kiếm thường có kích thước hình chữ nhật, chuyển động thường diễn theo phương ngang  Ước lượng chuyển động thực dựa kênh độ chói, nhiên thơng tin màu thêm vào để tăng độ xác phép ước lượng Phương pháp nén bù chuyển động  Phương pháp ước đoán bù chuyển động : giả thiết ảnh phép biến đổi từ ảnh trước đó, nghĩa biên độ và hướng dịch chuyển không cần thiết phải giống ảnh trước đó  Phương pháp nội suy bù chuyển động kỹ thuật nhiều độ phân giải: mã hoá tín hiệu phụ với đợ phân giải thấp (khoảng 1/2 đến 1/3 tốc độ khung) Ảnh có đợ phân giải đầy đủ xây dựng lại qua nội suy ảnh có đợ phân giải thấp cộng thêm thành phần sửa sai Đơn vị xử lý ảnh mà MPEG sử dụng macroblock (MB) 16X 16 điểm ảnh Minh họa Thứ tự khung nhìn MPEG  A Group-of-Picture (GOP) contains types of frames (I/P/B)  Frame order I1 BBB P1 BBB P2 BBB I2 …  Coding order I1 P1 BBB P2 BBB I2 BBB … Chuẩn MPEG-4 Các giải thuật nén âm Nén có tổn thất  Các phương pháp nén âm đơn giản: LCP(Linear Predictive Coding) CELP (Code Excited Linear Predictor)  Nén âm dùng mơ hình âm – tâm lý (Psychoacoustics): Hệ thống nghe phát âm người Che tần số Băng giới hạn Che thời  Nén âm MPEG Nén MP3  MP3 nhóm MPEG-1 lớp cung cấp chất lượng audio gần giống với chất lượng CD tốc độ bit thấp  MP3 hỗ trợ tần số lấy mẫu khác như: 32kHz; 44,1kHz; 48kHz; tốc độ bit thay đổi từ 32 đến 448kbps Nén MP3  Mã hóa audio cảm quan kỹ thuật lợi dụng đặc điểm cảm quan tai người để đạt tỉ lệ nén cao với chất lượng tốt Bộ mã hóa MP3 Các bước giải thuật nén Dùng lọc thông để chia tín hiệu âm thành sub-band theo tần số, tương ứng với 32 băng giới hạn  lọc sub-band Xác định số lượng che band gây band lân cận kết qủa bước  mơ hình âm - tâm lý Nếu mức to băng mà nhỏ ngưỡng che khơng mã hóa Ngược lại, xác định số bit cần thiết để mã hóa cho nhiễu sinh việc lượng tử hóa thấp đường cong che Định dạng dòng liệu bit Minh họa Sau phân tích, 16 band số 32 band sau: _ Band 10 11 12 13 14 15 16 Level(dB) 12 10 10 60 35 20 15 _ Nếu mức to âm thứ 60dB, che band thứ mức 12dB band thứ mức 15dB Mức to band 10dB ( 15dB) nên tiếp tục xử lý Layer I: lọc loại DCT với frame độ rộng tần số sub-band Mơ hình âm-tâm lý sử dụng hiệu che tần số (Frequency masking) Layer II: sử dụng frame lọc (trước, kế tiếp, tổng cộng 1152 mẫu) Mơ hình âm-tâm lý có sử dụng hiệu che thời (Temporal masking) Layer III: dùng lọc băng giới hạn tốt hơn, mơ hình âm-tâm lý có sử dụng hiệu che thời, có dùng mã hố Huffman Mã hóa dự đốn tuyến tính LPC Mối quan hệ mơ hình phát âm LPC ... Properties  The dictionary is created dynamically during the encoding and decoding process It is neither stored nor transmitted!  The dictionary adapts dynamically to the properties of the character... Voted as international standard in 1992  Works with color and grayscale images, e.g., satellite, medical,  Lossy and lossless  1987: ITU + ISO => international standard for still image compression... given character frequencies (or probabilities) The algorithm that solves this problem was found by David Huffman in 1952 Algorithm Generate-Huffman-Code Determine the frequencies of the characters

Ngày đăng: 22/02/2019, 09:07

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan