Nén tín hiệu truyền hình

31 523 1
Nén tín hiệu truyền hình

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

CHƯƠNG III: KỸ THUẬT NÉN TÍN HIỆU TRUYỀN HÌNH 3.1 Tổng quan nén tín hiệu 3.1.1 Cơ sở nén tín hiệu Tín hiệu video truyền thống, chất, nén từ năm 1950 với đời truyền hình màu Ba tín hiệu thành phần màu R,G,B với bề rộng dải thông 5Mhz, nén tín hiệu video màu hỗn hợp với bề rộng dải thông 5Mhz hình 3.1 R(0÷5 MHz) Camera Y(0÷5 MHz) Matrix G(0÷5 MHz) + R-Y(0÷1,5 MHz) B(0÷5 MHz) Tín hiệu Video màu tổng hợp (0÷5 MHz) B-Y(0÷1,5 MHz) Điều Chế Video Y C 5MHz R f G 5MHz f B 5MHz f 5MHz f Hình 3.1 : Nén Video tương tự Để truyền kênh truyền hình thông thường, tín hiệu video số cần phải “nén” đảm bảo chất lượng hình ảnh Trước hết xét thí dụ liệu gốc video: -Số hóa bit: (Chuẩn 4:2:2): Tín hiệu chói (Y):13.5x 106 x 8= 108 Mbits/s Tín hiệu hiệu mầu: 6.75 x 106 x x 2= 108 Mbits/s Tổng dung Lượng bit: 108 x 2= 216 Mbits/s -Số hóa 10 bit: (Chuẩn 4:2:2): Tín hiệu chói (Y):13.5 x 106 x 10= 135 Mbits/s Tín hiệu hiệu mầu: 6.75 x 106 x 10 x 2= 135 Mbits/s Tổng dung lượng bit: 135 x 2= 270 Mbits/s Dải thông yêu cầu tối thiểu kênh truyền tín hiệu gốc lớn:  Số hóa bit, đòi hỏi: BW ≥ 108 MHz  Số hóa 10 bit, đòi hỏi: BW ≥ 135 MHz Nén tín hiệu kỹ thuật kỹ thuật phát truyền hình Nó giảm dung lượng bit, tiết kiệm dải thông, đồng thời tạo khả truyền nhiều chương trình kênh truyền hình thông thường (một transponder truyền 10÷12 chương trình, kênh mặt đất truyền 4÷8 chương trình) Kích thước thiết bị lưu trữ nhỏ (ghi hình băng nhỏ dùng đĩa) Nén liệu dựa sở: *Độ dư thừa liệu: PTIT 71 - Độ dư thừa mã:  Dư thừa theo thống kê  Dư thừa không gian  Dư thừa thời gian - Dư thừa tâm sinh lý  Đặc trưng mắt HVS (Human Visual System)  Đặc trưng hệ thống thính giác người HAS (Human Auditory System)  Tính tương quan khả dự đoán * Entropy: Đây công cụ để đánh giá lượng thông tin chủ yếu chứa đựng hình ảnh, để từ xác định dung lượng tối thiểu cần sử dụng để miêu tả, truyền tải thông tin hình ảnh Sự kiện có xác suất nhỏ (giá trị nhị phân sample) cho thông tin nhiều Gọi lượng tin trung bình hình ảnh H(x), H(x) ENTROPY hình ảnh tính theo công thức : N H  x    P x i   I  x i  i 1 I xi   log2 Pxi  I(xi) : Lượng thông tin phân tử ảnh xi (được tính bit) P(xi) : Xác xuất phần tử ảnh xi xuất N H x   Pxi   log2 Pxi  Ta có : i 1 Entropy có ý nghĩa giới hạn trung bình thống kê số bit/phần tử Nếu nén liệu giá trị entropy, số thông tin bị 3.1.2 Phân loại nén tín hiệu Các phương pháp nén phân thành hai lớp hình 3.2 -Nén không tổn hao, trình mã hóa có tính thuận nghịch Lớp nén cho hệ số nén nhỏ 2:1 Mã hóa Huffman (mã hóa entropy),… thuộc lớp nén Quá trình DCT coi không gây thông tin điều kiện thông thường NÉN (COMPRESSION) NÉN KHÔNG TỔN HAO (LOSSLESS COMPRESSION) NÉN CÓ TỔN HAO (LOSSY COMPRESSION) Hình 3.2: Phân loại phương pháp nén PTIT 72 - Nén có tổn hao, trình mã hóa có tính chất gây thông tin -Cơ sở nén không tổn hao:  Dư thừa miền không gian (Spatial Redundancy)  Dư thừa miền thời gian (Temporal Redundancy)  Dư thừa xác xuất -Cơ sở nén có tổn hao:  Nhu cầu chất lượng ứng dụng khác  Loại bớt tần số cao ( ≈ Chi tiết nhỏ hình ảnh) Trong kỹ thuật truyền hình thường áp dụng kết hợp nhiều phương pháp để đạt hiệu nén tốt Các kỹ thuật nén điển hình thường theo mô hình ba bước: Biến đổi sang miền tần số cách sử dụng thuật toán biến đổi DCT, lượng tử hóa cac hệ số DCT để làm trơn liệu, nén mã entropy 3.2 Nén liệu video 3.2.1 Nén ảnh (Intra-Frame Compression) DCT Lượng tử hoá Quét zíc-zắc Mã hoá Entropy (VLC, RLC) Mạch trộn Khuếch đại đệm Hình 3.3: Sơ đồ khối nén ảnh Như hình 3.3 minh họa Nén ảnh loại nén nhằm giảm bớt thông tin dư thừa miền không gian Nén ảnh sử dụng hai trình có tổn hao không tổn hao để giảm bớt liệu ảnh Quá trình không sử dụng thông tin ảnh trước ảnh sau xét Hệ số nén không đạt cao Các bước gồm: DCT (Discrete Cosine Transform) DCT phép biến đổi toán học không tổn hao, có tính thuận nghịch, ứng dụng nén không gian - Phép biến đổi cosin rời rạc DCT biểu thị công thức : Fu,v  N 1 N 1 2x  1u cos2y  1v CuCv  f x,y cos N 2N 2N x  y - Phép biến đổi nghịch DCT-1 biểu thị : PTIT 73 f x,y  2x  1u cos2y  1v N 1 N 1 CuCv Fu,v cos  N u0 v0 2N 2N Biên độ Biên độ DCT Hệ số theo chiều dọc Hệ số theo chiều ngang Hệ số theo chiều dọc Hệ số theo chiều ngang Hình 3.4: Block mẫu DCT DCT biến đổi liệu dạng biên độ thành liệu dạng tần số không gian thông tin khối Các phép tính thực phạm vi khối  mẫu tín hiệu chói Y khối tương ứng tín hiệu màu CB CR DCT làm giảm tương quan không gian, góp phần làm giảm độ dư thừa thông tin Lượng tử hoá quét zíc-zắc Lượng tử hoá trình giảm bớt lượng bit cần thiết để biễu diễn hệ số Dựa vào đặc tính sinh lý thị giác, người ta mã hóa hệ số DCT quan trọng thông qua lượng tử hóa có trọng số Đây là lượng tử hóa theo khoảng cách để đạt hệ số nén cao Hệ số tần số thấp (DC coefficient) cần lượng tử xác so với hệ số có tần số không gian cao (AC coefficient) biểu thị giá trị độ chói trung bình khối phần tử ảnh (pixel block) Lượng tử hoá thực cách chia hệ số C(u,v) cho hệ số vị trí tương ứng bảng lượng tử Bảng tùy thuộc vào kênh chói hay kênh sắc Hình 3.5 thí dụ, hệ số ứng với tần số thấp chia cho giá trị nhỏ (10, 11, 12,…) Hệ số ứng với tần số cao chia cho giá trị lớn (100, 120, 121,…) bỏ phần thập phân Kết ta có tập hợp hệ số cosin C’(u,v) Trong trình lượng tử hoá, ta dùng tới 12 bit cho hệ số chiều (DC) bit cho hệ số có thứ tự cao Các hệ số cosin C’(u,v) quét zíc-zắc thành chuỗi nối tiếp mã hoá công đoạn Ví dụ DCT lượng tử hoá, hình 3.6 Trong ví dụ yêu cầu DCT lượng tử hoá để giảm tốc độ liệu cách đáng kể để truyền sub-block thông tin video DCT nhận ma trận  diễn tả miền không gian chuyển thành ma trận tương đương  miền tần số Chú ý thành phần tần số thấp nhóm góc bên trái phía trên, chứa hầu hết hệ số cao Tại điểm chuyển đổi DCT ngược lưu trữ ma trận miền không gian nguyên thuỷ Quá trình lượng tử PTIT 74 hoá thay giá trị nhỏ có hệ số tần số cao số “0” thay số có giá trị giống (similar) số “1” chung 16 12 16 14 16 14 16 18 16 24 16 49 16 72 16 Bảng trọng số 11 16 12 16 13 16 17 16 22 16 35 16 64 16 92 16 10 16 14 16 16 22 16 37 16 55 16 78 16 95 16 16 19 16 24 16 29 16 56 16 64 16 87 16 98 16 24 16 40 16 51 16 61 16 26 16 58 16 60 16 50 16 40 16 57 16 69 16 56 16 51 16 87 16 80 16 62 16 68 109 103 77 16 16 16 16 81 104 92 16 16 113 16 16 103 16 121 16 120 16 101 16 112 99 16 100 16 103 16 16 Hệ số DCT lượng tử hoá Hệ số DCT C00 16 C10 16 12 C20 16 14 C30 16 14 Lượng tử hoá có trọng số C00 16 C01 16 C02 16 C03 16 16 16 16 16 C10 16 C11 16 C12 16 16 16 16 16 16 C20 16 16 16 16 16 16 16 16 C30 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 C01 16 11 C11 16 12 C02 16 10 C12 16 14 C03 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 C77 16 99 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 C70 16 16 16 16 16 16 16 C77 16 C70 16 72 16 16 16 16 Hình 3.5: Lượng tử hoá có trọng số sử dụng kỹ thuật nén Quantization DCT 12 16 17 16 16 16 16 11 16 10 16 10 16 10 16 12 16 16 16 0.3 16 16 0.2 16 0.1 16 11 16 12 16 16 16 16 16 16 16 16 16 16 12 16 11 16 16 16 10 16 12 4.5 16 16 1.1 16 1.4 16 0.2 16 0.2 16 0.3 16 0.4 16 12 16 16 16 16 16 16 16 16 16 16 10 16 16 16 12 16 16 16 11 12 16 15 16 16 16 10 16 16 16 16 1.2 16 16 1.1 16 0.5 16 0.1 16 0.4 16 0.1 16 0.2 16 0.3 01 16 16 0.4 16 1.1 16 0.4 16 0.2 16 0.4 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 16 11 14 16 11 16 16 16 16 16 16 16 0.1 0.3 16 0.1 16 16 16 0.2 16 0.4 16 0.2 16 0.2 16 16 16 16 16 16 16 16 16 14 16 17 16 11 16 13 16 16 16 16 16 0.2 16 0.1 16 0.2 16 0.3 16 0.2 16 0.3 16 0.1 16 0.1 16 16 16 16 16 16 16 16 16 13 18 16 15 16 11 16 16 16 16 16 16 0.4 16 0.1 16 0.5 16 0.4 16 0.3 16 0.3 16 0.2 16 0.1 16 16 16 16 16 16 16 16 16 11 16 16 10 16 16 10 16 16 16 16 0.2 16 0.3 16 0.1 16 0.3 16 0.2 16 0.4 16 0.2 16 0.2 16 16 16 16 16 16 16 16 16 11, 12, 12, 4, 4, 8, 1, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 11,  12,  4, 8,  1,  0,  1, ,  0,  1, 39  Hình 3.6: DCT Coding lượng tử hoá Sau ma trận đọc theo cách hình chữ chi (zig-zag) hình 3.7 tạo thành vector 1x64 Mục đích việc quét zig-zag nhóm hệ số tần số thấp đỉnh vector, hệ số tần số cao “0” nhóm lại đáy vector Sau đó, hàng liệu dài thay hàng ngắn PTIT 75 Thứ tự truyền 64 hệ số khối  phần tử ảnh cách quét zig-zag làm tăng tối đa chuỗi giá trị “0” làm tăng hiệu nén Hình 3.7: Sơ đồ đường quét Zigzag hệ số DCT lượng tử hóa Mã hóa RLC mã hóa entropy: Đây công đoạn nén không tổn hao, thường thực phương pháp mã hoá với độ dài từ mã thay đổi VLC (Variable Length Coding) kèm theo mã theo loạt dài RLC (Run Length Coding) - Mã theo loạt dài RLC trình tách chuỗi (run) giống biểu diễn chuỗi bao gồm chiều dài chuỗi (runlength) ký tự lặp Mã hiệu chiều dài chuỗi lớn thường có tỉ lệ nén thấp, thường kết hợp VLC - Mã hoá entropy với độ dài từ mã thay đổi VLC sử dụng it bit để mã giá trị thường xảy nhiều bit để mã giá trị xảy Thí dụ: Mã hoá với độ dài cố định: Phần tử Xác xuất Từ mã Chiều dài từ mã A 0.75 00 B 0.125 01 C 0.0625 10 D 0.0625 11 bit/phần tử = 0.75  + 0.125  + 0.0625  + 0.0625  = Mã hoá với độ dài từ mã thay đổi: Phần tử Xác xuất A 0.75 B 0.125 C 0.0625 D 0.0625 Từ mã 10 110 111 Chiều dài từ mã 3 bit/phần tử = 0.75  + 0.125  + 0.0625  + 0.0625  = 1.375 PTIT 76 Như vậy, ví dụ đơn giản trên, mã hoá với độ dài từ mã thay đổi (VLC) tiết kiệm  1.375  : 1    100%  31.25%   3.2.2 Nén liên ảnh (Inter-Frame Compression) Ảnh động tập hợp ảnh tĩnh miền thời gian, chuỗi ảnh có lượng thông tin thay đổi việc so sánh ảnh, tính toán chuyển dịch vị trí nội dung ảnh thay đổi để loại bỏ thông tin dư thừa miền thời gian áp dụng kỹ thuật xấp xỉ bù chuyển động gọi nén liên ảnh Việc xác định thông tin phần ảnh chuyển động “xấp xỉ chuyển động” Việc khôi phục ảnh cách dùng phần ảnh từ ảnh trước với thông tin chuyển động “bù chuyển động” Nguyên tắc dự đoán bù chuyển động Vectơ di chuyển = cho nhóm pixels không di chuyển MPEG Vectơ di chuyển cho nhóm pixels di chuyển MPEG MPEG Frame # N + Frame # N Time Hình 3.8: Hình minh họa dùng vecto chuyển động nén liên ảnh   Tách chi tiết chuyển dịch hai frame kề Dùng vecto chuyển động để rõ vị trí chi tiết frame xét Vecto thị tọa độ khối (đã nén) frame trước lặp lại frame xét Có nhiều phương pháp để xác định vecto chuyển động số phương pháp gọi thích ứng khối (block matching) Hình 3.8 ví dụ minh hoạ sử dụng vectơ chuyển động nén liên ảnh Người ta chia hình ảnh thành MacroBlock = 16  16 pixels = block = 4(8  8) pixels Khi vùng ảnh chuyển động, người ta tìm kiếm vị trí thay đổi block ảnh kế tiếp, kết cho vectơ chuyển động Macroblock Do vậy, việc nhớ ảnh tĩnh, ảnh trước ảnh sau ảnh xét để kết hơp thông tin vectơ chuyển động Macroblock cho kết ảnh khác biệt, ảnh giống thông tin cho không, thông thường thay đổi nên hiệu nén cao PTIT 77 Các loại frame liệu video nén liên ảnh  I-frame (Intra-frame) sử dụng nén ảnh  P-frame (Predictive frame) dự đoán trước từ I-frame P-frame  B-frame (Bidirectional frame) dự đoán theo hai hướng từ I-frame P-frame Sơ đồ khối nén liên ảnh tạo P-frame hình 3.9a Ảnh + Ảnh khác biệt  + Lưu trữ ảnh dự đoán Xác Lưuđịnh trữ vectơ ảnh chuyển động dự đoán So sánh ảnh trước ảnh để tạo vectơ chuyển động thông tin dự đoán tốt thời gian dư thừa cao Lưu trữ ảnh gốc Vectơ chuyển động ghép với dòng liệu điều khiển tốc độ trước Hình 3.9a: Sơ đồ khối nén liên ảnh (tạo predictive frame) Hiệu hai ảnh ảnh dự đoán cho ảnh khác biệt đầu Nếu chuyển động, khác biệt ảnh (ảnh tĩnh), ảnh dự đoán cách xác tín hiệu tương ứng với ảnh khác biệt đầu = Khi hai ảnh không giống nhau, ảnh khác biệt (hiệu hai ảnh) thông tin công nghệ “nén” đạt hiệu mong muốn Sơ đồ khối nén liên ảnh tạo B-frame hình 3.9b Ảnh + Ảnh khác biệt  + Lưu trữ ảnh dự đoán So sánh ảnh trước ảnh để tạo vectơ chuyển động Lưu trữ ảnh trước Xác Lưuđịnh trữ vectơ ảnh chuyển động dự đoán Lưu trữ ảnh sau Vectơ chuyển động ghép với dòng liệu điều khiển tốc độ trước Hình 3.9b: Sơ đồ khối nén liên ảnh (tạo B-frame) PTIT 78 Trong thực tế có chuẩn nén đưa khuyến cáo ứng dụng phù hợp với yêu cầu cụ thể Họ chuẩn nén ảnh/video thông dụng liệt kê: JPEG: M-JPEG/ ISO/ IEC 10918 MPEG: - MPEG-1/ ISO/ IEC 11172 - MPEG-2/ ISO/ IEC 13818 - MPEG-4 - MPEG-7, … 3.2.3 Chuẩn nén JPEG Chuẩn nén ảnh JPEG (joint Photographic Experts Group) công nghệ nén ảnh hiệu quả, cho phép làm việc với ảnh có nhiều màu kích cỡ lớn Tỷ lệ nén ảnh đạt mức so sánh tới vài chục lần Ảnh màu không gian màu RGB (red Green Blue) biến đổi hệ YUV, YIQ (hay YCbCr) Điều thiết, thực cho kết nén cao hệ nhãn thị người nhạy cảm với thành phần Y nhạy cảm với hai loại U V Hệ thống nén thành phần Y ảnh với mức độ so với U, V, người ta nhận thấy thay đổi U V so với Y Hình 3.10: Sơ đồ khối mã hóa giải mã JPEG Giai đoạn biến đổi vùng thể dùng biến đổi cosin rời rạc (thông thường khối 8x8 pixel) Khi thông tin 64 pixel ban đầu biến đổi thành ma trận có 64 hệ số Điều quan trọng hệ số có khả thể cao nhất, khả giảm nhanh với hệ số khác Nói cách khác lượng thông tin 64 pixel tập trung chủ yếu số hệ số ma trận theo biến đổi Trong giai đoạn có mát thông tin, biến đổi ngược xác Nhưng lượng thông tin bị chưa đáng kể so với giai đoạn Ma trận nhận sau biến đổi cosin rời rạc lược bớt khác hệ số Đây lúc nhiều thông PTIT 79 tin người ta cắt bỏ thay đổi nhỏ hệ số Các biến đổi áp dụng cho thành phần U V ảnh với mực độ cao so với Y (mất nhiều thông tin U V hơn) Sau hệ số DC mã hóa DPCM có tương quan lớn với khối 8x8 trước đó, hệ số AC mã hóa RLC Cuối mã hóa entropy theo bảng phân loại huffman định Khi gỡ nén ảnh người ta việc làm lại bước theo trình ngược lại với biến đổi ngược Hiện chuẩn dùng truyền dẫn phát sóng truyền hình tốc độ dòng bit sau nén cao 3.2.4 Chuẩn nén MPEG-x Họ chuẩn nén MPEG kết hợp nén ảnh nén liên ảnh ban đầu thiết kế mã hóa hình ảnh âm Tiêu chuẩn MPEG-1, mục tiêu mã hóa tín hiệu audio video với tốc độ bit 1,5Mbit/s Cho đến có nhiều chuẩn MPEG đời Tuy nhiên, ta tập trung đề cập chuẩn điển hình MPEG-2 đời vào năm 1990 sử dụng cho ứng dụng đa với tốc độ bit từ 4Mbitps tới 9Mbitps MPEG-2 bao gồm thành phần chính:  Systems (ISO/IEC 13818 - 1): Chức ghép kênh truyền tải  Video (ISO/IEC 13818 - 2): Chức nén video  Audio (ISO/IEC 13818 -3): Chức nén audio  Các hệ thống kiểm tra (ISO/IEC 13818 - 4): Kiểm định a Cấu trúc dòng bit MPEG Video Dòng bit MPEG video có dạng hình vẽ 3.11: SEG : Thông tin chuỗi bit (Sequency), gồm: - Video Params : Chiều cao, rộng, tỉ lệ khuôn hình phần tử ảnh - Bitstream Params : Tốc độ bit thông tin khác - Qts : Có hai loại : Nén ảnh (ảnh I – I frame) Nén liên ảnh (ảnh P – P frame) GOP : Thông tin nhóm ảnh (Group of picture), gồm: - Time code : SMPTE : Giờ, phút, giây, ảnh - GOP params : Miêu tả cấu trúc GOP PICT : Thông tin ảnh (Picture Information ), gồm: - Type : Anh loại I, P hay B - Buffer params : Thông tin buffer PTIT 80 -Có khả biểu thị tấc dòng tích cực tín hiệu video -Có khả biểu thị thông tin khoảng thời gian xoá mành (vertical blanking interbval) HIGH 4:2:0 1920 ×1152 80 Mbps I,P,B HIGH - 1440 4:2:0 1440 ×1152 60 Mbps I,P,B MAIN 4:2:0 720 ×576 15 Mbps I,P 4:2:0 352 ×288 Mbps I,P,B LOW LEVEL / /PROFILES 4:2:0 720 ×576 15 Mbps I,P,B SIMPLE 4:2:0, 4:2:2 1920 ×1152 100 Mbps I,P,B 4:2:0 1440 ×1152 60 Mbps I,P,B 4:2:0 720 × 608 50 Mbps I,P,B MAIN 4:2:0 720 ×576 15 Mbps I,P,B 4:2:0, 4:2:2 1440 ×1152 80 Mbps I,P,B 4:2:0, 4:2:2 720 ×576 20 Mbps I,P,B 4:2:0 352 ×288 Mbps I,P,B SNR SPATIAL HIGH 4:2:2 PROFILE Hình 3.21: 4:2:2 Profiles @ Main Level MPEG-2 MPEG-2 chuẩn nén mềm dẻo có nhiều đặc điểm: • Hỗ trợ nhiều dạng thức video vào, đặc biệt dạng thức có độ phân giải cao, quét xen kẽ • Cú pháp dòng bit MPEG-2 mở rộng dòng bit MPEG-1 • Tương thích với MPEG-1:Tương thích thuận nghịch, lên xuống • Tính phân cấp (Scalability): phân chia thành nhiều lớp (layer) • Phân chia thành nhiều Profile, nhiều Level (mức) thích hợp với nhiều lĩnh vực ứng dụng dân dụng lẫn chuyên nghiệp e MPEG-4 part 10 (MPEG-4 AVC)/H264 MPEG-2 sử dụng rộng rãi gần hai thập kỷ qua MPEG-2 có khả mã hoá tín hiệu truyền hình chuẩn SD tốc độ từ 3-15Mbps truyền hình độ nét cao HD tốc độ từ 15-30Mbps Tuy nhiên, MPEG-2 nhằm đáp ứng tiêu chuẩn nén video, audio cho truyền hình mà chưa quan tâm đến ứng dụng khác, chưa sử dụng hết thuật toán tiêu chuẩn đầy đủ MPEG Cho nên kích thước file, tốc độ bitrate lớn so với chuẩn Tín hiệu đầu vào Encoder sử dụng chuẩn MPEG-2 chấp nhận dòng tín hiệu số SDI MPEG-4 AVC/H264 giới thiệu lần đầu năm 2003 nhanh chóng chứng tỏ tính linh hoạt ưu việt để thay cho MPEG-2 Các đặc điểm vượt trội kể đến bao gồm: o Cải tiến dự đoán hiệu (intra- and inter) PTIT 87 o o o o Linh hoạt liên kết mạng Thích ứng nhiều ứng dụng đa dạng Hiệu suất nén cao Phù hợp với môi trường tích hợp dịch vụ đa phương tiện mạng IP Tên H.264 theo ITU-T quy ước đặt tên, thành viên dòng H.26x VCEG; MPEG-4 AVC liên quan đến quy ước đặt tên ISO/IEC MPEG, part 10 tiêu chuẩn ISO / IEC 14496, tiêu chuẩn biết đến MPEG-4 Tiêu chuẩn phát triển quan hệ đối tác VCEG MPEG, sau công việc phát triển sớm ITU-T dự án VCEG gọi H.26L Vì thế, phổ biến để tham khảo với tên gọi H.264/AVC, AVC/H.264, H.264/MPEG-4 AVC, MPEG-4/H.264 AVC, để nhấn mạnh di sản chung MPEG-4 AVC Dùng mã hóa thích ứng ngữ cảnh, gồm:  Context-Adaptive Variable Length Coding (CAVLC), dùng để mã hóa hệ số transform lượng tử hóa  Context-Adaptive Binary Arithmetic Coding (CABAC): thuật toán losslessy phù hợp nén dòng video theo ngữ cảnh CABAC nén liệu hiệu so với CAVLC phức tạp hơn, đòi hỏi phải xử lý đáng kể giải mã khâu giải mã So sánh MPEG-2 Ứng dụng Trong lĩnh vực truyền hình số Tín hiệu vào Dòng tín hiệu số SDI MPEG-4 Truyền hình số, ứng dụng đồ hoạ video tương tác hai chiều (games, videoconferencing) ứng dụng multimedia tương tác hai chiều (World Wide Web ứng dụng nhằm phân phát liệu video truyền hình cáp, Internet video ) Cả dòng SDI IP Hiệu Bình thường nén chương trình SD: 3-15 Mbps chương trình HD: 15-30 Mbps Thuật Bình thường toán Tốt chương trình SD: 1.5-7.5 Mbps chương trình HD: 8-15 Mbps Phức tạp linh hoạt nhiều Bảng 3.22: So sánh MPEG-2 MPEG-4 MPEG-4 phức tạp so với MPEG-2 thiết kế để đạt video có chất lượng cao cho ứng dụng đa phương tiện với bit rate tương tối thấp MPEG-4 loại bỏ bit dư thừa cách so sánh nhiều khung hình so với MPEG-2 điều PTIT 88 chỉnh bit rate cho phù hợp So với MPEG-2 MPEG-4 định dạng mã hóa linh hoạt nhiều: Không áp dụng lĩnh vực truyền hình số MPEG-2, MPEG-4 AVC phát triển để trở thành tiêu chuẩn cho nén đồ hoạ video tương tác ứng dụng multimedia tương tác Bởi tín hiệu đầu vào Encoder sử dụng chuẩn MPEG-4 chấp nhận dòng tín hiệu số SDI dòng IP Ngày nay, MPEG-4 trở thành tiêu chuẩn công nghệ trình sản xuất, phân phối truy cập vào hệ thống video Nó góp phần giải vấn đề dung lượng cho thiết bị lưu trữ, giải vấn đề băng thông đường truyền tín hiệu video kết hợp hai vấn đề Như mà MPEG-4 có hiệu nén tốt hẳn so với MPEG-2, từ 1.57.5Mbps với chương trình SDTV 8-15Mbps với chương trình HDTV 3.3 Nén liệu audio 3.3.1 Cơ sở nén audio Theo mô hình tâm lý nghe, hệ thống thính giác người HAS (Human Auditory System) giống phân tích phổ âm thanh, chia thành băng Độ nhạy HAS giảm tần thấp tần cao, tạo nên độ dư thừa cảm nhận âm Để loại bỏ dư thừa tín hiệu audio, có kỹ thuật chủ yếu: dự đoán miền thời gian biến đổi miền tần số Nén không tổn thất thường gặp thuật toán vi sai: Tín hiệu audio dư thừa (các âm lặp lại, âm không thích hợp (tai nghe thấy)) bị loại bỏ cách tách audio thành 25/32 băng (chứa âm rời rạc), sau thực băng kỹ thuật DPCM ADPCM để dự báo đoạn lặp Cuối tận dụng mã hóa entropy Nén có tổn thất sử dụng đặc điểm không nhạy HAS để tách thành phần phổ có biên độ cao, loại bỏ thành phần phổ có biên độ nhỏ nằm xen thành phần phổ có biên độ lớn Các kỹ thuật thường gặp là: - Che phủ miền thời gian miền tần số - Chặn mức nhiễu lượng tử cho âm độ tín hiệu - Mã hoá nối (joint coding), dùng cho hệ thống đa kênh audio 3.3.2 Chuẩn nén MPEG cho audio số a Sơ đồ khối mã hóa/giải mã MPEG audio Dòng bit audio đầu vào chuyền tín hiệu qua miền thời gian Tín hiệu ngõ vào sử lý so sánh mô hình tâm lý nghe (Psychoacoustic model) để điều khiên phân tán bit lỗi Mạch lượng tử hoá liệu với kiềm chế giữ cho tỉ lệ S/N audio mức nhỏ chấp nhận Cuối cùng, liệu mã hoá thành dòng bit cuối hình 3.23 PTIT 89 Digital Audio Input Filter Bank Chuyển đổi qua miền tần số Phân tán bit nhiễu Định dạng dòng bit Dòng bit nén Audio Mô hình tâm lý nghe Điều khiển tỉ lệ S/N Audio nhỏ chấp nhận Hình 3.23: Cấu trúc sở mã hoá MPEG tín hiệu Audio Sơ đồ khối đơn giản giải nén MPEG hình 3.24 Đầu tiên dòng bit mã hoá định dạng lại thành dòng bit mã hoá đơn giản, sau xây dựng lại giá trị băng tần lượng tử hoá Cuối chuyển đổi giá trị phần băng tần thành dạng tín hiệu audio miền thời gian ENCODER BIT STREAM BIT STREAM UNPACKING FREQUENCY SAMPLE RECONSTRUCTION FREQUENCY – TO – TIME MAPPING DECODER PCM AUDIO ANCILLARY (IF ENCODER) Hình 3.24: Cấu trúc đơn giản giải mã MPEG Audio b Chuẩn nén MPEG-1 audio: Đây tiêu chuẩn mã hóa audio với tốc độ bit khoảng 32 > 192 Kbit/s cho âm Mono 64 > 448 Kbit/s cho âm Stereo Tốc độ lấy mẫu 32; 44,1; 48 kHz, 16bit/mẫu; chia làm lớp nén tùy thuộc vào ứng dụng khác nhau, với mức độ phức tạp tăng dần Đối với lớp tín hiệu Audio biến đổi từ miền thời gian sang miền tần số 32 băng lọc phụ  Layer I: Tổng cộng 32448 kb/s; 384=32x12 sample/ kênh; 32 băng con, khối 12 mẫu, frame: 384x20,83=8ms cho kênh 48 kHz  Layer II: Tổng 32384 kb/s; (mục tiêu 1287kb/s), 1152 sample/ kênh ; 32 băng con; khối 36 mẫu (32x36=1152); frame: 384x3x20,83=24ms  Layer III: Tổng 32320kb/s (mục tiêu 64kb/s), 1152 mẫu/ kênh, frame: 384x3x20,83=24ms; 32 băng (hoặc 192 băng con) Sau ta vào sơ đồ khối mạch mã hóa/giải mã audio lớp 2, sơ đồ khối mạch mã hóa/giải mã Audio lớp PTIT 90 Lớp 1,2 biểu thị tín hiệu audio đầu vào 32 băng lọc phụ thông số lượng tử hóa mã hóa khống chế mô hình âm Dữ liệu Audio vào 31 Băng lọc (32 băng phụ) Lượng tử hóa Tuyến tính Định dạng dòng bit mã sữa sai Dữ liệu mã hóa Mã hóa Thông tin phụ Biểu số FFT (1024 điểm) Điều khiển từ xa Mô hình “tâm lý nghe” Dữ liệu phụ Hình 3.25: Sơ đồ khối mã hóa audio lớp chuẩn ISO/IEC 11172-3 (ISO/MPEG) 31 Dữ liệu Đã mã hóa Tách kênh phát lỗi, sửa sai Quá trình ngược băng lọc (32 băng phụ) Giải lượng tử Tín hiệu Audio Stereo Giải mã Thông tin phụ Dữ liệu phụ Hình 3.26 : Sơ đồ khối giải mã Audio lớp chuẩn ISO/IEC 11172-3 (ISO/MPEG) Lớp biến thể giản ước phương pháp mã hóa MPEG-1 sử dụng chủ yếu ứng dụng dân dụng Lớp thực việc nén tín hiệu thực việc lượng tử hóa tinh hơn, ứng dụng nhiều kể dân dụng lẩn chuyên dụng Dữ liệu Audio Băng lọc (32 băng phụ) Biểu số FFT (1024 điểm) 31 575 DCT 0 Mô hình“tâm lý nghe” -Vòng kiểm soát méo -Lượng tử hóa phi tuyến tính -Vòng kiểm soát tốc độ bit Điều khiển từ xa 575 575 Mã hóa Huffman 0 Mã hóa Thông tin phụ Định dạng dòng bit mã sữa sai Dữ liệu audio mã hóa Dữ liệu phụ Hình 3.27 : Sơ đồ khối mã audio lớp chuẩn ISO/IEC 11172-3 (ISO/MPEG) PTIT 91 Lớp mã hóa môđun hiệu hai loại mã ASPEC MUSICAM Mỗi băng lọc phụ lại chia nhỏ nhiều đường có độ phân giải cao Ở lớp muốn hiệu nén cao phải dùng phương pháp lượng tử hóa phi tuyến Dữ liệu audio mã hóa Tăng kênh phát lỗi, sữa sai 575 31 575 Giải lượng tử DCT 0 Giải mã Thông tin phụ 31 DCT Quá trình ngược băng lọc (32 băng phụ) Tín hiệu Audio Stereo Dữ liệu phụ Hình 3.28: Sơ đồ khối giải mã audio lớp chuẩn ISO/IEC 11172-3 (ISO/MPEG) Bảng 3.29: Đặc tính layer chuẩn ISO/IEC 11172-3 (ISO/MPEG) c Chuẩn nén MPEG-2 audio: Dựa sở MPEG-1, năm 1994, chuẩn MPEG-2 audio (IOS/IEC 13818-3) đời nhằm đáp ứng áp dụng mới, với yêu cầu: - Đa năng, chất lượng audio cao thay đổi phạm vi rộng tùy tốc độ bit từ thấp đến cao (32 Kbps đến 1066 Kbps) Phạm vi rộng thực nhờ chia khung MPEG–2 audio thành phần: Dòng bit sơ cấp (dòng bit gốc) tương thích với MPEG – (384 Kb/s cho Player II) dòng bit mở rộng Với Player III, 64 Kb/s kênh, kênh audio đầy đủ băng tần mã hoá với tốc độ 320 Kb/s - Mã hoá kênh audio, bao gồm kênh phụ nâng cao tần số thấp, để làm âm tròn nhiều kênh - Sự mở rộng thực nhờ cộng thêm vào player : PTIT 92  tần số lấy mẫu (16; 22.05; 24 KHz) cho phép truyền băng tần khoảng 7.5 – 11 KHz cho chất lượng cao tốc độ dòng số liệu < 64 Kb/s cho kênh  Dung lượng đa kênh ( tốc độ bit đa kênh mở rộng đến Mb/s, cho phép đạt chất lượng cao) Các liệu cấy vào không gian liệu phụ cấu trúc MPEG-1 Audio frame Dữ liệu phụ Header CRC Phân bố SCFSI bit Hệ số thang độ Dữ liệu phụ Mẫu băng tần L0/R0 stereo sở Chú thích đa âm MC Header MC RCR MC bit phân bố MC SCFSI MC SCF Mẫu băng tần MC MC Dự báo Thông tin liệu nhiều kênh SCFSI : Scale Factor Selection Information = thông tin chọn hệ số tỉ lệ MC : Multi-channel = đa kênh Hình 3.30: Định dạng dòng bit audio MPEG-2, mở rộng MPEG-1 Tiêu chuẩn MPEG-2 audio tương thích chuẩn MPEG-1 Tuy nhiên giải mã MPEG-1 giải mã kênh trái phải dòng liệu MPEG-2 audio MPEG-2 Multi-channel Mono stereo Tần số lấy mẫu thấp kênh 16; 22.05; 24 KHz Layer I Layer II 32; 44.1; 48 KHz Layer III Layer I Layer II Layer III Hình 3.31: Các lớp audio theo tiêu chuẩn MPEG-2 Tại tần số lấy mẫu thấp, độ phân giải tần số khoảng 21 Hz với tần số lấy mẫu 24 KHz Nó cho phép băng tần có hệ số thang đo phù hợp tốt với độ rộng băng tần tới hạn PTIT 93 cho chất lượng audio tốt tốc độ bit thấp, độ rộng băng tần tín hiệu audio giảm tối đa 12 KHz Mô hình lớp MPEG-2 audio hình 3.31 Layer I Header CRC (32) (0,16) Layer II Header CRC (32) (0,16) Bit allocation (128-256) CRC (32) Ancillary data Sample (384) Bit Scale SCFSI allocation factors (128-256) (0-60) (0-1080) Side information (0,16) (128-256) Layer III Header Scale factors (0-384) Bit reservoir Sample Ancillary data (384) Ancillary data (384) SCFSI : Scale Factor Selection Information = thông tin chọn hệ số tỉ lệ CRC : Bit kiểm tra độ dư thừa tuần hoàn ; Header = Tiêu đề khung ; Bit allocation = Bit định Scale factor = Hệ số tỉ lệ ; Ancillary data = Số liệu phụ ; Bit Reservoir = Bit cung cấp (các số liệu từ hai khung trước) Hình 3.32: Định dạng dòng bit số liệu audio lớp I, II, III tiêu chuẩn MPEG2 Hình 3.32 Định dạng dòng bit số liệu audio lớp I, II, III tiêu chuẩn MPEG-2 Các lớp MPEG-2 giống MPEG-1 có đặc điểm sau: Frame haeder frame audio Phân bố bit CRC Hệ số thang đo Dữ liệu phụ CR0 CR1 CR2 Từ đồng 12 bits Bits Từ hệ thống 22 bits Mục đích 12 Từ đồng 1 2 1 10(MPEG = 1) Layer Tách lỗi Chỉ sô tốc độ bit Tần số lấy mẫu Bit đồng chỉnh Bit riêng mode Mode mở rộng Bản quyền Gốc/copy Mức nhấn CR11 32 mẫu CRC = Cyclic Redundancy Check (Kiểm tra độ dư thừa có chu kỳ) Hình 3.33: Cấu trúc Frame layer I, MPEG-2 PTIT 31 94 Layer I  Tốc độ liệu : 32  448 Kbps (tổng cộng)  Tín hiệu vào chia thành khung bao gồm 348 mẫu kênh  Chu kỳ khung ms (12  32  20.83s ) cho kênh 48 KHz  32 băng tần (Sub – band) có kích thước nhau, tạo từ khối (block) gồm 12 mẫu ( 32  12  384 mẫu)  Hệ số tỉ lệ bit băng (dải động âm 120 dB), hệ số tỉ lệ khác cho băng  Phân phối bit theo phương thức thích ứng trước  Mỗi mẫu băng tần lượng tử hóa cách xác tính toán phấn bố bit  Kênh đơn kép, stereo joint stereo (mã hóa kết hợp kênh trái kênh phải tín hiệu stereo audio)  Hầu hết thích hợp cho ứng dụng ghi âm studio kích thước khung (frame) ms Layer II  Loại kết nâng cao phương thức hoạt động player I, tỉ lệ nén cao Tốc độ bit xấp xỉ xung quanh 128 Kb/s  Tốc độ liệu 32 – 384 Kb/s  Tín hiệu vào chia thành khung, chứa 1152 mẫu /kênh  32 băng tần có kích thước nhau, tạo khối 36 mẫu (32  36 = 1152 mẫu)  Chu kỳ khung 24 ms cho kênh 48 KHz ( 384   20.83  24ms )  Hệ thống thang độ bit/băng (dải động 120 dB), băng khác nhau, nhóm 12, 24, 36 mẫu (8, 16 24 ms) để loại trừ méo âm  Vị trí bit tiến thích nghi, khung 24 ms cố định sử dụng lượng tử hoá bit chia nhỏ  Kênh đơn kênh kép, stereo joint stereo  Dùng rộng rải tiêu chuẩn MPEG CD– ROM, DVB, DAB, DBS, multimedia… Layer III  Tốc độ liệu 32 – 384 Kb/s  Tín hiệu vào chia thành khung, chứa 1152 mẫu /kênh PTIT 95  Tạo khung 24 ms  32 băng tần có kích thước nhau, chia tiếp thành 18 băng tần MDCT (tổng cộng 576 kênh), có khả chuyển mạch khối tức thời thành 192 băng  Các hệ số thang độ dùng để cải thiện cấu trúc mức nhiễu lượng tử  Vị trí bit tiên thích nghi    Mã hoá VLC (Huffman) giá trị lượng tử Kênh đơn kép, stereo joint stereo Dùng cho tốc độ bit thấp, ví dụ ISDN, viễn thông, đường truyền vệ tinh âm chất lượng cao qua internet Tốc độ lấy mẫu Tốc độ lấy mẫu Âm đa kênh 32 KHz 16 KHz Mono 44.1 KHz 22.05 KHz kênh stereo 48 KHz 24 KHz Joint stereo Đa kênh âm vòng Bảng 3.34: Chi tiết hệ thống audio chung Chuẩn MPEG ứng dụng rộng rãi HDTV, CATV, DVB, Internet 3.3.3 Một số chuẩn nén khác a Chuẩn nén AC-3 (Dolby Digital) Chuẩn AC-3 (Audio coding 3, Dolby Digital) chuẩn nén thường áp dụng hệ thống DVD-Video, ATSC-DTV, phát triển từ AC-1 AC-2 Đặc điểm chuẩn nén bao gồm:  Mã hoá âm từ đến kênh, thông thường cung cấp âm 5.1 kênh: trái, phải, trung tâm, trái vòm, phải vòm kênh hiệu ứng tần số thấp  kênh yêu cầu 6x48kHzx18bits=5.184Mbps chưa nén mã hoá tối thiểu với tốc độ 384kbps (đạt tỷ lệ nén 13:1)  Tuy nhiên, AC-3 hỗ trợ tốc độ từ 32 đến 640kbps  Cung cấp khả tự chọn mức âm  Cho phép giảm liệu trình lượng tử biểu diễn miền tần số tín hiệu âm  Bộ mã hoá sử dụng băng lọc phân tích chuyển mẫu PCM thành hệ số miền tần số Mỗi hệ số biểu diễn ký hiệu mũ nhị phân gồm phần số mũ phần định trị Các tập số mũ mã hoá thô qua phổ tín hiệu xem đường bao phổ Đường bao phổ định trị lượng tử cho khối âm (1536 mẫu âm thanh) định dạng thành khung chuyển Hình 3.35 mô tả sơ đồ khối mã hóa AC-3 PTIT 96 Hình 3.35: Sơ đồ khối mã hóa AC-3 Các ứng dụng AC-3:  Phát sóng quảng bá mặt đất hệ thống ATSC DTV  Phân phối audio qua cáp  Lưu trữ multi-media Việc nghiên cứu chi tiết chuẩn nén tham khảo tài liệu chuyên ngành Dolby Digital b Chuẩn nén AAC Advanced Audio Coding (viết tắt: AAC) - (ISO 14496-3) định dạng âm đa nén kiểu lossy định nghĩa theo tiêu chuẩnMPEG-2 MPEG-4, phát triển liên minh Fraunhofer, Dolby, Sony AT&T AAC phát triển nhằm thay cho định dạng âm tiếng MP3 để tích hợp container MP4-một container MPEG-4 Dạng định AAC phát triển để xóa chỗ yếu MP3 (MPEG-1 Audio Layer III, MPEG-2 Audio Layer III) AAC tích hợp tới 48 kênh âm (có sample rate tới 96KHz) cộng thêm 15 kênh âm tần số thấp (Low Frequency Enhancement-LFE) giới hạn sample rate 120 Hz Một số profile MPEG-4 AAC tiêu chuẩn:     Low Complexity (LC), sử dụng hệ thống mua bán nhạc trực tuyến Apple RealNetWorks cài sẵn phần cứng High Efficiency (HE), hiểu theo cách khác AACPlus, AAC+ hay AAC SBR(Spectral Band Replication) HE-AAC phát triển nhằm sử dụng việc mã hóa với bitrate thấp – đặc biệt có tác dụng với tập tin âm đa kênh (multichannel) Low Delay (LD), sử dụng cho thời gian trễ nhỏ (khoảng 20ms) mức Bitrate trung bình đến mức độ cao Được sử dụng lĩnh vực liên lạc, ví dụ hệ thống hội thoại video Main Profile - Profile PTIT 97  Scalable Sample Rate (SSR), dành cho "Streaming" hay "coi trực tuyến" Nó cho phép liệu liên tục mà không bị vấp cách giảm độ Bitrate, băng thông đường truyền không cho phép, độ băng thông cho phép nhiên giảm mạnh AAC dạng định nén sử dụng rộng rãi thiết bị di động kênh mua bán nhạc trực tuyến iTunes Store, Real Music Store, LiquidAudio gắn kèm với hệ thống chống chép DRM (ví dụ FairPlay Apple) AAC đem lại độ nén cao so với dạng định khác với mức nén tới 16:1 Ngay mức 64 kbit/sec đạt mức chất lượng khá, mức 128 kbit/sec ngang với chất lượng CD 3.4 Hệ thống ghép kênh truyền tải tín hiệu truyền hình số 3.4.1 Giới thiệu chung Có hai phương pháp thường sử dụng để ghép kênh số từ nhiều nguồn khác thành dòng sau:  Ghép kênh phân chia theo thời gian TDM (Time Division Multiplexing Method) Về nguyên lý, TDM gán khe thời gian cách tuần hoàn cho dòng sơ cấp audio, video số liệu  Ghép kênh gói (Packet Multiplexing method) Trong cách ghép kênh gói, gói số liệu từ dòng sơ cấp audio, video, số liệu đan xen vào cách tuần hoàn không tuần hoàn, gói gói để hình thành dòng ghép kênh Ghép kênh gói dùng truyền hình số mặt đất để truyền vài chương trình truyền hình kênh cao tần kết hợp với phương pháp ghép kênh (TDMA) theo thời gian (FDMA) theo tần số để truyền nhiều chương trình qua phát 3.4.2 Ghép kênh MPEG a Dòng sơ cấp dòng sơ cấp đóng gói Phần hệ thống MPEG mô tả cách thức dòng số video nén, audio nén dòng số liệu khác ghép chung lại với để tạo dòng ghép kênh MPEG Một số thuật ngữ nguyên lý lớp hệ thống MPEG trình bày đây: Chương trình (program): Theo ngôn ngữ phát truyền hình, chương trình thường có nghĩa tiết mục thông tin, giáo dục, giải trí… đài phát lên sóng hàng ngày Trong ngữ nghĩa MPEG, thuật ngữ chương trình có nghĩa kênh (channel) hay dịch vụ phát sóng đơn Dòng sơ cấp ES (Elementary Stream): Một chương trình gồm hay nhiều dòng sơ cấp Chương trình truyền hình thông thường bao gồm ba dòng sơ cấp: dòng video, dòng audio dòng số liệu teletext Tín hiệu Audio, Video sau nén MPEG có dạng dòng sơ cấp với chiều dài tùy ý chứa thông tin cần thiết để khôi phục lại âm hình ảnh ban đầu Các mã hóa đòi hỏi tín hiệu đầu vào theo chuẩn REC601 Video, nhiên thiết bị mã hóa MPEG-2 thực tế thường bao gồm mạch số hóa tín hiệu Video tương tự PTIT 98 (biến đổi A/D) Tương tự, tín hiệu Audio đầu vào phải theo chuẩn AES/EBU mạch mã hóa phải bao gồm biến đổi A/D Dòng sơ cấp tín hiệu gốc đầu mã hóa chứa thông tin cần thiết để giúp giải mã tái tạo lại hình ảnh âm ban đầu Dữ liệu Video (REC.601) Dữ liệu Audio (AES/EBU) Mã hóa video Dòng sơ cấp ES Video Mã hóa audio Dòng sơ cấp ES Audio Hình 3.36 : Dòng sơ cấp (ES) Dòng sơ cấp đóng gói (Packetized Elementary Stream – PES) Để truyền với tốc độ tin cậy cao, dòng liệu sơ cấp chia thành gói nhỏ có kích thước phù hợp tạo nên dòng liệu sở đóng gói Dòng sơ cấp ES Video Dòng sơ cấp ES Audio Đóng gói Đóng gói PES Video PES Audio Hình 3.37 : Dòng sở đóng gói (PES) b Ghép kênh dòng chương trình & dòng truyền tải MPEG Dòng ghép kênh: Lớp hệ thống MPEG-2 mô tả cách thức dòng sơ cấp chương trình hay nhiều chương trình ghép chung với tạo dòng số liệu thích hợp cho lưu trữ số hay truyền dẫn số Chuẩn nén MPEG-2 thiết kế cho tốc độ bit lớn 4Mb/s Tín hiệu video audio nén, xử lý đóng gói ghép kênh tạo thành dòng liệu với tốc độ mong muốn Các thông tin cần thiết sử dụng ghép kênh gồm:  Hệ thống nhãn thời gian (Time - Stamp TS): Sử dụng để đảm bảo dòng sơ cấp liên kết phát lại cách đồng giải mã  Các bảng thông tin dịch vụ (Service Information): Mô tả chi tiết thông số mạng, chương trình ghép kênh chất dòng sơ cấp khác  Các thông tin điều khiển việc xáo trộn (Scrambling) số liệu, thông tin dùng để truy cập có điều kiện CA (Conditional Access)  Các kênh số liệu riêng (private data): Số liệu riêng dòng số liệu mà nội dung không quy định tiêu chuẩn MPEG PTIT 99 Ở MPEG đạt đồng thông qua việc sử dụng nhãn thời gian tần số chuẩn đồng hồ (Clock system-CS) Ghép kênh dòng chương trình (Program stream-PS) Được thiết kế cho môi trường tạp nhiễu, dòng chương trình kết ghép kênh vài dòng sở chương trình dùng chung xung nhịp, bao gồm gói PES có độ dài thay đổi Dòng liệu sau ghép kênh chứa dòng bit điều khiển miêu tả chương trình Dòng chương trình thường ứng dụng đĩa CD-ROM, DVD, HDDVD Dòng PES Video Dòng PES Audio Ghép kênh Dòng PS Hình 3.38 : Ghép kênh dòng chương trình (PS) Như vậy, theo cách thức này:  Bộ mã hóa video mã hóa tín hiệu video số định dạng CCIR - 601 thành dòng sơ cấp video (video ES) có chiều dài gần vô tận chứa thông tin tối cần thiết để khôi phục lại hình ảnh ban đầu  Bộ mã hóa audio mã hóa tín hiệu audio số định dạng AES/EBU thành dòng sơ cấp audio có chiều dài tùy ý (tần số lấy mẫu 48KHz, số bit mẫy 24 bit tốc độ bit 1152 Kbit/s)  Ban đầu, dòng video, audio đóng gói lại thành dòng sơ cấp PES tương ứng với gói có độ dài thay đổi Mỗi gói PES bao gồm header số liệu trích từ dòng sơ cấp  Các gói PES lại ghép với tạo dòng chương trình PS Dòng chương trình thiết kế để truyền môi trường tạp nhiễu sai nhầm, ví dụ ứng dụng CD – ROM hai nguyên nhân sau:  Dòng chương trình bao gồm gói tương đối dài nối tiếp độ dài lại thay đổi Mỗi gói bắt đầu tiêu đề (header) Mỗi lỗi xảy phần tiêu đề làm thông tin toàn gói Vì gói chương trình chứa vài chục Kbyte số liệu nên mát thông tin gói làm gián đoạn khung ảnh  Độ dài gói không cố định khiến cho giải mã không dự đoán gói chấm dứt gói bắt đầu Thay vào đó, giải mã đọc dịch lại thông tin độ dài gói chứa tiêu đề, thông tin độ dài gói bị lỗi, giải mã đồng làm thông tin gói Ghép kênh dòng truyền tải (Transport stream-TS) Được thiết kế cho môi trường có tạp nhiễu để truyền kênh có nhiễu, dòng truyền tải kết ghép kênh dòng sơ cấp dùng chung xung nhịp không Như dòng truyền tải bao hàm gói nhiều chương trình PTIT 100 PID PES Video PID PES Audio 1-1 PID PES Audio 1-2 Transport stream (TS) MUX PID (n -2) PES Video i PES Audio i-1 Data PID (n-1) PID (n) Elementary stream map PID-Packet identification Hình 3.39: Ghép kênh dòng truyền tải (TS) Vì môi trường truyền dẫn phát sóng mà quan tâm có tạp nhiễu sai nhầm, dùng dòng chương trình mà phải dùng dòng truyền tải Tại đầu nhận, dòng liệu tương ứng với chương trình cần tìm tách khỏi dòng liệu truyền tải chung đưa tới giải mã Mô hình tổng quát ghép/phân kênh dòng liệu MPEG hình 3.40 Mã hoá video Mã hoá audio Dữ liệu khác Dòng video sơ cấp Dòng audio sơ cấp Giải mã video Đóng gói & Ghép kênh Dòng Truyền tải Phân kênh Dòng liệu Giải mã audio Giải mã liệu Hình 3.40: Ghép/phân kênh dòng MPEG Như vậy, có phân lớp dòng liệu MPEG, bao gồm:  Lớp định dạng nguồn, nén giải nén  Lớp hệ thống: đóng gói, đa hợp/giải đa hợp dòng PS/TS Cấu trúc định dạng dòng liệu MPEG tham khảo khuyến nghị ISO/IEC Câu hỏi ôn tập chương Cơ sở phương pháp nén So sánh phương pháp nén ảnh truyền hình Các phận cấu thành lớp chuẩn MPEG Mô hình tâm lý nghe đặc điểm hệ thống thính giác người HAS có ý nghĩa việc giảm tốc độ dòng bit audio? Hiệu khả ứng dụng chuẩn nén Audio? PTIT 101 ... tử Nếu nén liệu giá trị entropy, số thông tin bị 3.1.2 Phân loại nén tín hiệu Các phương pháp nén phân thành hai lớp hình 3.2 -Nén không tổn hao, trình mã hóa có tính thuận nghịch Lớp nén cho... có khả mã hoá tín hiệu truyền hình chuẩn SD tốc độ từ 3-15Mbps truyền hình độ nét cao HD tốc độ từ 15-30Mbps Tuy nhiên, MPEG-2 nhằm đáp ứng tiêu chuẩn nén video, audio cho truyền hình mà chưa... tỷ số tín hiệu tạp âm (signal to noise rate – SNR) có nghĩa chất lượng hình ảnh tỷ số tín hiệu tạp âm có tính thoả hiệp Một giải mã có tốc độ bit thấp, có đầy đủ độ phân giải tỉ số tín hiệu tạp

Ngày đăng: 23/05/2017, 11:05

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan