Tiểu luận môn truyền thông đa phương tiện multimedia

90 1.1K 0
Tiểu luận môn truyền thông đa phương tiện multimedia

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỤC LỤC MỤC LỤC DANH MỤC BẢNG BIỂU DANH MỤC CÁC HÌNH VẼ .3 Lời nói đầu CÁC THUẬT NGỮ VIẾT TẮT Chương I 1.1 xuất CHƯƠNG : MPEG-4 VISUAL 17 5.1 GIỚI THIỆU 17 5.2 TỔNG QUAN VỀ MPEG-4 VISUAL (Nén video tự nhiên) 18 5.2.1 Tính .18 5.3.2 Công cụ, đối tượng, đặc tính mức độ 18 5.2.3 đối tượng video .22 5.3 Mã hóa khung hình chữ nhật 23 5.3.1 Đầu vào đầu định dạng video 25 5.3.2 Các Profile đơn giản 26 5.3.2.1 Lõi video Bit tốc độ cực nhỏ .26 5.3.2.2 Các công cụ mã hóa 27 5.3.2.4 công cụ Truyền dẫn hiệu suất 34 5.3.3 Các chi tiết profile đơn giản 36 5.3.4 Các chi tiết Profile thời gian thực đơn giản 42 5.4 Mã hóa vùng hình dạng tùy biến 44 5.4.1 Core Profile 46 5.4.1.1 Mã hóa Khuôn hình nhị phân 47 5.4.1.1 Mã hóa bù chuyển động cho hình dạng tùy biến VOPs .50 5.4.2 Phần nội dung 54 5.4.2.1 Mã hóa hình xám 55 5.4.2.2 Mã hóa hình tĩnh .60 5.4.4 Phần n-bit .65 5.5 Mã hóa video mở rộng 66 5.5.1 Khả mở rộng không gian .67 5.5.2 Khả mở rộng thời gian 69 5.5.3 Khả mở rộng hình tốt 70 5.5.4 Mã hóa liên kết rút gọn 73 5.5.5 Mã liên kết 74 5.5.6 Khả mở rộng phần thu nhỏ 74 5.6 Kết cấu mã hóa 74 5.6.1 Kết cấu mã hóa liên kết 78 5.6.2 Kết cấu mã hóa liên kết nâng cao 78 5.7 MÃ HÓA ÂM THANH- CHẤT LƯỢNG HÌNH ẢNH 78 5.7.1 Phần âm nén 78 5.7.2 Các file âm gốc 80 5.8 MÃ HÓA TRƯỜNG HÌNH ẢNH TỔNG HỢP .80 5.8.1 Lưới mã hóa 2D 3D 81 5.8.2 Mặt hình dạng ảnh động 81 5.9 KẾT LUẬN 82 5.10 TÀI LIỆU THAM KHẢO 82 Chương VIII: Các ứng dụng định hướng 84 DANH MỤC BẢNG BIỂU Bảng 5.1 MPEG-4 Visual Hình ảnh để mã hóa video tự nhiên Bảng 5.2 Đặc tính MPEG-4 Visual để mã hóa tổng hợp Video Lai Bảng 5.3 mức cấu hình Bảng 5.4 giá trị thành phần dc_scaler vùng QP Bảng 5.5 Trọng số ma trận Ww Bảng 5.6 Hệ số dư lại( độ lớn) Bảng 5.7 Giá trị nén Bảng 5.9 Zero- ký hiệu mã hóa DANH MỤC CÁC HÌNH VẼ Hình 1.1 video khung ( cho thấy ví dụ vùng đồng ) Hình 1.2 khung Video ( thấp qua lọc ) Hình 1.3 video frame Hình 5.1 Các đặc tính đối tượng MPEG-4 Visual Hình 5.2 VOPs VO (khung hình chữ nhât) Hình 5.3 VOPs and VO (hình dạng tùy biến) Hình 5.4 Video scene liên kết VOs Hình 5.5 Video cảnh sáng tác VOS từ nguồn riêng biệt Hình 5.6 Các công cụ thành phần dùng để mã hóa khung ảnh chữ nhật Hình 5.7 Chuẩn nén I-VOP bước giải mã Hình 5.8 Chuẩn nén P-VOP bước giải mã Hình 5.9 vector chuyển động 1khối macro Hình 5.10 VOP tham chiếu VOP Hình 5.11 VOP tham chiếu ngoại suy vượt ranh giới Hình 5.12 Macroblock mã hóa chế độ nội Hình 5.13 Hệ số DCT (luma blocks) Hình 5.14 Dự đoán hệ số DC Hình 5.15 Dự đoán hệ số AC Hình 5.16 Không gian thời lan truyền lỗi Hình 5.17 Cấu trúc gói tin video Hình 5.18 Khôi phục lỗi sử dụng RVLCs Hình 5.19 Chế độ dự báo cho B-VOP Hình 5.20 chế độ trực tiếp vectors Hình 5.21 VOP, GMVs vector nội suy Hình 5.22 GMC (Bù cho vòng quay) Hình 5.23 GMC (bù cho phóng to camera ) Hình 5.24 VOP kín xen kẽ Hình 5.25 dòng DCT Hình 5.26 xử lý lỗi NEWPRED Hình 5.27 Giảm nửa độ phân giải macroblock Hình 5.28 công cụ đối tượng cho mã hóa hình dạng Hình 5.29 VO hiển thị vùng (1), bên (2) ranh giới (3) macroblocks Hình 5.30 VOP Hình 5.31 mặt nạ anpha nhị phân (VOP hoàn chỉnh) Hình 5.32 ranh giới macroblock Hình 5.33: mặt nạ anpha nhị phân (ranh giới MB) Hình 5.34 bối cảnh mẫu cho BAB nội Hình 5.35 Mẫu bối cảnh cho BAB Hình 5.36 Ví dụ lĩnh vực tài liệu tham khảo có chứa điểm ảnh suốt Hình 5.37 đệm ngang dọc MB ranh giới Hình 5.38 Ranh giới MB Hình 5.39 MB ranh giới sau đệm ngang Hình 5.40 MB ranh giới sau đệm dọc cạnh pixel Hình 5.41 Đệm MB suốt từ điểm lân cận Hình 5.42 Mặt nạ alpha màu xám quy mô cho MB ranh giới Hình 5.43 MB ranh giới với tính trắng xám Hình 5.44 Video cảnh với đối tượng nhị phân-alpha (trái) đối tượng màu xám-alpha (bên phải) Hình 5.45 Video cảnh với đối tượng bán suốt Hình 5.46 Chuỗi khung Hình 5.47 Bối cảnh Hình 5.48 Hình ba điểm ảnh khác Hình 5.49 Hình có độ trễ thấp: giải mã I-VOP Hình 5.50 Hình độ trễ thấp : tĩnh-hình-đối tượng mảnh Hình 5.51 Hình độ trễ thấp: Nội dung đệm(1) Hình 5.52 Hình độ trễ thấp : tĩnh-hình-cập nhật mảnh Hình 5.53: Hình độ trễ thấp: Nội dung đệm(2) Hình 5.54: Hình độ trễ thấp: Nội dung đệm(3) Hình 5.55: Hình thích ứng DCT Hình 5.56 Công cụ đối tượng cho khả mở rộng mã hóa Hình 5.57 Mã hóa mở rộng: Khái niệm chung Hình 5.58 Khung hình video gốc Hình 5.59 Sub-lấy mẫu khung mã hóa lớp sở Hình 5.60 Khung lớp sở (được giải mã up lên) Hình 5.61 Còn lại mã hóa lớp tăng cường Hình 5.62 Tăng cường thời gian P-VOP lựa chọn dự đoán Hình 5.63 Tăng cường thời gian B-VOP lựa chọn dự đoán Hình 5.64 Sơ đồ khối mã hóa FGS (đã rút gọn) Hình 5.65 Khối block dư (góc bên trái) Hình 5.67 Công cụ đối tượng cho kết cấu mã hóa Hình 5.68 Sơ đồ khối biên độ song Hình 5.69 Quét sơ đồ Hình 5.70 dải tần số quét Hình 5.72 Sự thay đổi cấu trúc macrobock(4:2:2 4:4:4 video) Hình 5.73 Ví dụ cấu trúc dải Hình 5.74 Công cụ mô hình Lời nói đầu Trong vòng vài năm trở lại dây nghe nói nhiều dấn từ multimedia Vậy, cách xác, multimedia gì? Từ lâu thuật ngữ media dùng để thực thể máy truyền th ảnh máy truyền hình, nghĩa nói đến vật mang thông tin đơn thuần, mà hệ thống tương đối phức tạp, có cấu, có đối tượng nhắm tới Loại truyền thông trực tiếp, từ miệng người đến tai người kia, không sử dụng thành phần (media) trung gian Không khí truyền chấn động âm media mà vật mang vật làm công việc tái thông tin Nếu dùng máy cassette audio để ghi lời người nói, nội dung cassette đến người nghe cách truy xuất trực tiếp, phải nhờ đến hệ thống vật lý khác: máy đọc cassette Nếu để rời, cassette xem vật mang Nếu gộp máy đọc cassette hệ thống truyền thông, media Media có mục đích phát, truyền thông tin không đòi hỏi cách nghe nhìn Một tờ giấy in chữ cho người mù đòi hỏi sờ mó Một chức postalc có nhạc mùi hương, đòi hỏi lúc nhìn, nghe ngửi Bằng chừng ấy, nói đến truyền thông đa phương tiện Và vật, từ multimedia xuất kèm với nhiều d ảnh từ chung khác: centre de ressource multimedia (trung tâm tài nguyên đa phương tiện), post de formation multimedia (trạm đào tạo đa phương tiện), multimedia training (huấn luyện đa phương tiện), multimedia personal computer MDC (máy tính cá nhân với đa phương tiện), digital multimedia system (hệ thống đa phương tiện dạng số ) Trong nội dung môn học nghiên cứu khái niệm Multimedia hiểu ứng dụng rỗng rãi Multimedia đời sống: yêu cầu xu hướng phát triển ứng dụng Multimedia, cấu trúc thiết kế ứng dụng bước cần thiết để xây dựng ứng dụng đa phương tiện, nắm bắt số công cụ có sẵn thực tế để thiết kế ứng dụng Multimedia CÁC THUẬT NGỮ VIẾT TẮT Từ viết tắt ACE BAB BDPs CAE CODEC DCT DPCM DRC DWT FBA FAPs FDPs GMC GOBs ISO/IEC ITU-T MCP MCR MPEG-2 MPEG-4 SNHC OBMC PQDCx QCIF or CIF QDCx RVLCs VLBV VLCs VO VOP VOPs Nghĩa tiếng Anh Nghĩa tiếng Việt Advanced Coding Efficiency The binary alpha mask Body Definition Parameters Arithmetic Encoding Compressor- decompressor Discrete Cosine Transform Differentinal Pulse Code Modulation Dynamic Resolution Conversion Discrete Wavelet Transform Face and Body Animation Facial Animation Parameters Facial Definition Parameters Global Motion Compensation Groups of Blocks General Requirements for the competence of testing and calibration laboratories International Telecommunication Union - Telecommunication Standardization Sector Motion- Compensated Prediction Motion-Compensated Reconstruction Moving Picture Experts Group Phase Mã hóa hệ số nâng cao Mặt nạ alpha nhị phân Các thông số hệ số hình dạng Mã hóa số học Bộ mã hóa-giải mã Biến đổi Cosin rời rạc Phương pháp mã hóa dự đoán tổn thất Chuyển đổi độ phân giải động Biến đổi Wavelet rời rạc Mặt hình dạng ảnh động Các thông số hình dạng Các thông số hệ số bề mặt Dự đoán bù chuyển động Nhóm khối Yêu cầu chung lực phòng thử nghiệm hiệu chuẩn Tiêu chuẩn viễn thông - thuộc tổ chức viễn thông quốc tế Dự đoán mã bù Tái thiết mã bù Tiêu chuẩn để mã hóa chung cho hình ảnh chuyển động thông tin âm liên quan Chuẩn nén hình ảnh âm bit-rate thấp Mã hóa tổng hợp lai tự nhiên Bù chuyển dịch khối xếp chồng Moving Picture Experts Group Phase Synthetic Natural Hybrid Coding Over- lapped Block Motion Compensation The Residual Quantised DC Coefficient Hệ số DC dư Quarter Common Tntermediate Format Một phần tư độ phân giải đầy đủ (4CIF) Quantised DC Coefficient Reversible Variable Length Codes Very Low Bit Rate Video Variable-length codes Video Object Video Object Plane Typically complete video frames Hệ số DC Các mã độ dài biến đổi biến đổi Vieo có tốc độ bít thấp Thay đổi mã dài Mức video Mỗi thời gian lấy mẫu Khung hình video hoàn chỉnh Chương I 1.1 xuất cảnh 1: hình ảnh bạn (một mô hình 3D thực tế với xuất giọng nói bạn) qua giới ảo tinh vi dân cư avatar khác, quảng cáo sản phẩm video tường Trên hình video ảo tin tức phát từ kênh ưa thích bạn; bạn muốn để xem chi tiết tình hình tài hành bạn tương tác với chương trình phát sóng kéo lên số thị trường chứng khoán Trên hình khác bạn gọi lập liên kết hội nghị truyền hình với ba người bạn Các hình ảnh video người tham gia khác, gọn gàng phân đoạn từ họ nguồn gốc, trình bày lại thêm ảo cảnh 2: nhẫn vidphone 3G bạn; bạn lật nắp mở trả lời gọi Khuôn mặtbạn bạn xuất hình bạn chào Mỗi thấy hình ảnh nhỏ rõ ràng khác hình điện thoại, mà rõ ràng 'blockiness' lớn tuổi lại mô hình điện thoại video Sau gọi kết thúc, bạn gọi lên nguồn cấp liệu video trực tiếp từ trận đấu bóng đá Các chất lượng dòng bản, lãi suất lớn bạn chuyển đổi dễ dàng tới chất lượng cao (nhưng đắt hơn) 'cao cấp' dòng Trong phút chốc, tín hiệu vô tuyến bắt đầu để phá vỡ lên tất bạn ý chút, biến dạng tạm thời hình video Hai kịch minh họa cho tầm nhìn khác hệ đa phương tiện ứng dụng Việc tầm nhìn MPEG-4 Visual: phong phú, tương tác trực tuyến giới mang tổng hợp, tự nhiên, video, hình ảnh, 2D 'đối tượng' 3D Thứ hai tầm nhìn H.264 / AVC: truyền thông video hiệu đáng tin cậy, hỗ trợ hai chiều, "streaming" ứng dụng truyền hình mạnh mẽ để vấn đề truyền dẫn kênh Các hai tiêu chuẩn, có ưu điểm nhược điểm họ người ủng hộ họ nhà phê bình, ứng cử viên đua để cung cấp nén video cho truyền thông hệ ứng dụng Bật tivi lướt qua hàng chục hàng trăm kênh kỹ thuật số Play phim yêu thích máy nghe nhạc DVD thở phào nhẹ nhõm mà bạn ném bạn băng VHS cũ Điều chỉnh chương trình phát sóng tin tức truyền hình nước web (vẫn postagestamp cửa sổ video lựa chọn tin cậy luồng video phát triển tất thời gian) Chat với bạn bè gia đình PC videophone Những hoạt động trở thành thường không đáng kể, chứng minh video kỹ thuật số đường trở thành phổ biến thành phần thiết yếu giải trí, máy tính, phát truyền hình thông tin liên lạc ngành công nghiệp Phổ biến, liền mạch, chất lượng cao video kỹ thuật số mục tiêu công ty, nhà nghiên cứu quan tiêu chuẩn hai thập kỷ qua Trong số khu vực (ví dụ phát sóng truyền hình người tiêu dùng lưu trữ video), video kỹ thuật số rõ ràng bị bắt thị trường, người khác (hội nghị truyền hình, email, video di động), thị trường thành công có lẽ sớm để phán xét Tuy nhiên, nghi ngờ video kỹ thuật số ngành công nghiệp quan trọng toàn cầu mà tiếp tục lan rộng doanh nghiệp, mạng nhà cửa Sự phát triển liên tục ngành công nghiệp video kỹ thuật số thúc đẩy lực lượng thương mại kỹ thuật Các thương mại ổ xuất phát từ tiềm doanh thu khổng lồ việc thuyết phục người tiêu dùng doanh nghiệp (a) đến thay công nghệ analog kỹ thuật số công nghệ cũ với mới, hiệu quả, chất lượng cao sản phẩm video kỹ thuật số (b) để thông qua sản phẩm truyền thông giải trí thực việc di chuyển đến video kỹ thuật số Các lái xe kỹ thuật đến từ tiếp tục cải thiện hiệu suất xử lý, sẵn có dung lượng lưu trữ cao chế truyền dẫn nghiên cứu phát triển video xử lý ảnh công nghệ Bắt video kỹ thuật số từ nguồn ( máy ảnh hay clip lưu trữ ) đến đích ( hình hiển thị ) liên quan đến chuỗi thành phần quy trình Chìa khóa cho chuỗi trình nén ( mã hóa) giải nén (giải mã), băng thông ' thô' video kỹ thuật số giảm đến kích thước quản lý để truyền lưu trữ , sau xây dựng lại cho hình hiển thị Bắt nén giải nén trình "đúng" đưa ý nghĩa cạnh kỹ thuật thương mại cho sản phẩm , cách cung cấp chất lượng hình ảnh tốt , độ tin cậy lớn / linh hoạt so với giải pháp cạnh tranh Do có quan tâm tiếp tục phát triển cải tiến nén video phương pháp giải nén hệ thống Các bên liên quan bao gồm giải trí , truyền thông phát truyền hình công ty , nhà phát triển phần mềm phần cứng , nhà nghiên cứu người nắm giữ khả sinh lời sáng chế thuật toán nén Những thành công ban đầu ngành công nghiệp video kỹ thuật số (đặc biệt phát sóng truyền hình kỹ thuật số DVD-Video) củng cố tiêu chuẩn quốc tế ISO / IEC [1] 13.818, phổ biến gọi 'MPEG-2 "(sau nhóm làm việc phát triển tiêu chuẩn, Ảnh Di chuyển Experts Group) Dự đoán nhu cầu cho công cụ nén tốt dẫn đến phát triển hai tiêu chuẩn khác cho nén video, biết đến ISO / IEC 14.496 Part ('MPEG-4 Visual) [2] ITU-T Recommendation H.264 / ISO / IEC 14.496 Part 10 ('H.264') [3] Video dạng MPEG-4 Visual H.264 chia sẻ tổ tiên số tính phổ biến (cả hai vẽ kiểm chứng kỹ thuật từ tiêu chuẩn trước đó) có thị kiến đáng ý khác nhau, tìm cách cải tiến chuẩn cũ theo cách khác Tầm nhìn MPEG-4 Visual để di chuyển từ phụ thuộc chặt chẽ vào hình ảnh video hình chữ nhật cung cấp mở, linh hoạt khuôn khổ cho truyền thông trực quan có sử dụng tính tốt nén video hiệu hướng đối tượng chế biến Ngược lại, H.264 có tầm nhìn thực tế hơn, nhằm làm tiêu chuẩn trước (cung cấp chế cho việc nén video hình chữ nhật hình ảnh) để làm điều cách hiệu hơn, mạnh mẽ thiết thực, hỗ trợ loại ứng dụng trở nên phổ biến thị trường (chẳng hạn phát sóng, lưu trữ streaming) Tại thời điểm có tranh luận sôi ( hai ) tiêu chuẩn đến thống trị thị trường MPEG - Visual trưởng thành hai tiêu chuẩn ( xuất vào năm 1999 , H.264 trở thành quốc tế Trực quan hiệu suất nén tính linh hoạt rắc rối, tiêu chuẩn cũ Tình hình cấp giấy phép liên quan đến video MPEG- Visual rõ ràng (và không phổ biến với số phận ngành công nghiệp ) chi phí cấp giấy phép H.264 phải đồng ý Cuốn sách hai tiêu chuẩn quan trọng xem xét với tiêu chuẩn , khái niệm cốt lõi chi tiết kỹ thuật tiêu chuẩn yếu tố xác định trả lời cho câu hỏi ' MPEG - Visual H.264? ' 1.2 Nén Video 10 Lập lại trật tự Các hệ số băng AC quét xếp lại theo hai cách: Các sóng mang băng thấp mã hoá đầu tiên, song 'con' băng cao hơn, Điều cho phép EZW mã hóa (xem bên dưới) để khai thác tương quan sóng mang hệ số Việc ba sóng mang mã hóa tập hợp hệ số thể hình 5.69 DC 2nd tree Hình 5.69 Quét sơ đồ 1st band 2nd band D C 76 3rd band Hình 5.70 dải tần số quét Quét dải theo thứ tự Tất Các hệ số chuỗi AC băng mã hoá, tất hệ số băng tiếp theo, (Hình 5.70) Phương pháp quét có xu hướng giảm hiệu suất mã hóa có lợi mà hỗ trợ hình thức khả mở rộng không gian từ giải mã trích xuất hình ảnh giảm độ phân giải cách giải mã số hạn chế băng Mã hóa DC băng Các hệ số băng DC mã hóa cách sử dụng DPCM Mỗi hệ số dự đoán từ không gian lân cận, trước mã hóa Bảng 5.9 Zero- ký hiệu mã hóa Ký hiệu ZeroTree Root (ZTR) ý nghĩa Các cient coef fi tất cients coef fi (hoặc dải) zero Không có liệu mã hoá cho Value + ZeroTree Root (VZTR) Các hệ số khác không tất cients fi coef (VZTR) không Không có liệu mã hoá cho Value (VAL) Isolated Zero (IZ) Các hệ số khác không nhiều cients coef fi khác không Thêm liệu phải mã hoá Các hệ số số không, nhiều cients fi coef khác không Thêm liệu phải mã hoá Mã hóa AC băng Mã hóa hệ số băng AC dựa EZW (Embedded Zerotree Wavelet mã hóa) Các hệ số (hoặc băng quét dải sử dụng) mã hóa bắt đầu với hệ số ('gốc’ quét để sử dụng) hệ số mã hoá bốn biểu tượng liệt kê Bảng 5.9 Mã hóa entropy Các ký hiệu sản xuất trình mã hóa băng DC AC entropy mã hóa cách sử dụng mã hóa số học dựa bối cảnh Mã hóa số học mô tả Chương nguyên tắc dựa bối cảnh số học mã hóa thảo luận phần 5.4.1 Chương 77 5.6.1 Kết cấu mã hóa liên kết Phần kết cấu mã hóa liên kết chứa đối tượng mà chứa công cụ mã hóa liên kết Công cụ hỗ trợ trình mã hóa mô tả phần trước, cho video gular rectan- đối tượng Bằng cách chọn chế độ quét phương pháp để đạt số loại mã hóa khả mở rộng (a) Dạng đơn, quét lệnh: khả mở rộng (b) Dải quét: khả mở rộng không gian (bằng cách giải mã tập hợp ban nhạc) (c) Dạng Bilevel: khả mở rộng bitplane dựa trên, tương tự FGS (d) Dạng đa cấp: 'chất lượng' khả mở rộng, với lớp cho dạng 5.6.2 Kết cấu mã hóa liên kết nâng cao Việc nâng cao phần mã hóa liên kết chứa đối tượng nâng cao cần có thêm công cụ bổ sung để kết cấu lien kết Sóng mang cho phép hình ảnh chia thành nhiều không chồng lấn sub-hình ảnh hay 'nút', mã hóa cách sử dụng trình kết cấu mã hóa sóng mô tả Công cụ đặc biệt hữu ích cho mã với nhớ hạn chế, kể từ biến đổi sóng bước chế biến khác áp dụng cho tập hợp hình ảnh thời điểm Hình dạng công cụ mã hóa thêm khả đối tượng dựa vào trình mã hóa kết cấu cách thích ứng DWT để đối phó với đối tượng cấu hình tùy ý Sử dụng lỗi công cụ phục hồi, kết cấu mã hóa phân chia thành gói ('gói kết cấu') Bitstream xử lý kết cấu Units (TUS), có băng DC, cấu trúc mã hóa đầy đủ (cây để quét) băng mã hóa đầy đủ (quét toàn dải) Một gói kết cấu chứa nhiều mã Tus Cách tiếp cận nâng cao giúp giảm thiểu tác động lỗi truyền khoanh vùng để giải mã TU 5.7 MÃ HÓA ÂM THANH- CHẤT LƯỢNG HÌNH ẢNH Trước phát sóng video kỹ thuật số cho người sử dụng cần mã hóa (hoặc chuyển mã) liệu sang định dạng nén Để tối đa hóa chất lượng video chuyển giao cho người tiêu dùng quan trọng để trì chất lượng cao thời gian chụp, chỉnh sửa phân phối hãng phim Các âm gốc phần âm MPEG-4 Visual thiết kế để hỗ trợ mã hóa video với chất lượng cao cho môi trường tập âm Những cân nhắc quan trọng bao gồm việc trì chất lượng âm cao (với gần không tổn hao hay không tổn hao mã hóa), hỗ trợ 4: 4: 4: 2: độ sâu màu sắc dễ dàng chuyển mã (chuyển đổi) đến / từ định dạng di sản MPEG-2 5.7.1 Phần âm nén Các đối tượng âm nén thiết kế để sử dụng việc chụp ảnh, lưu trữ chỉnh sửa video chất lượng cao Nó hỗ trợ I-VOPs (tức dự đoán thời gian) trình mã hóa thay đổi số cách 78 Định dạng nguồn: Âm nén hỗ trợ mã hóa video lấy mẫu 4: 2: 0, 4: 2: 4: 4: định dạng YCbCr (xem chương để biết chi tiết chế độ lấy mẫu) với tiến Y Y Cb Cb Cr Cr 4:4:4 Cấu trúc macroblock (12 block) Hình 5.72 Sự thay đổi cấu trúc macrobock(4:2:2 4:4:4 video) 04 23 98 75 e t c Hình 5.73 Ví dụ cấu trúc dải quét đan xen Các thay đổi cấu trúc khối mẫu cho 4: 2: 4: 4: video thể hình 5.72 Phép biến đổi lượng tử hóa: Độ xác DCT IDCT mở rộng ba bit fractional Cùng với biến đổi tích cực trình lượng tử nghịch đảo, điều cho phép không tổn hao mã DCT-dựa vào điều chế giải điều chế Trong số trường hợp, không tổn hao DCT mã hóa liệu nội dẫn đến khung mã hóa có nghĩa lớn so với ban đầu lý này, mã hóa tùy chọn sử dụng DPCM liệu mã khung thay DCT (xem Chương 3) Hình dạng mã hóa: thông tin hình dạng nhị phân mã hóa cách sử dụng PCM số học mã hóa (để đơn giản hóa trình mã hóa giải mã) Alpha (màu xám) hình dạng mã hóa với độ phân giải hạn gia hạn đến 12 bit Khoảng liệu: liệu mã hoá xếp khoảng cách tương tự MPEG-2 mã hóa video [7] Mỗi khoảng bao gồm mã bắt đầu loạt macroblocks mã hoá lát xếp theo thứ raster để trang trải hình ảnh mã hóa (xem ví dụ Hình 5.73) 79 Cấu trúc áp dụng để đơn giản hóa việc chuyển mã sang / từ đại diện mã hóa MPEG-2 Tiêu đề VOL: D liệu thêm vào đầu VOL, bắt chước người đầu hình ảnh MPEG-2 để đơn giản hóa MPEG-2 chuyển mã Hình 5.74 Công cụ mô hình 5.7.2 Các file âm gốc Các file âm gốc thiết kế để phân phối âm thanh-chất lượng hình ảnh (ví dụ sản xuất chuyển dổi âm thanh) thêm hỗ trợ cho định dạng P-VOPs đến công cụ âm rút gọn Định dạng mã hóa thay đổi cách thêm thông số kiểm soát mà bắt chước chặt chẽ thuộc tính máy quay video "thực sự", chẳng hạn biến dạng ống kính Bồi thường chuyển động phân mo-tion vector mã hóa P-VOPs thây dổi cho khả tương thích với cú pháp MPEG-2, ví dụ, vector chuyển động mã hóa cách sử dụng phương pháp MPEG-2 MPEG-4 phương pháp dự đoán trung bình thông thường 5.8 MÃ HÓA TRƯỜNG HÌNH ẢNH TỔNG HỢP lần kinh tiêu chuẩn quốc tế, MPEG4 giới thiệu khái niệm đối tượng hình tổng hợp tự nhiên 'lai' cho truyền thông hình ảnh Theo quan điểm này, số ứng dụng Bene từ cách sử dụng kết hợp công cụ từ cộng đồng mã hóa video (được thiết kế để mã hóa giới thực hay liệu video "tự nhiên") công cụ cộng đồng / 3D hoạt hình 2D (được thiết kế để render " tổng hợp 'hoặc máy tính tạo cảnh giác) MPEG4 trực quan bao gồm số công cụ đối tượng sử dụng kết hợp hình ảnh động video chế biến tự nhiên (Hình 5.74) Các loại đối tượng kết cấu ảnh động ảnh động 2D Lưới hỗ trợ mã hóa mắt lưới 2D mà đại diện cho hình dạng chuyển động, với kết cấu ánh xạ lên lưới Một công cụ để biểu diễn mã hóa mô hình lưới 3D bao gồm MPEG-4 hình ảnh phiên chưa phải phần phần M hình dạng ảnh động cho mặt / thể người mô hình hóa mã hóa [8] 80 Nó chứng minh công cụ hoạt hình dựa ứng dụng có tiềm thấp video mã hóa tốc độ bit [9] Tuy nhiên, thực tế, ứng dụng công cụ mã hóa tổng hợp (máy tính tạo ra) vật liệu Do trọng tâm sách video tự nhiên mã hóa, công cụ không đề cập chi tiết 5.8.1 Lưới mã hóa 2D 3D Một lưới 2D tạo thành từ vá lỗi tam giác bao gồm mặt phẳng 2D hình ảnh VO Hình triển chuyển động VOPs mô hình hóa cong vênh vá lỗi tam giác Một mô hình lưới 3D đối tượng tập hợp đa giác không gian 3D (bao gồm thông tin chi tiết) Các kết cấu bề mặt lưới 2D 3D nén dạng hình ảnh kết cấu tĩnh (bằng cách sử dụng DWT) chiếu lên lưới giải mã Những công cụ có số ứng dụng bao gồm mã hóa đại diện cho tổng hợp (máy tính tạo ra) "tự nhiên" 2D đối tượng 3D cảnh đặc biệt hữu ích cho ứng dụng kết hợp hình ảnh tự nhiên máy tính tạo (Synthetic lai tự nhiên Coding, SNHC) Có thể sử dụng mã hóa lưới dựa cho nén đối tượng hình tự nhiên Ví dụ, mạng lưới đồ kết cấu tĩnh truyền cho khung lựa chọn Không có kết cấu truyền cho khung hình trung gian, thay thông số lưới truyền giải mã dựng lại khung hình trung gian hiệu ứng động (biến dạng) lưới kết cấu bề mặt Đây loại hình biểu diễn có tính linh hoạt fl nhiều mô hình chuyển động dựa khối, kể từ mắt lưới thích ứng với biến dạng phi tuyến chuyển động khung hình Tại thời điểm tại, nhiên, tự động theo dõi thông số lưới tốn phức tạp cho ứng dụng nén video thực tế Cấu trúc ảnh động bao gồm định dạng nhị phân, cấu trúc liên kết 2D lưới ảnh 2D công cụ hỗ trợ mã hóa mắt lưới 2D (với cấu trúc liên kết thống nhất) đồ kết cấu tùy tiện hình Lưới ảnh động 2D loại đối tượng siêu cấu trúc ảnh động thêm Delaunay lưới topology (một phương pháp linh hoạt lưới tam giác) phần video gốc mã hóa công cụ phép kết hợp linh hoạt mắt lưới hình động video 5.8.2 Mặt hình dạng ảnh động Chuẩn MPEG-4 bao gồm định dạng hỗ trợ cho mặt thể người mẫu hoạt hình hình động mặt đơn giản đơn giản FBA (mặt hình dạng ảnh động) loại đối tượng thị giác Phương pháp để đối mặt / hoạt hình thể bao gồm: (a) xác định hình dạng hình học thể mô hình khuôn mặt (thường thực lần vào lúc bắt đầu phiên) (b) việc gửi thông số hình ảnh động để làm sinh động mô hình thể / mặt Một mô hình khuôn mặt mô tả định nghĩa thông số (FDPs) sử dụng thông số hình động (FAPs) Các thiết lập mặc định FDPs sử dụng để vẽ khuôn mặt 'chung' giải mã tùy chỉnh thiết lập FDPs truyền để tạo mô hình bề mặt Sau mô hình có sẵn giải mã, hoạt động cách truyền FAPs 81 Theo cách tương tự, đối tượng thể kết xuất từ tập hợp dạng định nghĩa thông số (BDPs) hình sử dụng thông số hình động (BAPs) Điều cho phép thể mô hình hình dạng khác nhau, từ thể tổng hợp chung vào hình dạng với hình Ứng dụng cho mặt hình động thể bao gồm hệ cảnh ảo hay giới chứa khuôn mặt / thể tổng hợp đối tượng, mã hóa dựa mô hình khuôn mặt tự nhiên thể cảnh, khuôn mặt / thể chuyển động phân tích, truyền tập hợp BAPs / FAPs tổng hợp giải mã Cho đến nay, phương pháp không sử dụng rộng rãi cho video mã hóa 5.9 KẾT LUẬN Chuẩn MPEG-4 chuẩn hỗ trợ mã hóa đại diện đối tượng trực quan với nén phi tuyến nén hữu tuyến Các tập hợp đa dạng công cụ mô tả tiêu chuẩn mã hóa có khả hỗ trợ loạt ứng dụng ef mã hóa fi cient khung hình video, mã hóa video cho mạng truyền dẫn không đáng tin cậy, mã hóa dựa đối tượng thao tác, mã hóa tổng hợp sợi 'lai' tổng hợp / cảnh quan thiên nhiên ứng dụng tương tác trực quan Các tiêu chuẩn MPEG-4 tiếp tục phát triển với việc bổ sung công cụ (ví dụ, phần để hỗ trợ xếp hình ảnh) Tuy nhiên, số nhà phát triển nhà sản xuất, yếu tố phổ biến chuẩn MPEG-4 đến phần công cụ đơn giản nâng cao có yêu cầu ngành công nghiệp rõ ràng cho mã hóa khung hình video hình chữ nhật Yêu cầu này, với khoảng thời gian kéo dài không chắn chuẩn MPEG-4 vấn đề cấp phép (xem chương 8) sáng chế, có nghĩa tiêu chuẩn H.264 phát triển có dấu hiệu vượt chuẩn MPEG-4 thị trường Các chương kiểm tra H.264 chi tiết 5.10 TÀI LIỆU THAM KHẢO ISO/IEC 14496-2, Amendment 1, Information technology – coding of audio-visual objects – Part 2: Visual, 2001 ISO/IEC 14496-1, Information technology – coding of audio-visual objects – Part 1: Systems, 2001 Y Wang, S Wenger, J Wen and A Katsaggelos, Review of error resilient coding techniques for realtime video communications, IEEE Signal Process Mag., July 2000 N Brady, MPEG-4 standardized methods for the compression of arbitrarily shaped video objects, IEEE Trans Circuits Syst Video Technol., pp 1170–1189, 1999 W Li, Overview of Fine Granular Scalability in MPEG-4 Video standard, IEEE Trans Circuits Syst Video Technol., 11(3), March 2001 I Daubechies, The wavelet transform, time-frequency localization and signal analysis, IEEE Trans Inf Theory 36, pp 961–1005, 1990 ISO/IEC 13818, Information technology: generic coding of moving pictures and associated audio information, 1995 (MPEG-2) I Pandzic and R Forchheimer, MPEG-4 Facial Animation, John Wiley & Sons, August 2002 P Eisert, T Wiegand, and B Girod, Model-aided coding: a new approach to incorporate facial animation into motion-compensated video coding, IEEE Trans Circuits Syst Video Technol., 10(3), pp 344–358, April 2000 82 83 Chương VIII: Các ứng dụng định hướng 8.1 Giới thiệu Ngoài tính kỹ thuật hiệu suất lý thuyết , có nhiều khác quan trọng cân nhắc để đưa vào tài khoản lựa chọn CODEC cho ứng dụng thực tế bao gồm hỗ trợ ngành công nghiệp cho CODEC ( ví dụ , cho dù có nhiều nguồn cho công nghệ ) , tính sẵn có công cụ phát triển chi phí ( bao gồm phát triển , hội nhập chi phí cấp giấy phép) Trong chương này, thảo luận yêu cầu lựa chọn ứng dụng xem xét vấn đề thực tiễn thatmayaffect lựa chọn ofCODEC.We liệt kê số có sẵn thương mại MPEG Visual H.264 codec báo cáo việc thực tuyên bố CODEC ( có ) Chúng xem xét cân nhắc thương mại quan trọng ( bao gồm chủ đề tranh cãi việc cấp phép sáng chế) kết thúc cách làm cho số dự đoán shortand phát triển lâu dài việc nghiên cứu CODEC tiêu chuẩn hóa 8.2 Ứng dụng Bảng 8.1 liệt kê ứng dụng cho công nghệ video mã hóa với quan trọng yêu cầu cho ứng dụng đề nghị MPEG-4 Visual H.264 Profiles Không số ứng dụng liệt kê Bảng 8.1 đòi hỏi công cụ mã hóa dựa đối tượng Như rõ ràng từ danh sách codec bán sẵn mục 8.4 dựa đối tượng mã hóa hỗ trợ rộng rãi thị trường ít, có, 'thực tế' ứng dụng thương mại objectbased mã hóa lên từ việc phát hành MPEG-4 Visual Các giai thoại sau có lẽ điển hình tình hình quan mã hóa, mà mô tả đối tượng dựa "một công nghệ tìm kiếm ứng dụng ' Một số công việc đầy hứa hẹn 'ký kín' trình bày hội thảo gần thị giác thông tin liên lạc cho người điếc ('Im lặng Progress ", tổ chức Đại học Bristol, tháng năm 2003) Ký kết liên quan đến việc đóng cửa truyền kênh riêng biệt phần ghép kênh truyền hình kỹ thuật số, kết hợp thông dịch viên ngôn ngữ ký hiệu người dịch nội dung kênh Các công cụ mã hóa đối tượng dựa MPEG-4 sử dụng để mã người ký đối tượng video,làm cho để chồng lên số người ký hình chương trình truyền hình Tuy nhiên , ý kiến phản hồi từ người dùng khiếm thính hội thảo chồng số tập trung khó theo dõi người sử dụng nhiều ưa thích để xem người ký riêng biệt ( hình chữ nhật ) cửa sổ hình Đó kết luận biểu tình thành tựu kỹ thuật thú vị không đặc biệt hữu ích cho nhóm người dùng mục tiêu 8.3 Nền Sự lựa chọn tảng thực cho video CODEC phụ thuộc vào số yếu tố bao gồm loại ứng dụng , hỗ trợ phát triển , hạn chế tiêu thụ điện , cần cho việc nâng cấp sản phẩm tương lai sẵn có chi phí codec thương mại cho tảng Bảng 8.2 so sánh số tảng thực phổ biến ( phần cứng chuyên dụng , Tín hiệu kỹ thuật số xử lý ' xử lý phương tiện truyền thông " , vi xử lý máy tính nhúng ) làm cho số nhận xét chung lợi tương đối họ bất lợi thảo luận sâu khả tảng tìm thấy tài liệu tham khảo [ ] 84 Tại thời điểm , phần mềm máy tính phần cứng chuyên dụng có lẽ widelyused tảng thực cho MPEG - Visual DSP tảng nhúng trở nên phổ biến cho ứng dụng video di động cân tốt sức mạnh họ hiệu , hiệu suất tính linh hoạt 8.4 Chọn CODE Chọn CODEC khó khăn , nhà cung cấp trình bày việc thực khả CODEC họ cách khác Các vấn đề cần xem xét bao gồm tính sẵn sàng điều khoản cấp phép, hỗ trợ cho Profiles yêu cầu trình độ, chất lượng chủ quan, nén hiệu suất, hiệu suất máy tính (ví dụ hướng dẫn cho thứ hai khung hình mã thứ hai), phù hợp cho tảng mục tiêu chọn (ví dụ cho dù tối ưu hóa cho tảng cụ thể) giao diện (API) cho CODEC Lý tưởng nhất, theCODECperformance nên đánh giá cách sử dụng vật liệu video nguồn mà đại diện ứng dụng mục tiêu (chứ là, sử dụng trình tự 'chuẩn' test video) Bảng 8.3 liệt kê lựa chọn bán sẵn MPEG-4 codec Visual, dựa thông tin có sẵn từ nghiệp Diễn đàn trang web MPEG-4 (www.m4if.org) tháng ba 2003 Điều nghĩa danh sách đầy đủ MPEG-4 codec, cho ta hương vị phạm vi phần mềm phần cứng triển khai Điều đáng ý hầu hết thông tin bảng dựa tuyên bố nhà sản xuất không bảo đảm xác Phần lớn codec liệt kê xuất để nhắm mục tiêu vào tuyến lưu trữ ứng dụng Có nhiều phần mềm triển khai MPEG-4 Visual sẵn, dao động từ phần mềm tham khảo thức (đầy đủ tính đến từ thời gian thực) để tối ưu hóa cao chơi thời gian thực Triển khai phần cứng có xu hướng nhắm vào hiệu suất cao (ví dụ: mã hóa phát sóng chất lượng) công suất thấp (ví dụ điện thoại di động trực tuyến) ứng dụng Một số nhà sản xuất Mã nguồn cung cấp cho xử lý cụ thể tín hiệu số (DSP) xử lý nhúng hệ thống chip (SoC) module thích hợp để tích hợp vào thiết kế phần cứng lớn thực Array Dòng Programmable Gate (FPGA) Hồ sơ cá nhân phổ biến hỗ trợ Simple Profile, đơn giản nâng cao Hồ sơ (cung cấp hiệu suất mã hóa hiệu nó) Hai công ty danh sách (Dicas Prodys) cung cấp giải pháp lõi sơ hai người này, Dicas 'CODEC hỗ trợ công cụ hình dạng nhị phân Core hồ sơ Đáng ý, cấu hình khác MPEG-4 Visual hỗ trợ codec Danh sách codec H.264 thương mại (Bảng 8.4) ngắn chi tiết số codec hạn chế Đây đáng ngạc nhiên thời điểm công bố H.264 phát hành Khuyến nghị toàn / Tiêu chuẩn Quốc tế Sớm chấp (chẳng hạn người liệt kê đây) có nguy phải thay đổi thiết kế họ để thích cuối sửa đổi tiêu chuẩn có tiềm để nắm bắt thị phần sớm Trường hợp thông tin có sẵn, Main hồ sơ phổ biến số triển khai thực sớm, hỗ trợ cho video interlaced hiệu video-độ trễ cao (thông qua việc sử dụng B-lát) Điều ngụ ý ứng dụng mục tiêu ban đầu cho H.264 phát sóng chất lượng xem trực tiếp lưu trữ video, thay công nghệ có ' cao cấp ' ứng dụng truyền hình phát sóng lưu trữ video 8.5 Những vấn đề thương mại 85 Đối với nhà phát triển sản phẩm truyền thông video, có số thương mại quan trọng vấn đề cần phải đưa vào tài khoản , thêm vào tính kỹ thuật hiệu suất vấn đề thảo luận Chương 5, 8.5.1 Tiêu chuẩn mở? MPEG - H.264 ' mở' tiêu chuẩn quốc tế , tức cá nhân tổ chức mua hồ sơ tiêu chuẩn từ ISO / IEC ITU - T Điều có nghĩa tiêu chuẩn có tiềm để kích thích phát triển giải pháp cạnh tranh sáng tạo phù hợp để mở thông số kỹ thuật Các tài liệu xác định xác cần thiết cho phù hợp, làm cho cho để phát triển mã hóa phù hợp giải mã Cùng lúc, có phạm vi cho nhà phát triển để tối ưu hóa mã hóa / giải mã , ví dụ để cung cấp nâng cao chất lượng hình ảnh hay để tận dụng tốt tảng thực cụ thể Tuy nhiên có số yếu tố làm việc chống lại cởi mở rõ ràng Các công ty tổ chức chuyên gia nhóm có tiềm ảnh hưởng đến việc tiêu chuẩn hóa trình ( trường hợp MPEG) có quyền truy cập đến tài liệu ( chẳng hạn phiên dự thảo tiêu chuẩn ) cung cấp cho họ dẫn thị trường đáng kể Các tiêu chuẩn không dễ dàng tiếp cận chuyên gia không điều làm cho đường cong học tập dốc cho người đến lĩnh vực Cuối , có hàng chục ngàn sáng chế liên quan đến hình ảnh video mã hóa nókhông xem thực tiêu chuẩn mà khả xâm phạm quyền sáng chế Trong trường hợp MPEG - Visual ( có lẽ mở rộng Profiles H.264 ) , điều có nghĩa thực thương mại tiêu chuẩn chủ đề cấp phép cho khoản toán lệ phí ( xem bên ) 8.5.2 Cấp phép MPEG-4 Visual H.264 Bất kỳ việc thực MPEG-4 Visual rơi vào phạm vi số 'thiết yếu' sáng chế Cấp giấy phép quyền sáng chế điều phối MPEG LA [1], thể đại diện cho quyền lợi chủ sở hữu sáng chế lớn phần MPEG ISO / IEC Thực thương mại sử dụng MPEG-4 Visual chịu toán tiền quyền(thông qua MPEG LA) cho 20 tổ chức giữ sáng chế Các khoản toán nhuận bút tính tuỳ theo tính chất sử dụng theo số lượng mã hóa, giải mã, thuê bao / phát mã hóa video Những người trích kế hoạch cấp phép cho chi phí ức chế cất lên MPEG-4 ngành công nghiệp người ủng hộ cho helpfully làm rõ tình hình sở hữu trí tuệ phức tạp đảm bảo "chi phí ẩn 'để người thực H.264 / MPEG-4 Part 10 đối tượng số sáng chế thiết yếu Tuy nhiên, để để làm cho newstandard truy cập tốt, JVT cố gắng để làm cho đường sở hồ sơ (xem chương 6) 'hoàng gia miễn phí' Trong trình tiêu chuẩn hóa, chủ sở hữu sáng chế quan trọng khuyến khích thông báo JVT tuyên bố sáng chế họ để nêu rõ liệu họ cho phép khoản tiền quyền miễn phí cho sáng chế (s) Những báo cáo sáng chế đưa vào tài khoản phát triển Profiles với mục đích việc giữ miễn phí hoàngcác khoản toán Khi trình tự nguyện dựa việc xác định xác tất liên quan sáng chế trước tiêu chuẩn hóa, chưa rõ ràng cho dù mục tiêu quyền miễn phí hồ sơ thực ban đầu positive1 Thực sử dụng Profiles Extended (xem chương 6) phải chịu khoản toán tiền quyền cho chủ sở hữu sáng chế 8.5.3 Nắm bắt thị trường 86 Xác định công nghệ tiêu chuẩn quốc tế không đảm bảo thương mại thành công thị trường Các ứng dụng mục tiêu ban đầu MPEG - , video CD , thành công , tiêu chuẩn sử dụng rộng rãi cho việc lưu trữ đoạn video mã hóa ứng dụng dựa PC trang web MPEG - rõ ràng thành công toàn giới ứng dụng để phát sóng truyền hình kỹ thuật số lưu trữ DVD -Video Phiên MPEG - Visual xuất vào năm 1999, không rõ liệu trở thành thị trường công nghệ hàng đầu cho video mã hóa Quá trình chậm đồng ý điều khoản cấp phép ( không hoàn thành ba năm sau công bố tiêu chuẩn) chất điều khoản khiến số nhà bình luận dự đoán MPEG-4 Visual không 'bắt' thị trường ứng dụng mục tiêu Đồng thời, thừa nhận rộng rãi có yêu cầu để tìm kế công nghệ phổ biến (nhưng cũ) MPEG-2 Một số nhà phát triển lựa chọn cho H.264 bỏ qua MPEG-4 Visual hoàn toàn bất chấp lợi rõ ràng hiệu (xem Chương 7), H.264 chưa trưởng thành hai tiêu chuẩn Có tục tranh luận việc liệu codec độc quyền (ví dụ, Microsoft'sWindows Media Player [3]) cung cấp giải pháp tốt so với tiêu chuẩn Nhà phát triển codec độc quyền không bị ràng buộc quy trình tiêu chuẩn chặt chẽ quy định (cho là) nâng cấp công nghệ họ đáp ứng yêu cầu công nghiệp nhanh so với nhà cung cấp dựa chuẩn Tuy nhiên, phụ thuộc vào nhà cung cấp (hoặc người cấp phép đơn) xem số bất lợi đáng kể giải pháp độc quyền 8.6 Hướng tương lai Đoán phát triển thương mại kỹ thuật tương lai ứng dụng đa phương tiện tiếng khoa học không xác Ví dụ, hội nghị truyền hình (bây công nghệ trưởng hầu hết tiêu chuẩn) chưa rộng rãi thông qua dự đoán; nhiều công cụ sáng tạo giới thiệu với MPEG-4 Visual tiêu chuẩn năm năm trước chưa thực Tác động thương mại Tuy nhiên, số dự đoán phát triển ngắn hạn, trung dài hạn công nghệ mô tả sách trình bày (nhiều số chứng minh không xác thời điểm sách công bố!) Trong ngắn hạn, công bố Khuyến nghị H.264 / MPEG-4 Part 10 có khả theo sau việc sửa đổi (s) để sửa chữa thiếu sót không xác Một số liên tục sáng kiến nhằm mục đích chuẩn hóa vận chuyển xa lưu trữ MPEG-4 H.264 mã hóa Video liệu (ví dụ, tập tin lưu trữ đĩa quang giao thông vận tải mạng IP) Tiếp theo mở rộng (và cho có hại) chậm trễ việc đồng ý điều khoản cấp phép cho MPEG-4 Visual, người ta hy vọng điều khoản cho H.264 hoàn tất thời gian ngắn sau công bố tiêu chuẩn (hy vọng có xác nhận tình trạng quyền miễn phí hồ sơ bản) Việc liên tục tranh luận mà tiêu chuẩn hành công nghệ mã hóa độc quyền tốt ' giải tương lai gần Các ứng cử viên xuất MPEG-4 Visual, H.264 Microsoft độc quyền Windows Media ('Corona') định dạng [3] Trong trung hạn, mong đợi để xem Profiles cho H.264 thêm hỗ trợ cho ứng dụng (ví dụ, Studio / Digital Cinema mã hóa) cải thiện hiệu suất mã hóa (có thể chi phí yêu cầu chế biến tăng) Ví dụ, có gọi cho đề xuất để mở rộng mẫu sâu hỗ trợ tiêu chuẩn để hơn tám bit điểm ảnh bao gồm hỗ trợ cho chất lượng crom cao (4: 2: 4: 4: 4) [4] Thật khó để xem MPEG-4 Visual phát triển nhiều nữa, mà hiệu H.264 có sẵn Các 'chiến thắng' 87 tranh luận công nghệ mã hóa bắt đầu để thay MPEG-2 H.263 ứng dụng truyền hình, nhà video, hội nghị truyền hình video streaming Một số dịch vụ video di động từ đầu dựa MPEG-4 Visual dịch vụ trở nên phổ biến, H.264 trở thành ưa chuộng công nghệ hiệu suất tốt tốc độ bit thấp Áp dụng rộng rãi điện thoại di động video có khả dẫn đến, ứng dụng dịch vụ sáng tạo người dùng bắt đầu để tham giavới công nghệ thích ứng với cho phù hợp với lối sống họ Hiệu suất tiếp tục cải thiện thuật toán trước không thực tế trở nên khả thi ứng dụng thương mại Mã hóa nghiên cứu video tiếp tục hoạt động tích cực có số phương pháp tiếp cận đầy hứa hẹn mà cuối thay lâu dài DPCM / DCT mã hóa mô hình Chúng bao gồm (trong số người khác) dựa mô hình, lưới dựa wavelet dựa nén video Có lập luận cho mô hình DPCM / DCT có 15 năm liên tục phát triển gần giới hạn hiệu nó, kỹ thuật khác cung cấp khả hiệu suất tiềm lớn (tuy nhiên, lập luận lưu hành số năm DPCM / DCT chưa chết!) Có thể số chi tiết tính bí truyền MPEG-4Visual (ví dụ dựa đối tượng lưới dựa mã hóa) tái xuất tiêu chuẩn tương lai với cải tiến công nghệ mã hóa Có thể nói công cụ trước thời đại có nhiều hội thành công thương mại nhu cầu ứng dụng thực trở nên rõ ràng 8.7 Kết luận Năm nỗ lực hàng trăm nhà nghiên cứu phát triển dẫn đến tiêu chuẩn hóa MPEG-4 Visual H.264 / MPEG-4 Part 10 / AVC Những tiêu chuẩn ấn tượng thành tựu, người theo cách khác MPEG-4 Visual thông qua trí tưởng tượng nhìn xa trông rộng phương pháp tiếp cận để nén video nhiều tính công cụ có lẽ phía trước thời gian họ H.264 đưa cách tiếp cận tập trung thực dụng để giải vấn đề nhu cầu ứng dụng đa phương tiện lên Cuốn sách cố gắng giải thích nguyên tắc hai tiêu chuẩn đặt chúng bối cảnh mục tiêu nhóm tiêu chuẩn hóa thị trường thay đổi Câu trả lời cho câu hỏi nhiều, hỏi, 'là tiêu chuẩn tốt cho ứng dụng tôi', chưa rõ ràng, có dấu hiệu cho thấy H.264 trở thành nhà lãnh đạo kỹ thuật thúc đẩy hệ video kỹ thuật số ứng dụng Tuy nhiên, trước đặt cược danh tiếng hay chiến lược phát triển sản phẩm có khả kết "MPEG-4 so với H.264 'cuộc tranh luận, giá trị ghi nhớ tranh luận tương tự từ khứ xa xôi: VHS vs Betamax TÀI LIỆU THAM KHẢO 88 MPEG LA, http://www.mpegla.com Iain E G Richardson, ‘Video Codec Design’, John Wiley & Sons, 2002 Microsoft Windows Media Series, http://www.microsoft.com/windows/windowsmedia/ ISO/IEC JTC1/SC29/WG11 N5523, Call for Proposals for Extended Sample Bit Depth and Chroma Format Support in the Advanced Video Coding Standard, March 2003 ISO/IEC 14496-2, Coding of audio-visual objects – Part 2: Visual, 2001, Annex F S Sun, D Haynor and Y Kim, Semiautomatic video object segmentation using VSnakes, IEEE Trans Circuits Syst Video Technol., 13 (1), January 2003 C Kim and J-NHwang, Fast and automatic video object segmentation and tracking for contentbased applications, IEEE Trans Circuits Syst Video Technol., 12 (2), February 2002 J Kim and T Chen, A VLSI architecture for video-object segmentation, IEEE Trans Circuits Syst Video Technol., 13 (1), January 2003 H 264 reference model software version JM6.1b, http://bs.hhi.de/∼suehring/tml/, March 2003 G Sullivan and T Wiegand, Rate-distortion optimization for video compression, IEEE Signal Process Mag., November 1998 T Koga, K Iinuma et al., Motion compensated interframe coding for video conference, Proc NTC, November 1991 J R Jain and A K Jain, Displacement measurement and its application in interframe image coding, IEEE Trans Commun., 29, December 1981 M Ghanbari, The cross-search algorithm for motion estimation, IEEE Trans Commun., 38, July 1990 10 M Gallant, G Cˆot´e and F Kossentini, An efficient computation-constrained block-based motion estimation algorithm for lowbit rate video coding, IEEE Trans Image Processing, (12), December 1999 11 P Kuhn, G Diebel, S Hermann, A Keil, H Mooshofer, A Kaup, R Mayer and W Stechele, Complexity and PSNR-Comparison of Several Fast Motion Estimation Algorithms for MPEG-4, Proc Applications of Digital Image Processing XXI, San Diego, 21–24 July 1998; SPIE, 3460, pp 486–499 12 R Garg, C Chung, D Kim and Y Kim, Boundary macroblock padding in MPEG-4 video decoding using a graphics coprocessor, IEEE Trans Circuits Syst Video Technol., 12 (8), August 2002 13 H Chang, Y-C Chang, Y-CWang,W-M Chao and L-G Chen, VLSI Architecture design of MPEG-4 shape coding, IEEE Trans Circuits Syst Video Technol., 12 (9), September 2002 89 14 W-H Chen, C H Smith and S C Fralick, A fast computational algorithm for the discrete cosine transform, IEEE Trans Commun., COM-25(9), September 1977 15 I E G Richardson, Video Codec Design, Wiley, 2002 16 ISO / IEC 13.818 , Công nghệ thông tin - Generic Mã hóa ofMoving Hình Associated âm Thông tin , 2000 17 ISO/IEC 14496-2, Coding of Audio-Visual Objects – Part 2:Visual, 2001 18 ISO/IEC 14496-10 and ITU-T Rec H.264, Advanced Video Coding, 2003 19 F Pereira and T Ebrahimi (eds), The MPEG-4 Book, IMSC Press, 2002 20 A Walsh and M Bourges-S´evenier (eds), MPEG-4 Jump Start, Prentice-Hall, 2002 21 ISO/IEC JTC1/SC29/WG11 N4668, MPEG-4 Overview, http://www.m4if.org/resources/ Overview.pdf, March 90 [...]...Bitrate mạng tiếp tục tăng (đáng kể trong khu vực địa phương và một chút ít như vậy trong các khu vực rộng lớn hơn), kết nối bitrate cao để nhà là phổ biến và khả năng lưu trữ của đĩa cứng, bộ nhớ flash và phương tiện truyền thông quang học lớn hơn bao giờ hết Với giá mỗi truyền hoặc lưu trữ bit liên tục rơi xuống, nó có lẽ là không rõ ràng lý do tại sao ngay lập... dụng hiệu quả hơn các truyền tải và lưu trữ các tài nguyên Nếu một kênh truyền bitrate cao có sẵn, sau đó nó là một đề nghị hấp dẫn hơn gửi có độ phân giải cao nén video hoặc nhiều kênh video nén hơn gửi, độ phân giải thấp, dòng không nén duy nhất Ngay cả với những tiến bộ liên tục trong lưu trữ và công suất truyền tải, nén có thể sẽ là một thành phần thiết yếu của đa phương tiện dịch vụ trong nhiều... cụ' để mã hóa và thao tác các phương tiện truyền thông kỹ thuật số MPEG-4 Visual bao gồm một 'lõi' video mô hình bộ mã hóa / giải mã cùng với một số công cụ mã hóa bổ sung Các mô hình cốt lõi dựa trên DPCM lai nổi tiếng / DCT mô hình mã hóa (xem Chương 3) và các chức năng cơ bản của lõi được mở rộng bởi các công cụ hỗ trợ (trong số những thứ khác) hệ số nén tăng cường, truyền tải đáng tin cậy, mã hóa... Các MPEG-4 Visual chuẩn là phương pháp thay đổi tỷ lệ lượng tử hóa biến giá trị của bộ giải mã Thay đổi tỷ lệ được điều khiển bởi một tham số mô hình, QP, có thể mất giá trị 1-31 (giá trị lớn hơn của QP sản xuất một kích thước bước lớn hơn và do đó cao hơn nén và biến dạng) Hai phương pháp thay đổi tỷ lệ được mô tả trong tiêu chuẩn: "Phương pháp 2" (phương pháp cơ bản) và "phương pháp 1 '(hơn linh hoạt... tiêu chuẩn được so sánh và kiểm soát tỷ lệ (phù hợp với đầu ra bộ mã hóa để truyền hoặc lưu trữ cơ chế thực tế) và các vấn đề gặp phải trong vận chuyển và lưu trữ nén video được thảo luận Chương 8 xem xét các yêu cầu của một số ứng dụng, danh sách hiện tại và mới nổi một số codec hiện đang sẵn có và nền tảng thực hiện và thảo luận quan trọng tác động của các yếu tố thương mại như giấy phép bằng sáng... các tiêu chuẩn MPEG MPEG-4 (một tiêu chuẩn đa phần bao gồm mã hóa âm thanh, các vấn đề hệ thống và các khía cạnh liên quan của âm thanh / truyền thông hình ảnh) lần đầu tiên được hình thành vào năm 1993 và phần 2 đã được chuẩn hóa vào năm 1999 Các nỗ lực chuẩn H.264 được khởi xướng bởi Video Coding Experts Group (VCEG), một nhóm công tác của Liên minh Viễn thông quốc tế (ITU-T) mà hoạt động trong một... tiêu chuẩn và phương pháp tiếp cận của nó và các tính năng, các profile để mã hóa các khung hình video hình chữ nhật được thảo luận (Simple, Advanced Simple và nâng cao Real-Time Simple profiles) Đây là bởi đến nay phổ biến nhất profiles sử dụng tại thời điểm hiện tại và như vậy họ được bảo hiểm trong một số chi tiết Công cụ và profile để mã hóa các đối tượng tùy tiện hình được thảo luận tiếp theo... Không nằm trong chương này 5.2 TỔNG QUAN VỀ MPEG-4 VISUAL (Nén video tự nhiên) 5.2.1 Tính năng MPEG-4 Visual nỗ lực đáp ứng các yêu cầu của một loạt các ứng dụng truyền thông trực quan thông qua một cách tiếp cận bộ công cụ dựa trên mã hóa thông tin thị giác Một số tính năng quan trọng mà phân biệt MPEG-4 Visual từ tiêu chuẩn mã hóa hình ảnh trước đó bao gồm: • Nén tối ưu theo trình tự và liên kết 'tự... truyền có hiệu quả trên các mạng thực tế Công cụ khả năng phục hồi lỗi giúp một bộ giải mã để phục hồi từ lỗi truyền dẫn và duy trì một kết nối video thành công trong một môi trường mạng dễ bị lỗi và các công cụ mã hóa mở rộng có thể giúp hỗ trợ truyền dẫn linh hoạt tại một loạt các bitrate mã hóa • Mã hóa vẫn giữ "kết cấu" (dữ liệu hình ảnh) Điều này có nghĩa là vẫn còn hình ảnh có thể mã hoá và truyền. .. bất kỳ tiêu chuẩn trước đó ) , hiệu quả truyền dẫn ( với một số được xây dựng trong các tính năng để hỗ trợ đáng tin cậy , mạnh mẽ truyền dẫn qua một loạt các kênh và các mạng ) và tập trung vào các ứng dụng phổ biến của nén video Chỉ có ba hồ sơ hiện đang được hỗ trợ ( trái ngược với gần 20 năm MPEG - 4 Visual ) , mỗi mục tiêu tại một lớp học của các ứng dụng truyền video phổ biến Các Hồ sơ ban đầu ... tạo đa phương tiện) , multimedia training (huấn luyện đa phương tiện) , multimedia personal computer MDC (máy tính cá nhân với đa phương tiện) , digital multimedia system (hệ thống đa phương tiện. .. nói đến truyền thông đa phương tiện Và vật, từ multimedia xuất kèm với nhiều d ảnh từ chung khác: centre de ressource multimedia (trung tâm tài nguyên đa phương tiện) , post de formation multimedia. .. (đáng kể khu vực địa phương chút khu vực rộng lớn hơn), kết nối bitrate cao để nhà phổ biến khả lưu trữ đĩa cứng, nhớ flash phương tiện truyền thông quang học lớn hết Với giá truyền lưu trữ bit

Ngày đăng: 29/01/2016, 16:48

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • DANH MỤC BẢNG BIỂU

  • DANH MỤC CÁC HÌNH VẼ

  • Lời nói đầu

  • CÁC THUẬT NGỮ VIẾT TẮT

  • Chương I

    • 1.1 sự xuất hiện

    • CHƯƠNG 5 : MPEG-4 VISUAL

      • 5.1 GIỚI THIỆU

      • 5.2 TỔNG QUAN VỀ MPEG-4 VISUAL (Nén video tự nhiên)

        • 5.2.1 Tính năng

        • 5.3.2 Công cụ, các đối tượng, đặc tính và các mức độ

        • 5.2.3 các đối tượng video

        • 5.3 Mã hóa khung hình chữ nhật

        • 5.3.1 Đầu vào và đầu ra định dạng video

        • 5.3.2 Các Profile đơn giản

        • 5.3.2.1 Lõi video Bit tốc độ cực nhỏ

        • 5.3.2.2 Các công cụ mã hóa cơ bản

        • 5.3.2.4 công cụ Truyền dẫn hiệu suất

        • 5.3.3 Các chi tiết profile đơn giản

        • 5.3.4 Các chi tiết Profile thời gian thực đơn giản

        • 5.4 Mã hóa vùng và hình dạng tùy biến

          • 5.4.1 Core Profile

          • 5.4.1.1 Mã hóa Khuôn hình nhị phân

            • Ví dụ:

Tài liệu cùng người dùng

Tài liệu liên quan