so sánh các chuẩn nén video trong truyền thông đa phương tiện

87 2.4K 7
so sánh các chuẩn nén video trong truyền thông đa phương tiện

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

so sánh các chuẩn nén video trong truyền thông đa phương tiện

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG Bộ môn truyền thông và mạng máy tính ******************** Bài tập lớn môn học Truyền thông đa phương tiện Giáo viên hướng dẫn : PGS-TS Nguyễn Thị Hoàng Lan Sinh viên thực hiện : Nguyễn Thành Nam B (trưởng nhóm) - 20062201 Đào Việt Phương - 20062418 Vũ Văn Thành - 20062900 Nguyễn Hoài Nam - 20062194 Phạm Ngọc Quang - 20062504 Hoàng Anh Minh - 20062101 Trịnh Ngọc Đức - 2006C078 Nguyễn An Hưng - 20061531 Lớp : Truyền thông và Mạng máy tính – K51 Mục lục Mục lục 2 CHUẨN MPEG 1 và MPEG 2 9 Tổng quan về MPEG 9 MPEG 1 9 1.1.Phân cấp cấu trúc của MPEG 1 10 1.2.Các kĩ thuật nén của MPEG 1 11 MPEG 2 16 1.3.Sơ đồ nén và giải nén của MPEG 2 16 1.4.Các kĩ thuật nén của MPEG 2 18 19 Biến đổi DCT được thực hiện trên một một macroblock của ảnh thật đã lấy mẫu để cho ra một ma trận 8 x 8 với các điểm là các hệ số DCT.Phép DCT thực hiện chuyển các hệ số không gian sang miền tần số .Mỗi một phần tử điểm ảnh ở ma trận gốc được biểu diễn bằng một hệ số tần số nào đó. Có nhiều năng lượng ảnh tập trung ở vùng tần số thấp ( ví dụ như các cảnh bầu trời, cảnh nền, ), các chi tiết của ảnh lại thể hiện ở tần số cao.Mắt người tập trung trước hết vào phần tần số thấp của ảnh vì năng lượng tập trung chủ yếu vào phần này.Nhưng vùng mang hệ số tần số cao lại mang nhiều thông tin hơn vùng tần số thấp. Vì vậy phép DCT sắp xếp lại thông tin, thuận tiện cho các bước mã hóa khác sau Các hệ số DCT nói lên sự biến đổi tần số giữa các mẫu theo chiều ngang và dọc. 19 Phép toàn DCT được mô tả như sau : 19 19 19 20 Lượng tử hoá là quá trình bỏ bớt các hệ số tần số, lượng tử hoá là quy cho (phân định) độ phân giải cho từng hệ số tần số (số lượng tử bit), sau đó nén số liệu bằng cánh quy các bit có trọng lượng thấp cho hệ số tầng số cao, điều này ít có nghĩa đối với người xem 20 Thực chất của lượng tử hóa là quá trình chia các hệ số F(u,v) cho các hệ số lớn hơn 1 ở các vị trí tương ứng, trong đó các hệ số ứng với tần số xuất hiện thấp của phần tử ảnh được chia cho các giá trị nhỏ (10, 11, 12, ), ứng với tần số cao được chia cho các giá trị lớn (100, 120, 121, ) và bỏ đi phần thập phân (chính là sai số lượng tử hoá). Quá trình lượng tử hoá tạo ra nhiều giá trị 0 trong ma trận các hệ số, và làm nhỏ đi các giá trị còn lại, nhờ vậy số lượng các bit của dữ liệu được mã hoá giảm đi đáng kể mà không gây ra sự khác biệt đáng kể dưới góc độ cảm nhận của mắt người so với ảnh gốc ban đầu 20 Lượng tử hóa được thực hiện bởi công thức sau : 20 2 T’[u][v] = 20 Trong đó: 20 T : ma trận DCT 20 T’: ma trận sau lương tử hóa 20 QM : ma trận lượng tử hóa được xác định bởi chuẩn MPEG 2 20 QS = 40, Quantizer scale 20 21 Ảnh hưởng của kĩ thuật nén lên chất lượng hình ảnh 26 So sánh giữa MPEG 1 và MPEG 2 34 H261 và H262 36 1.H261 36 1.1.Group of Block (GOB) 37 1.2.Mô hình mã hóa và giãi mã của H261 40 1.3.Các kĩ thuật nén của H261 41 2.H262 47 2.1.Mô hình mã hóa H262 47 2.2.Loại ảnh 49 2.3.Kiểm soát bộ đệm 49 2.4.Các profiles và các bậc 50 2.5.Kết luận 53 3.So sánh H261 và H262 54 4.So sánh giữa MPEG và H26X 56 MPEG 4 58 1.Giới thiệu chung 58 2.Phạm vi và tính năng của chuẩn MPEG-4 58 3.Kĩ thuật mã hóa Video của chuẩn MPEG4 59 3.1.Sự tổ hợp khung hình trong MPEG 4 59 3.2.Cấu trúc bộ mã hóa và giải mã của MPEG 4 61 3.3.Các Profiles và Levels trong chuần MPEG-4 62 4.MPEG 4 video 62 4.1.Khả năng mở rộng mã hóa các đối tượng Video 64 4.2. Khả năng khắc phục lỗi mạnh mẽ 64 3 4.3.Cải thiện sự ổn định với độ phân giải thời gian trễ thấp 67 4.4.Thuật toán nén của MPEG 4 68 5.So sánh MPEG 4 với MPEG 2 71 IV.H264 74 1.Tổng quan về H264 74 2.Sự phát triển của H264 74 3.Sơ đồ mã hóa khối của H264 75 4.Các phương pháp nén của H264 77 4.1.Giảm bớt độ dư thừa 77 4.2.Chọn chế độ, phân chia và chế ngự 78 4.3. Nén theo miền thời gian 79 4.4.Nén theo miền không gian 80 5. Các ưu điểm nổi bật của chuẩn nén H264 81 5.1.Ưu điểm của nén không gian 81 5.2.Ưu điểm của nén thời gian 81 5.3.Kích cỡ khối 81 5.4.Ưu điểm về lượng tử hoá và biến đổi 83 5.5.Ưu điểm đối với mã hoá entropy 83 So sánh H264 với các chuẩn nén khác 84 Kết luận về H264 85 KẾT LUẬN 86 TÀI LIỆU THAM KHẢO 87 Danh mục hình vẽ Hình 1 Hệ thống giải mã của MPEG 10 Hình 2 Video Sequence 10 4 Hình 3 Thành phần độ sáng và thành phần độ màu 11 Hình 4 Các khung hình trong chuẩn MPEG 13 Hình 5 Các khung hình trong 1s 13 Hình 6 Mã hóa Macroblock 15 Hình 7 SCRs 16 Hình 8 Sơ đồ mã hóa 17 Hình 9 Sơ đồ giải mã 17 Hình 10 Hai tiêu chuẩn lấy mẫu 4:2:0 và 4:2:2 18 Hình 11 Biến đổi DCT 19 Hình 12 Sơ đồ biến đổi DCT 20 Hình 13 Một số ví dụ về biến đổi DCT 21 Hình 14 Sơ đồ mã hóa VLC 21 Hình 15 Blocks trước và sau khi quét Zig-zag 22 Hình 16 Bit rate control 23 Hình 17 Ba ma trận lượng từ hóa: (a) MQUANT = 2, (b) MQUANT = 4, (c) MQUANT = 6 24 Hình 18 Dung lượng dữ liệu nén ứng với lượng tử hóa của hình 17 24 Hình 19 Hai ma trận lượng tử hóa tiêu chuẩn W(u,v) với MQUANT = 2 25 Hình 20 Dung lượng dữ liệu nén với ma trận lượng tử hóa trên hình 19 25 Hình 21 MPEG 2 Profiles 26 Hình 22 MPEG 2 Levels 27 Hình 23 Trật tự của một GOB trong ảnh 37 Hình 24 Cấu trúc của GOB header 37 Hình 25 Trật tự của macroblock trong một GOB 38 Hình 26 Cấu trúc của một lớp Macroblock 38 Hình 27 Trật tự của blocks trong Macroblock 39 Hình 28 Sơ đồ mã hóa H261 40 Hình 29 Sơ đồ giải mã H261 40 Hình 30 Intra frame và Inter frame 41 Hình 31 Intra-frame coding 41 Hình 32 Inter-frame coding 42 Hình 33 H261 frame encoder 43 Hình 34 Phương pháp tìm kiếm Motion Vector 44 5 Hình 35 Two-Dimensional Logarithmic 45 Hình 36 Hierarchical Motion Estimation 46 Hình 37 (a) Hệ thống mã hóa bù chuyển động DCT 47 Hình 38 Cấu trúc của chuỗi các bit video mã hóa theo chuẩn H262 48 Hình 39 (a)Bộ mã hóa video SNR 51 Hình 40 (a) Bộ mã hóa video sử dụng profile đánh giá không gian 52 Hình 41 H262 levels: Giới hạn kích thước ảnh, tốc độ frame, tốc độ bit, kích thước bộ đệm 53 Hình 42 Sự tổ hợp khung hình trong MPEG-4 60 Hình 43 Cấu trúc của bộ mã hoá và giải mã video MPEG-4 61 Hình 44 Sơ đồ cấu trúc giải mã video MPEG-4 61 Hình 45 The VLBV Core and the Generic MPEG-4 Coder 63 Hình 46 Phân loại các hình ảnh MPEG-4 và Video Coding thuật toán và công cụ 67 Hình 47 Sơ đồ khối cơ bản của MPEG-4 Video coder 68 Hình 48 Ví dụ về Sprite mã của chuỗi Video 70 Hình 49 Sơ đồ mã hóa khối của H264 76 Hình 50 Sơ đồ mã hóa H264 76 Hình 51 Sơ đồ giải mã H264 77 Hình 52 Multiple Reference Frames 78 Hình 53 Profiles của H264 79 Hình 54 Sơ đồ khối mã hoá MPEG, đường đứt nét đặc trưng cho phần bổ sung của H264 80 Hình 55 H264 có thể phân chia thành phần chói của từng MacroBlock 82 6 7 LỜI MỞ ĐẦU Hiện nay, chúng ta đang sống trong thời đại khoa học kĩ thuật và công nghệ cao, con người đã đạt nhiều thành tựu trong rất nhiều lĩnh vực, đặc biệt là trong công nghệ thông tin. Truyền thông đa phương tiện là một một ngành trong công nghệ thông tin, có mặt ở hầu hết mọi nơi, đóng vai trò quan trọng trong việc truyền tải thông tin, xóa nhòa các khoảng cách địa lý và mang lại cho con người nhiều lợi ích to lớn. Trong truyền thông đa phương tiện, nén video là một công nghệ vô cùng quan trọng. Tại sao ta phải nén video? Những video gốc với dung lượng lớn không thể truyền tải nếu không có nén. Tùy theo nhu cầu và các kĩ thuật thực hiện, chúng ta đã phát minh ra nhiều chuẩn nén video khác nhau, phù hợp với nhiều mục đích sử dụng. Có các loại chuẩn nén video nào, chúng hoạt động ra sao, chất lượng hình ảnh và các ứng dụng của chúng trong thực tế như thế nào, sự khác biệt giữa chúng như thế nào, đây chính là chủ đề mà chúng em sẽ tìm hiểu trong tiểu luận này: “So sánh các chuẩn nén video trong truyền thông đa phương tiện.” Tiểu luận này của chúng em sẽ được chia thành 4 phần: • Chuẩn Mpeg 1 và Mpeg 2, phần này sẽ trình bày về các kĩ thuật nén, ảnh hưởng của phương nén tới chất lượng nén video, và một số so sánh giữa 2 chuẩn nén này. • Chuẩn H261 và H262, phần này sẽ trình bày về các kĩ thuật nén, ảnh hưởng của phương pháp nén tới chất lượng nén video, và so sánh giữa kĩ thuật nén của dòng H26X (ITU-T) với dòng MPEG (ISO). • Chuẩn MPEG 4, phần này sẽ trình bày về các khía cạnh của chuẩn nén MPEG 4 và so sánh phương pháp nén giữa MPEG 4 với MPEG 1 và MPEG 2. • Phần cuối cùng là chuẩn H264, tìm hiểu về các kĩ thuật, các cải tiến trong phương pháp nén của H264 với các chuẩn khác, một số so sánh giữa H264 với MPEG và các chuẩn H26X khác. Cách thực hiện mỗi phần trên do các bạn thực hiện phần đó quyết định tùy theo hướng tìm hiểu của từng người. Chúng em xin cảm ơn cô Nguyễn Thị Hoàng Lan đã giúp chúng em hoàn thành tiểu luận này. 8 Nhóm 4 - lớp Truyền thông và mạng máy tính K51 CHUẨN MPEG 1 và MPEG 2 Tổng quan về MPEG Chuẩn MPEG (moving picture experts group) là chuẩn nén, giải nén và đồng bộ hóa các tín hiệu video và audio. Với các tỉ lệ nén 1.2 Mbps, với độ phân giải 352x240 quét 30Hz thông thường thì chất lượng video có thể so sánh được với chuẩn VHS Chất lượng hình ảnh có thể được cải thiện đáng kể bằng cách dùng tỉ lệ nén dữ liệu lớn hơn mà không cần thay đổi độ phân giải. MPEG không phải là công cụ nén đơn lẻ mà ưu điểm của nén MPEG chính là ở chỗ nó có một tập hợp các công cụ mã hóa chuẩn, chúng có thể được kết hợp với nhau một cách linh động để phục vụ cho một loạt các ứng dụng khác nhau. Các chuẩn MPEG hiện có gồm: • MPEG-1 là chuẩn lưu trữ và phục hồi ảnh động và Audio trong lưu trữ Media. MPEG-1 có thể nén tín hiêu video tới 1.5 Mbps với chất lượng VHS và âm thanh lập thể (stereo audio) với tốc độ 192 bps. NÓ được dùng để lưu trữ video và âm thanh trên CD-ROM. • MPEG-2 là chuẩn cho TV số. • MPEG-4 là chuẩn cho các ứng dụng Multmedia. MPEG-4 trở thành 1 tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ họa và video tương tác hai chiều (Games, Video conferencing) và các ứng dụng Multimedia tương tác hai chiều (world wide web hoặc các ứng dụng nhằm phân phát dữ liệu video như truyền hình cáp, internet video…). MPEG-4 đã trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phố và truy cập vào các hệ thống video. Nó đã góp phần giải quyết vấn đề dung lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường truyền tín hiệu video hoặc kết hợp cả hai vấn đề trên. • MPEG-7 chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin MPEG-1 và MPEG-2 đã được chuẩn hóa trong khi MPEG-4 và MPEG-7 đang được phát triển. MPEG 1 Dữ liệu MPEG gồm 2 lớp: • Lớp hệ thống (System layer) chứa thông tin về thời gian (Timing) và các thông tin khác cần thiết cho việc tách các dòng dữ liệu Video và Audio đồng thời đồng bộ hóa Video và Audio trong quá trình phát (Playback) 9 Nhóm 4 - lớp Truyền thông và mạng máy tính K51 • Lớp dữ liệu nén (Compress Layer) bao gồm các dòng dữ liệu Video và Audio. Hình 1 Hệ thống giải mã của MPEG Hệ thống giải mã sẽ tách các thông tin về thời gian từ dữ liệu hệ thống MPEG và gửi nó đến các thiết bị hệ thống khác (việc đồng bộ hóa sẽ cần thêm nhiều thông tin về thời gian). Hệ thống giải mã cũng tách các dữ liệu Video và Audio từ dữ liệu ban đầu, sau đó gửi chúng đến bộ giải mã thích hợp. Bộ giải mã Video (Video Decoder) và Audio (Audio Decoder) giải nén các dòng dữ liệu Video và Audio. Hầu hết các sơ đồ nén MPEG đều dùng kỹ thuật lấy mẫu bổ xung (subsampling) và lượng tử hóa (Quantization) trước khi mã hóa. Lấy mẫu bổ xung nhằm mục đích để làm giảm kích thước khung hình đầu vào theo cả chiều ngang và chiều dọc, như vậy sẽ giảm số lượng các điểm ảnh trước mã hóa. Trong một số trường hợp người ta còn lấy mẫu bổ xung theo thời gian để giảm số lượng các khung hình trước khi mã hóa. Đây được xem như là một kỹ thuật rất cơ bản nhằm loại bỏ sự dư thừa dựa vào khả năng lưu ảnh của mắt người cảm thụ. 1.1. Phân cấp cấu trúc của MPEG 1 Chuẩn MPEG định nghĩa một kiểu phân cấp cấu trúc trong dữ liệu Video như sau: • Video Sequence (Cảnh): bắt đầu với một Sequence Header, bao gồm một hoặc một nhóm khung hình và kết thúc với mã End-of-sequence. Hình 2 Video Sequence • GOP (Group of picture): một dãy liên tiếp các ảnh (picture) trong cảnh. • Frame/Picture (khung hình): là thành phần mã hóa chính, thường chúng ta có thể phân biết sự thay đổi về độ sáng của ảnh (Brightness) tốt hơn sự thay đổi 10 [...]... hình MPEG 2 MPEG 2 là chuẩn nén trong bộ tiêu chuẩn MPEG dùng để mã hóa luồng dữ liệu video kết hợp với các thông tin về âm thanh Đây là phương pháp mã hóa dữ liệu có tổn hao cho phép lưu trữ và truyền phim ảnh trên nền hệ thống và băng thông hiện thời Chuẩn nén MPEG 2 được nhóm MPEG phát triển tiếp sau chuẩn nén MPEG 1, nó được mở rộng và kế thừa nhằm mục đích hỗ trợ việc truyền video số tốc độ bít... độ bít lớn hơn 4 Mb/s, bao gồm các ứng dụng DSM (phương tiện lưu trữ số), các hệ thống truyền hình hiện tại (PAL, NTSC, SECAM), cáp, thu lượn tin tức điện tử, truyền hình trực tiếp từ vệ tinh, truyền hình mở rộng (EDTV), truyền hình độ phân giải cao (HDTV),… 1.3 Sơ đồ nén và giải nén của MPEG 2 Dưới đây là sơ đồ nén và giải nén của chuẩn MPEG 2: 16 Nhóm 4 - lớp Truyền thông và mạng máy tính K51 Hình... HighProfile@MainLevel • 4:2:2Profile@MainLevel: 33 Nhóm 4 - lớp Truyền thông và mạng máy tính K51 So sánh giữa MPEG 1 và MPEG 2 Về cơ bản, MPEG 1 và MPEG 2 là giống nhau Tuy nhiên vẫn có những khác biệt trong các kỹ thuật nén giữa 2 chuẩn này: • MPEG 2 hỗ trợ thêm định dạng 4:2:2, điều này cho phép MPEG 2 hỗ trợ các định dạng nén video chất lượng cao • Trong kỹ thuật quét các hệ số để phụ vụ việc mã hóa, MPEG 2 hỗ trợ... mã hóa với cơ chế nén phải có nhiều mức để phù hợp với từng trường hợp đầu ra MPEG 2 định nghĩa ra các profile và level để diễn tả các mức nén video của mình Các yếu tố chính ảnh hưởng đến chất lượng video video trong MPEG 2 là: bit rate, buffer size, tốc độ lấy mẫu, kiểu lấy mẫu, vector ranger Việc kiểm so t bit rate và buffer size được thực hiện trong công đoạn bit rate control Các việc còn lại được... rate control dùng để quản lý bộ đệm,kiểm so t quá trình lượng tử hóa.Đây là công đoạn dùng để kiểm so t chất lượng video cũng như bit rate đầu ra thông qua kiểm so t quá trình lượng tử hóa và quản lý dữ liệu nén trong bộ đệm Chìa khoá để điều khiển tốc độ truyền là trật tự dữ liệu đã nén trong bộ đệm (Buffer).Việc nén có thể được tiến hành với việc loại bỏ một vài thông tin đã được lựa chọn Ảnh hưởng nhỏ... có thể đạt được bằng cách bỏ bớt các thông tin chi tiết Điều này đảm bảo giới hạn tỉ lệ nén dữ liệu trong khi chất lượng của khung hình suy giảm tối thiểu Lượng tử hóa là kỹ thuật nén có tổn hao, kiểm so t quá trình này có thể kiểm so t được chất lượng video đầu ra Con số các bit được mã hoá thể hiện khối ảnh phụ thuộc rất nhiều vào kết quả của quá trình lượng tử hoá - ở đây là các giá trị QF(u,v) Đây... zigzag, sau đó các hệ số được chuyển thành dãy các cặp chỉ số biên độ, mỗi cặp biểu thị số lượng các hệ số 0 và biện độ của các hệ số khác 0 Các cặp chỉ số biên độ sau đó được mã hóa bằng các mã có độ dài thay đổi, các mã có độ dài ngắn hơn cho các cặp hay xuất hiện còn các mã dài hơn cho các cặp ít xuất hiện hơn Một vài Macroblock cần mã hóa chính xác hơn Để giải quyết sự không đồng đều giữa các block,... là một trong những công cụ mạnh để làm giảm sự dư thừa về không gian giữa các khung hình Khái niệm về bù chuyển động của các khung hình tức là các khung hình thành phần trong cảnh video sẽ được thay thế gần đúng Kỹ thuậ tiên đoán bù chuyển động giữa các khung hình được xem như là biện pháp để hạn chế bớt các thông số của chuyển động bởi việc dùng các Vector chuyển động để mô tả sự dịch chuyển các điểm... chuyenr động trong MPEG 2 chính xác tới ½ pixel, trong khi đó MPEG 1 chỉ là full pixel Điều này cho phép MPEg 2 nén video tốt hơn, đầu ra chất lượng tốt hơn • MPEG 2 hỗ trợ 2 kiểu quét video là quét tuần tự và quét xem kẽ Trong khi đó MPEG 1 chỉ hỗ trọ kiểu quét tuần tự 35 Nhóm 4 - lớp Truyền thông và mạng máy tính K51 H261 và H262 1 H261 H261 Là một tiêu chuẩn mã hóa được sử dụng trong mã hóa video Ban... nhóm 16x16 pixels trong đó thông tin về độ sáng được chứa trong 4 khối mỗi khối 8x8 pixels trong khi những thông tin về màu sắc được đưa bởi hai màu đỏ và xanh của các thành phần khác nhau trong một độ phân giải của mỗi khổi 8x8 pixels Những thành phần và các mã được đại diện bởi các giá trị lấy mẫu và được định nghĩa trong khuyến nghị ITU-R 601 Việc chia nhóm như thế này để chỉ rõ thông tin ở mỗi cấp . lượng nén video, và một số so sánh giữa 2 chuẩn nén này. • Chuẩn H261 và H262, phần này sẽ trình bày về các kĩ thuật nén, ảnh hưởng của phương pháp nén tới chất lượng nén video, và so sánh giữa. lớn. Trong truyền thông đa phương tiện, nén video là một công nghệ vô cùng quan trọng. Tại sao ta phải nén video? Những video gốc với dung lượng lớn không thể truyền tải nếu không có nén. Tùy. Phần cuối cùng là chuẩn H264, tìm hiểu về các kĩ thuật, các cải tiến trong phương pháp nén của H264 với các chuẩn khác, một số so sánh giữa H264 với MPEG và các chuẩn H26X khác. Cách thực hiện

Ngày đăng: 19/12/2014, 17:25

Từ khóa liên quan

Mục lục

  • Mục lục

  • CHUẨN MPEG 1 và MPEG 2

    • Tổng quan về MPEG

    • MPEG 1

      • 1.1. Phân cấp cấu trúc của MPEG 1

      • 1.2. Các kĩ thuật nén của MPEG 1

        • 1.2.1. Các kiểu khung hình trong MPEG 1

        • 1.2.2. Motion compensation

        • 2.2.4. Mã hóa trong Mpeg 1

        • MPEG 2

          • 1.3. Sơ đồ nén và giải nén của MPEG 2

          • 1.4. Các kĩ thuật nén của MPEG 2

            • 1.4.1. Video filtering

            • 1.4.2. DCT

            • Biến đổi DCT được thực hiện trên một một macroblock của ảnh thật đã lấy mẫu để cho ra một ma trận 8 x 8 với các điểm là các hệ số DCT.Phép DCT thực hiện chuyển các hệ số không gian sang miền tần số .Mỗi một phần tử điểm ảnh ở ma trận gốc được biểu diễn bằng một hệ số tần số nào đó. Có nhiều năng lượng ảnh tập trung ở vùng tần số thấp ( ví dụ như các cảnh bầu trời, cảnh nền,..), các chi tiết của ảnh lại thể hiện ở tần số cao.Mắt người tập trung trước hết vào phần tần số thấp của ảnh vì năng lượng tập trung chủ yếu vào phần này.Nhưng vùng mang hệ số tần số cao lại mang nhiều thông tin hơn vùng tần số thấp. Vì vậy phép DCT sắp xếp lại thông tin, thuận tiện cho các bước mã hóa khác sau Các hệ số DCT nói lên sự biến đổi tần số giữa các mẫu theo chiều ngang và dọc.

            • Phép toàn DCT được mô tả như sau :

              • 1.4.3. Lượng tử hóa

              • Lượng tử hoá là quá trình bỏ bớt các hệ số tần số, lượng tử hoá là quy cho  (phân định) độ phân giải cho từng hệ số tần số (số lượng tử bit), sau đó nén số liệu bằng cánh quy các bit có trọng lượng thấp cho hệ số tầng số cao, điều này ít có nghĩa đối với người xem

              • Thực chất của lượng tử hóa là quá trình chia các hệ số F(u,v) cho các hệ số lớn hơn 1 ở các vị trí tương ứng, trong đó các hệ số ứng với tần số xuất hiện thấp của phần tử ảnh được chia cho các giá trị nhỏ (10, 11, 12, ...), ứng với tần số cao được chia cho các giá trị lớn (100, 120, 121, ...) và bỏ đi phần thập phân (chính là sai số lượng tử hoá). Quá trình lượng tử hoá tạo ra nhiều giá trị 0 trong ma trận các hệ số, và làm nhỏ đi các giá trị còn lại, nhờ vậy số lượng các bit của dữ liệu được mã hoá giảm đi đáng kể mà không gây ra sự khác biệt đáng kể dưới góc độ cảm nhận của mắt người so với ảnh gốc ban đầu.

              • Lượng tử hóa được thực hiện bởi công thức sau :

              • T’[u][v] = 

              • Trong đó:

Tài liệu cùng người dùng

Tài liệu liên quan