Điện tử viễn thông xltn 8405 khotailieu

60 41 0
Điện tử viễn thông xltn 8405 khotailieu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

xử lý tiếng nói Trịnh Vă Văn Loan FIT HUT FIT Xử lý tiếng nói Tài liệu tham khảo La parole et son traitement automatique Calliope, Masson, 1989 Traitement de la parole Rene Boite et Murat Kunt, Presse Polytechniques Romandes, 1987 Fundamentals of Speech Signal Processing Saito S., Nakata K , Academic Press, 1985 Xö lý tiÕng nãi Néi dung Một số khái niệm Xử lý tin hiệu tiếng nói Mã hoá tiếng nói Tổng hợp tiếng nói Nhận dạng tiếng nói Một số khái niệm Xử lý tiếng nói ? Xử lý th«ng tin chøa tÝn hiƯu tiÕng nãi nh»m trun, lưu trữ trữ tín hiệu tổng hợp, nhận dạng tiếng nói Các nghiên cứu tiến hành để xử lý tiếng nói yêu cầu nhữ hiểu biết nhiều lĩnh vực ngày đa dạng: từ ng ngữ ữ âm ngôn ngữ ng ữ học cho ®Õn xư lý tÝn hiƯu Mét số khái niệm Mục đích Mã hoá cách có hiệu tín hiệu tiếng nói để truyền lưu trữ trữ tiếng nói Tổng hợp nhận dạng tiếng nói tiến tới giao tiếp ngườingười-máy tiếng nói Tất ứng dụng xử lý tiếng nói cần phải dựa kết phân tích tiếng nói Một số khái niệm Phân biệt tiếng nói âm thanh: Tiếng nói phân biệt với âm khác đặc tính âm học có nguồn gốc từ chế tạo tiếng nói Có loại nguồn âm tuần hoàn (dây rung) tạp âm (dây không rung) Một số khái niệm Bộ máy phát âm Vũm ming cng Khoang mi Vòm miệng mềm Lưỡi Họng Nắp quản Dây Thực quản Khí quản Mét sè kh¸i niƯm Sơ đồ khối máy phát âm Một số khái niệm Thanh môn (1) Thanh mơn Dây Mét sè kh¸i niƯm Thanh môn (2) vị trí hít, thở, phát âm, nói thì thào 10 Mã hoá tiếng nói Lượng tử tức thời (không nhớ) Luật lượng tử y = Q(x) định nghĩa: (L+1) møc tÝn hiƯu x(0), x(1), , x(L) L møc l­ỵng tử hoá Mỗi mức lượng tử hoá biểu diễn b»ng tõ b bit L = 2b • Sai sè lượng tử (tạp âm lượng tử) e = Q(x) - x Bước lượng tử : hiệu mức tín hiệu kề (i) = x(i)-x(i-1) Thông lượng I = bFs (bit/s) Fs : tÇn sè lÊy mÉu 46 Mã hoá tiếng nói Thụng lng (1) Tớn hiệu lượng tử bit (256 mức), Fs = kHz Thơng lượng = 64 kbit/s • Tín hiệu lượng tử 16 bit (65536 mức), Fs = 16 kHz Thông lượng = 256 kbit/s , tiếng nói  100 Mbyte • Cần phải mã hố tín hiệu tiếng nói (MPEG, GSM, G723, ) để truyền tiếng nói mạng lưu trữ 47 M· ho¸ tiÕng nãi Thông lượng (2) Tần số lấy mẫu (kHz) Số bit cho Thông mẫu luợng kbit/s Dung lượng / phút (kbyte) Lĩnh vực 48 16 768 11520 Ghi âm chuyên nghiệp 44,1 16 705,6 10584 CD Audio 32 16 512 7680 Radio FM 22 264 3960 Radio AM 8 64 960 Điện thoại 48 M· ho¸ tiÕng nói Lượng tử Tổng quát, bước lượng tử hàm biên độ tín hiệu x (lượng tử không đều) đơn giản lượng tử Mức lượng tử chọn mức tín hiệu y(i) = (1/2)[x(i-1)+x(i)] Luật lượng tử đối xứng đặc trưng bởi: - mức bão hoà xs - mức lượng tử L (L+1) = 2b Bước lượng tử = 2xs/L 49 Mã hoá tiếng nói Lượng tử L=9 50 Mã hoá tiếng nói Lượng tử L=? 0.8 0.6 0.4 0.2 -0.2 -0.4 -0.6 -0.8 -1 10 12 14 51 M· ho¸ tiÕng nói Lượng tử L = 16 0.8 0.6 0.4 0.2 -0.2 -0.4 -0.6 -0.8 -1 10 12 14 52 M· ho¸ tiếng nói Lượng tử -1 10 12 10 12 10 12 10 12 -1 -1 Quantification Error 0.2 -0.2 53 M· hoá tiếng nói Các tính chất lượng tử Mật độ xác suất sai số lượng tử l pe ( )   p (i   ), x l  ( L  1) / i  l phân bố -/2 + -/2 pe ( )  1/  ,    /  0,    / • Trung bình tạp âm lượng tử = Phương sai  /2  e2    /  d    /12  / 54 Mã hoá tiếng nói Các tính chất lượng tử Tỷ số tín hiệu nhiễu x2 SN  10 lg   e   xs   (d B)  6, 02b  4, 77  20 lg    x  NÕu xs  4 max  SN (d B)  6b 7,3 Với b 6, tăng dB tăng bit lượng tử Để có chất lượng thích hợp cần có b 11 55 M· ho¸ tiÕng nãi Tỷ số tín hiệu nhiễu N ăng lượng tín hiệu Ws SN N ¨ng l­ỵng nhiƠu Wn SN dB  10 log 10 SN Hoặc SN dB  20 log 10 Bi ªn ®é tÝn hiƯu Bi ªn ®é nhiƠu 56 M· ho¸ tiÕng nãi Tỷ số tín hiệu nhiễu Năng lượng SN (dB) Tín hiệu = Nhiễu Tín hiệu = Nhiễu Tín hiệu = 10 Nhiễu 10 Tín hiệu = 100 Nhiễu 20 Tín hiệu = 1000 Nhiễu 30 Tín hiệu = 10N Nhiễu N x 10 57 Mã hoá tiếng nói Lượng tử logarit Sau lấy logarit biên độ tín hiệu mã ho¸ tuyÕn tÝnh y(n) x(n) log[] M· ho¸ Q[] c(n) signe[] yˆ '(n) c’(n) Gi¶i m· xˆ '(n) exp[] xˆ '(n) signe[x(n)] 58 Mã hoá tiếng nói Lượng tử logarit Hai giải pháp dùng cho điện thoại Luật  (dïng ë Mü) y  log(1   x ) log(1   ) LuËt A (dïng ë ch©u ¢u) y   log A x  log A   255 : A  87,56  bit logarit ~ 12 bit lượng tử 59 Mã hoá tiếng nói Lượng tử thích nghi Bước lượng tử tuỳ thuộc vào biên độ tín hiệu  ThÝch nghi tr­íc yˆ (n) y(n) x(n) Q[] M· hoá c(n) Thích nghi độ k.đại y'(n) x'(n) = G'(n) G(n)  G(n) Gi¶i m· c’(n) yˆ '(n) : G’(n) 60 ... Không biến đổi hì hình thái 17 Một số khái niệm Mô hì hình tạo tiếng nói (Fant(Fant-1960) P Lọc thông Tuyến âm Tải x¹ thÊp G(z) V(z) R(z) A G( z )  (1  z 1 )(1   z 1 ) V( z )  R( z ) ... (z)   z k cos k z 1  z k z 2 k T z  e    F T k đók , , T: chu kỳ lấy mẫu, 2k : dải thông k Vẽ điểm cực Hk(z) mặt phẳng Z Viết phương trình sai phân mơ tả quan hệ tín hiệu yk(n) tín... FFT-1{log[S()]}= FFT-1{log[H()]}+ FFT-1{log[E()]} ) -1 FFT {log[S()]}: cepstrum: s(n) ) FFT-1{log[H()]}: thông tin vê`h(n): h(n) ) -1 FFT {log[E()]}: thơng tin vê`ng`n: e(n) 28 Xư lý tÝn hiƯu tiếng nói

Ngày đăng: 12/11/2019, 19:59

Từ khóa liên quan

Mục lục

  • xltn_1_50001_3696.pdf

  • xltn_1_50007_907.pdf

  • xltn_1_50013_3972.pdf

  • xltn_1_50019_9894.pdf

  • xltn_1_50025_0293.pdf

  • xltn_1_50031_1695.pdf

  • xltn_1_50037_9612.pdf

  • xltn_1_50043_6494.pdf

  • xltn_1_50049_5404.pdf

  • xltn_1_50055_6305.pdf

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan