Nghiên cứu kỹ thuật giảm nhiễu cho tín hiệu tiếng nói sử dụng bộ lọc kalman thích nghi

70 449 2
Nghiên cứu kỹ thuật giảm nhiễu cho tín hiệu tiếng nói sử dụng bộ lọc kalman thích nghi

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI - LUẬN VĂN THẠC SĨ KHOA HỌC NGÀNH: ĐO LƯỜNG VÀ CÁC HỆ THỐNG ĐIỀU KHIỂN NGHIÊN CỨU KĨ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI ĐẶNG QUANG HẢI Người hướng dẫn Luận văn: NGUYỄN QUỐC CƯỜNG Hà Nội, 2010 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI MỤC LỤC trang DANH SÁCH CÁC HÌNH……………………………………………………………4 DANH SÁCH CÁC BẢNG……………………………………………………… .6 LỜI MỞ ĐẦU…………………………………………………………………………7 CHƯƠNG I: ĐẶT VẤN ĐỀ………………………………………………………….9 1.1 Nâng cao chất lượng tiếng nói gì? 1.2 Đánh giá chất lượng thuật toán nâng cao chất lượng tiếng nói nào? 11 1.2.1 Tỷ số SNR (signal to noise ratio)…………………………………… 12 1.2.2 PESQ (Perceptual Evaluation of Speech Quality)……………………12 1.2.3 Log-Spectral Distortion (LSD)……………………………………….13 CHƯƠNG II: CÁC PHƯƠNG PHÁP NÂNG CAO CHẤT LƯỢNG TIẾNG NÓI 15 2.1 Các phương pháp thao tác miền phổ biên độ………………………………… 15 2.2 Các phương pháp dùng lọc thích nghi ………………………………………… 16 2.3 Các phương pháp dùng mô hình tiếng nói ………………………………………… 17 2.4 Các phương pháp dùng phân li không gian …………………………………… 18 2.5 Các phương pháp ước lượng nhiễu ………………………………………………….18 CHƯƠNG III: MÔ HÌNH HOÁ TÍN HIỆU TIẾNG NÓI VÀ TÍN HIỆU NHIỄU 20 3.1 Tín hiệu tiếng nói mô hình tiếng nói………………………………………… 20 3.1.1 Tín hiệu tiếng nói……………………………………………………….20 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 3.1.2 Mô hình tiếng nói……………………………………………………….24 3.1.3 Mô hình kích thích…………………………………………………… 25 3.1.4 Mô hình mở rộng……………………………………………………….26 3.1.5 Mô hình nhiễu………………………………………………………… 27 3.2 Tín hiệu nhiễu……………………………………………………………………27 3.2.1 Nhiễu méo dạng tín hiệu…………………………………………….27 3.2.2 Các loại nhiễu thường gặp………………………………………… .28 CHƯƠNG IV: BỘ LỌC KALMAN THÍCH NGHI VÀ ỨNG DỤNG TRONG XỬ LÝ TIẾNG NÓI………………………………………………………….30 4.1 Khái quát lọc số lọc thích nghi……………………………………… 30 4.1.1 Bộ lọc số……………………………………………………………… 30 4.1.2 Bộ lọc thích nghi……………………………………………………… 31 4.2 Bộ lọc Kalman ứng dụng xử lý tiếng nói………………………………34 4.2.1 Lý thuyết chung lọc Kalman…………………………………… 34 4.2.2 Bộ lọc Kalman nâng cao chất lượng tiếng nói……………………40 4.2.2.1 Lọc nhiễu màu…………………………………………………42 4.2.2.2 Bổ sung vecto trạng thái………………………………… 43 4.2.2.3 Đo sai lệch…………………………………………………… 44 4.2.2.4 Phép lọc Kalman sử dụng băng con………………………… 46 CHƯƠNG V: CƠ SỞ DỮ LIỆU VÀ THUẬT TOÁN……………………………… 49 5.1 Cơ sở liệu…………………………………………………………………… 49 5.1.1 NOIZEUS database……………………………………………… 49 5.1.2 Dữ liệu thực tế (Thu âm môi trường thực tế)…………………….49 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 5.2 Chương trình thuật toán………………………………………………………….49 5.2.1 Sơ đồ khối………………………………………………………………49 5.2.2 Khối phân chia tín hiệu thành băng con……………………………51 5.2.3 Khối ước lượng nhiễu………………………………………………… 60 5.2.4 Khối ước lượng thông số mô hình tiếng nói………………… 61 5.2.5 Khối sử dụng mô hình tiếng nói ước lượng để khôi phục tiếng nói dùng lọc Kalman…………………………………… 61 CHƯƠNG VI: KẾT QUẢ, ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN ………………62 TÀI LIỆU THAM KHẢO………………………………………………………………67 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI DANH SÁCH CÁC HÌNH Hình 1.1: Các phương pháp nâng cao chất lượng tiếng nói……………………………10 Hình 1.2: Tỷ số tín hiệu nhiễu…………………………………………………………12 Hình 2.1 : Phương pháp trừ phổ kinh điển……………………………………………….15 Hình 2.2: Hệ thống nâng cao chất lượng tiếng nói sử dụng microphone……….16 Hình 3.1 : Mô hình tạo tiếng nói……………………………………………………… 21 Hình 3.2: Ảnh phổ tiếng nói phụ nữ phát âm cụm từ “ Argue history”……23 Hình 3.3: Ảnh phổ tín hiệu kích thích thu từ trình lọc đảo LPC tín hiệu tiếng nói hình 3.2…………………………………………………………………… 24 Hình 3.4: Nhiễu trắng……………………………………………………………………….29 Hình 3.5: Nhiễu không ổn định…………………………………………………………….29 Hình 4.1: Mô hình lọc số……………………………………………………………… 30 Hình 4.2: Mô hình lọc nhiễu lọc thích nghi…………………………………… 33 Hình 4.3: Vòng quay liên tục lọc Kalman rời rạc…………………………… 38 Hình 4.4: Hoạt động lọc Kalman…………………………………………………….39 Hình 4.5 : Mô hình hệ thống tuyến tính động……………………………………………40 Hình 4.6: Quá trình lọc Kalman………………………………………………………… 42 Hình 4.7: Quá trình lọc Kalman băng con…………………………………………47 Hình 4.8 : Quá trình ước lượng thông số mô hình tiếng nói………………………… 47 Hình 4.9 : Thuật toán phát triển tiếng nói sử dụng lọc Kalman………………… 48 Hình 5.1: Sơ đồ nguyên lí chung thuật toán……………………………………… 50 Hình 5.2: Cấu trúc băng lọc phân tích………………………………………………….51 Hình 5.3 : Cấu trúc phần lọc băng lọc phân tích………………………… 52 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Hình 5.4 : Cấu trúc phân chia băng lọc phân tích……………………… 53 Hình 5.5: Đáp ứng xung h(n)………………………………………………………54 Hình 5.6: Dải thông h(n)……………………………………………………………54 Hình 5.7: Dải thông lọc Hi(ejw) trường hợp lý tưởng (a) Và thực tế đạt (b)H1(ejw)÷H7(ejw)…………………………………55 Hình 5.8: Cấu trúc lọc tổng hợp……………………………………………….57 Hình 5.9: Phép nội suy hệ số 2………………………………………………………….57 Hình 5.10: Hiện tượng tạo ảnh nội suy…………………………………….58 Hình 5.11: Loại bỏ thành phần ảnh phụ lọc nội suy………………………59 Hình 5.12: Ước lượng phổ công suất nhiễu…………………………………… 61 Hình 6.1: Đoạn âm trước (a) sau (b) đưa qua thuật toán………… 64 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI DANH SÁCH CÁC BẢNG Bảng 4-1: Các biểu thức Update thời gian lọc Kalman tuyến tính……………………38 Bảng 4-2: Các biểu thức Update giá trị đo lọc Kalman tuyến tính………………… 38 Bảng 5-1: Tỉ số tín hiệu nhiễu (SNR) kết sử dụng lọc Kalman…….62 Bảng 5-2: Độ méo kết sử dụng lọc Kalman……………………………….62 Bảng 5-3: Chỉ số điểm PESQ sử dụng lọc Kalman……………………………… 63 Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI LỜI MỞ ĐẦU Trải qua hàng nghìn năm việc giao tiếp người với người hầu hết thông qua ngôn ngữ giao tiếp hàng ngày Trong thời đại công nghệ bùng nổ việc giao tiếp người người lại mở rộng phương diện người máy Ở thời điểm việc trao đổi thông tin qua ngôn ngữ giao tiếp lời nói người nói người nghe cần thiết quan trọng, đặc biệt giao tiếp người máy có đặc thù riêng Vấn đề hiểu thông tin từ phía người nói thông qua ngôn ngữ truyền đạt điều kiện có nhiều trở ngại tiếng ồn, khó khăn phần cứng đặt chục năm trở lại Vấn đề nâng cao chất lượng trao đổi thông tin nói chung, nâng cao chất lượng tiếng nói nói riêng, thu hút nhiều nhà nghiên cứu Cải thiện tiếng nói nâng cao chất lượng tiếng nói hay tính hiểu tiếng nói môi trường có trở ngại cho việc truyền đạt Trong năm gần đây, khái niệm lọc Kalman trở nên phổ biến lĩnh vực nghiên cứu đặc tính ước lượng xác Các nhà kỹ thuật vận dụng ưu điểm lọc Kalman nhằm tạo kết hữu dụng trình xử lý tín hiệu tiếng nói Ngày nay, lọc Kalman trở thành kỹ thuật lọc tiếng, đưa đánh giá ước lượng loại trừ sai lệch nhiễu dư tồn tiếng nói Với mục đích nghiên cứu thử nghiệm kỹ thuật dựa tảng lọc Kalman, nhằm đưa kết xử lý tiếng nói cao hơn, luận văn này, tác giả lựa chọn sử dụng lọc thích nghi Kalman, thao tác miền không gian trạng thái mô hình tín hiệu tiếng nói tín hiệu nhiễu, kết hợp với thuật toán ước lượng nhiễu Doblinger thuật toán LSL (Least Squares Lattice) ước lượng tham số hồi quy tiếng nói, để khôi phục tín hiệu tiếng nói gốc từ tín hiệu tiếng nói có nhiễu Chương trình xử lý chạy thử nghiệm với sở liệu chuẩn NOIZEUS liệu thu âm thực tế để đưa kết đánh giá Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Để hoàn thành luận văn này, nỗ lực cố gắng thân, phải kể đến dẫn tận tình giáo viên hướng dẫn – TS Nguyễn Quốc Cường, trao đổi kiến thức giúp đỡ bạn bè, hỗ trợ động viên từ phía gia đình suốt thời gian qua Em xin chân thành cảm ơn thầy, bạn bè gia đình ! Hà Nội, ngày tháng năm 2010 Đặng Quang Hải Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI CHƯƠNG I: ĐẶT VẤN ĐỀ 1.1 Nâng cao chất lượng tiếng nói gì? Nhiễu có mặt nơi hầu hết ứng dụng liên quan đến xử lí âm tiếng nói, ví dụ hệ thống giao tiếp người - máy, hệ thống giao tiếp “hand-free”, hệ thống VoiIP, máy trợ thính, hệ thống hội thảo trực tuyến, phòng thí nghiệm trực tuyến, nhiều hệ thống khác Các tín hiệu mà quan tâm thông thường tiếng nói trước đưa đến microphone, thường tồn nhiễu làm giảm chất lượng tiếng nói Do đó, tín hiệu tiếng nói đến microphone cần phải loại bỏ nhiễu nâng cao chất lượng (bằng công cụ xử lí tín hiệu) trước lưu trữ, phân tích, truyền phát, phát lại Các trình loại bỏ nhiễu thường gọi “giảm nhiễu” (noise reduction) Vấn đề giảm nhiễu thu hút lượng lớn nhà nghiên cứu hàng chục năm qua đạt kết định Giảm nhiễu hay nâng cao chất lượng tiếng nói nói Cả hai khái niệm đến phương pháp loại bỏ thành phần làm suy giảm chất lượng tiếng nói, mà cụ thể nhiễu hay tiếng ồn, để từ nâng cao tính hiểu tiếng nói chất lượng tiếng nói Nâng cao chất lượng tiếng nói môi trường có tiếng ồn (ví dụ như: đường phố, ô tô, tàu hỏa, sân bay hay nhiễu môi trường có đông người), việc cải thiện chất lượng tính hiểu tiếng nói làm giảm khó khăn gặp phải giao tiếp tiếng nói Hiện có nhiều phương pháp để nâng cao chất lượng tiếng nói, đồng thời có nhiều cách đánh giá phương pháp Do đó, khó đưa nhận định xác, toàn diện phương pháp tốt phương pháp Các kỹ thuật nâng cao chất lượng tiếng nói chia đơn giản theo số lượng sử dụng microphone: loại sử dụng microphone, loại sử dụng hai microphone loại sử dụng mảng microphone Đặng Quang Hải - - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI π H i (e ) có độ rộng không đổi 32 , với độ rộng phổ H (e jω ) nằm liên jω tiếp trục tần số, có tên gọi Polyphase Filterbank Minh họa : Hi(ejw) H(ejw) H0(ejw) H1(ejw) H31(ejw) w -π/64 π/64 π/32 3π/64 π/16 31π/32 63π/64 π (a) 0.8 0.6 0.4 0.2 0 10 20 30 40 50 60 (b) Hình 5.7: Dải thông lọc Hi(ejw) trường hợp lý tưởng (a) Và thực tế đạt (b)H1(ejw)÷H7(ejw) Với 32 mẫu đầu vào x(n) lọc tạo mẫu đầu cho subband,như với 32 subband ta có 32 đầu s(n),các đầu mang xử lí sau Thay công thức hàm lọc vào, ta có: M −1 ⎡ ⎛ 2i + ⎛ N ⎞⎞ ⎤ xi ( n ) = ∑ ⎢ 2cos ⎜ π ⎜ k − ⎟ ⎟ hk ⎥x ( n − k ) ⎠⎠ ⎦ k =0 ⎣ ⎝ 2N ⎝ Đặt n = kN+l với l = 0÷N-1: Đặng Quang Hải - 55 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 15 N −1 ⎛ 2i + ⎛ N ⎞⎞ si ( m) = 2∑∑ 2cos ⎜ π ⎜ kN + l − ⎟ ⎟ hkN +l x ( ( m − k ) N − l ) ⎠⎠ k =0 l =0 ⎝ 2N ⎝ d Thực băng lọc: Với 32 mẫu đầu vào x(n) lọc tạo mẫu đầu cho subband,như với 32 subband ta có 32 đầu s(n),các đầu mang mã hóa Đầu lọc phân tích tính theo công thức: xi (n) = ∑ hk x(n − k ) k Thay công thức hàm cửa sổ vào ta có: M −1 ⎡ ⎛ 2i + ⎛ N ⎞⎞ ⎤ xi ( n ) = ∑ ⎢ 2cos ⎜ π ⎜ k − ⎟ ⎟ hk ⎥x ( n − k ) ⎠⎠ ⎦ k =0 ⎣ ⎝ 2N ⎝ Tín hiệu đầu si(m) tính sau: si (m) = x↓32i(m) = xi(32m) M −1 ⎡ ⎛ 2i + ⎛ N ⎞⎞ ⎤ k = ∑ ⎢2cos ⎜ π − ⎜ ⎟ ⎟ hk ⎥x ( N.m − k ) ⎠⎠ ⎦ k =0 ⎣ ⎝ 2N ⎝ Đặt n = kN+l với l = 0÷N-1: 15 N −1 ⎛ 2i + ⎛ N ⎞⎞ = 2∑∑ 2cos ⎜ π ⎜ kN + l − ⎟ ⎟ hkN +l x ( ( m − k ) N − l ) ⎠⎠ k =0 l =0 ⎝ 2N ⎝ Si(m) Từ công thức tính giá trị đầu : 15 N −1 ⎛ 2i + ⎛ N ⎞⎞ si ( m) = 2∑∑ cos ⎜ π ⎜ kN + l − ⎟ ⎟ hkN +l x ( ( m − k ) N − l ) ⎠⎠ k =0 l =0 ⎝ 2N ⎝ 5.2.2.2 Bộ lọc tổng hợp a Cấu trúc Cấu trúc băng lọc tổng hợp ngược lại với cấu trúc lọc phân tích Bao gồm bước thực hiện: - Bước 1: Tín hiệu băng (subband samples) si (m) đưa qua nội suy với hệ số 32 nhằm trả lại tần số lấy mẫu tín hiệu gốc x(n) - Bước 2: Tín hiệu nội suy yi(n) đưa qua băng lọc nội suy để loại bỏ thành phần phổ phụ (được sinh hiệu ứng tạo ảnh nội suy), tổng hợp tín hiệu nội suy lại thành tín hiệu khôi phục u(n) Đặng Quang Hải - 56 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Cấu trúc sau: s0(0÷31) s1(0÷31) K0(e ) u1(0÷1024) y1(0÷1024) K1(ejw) ↑32 s31(0÷31) u(0÷1024) jw ↑32 u0(0÷1024) y0(0÷1024) u31(0÷1024) y31(0÷1024) K31(ejw) ↑32 Hình 5.8: Cấu trúc lọc tổng hợp b Nguyên lý lọc: Phần trình bày nguyên lý hoạt động băng lọc tổng hợp với khung liệu (1024 mẫu vào 1024 mẫu) Các tín hiệu subband si(m) (đầu vào 32 subband subband gồm 32 mẫu) đưa qua nội suy hệ số nội suy 32 để trở lại tần số lấy mẫu giống với tín hiệu gốc Phép nội suy chèn thêm 31 mẫu có giá trị vào sau mẫu si(m), m = 0÷31, để tạo tín hiệu nội suy yi (n) với n = 0÷1023 Minh họa phép nội suy hệ số 2: Hình 5.9: Phép nội suy hệ số Đặng Quang Hải - 57 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Sau bước tín hiệu yi (n) có tần số lấy mẫu với x(n) tín hiệu (tính Frame) gồm 32x32=1024 mẫu Tuy nhiên phép nội suy sinh thành phần phổ không mong muốn hiệu ứng tạo ảnh sinh (lý thuyết lọc số nhiều nhịp) Đó lý người ta đặt sau nội suy lọc K i (e jω ) để loại bỏ phổ Minh họa trường hợp nội suy hệ số 2: Si(ejw) -3π/2 -π -π/2 π/2 π 3π/2 Yi(ejw) Ảnh -3π/2 -π Ảnh -π/2 π/2 π 3π/2 Hình 5.10: Hiện tượng tạo ảnh nội suy Các lọc K i (e jω ) K (e jω ) lọc thông thấp tần số cắt wc = π 32 , lọc K (e jω ) ÷ K 30 (e jω ) lọc thông dải có dải thông nằm sát có π độ rộng 32 ,các lọc loại bỏ thành phần phổ nằm dải thông (chính thành phần ảnh phụ) đầu lọc ui(n) nằm dải tần mong muốn thành phần ảnh phụ Đặng Quang Hải - 58 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Dải thông K i (e jω ) giống với H i (e jω ) tương ứng băng lọc phân tích không cần minh họa Minh họa trường hợp hệ số nội suy 2: Si(ejw) -3π/2 -π -π/2 π/2 π 3π/2 π 3π/2 π 3π/2 π 3π/2 Yi(ejw) -3π/2 -π -π/2 π/2 jw Ki(e ) -3π/2 -π -π/2 π/2 Ui(ejw) -3π/2 -π -π/2 π/2 Hình 5.11: Loại bỏ thành phần ảnh phụ lọc nội suy Đặng Quang Hải - 59 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Tín hiệu khôi phục u(n) sau tính tổng tín hiệu thành phần ui(n) miền thời gian 5.2.3 Khối ước lượng nhiễu Tín hiệu tiếng nói có nhiễu khung liệu gồm 1024 mẫu đưa vào để phân tích biến đổi Furier 1024 điểm để tính phổ công suất tiếng nói có nhiễu Từ để ước lượng phổ công suất nhiễu Nhiễu ước lượng theo phương pháp Doblinger [9] Gọi Sk (n) phổ công suất tín hiệu tiếng nói có nhiễu khung liệu thứ n băng thứ k Phổ công suất tiếng nói có nhiễu làm trơn miền thời gian sau: Psk (n) = α Psk (n − 1) + (1 − α ) Sk (n) Trong thừa số ghi nhớ α lựa chọn nằm khoảng 0.7 đến 0.9 Phổ công suất nhiễu tính theo hàm đệ quy với hệ số đệ quy phi tuyến sau: Nếu PNk ( n − 1) < Psk (n) PNk ( n) = γ PNk (n − 1) + Trái lại 1− γ ( Psk (n) − β Psk (n − 1) ) 1− β PNk ( n) = Psk (n) Các hệ số α β thường lựa chọn xấp xỉ gần Phổ công suất nhiễu sau tính cho phổ công suất nhiễu băng Hình vẽ họa cho phổ công suất nhiễu ước lượng từ phổ công suất tiếng nói lọc thứ 18 với tần số trung tâm 1062Hz Đặng Quang Hải - 60 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Hình 5.12: Ước lượng phổ công suất nhiễu Đường nét đậm phổ công suất tín hiệu tiếng nói có nhiễu đường nét đứt minh họa phổ công suất tín hiệu nhiễu 5.2.4 Khối ước lượng thông số mô hình tiếng nói Tín hiệu tiếng nói từ “downsample” trước tiên dùng để ước lượng hệ số hồi quy tín hiệu tiếng nói cách sử dụng thuật toán Least Square Lattice [18] Các hệ số hồi quy tiếng nói ước lượng sau a= 2∑ sn sn −1 n =1 8 ∑s +∑s n n −1 Các hệ số hồi quy ước lượng lại sau mẫu 5.2.5 Khối sử dụng mô hình tiếng nói ước lượng để khôi phục tiếng nói dùng lọc Kalman Sau có giá trị ước lượng hệ số hồi quy tiếng nói biên độ nhiễu tín hiệu tiếng nói ước lượng cách sử dụng lọc Kalman sau: mẫu tín hiệu tiếng nói có nhiễu vào dùng để ước lượng mẫu tín hiệu tiếng nói % Kalman Filter iteration Pt = a*P*a + sigmaw2; J = Pt/(Pt + sigmav2); x = a*x; x = x + J*(z - x); P = Pt - J*Pt; y=x Trong a hệ số hồi quy ước lượng từ phần Ngoài sigmaw2 công suất tín hiệu kích thích trường hợp chọn nhiễu trắng Phổ công suất nhiễu sigmav2 tính từ trình ước lượng nhiễu trên; y tín hiệu tiếng nói có nhiễu; x tín hiệu ước lượng Tín hiệu tiếng nói sau ước lượng nhờ lọc Kalman khôi phục lại cách “upsample” lên 32 lần trước đưa vào lọc tổng hợp Đầu 32 lọc tương ứng cộng với để tạo tín hiệu Đặng Quang Hải - 61 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI CHƯƠNG VI: KẾT QUẢ, ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN Đưa thuật toán nâng cao chất lượng tiếng nói sử dụng lọc Kalman vào chạy mô với số liệu NOIZEUS, thiết lập thông số sau: Phân tích phổ: Khung liệu 1024 mẫu, số điểm FFT 1024 Bộ lọc băng con: 32 băng lọc phân tích 32 băng lọc tổng hợp Ước lượng nhiễu: β = 0.96 α = 0.7 γ = 0.998 * Các kết thu được: Bảng 5-1: Tỉ số tín hiệu nhiễu (SNR) kết sử dụng lọc Kalman Input SegSNR[dB] Nhiễu Phương pháp 10 15 Airport Kalman 4.1514 7.9276 12.1550 16.4763 Car Kalman 5.0411 8.5973 12.2671 16.3480 Babble Kalman 3.7012 7.1934 12.0214 16.1977 Train Kalman 4.5040 8.6895 12.6273 16.7843 Exhibition Kalman 4.6979 8.4634 12.5004 16.4952 Station 4.3214 7.9707 12.1346 16.1901 Kalman Bảng 5-2: Độ méo kết sử dụng lọc Kalman Input SegSNR[dB] Nhiễu Phương pháp 10 15 Airport Kalman 9.4447 6.1657 3.8284 2.1945 Car Kalman 12.1660 7.2552 5.0069 2.9250 Babble Kalman 10.2219 6.9396 4.0484 2.3939 Train Kalman 13.2710 8.6413 5.4797 3.5038 Exhibition Kalman 11.1914 7.5990 4.9900 3.3590 Đặng Quang Hải - 62 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Station Kalman 12.1112 7.9512 4.3889 2.7817 Bảng 5-3: Chỉ số điểm PESQ sử dụng lọc Kalman Input SegSNR[dB] Nhiễu Phương pháp 10 15 Airport Kalman 1.5666 2.4696 2.3167 2.7068 Car Kalman 1.6887 2.0527 2.4516 2.8072 Babble Kalman 1.5441 1.9302 2.3119 2.6937 Train Kalman 1.5433 1.9176 2.2655 2.6826 Exhibition Kalman 1.4915 1.9270 2.3189 2.6749 Station 1.6096 2.0484 2.4112 2.7526 Kalman Ngoài ra, đánh giá thuật toán số liệu thu thực tế, với kết thu cho thấy thuật toán đảm bảo chạy tốt Đặng Quang Hải - 63 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Hình 6.1: Đoạn âm trước (a) sau (b) đưa qua thuật toán * Kết luận chung: - Ưu điểm: phương pháp cải thiện tiếng nói sử dụng lọc Kalman băng lọc đạt tỉ số tín hiệu nhiễu cao, độ méo thấp số PESQ tương đối cao Ngoài ra, ưu điểm trội thuật toán tượng “musical noise” - Nhược điểm: Phương pháp cải thiện tiếng nói sử dụng lọc Kalman băng lọc có nhược điểm thời gian thực chậm bám nhiễu không tốt khả bám nhiễu phụ thuộc hoàn toàn vào thuật toán ước lượng nhiễu Doblinger[9] Đặng Quang Hải - 64 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI * Hướng phát triển đề tài Do hạn chế thời gian khả thân, nên luận văn em thực xây dựng thuật toán chương trình chạy offline với số liệu thu thập sẵn có Tuy nhiên, có điều kiện nghiên cứu phát triển hơn, thuật toán hoàn toàn chạy online có khả bám nhiễu tốt trường hợp nhiễu không ổn định Thực kiểm tra chất lượng hệ thống nhận dạng kết hợp với khối cải thiện tiếng nói này, nhằm nâng cao kết xử lý thuật toán phát triển tiếng nói Tiếp việc đưa thuật toán xuống số thiết bị phần cứng DPS hay FPGA Đặng Quang Hải - 65 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI KẾT LUẬN Mặc dù cố gắng để thực mục tiêu đề ra, nhiên, hạn chế thời gian kiến thức, nên trình thực đồ án, chắn không tránh khỏi sai sót Em mong tiếp tục nhận ý kiến đóng góp từ thầy cô, bạn bè Cuối cùng, lần nữa, em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo hướng dẫn – TS Nguyễn Quốc Cường, xin chân thành cảm ơn bạn bè gia đình người hỗ trợ, giúp đỡ em nhiều trình nghiên cứu hoàn thành luận văn Hà Nội, ngày tháng năm 2010 Đặng Quang Hải Đặng Quang Hải - 66 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI TÀI LIỆU THAM KHẢO Adaptive Filters I: Fundamentals Bernard Widrow Technical Report No 6764-6, December 1966 Stanford Electronics Laboratories, Standford University, Stanford, California A Speech Enhancement Method Based on Kalman Filtering K.K Paliwal and Anjan Basu Computer Systems and Communication Group, Tata Institute of Fundamental Research, Homi Bhabha Road, Bombay 400005, India Enhancement of noisy speech utilizing the Kalman filter Murat Deviren Electrical and Electronics Engineering Thesis, September 2000 The Department of Electrical and Electronics Engineering, The Middle East Technical University, Speech Processing Using Kalman Filter Yong How Tong Electrical Engineering Thesis, October 2001 Department of Electrical Engineering, University of Queensland Quality Improvement of Speech Signals Using LPC Analysis N Esfandian and E Nadernejad Adv Studies Theor Phys., Vol.2, 2008, no.14, 673-685 Islamic Azad University Ghaemshahr, Iran Filtering of Colored Noise for Speech Enhancement and Coding Jerry D Gibson, Boneung Koo and Steven D Gray, IEEE Transactions on Signal Processing, Vol 39, No.8, August 1991 A Single Microphone Kalman Filter – Based Noise Canceller Đặng Quang Hải - 67 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI M Gabrea, E Grivel, and M Najim IEEE Signal Processing Letters, Vol.6, No.3, March 1999 Improved Colored Noise Handling in Kalman Filter – Based Speech Enhancement Algorithms Frédéric Mustière, Miodrag Bolíc, and Martin Bouchard School of Information Technology and Engineering University of Ottawa, Ottawa, Canada Computationally Efficient Speech Enhancement by Spectral Minima Tracking in Subband Gerhard Doblinger Vienna University of Technology, Austria 10 An Adaptive Kalman Filter for The Enhancement of Noisy AR Signals Gerhard Doblinger Vienna University of Technology, Austria 11 An Introduction to the Kalman Filter Greg Welch and Gary Bishop Department of Computer Science, University of North Carolina at Chapel Hill, February 8, 2001 12 Accuracy of the Perceptual Evaluation of Speech Quality (PESQ) algorithm Scott Pennock Lucent Technologies 13 Nghiên cứu kỹ thuật nén giải nén âm theo chuẩn MPEG Lê Duy Hải, Trần Tiến Dũng Đồ án tốt nghiệp chuyên ngành Kỹ thuật đo Tin học công nghiệp, K48 ĐHBKHN 14 Xử lý tín hiệu lọc số Nguyễn Quốc Trung NXB Khoa học Kỹ thuật, Hà Nội, 2003 Đặng Quang Hải - 68 - Lớp: CH Đo lường 2007-2009 NGHIÊN CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI 15 Matlab & Simulink dành cho kỹ sư điều khiển tự động Nguyễn Phùng Quang NXB Khoa học Kỹ thuật, Hà Nội, 2005 16 http://www.clear-labs.com/Tutorial-LitReview/index.html 17 http://www.utdallas.edu/~loizou/speech/noizeus/ 18 http://sepwww.stanford.edu/public/docs/sep65/gilles1/paper_html/node2.html Đặng Quang Hải - 69 - Lớp: CH Đo lường 2007-2009 ... 2007-2009 NGHI N CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI CHƯƠNG IV: BỘ LỌC KALMAN THÍCH NGHI VÀ ỨNG DỤNG TRONG XỬ LÝ TIẾNG NÓI 4.1 Khái quát lọc số lọc thích nghi. .. 2007-2009 NGHI N CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI Theo tín hiệu tiếng nói giả định tạo với mô hình này, thuật toán phát triển tiếng nói nghi n cứu dựa... 2007-2009 NGHI N CỨU KỸ THUẬT GIẢM NHIỄU CHO TÍN HIỆU TIẾNG NÓI SỬ DỤNG BỘ LỌC KALMAN THÍCH NGHI nghi n cứu luận văn mô hình tiếng nói có kích thích đa dải Tín hiệu kích thích mô hình hoá kết hợp M tín

Ngày đăng: 19/07/2017, 22:30

Từ khóa liên quan

Mục lục

  • TRANG BÌA

  • MỤC LỤC

  • DANH SÁCH CÁC HÌNH

  • DANH SÁCH CÁC BẢNG

  • LỜI MỞ ĐẦU

  • CHƯƠNG I: ĐẶT VẤN ĐỀ

  • CHƯƠNG II:

  • CHƯƠNG III:

  • CHƯƠNG IV:

  • CHƯƠNG V

  • CHƯƠNG VI:

  • KẾT LUẬN

  • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

Tài liệu liên quan