Nhận dạng tiếng nói sử dụng mạng NEURAL

73 377 1
Nhận dạng tiếng nói sử dụng mạng NEURAL

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠN Sau thời gian tìm hiểu đề tài “ Nhận dạng tiếng nói sử dụng mạng NEURAL” Em hoàn thành tiến độ dự kiến Để đạt kết này, em nỗ lực thực đồng thời nhận nhiều giúp đỡ, quan tâm, ủng hộ Thầy Cô bạn bè gia đình Em xin chân thành cảm ơn giáo viên hướng dẫn: ThS Đỗ Huy Khôi – Khoa Công nghệ Điện Tử Và Truyền Thông – Đại học công nghệ thông tin truyền thông - Đại học Thái Nguyên tận tình giúp đỡ em hoàn thành đồ án Em xin chân thành cảm ơn Thầy Cô giáo thuộc Khoa Công nghệ Điện Tử Và Truyền Thông trang bị cho em kiến thức chuyên ngành hữu ích để em hoàn thành đồ án phục vụ cho công việc em sau Vì thời gian có hạn nên đồ án em tránh khỏi thiếu sót, em mong đóng góp ý kiến từ phía Thầy Cô bạn Em xin chân thành cảm ơn ! Thái Nguyên, tháng năm 2012 Sinh Viên thực Triệu Hà Quảng LỜI CAM ĐOAN Đồ án hoàn thành sau thời gian nghiên cứu, tìm hiểu nguồn tài liệu, sách báo chuyên ngành thông tin mạng mà theo em hoàn toàn tin cậy Nội dung đồ án em tổng hợp lại từ tài liệu tham khảo, không chép toàn đồ án công trình nghiên cứu tác giả khác Em xin chịu trách nhiệm nội dung đồ án Thái Nguyên, tháng năm 2012 Sinh viên thực Triệu Hà Quảng MỤC LỤC LỜI CẢM ƠN LỜI CAM ĐOAN MỤC LỤC DANH MỤC HÌNH DANH MỤC TỪ VIẾT TẮT MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NƠRON 10 1.1 Giới thiệu mạng Nơron 10 1.2 Kiến trúc mạng Nơron 12 1.2.1 Mạng Perceptron tiến lớp SLP 12 1.2.2 Mạng perceptron tiến nhiều lớp MLP 13 1.3 Đặc trưng mạng Nơron 14 1.3.1 Tính chất phi tuyến 14 1.3.2 Tính chất tương ứng đầu vào- đầu 14 1.3.3 Tính chất thích nghi 15 1.3.4 Tính chất đưa lời giải có chứng 15 1.3.5 Tính chất chấp nhận sai sót 15 1.3.6 Tính chất đồng dạng phân tích thiết kế 16 1.4 Các phương pháp học 16 1.4.1 Học có giám sát 16 1.4.2 Học giám sát 16 1.4.3 Học tăng cường 17 CHƯƠNG 2: NHẬN DẠNG TIẾNG NÓI VÀ CÁC VẤN ĐỀ 18 2.1 Quá trình sản xuất tiếng nói thu nhận tiếng nói người 18 2.2 Các âm tiếng nói đặc trưng 19 2.2.1 Nguyên âm 19 2.2.2 Các âm vị khác 20 2.3 Khái niệm nhận dạng tiếng nói 21 2.4 Các nguyên tắc nhận dạng tiếng nói 23 2.5 Các phương pháp nhận dạng tiếng nói 23 2.5.1 Phương pháp âm học ngữ âm học 23 2.5.2 Phương pháp nhận dạng mẫu 25 2.5.3 Phương pháp trí tuệ nhân tạo 27 CHƯƠNG 3: NHẬN DẠNG TIẾNG NÓI SỬ DỤNG MẠNG NƠRON 29 3.1 Các mô hình nhận dạng tiếng nói 29 3.1.1 Mô hình Fujisaki 29 3.1.2 Mô hình Markov ẩn 31 3.2 Mô hình mạng Nơron 38 3.2.1 Phân tích tín hiệu tiếng nói 39 3.2.2 Huấn luyện mạng 45 3.3 Những thuận lợi khó khăn nhận dạng tiếng Việt 56 CHƯƠNG 4: CHƯƠNG TRÌNH NHẬN DẠNG TIẾNG NÓI 58 4.1 Giới thiệu Hàm Toobox Matlab cần để xây dựng hệ thống nhận dạng tiếng nói mạng Nơron 58 4.2 Xây dựng chương trình nhận dạng tiếng nói mạng Nơron MLP 60 4.2.1 Các bước xây dựng 61 4.2.2 Chương trình nhận dạng phát âm mười chữ số tiếng Việt 66 KẾT LUẬN 71 TÀI LIỆU THAM KHẢO 72 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN 73 DANH MỤC HÌNH Hình 1.1 Mô hình Nơron nhân tạo 10 Hình 1.2 mạng Nơron perceptron đơn lớp 13 Hình 1.3 Mạng Nơron perceptron đa lớp 14 Hình 2.1 Sơ đồ biểu diễn trình sản xuất thu nhận tiếng nói người 18 Hình 2.2 Các phần tử hệ thống nhận dạng tiếng nói 22 Hình 2.3 Sơ đồ khối nhận dạng tiếng nói theo âm học- ngữ âm học 24 Hình 2.4 Hệ thống nhận dạng tiếng nói theo phương pháp nhận dạng mẫu 26 Hình 2.5 Sơ đồ khối hệ thống nhận dạng tiếng nói theo phương pháp từ xuống 27 Hình 3.1 Hệ thống nhận dạng tiếng nói sử dụng mô hình mạng Nơron 38 Hình 3.2 Sơ đồ tính toán hệ số MFCC 39 Hình 3.3 tín hiệu tiếng nói khoảng thời gian dài 40 Hình 3.4 tín hiệu tiếng nói khoảng thời gian ngắn 40 Hình 3.5 Cửa sổ hamming 128 điểm 41 Hình 3.6 Tín hiệu bị thu nhỏ lại hai đầu hamming 42 Hình 3.7 Tín hiệu cửa sổ hóa với biên độ phổ sau FFT 42 Hình 3.8 Tín hiệu có cửa sổ hóa hamming với biên độ phổ sau FFT 43 Hình 3.9 Các băng lọc tam giác theo tần số Mel 43 Hình 4.1 Sơ đồ khối hệ thống nhận dạng tiếng nói chữ số tiếng Việt mạng Nơron MLP môi trường Matlab 62 Hình 4.2 Giải thuật cắt khoản lặng file wav 63 Hình 4.3 Giao diện chương trình 66 Hình 4.4 Tạo mạng Nơron MLP lớp 67 Hình 4.5 Chương trình huấn luyện mạng MLP 67 Hình 4.6 Chương trình nhận dạng từ file 68 Hình 4.7 Chương trình nhận dạng trực tiếp từ micro 68 Hình 4.8 Quá trình huấn luyện với đầu mong muốn 69 Hình 4.9 Quá trình huấn luyện với đầu mong muốn 69 Hình 4.10 File nhận dạng với đầu thực tế chữ số nhận 70 Hình 4.11 File nhận dạng với đầu thực tế chữ số nhận 70 DANH MỤC TỪ VIẾT TẮT Thuật ngữ Artifactial Neural Network Fast Fourier Transform Simple Linear Perceptron Từ viết tắt ANN FFT SLP Multiple layer perceptron MLP Recurrent neural networks Melscale frequency cepstral coeficients RNN MFCC Ý nghĩa Mạng Nowrron nhân tạo Biến đổi Fourier nhanh Mạng perceptron truyền thẳng lớp Mạng perceptron truyền thẳng nhiều lớp Mạng Nơron hồi quy Hệ số cepstral theo thang đo mel Expectation maximization Linear predictive code Speech Recognition Hidden Markov Model EM LPC SR HMM Kì vọng cực đại Hệ số dự đoán tuyến tính Nhận dạng tiếng nói Mô hình Markov ẩn MỞ ĐẦU Hiện nay, người nghiên cứu phương thức hoạt động não, sau áp dụng cho công nghệ đại Để tiếp cận khả học, người ta đưa mô hình mạng Nơron gồm Nơron liên kết với thành mạng mô theo cấu trúc mạng thần kinh người Đã có nhiều công trình nghiên cứu lĩnh vực nhận dạng tiếng nói (speech recognition) sở lý thuyết hệ thống thông minh nhân tạo, nhiều kết trở thành sản phẩm thương mại ViaVoice, Dragon,… hệ thống bảo mật thông qua nhận dạng tiếng nói hệ quay số điện thoại giọng nói,… Triển khai công trình nghiên cứu đưa vào thực tế ứng dụng vấn đề việc có ý nghĩa đặc biệt giai đoạn công nghiệp hóa, đại hóa nước nhà Mạng Nơron nhân tạo công cụ tốt việc giải toán như: hợp phân lớp đối tượng, xấp xỉ hàm, tối ưu hóa, định lượng vector, phân cụm liệu, Nó thay hiệu công cụ tính toán truyền thống để giải toán Cách ứng xử mạng Nơron nhân tạo giống não người, chứng tỏ khả học, nhớ lại, tổng quát hóa từ liệu huấn luyện Nhận dạng lĩnh vực đóng vai trò quan trọng khoa học kỹ thuật Trong hầu hết vấn đề kỹ thuật ngày nay, ta phải xác định, nhận dạng mô hình đối tượng liên quan, để từ tìm giải pháp Hiện giới chương trình nghiên cứu mạng Nơron phát triển rộng rãi nước nhiều tổ chức nghiên cứu Cũng có nhiều chương trình công bố, nhận dạng tiếng nói đưa vào để điều khiển robot Ở Việt Nam chương trình nghiên cứu mạng Nơron chưa phát triển so với nước, chưa có nhiều kết công bố Đồng thời ứng dụng xử lý tiếng nói chưa nhiều Lĩnh vực mạng Nơron xử lý tiếng nói phát triển, nghiên cứu ứng dụng ngày trở nên phổ biến quan trọng Vì vậy, em định chọn đồ án: “Nhận dạng tiếng nói sử dụng mạng NEURAL” Nội dung đồ án vào tìm hiểu mạng Nơron ứng dụng nhận dạng tiếng nói, phương pháp nhận dạng tiếng nói sử dụng mạng Nơron  Phương pháp phân tích cepstral theo thang đo mel MFCC (melscale frequency cepstral coefficients) sử dụng việc trích trọn đặc trưng tiếng nói  Mạng Nơron lan truyền ngược hướng (Back-propagation Neural Network) sử dụng để học mẫu định đối tượng nhận dạng Đồ án gồm chương: Chương 1: Tổng Quan Về Mạng Nơron Chương 2: Nhận Dạng Tiếng Nói Và Các Vấn Đề Chương 3: Nhận Dạng Tiếng Nói Sử Dụng Mạng Nơron Chương 4: Chương Trình Nhận Dạng Tiếng Nói CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NƠRON 1.1 Giới thiệu mạng Nơron Mạng Nơron (Neuron Network) công cụ có khả giải nhiều toán khó, thực tế nghiên cứu mạng Nơron đưa cách tiếp cận khác với cách tiếp cận truyền thống lý thuyết nhận dạng Mạng Nơron nhân tạo mô hoạt động Nơron thần kinh, mạng Nơron nhân tạo hệ thống bao gồm nhiều phần tử xử lý đơn giản (neuron) hoạt động song song Tính hệ thống tùy thuộc vào cấu trúc hệ, trọng số liên kết Nơron trình tính toán lại Nơron đơn lẻ Mạng Nơron từ liệu mẫu tổng quát hóa dựa liệu mẫu học Hình 1.1 Mô hình Nơron nhân tạo 10 VoiceBox toolbox VoiceBox toolbox Matlab chuyên xử lí tiếng nói Mike Brookes phát triển VoiceBox yêu cầu Matlab phiên trở lên VoiceBox gồm hàm chia thành số nhóm chức sau:  Xử lí file âm (đọc, ghi file wav số định dạng file âm khác)  Phân tích phổ tín hiệu  Phân tích LPC  Tính toán MFCC, chuyển đổi spectral - cepstral  Chuyển đổi tần số (mel-scale, midi, )  Biến đổi Fourier, Fourier ngược, Fourier thực  Tính khoảng cách (sai lệch) vector dãy vector Loại trừ nhiễu tín hiệu tiếng nói Chức quan trọng trích đặc trưng tín hiệu tiếng nói, mà loại phổ biến LPC MFCC Hàm tính MFCC tín hiệu VoiceBox hàm : melcepst(s,fs,w,nc,p,n,inc,fl,fh) Hàm có nhiều tham số, số tham số quan trọng là:  S vector tín hiệu tiếng nói, fs tần số lấy mẫu (mặc định 11050)  nc số hệ số MFCC cần tính (tức số phần tử vector đặc trưng, mặc định là12)  P số lọc mel-scale  W xâu mô tả lựa chọn khác: có tính thêm log lượng, có tính thêm đặc trưng delta Mặc dù hàm gọi cách đơn giản là: c=melcepst(s,fs) Lời gọi hàm sinh ma trận c, dòng ma trận 12 hệ số MFCC frame Để kèm thêm log lượng liệu delta hệ nhận dạng khác, ta dùng lệnh: c=melcepst(s,fs,’ed’) 59 Khi dòng c vector 26 hệ số MFCC frame tương ứng NetLab toolbox NetLab Ian T Nabney phát triển Chúng sử dụng toolbox NetLab để xây dựng, huấn luyện thử nghiệm mạng nơron MLP cho hệ thống nhận dạng đồ án Lệnh khởi tạo MLP NetLab có cú pháp sau: net = mlp(inode, hnode, onode, func, anpha) Trong đó:  inode, hnode, onode số Nơron lớp vào, lớp ẩn lớp  Func kiểu hàm kích hoạt  anpha ngưỡng giá trị trọng số, thường lấy 0.01  net mạng MLP hàm tạo Mạng MLP sau điều kiện khởi tạo huấn luyện với liệu huấn luyện cho trước Lệnh huấn luyện MLP NetLab có cú pháp sau: [net, error] = mlptrain(net, x, t, its) Trong đó:  X, t liệu huấn luyện x vector đầu vào, t vector đầu cần đạt đến (target)  Its số vòng huấn luyện (số lần thực thuật toán lan truyền ngược lỗi)  Net mạng Nơron  Error tổng sai số lần huấn luyện cuối Sau huấn luyện ta dùng mạng MLP để tính đầu ứng với đầu vào Lệnh tính đầu y MLP ứng với đầu vào x sau: y = mlpfwd(net, x) Trong đó:  X hay nhiều vector đầu vào  Y vector đầu tương ứng 4.2 Xây dựng chương trình nhận dạng tiếng nói mạng Nơron MLP Nhận dạng tiếng nói lĩnh vực không vô phức tạp 60 Nhận dạng tiếng nói giới bắt đầu nghiên cứu cách 50 năm, nhiên kết thực tế đạt vô khiêm tốn Còn phải lâu người đạt đến việc xây dựng hệ thống hiểu tiếng nói người Trong phạm vi đồ án môn học, em xây dựng chương trình nhỏ nhận dạng mười chữ số tiếng Việt công cụ có sẵn Matlab Em muốn xây dựng hệ thống nhận dạng tiếng Việt với từ điển lớn hơn, ứng dụng vào thực tế Tuy nhiên tiếp xúc lĩnh vực nên khả năng, kiến thức em hạn chế, cộng vào khó khăn thời gian, phương tiện,… nên em xây dựng hệ thống nhận dạng nhỏ Trong tương lai có điều kiện tiếp xúc nghiên cứu sâu lĩnh vực này, em mong muốn phát triển đồ án lên để ứng dụng thực tế 4.2.1 Các bước xây dựng Hệ thống nhận dạng mười chữ số tiếng Việt xây dựng với đặc trưng sau: Phương pháp: nhận dạng từ đơn (isolate word recognition)  Input: file wav, file chứa từ Hoặc ghi âm trực tiếp  Output: chữ số nhận dạng file đầu vào  Bộ từ vựng: 11 từ đơn âm chữ số tiếng Việt (“không”, “một”, “hai”, “mười”) Sơ đồ khối hệ thống nhận dạng tiếng nói chữ số tiếng Việt mạng Nơron MLP môi trường Matlab mô tả hình 4.1 Chức khối mô tả sau: Thu thập tiền xử lí: tín hiệu tiếng nói giai đoạn huấn luyện thực phương pháp thủ công: sử dụng phần mềm ghi âm, lọc nhiễu cắt thành từ riêng rẽ, từ ghi vào file (tên file ghi từ tương ứng) Bộ liệu em xây dựng gồm:  File wav 16 bit 8kHz, file phát âm từ Từ chữ số tiếng Việt từ đến 10 61 Trích chọn đặc trưng MFCC Chia liệu phân lớp Nguồn vào(tiếng nói) Thu thập tiền xử lí (cắt từ,lọc nhiễu…) Xây dựng CSDL huấn luyện mạng CSDL huấn luyện DLthử nghiệm Thử nghiệm mạng Độ xác DL huấn luyện Trích chọn đặc trưng MFCC Xây dựng huấn luyện mạng Tính đầu vào cho mạng Truyền qua mạng để tính xác suất phân lớp Mạng noron MLP Lựa chọn lớp có xác suất cao Chữ số nhận dạng Hình 4.1 Sơ đồ khối hệ thống nhận dạng tiếng nói chữ số tiếng Việt mạng Nơron MLP môi trường Matlab Việc thu thập tiền xử lí (cắt vùng không chứa tín hiệu tiếng nói) thực lệnh sau: x = wavrecord(10000,8000); x = x'; y = endcut(x, 64, 1.5E-3); Hàm endcut dùng cắt khoảng lặng không chứa tín hiệu âm, sơ đồ giải thuật miêu tả hình 4.2 Các lệnh miêu tả sau: 62 function y = endcut(x, n, es) x = x - mean(x); if nargin < es = 2E-3; end; if nargin < n = 128; end; y=[]; i=1; while ies) y = [y t]; end; i=i+n; end; Begin Đọc file wav, chiều dài frame, ngưỡng lượng Chia wav thành frame, tính nl frame nl frame > nl ngưỡng S Đ lưu frame End Hình 4.2 Giải thuật cắt khoản lặng file wav Mỗi file âm trích chọn đặc trưng MFCC thành dãy vector MFCC hàm wave2mfcc: 63 function mfcc = wave2mfcc(wav, fs, p); if nargin < p = 8; end; if nargin < fs = 8000; end; if isstr(wav) [wav fs] = wavread(wav); end; mx = max(wav); wav = wav / mx; mfcc = melcepst(wav,fs,'e',p1); Vì file wav có độ dài ngắn khác nên dãy vector đặc trưng MFCC tương ứng số phần tử Nhưng đầu vào mạng Nơron MLP lại phải cố định Do em thực biện pháp đơn giản chia dãy đặc trưng thành phần nhau, tính trung bình phần vector ghép lại thành vector Kết đầu vào mạng Nơron vector 8x5=40 thành phần function x = VecAvr(ft,k); n = length(ft); m = floor(n/k); x=[]; i=0;t=1; while i[...]... dãy các kí hiệu ngữ âm  Nhận dạng tiếng nói là một quá trình nhận thức Ngôn ngữ nói là có nghĩa, do đó thông tin về ngữ nghĩa và suy đoán có giá trị trong quá trình nhận dạng tiếng nói 2.5 Các phương pháp nhận dạng tiếng nói Hiện nay có 3 phương pháp chủ yếu được sử dụng trong nhận dạng tiếng nói là: 1 Phương pháp âm học- ngữ âm học 2 Phương pháp nhận dạng mẫu 3 Phương pháp ứng dụng trí tuệ nhân tạo... khi nói từ tiếp theo Còn hệ thống nhận dạng các từ phát âm liên tục không yêu cầu điều kiện này 2 Nhận dạng tiếng nói độc lập/phụ thuộc người nói Đối với hệ thống nhận dạng phụ thuộc người nói đòi hỏi tiếng người nói phải có trong cơ sở dữ liệu của hệ thống còn hệ thống nhận dạng không phụ thuộc người nói thì người nói không nhất thiết phải có mẫu trước khi nhận dạng trong cơ sở dữ liệu 3 Nhận dạng. .. thống nhận dạng tiếng nói theo phương pháp từ trên xuống 27 Đặc điểm của hệ thống nhận dạng theo phương pháp này là:  Sử dụng hệ chuyên gia để phân đoạn và gán nhãn ngữ âm Điều này làm đơn giản hóa hệ thống so với phương pháp nhận dạng ngữ âm  Sử dụng mạng Nơron nhân tạo để học mối quan hệ giữa các ngữ âm, sau đó dùng nó để nhận dạng tiếng nói Mục đích của việc sử dụng hệ chuyên gia là nhằm tận dụng. .. nay, có hai phương pháp nhận 25 dạng mẫu được sử dụng rỗng rãi đó là mô hình Markov ẩn và mạng Nơron Sơ đồ khối của một hệ thống nhận dạng mẫu: Huấn luyện mẫu Trích chọn đặc trưng Tiếng nói Các mẫu chuẩn/ các mô hình {mẫu thử} {các mẫu tham chiếu} Phân tích hệ thống Phân loại mẫu Quyết định logic Tiếng nói nhận dạng Hình 2.4 Hệ thống nhận dạng tiếng nói theo phương pháp nhận dạng mẫu Hệ thống bao gồm... nguyên tắc cơ bản trong nhận dạng tiếng nói Các nghiên cứu về nhận dạng tiếng nói dựa trên ba nguyên tắc cơ bản :  Tín hiệu tiếng nói được biểu diễn chính xác bởi giá trị phổ trong một khung thời gian ngắn Nhờ vậy ta có thể trích ra đặc điểm tiếng nói từ những khoảng thời gian ngắn và dùng các đặc điểm này làm dữ liệu nhận dạng tiếng nói  Nội dung của tiếng nói được biểu diễn dưới dạng chữ viết, là một... trình sản xuất tiếng nói và thu nhận tiếng nói của con người Hình 2.1 Sơ đồ biểu diễn quá trình sản xuất thu nhận tiếng nói của con người Hình 2.1 đưa ra sơ đồ khối của quá trình sản xuất tiếng nói, nhận thức tiếng nói của con người Quá trình sản xuất tiếng nói bắt đầu khi người nói tạo ra một thông điệp ( trong ý nghĩ của anh ta) và muốn truyền tải nó cho người nghe thông qua tiếng nói Tổ chức thần... năng của một hệ thống nhận dạng với từ điển cỡ nhỏ thường cao hơn hiệu năng của các hệ thống nhận dạng có từ điển cỡ vừa và lớn 4 Nhận dạng trong môi trường nhiễu cao/thấp 21 Hiệu năng của các hệ thống nhận dạng không nhiễu sẽ cao hơn hiệu năng của các hệ thống nhận dạng có nhiễu Dưới đây là hình biểu diễn các phần tử cơ bản của một hệ thống nhận dạng tiếng nói Dữ liệu tiếng nói Mô hình âm thanh Mô... vụ cần nhận dạng tiếng nói 23 Sơ đồ khối của phương pháp này được biểu diễn bằng hình 2-3 Bộ tách đặc trưng Tín hiệu tiếng nói Trích chọn đặc trưng Phân đoạn Bộ tách đặc trưng và Lựa chọn Tiếng nói được nhận dạng gán đoạn Bộ tách đặc trưng Hình 2.3 Sơ đồ khối nhận dạng tiếng nói theo âm học- ngữ âm học Nguyên lý hoạt động của phương pháp có thể mô tả như sau: Trích chọn đặc trưng: Tín hiệu tiếng sau... thuật điều khiển, mạng Nơron được ứng dụng để nhận dạng, dự báo và điều khiển các hệ thống động; trong điện tử viễn thông thì ứng dụng để xử lý ảnh, nhận dạng ảnh và truyền thông; trong hệ thống điện thì ứng dụng để nhận dạng, dự báo và điều khiển các trạm biến áp 1.2 Kiến trúc mạng Nơron Có rất nhiều kiểu kiến trúc mạng Nơron khác nhau như: mạng Nơron hồi quy, mạng tự tổ chức, mạng bán kính tâm,... nhận dạng tiếng nói thông qua hệ thống thần kinh con người như trên, chúng ta có thể có một chút ý niệm về khả năng ứng dụng mạng Nơron nhân tạo trong việc mô phỏng một số tổ chức thần kinh như một phần của hệ thần kinh thính giác 2.2 Các âm thanh tiếng nói và các đặc trưng 2.2.1 Nguyên âm Các nguyên âm có tầm rất quan trọng trong nhận dạng tiếng nói, hầu hết các hệ thống nhận dạng dựa trên cơ sở nhận ... Nhận Dạng Tiếng Nói Và Các Vấn Đề Chương 3: Nhận Dạng Tiếng Nói Sử Dụng Mạng Nơron Chương 4: Chương Trình Nhận Dạng Tiếng Nói CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NƠRON 1.1 Giới thiệu mạng Nơron Mạng. .. mạng Nhận dạng Hình 3.1 Hệ thống nhận dạng tiếng nói sử dụng mô hình mạng Nơron 38 3.2.1 Phân tích tín hiệu tiếng nói Phương pháp tính hệ số MFCC phương pháp trích chọn tham số tiếng nói sử dụng. .. Ngôn ngữ nói có nghĩa, thông tin ngữ nghĩa suy đoán có giá trị trình nhận dạng tiếng nói 2.5 Các phương pháp nhận dạng tiếng nói Hiện có phương pháp chủ yếu sử dụng nhận dạng tiếng nói là: Phương

Ngày đăng: 13/04/2016, 10:23

Tài liệu cùng người dùng

Tài liệu liên quan