tổng quan về xử lí tiếng nói

52 240 1
tổng quan về xử lí tiếng nói

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói tổng quan về xử lí tiếng nói

1 TRƢỜNG ĐẠI HỌC HÀNG HẢI VIỆT NAM KHOA CÔNG NGHỆ THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN *** BÀI GIẢNG XỬ LÝ TIẾNG NÓI  : XỬ LÝ TIẾNG NÓI  : 17412 TRÌNH ÀO T : ĐẠI HỌC CHÍNH QUY DÙNG CHO SV NGÀNH : CÔNG NGHỆ THÔNG TIN HẢI PHÕNG - 2011 2 MỤC LỤC CHƢƠNG I: CÁC KIẾN THỨC CƠ BẢN 6  6  6  7  7  9  9  10  11 CHƢƠNG II: XỬ LÝ TÍN HIỆU SỐ TRONG XỬ LÝ TIẾNG NÓI 13  13  14  14  15  15  15  15 i 19  19  20 CHƢƠNG III: NHÂN DẠNG TIẾNG NÓI 22  22  22  24 3.2 Các mô  27  27 3.2.2 Mô hình Markov 28 CHƢƠNG IV: CÁC HỆ THỐNG CHUYỂN VĂN BẢN THÀNH GIỌNG NÓI 30  30  30  30  31 4.1.4 Phân tíc 32 3  32  33  33  34  34  36 4 Tên học phần Loại học phần: 2 Bộ môn phụ trách giảng dạy Khoa phụ trách: CNTT. Mã học phần: 17412 Tổng số TC: 4 T       75 45 30 0 không không Điều kiện tiên quyết:  Mục tiêu của học phần:   Nội dung chủ yếu:   Nội dung chi tiết: TÊN CHƢƠNG MỤC PHÂN PHỐI SỐ TIẾT TS LT TH BT KT CHƢƠNG I: CÁC KIẾN THỨC CƠ BẢN 15 9 6 1.1 Tổng quan về xử lý tiếng nói 3    1.2 Cấu trúc ngôn ngữ nói 6     CHƢƠNG II: XỬ LÝ TÍN HIỆU SỐ TRONG XỬ LÝ TIẾNG NÓI 15 9 6 2.1 Xử lý tín hiệu số 3  2.1.2  2.1.3  2.2 Biểu diễn tín hiệu tiếng nói 3 2.2.1  2.3 Mã hóa tiếng nói 3   CHƢƠNG III: NHÂN DẠNG TIẾNG NÓI 21 12 9 3.1 Các hệ thống nhận dạng tiếng nói 3   3.2 Các mô hình Markov ẩn 9  3.2.2 Mô hình Markov CHƢƠNG IV: CÁC HỆ THỐNG CHUYỂN VĂN BẢN THÀNH GIỌNG NÓI 24 15 9 4.1 Phân tích ngữ âm và văn bản 6     5  4.2 Tổng hợp tiếng nói 9 4.2.1 Các t    Nhiệm vụ của sinh viên:   Tài liệu học tập: 1. Xuedong Huang, Alex Acero, Hsiao Wuen Hon, Spoken Language Processing- A Guide to Theory, Algorithm and System Development, Prentice Hall, 2001. 2. Lawrence R.Rabiner, Ronald W.Schafer, Digital Processing of Speech Signals, Prentice- Hall, Inc. Englewood Cliffs, NewJersey, 1978. Hình thức và tiêu chuẩn đánh giá sinh viên: -  -     Thang điểm:  Điểm đánh giá học phần: Z = 0,3X + 0,7Y. chính thức và thống nhất   Ngày phê duyệt: / / Trƣởng Bộ môn 6   1.1 Tổng quan về xử lý tiếng nói K  khi xu hi máy tính càng ngày càng chng   ó là mt công  vô cùng hu ích  giúp con i  lý thông tin. Cùng i s  ca xã hi, khi  thông tin mà máy tính cn x lý tng  nhanh trong khi thi gian dành cho nhng công vi l gim i. Vì y, vi ng tc  x lý thông tin, trong ó có tc  trao i thông tin gia con ngi và máy tính, tr thành mt yêu u  thit. Hi  giao  ngi-máy c tc   các thi  n bàn phím, chut, màn hình, vi tc  i ch nên  có các phng pháp trao i thông tin mi giúp con ngiiuhn i máy tính. Mt trong nhng ng nghiên cu này là s dng  nói trong trao i thông tin ngi-máy. Nhng nghiên cu này liên quan trc  ti các k qu ca chuyên ngành x lý  nói, trong ó có tng h nói. 1.1.1 Nhận dạng tiếng nói tự động            nhau.      - Tín  -  t -    7 -      là không rõ ràng. 1.1.2 Chuyển đổi văn bản thành tiếng nói   -to-      âm thanh. Các thành phần cơ bản của một hệ thống chuyển đổi văn bản thành tiếng nói -  -   -  -  +  +  +  8 +  -  +   1.1.3 Hệ thống hiểu ngôn ngữ nói Tng hp ti nói là lnh c ang c nghiên cu khá rng rãi trên thgii và ã cho nhng k  khá t. Có ba ph pháp c  dùng  tng hp  nói là mô phng b máy phát âm, tng hp b formant và tng hp b cách ghép ni. Phng pháp mô png b máy phát âm cho ch l tt nng òi hi  tính toán vì vi mô png chính xác b máy phát âm  pc p. Phng pháp ng hp formant không òi hi chi phí cao trong tính toán nhng cho k qu cha tt. Ph pháp ng hp ghép ni cho chlng tt, chí phí tính toán không cao nhng ng t vng phn.  các nc phát tri nhng nghiên cu  lý  nói, ã cho các kqu kh quan, làm tin  cho vi giao  ngi-máy b  nói.  Vit Nam, các nghiên cu trong lnh 9 vc này tuy mi c phát  trong nhng n  ây nhng cng ã có mt sk quh quan 1.2 Cấu trúc ngôn ngữ nói 1.2.1 Hệ thống tiếng nói con ngƣời   máy phát âm bao gm các thành phn riêng r n pi, khí qun,  các ng dmi. Trong ó:  Thanh qun cha hai dây thanh có th dao ng to ra s cng hci  ra âm thanh.  Tuyn âm là ng không  b   môi, k thúc i dây thanh hoanh qun.  Khoang mi là ng không u b u  môi, k thúc bi vòm ming, có  dài nh khong 12cm i vi ngi ln.  Vòm mcn ng. 1. c mi 2. Vòm m 3. ng 4. Vòm mng m 5. i 6. Thâi 7. Li gà 8. ming 9. Yh 10. N óng ca thanh qu 11. Dây thanh gi 12. Dây thanh 13. Thanh qun 14. Thc qu b) Cơ chế phát âm k    10     1.2.2 Ngữ âm học và âm vị học             trên         à khai thác       [...]... 4.2 Tổng hợp tiếng nói 4.2.1 Các tính chất của tổng hợp tiếng nói Tổng hợp tiếng nói là phát sinh tiếng nói từ sóng tiếng nói Trong vài thập niên gần đây, các bộ tổng hợp tiếng nói có chất lƣợng ngày càng cao.Tuy nhiên chất lƣợng của các phƣơng pháp 34 35 hiện nay mới chỉ đạt đến mức phù hợp cho một vài ứng dụng, chẳng hạn nhƣ đa phƣơng tiện và truyền thông Hiện nay có ba phƣơng pháp tổng hợp tiếng nói. .. hợp tiếng nói là tổng hợp formant Các phƣơng pháp tổng hợp tiếng nói cùng với những đặc điểm cơ bản nhất sẽ đƣợc giới thiệu trong phần tiếp theo 4.2.2 Tổng hợp tiếng nói bằng các Formant Phƣơng pháp tổng hợp formant (formant synthesis) yêu cầu phải tổng hợp đƣợc tối thiểu 3 formant để hiểu đƣợc tiếng nói, và để có đƣợc tiếng nói chất lƣợng cao thì cần tới 5 formant Tiếng nói đƣợc tạo ra từ các bộ tổng. .. có thể đƣợc tổng kết từ các quá trình phân tích tiếng nói 2.3.2 Các bộ mã hóa dạng sóng tiếng nói vô hƣớng Nhận dạng tiếng nói là lĩnh vực nghiên cứu với mục đích tạo ra đƣợc một thiết bị, máy móc hoặc phần mềm có khả năng nhận biết một cách chính xác tiếng nói của con ngƣời từ bất kỳ một nguồn phát âm nào Nhận dạng tiếng nói có hai ứng dụng chính là nhận dạng tiếng nói và nhận dạng ngƣời nói a Nhận... dụng của xử lý tín hiệu số trong xử lý tiếng nói ? 2 Trình bày mô hình âm học của việc tạo tiếng nói ? 3 Trình bày các tính chất của bộ mã hóa tiếng nói ? 22 CHƢƠNG III : NHẬN DẠNG TIẾNG NÓI 3.1 Các hệ thống nhận dạng tiếng nói 3.1.1 Nhận dạng từ riêng lẻ Trong tiếng Việt, ngữ nghĩa của một từ phụ thuộc vào thanh điệu Khi thanh điệu thay đổi, nghĩa của từ cũng thay đổi theo Có 6 thanh điệu trong tiếng. .. tham số Nếu mô hình mẫu này và các tham số đƣợc xây dựng một cách hoàn hảo thì tiếng nói tổng hợp có thể giống với tiếng nói tự nhiên Hiện có hai phƣơng pháp tổng hợp tiếng nói: a Tổng hợp tiếng nói theo cách phát âm Đây là cách tiếp cận trực tiếp để mô hình hoá hệ thống một cách chi tiết Trong phƣơng pháp này hệ thống tổng hợp đƣợc mô phỏng giống nhƣ quá trình tạo ra âm thanh và lan truyền âm thanh... tạo ra hầu hết các tiếng nói tự nhiên b Tổng hợp đầu cuối tự nhiên Theo hƣớng mô hình hoá này, ngƣời ta dựa trên các đặc tính đáp ứng tần số của dây thanh và tuyến âm để mô phỏng lại cơ chế tạo tiếng nói Mô hình này gọi là mô hình nguồn-lọc Bộ tổng hợp tiếng nói theo hƣớng này đƣợc thực hiện bằng cách sử dụng hệ thống tƣơng tự với cơ chế tạo tiếng nói tại những điểm quan sát Cơ quan phát âm đƣợc mô... khoảng thời gian mà tín hiệu đƣợc coi là dừng: 20 ms 2.3 Mã hóa tiếng nói 2.3.1 Các tính chất của bộ mã hóa tiếng nói Dựa trên cơ sở lựa chọn các cách biểu diễn tín hiệu và phƣơng pháp xử lý, đã có rất nhiều các ứng dụng quan trọng đã đƣợc triển khai Hình vẽ dƣới đây sẽ chỉ ra một số ứng dụng trong lĩnh vực xử lý tiếng nói Tổng hợp tiếng nói là quá trình tạo ra tín hiệu âm thanh bằng cách điều khiển... sinh tiếng nói tổng hợp là phát các mẫu tiếng nói đã thu từ tiếng nói tự nhiên (nhƣ các từ hoặc câu) Phƣơng pháp này cho chất lƣợng tƣơng đối tốt nhƣng gặp phải hạn chế là số lƣợng từ vựng trong cơ sở dữ liệu rất lớn Bên cạnh đó tiếng nói cũng có thể tạo ra bằng cách mô phỏng hệ thống phát âm Phƣơng pháp này cho chất lƣợng rất tốt nhƣng thực hiện khá phức tạp Một phƣơng pháp nữa cũng đƣợc dùng để tổng. .. lý tiếng nói? Ý nghĩa trong thực tiễn? Cho ví dụ minh họa? 2 Trình bày các nguyên tắc cơ bản trong quá trình nhận dạng tiếng nói? 3 Trình bày hệ thống chuyển đổi văn bản thành giọng nói? 4 Trình bày cấu trúc của ngôn ngữ nói? 13 CHƢƠNG II : XỬ LÝ TÍN HIỆU SỐ TRONG XỬ LÝ TIẾNG NÓI 2.1 Xử lý tín hiệu số Phân tích và thiết kế các hệ thống tuyến tính đƣợc thực hiện dễ dàng nhờ các biểu diễn miền tần số frequency-domain... giao tiếp thông qua sự vào ra cơ khí Khi áp dụng tiếng nói vào giao tiếp, lợi ích của nó có thể dễ dàng nhận thấy: đó là tính tiện lợi, dễ sử dụng, tốc độ giao tiếp cao Để có thể sử dụng tiếng nói nhƣ một công cụ giao tiếp thì hệ thống cần có khả năng tiếng nói về ngữ nghĩa Nhận dạng ngữ nghĩa bao gồm nhận dạng từ và nhận dạng câu b Nhân dạng ngƣời nói Trong thế giới ngày nay tồn tại nhiều hệ thống . THÔNG TIN BỘ MÔN HỆ THỐNG THÔNG TIN *** BÀI GIẢNG XỬ LÝ TIẾNG NÓI  : XỬ LÝ TIẾNG NÓI  : 17412 TRÌNH ÀO T : ĐẠI HỌC CHÍNH QUY DÙNG CHO. PHỐI SỐ TIẾT TS LT TH BT KT CHƢƠNG I: CÁC KIẾN THỨC CƠ BẢN 15 9 6 1.1 Tổng quan về xử lý tiếng nói 3  . Ngày phê duyệt: / / Trƣởng Bộ môn 6   1.1 Tổng quan về xử lý tiếng nói K  khi xu hi máy tính càng ngày càng chng   ó là mt công  vô

Ngày đăng: 03/09/2014, 00:11

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan