Tài liệu Xử lý tiếng nói - Text to Speech System pdf

40 1.1K 19
Tài liệu Xử lý tiếng nói - Text to Speech System pdf

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài 4:Bài 4: Các hệ thống chuyển đổivănbảnCác hệ thống chuyển đổivănbảnCác hệ thống chuyển đổi văn bản Các hệ thống chuyển đổi văn bản thành giọng nóithành giọng nói  Các hệ thống chuyển đổi văn bản thành Các hệ thống chuyển đổi văn bản thành giọng nói có thể được xem như là hệ thống giọng nói có thể được xem như là hệ thống ểểmã hóa tiếng nói cho phép lựa chọn kiểu mã hóa tiếng nói cho phép lựa chọn kiểu cách nói, tốc độ, cường độ và các hiệu ứngcách nói, tốc độ, cường độ và các hiệu ứng Các thành phầntronghệ thống TTSCác thành phầntronghệ thống TTSCác thành phần trong hệ thống TTSCác thành phần trong hệ thống TTS  Thành phần phân tích văn bản:Thành phần phân tích văn bản: ––Xác định cấu trúc tài liệu, chuyển đổi ký hiệu, Xác định cấu trúc tài liệu, chuyển đổi ký hiệu, phân tích cấu trúc ngôn ngữphân tích cấu trúc ngôn ngữ –– Chuyển đổi các ký hiệu sang dạng chuẩn.Chuyển đổi các ký hiệu sang dạng chuẩn. Chuyển đổicácsố sang dạng chữ tương ứngChuyển đổicácsố sang dạng chữ tương ứng–– Chuyển đổi các số sang dạng chữ tương ứng Chuyển đổi các số sang dạng chữ tương ứng –– Phân tích khoảng trống, dấu chấm câu để xác Phân tích khoảng trống, dấu chấm câu để xác định cấu trúc ngôn ngữđịnh cấu trúc ngôn ngữị ggị gg  Thành phần phân tích ngữ âm:Thành phần phân tích ngữ âm: –– Chuyển đổi các từ đã chuẩn hóa sang các âm vị Chuyển đổi các từ đã chuẩn hóa sang các âm vị y g ịy g ị tương ứng (với thông tin như trọng âm, thời gian tương ứng (với thông tin như trọng âm, thời gian phát âm)phát âm) Các quá trình trong thành phần Các quá trình trong thành phần qgpqgp phân tích văn bảnphân tích văn bản  Xác định cấu trúc tài liệu: Xác định cấu trúc tài liệu: –– Cung cấp ngữ cảnh phục vụ cho các quá trình Cung cấp ngữ cảnh phục vụ cho các quá trình thựchiệnsaunàythựchiệnsaunàythực hiện sau nàythực hiện sau này ––Ngắt câu, phân đoạn văn bảnNgắt câu, phân đoạn văn bản  Chuẩnhóavănbản:Chuẩnhóavănbản:  Chuẩn hóa văn bản: Chuẩn hóa văn bản: –– Chuyển đổi ký hiệu ở dạng dạng khác nhau về Chuyển đổi ký hiệu ở dạng dạng khác nhau về dạng chuẩndạng chuẩn Phâ tí h ô ữPhâ tí h ô ữ  Phân tích ngôn ngữ: Phân tích ngôn ngữ: –– Phân tích đặc điểm cú pháp, ngữ nghĩa của câu Phân tích đặc điểm cú pháp, ngữ nghĩa của câu từ để có thể chọn cách phát âm thích hợptừ để có thể chọn cách phát âm thích hợptừ để có thể chọn cách phát âm thích hợptừ để có thể chọn cách phát âm thích hợp Các quá trình trong thành phần Các quá trình trong thành phần qgpqgp phân tích ngữ âmphân tích ngữ âm  Phân biệt từ có cách viết giống nhau nhưng Phân biệt từ có cách viết giống nhau nhưng khác âmkhác âm  Phân tích từ để xác định cách phát âm thích Phân tích từ để xác định cách phát âm thích hợphợp  Chuyển đổi ký tự sang âm thanh và xây Chuyển đổi ký tự sang âm thanh và xây dựng từ điển phát âmdựng từ điển phát âm  Các quá trình được thực hiện trước có thể Các quá trình được thực hiện trước có thể sinh ra nhiều kết quả và chuyển cho quá sinh ra nhiều kết quả và chuyển cho quá ằằtrình sau với hy vọng rằng quá trình sau có trình sau với hy vọng rằng quá trình sau có thể xác định kết quả đúng đắn khi có nhiều thể xác định kết quả đúng đắn khi có nhiều thông tin hơnthông tin hơnthông tin hơnthông tin hơn ––Ví dụ: dấu chấm câu có thể được dùng sau một Ví dụ: dấu chấm câu có thể được dùng sau một từ viếttắthoặc dùng để kết thúc câutừ viếttắthoặc dùng để kết thúc câutừ viết tắt hoặc dùng để kết thúc câutừ viết tắt hoặc dùng để kết thúc câu Một vài ví dụ về trường hợp nhầm lẫn trong Một vài ví dụ về trường hợp nhầm lẫn trong ộ ụ g ợp gộ ụ g ợp g chuẩn hóa văn bảnchuẩn hóa văn bản Các luồng dữ liệuCác luồng dữ liệuCác luồng dữ liệuCác luồng dữ liệu  Hầu hết các hệ thống TTS cung cấp tập hợp Hầu hết các hệ thống TTS cung cấp tập hợp các thẻ đánh dấu để cung cấp thêm thông các thẻ đánh dấu để cung cấp thêm thông tin cho việc đọc văn bảntin cho việc đọc văn bản  W (Words): cấu trúc từW (Words): cấu trúc từ  ΣΣ: cấu trúc âm tiết: cấu trúc âm tiết  C (Controls): cấu trúc âm vịC (Controls): cấu trúc âm vị  S (Syntax/Semantic): cú pháp, ngữ nghĩaS (Syntax/Semantic): cú pháp, ngữ nghĩaS (Sy ta /Se a t c) cú p áp, gữ g aS (Sy ta /Se a t c) cú p áp, gữ g a –– NP (Noun Phrase)NP (Noun Phrase) –– VP (Verb Phrase)VP (Verb Phrase) –– S (Sentence)S (Sentence) [...]... dùng xác định âm vị sử dụng trong phát âm Xác định cấu trúc tài liệu Văn bản thô Trang web g Tài liệu XML Email a Thuật to n ngắt câu Chuẩn hóa văn bản Văn bản thường bao gồm các từ viết tắt như FDA cho từ “Food and Drug Administration” hay WTO cho từ World Trade Organization Tài liệu kỹ thuật có thể bao gồm các biểu liệ h ậ ó hể b ồ á biể thức to n học, đồ thị, bảng biểu Nội dung email có thể có các... W3C: World Wide Web Consortium PseudoPseudo-acronyms – IOU: “I owe you” I you – CQR: “secure”, a brand of boat anchor 19 Chuẩn hóa văn bản Number formats – Phone numbers 0 2-1 2340 2-1 23 4-5 678 (02) 123 4-5 678 1234+8 2- 1234+8 2-2 -1 23 4-5 678 – Dates 12/19/94 December nineteenth ninety four 04/27/1992 April twenty seventh nineteen ninety two May 27, 1995 May twenty seventh nineteen ninety five 1,994 one thousand... word – NATO North Atl ti Treaty Organization NATO: th tlantic t i ti – scuba: self-contained underwater breathing apparatus elf- Pronounced as the names of letters – DNA: deoxyribonucleic acid eoxyribon – LED: light-emitting diode ight- Pronounced as the names of letters but with a shortcut – IEEE: Institute of Electrical and Electronics Engineers – W3C: World Wide Web Consortium PseudoPseudo-acronyms... front-stress vowel, verb with frontendend-stress vowel “an absent boy” vs “Do you choose to absent yourself?” – Voicing: noun/verb or adjective/verb distinction made by voice final consonant “They will abuse him.” vs “They won’t take abuse.” – -ate words: noun/adjective sense uses schwa, verb sense t d / dj ti h b uses a full vowel “He will graduate.” vs “He is a graduate.” – Double stress: front-stressed... re nation al ize prefix stem suffix Khi một từ không được liệt kê t o g từ điển, ột ô g ệt ê trong để , ta có thể phân tách từ mới này thành các từ ngắn hơn đã có Thuật to n phân tích hình thái từ Từ vựng phát âm Trong xử tiếng nói, từ vựng phát âm được dùng để lưu trữ sự tương ứng giữa cách đánh vần và phát âm của từ Hầu hết các hệ thống TTS sử dụng kết hợp từ vựng và các luật cho phát âm ừ à á... b uses a full vowel “He will graduate.” vs “He is a graduate.” – Double stress: front-stressed before noun end-stressed frontnoun, endwhen final in phrase “an overnight bag” vs “Are you staying overnight?” – -ed adjectives with matching verb past tenses “He is a learned man.” vs “He learned to play piano.” Phân tích hình thái từ Phân tách từ: re nation al ize prefix stem suffix Khi một từ không được... two six twenty four twenty six two thousand four hundred (and) twenty six 22 Chuẩn hóa văn bản DomainDomain-specific tags – Mathematical expressions (MathML) (x + 2)2 x 2 2 – Chemical formula (CML) C2OCHO4 BUILTIN=“STOICH”> C C O C O H H H H 23 Phân tích ngôn ngữ Phân biệt các từ có cách viết giống nhau... project was behind schedule The new images project well onto the wall g p j Ngữ điệu Ngữ điệu liên quan đến: – Khoảng dừng: để tách biệt các cụm từ khác nhau – Tần số cơ bản F0: tần số dao động của dây thanh – Khoảng thời gian phát âm – Cường độ âm g ộ Sơ đồ tạo ngữ điệu trong TTS Trong sơ đồ trên, dữ liệu vào là chuỗi văn bản với các chuỗi các âm vị, dữ liệu ra là khoảng thời gian phát âm cho mỗi âm vị và... nineteen ninety four 20 Chuẩn hóa văn bản Number formats – Times 11:15 eleven fifteen 5:20 am five twenty am 12:15:20 twelve hours fifteen minutes and twenty seconds 07:55:46 seven hours fifty-five minutes and forty-six fiftyfortyseconds – M Money and currency d $40 forty dollars 300 € three hundred euros 21 Chuẩn hóa văn bản Number formats – Ordinal numbers 1/2 one h lf half 1/3 one third 1/4 one quarter... thẻ, ví dụ: The 7% Solution Ví dụ: “at 8 am I …” Có thể được chuyển thành: ợ y At eight am I … At e g t a I … t u be eight / u be am Thuật to n mở rộng các từ viết tắt Bước 1: Nếu từ w không có trong bảng từ viết tắt dạng rút gọn chuyển sang bước 3 Bước 2 B ớ 2: Mở rộng từ viết tắt d ộ ừ iế ắ dạng rút gọn: ú – Nếu từ viết tắt tương ứng được . formats –– Phone numbersPhone numbers 020 2-- 1234123 4-- 56785678 (02) 1234(02) 123 4-- 56785678 +82+8 2-- 2 2-- 1234123 4-- 56785678 ––DatesDates 12/19/9412/19/94. trúc tài liệuXác định cấu trúc tài liệuXác định cấu trúc tài liệuXác định cấu trúc tài liệu  Văn bản thôVăn bản thô  Trang webTrang webgg  Tài liệu

Ngày đăng: 14/12/2013, 10:15

Hình ảnh liên quan

thức toán học, đồ thị, bảng biểu - Tài liệu Xử lý tiếng nói - Text to Speech System pdf

th.

ức toán học, đồ thị, bảng biểu Xem tại trang 14 của tài liệu.
bảng: mở rộng từ viết tắt bằng cách thêm thẻ - Tài liệu Xử lý tiếng nói - Text to Speech System pdf

b.

ảng: mở rộng từ viết tắt bằng cách thêm thẻ Xem tại trang 17 của tài liệu.
Phân tích hình thái từ - Tài liệu Xử lý tiếng nói - Text to Speech System pdf

h.

ân tích hình thái từ Xem tại trang 26 của tài liệu.
Thuật toán phân tích hình thái từ - Tài liệu Xử lý tiếng nói - Text to Speech System pdf

hu.

ật toán phân tích hình thái từ Xem tại trang 27 của tài liệu.
dựa vào luật sử dụng một bảng tìm kiếm - Tài liệu Xử lý tiếng nói - Text to Speech System pdf

d.

ựa vào luật sử dụng một bảng tìm kiếm Xem tại trang 38 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan