Xử lý tiếng nói - Speech Synthesis for Vietnamese

15 768 6
Xử lý tiếng nói - Speech Synthesis for Vietnamese

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài 6:Bài 6: Tổng hợp tiếng nói tiếng ViệtTổng hợp tiếng nói tiếng Việt  Ở Việt Nam, việc nghiên cứu trong lĩnh vực Ở Việt Nam, việc nghiên cứu trong lĩnh vực xử tiếng nói mới được phát triển trong xử tiếng nói mới được phát triển trong thời gian gần đâythời gian gần đây  Tổng hợp tiếng nói tiếng Việt chủ yếu dựa Tổng hợp tiếng nói tiếng Việt chủ yếu dựa àh há hé ốiáđ ị âàh há hé ốiáđ ị âvào phương pháp ghép nối các đơn vị âmvào phương pháp ghép nối các đơn vị âm Âm tiếttiếng ViệtÂm tiếttiếng ViệtÂm tiết tiếng ViệtÂm tiết tiếng Việt  Âm tiết là đơn vị ngữ âm nhỏ nhất khi nói. Âm tiết là đơn vị ngữ âm nhỏ nhất khi nói. Cho dù phát âm thật chậm, thật rõ ràng thì Cho dù phát âm thật chậm, thật rõ ràng thì những âm thanh tiếng nói phát ra không những âm thanh tiếng nói phát ra không thể chia nhỏ ra được nữa.thể chia nhỏ ra được nữa. Âiế óíh à đ bởiÂiế óíh à đ bởi  Âm tiết có tính toàn vẹn được tạo ra bởi Âm tiết có tính toàn vẹn được tạo ra bởi một đợt căng của bộ máy phát âmmột đợt căng của bộ máy phát âm Cá đợt ă ốitiế htthà h ộtCá đợt ă ốitiế htthà h ột  Các đợt căng nối tiếp nhau tạo thành một Các đợt căng nối tiếp nhau tạo thành một chuỗi âm tiết chuỗi âm tiết Đặc điểmâmtiếttiếng ViệtĐặc điểmâmtiếttiếng ViệtĐặc điểm âm tiết tiếng ViệtĐặc điểm âm tiết tiếng Việt  Tính độc lậpTính độc lập ––Âm tiết tiếng Việt được thể hiện rõ ràng, riêng Âm tiết tiếng Việt được thể hiện rõ ràng, riêng biệt với nhau. Trong tiếng Việt không có hiện biệt với nhau. Trong tiếng Việt không có hiện tượng nối âmtượng nối âm  Có khả năng mang ý nghĩaCó khả năng mang ý nghĩa  Có khả năng mang ý nghĩaCó khả năng mang ý nghĩa ––Hầu hết các âm tiết tiếng Việt đều mang ý nghĩaHầu hết các âm tiết tiếng Việt đều mang ý nghĩa  Âm tiết tiếng Việt có cấu trúc chặt chẽ. Mỗi Âm tiết tiếng Việt có cấu trúc chặt chẽ. Mỗi âm tiết tiếng Việt ở dạng đầy đủ có 5 thành âm tiết tiếng Việt ở dạng đầy đủ có 5 thành phần như sau:phần như sau: Thanh điệuThanh điệu Âm đầuÂm đầuVầnVần Âm đệmÂm đệm Âm chínhÂm chính Âm cuốiÂm cuốiÂm đệmÂm đệm Âm chínhÂm chính Âm cuốiÂm cuối  Âm đầu:Âm đầu: ––Thường là phụ âm, có chức năng tạo ra âm sắc Thường là phụ âm, có chức năng tạo ra âm sắc  ể ểcho âm tiết lúc mở đầu. Âm đầu có thể khuyết cho âm tiết lúc mở đầu. Âm đầu có thể khuyết trong một số trường hợp.trong một số trường hợp.  Âm đệm:Âm đệm:  Âm đệm:Âm đệm: ––Có chức năng làm thay đổi âm sắc của âm tiết Có chức năng làm thay đổi âm sắc của âm tiết lúc khởi đầu và làm phân biệt âm tiết này với âm lúc khởi đầu và làm phân biệt âm tiết này với âm p ệ yp ệ y tiết khác. Âm đệm có thể khuyết trong một số tiết khác. Âm đệm có thể khuyết trong một số trường hợp.trường hợp.  Âm chính:Âm chính: –– Luôn luôn có mặt trong mọi âm tiết, có chức năng Luôn luôn có mặt trong mọi âm tiết, có chức năng ắ Âắ Âquy định âm sắc chủ yếu của âm tiết. Âm chính quy định âm sắc chủ yếu của âm tiết. Âm chính luôn luôn là nguyên âmluôn luôn là nguyên âm  Âm cuối:Âm cuối:  Âm cuối:Âm cuối: ––Có thể là phụ âm hoặc bán nguyên âm, có chức Có thể là phụ âm hoặc bán nguyên âm, có chức năng là cơ sở phân chia loại hình âm tiết, để nhận năng là cơ sở phân chia loại hình âm tiết, để nhận g p ạ , ậg p ạ , ậ ra sự xuất hiện của thanh điệura sự xuất hiện của thanh điệu  Thanh điệu: Thanh điệu: –– luôn có mặt trong âm tiết, có chức năng phân luôn có mặt trong âm tiết, có chức năng phân biệt âm tiết về cao độbiệt âm tiết về cao độ Các giải pháp tổng hợp tiếng nói Các giải pháp tổng hợp tiếng nói g pp g ợp gg pp g ợp g tiếng Việttiếng Việt  Ghép tiếng nói từ những từ riêng lẻGhép tiếng nói từ những từ riêng lẻ  Ghép tiếng nói từ những đơn âm cơ bảnGhép tiếng nói từ những đơn âm cơ bảnp g gp g g  Ghép tiếng nói theo hai phần: phụ âm đầu Ghép tiếng nói theo hai phần: phụ âm đầu và phần vầnvà phần vần  Ghép tiếng nói từ các âm vị kép (diphone)Ghép tiếng nói từ các âm vị kép (diphone) Tổng hợp tiếng việt bằng cách ghép nối Tổng hợp tiếng việt bằng cách ghép nối g ợp g ệ ggpg ợp g ệ ggp các âm vị kép (diphone)các âm vị kép (diphone)  Tiếng việt là ngôn ngữ đơn âm tiết, bất kỳ Tiếng việt là ngôn ngữ đơn âm tiết, bất kỳ từ nào cũng có thể được tạo thành từ hai từ nào cũng có thể được tạo thành từ hai âm vị képâm vị kép (diphone) ghép lại(diphone) ghép lại  Ví dụ: Ví dụ: ểể–– từ từ tôitôi có thể phân tích thành hai diphone “có thể phân tích thành hai diphone “ tô”tô” và và ““ ôi”ôi” Các bước thực hiện tổng hợp tiếng nói Các bước thực hiện tổng hợp tiếng nói ự ệ g ợp gự ệ g ợp g tiếng Việttiếng Việt 1.1. Thu âm và tạo cơ sở dữ liệu diphoneThu âm và tạo cơ sở dữ liệu diphone 2.2. Phân tích văn bản, xác định các diphone Phân tích văn bản, xác định các diphone , ị p, ị p cần sử dụng để tổng hợpcần sử dụng để tổng hợp 3.3. Ghép nối các diphone để tạo thành tiếng Ghép nối các diphone để tạo thành tiếng nói tương ứngnói tương ứng 4.4. Làm trơn và biến đổi thanh điệu tiếng nói Làm trơn và biến đổi thanh điệu tiếng nói sau khi ghép nốisau khi ghép nối Các diphone trong tiếng việtCác diphone trong tiếng việtCác diphone trong tiếng việtCác diphone trong tiếng việt  Mỗi từ trong tiếng việt có thể được tạo Mỗi từ trong tiếng việt có thể được tạo thành từ hai diphonethành từ hai diphone  Từ = diphone bắt đầu + diphone kết thúcTừ = diphone bắt đầu + diphone kết thúc ––Ví dụ: bạn = ba + an + thanh điệuVí dụ: bạn = ba + an + thanh điệu  Diphone bắt đầu: một phụ âm đứng trước Diphone bắt đầu: một phụ âm đứng trước và tiếp theo là nguyên âmvà tiếp theo là nguyên âm –– Ví dụ: ba, khaVí dụ: ba, kha  Diphone kết thúc: một nhóm các nguyên Diphone kết thúc: một nhóm các nguyên â đứ t ướ àtiế th là h ââ đứ t ướ àtiế th là h ââm đứng trước và tiếp theo là phụ âmâm đứng trước và tiếp theo là phụ âm ––Ví dụ: an, ươngVí dụ: an, ương [...]... tiếng việt là 389 diphone trong đó có 61 diphone kết thúc có dấu Xem bả phụ lục các di h X bảng h l á diphone tiếng việt iế iệ Xây dựng cơ sở dữ liệu diphone y ự g ệ p tiếng việt Thu âm các mẫu tiếng nói Tách các diphone từ mẫu tiếng nói p g Lưu trữ dạng sóng âm thanh của diphone vào cơ sở dữ liệu Tổng hợp tiếng nói bằng cách g p hai g ợp g g ghép phần: phụ âm đầu và phần vần Theo thống kê, trong tiếng. .. làm âm đầu và 650 vần Xem bảng phụ lục các phụ âm đầu và vần trong tiếng Việt Xây dựng cơ sở dữ liệu p ụ âm đầu và y ự g ệ phụ phần vần Thu âm các mẫu tiếng nói Tách các phụ âm đầu và p p ụ phần vần từ mẫu tiếng nói Lưu trữ dạng sóng âm thanh của phụ âm đầu và phần vần vào cơ sở dữ liệu Các bước thực hiện tổng hợp tiếng nói ự ệ g ợp g tiếng Việt 1 2 3 4 Thu âm và tạo cơ sở dữ liệu phụ âm đầu và phần... âm và tạo cơ sở dữ liệu phụ âm đầu và phần vần Phân tích văn bản, xác định phụ âm đầu và vần tạo nên từ Ghép nối phụ âm đầu và phần vần tương ứng trong CSDL để tạo thành tiếng nói tươ ứ tương ứng Làm trơn và biến đổi thanh điệu tiếng nói sau khi ghép nối . tổng hợp tiếng nói Các giải pháp tổng hợp tiếng nói g pp g ợp gg pp g ợp g tiếng Việttiếng Việt  Ghép tiếng nói từ những từ riêng lẻGhép tiếng nói từ những. hợp tiếng nói tiếng ViệtTổng hợp tiếng nói tiếng Việt  Ở Việt Nam, việc nghiên cứu trong lĩnh vực Ở Việt Nam, việc nghiên cứu trong lĩnh vực xử lý tiếng

Ngày đăng: 07/11/2013, 07:15

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan