Luan van tot nghiep nghiên cứu các đặc trưng của tiếng việt để áp dụng nhân dạng tiếng việt

116 725 1
Luan van tot nghiep nghiên cứu các đặc trưng của tiếng việt để áp dụng nhân dạng tiếng việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đ I H C QU C GIA THÀNH PH H CHÍ MINH TRƯ NG Đ I H C KHOA H C T NHIÊN B MÔN CÔNG NGH TRI TH C LU N VĂN T T NGHI P C NHÂN CÔNG NGH THÔNG TIN NGHIÊN C U CÁC Đ C TRƯNG C A TI NG VI T ÁP D NG VÀO NH N D NG TI NG NÓI TI NG VI T Giáo viên hư ng d n: Th.S Thái Hùng Văn Sinh viên th c hi n: Đ Xuân Đ t – 9912540 Võ Văn Tu n – 9912737 Thành ph H Chí Minh, tháng năm 2003 L i C m Ơn Hoàn thành lu n văn này, chúng em xin chân thành c m ơn th y Thái Hùng Văn ñã tr c ti p hư ng d n t o ñi u ki n cho chúng em ti p c n v i lĩnh v c nh n d ng ti ng nói, m t lĩnh v c vô lý thú Chúng em xin g i l i c m ơn ñ n th y trư ng, đ c bi t th y cô b môn Công Ngh Tri Th c, th y Tr n Ti n Đ c trư ng ĐH Sư Ph m K Thu t ñã truy n ñ t cho chúng em nhi u ki n th c b ích Chúng tơi khơng th khơng nh c đ n s đ ng viên chăm sóc c a gia đình, s c ng tác giúp ñ ng h tinh th n c a b n bè, ñ c bi t b n Nguy n T n Dũng anh Đ ng Hoàng Vũ Chúng xin ghi ơn t t c Thành ph H Chí Minh, tháng năm 2003 Đ Xuân Đ t - Võ Văn Tu n i L i Gi i Thi u Trong q trính ti n hố, ngư i ñã tr thành ñ ng v t m nh nh t, cao c p nh t nh vào hai th : lao ñ ng ti ng nói Lao đ ng t o tư ti ng nói giúp ngư i k t h p v i Cùng v i th i gian, phương ti n giao ti p - thông tin c a ngư i ñã phát tri n r t phong phú ña d ng Tuy nhiên, dù ña d ng đ n đâu khơng th thay th đư c vai trị c a ti ng nói Ti ng nói m t phương ti n giao ti p ñ c bi t hi u qu c c kỳ ph d ng, m t ch c vô quý giá c a ngư i [L.V.L i-99] S phát tri n vư t b c c a ngư i nh t c ñ kh giao ti p phong phú c a ti ng nói Ngày nay, nh s phát tri n c a khoa h c k thu t, máy móc d n d n thay th lao đ ng tay chân Tuy nhiên ñ ñi u n máy móc, ngư i ph i làm nhi u thao tác t n nhi u th i gian c n ph i ñư c ñào t o Đi u gây tr ng i khơng đ i v i vi c s d ng máy móc, thành t u khoa h c k thu t Chúng ta tư ng tư ng nhà có m t ngư i máy giúp vi c Khi ta mu n ngư i máy làm vi c, ta ph i l c tìm đĩa chương trình tương ng, ph i n p chương trình, … ph i ch y lăng xăng làm m t danh sách công vi c lúc ta ng i bên bàn làm vi c, ñang ph i t p trung suy nghĩ vào m t v n ñ c n gi i quy t Và ta tư ng tư ng xem n u ngư i máy “nghe hi u” đư c nh ng ta nói Lúc ta ch c n “nh v ” m t câu, m i vi c s tr nên d dàng! Đi tìm gi i pháp giúp cho máy có th “nghe hi u” ñư c, ngư i ñã bư c vào lĩnh v c nh n d ng ti ng nói Hơn n a th k trơi qua, ngư i ñã thu ñư c nh ng thành t u ñáng k , có nh ng ng d ng h u ích vào đ i s ng Nhưng dù sao, kh “nghe hi u” c a máy v n m t kho ng cách xa so v i th c t M t khác, h th ng nhân d ng hi n ch ñư c phát tri n tương ñ i t t đ i v i m t s ngơn ng ti ng Anh, ti ng Pháp, ti ng Hoa,… Cịn đ i v i nư c ta, nh n d ng ti ng nói v n cịn m t lĩnh v c m i m Đ n ñã ñ t ñư c m t s thành t u có nh ng ng d ng nh t đ nh, nhìn chung, nh n d ng ti ng Vi t v n chưa ñ t ñư c k t qu c n thi t đ có th t o m t s n ph m th c t hoàn ch nh Khó khăn n m tính ph c t p c a v n ñ m c ñ ñ u tư k th a chưa cao Các nghiên c u ch y u v n nh n ii d ng ti ng nói chung chung ch chưa có nhi u phân tích k đ c tính riêng c a ti ng Vi t Các h nh n d ng trư c ñây h u h t khơng phân bi t đư c t đ ng âm như: a, á, à, , ã, … Hơn n a kích thư c t n (s t nh n bi t đư c) cịn nh , th i gian h c m u lâu, nh n d ng mang tính ph thu c ngư i nói cao V n đ cịn khó khăn ch nh n d ng ti ng nói mang tính liên ngành [T.H.Văn00] Nghiên c u nh n d ng ti ng nói b ng máy tính nghiên c u c m t h th ng ngành khoa h c có liên quan như: ngôn ng h c, th ng kê h c, sinh lý h c, v t lý h c, toán h c, âm h c, tâm lý h c, lý thuy t thông tin truy n tin… dĩ nhiên có c cơng ngh thơng tin Lu n văn xây d ng v i mong mu n góp ph n kh c ph c nh ng h n ch trên, nâng cao hi u qu nh n d ng ti ng Vi t; b ng cách rút trích s d ng nhi u đ c trưng âm h c ti ng Vi t hơn, t ñó dùng nhi u ñ c trưng ñ nh n d ng giúp nâng cao đ xác phân bi t ñư c t ñ ng âm góp ph n nâng kích thư c t n lên l n N i dung lu n văn ñư c trình bày thành chương sau: Chương 1: Ti ng nói ng âm ti ng Vi t Chương th nh t tóm t t v ti ng nói trình bày m t s đ c ñi m ng âm ti ng Vi t Trong s ñó, lu n văn quan tâm nhi u ñ n ñi u, ñ c ñi m khác bi t c a ti ng Vi t so v i nhi u ngơn ng khác Chương 2: X lý tín hi u s - phân tích ti ng nói: Trình bày m t s ki n th c b n v x lý tín hi u s m t s phương pháp ti p c n tín hi u ti ng nói Chương 3: Nh n d ng ti ng nói Chương mơ t m t h nh n d ng ti ng nói t ng quát, ñi c th vào h nh n d ng ti ng nói s d ng mơ hình Markov n liên t c Chương 4: M t s kh o sát v ñi u ti ng Vi t Đây kh o sát c a ngư i vi t v ñi u ti ng Vi t K t qu kh o sát s ñư c k t h p, so sánh v i nghiên c u v ng âm ti ng Vi t trư c ñây ñ rút ñ c ñi m ng âm ti ng Vi t, làm s cho vi c xây d ng m t h nh n d ng ti ng Vi t theo mô t c a lu n văn Chương 5: Xây d ng mơ hình nh n d ng ñi u ti ng Vi t Nh n d ng ñi u bư c ñ u tiên ng d ng nghiên c u nói vào m t h iii nh n d ng ti ng Vi t c a lu n văn B t đ u t đ c tính đ c trưng c a ti ng Vi t ñi u Chương 6: Thi t k mơ hình nh n d ng ti ng Vi t Ph n thi t k c a lu n văn v m t h nh n d ng ti ng Vi t hồn ch nh ng d ng mơ đun nh n d ng ñi u vào m t h nh n d ng ti ng Vi t hoàn ch nh Chương 7: Hi n th c hố mơ hình nh n d ng ti ng Vi t Chương cu i cài ñ t c th c a lu n văn v m t h nh n d ng ti ng Vi t Ph n ph l c 1: gi i thi u v m t s ñ c ñi m ng âm ti ng Vi t Trong ñó, lu n văn ý nhi u ñ n ñ c ñi m ñi u ñư c dùng ñ ng d ng phân l p ti ng Vi t Ph n ph l c 2: Gi i thi u vai trò c a t n s b n ti ng nói m t s phương pháp rút trích t n s b n iv M cL c L i C m Ơn i L i Gi i Thi u .ii M c L c v Chương Ti ng nói ng âm ti ng Vi t 1.1 Gi i thi u ti ng nói 1.1.1 S phân b v biên ñ 1.1.2 S phân b v t n s 1.1.3 S bi n ñ i t n s b n 1.1.4 T s ti ng nói 1.2 Ng âm ti ng Vi t (Tham kh o ph l c 1) 1.2.1 Thanh ñi u 1.2.2 Âm v 1.2.3 Trư ng ñ Chương X lý tín hi u s - phân tích tín hi u ti ng nói 2.1 X lý tín hi u s 2.1.1 L y m u tín hi u Hàm l y m u: 2.1.1.1 Ph c a tín hi u đư c l y m u 2.1.1.2 M i quan h gi a ph c a tín hi u r i r c ph c a tín hi u liên t c theo th i gian th i gian 2.1.2 Dãy xung 10 2.1.3 Bi n ñ i Fourier r i r c 11 2.1.3.1 Bi n ñ i Fourier r i r c 12 v 2.1.3.2 Bi n ñ i Fourier nhanh 13 2.1.4 Bi n ñ i cosin r i r c 13 2.1.5 Các b l c 14 2.1.6 C a s tín hi u 15 2.2 Phân tích tín hi u ti ng nói 20 2.2.1 Phương pháp dãy b l c 20 2.2.2 Trích ñ c trưng MFCC 28 2.2.3 Phương pháp mã hóa d báo n tính (LPC) 32 2.2.3.1 Làm rõ tín hi u .34 2.2.3.2 Phân ño n thành frame 34 2.2.3.3 L y c a s 35 2.2.3.4 Phân tích t tương quan 36 2.2.3.5 Phân tích LPC 36 2.2.3.6 Chuy n h s LPC thành h s cepstral 37 2.2.3.7 Đ t tr ng s cho h s cepstral 37 2.3 Phát hi n chu kỳ ti ng nói – phương pháp tìm t n s b n (Tham kh o ph l c 2) 38 2.3.1 Các k thu t theo mi n th i gian 39 2.3.2 Các k thu t phân tích ph h u h n 39 2.3.3 Mơ t tín hi u 40 2.3.3.1 Ti ng nói thơ 40 2.3.3.2 L i d báo n tính 40 2.3.4 M t s phương pháp cài ñ t k thu t trích F0: 41 2.3.4.1 Phương pháp dùng cepstral: 41 2.3.4.2 Phương pháp t tương quan: 41 2.3.4.3 Phương pháp CLIP (center clipping pitch detector) 42 vi 2.3.4.4 Phương pháp SIFT (Simplified Inverse Filter Tracking) 43 2.3.4.5 Hàm AMDF (Average Magnitude Difference Function) 43 2.3.4.6 Phương pháp so kh p biên ñ 43 Chương Nh n d ng ti ng nói 46 3.1 T ng quan m t h nh n d ng: 46 3.2 T ng quan m t h nh n d ng ti ng nói: 46 3.3 Nh ng thu n l i khó khăn c a nh n d ng ti ng nói: 49 3.4 Nh n d ng ti ng nói s d ng mơ hình Markov n 50 3.4.1 Mơ hình Markov n toán c n gi i quy t: 50 3.4.1.1 Gi i quy t toán th nh t: 51 3.4.1.2 Gi i quy t toán th hai: 52 3.4.1.3 Gi i quy t toán th ba: 52 3.4.2 Mơ hình Markov n liên t c (CDHMM - Continuous Densities Hidden Markov Model) 55 Chương M t s kh o sát v ñi u ti ng Vi t 59 4.1 Thanh (Thanh ngang) 59 4.2 Thanh (Thanh huy n) 60 4.3 Thanh (Thanh ngã) 61 4.4 Thanh (Thanh h i) 63 4.5 Thanh (Thanh s c) 64 4.6 Thanh (Thanh n ng) 66 Chương Xây d ng mơ hình nh n d ng u ti ng Vi t 66 5.1 Ti n x lý 66 5.2 Trích F0 t tín hi u ti ng nói (pitch extraction) 69 5.3 T o vector ñ c trưng t vector V(F0) 71 5.4 Hu n luy n cho mơ hình 72 vii 5.5 Nh n d ng 73 5.6 M t s k t qu nh n d ng ñi u ti ng Vi t 74 Chương Thi t k mô hình nh n d ng ti ng nói ti ng Vi t 77 6.1 Cơng đo n hu n luy n 77 6.2 Cơng đo n nh n d ng 79 Chương Hi n th c hố mơ hình nh n d ng ti ng Vi t 80 7.1 Nh n d ng ti ng ñơn 80 7.2 Nh n d ng câu 82 Chương K t lu n 84 8.1 K t lu n 84 8.2 Hư ng phát tri n: 85 Tài li u tham kh o 86 Ph l c 1: Ng âm ti ng Vi t 87 Ph l c 2: Vai trò c a t n s b n m t s k thu t x lý t n s 100 viii Chương Ti ng nói ng âm ti ng Vi t 1.1 Gi i thi u ti ng nói Ti ng nói m t lo i sóng âm Khi ta nói, ti ng nói đư c truy n mang theo thơng tin dư i d ng dao ñ ng phương truy n ñ n tai ngư i nh n M c đ truy n tin c a ti ng nói ñư c xem nhanh nh t kh t nhiên c a ngư i Khác v i sách báo, thư tín… ch try n tin m t chi u, ti ng nói giúp ta truy n tin c hai chi u Sách báo giúp ta ghi l i thơng tin đ sau đ c l i, ti ng nói giúp ta th hi n b n thân Thơng qua cách nói chuy n, kh ng x , ta có th đánh giá đư c trình đ nhân cách c a mơt ngư i Ti ng nói phương ti n truy n tin nhanh nh t hi u qu nh t c a ngư i Ti ng nói có r t nhi u đ c tính: Đ c tính c a sóng âm g m đ c tính sinh lý, v t lý như: cư ng ñ , t n s , biên ñ , lư ng, âm s c, đ cao, đ to… Đ c tính xã h i như: ng ñi u, s c thái tình c m, đ a phương… S t đư c s d ng thư ng xuyên giao ti p h ng ngày c a m t ngư i dao ñ ng kho ng t 2000 ñ n 3000 t S t ngư i ta s d ng trung bình kho ng 5000 đ n 10000 t [5] Nghiên c u v nh n d ng ti ng nói máy tính, ta s xem xét ch y u ñ n t n s , biên ñ (hay lư ng) Ti ng nói có mi n t n s b n n m kho ng 80 – 8000 Hz [11] 1.1.1 S phân b v biên ñ Khi th ng kê v i kho ng 80 ngư i (4 ngư i/ ngôn ng ), ngư i ta nh n th y r ng biên ñ t i ña ñ t ñư c c a m t ti ng nói có th l n 50dB [5] Trong m t chu i ti ng nói, biên đ ti ng nói s phân b liên t c theo d ng hình sin s đ i l p V m t ng âm, ñ c tính c a ñi u h u khơng lan truy n lên ph âm đ u Ho c có (trong trư ng h p ph âm đ u h u vang), ño n ñ u c a âm ti t ñ c trưng khu bi t c a ñi u chưa th hi n rõ Tài li u ng âm thí nghi m ch ng minh r ng, thông tin ngôn ng h c c a ñi u ch th hi n rõ n a cu i c a âm ti t mà Ph n v n c a âm ti t có th bao g m âm ñ m, m t âm b t bu c có th có bán nguyên âm hay ph âm cu i S khác c a bi u hi n t p trung gi a cu i v n (t c nguyên âm ph âm cu i) Trong v n khơng có ph âm cu i (ví d : ta, tu), ho c có âm cu i bán ngun âm (ví d : mai, sau), hay có âm cu i ph âm vang (ví d : nam, lan xanh, mang) ñ c trưng c a ñi u ñư c ñ c trưng d dàng Ph c t p v n ñư c k t thúc b ng ph âm cu i vơ thanh, khép (ví d : t p, t p, hát, b t, bác, b c …) ño n gi ph âm cu i vơ có zero âm h c, v y đ c trưng c a khơng th hi n đư c đo n Nhưng v m t th c m, ph âm cu i v n ñư c nh n di n /-p/, hay /-t/, ho c /-k/ nh giai ño n t o thành ch t c s chuy n ti p t nguyên âm ñ n ph âm (Gordina, 1984) Giai ño n chuy n ti p luôn h u thanh, nên nh dó đ c trưng c a u ph n có bi u hi n r t h n ch Có th nói r ng, m i quan h v i thành ph n chi t ño n c a âm ti t, ñi u b s ch ñ nh rõ ràng nh t c a âm cu i Vì v y s phân b c a ñi u âm ti t ph thu c vào lo i hình k t thúc âm ti t S lư ng ñi u xu t hi n nh ng âm ti t k t thúc b ng ph âm cu i vô r t h n ch âm ti t ch có th s c ho c n ng Hai có đư ng nét âm u khơng đ i hư ng, ho c ñi lên (như s c) ho c ñi xu ng (như n ng) Nên d nh n di n nh ng âm ti t có trư ng đ giai đo n tính ng n S phân b c a ñi u m i quan h v i âm cu i có th tóm t t sơ đ sau: 93 Thanh s c n ng nh ng âm ti t có âm cu i vơ có nh ng ñ c ñi m riêng v ñ dài ñư ng nét âm ñi u khác v i s c n ng âm ti t l i (so sánh: tá / tán v i tát ta / t n v i t t) Vì v y, trư c t ng có quan ni m r ng nh ng ñi u âm ti t có âm cu i vơ nh ng u đ c bi t khác v i l i ti ng vi t ñư c ghi m t h th ng g m ñi u: tan, tàn, tãn, t n, tán, t n, tát, t t 1.4 V ñ c trưng b n c a ñi u ti ng Vi t tr ng thái tĩnh Như ñã bi t ti ng vi t thu c lo i ngơn ng đơn l p có u N u âm ti t m t ñơn v v i ch c làm v v t ch t c a hình v (đơn v nh nh t có ý nghĩa) di n m o ng âm c a c n ñư c xem xét theo c khía c nh: Ph âm t n s b n quan m âm v h c h th ng d u hi u khu bi t c a ng âm ti ng Vi t Qu v y b t kỳ m t âm ti t có m t u nh t đ nh ñi u bao gi t n t i âm ti t Xét v m t c u trúc, u thu c tính ng âm c a toàn b âm ti t, bao g m thông s âm h c b n: 1- t n s b n (F0), 2- cư ng ñ (I), 3- trư ng ñ (T) Xét v m t ch c năng, ñi u m t d u hi u hay m t chùm nét khu bi t c a toàn b âm ti t b i l đó, âm ti t ti ng vi t có c u trúc thành ph n: cáu trúc âm c u trúc ñi u c u trúc âm bao g m y u t chi t ño n; ñi u y u t siêu chi t ño n ñi u m t c u trúc ña chi u phi n tính Xét v s phân chi t, khơng có đ c tính phân l p xét v ch c l i có đ c tính phân l p 1.5 Di n m o v ñư ng nét c a ñi u qua s th c m b ng thính giác Thanh 1: có b n bi n u, ñư ng nét v b n ngang b ng ph ng Thanh 2: có ba bi n u, đư ng nét nói chung xu ng ñ u ñ n, b ng ph ng Thanh 3: có b n bi n u, đư ng nét b gãy gi a thành ño n, ño n hai ñi lên k t thúc cao Nét gãy gi a ph n l n b tách 94 có bi n u, nét gãy l i khơng b tách u ch ng t hi n tư ng t c h ng gi a c a tính ch t b t bu c Thanh 4: có ba bi n u, đư ng nét ban ñ u ñi xu ng r i sau ñó ñi lên ho c m nh (thư ng g p gi ng nam) ho c y u (thư ng g p gi ng n ) Thanh 5: có b n bi n ñi u, ñư ng nét ñi lên ho c ho c b ng ph ng ho c lên g p ng n Thanh 6: có năm bi n ñi u nói chung ñi xu ng g p ng n Đư ng nét ñi lên g p c a ñi xu ng g p c a có liên quan tr c ti p v i phương th c k t thúc c a âm ti t Nh n Xét: Tuỳ theo c u trúc c a âm ti t s phát âm cá nhân c a c ng tác viên, ñi u có th ñư c th hi n nh ng hình th c khác nh ng nét chung c a ñi u v n ñư c nh n di n qua ñư ng nét c a ñi u, b i l m t nh ng ñ c trưng ng âm b n c a ñi u ñư ng nét, t c s v n ñ ng c a t n s b n theo hàm th i gian T nh ng k t qu phân tích, có th miêu t đư ng nét c a ñi u sau: Thanh ñi u S miêu t ñư ng nét Ngang ñi xu ng ñ u ñ n b ng ph ng lên, xu ng – gãy – lên xu ng –lên Lên xu ng th p Thanh có hai hình th c th hi n: 5a, 5b, 6a, 6b Đư ng nét c a chúng ñư c miêu t sau: Thanh ñi u Hình th c th hi n 5a Đi lên ñ u ñ n 5b Đi lên g p 6a Đi xu ng th p 95 S miêu t ñư ng nét Đi xu ng th p g p 6b Âm v Xét v m t ng âm, âm v ñơn v nh nh t c a ti ng nói M i âm v có hai ch c : C u t o nên v âm c a đơn v có nghĩa Phân bi t v âm c a ñơn v có nghĩa Ví d : t tơi có âm v : “t”, “ơ”, “i” Đ n đây, m t câu h i ñư c ñ t âm v khác b i nh ng ñ c trưng Ta s xét ñ n ñ c trưng âm h c c u âm t o nên âm v Các ñ c trung b n c a âm v ñư c chia thành lo i tuỳ theo t ng tiêu chu n như: 2.1 Phân bi t nguyên âm theo v trí đ u lư i: ngun âm dịng trư c: phát âm, đ u lư i đưa v phía trư c Ví d : [i], [e] ngun âm dịng gi a: phát âm, ph n gi a c a lư i nâng lên phía ng c nguyên âm dòng sau: ph n sau c a lư i nâng lên phía ng c m m Ví d : [a], [u], [o] 2.2 Phân bi t nguyên âm d a vào đ m c a mi ng: ngun âm có ñ m r ng: [a], [ă] nguyên âm có ñ m h p: [i], [u] 2.3 Phân bi t nguyên âm theo hình dáng mơi: khơng trịn mơi: [i], [e], [a] trịn mơi: [o], [u] Ngồi ra, ngư i ta d a vào tiêu chu n khác như: tính mũi hố, trư ng đ … Ngư i ta mô t nguyên âm d a vào t t c tiêu chu n trên, ví d : [i] m t ngun âm có đ m h p, hàng trư c, khơng trịn mơi; [u] ngun âm hàng sau, trịn mơi, đ m i h p… 2.4 Phân bi t ph âm d a vào phương th c c u âm: 96 ph âm t c: khơng khí ñi b c n tr hoàn toàn, ph i phá v s c n tr y đ ngồi gây ti ng n ph âm xát: khơng khí b c n tr khơng hồn toàn, ph i lách m t khe h nh gi a hai quan c u âm, gây nên ti ng xát nh Ví d : [v], [f], [h]… ph âm rung: phát âm, ch lư i ho c ñ u lư i ch n ñ ng liên t c làm cho lu ng khơng khí b ch n l i m liên ti p, gây nên m t lo t ti ng rung Đó ph âm ki u [R] 2.5 Căn c vào v trí c u âm: âm mơi-mơi: v t c n hai môi, [m], [b]…; âm môi-răng, v t c n hàm mơi dư i [v], [f]… âm đ u lư i: ñ u lư i áp ch t vào hàm trên: [t], ho c ñ u lư i áp vào ng c hay l i: [d], [n], [l]… âm m t lư i: m t lư i ñư c nâng lên phía ng c c ng: [c] âm cu i lư i: ph n cu i lư i nâng lên ti p xúc ng c m m: [g], [k]… âm h u: khơng khí b c n tr h u: [h]… T ng h p tiêu chu n s giúp ta phân bi t âm v v i Ví d : ph âm [p] âm môi, n, vô thanh, t c, ph âm; ph âm [d] âm ñ u lư i, n, h u thanh, t c… 2.6 Phân bi t ph âm d a vào ñ c ñi m âm h c: âm vang: [m], [n], [l]… Các ph âm vang có đ c m thành ph n c u t o c a chúng, ti ng âm n: [t], [k], [b], [s]… Có nhi u ti ng đ ng (ti ng n) thành ph n c u t o Ph âm n chia hai lo i nh : h u ([b], [d], [g], [z]: dây rung) vô ([p], [t], [k], [s]: dây không rung) Khi phân lo i t ng quát, ngư i ta cịn d a vào m t s đ c m khác Đó tiêu chí lư ng phân, t ng h p l i s t o thành m t lư ng phân: Nguyên âm – không nguyên âm Ph âm – không ph âm B ng - tr m 97 Lỗng - đ c Ng t – không ng t G t – không g t Căng – lơi H u – vô Mũi - mi ng Giáng – không giáng Thăng – khơng thăng Thanh h u hóa – khơng h u hố Ưu m c a phân lo i âm h c: Có th xác đ nh tr c ti p âm mà không c n ph i thơng qua ho t đ ng c a b máy phát âm Nguyên âm ph âm ñư c phân chia bình đ ng D a lư ng phân mà có th đ xu t mơ hình giúp th c thi mơ hình giao ti p ngư i - máy Có m i tương ng v i phân lo i v c u âm Ngoài âm v , ta cịn có khái ni m “âm t ” Âm t s th hi n c th c a âm v Ví d : m t âm v [n], âm ti t khác khác nhau: m nh lên, y u đi, trịn mơi (“no”, “nô”) T ng cách phát âm c th c a âm v [n] t ng âm ti t “no” hay “nơ” m t âm t [n] Tóm l i, âm t bi n th c a âm v Các bi n th thư ng ñư c chia làm hai lo i: bi n th k t h p b qui ñ nh b i v trí, b i c nh; bi n th t n u không ph thu c b i c nh Trư ng ñ M t nh ng đ c m c a ngơn ng ti ng Vi t tính c đ nh v trư ng ñ c a âm ti t Các âm ti t n u m t lo i hình u s có m t đ dài b ng nhau, khơng k đ n s y u t tham gia c u t o âm ti t nhi u hay Ví d , hai âm ti t làm, mang m t ñi u huy n, có trư ng đ b ng nhau, dù ph n v n c a ch nguyên âm [ a ], ph n v n c a làm g m hai y u t nguyên âm [a] âm cu i [m] Đ đ m b o cho tính c đ nh c a trư ng ñ âm ti t, n i b c a ph n v n có s ñ p ñ i l n v trư ng ñ : n u nguyên âm ng n bán nguyên âm cu i / 98 ph âm cu i dài ngư c l i, n u nguyên âm dài bán nguyên âm cu i / ph âm cu i ng n Ngoài s ñ p ñ i v trư ng ñ , ph n v n cịn có s l thu c v ch t gi a nguyên âm âm cu i Gi a âm cu i âm s có s ti p h p l ng n u âm cu i ñi sau m t nguyên âm dài T đ c m v a nêu, có th nh n th y, nguyên âm (tr / ă / ) âm cu i ñ u có bi n th ng n dài nh hư ng c a âm cu i lên ti ng H th ng âm cu i Âm cu i y u t k t thúc âm ti t Các âm ti t ti ng Vi t có th k t thúc b ng cách bi n ñ i âm s c c a âm đ ng tác khép l i c a b máy phát âm, làm cho b ng ho c tr m Âm cu i trư ng h p hai bán nguyên âm /-u/ /-i/ Ví d : dâu, sao, ngày, mai Âm ti t ti ng Vi t cịn có th k t thúc b ng ñ ng tác khép c a b máy phát âm v i m t ph âm t c (mũi ho c mi ng), ví d : h c, t p, hành, ñ ng V m t âm v h c, h th ng âm cu i ti ng Vi t g m có bán nguyên âm ph âm Quy lu t bi n d ng c a âm âm cu i Trong s k t h p v i âm ñ u âm đ m, ngun âm làm âm có b nh hư ng nhi u Ch ng h n, sau âm ñ u ph âm mũi / m-, n-, , ŋ- /, nguyên âm nhi u b mũi hố Sau âm đ m / -u- /, nh hư ng c a tính ch t trịn mơi c a âm đ m, ngun âm b mơi hố, tr thành m t ngun âm chuy n s c Tuy nhiên, ñáng k c s bi n d ng c a âm âm cu i chúng k t h p v i Trong khuôn kh c a ph n v n, có s liên quan ch t ch gi a âm âm cu i S bi n đ i c a âm bao gi kéo theo s bi n ñ i c a âm cu i ngư c l i 99 Ph l c 2: Vai trò c a t n s b n m t s k thu t x lý t n s Vi c xác ñ nh t n s b n (F0) hay “pitch” c a tín hi u m t v n ñ quan tr ng nhi u ng d ng ti ng nói (M c dù pitch m t đ c tính nh n bi t c a ti ng nói, F0 đ i tư ng c n tính đây, “b c lư ng” thư ng ñư c g i b “dị tìm pitch”) Ti ng nói h u bao g m rung đ ng c a dây thanh, “pitch” ñ c p ñ n t n s b n c a rung đ ng hay chu kỳ tính đư c tín hi u ti ng nói Các x lý âm b n v ng ñi u nh n gi ng s quy t ñ nh âm v ngơn ng nói H u h t b mã hố ti ng nói m c ñ th p ñ u tính pitch ñ giúp cho ti ng nói tái t o có th ch p nh n ñư c, m t s b mã hố ti ng nói m c đ v a s d ng pitch ñ gi m b t m c ñ chuy n ñ i v n gi ñư c ti ng nói có ch t lư ng cao Thành ph n pitch r t có ích nh n d ng ngư i nói t ng h p ti ng nói (ng u t nhiên ph i tuân theo lu t) Bi u di n t n s theo th i gian th c có th cho ta m t ý tư ng ng d ng cho ngư i ñi c h c nói Vi c xác đ nh pitch đơn gi n ñ i v i h u h t ti ng nói, s thay đ i c a ti ng nói t nhiên, dao đ ng b t qui t c c a dây thanh, kho ng gi i h n giá tr F0 r ng, nh hư ng c a hình d ng b máy phát âm đ n F0, ti ng nói b gi m ch t lư ng môi trư ng n, thu t tốn thư ng khơng đ t đ xác 100% Các k thu t thi t b ph n c ng hi n có s d ng thêm thơng tin khác ngồi tín hi u ti ng nói, ví d : b ng cách đo ñi n tr qu n dây m đóng, thơng qua ti p xúc v i micrô hay gia t c k g n ngư i, hay thơng qua siêu âm ho c hình nh ho t ñ ng c a dây Tuy nhiên, ph n l n b dị tìm pitch thu t tốn máy tính thao tác tr c ti p tín hi u ti ng nói H u h t x lý đ u có m t ph n quy t ñ nh ti ng nói, x lý có th phân lo i lên đ n l p ti ng nói: h u thanh, vơ thanh, k t h p (ví d : /z/), kho ng l ng Không gi ng c lư ng pitch, vi c dị tìm ti ng nói (g m lo i r i r c) có v phù h p v i k thu t nh n d ng m u Ta có th dị tìm F0 t các tham s mang tính chu kỳ mi n th i gian hay t thay đ i u hồ cách theo qui lu t mi n t n s Các b dò 100 pitch theo mi n th i gian có thành ph n: b ti n x lý (dùng ñ l c ñơn gi n hố tín hi u thơng qua vi c thu nh d li u), mơđun s trích F0 (đánh d u pitch n m có d ng sóng), m t b x lý (dùng đ s a l i) Các thu t tốn th xác đ nh m t hay nhi u khía c nh sau c a tín hi u ti ng nói: hàm u hồ b n, c u trúc th i gian có chu kỳ, xen k gi a cư ng ñ cao th p, ñi m gián ño n Các hàm ñi u hồ c u trúc có chu kỳ thư ng cho k t qu t t, nhiên có vài trư ng h p cá bi t b sai Các thu t tốn dị tìm pitch thư ng chuy n s ph c t p m t thành ph n sang thành ph n khác Ví d : rút trích hàm u hồ b n c n ph i có m t b l c ph c t p đ làm cơng vi c ti n x lý l i ý ñ n m t b rút trích b n sơ c p ñơn gi n ñ m s zero crossing c a ti ng nói đư c x lý l c M t ngư ng đ ng khác khơng ñư c s d ng x lý ñ lo i b giá tr zero crossing không phù h p Nhìn chung, ti n x lý có th m t b l c thơng th p đơn gi n, ñ ph c t p vi c ch n t n s ngư ng s tăng lên tuỳ thu c vào kho ng gi i h n giá tr F0 Các k thu t mi n t n s dùng đ trích pitch g m: ñ tương quan, kh ñúng l n nh t, k thu t x lý ph khác có ki m tra tín hi u ti ng nói b ng m t c a s ng n T tương quan, đ l ch trung bình c a biên ñ , nén ph , phương pháp so kh p hàm u hồ x lý ti p c n ph Nhìn chung chúng có ñ xác cao k thu t mi n th i gian, chi phí tính tốn cao Trích pitch theo th i gian th c có m t ràng bu c giá tr F0 ph i đư c tính v i đ trì hỗn nh nh t B i h u h t k thu t x lý theo mi n t n s c n m t vùng ñ m m u ti ng nói trư c chuy n ñ i ph , chúng thư ng không nhanh b ng x lý tr c ti p d ng sóng theo th i gian.Ta có th s a l i m t s b dị tìm pitch đ ñ t t c ñ nhanh hơn, b ng cách gi m th i gian chu kỳ F0; ví d : có th c lư ng l i c u trúc có chu kỳ (và th i gian chu kỳ) nhanh chu kỳ th t s Các b dị tìm pitch th khơng k t xu t th i m mà tính kho ng th i gian phù h p cho ng d ng b mã hoá ti ng nói Các k thu t theo mi n th i gian Dư ng c lư ng t n s b n m t công vi c ñơn gi n; ngư i, ñ c bi t nhà ng âm h c c m th y d dàng kh o sát m t d ng sóng phân đo n thành chu kỳ liên t c B i s kích thích c a b máy phát âm lên m i chu kỳ F0 di n s i dây đóng l i, m i chu kỳ có khuynh hư ng b t ñ u b ng cư ng ñ l n (g i ñi m kh i ñ u) sau ñó gi m d n M c ñ gi m thư ng t l 101 ngh ch v i băng t n c a F1 Ngo i tr ti ng nói có chu kỳ ng n hay băng t n c a F1 h p, thư ng s có s suy gi m đ cho ta có th đ nh v đư c m kh i ñ u nh m t phép t tìm c c đ i đơn gi n, v i vài ràng bu c b n v th i gian chu kỳ N u gi i h n ngư i nói t gi ng tr em hay gi ng n cao ñ n gi ng nam trung, th i gian chu kỳ F0 có th kéo dài t nh ms ñ n l n 20 ms, m c dù gi i h n ñi n hình s nh hơn, ví d : 6-12 ms ñ i v i ñàn ông M t ràng bu c ñáng tin c y d a t c ñ thay ñ i F0; ph n h u c a ti ng nói, F0 thư ng thay ñ i ch m, hi m nhi u m t quãng kho ng 100 ms Trư c áp d ng ràng bu c liên t c trên, ngư i ta ph i tìm chu kỳ F0 xác vùng h u thanh, F0 có th thay đ i r t nhi u vùng vô c a ti ng nói (ví d : m b t đ u l i c a ti ng nói sau m t kho ng l ng hay âm t c có th có F0 sai l ch r t nhi u so v i F0 t i ñi m k t thúc ph n h u li n trư c) H u h t v n đ tìm F0 x y t i vùng biên gi a h u vô thanh, nơi mà ràng bu c liên t c khơng áp d ng đư c chu kỳ F0 g n b t qui t c Các khó khăn khác ph thu c vào thay ñ i ñ t ng t c a cư ng đ phc măng có th làm tăng ñư ng biên âm v Đ d dàng ti p c n vi c dị tìm m kh i đ u, thơng thư ng ti ng nói c n đư c x lý l c thơng th p bư c ti n x lý ñ ch cịn lưu tr F1 (ví d : kho ng 0-900 Hz) Đi u s lo i b nh hư ng c a phoóc măng cao mà v n gi l i ñư c t n s có hàm u hồ đ m nh đ xác ñ nh m t ñi m kh i ñ u xác M t cách ti p c n khác ch n ngư ng cư ng ñ thay đ i: b i chu kỳ có giá tr nh nh t kho ng ms, ñi m kh i ñ u ph i cách ms, b qua sai l ch tín hi u l n có th x y sau ñi m b t ñ u chu kỳ, ngư ng s gi m d n theo hàm mũ m c ñ ñ c trưng c a chu kỳ F0 M t cách ti p c n tr c ti p l c t t c lư ng t tín hi u ti ng nói ngo i tr t n s b n sau ki m tra s zero crossing (m i chu kỳ c a dao đ ng b n s có m zero crossing) M t khó khăn g p ph i xác ñ nh ngư ng cho b l c thông th p: ngư ng ñó ph i ñ l n ñ nh n ñư c m t dao đ ng gi ng nói cao ph i đ nh đ có th lo i b ñư c t t c dao ñ ng t th hai tr gi ng nói th p Khó khăn th hai, nhi u ng d ng dùng ti ng nói đư c l c thơng đ phân tích (ví d : n tho i, ñã lo i b mi n t n s 0-300 Hz), dao đ ng b n khơng ñư c bi u di n M t gi i pháp cho v n ñ tái t o dao ñ ng b n t dao ñ ng t n s cao thông qua m t phép c lư ng phi n, ví d : cho ti ng nói qua m t b tách sóng, đ t o lư ng c a t t c dao ñ ng thành ph n 102 Các k thu t c lư ng F0 d a theo mi n th i gian có thu n l i v s tính tốn đơn gi n Thêm vào đó, chúng đ nh v th i ñi m ch ñ nh cho ñi m kh i ñ u F0, ñi u th t s có ích c n tính chu kỳ F0 so v i vi c c lư ng F0 ñơn thu n Tuy nhiên, h th ng có t c đ nói khác (tăng hay gi m t c ñ , ph thu c ngư i dùng thích nghe t c đ nào) thơng thư ng làm b ng cách b qua hay nhân đơi chu kỳ F0, ghép n i ñi m kh i ñ u ñ gi m thi u s gián ño n d ng sóng Các k thu t phân tích ph h u h n L p th hai c a vi c c lư ng F0 m t kh i m u ti ng nói có nhi m v chuy n đ i m u tín hi u theo d ng ph đ làm tăng thơng tin mang tính chu kỳ tín hi u Tính chu kỳ xu t hi n ñ t c c ñ i ph mang tính tn hồn Trong c c đ i d ng sóng theo mi n th i gian thư ng d a tương tác gi a phoóc măng (ñ c bi t F1) v i s kích thích mơn, c c đ i ph thư ng d nh n bi t Trong h th ng này, ngư i ta có th xem phép bi n ñ i ph bư c ti n x lý b dị tìm c c ñ i ph b c lư ng F0 s Sau m t b x lý s ki m tra l i s a l i F0 ñư c c lư ng Các l i có th phân thành lo i b n sau: g p đơi hay gi m n a pitch, thi u bư c nh n d ng s hàm ñi u hồ l n đ u tiên L i g p đơi có khuynh hư ng x y m c lư ng c a t n s b n y u m c lư ng c a t n s k ti p (L i chia đơi F0 thư ng x y thu t toán theo mi n th i gian hơn, hai chu kỳ b nh m thành m t) Theo nghiên c u, F0 không th bi n thiên m t quãng m t khung h u h t b c lư ng pitch (thông thư ng s c lư ng F0 m i 10-30 ms), b x lý s áp d ng ràng bu c liên t c ñ làm trơn c lư ng thay ñ i b t thư ng Các l i sai l ch nh ch ng vài hertz khó x lý l i thơ, l i (ví d : g p đơi) có xu hư ng gia tăng khung phân tích q ng n (khơng ch a đ thơng tin đ xác đ nh pitch xác) hay dài (n u F0 thay ñ i nhanh khung) Hai trư ng h p sau minh ho s l a ch n ñ dài khung thích h p Cũng ng d ng l y c a s khác, tham s ti ng nói t t nh t tín hi u khơng đ i su t khung Vì v y ta nên l y khung ng n, nhi u nh t vài chu kỳ pitch, F0 có th thay đ i r t nhanh Cũng có th l i d ng tính ch t thay đ i nhanh c a ph t i ñư ng biên dùng vào b c lư ng pitch c a ph M t khác, m t khung ph i ch a nh t chu kỳ đ cung c p ñư c d u hi u mang tính chu kỳ Tính xác c a vi c tính F0 t l v i s m u khung phân tích Vì th , 103 khung ng n d g p l i tìm pitch Vì ch có m t gái tr F0 đư c rút t m i khung, ngư i ta thư ng l y trung bình F0 c lư ng ñư c khung M t ph c t p vi c trích pitch có ngun nhân t s khơng xác c a pha (g p ph i nhi u phương ti n truy n tin, ch ng h n ñi n tho i) t s sai l ch pha gi a các dao đ ng B i pha c a ph ti ng nói có th b thay đ i ñ n 1800 v i m i phoóc măng, dao ñ ng kho ng 200-900 Hz c a F1 dư ng có pha khác v i pha c a d ng sóng ph c t p th nh tho ng làm m tính chu kỳ vi c c lư ng pitch theo mi n th i gian M t gi i pháp cho vi c lo i b nh hư ng c a pha b ng cách dị tìm m c c ñ i, không ph i thao tác tr c ti p tín hi u ti ng nói đư c l c mà thơng qua tính t tương quan h u h n (k) Nh c l i (k) ngh ch ñ o c a phép bi n ñ i Fourier cho ph lư ng (|X(ejw)|2), đó, thi t đ t pha u hồ v giá tr zero M c dù m t tín hi u theo mi n th i gian, (k) không th ñ nh v ñi m b t ñ u pitch b i s m t mát pha phân tích h u h n Vì m c đích c lư ng F0, s tái t o ph lư ng khơng xác, tín hi u ti ng nói thư ng b bóp méo trính x lý trư c l y t tương quan đ gi m b t tính tốn gi tham s có tính tu n hồn Phương pháp c t tâm (Center clipping) th nh tho ng ñư c dùng ñ tăng hi u su t trích pitch Đó k thu t gán m u có cư ng đ th p b ng gi m m u có cư ng đ (biên ñ ) cao Tuy nhiên c t v y có th gây khó khăn cho vi c dị tìm pitch ti ng nói l n ( n) Ngư i ta ph i dùng m t ngư ng c t ñ ng, thư ng 30% c a cư ng đ ti ng nói l n nh t, đ thích nghi v i cư ng đ ti ng nói khác Phương pháp Infinite peak clipping đư c dùng ñ c lư ng pitch cho k t qu t t thông qua t tương quan gi m đáng k tính tốn t t c phép nhân ñ u ch g m giá tr Dùng c t xen k , tín hi u có th tăng đ n cư ng ñ cao (trong v n gi ñư c d u ñ i s c a m i m u ti ng nói) đ đánh d u c c ñ i d ng sóng Có th c lư ng F0 tr c ti p b ng cách ñ nh v c c ñ i ph b n Tuy nhiên cách làm thi u xác th c t có th rơi vào trư ng h p tín hi u ti ng nói đư c l c hay t n s b n có lư ng th p F1 C u trúc ñi u hoà (ph ñ t c c ñ i t i nhi u ñi m t n s b n) d u hi u xác ñ tách F0; t n s c a c s chung l n nh t c a dao ñ ng cho ta m t c lư ng F0 t t M t cách ti p c n khác tính s tách bi t t n s dao ñ ng c a ph ; m t l c ch n nén ph b ng s nguyên (ví d : nén t n s t l 2,3,4…): k t qu t n s b n th hi n c c ñ i t t ñư c tăng cư ng hàm u hồ 104 K thu t tìm đ tương t l n nh t có m t cách c lư ng pitch khác, ñ c bi t ch y t t đ i v i tín hi u ti ng nói n (l n) M t cách xác đ nh chu kỳ c a tín hi u môi trư ng n thêm kho ng l ng c a tín hi u tín hi u g c Khi kho ng l ng b ng chu kỳ pitch, tín hi u ti ng nói s ñư c khu ch ñ i, ti ng n (khác pha v i kho ng l ng) có xu hư ng b kh Các b dị tìm pitch c a ph cho ta c lư ng g n ñúng cách ti p c n theo mi n th i gian địi h i tính tốn chuy n ph nhi u Phép bi n đ i tr ng vào thơng tin v tính tu n hồn c a ti ng nói phân tích theo mi n th i gian khơng làm đư c Nh c l i, xác đ nh ti ng nói m t ph n c a vi c trích pitch, l i g p ph i h th ng có th phân làm lo i: l i F0 l n (ví d : g p đơi), l i F0 nh , l i nh m khung ti ng nói h u thành vô thanh, ngư c l i Không có thu t tốn có th đ ng th i x lý t t c lo i l i Ta có th c lư ng b dị tìm b ng cách dùng vào h th ng mã hố ti ng nói bi u di n kích thích b ng F0 k t lu n kích thích có ti ng nói hay khơng Khơng có l i tương ng v i khía c nh ch t lư ng mong đ i c a ti ng nói đư c mã hố, l i nh m l n t h u sang vơ gây cho ta nhi u khó ch u nh t d n đ n ti ng chói tai, âm n Trong tính tốn pitch khơng tương x ng v i mong ñ i l m, vi c s d ng thu t tốn trích pitch khác cho k t qu không chênh l ch nhi u Thu t tốn AMDF có l m t ch n l a t t, ñã ki m tra k t qu mong đ i cao, cho b mã hố ti ng nói quy t đ nh d a vào k t lu n m t tín hi u ti ng nói hay khơng c cho vi c tìm m i liên quan gi a k t qu mong ñ i v i l i F0 2.1 Rút g n thông tin Trong ng d ng mã hoá nh n d ng, m t công vi c l n c a vi c phân tích ti ng nói bi u di n thơng tin tín hi u m t cách có hi u qu mà v n ch a ñ tham s đ có th tái t o l i ho c nh n d ng đư c ti ng nói Trong mã hố, ta nh m vào m c đích làm gi m b nh hay t c ñ c n ph i truy n t i ti ng nói mà v n gi ñư c ch t lư ng t t nh t c a ti ng nói đư c tái t o theo m t sau: d hi u, t nhiên, có th nh n bi t đư c ngư i nói Vì v y, cách bi u di n mang tính kinh t c a khía c nh quy t đ nh tín hi u ti ng nói h t s c quan tr ng Trong h th ng nh n d ng, v n ñ v lưu tr ñư c ý ñ n bên c nh quan tâm ch y u đ nh n d ng xác Tuy nhiên, b nh n d ng s ch y nhanh n u m u d li u đư c lưu tr chi m b nh Hơn n a, m u t t, nh thư ng cho k t qu t t hơn, ví d : m u ch a d ng sóng ti ng nói đư c l y m u c n nhi u b nh lưu tr cho đ c tính ch t lư ng m u d ng ph hay d 105 báo n tính Trong c hai trư ng h p, vi c c t b thông tin dư ch a tín hi u ti ng nói r t quan tr ng Dĩ nhiên m t thông tin c n thi t hay khơng cịn tuỳ thu c vào t ng ng d ng: ch ng h n khía c nh ph thu c ngư i nói khơng th thi u ng d ng nh n d ng ngư i nói, nhiên khía c nh l i thơng tin th a ñ i v i ng d ng nh n d ng thơng p theo m u h th ng nh n d ng ti ng nói t đ ng Khơng ph i lúc xác đ nh rõ ràng khía c nh c a ti ng nói có th c t b đư c Ti ng nói ch p nh n ñư c có th ñư c t ng h p v i t c ñ 600 bit/giây, bi u di n ti ng nói dư i d ng s ñơn gi n nh t ch c n m t n a s Tuy nhiên, ta gi m t l bit, d n d n s xu t hi n nh ng sai l ch nh ti ng nói đư c tái t o Đ c bi t khía c nh c a tín hi u liên quan ñ n nh n d ng ngư i nói dư ng khơng đư c c t b Các mơ hình t ng h p ti ng nói hi n tr ng đ n khía c nh trì tính d hi u, th nh tho ng ý ñ n s gi m m t tính t nhiên 2.2 N m b t thu n l i s chuy n ñ ng ch m c a b máy phát âm B i có th xem ti ng nói m t chu i âm v liên k t theo ng ñi u, h u h t h th ng phân tích ti ng nói ñ u c g ng rút trích tham s liên quan ñ n ph m u th i gian th hi n ñ c trưng riêng c a t ng âm v Ti ng nói thư ng ñư c chuy n thành m t t p tín hi u tham s có liên h ch t ch v i chuy n ñ ng c a b ph n c a b máy phát âm Các tín hi u có th g n v i m t b ph n riêng bi t (ví d : tham s F0 g n li n v i s rung ñ ng c a dây thanh) ho c t o thành s k t h p c a m t s b ph n; ví d : k t xu t t m t b l c thông hay m t m u ph phép bi n ñ i DFT liên quan ñ n v trí c a phc măng cư ng ñ , khía c nh l i tồn b b máy phát âm quy t đ nh B máy phát âm chuy n ñ ng r t ch m so v i t c ñ l y m u bình thư ng; ví d : m t âm v (phonetic) trung bình thư ng có th i lư ng dài 50 ms ( m c dù m t s ng n hơn, ch ng h n âm n ), t c ñ l y m u ti ng nói thơng thư ng kho ng 0.1 ms K t qu tham s ti ng nói tương ng có t c đ thay ñ i ch m th ta có th l y th p phân.Ví d , phép bi n ñ i Fourier h u h n (ñã ñư c ki m tra v i t n s c ñ nh) m t tín hi u th i gian c a m t băng thông b ng băng thông c a c a s dùng phân tích ph Ngư i ta có th l y th p phân v i m t t l g p đơi băng thông c a c a s mà v n khơng m t mát thơng tin; ví d : cách bi u di n ph băng t n r ng, ngư i ta có th dùng m t c a s 300 Hz ñ bi u 106 di n v i m t t c ñ l y m u 600 m u/giây B i th c t băng t n c a s khơng hồn tồn b gi i h n, vi c l y th p phân không làm sai l ch thông tin nhi u l m Xét khung phân tích t c ñ c p nh t tiêu bi u kho ng 10 ms, ch có m t ph n r t nh có nh ng thay đ i đ t ng t Vì v y, vi c l y m u tham s ph t c ñ 600 m u/giây không hi u qu ch s d ng t c ñ cao th m t kho ng th i gian ng n Trên th c t , thu t toán mã hoá nh n d ng l y m u v i t c ñ kho ng 25-200 m u/giây, tuỳ theo t ng ng d ng Đi u có th làm gi m b t đ xác lúc thay ñ i ph di n nhanh, nhiên theo lý thy t hi u qu khơng gi m nhi u l m (ví d : khơng c n thi t ph i làm trơn thay ñ i d c ti ng nói tái t o), l i thu ñư c m t thu n l i r t l n vi c gi m b nh lưu tr tham s 107 ... pháp đ gi i h phương trình đó, th c t , hai l p phương pháp thư ng ñư c dùng nh t là: phương pháp t tương quan phương pháp đ ng bi n đây, chúng tơi ch trình bày l i k t qu tính tốn cách th c áp. .. hay 4/3 Phương pháp dãy b l c có th đư c cài đ t theo nhi u cách, tuỳ thu c vào phương pháp dùng ñ thi t k dãy b l c riêng bi t Có hai phương pháp thi t k dãy b l c s , phương pháp ng xung vô h... t ñi m c a cách cài đ t u c u tính tốn nhi u Vì v y, v i dãy b l c FIR Q kênh, c n: CDFFIR = LQ phép nhân c ng đ tính xi(n), i = 1,2,…,Q m i giá tr n M t cách cài đ t khác t n có th áp d ng cho

Ngày đăng: 28/04/2014, 10:17

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan