Nghiên cứu kỹ thuật mã hóa tiếng nói và phương pháp thám

89 334 0
Nghiên cứu kỹ thuật mã hóa tiếng nói và phương pháp thám

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MỸ LỆ NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI VÀ PHƢƠNG PHÁP THÁM LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN, NĂM 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MỸ LỆ NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI VÀ PHƢƠNG PHÁP THÁM Chuyên ngành : Khoa học máy tính Mã số : 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH HƢỚNG DẪN KHOA HỌC: TIẾN SỸ HỒ VĂN CANH THÁI NGUYÊN, NĂM 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ i LỜI CAM ĐOAN Tôi xin cam đoan, nội dung liên quan tới đề tài trình bày luận văn thân tự nghiên cứu, tổng hợp hướng dẫn khoa học TS Hồ Văn Canh Các nhận xét, kết luận trích dẫn đầy đủ theo gốc Tôi xin chịu trách nhiệm trước pháp luật lời cam đoan Thái Nguyên, ngày tháng 10 năm 2015 Học viên viên thực Lê Mỹ Lệ Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ii LỜI CẢM ƠN Trên thực tế thành công mà không gắ n liề n với nỗ lực củ a bả n thân hỗ trợ, giúp đỡ dù hay nhiề u, dù trực tiế p hay gián tiế p củ a ngƣời khác Trong suố t thời gian từ bắ t đầ u họ c tậ p Đạ i họ c Thái Nguyên -Trường Đạ i họ c CNTT & TT đế n em nhậ n đƣợc rấ t nhiề u quan tâm, giúp đỡ củ a quý thầ y cô, gia đình, bạ n bè Với lòng biế t ơn sâu sắ c nhấ t, em xin gửi tới quý Thầ y/cô thuộ c Việ n Công nghệ Thông tin-Việ n Hàn lâm Khoa họ c Công nghệ Việ t Nam Thầ y/cô thuộ c ĐH Thái Nguyên - Trƣờng Đạ i họ c Công nghệ Thông tin Truyề n thông với tri thức tâm huyế t củ a để truyề n đạ t vố n kiế n thức quý báu cho chúng em suố t thời gian họ c tậ p tạ i trƣờng Em xin chân thành m ơn Ts Hồ Văn Canh hƣớng dẫ n em trình làm luậ n văn Quá trình thực hiệ n hoàn thành luậ n văn kiế n thức củ a em hạ n chế nhiề u bỡ ngỡ Do vậ y, không tránh khỏ i thiế u sót điề u chắ c chắ n, em rấ t mong nhậ n đƣợc ý kiế n đóng góp quý báu củ a quý Thầ y Cô bạ n họ c lớp để kiế n thức củ a em lĩnh vực đƣợc hoàn thiệ n Sau cùng, em xin kính chúc quý Thầ y Cô đặ c biệ t Ts Hồ Văn Canh thậ t dồ i sức khoẻ , niề m tin để tiế p tụ c thực hiệ n sứ mệ nh cao đẹ p củ a truyề n đạ t kiế n thức cho hệ mai sau Trân trọ ng! Thái Nguyên, ngày tháng 10 năm 2015 Học viên viên thực Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iii Lê Mỹ Lệ MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC TỪ VIẾT TẮT vi DANH MỤC BẢNG BIỂU, ĐỒ THỊ vii MỞ ĐẦU Chƣơng 1: TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI 1.1 Mở đầu 1.2 Tổng quan máy phát âm 1.2.1 Bộ máy phát âm 1.2.2 Cơ chế phát âm 1.3 Biểu diễn tín hiệu tiếng nói 1.3.1 Xác định tần số lấy mẫu 1.3.2 Nén tín hiệu tiếng nói 10 1.4 Đặc tính tiếng nói 11 1.4.1 Âm hữu 11 1.4.2 Âm vô 11 1.4.3 Âm vị 11 1.4.4 Nguyên âm 12 1.4.5 Phụ âm 12 1.4.6 Các đặc tính khác 12 1.5 Mô hình tạo tiếng nói 14 1.6 Kỹ thuật xử lý tiếng nói 17 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ iv 1.6.1 Tổng hợp tiếng nói 18 1.6.2 Nhận dạng tiếng nói 19 1.6.3 Phương pháp ghép nối 22 1.7 Mã hoá tham số tín hiệu 25 1.8 Kết luận chƣơng 25 Chƣơng 2: TỔNG QUAN CÁC PHƢƠNG PHÁP MÃ HÓA VÀ THÁM MÃ TIẾNG NÓI 27 2.1 Mã hoá vùng thời gian 27 2.1.1 Công nghệ PCM 27 2.2 Mã hoá vùng tần số (Frequence Domain Coding of speech) 32 2.3 Mã hoá dải nhỏ(Sbc) 32 2.4 Mã hoá biến đổi thích nghi (ATC) 35 2.5 Mã hoá tham số nguồn (resourd parameters method) 37 2.5.1 Bộ mã hoá nguồn theo kênh 38 2.5.2 Phương pháp dự đoán tuyến tính LPC 39 2.6 Mã hoá theo hệ mật mã khoá đối xứng AES 40 2.6.1 Giới thiệu khái quát 42 2.7 Các phƣơng pháp mã hoá khác 50 2.7.1 Phương pháp mã hoá DPCM ( Điều xung mã vi sai) 51 2.7.2 Phương pháp DM ( điều chế delta) 52 2.7.3 Phương pháp mã hoá ADPCM 53 2.8 Phép biến đổi Fourier 53 2.8.1 Sự hội tụ phép biến đổi Fourier 54 2.8.2 Phép biến đổi Fourier rời rạc (Discriete Fourier Transform - DFT) 54 2.8.3 Phép biến đổi fourier nhanh (FFT) 55 2.8.4 Quan hệ biến đổi Z biến đổi Fourier 56 2.8.5 Phép biến đổi Fourier ngược 57 2.8.6 Các tính chất phép biến đổi Fourier 57 2.9 Tổng quát phƣơng pháp thám 58 2.9.1 Tấn công mã có từ giả định 58 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ v 2.9.2 Tấn công mã đoạn tiếng nói gốc cho trước (không có từ giả định) hệ thống phép hoán vị cố định 59 2.9.3 Tấn công vào mã thay đổi hệ thống phép hoán vị 62 2.10 Kết luận chƣơng 66 Chƣơng 3: ỨNG DỤNG HỆ MẬT MÃ AES TRONG MÃ HOÁ TIẾNG NÓI 69 3.1 Các khái niệm quy ƣớc 69 3.2 Sơ đồ luồng thực 70 3.2.1 Chi tiết bước thực trình mã hóa 71 3.2.2 Cấu trúc lớp chương trình 71 3.3 Phƣơng pháp thám 71 3.3.1 Bước 1: Phân loại mã 73 3.3.2 Bước : Xác định mã pháp 74 3.4 Đề mô chƣơng trình 77 KẾT LUẬN 78 DANH MỤC TÀI LIỆU THAM KHẢO 79 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ vi DANH MỤC TỪ VIẾT TẮT ADC Analog Digital Converter ADM Adaptive Delta Modulation ADPCM Adaptive Differential Pulse Code Modulation AES Advanced Encryption Standard ARK AddRoundKey CSR Continuous Speech Recognition DCT Discrete cosine transform DFT Discrete furier transform DHT Discrete wash – Had transform DPCM Differential PCM FFT Fast FT FIR Finite Impulse Response FT Fourier Transform IDFT Inverse Discrete FT IDTFT Inverse DTFT IFT Inverse FT IMC InvMixColumns ISB InvSubBytes ISR InvShiftRows MC MixColumns PST Prolate spheroidal transform Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ vii SB SubBytes SR ShiftRows DANH MỤC BẢNG BIỂU, HÌNH VẼ Danh mục bảng biểu: Bảng 1.1 Giá trị tần số người 13 Bảng 2.1 Chia dải tần tiếng nói phương pháp Sbc 33 Bảng 2.2 Bảng S-BOX AES 47 Bảng 2.3 Việc công vào mã (có từ giả định) .59 Bảng 2.4 Tỷ lệ % thành phần qua phép biến đổi DCT DFT .61 Bả 62 Bảng 2.6 Đo khoảng cánh thể hiện(c/minh) chất lượng tiếng nói 62 Danh mục hình: Hình 1 Bộ máy phát âm người Hình 1.2 Biểu diễn tín hiệu tiếng nói Hình 1.3 Thông lượng cho phương pháp biểu diễn tiếng nói Hình 1.4 Mô hình hoá nguồn âm âm hữu .14 Hình 1.5 Chuỗi đoạn ống âm học lý tưởng 15 Hình 1.6 Các biểu diễn lý học toán học 16 Hình 1.7 Mô hình số hệ thống phát âm 17 Hình 1.8 Một vài ứng dụng xử lý tiếng nói 18 Hình 1.9 Cấu trúc tổng hợp Formant nối tiếp 21 Hình 1.10 Cấu trúc tổng hợp Formant song song 22 Hình 1.11 Sự phân tầng mã hoá tiếng nói 24 Hình 2.1 Cấu hình phương pháp thông tin PCM 28 Hình 2.2 Quá trình lấy mẫu 29 Hình 2.3 Tạp âm lượng tử theo biên độ tín hiệu đầu vào 30 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ viii Hình 2.4 Đặc tính nén giãn 31 Hình 2.5 Sơ đồ mã hóa giải mã dải nhỏ 35 Hình 2.6 Mô tả State thuật toán mã hóa AES biểu diễn dạng ma trận 4x4 43 .44 Hình 2.8 Lưu đồ thực SB ISB .45 Hình 2.9 Biến đổi SubBytes () mảng trạng thái 46 Hình 2.10 Lưu đồ thực SR .48 Hình 2.11 Quá trình xử lý MixColumns 48 Hình 2.12 Mô tả bước Key scheduling 50 Hình 2.13 Sơ đồ mã hóa giải mã DPCM .51 Hình 2.14 Sơ đồ mã hóa giải mã AD 53 Hình 3.1 Lưu đồ cấu trúc lặp thuật toán mã hóa AES .69 Hình 3.2 Sơ đồ mã hoá tiếng nói AES - áp dụng FFT 70 Hình 3.3 Quy trình giải mã AES 72 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 65 t c ng 2.7 ng Độ c tr n n đƣa o) ng iđ n i ta lấ o c 2.8.1 v ch mụ c a [8] thể nh n n công y 66 c p D n o b 2.10 Kế t luậ n chương Trong chƣơng đề tài nghiên cứu phƣơng pháp mã hoá ng sóng Phƣơng thức đơn giả n lƣợng tử riêng mẫ u (có thể mẫ u nguyên rờ i rạ c hay mẫ u sai số , mẫ u chia khoả ng) Dựa vào phép biế t đổ i FFT Trong PCM ADPCM 32kbps phƣơng thức đƣợc ƣa chuộ ng nhấ t đạ t đƣợc chấ t lƣợ ng tiế ng nói mã hoá theo yêu cầ u, nhiên chúng lạ i có điể m yế u băng tầ n truyề n dẫ n chiế m nhiề u, để áp dụ ng cho mạ ng viễ n thông vớ i hệ thố ng đa dị ch vụ tích hợp nhiề u kênh dị ch vụ , điề u kiệ n cạ nh tranh ngặ t nghèo hãng giới buộ c phả i có phƣơng thức mã hoá mang lạ i hiệ u cao kinh tế , đả m bả o chấ t lƣợng theo từ “cạ nh tranh củ a kinh tế tƣ bả n”, nề n tả ng để xây dựng lý thuyế t viễ n thông Phƣơng thức nghiên cứu tham số nguồ n củ a tín hiệ u tiế ng nói cho ta tố c độ lậ p mã thấ p vẫ n đả m bả o đƣợc chấ t lƣợng đặ t Nhìn chung phƣơng pháp mã hoá hiệ n 67 phƣơng pháp “đƣa ra”, chúng cầ n có nhiề u i tiế n nữa, chƣa đƣợ c ITU khuyế n nghị nhƣ thiế t bị phầ n cứng cho mạ ng viễ n thông chƣa có Trong điề u kiệ n Việ t Nam tiêu chuẩ n cho đánh giá chấ t lƣợng mã hoá thoạ i chƣa có tiêu chuẩ n nghành, ta đề u chấ p nhậ n sả n phẩ m đƣa củ a hãng chiế m thị phầ n lớn sả m phẩ m cung cấ p cho mạ ng viễ n thông Việ t nam, thể hiệ n mặ t nổ i thiế t bị đầ u cuố i di độ ng, VoiceIP, dị ch vụ viễ n thông qua vệ tinh Chính phân tích mà đƣa cách chung thực hiệ n việ c đánh giá chấ t lƣợng mã hoá Quy trình đánh giá mộ t hệ thố ng mô tả theo giả i thuậ t trang sau, Nhìn chung rấ t khó đƣa mộ t tiêu chuẩ n đánh giá mộ t cách xãc chấ t lƣợng củ a tín hiệ u tiế ng nói đƣợc mã hoá theo phƣơng thức hay hệ thố ng bằ ng mộ t số cụ thể , tức muố n nói khả biể u diễ n nhƣ mộ t đạ i lƣợng giố ng nhƣ đạ i lƣợng nhƣ kg,m, pa đặ c tính sinh họ c củ a thính giác khác củ a ngƣời, tức mộ t câu nói nhƣng ta nhậ n đƣợc đánh giá khác ngƣờ i khác nhau, giớ i tính độ tuổ i khác khác nhau, củ a đố i tƣợng khoả ng không gian thờ i gian khác khác Chính vậ y, phạ m vi đề tài em mạ nh n đề xuấ t sử dụ ng hệ mậ t mã đố i xứng để mã hoá nhằ m tăng cƣờng bả o mậ t thông tin truyề n gói liệ u qua lạ i (giữa ngƣời gửi ngƣờ i nhậ n) mạ ng viễ n thông 68 69 Chƣơng ỨNG DỤNG HỆ MẬT MÃ AES TRONG MÃ HOÁ TIẾNG NÓI 3.1 Các khái niệ m quy ước Từ kế t nghiên cứu phầ n chƣơng 2, đề tài đề xuấ t triể n khai p, thuậ 128 bits n nh 3.1 Hình 3.1 Lưu đồ cấu trúc lặp thuật toán mã hóa AES 70 3.2 Sơ đồ luồ ng thực hiệ n Tệp âm gốc Đọc tệp âm Tín hiệu âm (Miền Quá thời gian – liên tục) Áp dụng FFT rời trình rạc tín hiệu mã hóa Tín hiệu âm (Miền tần số – rời rạc) Mã hóa giải mã AES Tệp âm mã hóa Hình 3.2 Sơ đồ mã hoá tiếng nói AES - áp dụng FFT Như vậy, liệu đầu vào tệp âm sau biển đổi FFT chuyển vị từ dạng liên tục sang dạng số, chương trình sử dụng thuật toán AES (dùng độ dài khoá 128) để mã hoá Đầu dự liệu âm mã hoá dạng tín hiệu số 71 3.2.1 Chi tiế t bước thực hiệ n trình mã hóa Bƣớc 1: Đọ c tệ p âm gố c (hiệ n tạ i hỗ trợ tậ p tin wav), âm đƣợc đọ c vào thành ng tín hiệ u số liên tụ c Bƣớc 2: Áp dụ ng thuậ t toán FFT để rời rạ c hóa tín hiệ u số liên tụ c thành tín hiệ u rời rạ c Bƣớc 3: Sử dụ ng thuậ t toán mã hóa AES để mã hóa tín hiệ u lƣu lạ i kế t Quá trình giả i mã đƣợc thực hiệ n ngƣợc lạ i 3.2.2 Cấ u trúc lớp chương trình 3.2.2.1 Lớ p Encryption Lớp thực hiệ n mã hóa giả i mã sử dụ ng thuậ t toán AES 3.2.2.2 Lớ p FFT Thực hiệ n phép biế n đổ i FFT 3.3 Phƣơng pháp thám Với thuật toán AES, trình giải mã phép biến đổi ngược với phép biến đổi trình mã hóa gọ 72 Riêng AddRoundKey phép biến đổi thực phép toán XOR theo bit nên biến đổi ngược phép biến đổi sử dụng trình mã hóa phép biến đổi AddRoundKey giống cho hai trình mã hóa giải mã Hình 3.3 Quy trình giải mã AES Nhưng với thuật toán AES việc thám mã thường khó thực hiện, thuật toán có kích thước khoá dài; theo nghiên cứu trước tính bảo mật hệ mã hóa đối xứng phụ thuộc chủ yếu vào hai yếu tố: Độ phức tạp thuật toán độ dài khóa Có nghĩa phương pháp để phá vỡ hệ thống mật mã cố gắng thử khóa có thể, gọi phương pháp vét cạn Nếu khóa có độ dài bit có 28= 256 khóa Như muốn tìm khóa nhiều 256 lần thử khóa Chẳng hạn, thuật toán DES sử dụng khóa có độ dài 56 bit nên có 256 khóa, số lớn việc tìm kiếm khóa khó khăn Giả sử có máy tính thử triệu khóa giây, cần 2000 năm để thử hết khóa Các thành tựu gần thời gian cần thiết để giải trang mã DES mà khoá là: Sau vài tháng Internet năm 1997; vài ngày thiết bị phần cứng tăng cường năm 73 1998; sau 22 kết hợp biện pháp năm 1999 Như đoán rõ sau khoảng thời định, có nguồn lực máy tính mạnh Như vậy, thấy thám mã chủ yếu dựa vào công vét cạn để thám Với AES khác, "Thiết kế” độ dài khoá thuật toán AES (128, 192 256 bít) đủ an toàn để bảo vệ thông tin phối hợp tốt với công nghệ cứng việc bảo đảm an toàn thông tin nâng lên nhiều lần; vậy, với độ dài khoá 2128 việc công gặp nhiều khó khăn với thám mã hệ mã hoá khối chủ yếu sử dụng phương pháp chủ yếu sử dụng phương pháp: - Phương pháp công vét cạn; - Phương pháp thám mã vi sai; - Phương pháp thám mã tuyến tính Về thực qua bước sau: 3.3.1 Bƣớc 1: Phân loại mã Giả sử, State’ sau nhận mã, ta phân tích mật mã phân loại State’ xem mã có loại mã pháp, có loại khoá mã Mặc dù chưa biết mã pháp (phương pháp mã hoá) điện đó, chúng phân loại (phân lớp) Đây bước quan trọng định thành công hay thất bại mã thám nên nhiều thời gian Nếu việc phân loại xác thuận lợi cho bước tiến hành Ngược lại, phân loại thiếu xác gây khó khăn cho bước sau đó, chí thất bại Người ta có nhiều phương pháp thực thi giai đoạn này, số áp dụng kỹ thuật phân lớp đối tượng Ý tưởng toán phân lớp sau: Giả sử ta nhận m mã M1, M2, , Mm với m $ Mỗi mã ta gọi đối tượng Tập hợp m mã (các đối tượng) ta ký hiệu G Vậy G = {M1, M2, , Mm} Ứng với đối tượng ta cần tìm đặc trưng tham số Giả sử đối tượng Mi có pi đặc trưng Ở đây, đơn giản, ta giả thiết p1 = p2 = = pm= p Vấn đề đặt phân tập hợp G thành k lớp không giao mà ta ký hiệu G1, G2, , Gk, k > cho: (i) Gi khác i = 1,k (ii) Gi Gj i khác j (iii) G1c G2c c YGk = G cho sai sót phân lớp bé Để thực việc 74 phân lớp đối tượng ta cần đưa độ đo “khoảng cách” đối tượng Các đối tượng “gần gũi” gán cho lớp 3.3.2 Bƣớc : Xác định mã pháp Sau hoàn thành việc phân lớp (phân loại mã pháp) bước 1, tiến hành xác định phương pháp mã dịch ứng với lớp cụ thể (cần ý rằng, thường tiến hành xác định mã pháp mã có nhiều đặc điểm theo quan điểm nhà thám mã) Đây khâu quan trọng công tác thám mã truyền thống Tuy nhiên số hệ mật đối xứng đại mã DES, 3DES, AES, IDEA, PGP bước coi bỏ qua từ đầu mã, người ta mã thuộc loại mã pháp Ở trình bày cách thức xác định mã pháp luật mã truyền thống (bước bỏ qua hệ mật mà thuật toán mã hoá - phương pháp mã - công khai hoàn toàn) Bước bao gồm công việc sau đây: 3.3.2.1 Tính tần số Mục đích việc tính tần số để phát tính quy luật không ngẫu nhiên tồn mã Có nhiều loại tần số khác cần tính, mà mã pháp tồn tính không ngẫu nhiên (có quy luật) đặc thù riêng cho Theo kinh nghiệm phân tích mà người ta tiến hành tính tần số loại phù hợp thông qua bộc lộ rõ tính quy luật (không ngẫu nhiên) mã Việc tính tần số thường gồm: - Tần số đơn: Tần số đơn tần số kí tự mã Sau có kết tính tần số đơn, ta tiến hành xếp lại thứ tự ký tự theo tần số từ cao đến thấp Cũng lập bảng tần xuất cách chia tần số ký tự cho độ dài mã cần tính để xem tần số tương đối chúng - Tần số đôi móc xích (concatenate frequency of pairs) Tần số đôi móc xích tần số đôi cặp kề đè lên ký tự Mục đích việc tính tần số đôi móc xích để xem quan hệ phụ thuộc ký tự sau với ký tự kề trước nào, (ta thường gọi quan hệ xích Makov cấp 1) Từ ước lượng xác suất xuất ký tự biết trước ký tự đứng trước 75 - Tần số đôi thường: Tần số đôi thường tần số đôi rời nhau, ví dụ: cho đoạn văn : Việt Nam tần số đôi thường gồm: Vi: xuất lần e e: xuất lần t j: xuất lần n a: xuất lần Ký tự cuối bỏ qua (chỉ gồm có đôi) Trong đó, tần số đôi móc xích thể là: Vi, ie, ee, et, tj, jn, na, am gồm đôi Lưu ý: - Số tất đôi móc xích văn độ dài n n – - Còn số tất “bộ đôi thường” là: [n)2], ký hiệu [x] số nguyên lớn bé x - Tần số 3, 4, Tuỳ theo trường hợp cụ thể phải tính tần số 3, 4, 3.3.2.2 Tính trùng mã Tính trùng mã tức tính tần số trùng lặp dãy ký tự liền mã Thường tính trùng lặp ký tự (bộ 3), ký tự (bộ 4), ký tự (bộ 5) xuất mã vị trí chúng mã Khi tính trùng mã (các bộ) ta phải quan tâm tham số sau đây: Tần số trùng mã (trùng lặp) Độ dài trùng lặp Vị trí trùng lặp Khoảng cách trùng lặp Trùng mã mã mã khác Những tham số có ích việc xác định mã pháp 3.3.2.3 Tần số định kỳ: Ngoài việc tính tần số đơn, đôi móc xích, đôi thường v.v trùng mã (sự trùng lặp) mã mã, nhiều trường hợp người ta phải tính tần số định kỳ Giả sử ta có mã M độ dài n Thường n lớn lớn tốt Bây ta lập bảng k cột (k $ thường k $ 3) n/k hàng Sau đó, ta viết mã trái qua phải viết từ xuống hết dừng Bây ta tiến hành tính tần số đơn theo cột từ cột đến cột k Như ta 76 thường phải tính toán tần số “định kỳ” khác k = 3, 4, , 10 Tần số gọi tần số định kỳ Trong nhiều trường hợp tần số đơn, đôi, mã tương đối san (tức không vi phạm tiêu chuẩn 3s c2) tần số định kỳ lại có quy luật rõ 3.3.2.4 Tần số đôi dọc đôi dọc đồng tự Nếu ta viết mã mã mã Ví dụ mã M1=m11,m12 m1n1 M2=m21m22 m2n2 Ta có: M1=m11m12m13 m1n1 M2=m21m22m23 m2n1 m2n2 Ta cắt phần thừa m2n1+1, m2n2 (giả sử n1 < n2), ta ký hiệu độ dài hai mã lại n Ta tiến hành tính tần số cặp (m1k m2k), với k = 1, 2, n Ta có tần số đôi bảng gọi bảng tần số đôi dọc Các phần tử đường chéo ma trận tần số đôi tạo từ M1, M2 tần số đôi dọc đồng tự 3.3.2.5 Phân tích kết tính tần số trùng mã Bước dựa vào kết tính loại tần số, trùng mã để kết luận mã (các mã) thuộc loại mã pháp Để đánh giá độ chênh lệch tần số tính độc lập ký tự mã, người ta thường dùng tiêu chuẩn thống kê toán học, chẳng hạn tiêu chuẩn 3s, tiêu chuẩn c2 tiêu chuẩn MLR (Most Likelihood Ratio- tỷ số hợp lý cực đại) Nói chung việc xác định mã pháp công việc phức tạp, phụ thuộc phần vào trình độ kinh nghiệm mã thám viên Có nhiều trường hợp thoáng nhìn mã người ta dự đoán phương pháp mã có nhiều trường hợp phải nghiên cứu công phu mà độ rủi ro 3.3.2.5 Xác định ngôn ngữ dùng: Đây bước giúp cho việc thám mã đột phá thành công 77 3.4 Đề mô chương trình 78 KẾT LUẬN Trong đề tài luậ n văn củ a mình, em tậ p trung giả i quyế t vấ n đề bả n mã hoá tiế ng nói là: Tìm hiể u tiế ng nói xử lý tiế ng nói Tìm hiể u cách tiế p cậ n mã hoá tiế ng nói Tậ p trung phân tích phƣơng pháp thám mã tiêng nói:  Tấn công vào mã tiếng nói cho trước từ giả định  Tấn công mã đoạn tiếng nói gốc cho trước  Tấn công mã công hoán vị bị thay đổi  Phép biến đổi FFT Trong phầ n luậ n văn đề tài, em mạ nh n đề xuấ t sử dụ ng hệ mậ t mã đố i xứng AES để mã hoá tiế ng nói Hạn chế luận văn em việc sử dụng thuật toán mã hoá nâng cao AES, tăng tính bảo mật trình mã hoá làm chế đề tài việc tiến hành thám mã Cuối cùng, lần cho phép em cảm ơn Thầy Tiến sỹ Hồ Văn Canh tận tình bảo em kiến thức tạo điều kiện thuận lợi để em hoàn thành đề tài tốt nghiệp 79 DANH MỤC TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Nguyễn Viết Thế, Hồ Văn Canh: Nhập môn Phân tích thông tin có bảo mật NXB Thông tin Truyền thông, năm 2010 [2] Chuyên khảo tiếng nói - Vụ nghiên cứu khoa học - Ban yếu phủ, năm 2003 [3] Đặng Ngọc Đức, Nguyễn Tiến Dũng, Lương Chi Mai (2011), Mô hình phiên âm tiếng Việt mức âm vị Tiếng Anh: [4] Filer, T Fridrich, J Goljan, M : “Using Senser Pattern Noise for Camara Model Identification” In: Proc ICIP 2008, San Diego, pp 1286 - 1299 (2008) [5] Kratzen, C Oermanm, Am Dittmanm, J Larg, A : “Digital Audio Forensics” In: 9th Wordshop on Multimedia & Security, pp 63 - 74 ACM New York (2007) [6] Rabiner : “Digital Processing (2008).” [7] Robert Bucholz, Christian Kraetxer, and Jana Dittman: “Microphone Classification Using Fourier Coeffciant” PO Box 4120, 39016 Magdeburg, Germany, 2009 [8] Simon singh: “The Code Book (2008)” Internet: [9] https://www.univie.ac.at/nuhag-php/janssen/data/p019.pdf [10] https://en.wikipedia.org/wiki/Fast_Fourier_transform [11] http://hdl.handle.net/123456789/654 [...]... TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI 3 Chương 2 TỔNG QUAN CÁC PHƢƠNG PHÁP MÃ HÓA VÀ THÁM MÃ TIẾNG NÓI Chương 3 ỨNG DỤNG HỆ MẬT MÃ AES TRONG MÃ HOÁ TIẾNG NÓI Phầ n kế t luậ n: Tóm tắt các kết quả đạt được và đề cập những hạn chế bất cập của đề tài Chƣơng 1 TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI 1.1 Mở đầ u Tiế ng nói là mộ t phƣơng tiệ n trao đổ i thông tin củ a con ngƣời Tiế ng nói đƣợc tạ o... n đề tài: “ Nghiên cứu kỹ thuậ t mã hoá tiế ng nói và phương pháp thám. ” làm đề tài tố t nghiệ p luậ n văn cao họ c củ a em Nộ i dung củ a luậ n văn gồ m: phầ n mở đầ u, ba chƣơng chính, kế t luậ n và tài liệ u tham khả o, cụ thể : Phần mở đầu: Trình bày lý do chọn đề tài, mục tiêu, đối tượng và phạm vi nghiên cứu, ý nghĩa khoa học và thực tiễn của đề tài nghiên cứu, phương pháp nghiên cứu Chương 1... 1.6 Kỹ thuậ t xử lý tiế ng nói cơ bả n Dựa trên cơ sở lựa chọ n các cách biể u diễ n tín hiệ u và phƣơng pháp xử lý, đã có rấ t nhiề u các ứng dụ ng quan trọ ng đã đƣợc triể n khai Hình vẽ dƣới đây sẽ chỉ ra mộ t số ứng dụ ng trong lĩnh vực xử lý tiế ng nói 18 Hình 1.8 Một vài ứng dụng xử lý tiếng nói 1.6.1 Tổ ng hợp tiế ng nói Tổng hợp tiếng nói là phát sinh tiếng nói từ sóng tiếng nói Trong vài... tổng hợp tiếng nói có chất lượng ngày càng cao.Tuy nhiên chất lượng của các phương pháp hiện nay mới chỉ đạt đến mức phù hợp cho mộ t vài ứng dụ ng, chẳ ng hạ n nhƣ đa phƣơng tiệ n và truyề n thông Hiệ n nay có ba phƣơng pháp tổ ng hợp tiế ng nói Phƣơng pháp đơn giả n nhấ t để phát sinh tiế ng nói tổ ng hợp là phát các mẫ u tiế ng nói đã thu từ tiế ng nói tự nhiên (nhƣ các từ hoặ c câu) Phƣơng pháp này... tính trên mạ ng đề u sử dụ ng phƣơng thức mã hoá Có nhiề u loạ i Hệ mậ t mã khác nhau nhƣng chúng đề u có chung mộ t tính chấ t bả o mậ t thông tin Trong mỗ i hệ mậ t mã đó có nhiề u loạ i nhƣ: mã hoá bả n text, mã hoá hình ả nh, mã hoá tiế ng nói, mã hoá dữ liệ u,… Ở nƣớc ta, Cơ quan chị u trách nhiệ m chính nghiên cứu, phát triể n và ứng dụ ng các hệ mậ t mã là Ban Cơ yế u Chính phủ Trƣớc đây nó... ngành xử lý tiế ng nói, trong đó có tổ ng 2 hợp tiế ng nói Tổ ng hợp tiế ng nói là lĩnh vực đang đƣợc nghiên cứu khá rộ ng rãi trên thế giới và đã cho những kế t quả khá tố t Và vì vậ y, cũng giố ng nhƣ các dữ liệ u thông tin khác, tiế ng nói cũng cầ n đƣợc bả o mậ t, nhấ t là trong mộ t số lĩnh vực Ta biế t rằ ng phƣơng pháp bả o mậ t thông tin có hiệ u quả nhấ t chính là phƣơng pháp mã hoá Hầ u hế t... dùng kỹ thuậ t số cho tấ t cả các loạ i tín hiệ u do vậ y tín hiệ u tiế ng nói cũng phả i xem xét trong mô hình số Nhƣ vậ y bả n chấ t củ a mã hoá tín hiệ u thoạ i chỉ là xử lý số thông thƣờng Các phƣơng pháp tiế p cậ n đố i tƣợng khác nhau cho ta các phƣơng pháp mã hoá khác nhau, căn cứ vào cách tiế p cậ n đố i tƣợng ta chia các phƣơng pháp mã hoá nhƣ hình sau: 24 Hình 1.11 Sự phân tầng bộ mã hoá tiếng. .. ng nói) : + Bộ tham số formant + Bộ tham số của bộ lọc đảo 1.6.2 Nhậ n dạ ng tiế ng nói Nhậ n dạ ng tiế ng nói là lĩnh vực nghiên cứu với mụ c đích tạ o ra đƣợc mộ t thiế t bị , máy móc hoặ c phầ n mề m có khả năng nhậ n biế t mộ t cách chính xác tiế ng nói củ a con ngƣời từ bấ t kỳ mộ t nguồ n phát âm nào Nhậ n dạ ng tiế ng nói có hai ứng dụ ng chính là nhậ n dạ ng tiế ng nói và nhậ n dạ ng ngƣời nói. .. trƣờng Đạ i họ c và Họ c việ n đã có mộ t số đề tài nghiên cứu vấ n đề này, chủ yế u là dùng cho Thƣơng mạ i Mộ t nộ i dung rấ t quan trọ ng chƣa đƣợc các trƣờng Đạ i họ c hay Họ c việ n quan tâm nhiề u là mã hoá hình ả nh hay mã hoá tiế ng nói Trong lúc đó, mã hoá tiế ng nói đóng mộ t vai trò quan trọ ng và cầ n thiế t trong lực lƣợng vũ trang củ a chúng ta Đặ c biệ t là trong hả i quân và trong các đơn... trình tạ o tiế ng nói theo mô hình vậ t lý và toán họ c; tổ ng quát các quá trình xử lý tiế ng nói Qua kế t quả nghiên cứu cho thấ y, ngày nay dƣới sự phát triể n củ a công nghệ thông tin, vấ n đề xử lý, bả o mậ t cơ sở dữ liệ u đa phƣơng (trong đó có tiế ng nói) đóng vai trò quan trọ ng Do vậ y, vấ n đề tổ ng hợp và xử dữ liệ u này đóng vai trò chính, nhấ t là việ c mã hóa tiế ng nói nhằ m đáp ƣng ... vi nghiên cứu, ý nghĩa khoa học thực tiễn đề tài nghiên cứu, phương pháp nghiên cứu Chương TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI Chương TỔNG QUAN CÁC PHƢƠNG PHÁP MÃ HÓA VÀ THÁM MÃ TIẾNG NÓI... tiế ng nói 18 Hình 1.8 Một vài ứng dụng xử lý tiếng nói 1.6.1 Tổ ng hợp tiế ng nói Tổng hợp tiếng nói phát sinh tiếng nói từ sóng tiếng nói Trong vài thập niên gần đây, tổng hợp tiếng nói có... NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG LÊ MỸ LỆ NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI VÀ PHƢƠNG PHÁP THÁM Chuyên ngành : Khoa học máy tính Mã số : 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA

Ngày đăng: 16/02/2016, 14:28

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan