... ngônngữ tự nhiên dựa thống kê việc xây dựng môhìnhngônngữMôhìnhngônngữ phân bố xác suất tập văn [2][10] Nói đơn giản, môhìnhngônngữ cho biết xác suất câu (hoặc cụm từ) thuộc ngônngữ ... thước môhìnhngônngữ lần 2.5.3 Nén (Compression): Môhìnhngônngữ có cấu trúc liệu Do cấu trúc liệu nén lại thuật toán nén, kích thước môhìnhngônngữ tất nhiên giảm Tuy nhiên, môhìnhngônngữ ... thước môhìnhngônngữ lớn Nó gây khó khăn việc lưu trữ mà làm tốc độ xử lý môhìnhngônngữ giảm xuống nhớ máy tính hạn chế Để xây dựng môhìnhngônngữ hiệu quả, phải giảm kích thước môhình ngôn...
... thực môhình Perplexity môhình đánh giá tập kiểm tra Trong thực tế, Perplexity thước đo để đánh giá môhìnhngôn ngữ, coi hàm cả ngônngữmôhình Trên phương diện hàm mô hình, đánh giá môhìnhmô ... 40 4. 1.1 Giới thiệu dịch máy thống kê 40 4. 1.2 Dịch máy thống kê dựa cụm 43 4. 1.3 Điểm BLEU 45 4. 2 Baseline System 46 4. 3 Ngữ liệu 46 4.4 ... thành công môhìnhngônngữ 4- gram từ 1GB ngữ liệu huấn luyện, SRILM Tuy thời gian huấn luyện RandLM lâu SRILM vấn đề lớn, ta xây dựng môhìnhngônngữ lần Hơn nữa, dung lượng môhìnhngônngữ Bloom...
... H(L) môhìnhngônngữ khác ngônngữ L, môhình cho H(L) nhỏ môhìnhngônngữ thể xác ngônngữ L 1 .4. 2 Perplexity – Độ hỗn loạn thông tin Sau LM huấn luyện, cần phải đánh giá chất lượng môhình ... thực môhình Perplexity môhình đánh giá tập kiểm tra Trong thực tế, Perplexity thước đo để đánh giá môhìnhngôn ngữ, coi hàm cả ngônngữmôhình Trên phương diện hàm mô hình, đánh giá môhìnhmô ... thước môhìnhngônngữ lần 1.3.3 Nén (Compression) Môhìnhngônngữ có cấu trúc liệu Do cấu trúc liệu nén lại thuật toán nén, kích thước môhìnhngônngữ tất nhiên giảm Tuy nhiên, môhìnhngôn ngữ...
... 𝑤𝑤𝑖𝑖−1 ) có 𝑛𝑛 + từ Môhìnhngônngữ gọi môhìnhngônngữ N-gram Với công thức này, ta xây dựng môhìnhngônngữ dựa việc thống kê cụm 2.3 Khó khăn xây dựng môhìnhngônngữ N-gram 2.3.1 Phân ... cứu môhìnhngônngữ tiền đề nghiên cứu lĩnh vực Môhìnhngônngữ có nhiều hướng tiếp cận, chủ yếu xây dựng theo môhình N-gram mà ta đề cập Môhìnhngônngữ N-gram 2.1 Một số khái niệm Ngữ liệu: ... cuối lớn giá trị 𝐻𝐻(𝐿𝐿) gốc Do vậy, tính 𝐻𝐻(𝐿𝐿) môhìnhngônngữ khác ngônngữ 𝐿𝐿, môhình cho 𝐻𝐻(𝐿𝐿) nhỏ môhìnhngônngữ thể xác ngônngữ 𝐿𝐿 4. 1.2 Độ hỗn loạn thông tin (perplexity) Độ hỗn...
... (Compression) Môhìnhngônngữ có cấu trúc liệu Do cấu trúc liệu đƣợc nén lại thuật toán nén, kích thƣớc môhìnhngônngữ tất nhiên giảm Tuy nhiên, môhìnhngônngữ bị nén, độ xác tốc độ môhìnhngônngữ ... công thức cuối lớn giá trị H(L) gốc Do vậy, tính H(L) môhìnhngônngữ khác ngônngữ L, môhình cho H(L) nhỏ môhìnhngônngữ thể xác ngônngữ L 2.6.2 Perplexity – Độ hỗn loạn thông tin: Độ hỗn ... độ xử lý môhìnhngônngữ giảm xuống nhớ máy tính hạn chế Để xây dựng môhìnhngônngữ hiệu quả, phải giảm kích thƣớc môhìnhngônngữ mà đảm bảo độ xác Vấn đề đƣợc giải phần 2.6 2 .4. Các phƣơng...
... dụng lĩnh vực xử lí ngônngữ tự nhiên 1.1 Môhình LM 1.2 Môhìnhngônngữ văn phạm 1.3 Các môhìnhngônngữ khác dựa khái niệm 1 .4 Môhìnhngônngữ N-gram Chương 2: Môhìnhngônngữ N-gram 2.1 Các ... sâu sắc ngônngữ học 1.1 MÔHÌNHNGÔNNGỮ (LANGUAGE MODEL - LM) Môhìnhngônngữ phân bố xác suất tập văn [2] Hay đơn giản, môhìnhngônngữ cho biết xác suất câu (hoặc cụm từ) ngônngữ Ví dụ ... cứu môhìnhngônngữ tiền đề để nghiên cứu lĩnh vực khác 6 Môhìnhngônngữ có nhiều hướng tiếp cận chủ yếu xây dựng theo môhình N-gram 1.2 MÔHÌNHNGÔNNGỮ VĂN PHẠM * Các cấp độ ngôn ngữ: ...
... 43 v 4. 3 Đánh giá độ xác 44 4. 3.1 Phân tích ảnh hưởng yếu tố 44 4. 3.1.1 Mục tiêu 44 4. 3.1.2 Thiết kế thực nghiệm 44 4. 3.1.3 Kết 44 4. 3.2 ... áp dụng môhìnhngônngữngữ nghĩa thống kê gợi ý mã cho ngônngữ C 1.2 Mục tiêu phương pháp luận Luận văn xây dựng chương trình mômôhìnhngônngữngữ nghĩa thống kê gợi ý mã cho ngônngữ C, ... thuật toán cần hiểu rõ để áp dụng môhìnhngônngữngữ nghĩa thống kê gợi ý mã cho ngônngữ C Chương 3: Áp dụng môhìnhngônngữngữ nghĩa thống kê gợi ý mã cho ngônngữ C Trong phần luận văn trình...
... Data Mining ) 2.2 Môhìnhngônngữ 2.2.1 Khái quát Môhìnhngônngữ phân bố xác suất tập văn bản, cho biết xác suất câu, dãy từ thuộc ngônngữMôhìnhngônngữ tốt đánh giá câu ngữ pháp, trôi chảy ... chất lượng môhìnhngônngữ Vậy, làm để đánh giá cho môhìnhngôn ngữ? câu hỏi giải đáp mục Chúng ta trực quan đánh giá thông qua kết sử dụng môhìnhngônngữ nhiên cách đánh giá phụ thuộc vào ... cụ Ngônngữ lập trình Python 2.7 Công cụ phát triển Ipython notebook Framework Caffe Công cụ tạo mô SRILM hìnhngônngữ 48 4. 2 Quá trình thử nghiệm 4. 2.1 Nhận dạng đối tượng Chúng sử dụng mô hình...
... xác thống kê 2.2 Môhìnhngônngữ 2.2.1 Khái quát Môhìnhngônngữ phân bố xác suất tập văn bản, cho biết xác suất câu, cụm từ thuộc ngônngữMôhìnhngônngữ tốt đánh giá câu ngữ pháp, trôi chảy ... trọng môhìnhngônngữ N-gram Môhìnhngônngữ quan trọng việc phát từ bị nhiễu Trong nhận dạng giọng nói, với đầu vào tín hiệu âm có nhiễu, độ nhập nhằng, tương đồng cao 2.2.3 Môhìnhngônngữ ... cụ Ngônngữ lập trình Python 3.2 Công cụ phát triển Ipython notebook Framework Caffe 19 Công cụ tạo môhìnhngônngữ SRILM 4. 2 Quá trình thử nghiệm 4. 2.1 Nhận dạng đối tượng Chúng sử dụng mô hình...
... giá kết dịch Chƣơng 1: MÔHÌNHNGÔNNGỮMôhìnhngônngữ nhận nhiều quan tâm nhà khoa học Đã có nhiều môhìnhngônngữ đưa nhằm cải tiến môhìnhngônngữMôhìnhngônngữ sử dụng vào toán nhận ... thức môhìnhngôn ngữ, môhình N-gram, phƣơng pháp làm mịn độ đo dùng để đánh giá môhìnhngônngữ Chương 2: Nghiên cứu sâu môhìnhngônngữ dựa mạng nơron Đặc biệt tập trung vào môhìnhngônngữ ... sánh môhìnhngônngữ .43 Bảng 3.11: Kết BLEU tích hợp với hệ thống dịch máy Moses 47 Bảng 3.12: Kết Perplexity so sánh môhìnhngônngữ .48 DANH MỤC HÌNH ẢNH Hình 2.1: Môhìnhngôn ngữ...
... thực môhình Perplexity môhình đánh giá tập kiểm tra Trong thực tế, Perplexity thước đo để đánh giá môhìnhngôn ngữ, coi hàm cả ngônngữmôhình Trên phương diện hàm mô hình, đánh giá môhìnhmô ... 40 4. 1.1 Giới thiệu dịch máy thống kê 40 4. 1.2 Dịch máy thống kê dựa cụm 43 4. 1.3 Điểm BLEU 45 4. 2 Baseline System 46 4. 3 Ngữ liệu 46 4.4 ... thành công môhìnhngônngữ 4- gram từ 1GB ngữ liệu huấn luyện, SRILM Tuy thời gian huấn luyện RandLM lâu SRILM vấn đề lớn, ta xây dựng môhìnhngônngữ lần Hơn nữa, dung lượng môhìnhngônngữ Bloom...
... 2.1 .4 Sử dụng tập văn Error! Bookmark not defined 2.2 Môhìnhngônngữ Error! Bookmark not defined 2.2.1 Khái quát Error! Bookmark not defined 2.2.2 Tầm quan trọng môhìnhngônngữ ... 2.2.3 Môhìnhngônngữ N-gram Error! Bookmark not defined 2.2 .4 Xích Markov Error! Bookmark not defined 2.2.5 Ước lượng xác suất Error! Bookmark not defined 2.2.6 Đánh giá môhình xác ... -* - ĐÀO BẢO LINH SINH CÂU MIÊU TẢ CHO HÌNH ẢNH SỬ DỤNG MÔHÌNHNGÔNNGỮ Ngành: Công Nghệ Thông Tin Chuyên ngành: Kỹ Thuật Phần Mềm Mã số: 60 .48 .01.03 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN...
... công thức cuối cùng sẽ lớn hơn giá trị H(L) gốc. Do vậy, khi tính H(L) của các môhìnhngônngữ khác nhau trên ngônngữ L, môhình nào cho H(L) nhỏ hơn thì môhìnhngônngữ đó thể hiện chính xác ngônngữ L hơn. 1.6.2 Perplexity - Độ ... dữ liệu đó được nén lại bằng các thuật toán nén, thì kích thước của môhình 20 ngônngữ tất nhiên là giảm. Tuy nhiên, khi một môhìnhngônngữ bị nén, thì độ chính xác và tốc độ của môhìnhngônngữ đều giảm (do phải ... khăn trong việc lưu trữ mà còn làm tốc độ xử lý của môhìnhngônngữ giảm xuống do bộ nhớ của máy tính là hạn chế. Để xây dựng môhìnhngônngữ hiệu quả, chúng ta phải giảm kích thước của môhìnhngônngữ mà vẫn đảm bảo độ chính xác. Vấn đề này sẽ được giải quyết ở phần 1.5 ...
... đưa môhìnhngônngữ tiền đề để ứng dụng vào lĩnh vực Môhìnhngônngữ vấn đề quan trọng lĩnh vực xử lý ngônngữ tự nhiên Môhìnhngônngữ phân bố xác suất đoạn văn tập văn lớn Vì môhìnhngônngữ ... chương trình bày kiến thức môhìnhngônngữ định nghĩa môhìnhngôn ngữ, môhình n-gram, phương pháp đánh giá môhìnhngônngữ phương pháp làm mịn 1.1 Giới thiệu: Môhìnhngônngữ phân bố xác suất ... Markov đưa môhình Markov sử dụng để lập môhình cho chuỗi chữ Sau Claude Shannon đưa môhình cho chữ từ Môhìnhngônngữ định nghĩa sau: Tập V tập từ ngônngữ Ví dụ xây dựng môhìnhngônngữ cho...
... đưa môhìnhngônngữ tiền đề để ứng dụng vào lĩnh vực Môhìnhngônngữ vấn đề quan trọng lĩnh vực xử lý ngônngữ tự nhiên Môhìnhngônngữ phân bố xác suất đoạn văn tập văn lớn Vì môhìnhngônngữ ... 46 4. 1.1 Thời gian nhớ 46 4. 1.2 Sự so sánh độ hỗn loạn thông tin môhìnhngônngữ 46 4. 2 Thực nghiệm 47 4. 2.1 Môi trường chạy thực nghiệm 47 4. 2.2 ... Chương 1: Môhìnhngônngữ 10 1.1 Giới thiệu: 10 1.2 Môhìnhngônngữ N-gram 11 1.3 Khó khăn xây dựng môhìnhngônngữ N-gram 13 1.3.1...
... đưa môhìnhngônngữ tiền đề để ứng dụng vào lĩnh vực Môhìnhngônngữ vấn đề quan trọng lĩnh vực xử lý ngônngữ tự nhiên Môhìnhngônngữ phân bố xác suất đoạn văn tập văn lớn Vì môhìnhngônngữ ... 10 Chƣơng 1: Môhìnhngônngữ Trong xử lý ngônngữ tự nhiên, môhìnhngônngữ sử dụng rộng rãi Môhìnhngônngữ áp dụng nhiều lĩnh vực nhận dạng giọng nói, dịch máy Môhìnhngônngữ ngày nhận ... chương trình bày kiến thức môhìnhngônngữ định nghĩa môhìnhngôn ngữ, môhình n-gram, phương pháp đánh giá môhìnhngônngữ phương pháp làm mịn 1.1 Giới thiệu: Môhìnhngônngữ phân bố xác suất...