... Kiểm lỗi chính tả bằng mô hình N-gram kết hợp với phương pháp ước lượng
Bayes để tính xác suất N-gram và các mô hình tách từ
Phương pháp này áp dụng mô hình CInsunSpell[4] của tiếng Hoa vào tiếng ... HCM
ĐỀ TÀI NCKH CẤP TRƯỜNG
XÂY DỰNG PHƯƠNG PHÁP KIỂM LỖI CHÍNH TẢ
TIẾNG VIỆT SỬ DỤNG MÔ HÌNH TỪ ĐIỂN
MÃ SỐ:...
... bắt lỗi chính tả thì lỗi chính tả có thể phân làm hai loại là lỗi
non-word và lỗi real-word (được sử dụng trong [TPLT98]):
• Lỗi non-word là lỗi tạo ra từ sai, hoàn toàn không có trong từ điển.
Đây ... 39
2.4.2 Chính tả tiếng Việt . . . . . . . . . . . . . . . . . . . . . 41
2.4.3 Lỗi chính tả . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1...
... li chính t cho các ngôn ng châu Á 6
1.1.2.1. Mô hình CInsunSpell cho ting Hoa 6
1.1.2.2. Phng pháp ca Nagata cho ting Nht 7
1.1.3. ánh giá chung v các mô hình trên 9
1.2. Kim li chính ... 10
1.2.2. Kim li chính t da vào phân tích cú pháp 11
1.2.3. Kim li chính t bng mô hình li t 12
1.2.4. Word 2003 phiên bn ting Vit 13
Chng 2. s lý thuy...
... về tiếng Việt, bài toán kiểm lỗi chính tả và
phương pháp kiểm lỗi chính tả được sử dụng.
Chương 2: Trình bày một số vấn đề lý thuyết về mô hình ngôn ngữ n-gram.
Chương 3: Kiểm lỗi chính tả ...
kiểm lỗi chính tả tiếng Việt. Trọng tâm của luận văn là sử dụng mô hình ngôn ngữ N-
gram để kiểm lỗi chính tả cảm ngữ cảnh tiếng Việ...
... năng
chính tả tiếng Việt.
1.2.3. Đặc điểm chính tả tiếng Việt
1.2.3.1. Chính tả tiếng Việt là chính tả ngữ âm
Về cơ bản, chính tả tiếng Việt là chính tả ngữ âm, nghĩa là mỗi âm vị đợc
ghi bằng ... 58
2.4. Thực trạng sử dụng các biện pháp sửa lỗi chính tả cho học sinh lớp
2, 3 dân tộc Hmông huyện Kỳ Sơn - tỉnh Nghệ An 59
2.4.1. Thực trạng...
... bày và xây dựng hệ thống phân loại kết hợp với các phương pháp tối ưu kích thước
dữ liệu được áp dụng cho văn bản Tiếng Việt.
2. Phân tách câu thành các từ
Khác với tiếng Anh, văn bản tiếng Việt ... là phương thức chủ yếu để sản sinh ra các đơn vị từ vựng. Theo phương thức
này, tiếng Việt triệt để sử dụng các yếu tố cấu tạo từ thuần Việt hay vay mượn t...
... BY
−
Đồ thị biểu diễn độ chính xác phân loại trên mỗi chuyên mục trường hợp văn bản
tách thành các từ sử dụng hàm nhân RBF (mũ=1.5)
Phương pháp LSI/SVD
LSI là ứng dụng của một kỹ thuật toán ...
Nội dung trình bày
•
Đặt vấn đề
•
Các phương pháp học máy phân loại văn
bản
•
Các phương pháp giảm chiều đặc trưng
•
Kết quả thực nghiệm
•
Kết luận
Phương pháp LDA/GSVD...
... bị sai chính tả và từ gợi ý sửa lại đúng. Số lượng từ càng nhiều và càng sát với
thực tế thì khả năng kiểm tra chính tả của chương trình càng tốt hơn.
- Chức ... xử lý
theo ý riêng của người dùng như: kiểm tra chính tả toàn văn bản / chỉ vùng
phủ khối / trang tùy ý, các chế độ bắt lỗi tùy biến, độ dài của từ kiểm tra
(mặc định là 3 tối đa là 6, nếu ... viện dữ liệ...