Xây dựng chương trình bắt lỗi chính tả tiếng Việt

172 138 0
Xây dựng chương trình bắt lỗi chính tả tiếng Việt

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Mô hình bắt lỗi chính tả theo hai giai đoạn. Giai đoạn thứ nhất tìm và yêu cầu người dùng sửa lỗi tiếng (những tiếng không tồn tại trong tiếng Việt). Giai đoạn này chủ yếu sửa những lỗi sai do nhập liệu từ bàn phím. Giai đoạn hai được dùng để bắt lỗi từ. Tất cả các cách tách từ có thể có của câu nhập vào được xây dựng dựa trên lưới từ. Sau đó lưới từ này được mở rộng để thêm vào những câu mới nhờ áp dụng các nguyên nhân gây lỗi chính tả, nhằm tạo ra câu đúng từ câu sai chính tả. Mô hình ngôn ngữ được áp dụng để đánh giá từng cách tách từ trong lưới từ và chọn ra cách tách từ tốt nhất. Dựa vào cách tách từ này và câu gốc, ta sẽ xác định từ sai chính tả và đưa ra từ đề nghị. Một số heuristic được áp dụng để hiệu chỉnh lưới từ nhằm tạo ra một kết quả

Ngày đăng: 21/06/2018, 09:39

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan