...
vector. Dựa trên phương pháp biểu diễn này, luận văn sử dụng phương pháp phân cụm tiếng
Việt dựa trên thuật toán cây phân cấp và hệ thống tra cứu văn bản tiếng Việt dựa trên tập dữ
liệu văn bản tiếng ... thuật phân cụm văn bản tiếng Việt dựa trên thuật toán phân cấp
2.2.1 Phân cụm văn bản
2.2.1.1 Khái niệm phân cụm văn bản
Định nghĩ...
... danh đối với các văn bản tiếng Việt khác.
Cách viết địa danh trên các bản đồ vì thế là vấn đề được lưu tâm từ trước
tới nay. Tuy nhiên, trên thực tế cách viết địa danh trên các bản đồ vẫn chưa ... xúc giữa tiếng Việt và các ngôn
ngữ phương Tây mà những âm /p/ và /r/ vào tiếng Việt và ngày nay chúng ta
gọi /pari/ (paris) chứ không gọi là /bazi/ cho hợp với...
... cách xử lý chung và đồng nhất cho các bản đồ để
định
2. Một số ý kiến về vấn đề chuẩn hố địa danh nước ngồi trên các văn bản
tiếng Việt
2.1. Những qui định của quốc tế và Việt Nam về cách ... chương và
một phụ lục
Chương 1. Lý luận chung
Chuơng 2. Tình hình viết địa danh trên một số văn bản tiếng Việt hiện nay
Chương 3. Đánh giá tình hình địa danh nước...
... tiếp cận dựa trên từ điển: Ý tưởng của hướng tiếp cận này là
những cụm từ được tách ra từ văn bản phải được so khớp với các từ
trong từ điển. Do đó trong hướng tiếp cận này đòi hỏi từ điển riêng ... chuyên gia, thầy cô và bạn bè.
41
Luận văn tốt nghiệp
- Từ điển từ vựng tiếng Việt có kèm theo chú giải từ loại, là các nhãn từ
loại có thể. Từ đi...
... Văn bản tiếng Việt không dấu
Văn bản tiếng Việt có dấu
Dữ liệu đơn ngữ
Văn bản tiếng Việt có dấu
Xây dựng mô hình ngôn ngữ
Xây dựng mô hình dịch
Dịch máy
Đánh giá kết quả dịch
... vậy phát triển một công cụ giúp thêm dấu tiếng Việt vào
văn bản không dấu là việc rất cần thiết và thú vị.
: VietPad là một chƣơng trình text
editor Việt Unico...
... khi thực hiện ẩn
dữ trên văn bản.
Các phƣơng pháp ẩn dữ liệu trên văn bản có thể chia thành ba nhóm: ẩn dữ
liệu trực tiếp trên văn bản, ẩn dữ liệu trên văn bản đã định dạng, ẩn dữ liệu trên
tập ... trên văn bản trên thế giới 42
3.2.1.1. Watermarking trực tiếp trên văn bản 42
3.2.1.2. Watermarking trên văn bản đã định dạng 43
3.2.1.3. Waterm...
... xuất hiện kí tự trong file văn bản
V. Kết quả thử nghiệm
Chương trình được chạy thử cho file văn bản có tên là A.TXT và kết quả được
ghi trên 2 file:
KETQUA1.TXT: chứa kết ... sách thống kí tự từ đơn và đưa kết quả ra file văn
bản.
Từ danh sách đã thu được từ bước 1, ta tiến hành thực hiện công việc thứ nhất
của bài toán: thống kê kí tự đơ...
... tƣơng ứng cụm từ
trực tiếp từ văn bản song ngữ. Họ giới thiệu một mô hình khả năng kết nối dựa trên
cụm từ sinh đồng thời từ câu của ngôn ngữ nguồn và ngôn ngữ đích trong một văn bản
song song. ... đoạn văn bản tiếng Việt không dấu sang
văn bản có dấu tƣơng ứng.
Hình 1.2.4-5 Văn bản sau khi thực hiện chức năng thêm dấu của Vietmarker
Ngoài ra c...
... nguyên cơ bản cho xử
lý văn bản tiếng Việt
− Từ điển từ tiếng Việt cho máy
tính
− Kho ngữ liệu câu tiếng Việt
được chú giải ngữ pháp (Viet
TreeBank)
Kho ngữ liệu các cặp câu Anh-
Việt được ... trong hầu hết các giai đoạn của xử
lý tiếng nói và văn bản. Xu thế này đã làm cho xử lý tiếng nói và văn bản – vốn
tách riêng từ các năm 1960 − gặp lạ...