phân loại văn bản tiếng việt

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Ngày tải lên : 12/04/2013, 15:44
... 2009. Học viên Lưu Văn Tăng 4 Luận văn tốt nghiệp Chương 2. Các công cụ phân tích văn bản tiếng Việt Trong chương này em giới thiệu một số công cụ phân tích văn bản tiếng Việt đã có áp dụng ... một văn bản tiếng Việt bất kỳ. Hãy phân tách văn bản đó ra thành các đơn vị câu độc lập. Bài toán tách câu đặt ra với mục đích xây dựng công cụ tự động tách các câu trong một văn bản tiếng Việt ... ngữ liệu cho phân tích văn bản tiếng Việt, các hướng tiếp cận để giải các bài toán đó. Chương 2 – Giới thiệu một số công cụ trong xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt. • Công...
  • 43
  • 1.4K
  • 13
042_Phân loại văn bản tiếng Việt

042_Phân loại văn bản tiếng Việt

Ngày tải lên : 06/10/2013, 19:20
... 4. Bài toán phân loại văn bản Tiếng Việt Xét bài toán phân loại văn bản Tiếng Việt, cho một văn bản bất kỹ hãy xác định chủ đề của văn bản đó dựa trên một tập gồm 200 văn bản. 5. Thực ... quan đến phân loại văn bản như: các phương pháp phân loại văn bản Tiếng Anh, các phương pháp tách từ Tiếng Việt, và cách tiến hành đi vào làm công cụ phân loại văn bản. Trong luận văn có sử ... trọng liên quan đến vấn đề phân loại văn bản. Rút ra những kinh nghiệm của bản thân [1] Nguyễn Phương Thái, Kiểm lỗi Chính tả Cảm Ngữ cảnh Tiếng Việt, Luận văn thạc sĩ, Khoa Công nghệ,...
  • 2
  • 801
  • 7
Tài liệu VẤN ĐỀ GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT pdf

Tài liệu VẤN ĐỀ GÁN NHÃN TỪ LOẠI CHO VĂN BẢN TIẾNG VIỆT pdf

Ngày tải lên : 10/12/2013, 04:15
... hợp tiếng nói, các hệ thống nhận dạng tiếng nói cũng như trong các hệ thống dịch máy. Đối với các văn bản Việt ngữ, việc gán nhãn từ loại có nhiều khó khăn, đặc biệt là bản thân việc phân loại ... lệ lỗi càng giảm - Tập mẫu v ới các văn bảnvăn phong khác nhau có ảnh hưởng tới kết quả gán nhãn. Bảng 1. Kết quả gán nhãn từ loại mức 1 Văn bản / Văn phong Số đơn vị từ Test 1 Test 2 ... TỪ LOẠI Trong phần này chúng tôi giới thiệu tổng quan về các kĩ thuật gán nhãn từ loại và các bước giải quyết bài toán gán nhãn từ loại cho văn bản tiếng Việt. Quá trình gán nhãn từ loại...
  • 11
  • 733
  • 1
Nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn

Nghiên cứu gán nhãn từ loại cho văn bản tiếng việt bằng phương pháp học máy không có hướng dẫn

Ngày tải lên : 10/02/2014, 20:19
... từ loại hay không. Công việc gán nhãn từ loại cho một văn bản là xác định từ loại của mỗi từ trong phạm vi văn bản đó. Các công cụ gán nhãn (hay chú thích) từ loại cho các từ trong một văn bản ... Toán tin; Gán nhãn từ loại; Văn bản tiếng Việt; Máy tính Content MỞ ĐẦU Một trong các vấn đề nền tảng của ngôn ngữ tự nhiên là việc phân loại các từ thành các lớp từ loại dựa theo thực tiễn ... tiếng Việt theo cách tiếp cận này. loại chính xác nhờ kết quả liên kết từ Anh -Việt và phép chiếu từ loại từ Anh sang Việt. Như vậy, có thể thấy rằng bài toán gán nhãn từ loại cho tiếng Việt...
  • 13
  • 1.2K
  • 2
NHẬN BIẾT CÁC LOẠI THỰC THỂ TRONG VĂN BẢN TIẾNG VIỆT NHẰM HỖ TRỢ WEB NGỮ NGHĨA VÀ TÌM KIẾM HƯỚNG THỰC THỂ

NHẬN BIẾT CÁC LOẠI THỰC THỂ TRONG VĂN BẢN TIẾNG VIỆT NHẰM HỖ TRỢ WEB NGỮ NGHĨA VÀ TÌM KIẾM HƯỚNG THỰC THỂ

Ngày tải lên : 16/02/2014, 03:00
... nhận biết các loại thực thể trong tiếng Việt Một hệ thống nhận biết loại thực thể trong tiếng Việt nếu ra đời sẽ góp phần quan trọng trong xử lý tiếng Việt và hiểu các văn bản tiếng Việt. Tuy ... quá trình phân lớp. Thực nghiệm trên các văn bản tiếng Việt cho thấy qui trình phân lớp đạt được kết quả rất khả quan. 18 Phương trình (3.6) thể hiện một ràng buộc đối với phân phối mô ... Nhận biết các loại thực thể là một bước cơ bản trong trích chọn thông tin từ văn bản và xử lý ngôn ngữ tự nhiên. Nó được ứng dụng nhiều trong dịch tự động, tóm tắt văn bản, hiểu ngôn ngữ...
  • 58
  • 2K
  • 2
Tra cứu văn bản tiếng việt dựa trên kỹ thuật phân cụm

Tra cứu văn bản tiếng việt dựa trên kỹ thuật phân cụm

Ngày tải lên : 17/02/2014, 09:46
... văn bản 2.2 Kỹ thuật phân cụm văn bản tiếng Việt dựa trên thuật toán phân cấp 2.2.1 Phân cụm văn bản 2.2.1.1 Khái niệm phân cụm văn bản Định nghĩa: Thuật toán phân cụm nhóm tập các văn bản ... văn bản tiếng Việt đã được phân cụm. 2.1 Phương pháp biểu diễn văn bản 2.1.1 Khái niệm Biểu diễn văn bản là phương pháp mô tả nội dung hoặc đặc trưng của văn bản [1]. Khi biểu diễn văn bản ... tài “Tra cứu văn bản tiếng Việt dựa trên kỹ thuật phân cụm”. Các đóng góp của luận văn - Nghiên cứu, cải tiến một số phương pháp tra cứu đối với văn bản tiếng Anh áp dụng cho tiếng Việt. - Sử...
  • 26
  • 478
  • 1
Tìm kiếm văn bản tiếng việt

Tìm kiếm văn bản tiếng việt

Ngày tải lên : 02/11/2012, 13:53
... các trường hợp sau: q là thành phần thô trong văn bản d j [3-1] q là thành phần thô dưới trong văn bản d j [3-2] q là thành phần thô trên trong văn bản d j [3-3] 4- q bao hàm thô d j (ngược ... Với q là một truy vấn ta có các trường hợp sau: Văn bản d j là thành phần thô trong q [4-1] Văn bản d j là thành phần thô dưới trong q [4-2] Văn bản d j là thành phần thô trên trong q [4-3] 5- ... thuộc, bổ sung ý nghĩa cho vị ngữ. 4. Các đặc điểm của tiếng Việt TrÞnh §øc Cêng Trang 10 Đồ án tốt nghiệp Tìm kiếm văn bản tiếng Việt 3.1 Cõu n Cõu n l loi cõu c s ca ting Vit, nú bao gm...
  • 77
  • 841
  • 5
Luận văn tốt nghiệp Xử lý các văn bản tiếng Việt

Luận văn tốt nghiệp Xử lý các văn bản tiếng Việt

Ngày tải lên : 23/11/2012, 08:08
... Bảng 3. Quá trình phân tích từ trên xuống Bảng 5. Tập luật của văn phạm tiếng Việt 48 Bảng 6. Tập luật của văn phạm tiếng Anh 50 Khoá luận tốt nghiệp 6 Danh mục hình Hình 1. Phân loại ... phương án phân tích cho một câu tiếng Việt nhập nhằng 62 Hình 19. Cây phân tích ứng với cách tách từ đúng 62 Danh mục bảng Bảng 1. Phân tích từ trên xuống, ưu tiên chiều sâu cho văn phạm ... toán cho bài toán phân tích cú pháp tiếng Anh. Trong phần phụ lục của khoá luận em sẽ trình bày chi tiết bài toán tách từ vựng tiếng Việt. Chương 4. Xây dựng văn phạm tiếng Việt Khoá luận tốt...
  • 63
  • 1.1K
  • 4
Tìm kiếm văn bản tiếng Việt

Tìm kiếm văn bản tiếng Việt

Ngày tải lên : 05/04/2013, 15:56
... việc trên một tập lớn các tài liệu như phân lớp văn bản, phân loại văn bản, tìm kiếm văn bản do đó mối tương quan giữa các từ chiết xuất được và tập văn bản phải được lưu ý đến. Ngưỡng kết hợp ... liệu văn bản sẽ được trình bầy ở phần sau. 2. Các kỹ thuật khai phá Các bài toán thường được quan tâm trong khai phá dữ liệu văn bản là Phân loại văn bản (text categorization), Phân lớp văn bản ... trong tiếng Việt có thể là một tiếng hay gồm nhiều tiến. Hơn nữa, trong tiếng Việt những từ nhiều tiếng có thể được ghép bởi những tiếng hay từ khác có nghĩa. Ví dụ như hai từ chỉ một tiếng...
  • 86
  • 445
  • 0
Bước đầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng Việt hiện nay

Bước đầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng Việt hiện nay

Ngày tải lên : 06/04/2013, 10:22
... danh đối với các văn bản tiếng Việt khác. Cách viết địa danh trên các bản đồ vì thế là vấn đề được lưu tâm từ trước tới nay. Tuy nhiên, trên thực tế cách viết địa danh trên các bản đồ vẫn chưa ... trong tiếng Việt, âm /r/ chỉ tồn tại với tư c¸ch là một âm của phương ngữ nhưng do một qúa trình tiếp xúc giữa tiếng Việt và các ngôn ngữ phương Tây mà những âm /p/ và /r/ vào tiếng Việt và ... tiếp Chủ yếu phiên theo tiếng Hán và cách đọc Hán Việt “Ngày 17. 2 tại Hà Nội, ngài Ha- tô- ri, đại sứ Nhật Bản tại Việt Nam và GS Nguyễn Trọng Nhân, chủ tịch hội Nhãn Khoa Việt Nam cùng ký kết...
  • 56
  • 840
  • 0
Bước dầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng việt hiện nay

Bước dầu khảo sát tình hình viết địa danh nước ngoài trên một số văn bản tiếng việt hiện nay

Ngày tải lên : 07/04/2013, 10:34
... chung và đồng nhất cho các bản đồ để định 2. Một số ý kiến về vấn đề chuẩn hố địa danh nước ngồi trên các văn bản tiếng Việt 2.1. Những qui định của quốc tế và Việt Nam về cách viết địa danh ... các văn bản. 4. Bố cục Ngồi phần mở đầu và kết luận, đề tài của chúng tơi gồm bốn chương và một phụ lục Chương 1. Lý luận chung Chuơng 2. Tình hình viết địa danh trên một số văn bản tiếng Việt ... một văn bản. Vì vậy, chúng ta cần nhận thấy rằng để thống nhất cách viết địa danh trên tất cả các văn bản thì phải việc trước tiên là cần phải thống nhất cách viết ngay trong bản thân từng văn...
  • 58
  • 633
  • 2
tìm hiểu các hướng tiếp cận bài toán phân loại văn bản và xây dựng phần mềm phân loại tin tức báo điện tử

tìm hiểu các hướng tiếp cận bài toán phân loại văn bản và xây dựng phần mềm phân loại tin tức báo điện tử

Ngày tải lên : 12/04/2013, 14:29
... PHÁP PHÂN LOẠI VĂN BẢN TIẾNG ANH 2.1. Bối cảnh các phương pháp phân loại văn bản hiện nay Phân loại văn bản tự động là một lĩnh vực được chú ý nhất trong những năm gần đây. Để phân loại ... hướng tiếp cận cho phân loại văn bản và tách từ tiếng Việt hiện nay; 2 chương tiếp theo trình bày hướng tiếp cận của luận vă n đối với phân loại văn bản và tách từ tiếng Việt; 3 chương cuối ... 1997]. 2.2. Các phương pháp phân loại văn bản tiếng Anh hiện hành 2.2.1. Biểu diễn văn bản Bước đầu tiên của mọi phương pháp phân loại là chuyển việc mô tả văn bản dùng chuỗi ký tự thành một...
  • 132
  • 1.1K
  • 12

Xem thêm