Nghiên cứu phân lớp tự động văn bản báo chí tiếng Việt về tài nguyên và môi trường

80 1.1K 0
Nghiên cứu phân lớp tự động văn bản báo chí tiếng Việt về tài nguyên và môi trường

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • DANH MỤC CÁC HÌNH

  • MỞ ĐẦU

  • 1.1. KHAI PHÁ DỮ LIỆU VĂN BẢN

  • 1.2. KHÁI NIỆM CƠ BẢN TRONG KHAI PHÁ VĂN BẢN

  • 1.2.1. Một số khái niệm sử dụng trong luận văn

  • 1.2.2. Các phương pháp đánh trọng số cho từ khóa

  • 1.3. MỘT SỐ PHƯƠNG PHÁP BIỂU DIỄN VĂN BẢN

  • 1.3.1. Mô hình Boolean

  • 1.3.2. Mô hình không gian vector

  • 1.3.3. Mô hình xác suất

  • 1.3.4. Mô hình LSI

  • 1.4. PHƯƠNG PHÁP LỰA CHỌN TỪ TRONG BIỂU DIỄN VĂN BẢN

  • 1.4.1. Loại bỏ từ dừng

  • 1.4.2. Thu gọn đặc trưng biểu diễn

  • 1.5. ĐỘ LIÊN QUAN GIỮA CÁC VĂN BẢN

  • 1.6. PHÂN LỚP VĂN BẢN

  • 1.7. THUẬT TOÁN K LÁNG GIỀNG GẦN NHẤT (KNN)

  • 2.1. MỘT SỐ ĐẶC ĐIỂM TIẾNG VIỆT

  • 2.1.1. Âm tiết

Tài liệu cùng người dùng

Tài liệu liên quan