0

trích rút kho ngữ liệu từ wiki

Đề tài :  nghiên cứu việc xây dựng, chuẩn hóa và khai thác kho ngữ liệu từ nguồn internet cho xử lý tiếng việt

Đề tài : nghiên cứu việc xây dựng, chuẩn hóa và khai thác kho ngữ liệu từ nguồn internet cho xử lý tiếng việt

Tiến sĩ

... ngôn ngữ, kiểm tra xuất xác nhận quy tắc ngữ pháp ngôn ngữ Kho ngữ liệu chứa văn ngôn ngữ (kho ngữ liệu đơn ngữ) chứa văn nhiều ngôn ngữ (kho ngữ liệu đa ngữ) Nội dung kho ngữ liệu lấy từ nhiều ... làm kho ngữ liệu trung gian (làm “hạt giống”) cho việc thu thập kho ngữ liệu lớn từ Web 2.2.1.1 Trích rút kho ngữ liệu từ Wiki Để trích rút văn từ Wiki trước hết ta cần tải khối liệu nén XML Wiki ... nguồn từ kỷ yếu Quốc hội Châu Âu từ năm 1996–2006 Kho ngữ liệu gồm cặp ngôn ngữ khác nhau; Kho ngữ liệu song ngữ song song Anh - Pháp (Canadian Hansard) hiệp hội liệu ngôn ngữ học (LDC), kho ngữ liệu...
  • 150
  • 1,471
  • 5
NGHIÊN CỨU VIỆC XÂY DỰNG, CHUẨN HÓA VÀ  KHAI THÁC KHO NGỮ LIỆU TỪ NGUỒN INTERNET  CHO XỬ LÝ TIẾNG VIỆT

NGHIÊN CỨU VIỆC XÂY DỰNG, CHUẨN HÓA VÀ KHAI THÁC KHO NGỮ LIỆU TỪ NGUỒN INTERNET CHO XỬ LÝ TIẾNG VIỆT

Tiến sĩ

... (kho ngữ liệu đa ngữ) Các văn dạng thô- chưa tách từ giải ngôn ngữ tách từ, giải ngôn ngữ (mức từ loại, mức cú pháp) Các kho ngữ liệu giải mức cú pháp gọi ngân hàng cú pháp (treebank) Kho ngữ liệu ... cho kho ngữ liệu tiếng Việt - Xây dựng quan hệ ngữ pháp tiếng Việt (37 quan hệ ngữ pháp) cho hệ thống nghiên cứu từ vựng; Tích hợp kho ngữ liệu xây dựng từ Internet (kho ngữ liệu thô tách từ gán ... ngôn ngữ học, sử dụng việc phân tích thống kê kiểm tra giả thiết ngôn ngữ, kiểm tra xuất xác nhận quy tắc ngôn ngữ Kho ngữ liệu chứa văn ngôn ngữ (kho ngữ liệu đơn ngữ) chứa văn nhiều ngôn ngữ (kho...
  • 29
  • 342
  • 0
Nghiên cứu việc xây dựng, chuẩn hóa và khai thác kho ngữ liệu từ nguồn internet cho xử lý tiếng việt (TT)

Nghiên cứu việc xây dựng, chuẩn hóa và khai thác kho ngữ liệu từ nguồn internet cho xử lý tiếng việt (TT)

Tiến sĩ

... (kho ngữ liệu đa ngữ) Các văn dạng thô- chưa tách từ giải ngôn ngữ tách từ, giải ngôn ngữ (mức từ loại, mức cú pháp) Các kho ngữ liệu giải mức cú pháp gọi ngân hàng cú pháp (treebank) Kho ngữ liệu ... cho kho ngữ liệu tiếng Việt - Xây dựng quan hệ ngữ pháp tiếng Việt (37 quan hệ ngữ pháp) cho hệ thống nghiên cứu từ vựng; Tích hợp kho ngữ liệu xây dựng từ Internet (kho ngữ liệu thô tách từ gán ... ngôn ngữ học, sử dụng việc phân tích thống kê kiểm tra giả thiết ngôn ngữ, kiểm tra xuất xác nhận quy tắc ngôn ngữ Kho ngữ liệu chứa văn ngôn ngữ (kho ngữ liệu đơn ngữ) chứa văn nhiều ngôn ngữ (kho...
  • 26
  • 444
  • 0
Nghiên cứu xây dựng thuật toán trích rút tự động các luật văn phạm PCFG LTGA từ các kho ngữ liệu có chú giải cú pháp tiếng việt phục vụ cho bài toán phân tích cú pháp

Nghiên cứu xây dựng thuật toán trích rút tự động các luật văn phạm PCFG LTGA từ các kho ngữ liệu có chú giải cú pháp tiếng việt phục vụ cho bài toán phân tích cú pháp

Tiến sĩ

... ngôn ngữ, kiểm tra xuất xác nhận quy tắc ngữ pháp ngôn ngữ Kho ngữ liệu chứa văn ngôn ngữ (kho ngữ liệu đơn ngữ) chứa văn nhiều ngôn ngữ (kho ngữ liệu đa ngữ) Nội dung kho ngữ liệu lấy từ nhiều ... làm kho ngữ liệu trung gian (làm “hạt giống”) cho việc thu thập kho ngữ liệu lớn từ Web 2.2.1.1 Trích rút kho ngữ liệu từ Wiki Để trích rút văn từ Wiki trước hết ta cần tải khối liệu nén XML Wiki ... nguồn từ kỷ yếu Quốc hội Châu Âu từ năm 1996–2006 Kho ngữ liệu gồm cặp ngôn ngữ khác nhau; Kho ngữ liệu song ngữ song song Anh - Pháp (Canadian Hansard) hiệp hội liệu ngôn ngữ học (LDC), kho ngữ liệu...
  • 150
  • 863
  • 0
Extraction of Vietnamese collocation from text corpora  trích chọn lọc collocation tiếng Việt từ kho ngữ liệu văn bản

Extraction of Vietnamese collocation from text corpora trích chọn lọc collocation tiếng Việt từ kho ngữ liệu văn bản

Công nghệ thông tin

... collocation Chi-Square values are calculated from a large data set (data Vnexpress (199MB) and Wikipedia (270MB) in about 200 subjects), and are based on a threshold value to determine the collocation ... có, vẫn, những, lại, mà, kia, quá, một, cũng, như, đây, đấy, đó, sau, khi, một, trong, cả, tới, từ, đến, bị Since the words forming a collocation have a relationship with each other, so we limited ... In In CoRR-1996, pages 74–83, 1993 [4] Mai Ngọc Chừ; Vũ Đức Nghiệu Hoàng Trọng Phiến Cơ sở ngôn ngữ học tiếng Việt Nxb Giáo dục, 1997 [5] John Carroll, Guido Minnen, Darren Pearce, Yvonne Canning,...
  • 43
  • 705
  • 0
RÚT TRÍCH KHO NGỮ LIỆU SONG NGỮ HOA VIỆT TRÊN NHIỀU DOMAIN

RÚT TRÍCH KHO NGỮ LIỆU SONG NGỮ HOA VIỆT TRÊN NHIỀU DOMAIN

Kỹ thuật lập trình

... dựng kho ngữ liệu song song cho cặp ngôn ngữ Anh-Việt: hệ thống tạo kho ngữ liệu song ngữ Anh-Việt hai tác giả Đặng Bác Văn, Hồ Bảo Quốc [8]; hệ thống xây dựng kho ngữ liệu song ngữ Anh-Việt từ ... + Trạng ngữ thời gian Các cấu trúc dị biệt Sự lặp lại từ KHAI THÁC NGỮ LIỆU SONG NGỮ HOA-VIỆT TRÊN NHIỀU DOMAIN Chúng sử dụng độ tương đồng nội dung văn để rút trích cặp ... 2007 Xây dựng kho ngữ liệu song ngữ từ liệu khai thác từ Internet, Luận văn Thạc sĩ Công nghệ thông tin, ĐH KHTN [10] Ngô Quốc Hưng, 2009 Tìm kiếm tự động văn song ngữ Anh-Việt từ Internet Luận...
  • 7
  • 266
  • 2
Rút trích tri thức ngữ nghĩa từ tên thể loại wikipedia

Rút trích tri thức ngữ nghĩa từ tên thể loại wikipedia

Thạc sĩ - Cao học

... lọc liệu từ Wikipedia Phân tích tên thể loại, tiêu đề viết thành cặp từ vựng Rút trích đặc trưng từ hệ thống phân cấp thể loại Wikipedia Tính độ tương đồng từ vựng dựa đặc trưng rút trích từ Wikipedia ... thể loại tài liệu lưu trữ Wikipedia + Khảo sát nghiên cứu liên quan đến việc rút trích ngữ nghĩa từ tên thể loại + Phát triển sở kế thừa cải tiến phương pháp rút trích ngữ nghĩa từ tên thể loại, ... trên, luận văn nghiên cứu rút trích tri thức ngữ nghĩa từ tên thể loại wikipedia” xây dựng mô ứng dụng mở rộng truy vấn sử dụng đặc trưng ngữ nghĩa rút trích từ hệ thống Wikipedia 1.2 Mục đích Mục...
  • 63
  • 332
  • 0
Xây dựng kho dữ liệu từ vựng song ngữ việt bhnong

Xây dựng kho dữ liệu từ vựng song ngữ việt bhnong

Kỹ thuật

... a t vào kho ng v ng Ho c có th c p nh t t ñ ng vào kho ng v ng t ngu n văn b n, hay báo, v.v… b ng ti ng Bhnong m ng Thi t k trò chơi ñ cho ngư i chơi có th t ñ ng thêm nh ng t m i vào kho ng ... Tìm hi u c u trúc t p tin văn b n RTF c a Winword c u trúc tài li u XML Ý nghĩa khoa h c th c ti n c a ñ tài V m t khoa h c B n thân n m ñư c s lý thuy t t ng quan v lo i t ñi n gi y t ñi n máy ... hi u phương pháp c p nh p t ñ ng nên chương trình ch có th làm giàu kho ng v ng b ng phương pháp th công ch không th làm giàu kho ng v ng b ng nhi u phương pháp c p nh t t ñ ng Hư ng phát tri n...
  • 26
  • 373
  • 0
Xây dựng ontology từ kho ngữ liệu dạng văn bản

Xây dựng ontology từ kho ngữ liệu dạng văn bản

Thạc sĩ - Cao học

... động từ kho ngữ liệu dạng văn II- Nhiệm vụ nội dung: - Khảo sát phương pháp xây dựng ontology từ kho ngữ liệu dạng văn - Đề xuất (hoặc cải tiến) phương pháp xây dựng ontology từ kho ngữ liệu ... động từ nguồn ngữ liệu dạng văn bản, từ góp phần hỗ trợ người dùng tạo thể học cho miền kiến thức cụ thể từ nguồn ngữ liệu văn Các đóng góp luận văn: - Trình bày bước tạo thể học bán tự động từ kho ... quan Từ việc tìm hiểu phương pháp có, để tìm hiểu phương pháp tạo thể học bán tự động từ kho ngữ liệu dạng văn đề tài tập trung thực nhiệm vụ sau: Khảo sát phương pháp xây dựng ontology từ kho ngữ...
  • 84
  • 394
  • 1
Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

Khoa học xã hội

... tập liệu mẫu đủ lớn Tập liệu mẫu kho ngữ liệu Có loại kho ngữ liệu câu, từ, từ gán nhãn, câu gán nhãn cú pháp Trong kho liệu câu gán nhãn cú pháp đầy đủ nhất, từ đễ dàng rút liệu mẫu câu, từ hay ... thuật gồm hai phần chủ ngữ vị ngữ: Trong chủ ngữ thường cụm danh từ, vị ngữ thường cụm động từ cụm tính từ Với số ngôn ngữ tiếng Anh, vị ngữ cụm động từ Với câu: “Anh yêu em”, ... vị từ không bao gồm từtừ điển, mà từ từ sinh tự theo quy tắc (như phương thức thêm phụ tố hay phương thức láy) chuỗi kí hiệu không liệt kê từ điển Công cụ sử dụng tập liệu kèm tập từ điển từ...
  • 43
  • 1,354
  • 13
Báo cáo khoa học: Trích rút đường mực nước từ ảnh Landsat docx

Báo cáo khoa học: Trích rút đường mực nước từ ảnh Landsat docx

Báo cáo khoa học

... Đường mực nước rút trích từ Landsat 1MSS b Đường mực nước rút trích từ Landsat 2MSS Hình Đường mực nước rút trích từ Landsat MSS Đối với ảnh Landsat TM, đường phân ranh đất nước từ công thức nguyên ... Đường mực nước rút trích từ công thức ảnh tỷ số nguyên thủy B5/B2 công thức cải tiến (B5+B7)/B2 kết hợp với B7 từ ảnh Landsat 5TM khu vực Mũi Né năm 1990 b Đường mực nước rút trích từ công thức ... kết hợp với B7 từ ảnh Landsat 7ETM+ khu vực Mũi Né năm 2002 Hình So sánh kết rút trích đường mực nước từ công thức ảnh tỷ số nguyên thủy công thức cải tiến ảnh Landsat 5TM 7ETM+ Từ kết đường mực...
  • 7
  • 313
  • 0
SỬ DỤNG KHO NGỮ LIỆU TRONG GIẢNG DẠY TIẾNG VIỆT

SỬ DỤNG KHO NGỮ LIỆU TRONG GIẢNG DẠY TIẾNG VIỆT

Kỹ thuật lập trình

... bao gồm sử dụng kho ngữ liệu ngôn ngữ cho phép người học trực tiếp sử dụng kho ngữ liệu thông qua tập có hướng dẫn qua tài liệu biên soạn dựa vào kho ngữ liệu, chẳng hạn dòng mục ngữ cảnh sau: ... từ vựng dựa kho ngữ liệu Nghiên cứu kho ngữ liệu đóng vai trò quan trọng việc đánh giá xem có dạy cho người học từ mà họ cần tới đời sống hàng ngày hay không, từ phát triển tài liệu dựa kho ngữ ... 1101842 570177 ngữ liệu, dựa kho ngữ liệu xấp xỉ 1089431 559560 100 triệu từ 1054607 551195 Thủ tục để tìm kiếm ngữ đoạn đồng xuất sử dụng nhằm để rút chuỗi lặp lặp lại kho ngữ liệu tạo chuỗi...
  • 11
  • 1,131
  • 7
TRÍCH RÚT MỐI QUAN HỆ NGỮ NGHĨA VÀ  ÁP DỤNG CHO HỆ THỐNG HỎI ĐÁP TỰ ĐỘNG  TIẾNG VIỆT

TRÍCH RÚT MỐI QUAN HỆ NGỮ NGHĨA VÀ ÁP DỤNG CHO HỆ THỐNG HỎI ĐÁP TỰ ĐỘNG TIẾNG VIỆT

Báo cáo khoa học

... này, kho luận nghiên cứu giới thiệu phương pháp trích rút mối quan hệ ngữ nghĩa quan tâm Từ đó, đưa phương pháp trích rút mối quan hệ ngữ nghĩa cho ngôn ngữ tiếng Việt cách kết hợp phương pháp trích ... pháp trích rút mẫu quan hệ ngữ nghĩa phù hợp tài liệu tiếng Việt Chương 3: Mô hình hệ thống hỏi đáp tiếng Việt sử dụng trích rút mối quan hệ ngữ nghĩa Trình bày mô hình trích rút mẫu quan hệ ngữ ... hệ ngữ nghĩa 1.1 Quan hệ ngữ nghĩa 1.2 Các loại quan hệ ngữ nghĩa 1.3 Bài toán trích rút mối quan hệ ngữ nghĩa 1.4 Hệ thống hỏi đáp dựa trích rút quan hệ ngữ...
  • 60
  • 1,413
  • 5
Xây dựng kho dữ liệu song ngữ việt   cơ tu phục vụ tra cứu văn hóa dân tộc cơ tu

Xây dựng kho dữ liệu song ngữ việt cơ tu phục vụ tra cứu văn hóa dân tộc cơ tu

Kỹ thuật

... trưng ngữ pháp tiếng Cơ Tu Tìm hiểu phương pháp tách từ tiếng Việt, sở liệu đa ngữ, cách tổ chức kho liệu song ngữ XML Xây dựng kho liệu song ngữ Phân tích cấu trúc sở liệu song ngữ, kho liệu ... dựng kho liệu song ngữ, áp dụng xây dựng kho liệu song ngữ Việt – Cơ Tu Thống kê kho liệu cập nhật - 19 - Kho liệu Việt – Cơ Tu Số mục TừTu Dung Chiếm từ Việt (đối chiếu) lượng tỷ lệ 1145 từ ... dân tộc Cơ Tu Chƣơng Xây dựng kho liệu song ngữ: Trình bày vấn đề xử lý xây dựng kho liệu song ngữ, xây dựng kho liệu song ngữ Việt – Cơ Tu, cập nhật kho liệu song ngữ Chƣơng Triển khai ứng dụng...
  • 26
  • 905
  • 0
Nghiên cứu kho dữ liệu chuyên đề và ứng dụng trong việc trích rút thông tin quản lý án hình sự tại viện kiểm sát nhân dân tối cao

Nghiên cứu kho dữ liệu chuyên đề và ứng dụng trong việc trích rút thông tin quản lý án hình sự tại viện kiểm sát nhân dân tối cao

Thạc sĩ - Cao học

... CHUNG VỀ KHO DỮ LIỆU Trong chương này, luận văn nêu số khái niệm kho liệu 1.1 Về kho liệu Định nghĩa kho liệu: Có nhiều đinh nghĩa kho liệu, phổ biến định nghĩa kho liệu Bill Inmon: "Kho liệu tập ... quan trọng kho liệu mô hình hoá đa chiều 1.4 Kho liệu chuyên đề Kho liệu chuyên đề (DM) CSDL có đặc điểm giống với Kho liệu với quy mô nhỏ lưu trữ liệu lĩnh vực, chuyên ngành Datamart kho liệu hướng ... vùng chứa liệu dạng lai vùng liệu chuẩn hoá sở liệu hoạt động Mục đích việc hỗ trợ cho việc nạp liệu vào kho liệu đầu cuối, dùng sở liệu hoạt động tập trung Kho liệu đầu cuối, gọi vùng liệu đa...
  • 25
  • 815
  • 0
ứng dụng khai phá dữ liệu để trích rút thông tin theo chủ đề từ các mạng xã hội

ứng dụng khai phá dữ liệu để trích rút thông tin theo chủ đề từ các mạng xã hội

Kỹ thuật

... phân tích thông tin, liệu từ tài liệu, giáo trình, sách liên quan đến khai phá liệu, rút trích thông tin Phương pháp nghiên cứu thực tiễn o Tiến hành nghiên cứu kỹ thuật rút trích thông tin, ứng ... lọc liệu có ích từ nguồn liệu khổng lồ Nhu cầu phát triển kỹ thuật chọn lọc, thu thập, phân tích liệu ,trích rút thông tin cách thông minh hiệu quả, thế, đặt hết Từ đó, kỹ thuật khai phá liệu ... khai phá liệu Khai phá liệu lĩnh vực nghiên cứu ổn định, đời vào kho ng năm cuối của thập kỷ 1980 KPDL trình khảo sát phân tích lượng lớn liệu lưu trữ CSDL, kho liệu, …để từ trích xuất thông tin...
  • 26
  • 800
  • 1
Đồ án tốt nghiệp XÂY DỰNG ỨNG DỤNG TRÍCH rút THỜI GIAN, địa điểm từ dữ LIỆU TIN NHẮN

Đồ án tốt nghiệp XÂY DỰNG ỨNG DỤNG TRÍCH rút THỜI GIAN, địa điểm từ dữ LIỆU TIN NHẮN

An ninh - Bảo mật

... cho từ câu: • • • • • [từ thứ i]: Nhận giá trị nội dung text từ thứ i câu xét, từ từ đơn từ ghép, tách thư viện vnTagger [từ loại]: Xác định từ xét từ loại nào, nhận giá trị: danh từ/ tính từ/ ... Token từ, số hay dấu hết câu POS tagger (Part of speech tagger): gán cho từ nhãn loại từ o ngữ pháp Các nhãn bao gồm: danh từ, động từ, tính từ, phó từ Paser: chia từ vào cụm: cụm danh từ, cụm ... nhiên xuất phát từ việc xác định thông tin cụ thể từ tài liệu ngôn ngữ tự nhiên Mục đích trích rút thông tin chuyển văn tự nhiên dạng văn có cấu trúc Thông tin trích rút từ nguồn tài liệu khác biểu...
  • 61
  • 769
  • 2

Xem thêm