0

cu phap tieng viet su dung

Phân tích cú pháp tiếng việt sử dụng văn phạm phụ thuộc

Phân tích pháp tiếng việt sử dụng văn phạm phụ thuộc

Hệ thống thông tin

... Dependency Grammar for Vietnamese Firstly, I demonstrate my researches of grammar of Vietnamese As the result of this stage, I illustrate the process of building Dependency Grammar for Vietnamese In the ... first with Uniqueness Giải thuật ESDU LSU List-based Search with Uniqueness Giải thuật LSU LSUP List-based Search with Uniqueness and Projectivity Giải thuật LSUP VPPT Văn phạm phụ thuộc VPLK Văn ... I show and evaluate the result of the test from applying constructed parsing on Vietnamese Phân tích pháp tiếng Việt sử dụng Văn phạm phụ thuộc MỤC LỤC TÓM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP ...
  • 72
  • 1,651
  • 8
Phân tích cú pháp tiếng việt sử dụng văn phạm phụ thuộc

Phân tích pháp tiếng việt sử dụng văn phạm phụ thuộc

Hệ thống thông tin

... biểu diễn cung từ head đến dependent với nhãn quan hệ DT_TT Áo đẹp TÍNH CHẤT VĂN PHẠM PHỤ THUỘC  Chỉ có từ root câu  Các từ lại có head  Tính đơn nhất: Mỗi từ có  head Tính xạ ảnh: Các cung không ... NỘI DUNG Bài toán phân tích pháp Văn phạm phụ thuộc Xây dựng văn phạm phụ thuộc cho tiếng Việt Thử...
  • 20
  • 903
  • 0
XÂY DỰNG hệ THỐNG PHÂN LOẠI văn bản TIẾNG VIỆT sử DỤNG PHƯƠNG PHÁP máy véc tơ hỗ TRỢ kết hợp các PHƯƠNG PHÁP tối ưu KÍCH THƯỚC dữ LIỆU

XÂY DỰNG hệ THỐNG PHÂN LOẠI văn bản TIẾNG VIỆT sử DỤNG PHƯƠNG PHÁP máy véc tơ hỗ TRỢ kết hợp các PHƯƠNG PHÁP tối ưu KÍCH THƯỚC dữ LIỆU

Hệ thống thông tin

... k Tính tổng Sumd ( j ) = ∑ m =1 cos(d , di ) k vec tớ đầu tiền tập j Nếu sumd ( x) = arg max( sumd ( j )) văn d thuộc lớp x 3.7 Phân loại văn phương pháp Support Vector Machines Support Vector ... Trong xr support véc-tơ thỏa mãn α*r >0, s tổng số support véc-tơ siêu phẳng tối ưu Từ (1.14) ta thấy αi≥ 0, nên αi= tích αiyixi=0, αi>0 có ý nghĩa việc xây dựng véc-tơ w Theo điều kiện bổ sung hệ ... quan hệ pháp yếu tố câu, nhờ nhằm đưa nội dung muốn thông báo Trên văn bản, ngữ điệu thường biểu dấu câu Chúng ta thử so sánh câu sau để thấy khác nội dung thông báo: - Đêm hôm qua, cầu gãy -...
  • 72
  • 1,759
  • 15
xây dựng hệ thống phân loại văn bản tiếng việt sử dụng phương pháp máy véc-tơ hỗ trợ kết hợp các phương pháp tối ưu kích thước dữ liệu

xây dựng hệ thống phân loại văn bản tiếng việt sử dụng phương pháp máy véc-tơ hỗ trợ kết hợp các phương pháp tối ưu kích thước dữ liệu

Công nghệ thông tin

... xi * i =1 n b =− ∑ ∑αi* yi K ( xi , xr ) s r|αr* >0 i =1 * • Trong đó: xr support véc-tơ thỏa mãn: α r > s: tổng số support véc-tơ siêu phẳng tối ưu Phân loại với SVM (tiếp) • Các hàm nhân sử ... trước, yêu cầu gán nhãn cho văn vào một (hay một số) lớp văn bản thích hợp dựa vào nội dung văn • Ứng dụng: Hệ thống phân loại văn ứng dụng hệ thống lọc thư rác (mail spam), dịch máy, ... điển): “Thể_thao, Bóng_đá, Đội_tuyển, Đông_Nam_Á, Cúp_AFF, Việt_Nam” Văn D biểu diễn phương pháp tần su t là: D = (0,0,1,1,1,1) Mô hình hóa toán (tiếp) - Biểu diễn toán: n • Input space: X = {x1 ,...
  • 39
  • 986
  • 5
Vài nét về lịch sử nghiên cứu cú pháp tiếng Việt Sau 1945 đến trước 1990 pptx

Vài nét về lịch sử nghiên cứu pháp tiếng Việt Sau 1945 đến trước 1990 pptx

Cao đẳng - Đại học

... hình thành cách nhìn phi truyền thống số thành phần câu dẫn Tuy nhiên, số tác giả có quan điểm dung hoà Chẳng hạn, tác giả “Ngữ pháp tiếng Việt” (1975) Bưstrov, Nguyễn Tài Cẩn Xtankêvich chấp ... trực tiếp bậc với (thường tổ hợp) kí hiệu Kn Theo đó, tác giả xác định E1 từ tình thái, đứng đầu cu i câu E2 trạng ngữ thời gian, cấu tạo ngữ thể từ, có giới từ, phụ thuộc vào kết cấu chứa chúng...
  • 11
  • 551
  • 4
Xây dựng phương pháp kiểm lỗi chính tả tiếng việt sử dụng mô hình từ điển

Xây dựng phương pháp kiểm lỗi chính tả tiếng việt sử dụng mô hình từ điển

Lập trình

... A* để tách từ Ngôn ngữ thống kê dùng để tính xác su t kết hợp chỗi chuỗi nhãn từ loại Xác su t kết hợp thực tích xác su t xuất chuỗi với xác su t xuất chuỗi nhãn ngữ liệu huấn luyện Sau cùng, ... đến xác su t ngram thấp (thường có giá trò 0) Để khắc phục, tác giả CInsunSpell dùng thêm bi-gram với làm mòn cách mở rộng cửa sổ bi-gram từ tiếng thành tiếng phía sau để nâng cao hiệu su t phát ... đánh giá xác su t kết hợp đó, sau tìm cách kết hợp có xác su t lớn làm lời giải cho toán tách từ Theo đánh giá tác giả, phương pháp giúp cải thiện độ xác hệ OCR từ 90% đến 96%, hiệu su t tách từ...
  • 14
  • 2,019
  • 9
phân loại văn bản tiếng việt sử dụng phương pháp máy hỗ trợ vector (support vector machine – svms)

phân loại văn bản tiếng việt sử dụng phương pháp máy hỗ trợ vector (support vector machine – svms)

Ngân hàng - Tín dụng

... liệu Vietnamnet 51 Bảng 4-2: Kết thực nghiệm liệu VnExpress 52 Bảng 4-3: Kết thực nghiệm trích chọn tập đặc trưng báoVietnamnet 55 Bảng 4-4: Kết thực nghiệm phân loại đa lớp liệu báo Vietnamnet ... Trong đó: - P( t k , ci ): xác su t lựa chọn ngẫu nhiên văn x tập văn huấn luyện, x không chứa thuật ngữ tk x  ci, xác su t số lần xảy tập huấn luyện - P(tk,ci): xác su t chọn ngẫu nhiên văn x, ... phương pháp phân loại văn dựa kỹ thuật học máy dựa vào tần su t xuất (số lần xuất hiện) từ cụm từ văn bản, dựa vào tần su t xuất từ văn tần su t văn (số văn tập liệu huấn luyện chứa từ đó) Độ xác...
  • 79
  • 650
  • 1
Nén dữ liệu tiếng việt sử dụng phương pháp mã hóa số học

Nén dữ liệu tiếng việt sử dụng phương pháp mã hóa số học

Công nghệ thông tin

... frmArithmeticCoder { /// /// Required designer variable /// private System.ComponentModel.IContainer components = null; /// /// Clean up any resources being used /// ... nói cách khác dùng ký tự bổ sung để biểu diễn lại chuỗi ký tự quy Để nén LZW mã ASCII bits ta cần mở rộng bảng chữ cách dùng bits hay nhiều 256 ký tự bổ sung mà mã bits cung cấp dùng để lưu trữ ... Form Designer generated code /// /// Required method for Designer support - not modify /// the contents of this method with the code editor /// private void InitializeComponent()...
  • 54
  • 1,166
  • 2
xây dựng cơ sở dữ liệu cho phân tích cú pháp tiếng việt với hệ hình thức văn phạm tag

xây dựng cơ sở dữ liệu cho phân tích pháp tiếng việt với hệ hình thức văn phạm tag

Khoa học tự nhiên

... lục 2): Sub+V V+Sub Sub +V Sub+V+Dob Sub+V+Obj_NP-Ins Sub+V+Obj_NP-Dur Sub+V+Obj_NP-VP-AP Học viên: Khuất Thị Thủy 27 Luận văn tốt nghiệp Sub+V+Obj_VP Sub+V+Obj_PP-Lo Sub+V+Obj_PP-Lo 10 Sub_NP+V+Obj_PP-Lo ... Sub_NP+V+Obj_PP-Lo Sub_PP-Lo+V+ Obj_NP 11 Sub+V+Obj_Clause 12 Sub+V+Dob+Iob Sub+V+Iob+Dob 13 Sub+V+Obj_VP+Dob Sub+V+Dob+Obj_VP 14 Sub+V+Dob+Obj_PP-Lo Sub+V+Obj_PP-Lo+Dob 15 Sub+V+Dob+Obj_PP-Lo 16 Sub+V+Dob+Obj_VP ... dân Sub+V+Dob Vt Sub+V+Obj_NP-Ins Vt Sub+V+Obj_NP-Dur Vs Sub+V+Obj_NP-VP-AP Vs, Vt Sub+V+Obj_VP Vm Sub+V+Obj_PP-Lo Vt Tàu rời ga Khách vào nhà Sub+V+Obj_PP-Lo Vs Ông bà sống quê Họ Hà Nội 10 Sub_NP+V+Obj_PP-Lo...
  • 52
  • 542
  • 0
Nghiên cứu xây dựng thuật toán trích rút tự động các luật văn phạm PCFG LTGA từ các kho ngữ liệu có chú giải cú pháp tiếng việt phục vụ cho bài toán phân tích cú pháp

Nghiên cứu xây dựng thuật toán trích rút tự động các luật văn phạm PCFG LTGA từ các kho ngữ liệu có chú giải pháp tiếng việt phục vụ cho bài toán phân tích pháp

Tiến sĩ

... xếp theo chiều giảm dần tần su t, 1000 từ có tần su t cao bỏ qua chúng thường coi từ dừng (stop word) máy tìm kiếm, 5000 từ danh sách tần su t thuộc nhóm từ có tần su t trung bình sử dụng làm ... 93 Bảng 5 .Ghép số nhãn pháp VietTreebank thành 98 Bảng Hai văn phạm G1, G2 trích rút từ VietTreebank 100 Bảng Thống kê Spin từ từ điển so sánh với VietTreebank 105 ... tử, sách giáo khoa v.v., dung lượng kho ngữ liệu giải pháp nói chung hạn chế Tuy có số kho ngữ liệu có dung lượng lớn (hàng trăm triệu từ) kho ngữ liệu COCA, liệu bổ sung vào hàng năm Nhưng...
  • 150
  • 863
  • 0
Tóm tắt văn bản tiếng việt sử dụng phương pháp textrank

Tóm tắt văn bản tiếng việt sử dụng phương pháp textrank

Công nghệ thông tin

... phân loại tóm tắt dựa sở: - Định dạng văn bản, nội dung đầu vào - Định dạng, nội dung đầu - Mục đích tóm tắt Chi tiết phân loại dựa định dạng, nội dung đâu vào sau:  Kiểu văn (bài báo, tin, thư, ... thông tin nội dung thông tin ◦ Tóm tắt sở truy vấn (Query-based) hay tóm tắt chung Tóm tắt chung có mục đích tìm đoạn tóm tắt cho toàn văn mà nội dung đoạn văn bao quát toàn nội dung văn Tóm tắt ... đến đỉnh đồ thị Đối với trang web d xác su t người dùng nhấn vào liên kết xác su t để người dùng vào trang web hoàn toàn – d Theo Pagerank d = 0.85 Đây xác su t đươc sử dụng TextRank Ban đầu gán...
  • 64
  • 1,222
  • 12
KQLS Tiếng Việt; sử dụng TV có tính chất nghệ thuật

KQLS Tiếng Việt; sử dụng TV có tính chất nghệ thuật

Ngữ văn

... học tập công tác Nội dung: - Nguồn gốc, quan hệ họ hàng tiếng Việt - Vài nét trình phát triển tiếng Việt Tổ chức: Biên chế theo lớp học Nội dung, thời gian, phương pháp TT Nội dung Thời gian Phương ... tiết (Lí thuyết) 4.Nội dung - Hiệu tác động văn - Yêu cầu tính xác - Yêu cầu tính nghệ thuật 5.Tổ chức Biên chế theo lớp học 5.Nội dung, thời gian, phương pháp T/T Nội dung Thời gian 05 ph Phần ... triệt xét HL 02 Phần nội dung 75 phút Kết hợp phân tích, nêu vấn Nguồn gốc, quan 25phút đề, phát vấn, gợi mở hệ họ hàng tiếng Việt tổng hợp khái quát nội Vài nét 45phút dung trình phát triển tiếng...
  • 17
  • 459
  • 0
PHÂN ĐOẠN TỪ TIẾNG VIỆT SỬ DỤNG MÔ HÌNH CRFs

PHÂN ĐOẠN TỪ TIẾNG VIỆT SỬ DỤNG MÔ HÌNH CRFs

Lập trình

... từ tiếng Việt o Mỗi cung D Từ phần tử H tới môt phần tử H Từ phần tử ε (xâu rỗng) đến phần tử P o Mỗi từ D biểu diễn chuỗi cung bắt đầu cung tương ứng với phần tử H, kết thúc cung có trọng số tương ... sinh sử dụng xác su t đồng thời để mô hình hóa toán có tính điều kiện không thích hợp [15] Với toán hợp lý ta dùng mô hình điều kiện để tính trực tiếp xác su t điều kiện thay xác su t đồng thời ... hình xác su t điều kiện McCallum đưa năm 2000 đáp án cho vấn đề mô hình Markov truyền thống Mô hình MEMMs định nghĩa hàm xác su t trạng thái, với đầu vào thuộc tính quan sát, đầu xác su t chuyển...
  • 52
  • 678
  • 1
Nhận dạng tiếng nói tiếng việt sử dụng mạng nơ ron nhân tạo và mô hình markov ẩn

Nhận dạng tiếng nói tiếng việt sử dụng mạng nơ ron nhân tạo và mô hình markov ẩn

Kỹ thuật

... Trong CDHMM, phân b xác su t không gian vector âm h c ñư c mô hình hóa tr c ti p s d ng hàm m t ñ xác su t liên t c (PDF) ch ng h n hàm tr n c a hàm Gaussian - SCHMM: Mô hình cung c p chi ti t d ... i dung v nh n d ng ti ng nói ti ng Vi t chương trình bày xu hư ng phát tri n lĩnh v c x lý ngôn ng , nghiên c u hư ng ti p c n nh n d ng, tiêu chí ñánh giá nh hư ng ñ n hi u su t nh n d ng, cu ... 1.2.2 Các hư ng ti p c n 1.2.2.1 Ti p c n d a vào âm h c ng âm h c - 12 minh c a ñ hình dung, phân tích cu i t o m t quy t ñ nh nh ng ñ c tính âm h c ño ñư c Hư ng ti p c n âm h c ng âm h c d...
  • 13
  • 931
  • 3
phân tích cú pháp tiếng việt theo tiếp cận thống kê

phân tích pháp tiếng việt theo tiếp cận thống kê

Hệ thống thông tin

... cải tiến cách thêm vào xác su t phụ thuộc subcategorization frame trái phải: - Lựa chọn head H với xác su t - Lựa chọn subcat frames trái phải, LC RC với xác su t Mỗi subcat frame tập (tập chứa ... đưa vào subcategoration frame Trong ngôn ngữ có nhiêu luật quy định thành phần đưa vào subcategorization frame, ví dụ trường hợp nhỏ Dựa vào subcategorization frame ta đưa mô hình xác su t cho ... Sinh nhãn head với xác su t Tính toán xác su t vế trái head có xác su t , Ln+1 (ln+1) = STOP Ký tự STOP thêm vào bảng ký tự không kết thúc, mô hình dừng việc sinh tiếp xác su t vế trái gặp ký tự...
  • 78
  • 770
  • 3
Luận văn:Nhận dạng tiếng nói tiếng Việt sử dụng mạng nơ-ron nhân tạo và mô hình markov ẩn potx

Luận văn:Nhận dạng tiếng nói tiếng Việt sử dụng mạng nơ-ron nhân tạo và mô hình markov ẩn potx

Thạc sĩ - Cao học

... Trong CDHMM, phân b xác su t không gian vector âm h c ñư c mô hình hóa tr c ti p s d ng hàm m t ñ xác su t liên t c (PDF) ch ng h n hàm tr n c a hàm Gaussian - SCHMM: Mô hình cung c p chi ti t d ... i dung v nh n d ng ti ng nói ti ng Vi t chương trình bày xu hư ng phát tri n lĩnh v c x lý ngôn ng , nghiên c u hư ng ti p c n nh n d ng, tiêu chí ñánh giá nh hư ng ñ n hi u su t nh n d ng, cu ... 1.2.2 Các hư ng ti p c n 1.2.2.1 Ti p c n d a vào âm h c ng âm h c - 12 minh c a ñ hình dung, phân tích cu i t o m t quy t ñ nh nh ng ñ c tính âm h c ño ñư c Hư ng ti p c n âm h c ng âm h c d...
  • 13
  • 1,103
  • 4
LUẬN VĂN: PHÂN TÍCH CÚ PHÁP TIẾNG VIỆT THEO TIẾP CẬN THỐNG KÊ docx

LUẬN VĂN: PHÂN TÍCH PHÁP TIẾNG VIỆT THEO TIẾP CẬN THỐNG KÊ docx

Công nghệ thông tin

... cải tiến cách thêm vào xác su t phụ thuộc subcategorization frame trái phải: - Lựa chọn head H với xác su t - Lựa chọn subcat frames trái phải, LC RC với xác su t Mỗi subcat frame tập (tập chứa ... đưa vào subcategoration frame Trong ngôn ngữ có nhiêu luật quy định thành phần đưa vào subcategorization frame, ví dụ trường hợp nhỏ Dựa vào subcategorization frame ta đưa mô hình xác su t cho ... Sinh nhãn head với xác su t Tính toán xác su t vế trái head có xác su t , Ln+1 (ln+1) = STOP Ký tự STOP thêm vào bảng ký tự không kết thúc, mô hình dừng việc sinh tiếp xác su t vế trái gặp ký tự...
  • 78
  • 568
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Nhận dạng từ có thanh điệu khác nhau trong tiếng Việt sử dụng mô hình Markov ẩn" pot

Báo cáo khoa học

... Âm đầu Âm đệm Vần Âm Âm cu i Âm đầu luôn phụ âm thiếu số âm tiết Vần đợc phân thành âm đệm, âm âm cu i Âm đệm âm cu i thiếu số âm tiết Âm nguyên âm đơn nguyên âm đôi Âm cu i phụ âm bán nguyên ... recognition of Vietnamese speech words with differrent tones and some results of recognition experiments with Vietnamese speech databases of words The recognition task is limited to Vietnamese words, ... Amsterdam, www.praat.org SUMMARY recognition of Vietnamese speech words with different tones by using Hidden Markov Model Based on the study of the hidden Markov model (HMM) and Vietnamese phonetics,...
  • 9
  • 609
  • 0
Nhận dạng chữ viết tay tiếng Việt sử dụng mạng nơron

Nhận dạng chữ viết tay tiếng Việt sử dụng mạng nơron

Công nghệ thông tin

... dẫn su t thời gian nghiên cứu thực luận văn Tôi xin chân thành cảm ơn Thầy giáo Viện Công nghệ Thông tin Thầy giáo Trƣờng Công nghệ thông tin Truyền thông - ĐH Thái Nguyên giảng dạy, giúp đỡ su t ... thông - ĐH Thái Nguyên tạo điều kiện tốt cho su t hai năm học qua Xin cảm ơn bạn bè, đồng nghiệp tạo diều kiện nhƣ bảo nhiều thời gian thực luận văn Cu i cùng, xin chân thành cảm ơn gia đình động ... Kohonen cấu trúc đơn giản mà hiệu cao Mạng nơron Kohonen đƣơc sƣ dung rât n hiêu ƣng d ụng, thông thƣơng ̣ ̉ ̣ ́ ̀ ́ ̀ viêc gom cum va /hoăc mô hì nh hoa dƣ liêu đa chiêu cac lƣơi co hai ̣ ̣...
  • 86
  • 705
  • 0

Xem thêm