0

tình hình sử dụng và phát triển

Nghiên cứu dịch máy thống kê & Thử nghiệm xây dựng hệ dịch máy thống kê Anh-Việt

Nghiên cứu dịch máy thống kê & Thử nghiệm xây dựng hệ dịch máy thống kê Anh-Việt

Anh ngữ phổ thông

... kê nhanh  24 Sử dụng cấu hình Interpolation: qua thử nghiệm với ngữ liệu có cho kết tốt Backoff Gióng hàng từ  Dùng GIZA++:  Phổ biến  Mô hình gióng hàng: IBM Model 1-5 mô hình HMM (thay ... 23 Xây dựnghình ngôn ngữ  Các công cụ xây dựng:  SRILM, IRSTLM, RandLM  Lựa chọn SRILM:  Mô hình n-gram  Cấu hình làm mịn hỗ trợ: Interpolation Backoff  Ưu điểm:  Cấu hình đơn giản ... câu tiếng Anh đầu vào e, tìm câu tiếng Việt v* cho xác suất điều kiện P(v|e) lớn  Công thức Bayes: v* = argmaxvP(e|v)P(v)  P(e|v): Mô hình dịch  P(v) : Mô hình ngôn ngữ Mô hình dịch máy thống...
  • 32
  • 1,073
  • 3
XỬ LÝ NHẬP NHẰNG NGỮ NGHĨA TRONG DỊCH MÁY THỐNG KÊ DỰA VÀO CỤM TỪ

XỬ LÝ NHẬP NHẰNG NGỮ NGHĨA TRONG DỊCH MÁY THỐNG KÊ DỰA VÀO CỤM TỪ

Kỹ thuật - Công nghệ

... luyện WSD, mô hình sử dụng tập ngữ liệu huấn luyện để đưa mô hình cho cụm từ tương ứng Mỗi từ, cụm từ có mô hình riêng 4.6.2 Các thuộc tính WSD Chúng sử dụng thuộc tính thường hay sử dụng nghiên ... WSD sử dụng MEM khoảng 70%, điểm BLEU hệ dịch máy tích hợp WSD tăng lên từ 36.57 (không sử dụng WSD) lên 37.45 (sử dụng tất thuộc tính WSD) Ngoài ra, thực nghiệm cho thấy thuộc tính WSD sử dụng ... tiếp mô hình dịch sử dụnghình log-linear đề xuất Och Ney [4] Mô hình log-linear mô hình công thức tổng quát sau: h (x) i i Với trọng số λ hàm đặc trưng h(x) Trong mô hình log-linear áp dụng...
  • 60
  • 1,142
  • 1
Tối ưu bảng cụm từ cho dịch máy thống kê dựa vào cụm

Tối ưu bảng cụm từ cho dịch máy thống kê dựa vào cụm

Thạc sĩ - Cao học

... luận văn đƣợc đồng ý sử dụng thông tin để xây dựng luận văn không sử dụng tùy ý nội dung luận văn vào mục đích khác; Bên cạnh nội dung luận văn hoàn toàn thực dƣới hƣớng dẫn tận tình TS Nguyễn Văn ... đầu vào Error! Bookmark not defined DANH MỤC CÁC HÌNH VẼ Hình 1.1: Lịch sử dịch máy Error! Bookmark not defined Hình 1.2 Sơ đồ tổng quát hệ dịch máy Error! Bookmark not defined Hình ... THIỆU Trong bối cảnh phát triển giới ngày nay, nhu cầu trao đổi thông tin ngày nhiều, số lƣợng ngôn ngữ sử dụng lớn Tuy nhiên, vấn đề khó khăn gặp phải số lƣợng ngôn ngữ sử dụng lớn cần phải có...
  • 11
  • 417
  • 0
Dịch máy Anh - Việt dựa trên phương pháp thống kê tích hợp với thông tin ngôn ngữ

Dịch máy Anh - Việt dựa trên phương pháp thống kê tích hợp với thông tin ngôn ngữ

Công nghệ thông tin

... ⎩ ⎭ (3.4) hình dịch thống kê mô hình hóa hình 3.1 Hình 3.1: Kiến trúc SMT sử dụnghình log-linear Trong mô hình log-linear áp dụng cho dịch máy thống kê, mô hình ngôn ngữ mô hình dịch ... Europarl corpus [24], Koehn phát triển - Bộ tách từ: sử dụng công cụ JvnSegmenter [39] cung cấp dạng mã nguồn mở nhóm Phan Xuân Hiếu, Nguyễn Cẩm Tú phát triển sử dụng kĩ thuật Conditional Random ... Europarl corpus, Koehn phát triển - Bộ gán nhãn từ loại (POS tagger): sử dụng công cụ CRFTagger [14] cung cấp dạng mã nguồn mở nhóm Phan Xuân Hiếu, Nguyễn Cẩm Tú phát triển sử dụng kĩ thuật Conditional...
  • 63
  • 974
  • 5
043_Phân tích thiết kế và xây dựng hệ thống phòng chống virus thông minh dựa trên hành vi hoạt động của Virus

043_Phân tích thiết kế xây dựng hệ thống phòng chống virus thông minh dựa trên hành vi hoạt động của Virus

Điện - Điện tử - Viễn thông

... (tự sao) + Đặt vào hàng đợi khởi động hệ thống + Đăng ký kiểm soát hành động bàn phím Kết thực nghiệm cho thấy việc nắm bắt, kiểm soát theo hành vi thích hợp tối đa mẫu virus chưa phát hiện, đồng ... theo hành vi thích hợp tối đa mẫu virus chưa phát hiện, đồng thời giúp người dùng kiểm soát việc sử dụng thiết bị, giảm bớt nỗi lo ngại lây nhiễm virus isVirus k–n k k–n+1 k+1 b) Xác định virus ... sánh kiểm tra xác thực virus Khi chương trình ứng dụng virus thực hành động nhạy cảm với tần số lớn tần số cho phép Mỗi lần, chương trình ứng dụng thực thi hành động nguy hiểm, tần số trung bình...
  • 2
  • 518
  • 1
ỨNG DỤNG MÔ HÌNH DỊCH MÁY THỐNG KÊ CHO BÀI TOÁN BỎ DẤU CHO VĂN BẢN TIẾNG VIỆT

ỨNG DỤNGHÌNH DỊCH MÁY THỐNG KÊ CHO BÀI TOÁN BỎ DẤU CHO VĂN BẢN TIẾNG VIỆT

Công nghệ thông tin

... nội dung Chính phát triển công cụ giúp thêm dấu tiếng Việt vào văn không dấu việc cần thiết thú vị : VietPad chƣơng trình text editor Việt Unicode phát triển Quân Nguyễn nhóm phát triển http://vietpad.sourceforge.net ... dịch máy dựa vào thống kê có tính khả chuyển cao, có khả áp dụng đƣợc cho cặp ngôn ngữ Hệ thống SMT đƣợc đề xuất lần Brown năm 1990 sử dụnghình kênh nhiễu (noisy channel model) phát triển áp ... Windows, Linux/Unix, Mac OS X, hay Solaris VietPad đƣợc phát triển Quân Nguyễn nhóm phát triển http://vietpad.sourceforge.net Ngƣời sử dụng đánh chữ Việt tƣơng thích với tiêu chuẩn Unicode dùng...
  • 44
  • 820
  • 5
ỨNG DỤNG của mô HÌNH NGÔN NGỮ TRONG DỊCH máy THỐNG kê

ỨNG DỤNG của mô HÌNH NGÔN NGỮ TRONG DỊCH máy THỐNG kê

Lập trình

... chương trình sử dụng -lm file: đọc mô hình ngôn ngữ từ tệp file Tham số tham số bắt buộc, trừ tham số -null chọn -null: không sử dụnghình ngôn ngữ đọc từ tệp, mà sử dụnghình ngôn ngữ ... SMT Sau xây dựnghình Ngram với phương pháp làm mịn khác nhau, sử dụnghình Ngram vào mô hình dịch máy thống kê dịch từ tiếng Anh sang tiếng Việt Bằng cách sử dụnghình dịch máy thống ... dựa vào cụm sử dụnghình kênh nhiễu, áp dụng công thức Bayes ta có: Do P(f) không đổi e, vấn đề trở thành việc tìm câu e nhằm tối đa hóa P(f\e)P(e) Việc xây dựnghình ngôn ngữ cần sử dụng...
  • 46
  • 1,187
  • 2
Nghiên cứu giải mã trong kỹ thuật dịch máy thống kê

Nghiên cứu giải mã trong kỹ thuật dịch máy thống kê

Kỹ thuật

... động từ phụ thuộc vào chủ từ tân từ - Tận dụnghình ngôn ngữ cú pháp (syntactic language models) Câu dịch tốt câu dịch có cú pháp “đúng” dựa vào mô hình ngôn ngữ cú pháp, mô hình cho phép kiểm ... or the man (a) Hình 2.6 Sơ đồ cú pháp a is small - 11 - ? S VP NP the VP house is the man is small (b) Hình 2.7 Sơ đồ cú pháp b Bằng cách sử dụnghình ngôn ngữ cú pháp, cú pháp hình (a) chọn ... nhanh chóng hết Cùng với phát triển lĩnh vực trí tuệ nhân tạo, dịch máy trải qua giai đoạn thăng trầm Có lúc rơi vào hoàn cảnh bế tắc, tưởng chừng phải dừng bước hướng phát triển Tuy nhiên, việc...
  • 26
  • 280
  • 0
LUẬN VĂN: Ứng dụng mô hình dịch máy thống kê cho bài toán bỏ dấu cho văn bản Tiếng Việt ppt

LUẬN VĂN: Ứng dụnghình dịch máy thống kê cho bài toán bỏ dấu cho văn bản Tiếng Việt ppt

Công nghệ thông tin

... nội dung Chính phát triển công cụ giúp thêm dấu tiếng Việt vào văn không dấu việc cần thiết thú vị : VietPad chƣơng trình text editor Việt Unicode phát triển Quân Nguyễn nhóm phát triển http://vietpad.sourceforge.net ... dịch máy dựa vào thống kê có tính khả chuyển cao, có khả áp dụng đƣợc cho cặp ngôn ngữ Hệ thống SMT đƣợc đề xuất lần Brown năm 1990 sử dụnghình kênh nhiễu (noisy channel model) phát triển áp ... Windows, Linux/Unix, Mac OS X, hay Solaris VietPad đƣợc phát triển Quân Nguyễn nhóm phát triển http://vietpad.sourceforge.net Ngƣời sử dụng đánh chữ Việt tƣơng thích với tiêu chuẩn Unicode dùng...
  • 45
  • 599
  • 1
Luận văn:NGHIÊN CỨU GIẢI MÃ TRONG KỸ THUẬT DỊCH MÁY THỐNG KÊ pptx

Luận văn:NGHIÊN CỨU GIẢI MÃ TRONG KỸ THUẬT DỊCH MÁY THỐNG KÊ pptx

Thạc sĩ - Cao học

... động từ phụ thuộc vào chủ từ tân từ - Tận dụnghình ngôn ngữ cú pháp (syntactic language models) Câu dịch tốt câu dịch có cú pháp “đúng” dựa vào mô hình ngôn ngữ cú pháp, mô hình cho phép kiểm ... or the man (a) Hình 2.6 Sơ đồ cú pháp a is small - 11 - ? S VP NP the VP house is the man is small (b) Hình 2.7 Sơ đồ cú pháp b Bằng cách sử dụnghình ngôn ngữ cú pháp, cú pháp hình (a) chọn ... nhanh chóng hết Cùng với phát triển lĩnh vực trí tuệ nhân tạo, dịch máy trải qua giai đoạn thăng trầm Có lúc rơi vào hoàn cảnh bế tắc, tưởng chừng phải dừng bước hướng phát triển Tuy nhiên, việc...
  • 26
  • 379
  • 1
ĐỀ TÀI: TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH-VIỆT pptx

ĐỀ TÀI: TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH-VIỆT pptx

Thạc sĩ - Cao học

... 20 Hình 2.5 Mô hình dịch factored SMT 27 Hình 4.1 Mô hình chung luận văn 43 Hình 4.2 Mô hình ngôn ngữ từ vựng 49 Hình 4.3 Mô hình ngôn ngữ từ loại 49 Hình ... điểm mà mô hình dịch máy thống kê có tiềm lớn ứng dụng dịch máy Rất nhiều nhóm nghiên cứu tập trung khai thác phát triển hệ dịch máy mô hình Do đó, hƣớng đến phát triển hệ dịch sử dụng đồng thời ... từ 3.2.3 Tích hợp vào mô hình ngôn ngữ Nhóm nghiên cứu [9] đƣa phƣơng pháp sử dụng thông tin cú pháp cho dịch máy thống kê Họ sử dụnghình phân tích cú pháp thống kê nhƣ mô hình ngôn ngữ SMT...
  • 92
  • 379
  • 0
CẢI TIẾN CHẤT LƯỢNG DỊCH máy THỐNG kê VIỆT – ANH BẰNG mô HÌNH PHÁT SINH từ CHỨC NĂNG

CẢI TIẾN CHẤT LƯỢNG DỊCH máy THỐNG kê VIỆT – ANH BẰNG mô HÌNH PHÁT SINH từ CHỨC NĂNG

Kỹ thuật lập trình

... dịch Post-generation (phát sinh từ chức kết dịch): mô hình SMT phát sinh từ chức kết dịch Hệ thống TFWIM: mô hình phát sinh từ chức đượctích hợp lúc giải mã Trong báo này, sử dụng ngữ liệu song ... giảthiếti|PPgo|VBschool|NN | Mô hình TFWIM tìm vị trí chèn Hình 2: Hình Quá trình tìm vị trí chèn phát sinh giả thiết giải mã sau áp dụng công thức (3) Kết sau tìm từ thích hợp để chèn là: Hình Kết giải mã ... 24 23.5 Mô hình Hình So sánh điểm BLEU mô hình dịch Sau vài so sánh giữakết dịch mô hình sở mô hình TFWIM Trường hợp 1: kết dịch mô hình đề tài tốt mô hình sở họcó_thểtựnhìnthấy Câu tiếng gấu...
  • 9
  • 315
  • 2
THAY đổi TRỌNG số mô HÌNH GIẢI mã TRONG DỊCH máy THỐNG kê

THAY đổi TRỌNG số mô HÌNH GIẢI mã TRONG DỊCH máy THỐNG kê

Kỹ thuật lập trình

... gióng hàng chéo để phân lớp cho câu đầu vào, thứ hai dịch câu đầu vào với tất trọng số sử dụnghình xếp hạng để chọn câu đầu tốt Phân lớp cho câu đầu vào theo đặc trƣng Phân lớp dựa TF-IDF ... công trình Lü cộng (2007) Liu cộng (2012) sử dụng tf-idf để đo tương tự câu đầu vào với phân nhóm Sau phân nhóm cho câu đầu vào dựa vào độ đo này, câu phân vào nhóm dịch trọng số nhóm Phân lớp dựa ... THỰC NGHIỆM ĐÁNH GIÁ Chương mô tả chi tiết thí nghiệm thực để đánh giá hiệu hướng tiếp cận chúng tôi, đồng thời so sánh hiệu dịch mô hình với mô hình Och (2003) Ngữ liệu Ngữ liệu sử dụng để huấn...
  • 10
  • 320
  • 4
tích hợp thông tin hình thái từ vào hệ dịch máy thống kê anh việt

tích hợp thông tin hình thái từ vào hệ dịch máy thống kê anh việt

Công nghệ thông tin

... điểm mà mô hình dịch máy thống kê có tiềm lớn ứng dụng dịch máy Rất nhiều nhóm nghiên cứu tập trung khai thác phát triển hệ dịch máy mô hình Do đó, hướng đến phát triển hệ dịch sử dụng đồng thời ... xuất mô hình dịch factored (đại diện) tích hợp trực tiếp tri thức ngôn ngữ vào mô hình dịch Mô hình phát triển dựa cách tiếp cận dịch máy dựa ngữ Cải tiến mô hình thông tin tri thức tích hợp vào ... từ 3.2.3 Tích hợp vào mô hình ngôn ngữ Nhóm nghiên cứu [9] đưa phương pháp sử dụng thông tin cú pháp cho dịch máy thống kê Họ sử dụnghình phân tích cú pháp thống kê mô hình ngôn ngữ SMT Kết...
  • 96
  • 654
  • 0
Tối ưu bảng cụm từ để cái tiến dịch máy thống kê

Tối ưu bảng cụm từ để cái tiến dịch máy thống kê

Công nghệ thông tin

... trình tự phương pháp dựa sở từ, mà sử dụng khuôn dạng ghi tuyến tính Các thành phần mô hình ngôn ngữ, mô hình dịch cụm từ, mô hình dịch từ vựng mô hình đảo cụm sử dụng cách thích hợp Khuôn dạng cho ... cách rõ ràng đại diện sử dụng rộng rãi nhiều mô hình dịch PB-SMT 14 Phương pháp sử dụng việc thực tối ưu bảng cụm từ (JunczysDowmunt, 2012a, b) cho Moses (Koehn 2007) [4] sử dụng để thay cho bảng ... quát mô hình dịch thống kê thể hình 1.1 Câu nguồn Tiền xử lý Bộ giải mã (tìm kiếm): V1J  arg max p(v1J | e1I ) Mô hình ngôn ngữ Mô hình gióng hàng Mô hình từ vựng Hậu xử lý … Câu đích Hình 1.1:...
  • 59
  • 268
  • 1
TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH  VIỆT

TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH VIỆT

Kinh tế

... hợp tri thức vào hệ thống dịch máy 39 3.2.1 Tích hợp thông tin hình thái vào mô hình dịch 39 3.2.2 Tích hợp thông tin cú pháp vào mô hình dịch 40 3.2.3 Tích hợp vào mô hình ngôn ngữ ... dịch khảo sát khác biệt cặp ngôn ngữ, đặc biệt cặp khác nhiều trở ngại đem mô hình áp dụng cho cặp ngôn ngữ khác trật tự từ 3.1.2 Sử dụng thông tin từ loại 3.1.3 Sử dụng luật biến đổi hình ... 63 Hình 2.5 Mô hình dịch factored SMT 27 Bảng 5.4 Kết dịch hệ tích hợp thông tin hình thái từ vào câu tiếng Việt Hình 4.1 Mô hình chung luận văn 43 64 Hình...
  • 46
  • 344
  • 0
XÂY DỰNG HỆ THỐNG CUNG CẤP DỊCH VỤ QUA SMS DỰA TRÊN VỊ TRÍ THUÊ BAO DI ĐỘNG

XÂY DỰNG HỆ THỐNG CUNG CẤP DỊCH VỤ QUA SMS DỰA TRÊN VỊ TRÍ THUÊ BAO DI ĐỘNG

Điện - Điện tử - Viễn thông

... xây dựng đưa vào sử dụng Châu Âu tiêu chuẩn, đặc tính GSM công bố lần vào năm 1990 Vào cuối năm 1993 có triệu thuê bao sử dụng mạng GSM 70 nhà cung cấp dịch vụ 48 quốc gia Đến GSM sử dụng tỷ người ... (Personal Identity Number) để bảo vệ quyền sử dụng người sử dụng hợp pháp SIM cho 15 phép người sử dụng sử dụng nhiều dịch vụ cho phép người dùng truy nhập vào PLMN (Public Land Mobile Network) khác ... GPS, nhanh GPS Sử dụng dịch vụ Muốn sử dụng My Location điện thoại di động, cần download điện thoại, cài đặt sử dụng cách dễ dàng Đặc điểm Đây công nghệ sử dụng thông tin từ trạm phát sóng BTS...
  • 68
  • 576
  • 1
Xây dựng hệ thống cung cấp dịch vụ qua SMS dựa trên vị trí thuê bao di động

Xây dựng hệ thống cung cấp dịch vụ qua SMS dựa trên vị trí thuê bao di động

Thương mại điện tử

... (Personal Identity Number) để bảo vệ quyền sử dụng người sử dụng hợp pháp SIM cho phép người sử dụng sử dụng nhiều dịch vụ cho phép người dùng truy nhập vào PLMN (Public Land Mobile Network) khác ... GPS, nhanh GPS Sử dụng dịch vụ Muốn sử dụng My Location điện thoại di động, cần download điện thoại, cài đặt sử dụng cách dễ dàng Đặc điểm: Đây công nghệ sử dụng thông tin từ trạm phát sóng BTS ... Location (beta)" sử dụng Google Maps cho điện thoại di động cho phép xác định tọa độ người sử dụng không cần GPS Khi sử dụng dịch vụ khách hàng biết xác tọa độ người dùng dựa vào trạm phát sóng gần...
  • 69
  • 951
  • 5

Xem thêm