0

cách tiếp cận dựa vào độ dài câu

Xây dựng chương trình dịch tự động Anh - Việt bằng phương pháp thống kê

Xây dựng chương trình dịch tự động Anh - Việt bằng phương pháp thống kê

Công nghệ thông tin

... Download Web site từ Internet Tool hỗ trợ (Teleport Pro, ) Web site đĩa cứng Tự động Lấy text Các file text Tự động Chuyển đổi mã, loại bỏ nhiễu Các file text Corpus thô Hỡnh 2.1: S quỏ trỡnh ... chiu (ngi-mỏy) v cú th cú mi giai on Sau õy l s tng quỏt ca h dch mỏy Con ng-ời Văn Soạn thảo vào kiểm tra tả Dịch máy Hiệu đính Văn Cơ sở trí thức Hỡnh 1.1: S tng quỏt ca h dch mỏy Nguyn Vn...
  • 92
  • 530
  • 6
ỨNG DỤNG của mô HÌNH NGÔN NGỮ TRONG DỊCH máy THỐNG kê

ỨNG DỤNG của mô HÌNH NGÔN NGỮ TRONG DỊCH máy THỐNG kê

Lập trình

... xác định độ dài thích hợp câu dịch, đưa thêm vào thừa số ω sinh câu ngôn ngữ đích Thừa số tối ưu qua trình tìm kiếm câu dịch tối ưu Thừa số lớn độ dài câu ngôn ngữ đích dài Nói tóm lại, câu dịch ... có hướng tiếp cận chính: Mô hình dịch dựa từ (word-based) Mô hình dịch dựa cụm từ (phrase-based) Mô hình dịch dựa cú pháp (syntax-based) Cả hướng tiếp cận dựa tư tưởng Đó tương ứng hai câu (alignment) ... Anh-Nhật, HoaNhật, … Các cách tiếp cận : ba lớp dịch trực tiếp (direct), dịch dựa luật chuyển đổi (transfer), dịch liên ngữ (interlingua) dịch dựa vào thống Phương pháp dịch dựa luật chuyển đổi dịch...
  • 46
  • 1,187
  • 2
XỬ LÝ NHẬP NHẰNG NGỮ NGHĨA TRONG DỊCH MÁY THỐNG KÊ DỰA VÀO CỤM TỪ

XỬ LÝ NHẬP NHẰNG NGỮ NGHĨA TRONG DỊCH MÁY THỐNG KÊ DỰA VÀO CỤM TỪ

Kỹ thuật - Công nghệ

... với liệu đưa vào Một câu vào có nhiều cách tách để đưa câu thành cụm từ có độ dài khác Các tính toán điểm số dựa cách dịch, trật tự từ, mô hình ngôn ngữ xác định cách phân tách câu 3.2.2 Xác ... cho câu đầu ứng với câu đầu vào không ngắn dài Tùy thuộc vào liệu học mà ta ưu tiên cách dịch ngắn (ω < 1) hay cách dịch dài (ω > 1) Tương tự, hàm phạt cụm từ nhằm xác định cách dịch cụm từ dài ... máy thống kê dựa đơn vị từ, dựa đơn vị cụm từ dựa cú pháp Trong đó, dịch máy thống kê dựa đơn vị cụm từ phương pháp tiếp cận đưa kết tốt thu hút nhiều quan tâm Tuy nhiên, cách tiếp cận thống kê...
  • 60
  • 1,142
  • 1
THAY đổi TRỌNG số mô HÌNH GIẢI mã TRONG DỊCH máy THỐNG kê

THAY đổi TRỌNG số mô HÌNH GIẢI mã TRONG DỊCH máy THỐNG kê

Kỹ thuật lập trình

... có độ đồng cao Một cách tiếp cận khác cách tiếp cận sử dụng đặc trưng ngôn ngữ để phân chia tập dev thành tập có độ đồng cao dựa trực tiếp điểm BLEU Điểm BLEU tiêu chuẩn vàng để đánh giá độ đồng ... câu xuất ngữ liệu lớn.Ngược lại cross-entropy lớn xác suất xuất nhỏ Chiều dài câu nguồn Chiều dài câu ảnh hưởng đến trọng số, câu dài cấu trúc ngữ nghĩa phức tạp câu ngắn.Trong thực tế, câu dài ... (2012) sử dụng tf-idf để đo tương tự câu đầu vào với phân nhóm Sau phân nhóm cho câu đầu vào dựa vào độ đo này, câu phân vào nhóm dịch trọng số nhóm Phân lớp dựa đặc trưng ngôn ngữ Một gom nhóm...
  • 10
  • 320
  • 4
Tổ chức bộ máy - chức năng - nhiệm vụ của tổng cục thống kê vụ dân số và lao động

Tổ chức bộ máy - chức năng - nhiệm vụ của tổng cục thống kê vụ dân số và lao động

Báo cáo khoa học

... lần ban hành chế độ báo cáo đầy đủ dân số lao động xã hội, bao gồm nguồn lao động lực lợng lao động xã hội Chế độ báo cáo định kỳ lao động lần quán triệt nguyên tắc thống kê lao động xã hội theo ... số - Lao động có hội tiếp cận quốc tế thống kê phân tích số liệu lao động xã hội Tiến hành hoạt động Tiểu dự án VIE/01/P12 - TK: Tiểu dự án đợc ký kết từ tháng 12 năm 2002 tiếp tục kéo dài năm ... lienhe@docs.vn Tel (: 0918.775.368 động không chủ động đợc việc đề tiêu điều tra (đầu vào) xử lý kết (điều tra) điều tra lao động việc làm (do Bộ Lao động - TBXH chủ trì), cha chủ động khâu tổ chức giám...
  • 18
  • 1,198
  • 0
Nghiên cứu giải mã trong kỹ thuật dịch máy thống kê

Nghiên cứu giải mã trong kỹ thuật dịch máy thống kê

Kỹ thuật

... Dịch máy dựa ví dụ Cách tiếp cận theo dịch máy dựa ví dụ đơn giản, không đòi hỏi phải có phân tích ngôn ngữ học, cú pháp, ngữ nghĩa câu dịch dựa vào việc “so khớp” mẫu Việc “so khớp” mẫu dựa hoàn ... thống kê dựa cú pháp (Syntax-based SMT) Trong hướng tiếp cận trên, việc lựa chọn câu dịch đa số dựa vào số thống kê mà sử dụng tri thức ngôn ngữ Dịch máy thống kê dựa cú pháp hướng tiếp cận cố ... mà SMT có hướng tiếp cận chính: dựa từ (word-based), dựa đoạn câu (phrase-based) dựa cú pháp (syntax-based) 2.1.1 Dịch máy thống kê dựa từ (Word-based SMT) Dịch máy thống kê dựa từ, mô hình dịch...
  • 26
  • 280
  • 0
Luận văn:NGHIÊN CỨU GIẢI MÃ TRONG KỸ THUẬT DỊCH MÁY THỐNG KÊ pptx

Luận văn:NGHIÊN CỨU GIẢI MÃ TRONG KỸ THUẬT DỊCH MÁY THỐNG KÊ pptx

Thạc sĩ - Cao học

... Dịch máy dựa ví dụ Cách tiếp cận theo dịch máy dựa ví dụ đơn giản, không đòi hỏi phải có phân tích ngôn ngữ học, cú pháp, ngữ nghĩa câu dịch dựa vào việc “so khớp” mẫu Việc “so khớp” mẫu dựa hoàn ... thống kê dựa cú pháp (Syntax-based SMT) Trong hướng tiếp cận trên, việc lựa chọn câu dịch đa số dựa vào số thống kê mà sử dụng tri thức ngôn ngữ Dịch máy thống kê dựa cú pháp hướng tiếp cận cố ... mà SMT có hướng tiếp cận chính: dựa từ (word-based), dựa đoạn câu (phrase-based) dựa cú pháp (syntax-based) 2.1.1 Dịch máy thống kê dựa từ (Word-based SMT) Dịch máy thống kê dựa từ, mô hình dịch...
  • 26
  • 379
  • 1
ỨNG DỤNG MÔ HÌNH DỊCH MÁY THỐNG KÊ CHO BÀI TOÁN BỎ DẤU CHO VĂN BẢN TIẾNG VIỆT

ỨNG DỤNG MÔ HÌNH DỊCH MÁY THỐNG KÊ CHO BÀI TOÁN BỎ DẤU CHO VĂN BẢN TIẾNG VIỆT

Công nghệ thông tin

... phần: Cho trƣớc câu ngôn ngữ nguồn f, mục tiêu mô hình dịch máy tìm câu e ngôn ngữ đích cho xác suất P(e|f) cao Có nhiều cách tiếp cận để tính đƣợc xác suất P(e|f), nhiên cách tiếp cận trực quan ... cận chính: Mô hình dịch dựa từ (word-based) Mô hình dịch dựa cụm từ (phrase-based) Mô hình dịch dựa cú pháp (syntax-based) Cả hƣớng tiếp cận dựa tƣ tƣởng Đó tƣơng ứng hai câu (alignment) 3.3.1 ... hai câu tiếng Anh tiếng Tây Ban Nha cho thêm từ vô giá trị vào đầu câu tiếng Anh Hình 2.3.1-10 Sự tƣơng ứng câu tiếng Anh với câu tiếng Tây Ban Nha cho thêm từ vô giá trị (null) vào đầu câu tiếng...
  • 44
  • 820
  • 5
LUẬN VĂN: Ứng dụng mô hình dịch máy thống kê cho bài toán bỏ dấu cho văn bản Tiếng Việt ppt

LUẬN VĂN: Ứng dụng mô hình dịch máy thống kê cho bài toán bỏ dấu cho văn bản Tiếng Việt ppt

Công nghệ thông tin

... phần: Cho trƣớc câu ngôn ngữ nguồn f, mục tiêu mô hình dịch máy tìm câu e ngôn ngữ đích cho xác suất P(e|f) cao Có nhiều cách tiếp cận để tính đƣợc xác suất P(e|f), nhiên cách tiếp cận trực quan ... cận chính: Mô hình dịch dựa từ (word-based) Mô hình dịch dựa cụm từ (phrase-based) Mô hình dịch dựa cú pháp (syntax-based) Cả hƣớng tiếp cận dựa tƣ tƣởng Đó tƣơng ứng hai câu (alignment) 3.3.1 ... hai câu tiếng Anh tiếng Tây Ban Nha cho thêm từ vô giá trị vào đầu câu tiếng Anh Hình 2.3.1-10 Sự tƣơng ứng câu tiếng Anh với câu tiếng Tây Ban Nha cho thêm từ vô giá trị (null) vào đầu câu tiếng...
  • 45
  • 599
  • 1
ĐỀ TÀI: TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH-VIỆT pptx

ĐỀ TÀI: TÍCH HỢP THÔNG TIN HÌNH THÁI TỪ VÀO HỆ DỊCH MÁY THỐNG KÊ ANH-VIỆT pptx

Thạc sĩ - Cao học

... tích hợp trực tiếp tri thức ngôn ngữ vào mô hình dịch Mô hình đƣợc phát triển dựa cách tiếp cận dịch máy dựa ngữ Cải tiến mô hình thông tin tri thức đƣợc tích hợp vào hệ thống mức độ từ Một từ ... hình giả sử câu 𝑒 ngôn ngữ nguồn có câu dịch câu 𝑣 ngôn ngữ Trang 11 đích Một câu e dịch sang đƣợc nhiều câu v Trong dịch thống kê, ta chọn câu v có khả câu dịch e nhiều Với cặp câu 𝑣 𝑒 ta gọi ... dịch dựa ngữ để tích hợp vào hệ thống mình, chẳng hạn [34] thành công sử dụng cách dịch dựa ngữ mô hình dịch máy dựa cú pháp (syntax-based) Hầu hết hệ thống dịch máy thống kê sử dụng cách dịch dựa...
  • 92
  • 379
  • 0
Nghiên cứu dịch máy thống kê & Thử nghiệm xây dựng hệ dịch máy thống kê Anh-Việt

Nghiên cứu dịch máy thống kê & Thử nghiệm xây dựng hệ dịch máy thống kê Anh-Việt

Anh ngữ phổ thông

... 4743 cặp câu 100 câu 0.099 Thống kê AnhViệt 159.9 00 cặp câu 100 câu 0.162 100 câu 0.301 Googl e transl ate 100 câu 0.119 Googl e transl ate 29 Nhận xét  Dịch máy thống kê phụ thuộc vào liệu ... máy thống kê: dịch văn từ ngôn ngữ sang ngôn ngữ khác dựa mô hình sinh cách tự động từ ngữ liệu  Bài toán: Cho câu tiếng Anh đầu vào e, tìm câu tiếng Việt v* cho xác suất điều kiện P(v|e) lớn ... Đầu vào: câu tiếng Anh e  Đầu ra: câu tiếng Việt v did not go home - chọn cụm từ tiếng Anh cần dịch did not go home Anh ta - tìm cụm từ tiếng Việt tương ứng - thêm cụm từ tiếng Việt vào cuối câu...
  • 32
  • 1,073
  • 3
CẢI TIẾN CHẤT LƯỢNG DỊCH máy THỐNG kê VIỆT – ANH BẰNG mô HÌNH PHÁT SINH từ CHỨC NĂNG

CẢI TIẾN CHẤT LƯỢNG DỊCH máy THỐNG kê VIỆT – ANH BẰNG mô HÌNH PHÁT SINH từ CHỨC NĂNG

Kỹ thuật lập trình

... đó? Tất vấn đề giải báo nhằm cải tiến chất lượng dịch SMT CÔNG TRÌNH LIÊN QUAN Cách tiếp cận dựa thống kê bước đột phá về phương pháp luâ ̣n cho dich ̣ máy , kế t quả thực tế của ̣ dich ... năng.Thực nghiệm liệu 1000 câu tiếng Anh, mô hình đạt độ xác 87,172% Trong mô hình này, ngữ liệu Tiếng Anh xóa từ chức năng, sau đưa vào mô hình dịch.Bộ giải mã dựa vào thông tin ngữ cảnh lưu ... h) cho thấy mô hình tăng 0,34% so với hệ thống dịch Baseline Tương tự hướng tiếp cận đầu tiên, mô hình hướng tiếp cận cải tiến chất lượng dịch máy thông qua việc xóa chèn từ chức mang lại hiệu...
  • 9
  • 315
  • 2
tích hợp thông tin hình thái từ vào hệ dịch máy thống kê anh việt

tích hợp thông tin hình thái từ vào hệ dịch máy thống kê anh việt

Công nghệ thông tin

... diện) tích hợp trực tiếp tri thức ngôn ngữ vào mô hình dịch Mô hình phát triển dựa cách tiếp cận dịch máy dựa ngữ Cải tiến mô hình thông tin tri thức tích hợp vào hệ thống mức độ từ Một từ mô hình ... 1990 Mô hình giả sử câu ngôn ngữ nguồn có câu dịch câu ngôn ngữ Trang 11 đích Một câu e dịch sang nhiều câu v Trong dịch thống kê, ta chọn câu v có khả câu dịch e nhiều Với cặp câu ta gọi xác suất ... dịch dựa ngữ để tích hợp vào hệ thống mình, chẳng hạn [34] thành công sử dụng cách dịch dựa ngữ mô hình dịch máy dựa cú pháp (syntax-based) Hầu hết hệ thống dịch máy thống kê sử dụng cách dịch dựa...
  • 96
  • 654
  • 0
Tối ưu bảng cụm từ để cái tiến dịch máy thống kê

Tối ưu bảng cụm từ để cái tiến dịch máy thống kê

Công nghệ thông tin

... pháp tiếp cận thống kê tương phản với phương pháp tiếp cận dựa luật dịch máy với dịch máy dựa ví dụ Thay xây dựng từ điển, quy luật chuyển đổi tay, hệ dịch tự động xây dựng từ điển, quy luật dựa ... toán độ xác Đầu tiên tính trung bình hình học độ xác n-gram sửa đổi, pn, sử dụng n-gram đến chiều dài N trọng lượng tích cực WN cách tổng hợp Tiếp theo, gọi c độ dài cụm từ mục tiêu r chiều dài ... θ, có sẵn corpus song ngữ bao gồm S cặp câu {(es,vs) :s = 1, …, S} Với cặp câu (es,vs), biến gióng hàng kí hiệu a Tập tham số θ xác định dựa vào cách tiếp cận hợp lý cực đại corpus huấn luyện song...
  • 59
  • 268
  • 1
C1 Tình hình kinh tế - xã hội, nhiệm vụ trọng tâm và tình hình thực hiện. C2 Hệ thống an sinh xã hội hiện nay bao gồm rất nhiều các thành tố và nhiều chương trình khác nhau

C1 Tình hình kinh tế - xã hội, nhiệm vụ trọng tâm và tình hình thực hiện. C2 Hệ thống an sinh xã hội hiện nay bao gồm rất nhiều các thành tố và nhiều chương trình khác nhau

Kinh tế - Thương mại

... phát triển, bảo đảm tính lâu dài, thường xuyên nhằm thực an sinh xã hội bền vững Mặt khác chế hoạt động bảo hiểm tạo cho khả đảm bảo nguồn tài dồi dào, đủ khả thực dài hạn Bởi lẽ nhiều loại hình ... nước Thực tế cho thấy phận người lao động trẻ tuổi lâm vào hoàn cảnh nghèo đói không thuộc diện ƯĐXH nhiều Vì vậy, xóa đói giảm nghèo coi giải pháp có tính lâu dài bền vững cả, giúp người nghèo ... thường có điều kiện sống thiếu thốn, có thu nhập thấp, trình độ học vấn nhìn chung không cao, tiếp xúc với dịch vụ chăm sóc y tế, giáo dục cách đầy đủ Đây diện đối tượng dễ bị tổn thương chiếm tỷ...
  • 9
  • 1,339
  • 0
Triển khai các nhiệm vụ trọng tâm năm 2011 tại sở thông tin và truyền thông

Triển khai các nhiệm vụ trọng tâm năm 2011 tại sở thông tin và truyền thông

Tài liệu khác

... phương, Bưu điện Tỉnh chủ động phát huy tinh thần sáng tạo, đổi cách nghĩ cách làm, xếp máy, tổ chức, nhân sự, mở cách làm, dịch vụ mới, bước cải thiện chất lượng hoạt động theo hướng ngày hiệu ... án quan trọng có tính chất đột phá như: + Dự án ứng dựng CNTT vào lĩnh vực CCHC cửa huyện, thị xã, thành phố + Dự án bảo mật tích hợp mạng diện rộng + Đưa vào hoạt động mạng Hệ thống Hội nghị ... doanh nghiệp CNTT: Hoạt động kinh doanh ngày đa dạng, động hơn, số doanh nghiệp tổ chức bán máy tính trả góp địa bàn Tỉnh tạo điều kiện cho người dân có điều kiện tiếp cận với máy tính phục vụ...
  • 7
  • 282
  • 0
47-2008-CT-BGDDT_Về nhiệm vụ trọng tâm của giáo dục mầm non, giáo dục phổ thông 2009-2010.doc

47-2008-CT-BGDDT_Về nhiệm vụ trọng tâm của giáo dục mầm non, giáo dục phổ thông 2009-2010.doc

Tư liệu khác

... khó khăn cần tăng cường đầu tư kinh phí, huy động tối đa số trẻ độ tuổi học, vận động học sinh bỏ học học trở lại, phụ đạo học sinh yếu, tăng cường đội ngũ giáo viên, mở rộng hình thức tổ chức ... mù chữ (XMC) giáo dục tiếp tục sau biết chữ; tích cực vận động người lớp XMC, phấn đấu đạt tiêu đến năm 2010 tỷ lệ người biết chữ độ tuổi từ 15 trở lên đạt 98%, số người có độ tuổi từ 15 đến 35 ... trước vào lớp 1, tăng cường dạy tiếng Việt cho học sinh dân tộc cấp tiểu học Tiếp tục xây dựng sách giáo dục hòa nhập cho trẻ em có hoàn cảnh khó khăn, đảm bảo công xã hội bình đẳng hội tiếp cận...
  • 15
  • 503
  • 2

Xem thêm