... Download Web site từ Internet Tool hỗ trợ (Teleport Pro, ) Web site đĩa cứng Tự động Lấy text Các file text Tự động Chuyển đổi mã, loại bỏ nhiễu Các file text Corpus thô Hỡnh 2.1: S quỏ trỡnh ... chiu (ngi-mỏy) v cú th cú mi giai on Sau õy l s tng quỏt ca h dch mỏy Con ng-ời Văn Soạn thảo vào kiểm tra tả Dịch máy Hiệu đính Văn Cơ sở trí thức Hỡnh 1.1: S tng quỏt ca h dch mỏy Nguyn Vn...
... xác định độdài thích hợp câu dịch, đưa thêm vào thừa số ω sinh câu ngôn ngữ đích Thừa số tối ưu qua trình tìm kiếm câu dịch tối ưu Thừa số lớn độdàicâu ngôn ngữ đích dài Nói tóm lại, câu dịch ... có hướng tiếpcận chính: Mô hình dịch dựa từ (word-based) Mô hình dịch dựa cụm từ (phrase-based) Mô hình dịch dựa cú pháp (syntax-based) Cả hướng tiếpcậndựa tư tưởng Đó tương ứng hai câu (alignment) ... Anh-Nhật, HoaNhật, … Các cáchtiếpcận : ba lớp dịch trực tiếp (direct), dịch dựa luật chuyển đổi (transfer), dịch liên ngữ (interlingua) dịch dựavào thống Phương pháp dịch dựa luật chuyển đổi dịch...
... với liệu đưavào Một câuvào có nhiều cách tách để đưacâu thành cụm từ có độdài khác Các tính toán điểm số dựacách dịch, trật tự từ, mô hình ngôn ngữ xác định cách phân tách câu 3.2.2 Xác ... cho câu đầu ứng với câu đầu vào không ngắn dài Tùy thuộc vào liệu học mà ta ưu tiên cách dịch ngắn (ω < 1) hay cách dịch dài (ω > 1) Tương tự, hàm phạt cụm từ nhằm xác định cách dịch cụm từ dài ... máy thống kê dựa đơn vị từ, dựa đơn vị cụm từ dựa cú pháp Trong đó, dịch máy thống kê dựa đơn vị cụm từ phương pháp tiếpcậnđưa kết tốt thu hút nhiều quan tâm Tuy nhiên, cáchtiếpcận thống kê...
... có độ đồng cao Một cáchtiếpcận khác cáchtiếpcận sử dụng đặc trưng ngôn ngữ để phân chia tập dev thành tập có độ đồng cao dựa trực tiếp điểm BLEU Điểm BLEU tiêu chuẩn vàng để đánh giá độ đồng ... câu xuất ngữ liệu lớn.Ngược lại cross-entropy lớn xác suất xuất nhỏ Chiều dàicâu nguồn Chiều dàicâu ảnh hưởng đến trọng số, câudàicấu trúc ngữ nghĩa phức tạp câu ngắn.Trong thực tế, câudài ... (2012) sử dụng tf-idf để đo tương tự câu đầu vào với phân nhóm Sau phân nhóm cho câu đầu vàodựavàođộđo này, câu phân vào nhóm dịch trọng số nhóm Phân lớp dựa đặc trưng ngôn ngữ Một gom nhóm...
... lần ban hành chế độ báo cáo đầy đủ dân số lao động xã hội, bao gồm nguồn lao động lực lợng lao động xã hội Chế độ báo cáo định kỳ lao động lần quán triệt nguyên tắc thống kê lao động xã hội theo ... số - Lao động có hội tiếpcận quốc tế thống kê phân tích số liệu lao động xã hội Tiến hành hoạt động Tiểu dự án VIE/01/P12 - TK: Tiểu dự án đợc ký kết từ tháng 12 năm 2002 tiếp tục kéo dài năm ... lienhe@docs.vn Tel (: 0918.775.368 động không chủ động đợc việc đề tiêu điều tra (đầu vào) xử lý kết (điều tra) điều tra lao động việc làm (do Bộ Lao động - TBXH chủ trì), cha chủ động khâu tổ chức giám...
... Dịch máy dựa ví dụ Cáchtiếpcận theo dịch máy dựa ví dụ đơn giản, không đòi hỏi phải có phân tích ngôn ngữ học, cú pháp, ngữ nghĩa câu dịch dựavào việc “so khớp” mẫu Việc “so khớp” mẫu dựa hoàn ... thống kê dựa cú pháp (Syntax-based SMT) Trong hướng tiếpcận trên, việc lựa chọn câu dịch đa số dựavào số thống kê mà sử dụng tri thức ngôn ngữ Dịch máy thống kê dựa cú pháp hướng tiếpcận cố ... mà SMT có hướng tiếpcận chính: dựa từ (word-based), dựa đoạn câu (phrase-based) dựa cú pháp (syntax-based) 2.1.1 Dịch máy thống kê dựa từ (Word-based SMT) Dịch máy thống kê dựa từ, mô hình dịch...
... Dịch máy dựa ví dụ Cáchtiếpcận theo dịch máy dựa ví dụ đơn giản, không đòi hỏi phải có phân tích ngôn ngữ học, cú pháp, ngữ nghĩa câu dịch dựavào việc “so khớp” mẫu Việc “so khớp” mẫu dựa hoàn ... thống kê dựa cú pháp (Syntax-based SMT) Trong hướng tiếpcận trên, việc lựa chọn câu dịch đa số dựavào số thống kê mà sử dụng tri thức ngôn ngữ Dịch máy thống kê dựa cú pháp hướng tiếpcận cố ... mà SMT có hướng tiếpcận chính: dựa từ (word-based), dựa đoạn câu (phrase-based) dựa cú pháp (syntax-based) 2.1.1 Dịch máy thống kê dựa từ (Word-based SMT) Dịch máy thống kê dựa từ, mô hình dịch...
... phần: Cho trƣớc câu ngôn ngữ nguồn f, mục tiêu mô hình dịch máy tìm câu e ngôn ngữ đích cho xác suất P(e|f) cao Có nhiều cáchtiếpcận để tính đƣợc xác suất P(e|f), nhiên cáchtiếpcận trực quan ... cận chính: Mô hình dịch dựa từ (word-based) Mô hình dịch dựa cụm từ (phrase-based) Mô hình dịch dựa cú pháp (syntax-based) Cả hƣớng tiếpcậndựa tƣ tƣởng Đó tƣơng ứng hai câu (alignment) 3.3.1 ... hai câu tiếng Anh tiếng Tây Ban Nha cho thêm từ vô giá trị vào đầu câu tiếng Anh Hình 2.3.1-10 Sự tƣơng ứng câu tiếng Anh với câu tiếng Tây Ban Nha cho thêm từ vô giá trị (null) vào đầu câu tiếng...
... phần: Cho trƣớc câu ngôn ngữ nguồn f, mục tiêu mô hình dịch máy tìm câu e ngôn ngữ đích cho xác suất P(e|f) cao Có nhiều cáchtiếpcận để tính đƣợc xác suất P(e|f), nhiên cáchtiếpcận trực quan ... cận chính: Mô hình dịch dựa từ (word-based) Mô hình dịch dựa cụm từ (phrase-based) Mô hình dịch dựa cú pháp (syntax-based) Cả hƣớng tiếpcậndựa tƣ tƣởng Đó tƣơng ứng hai câu (alignment) 3.3.1 ... hai câu tiếng Anh tiếng Tây Ban Nha cho thêm từ vô giá trị vào đầu câu tiếng Anh Hình 2.3.1-10 Sự tƣơng ứng câu tiếng Anh với câu tiếng Tây Ban Nha cho thêm từ vô giá trị (null) vào đầu câu tiếng...
... tích hợp trực tiếp tri thức ngôn ngữ vào mô hình dịch Mô hình đƣợc phát triển dựacáchtiếpcận dịch máy dựa ngữ Cải tiến mô hình thông tin tri thức đƣợc tích hợp vào hệ thống mức độ từ Một từ ... hình giả sử câu 𝑒 ngôn ngữ nguồn có câu dịch câu 𝑣 ngôn ngữ Trang 11 đích Một câu e dịch sang đƣợc nhiều câu v Trong dịch thống kê, ta chọn câu v có khả câu dịch e nhiều Với cặp câu 𝑣 𝑒 ta gọi ... dịch dựa ngữ để tích hợp vào hệ thống mình, chẳng hạn [34] thành công sử dụng cách dịch dựa ngữ mô hình dịch máy dựa cú pháp (syntax-based) Hầu hết hệ thống dịch máy thống kê sử dụng cách dịch dựa...
... 4743 cặp câu 100 câu 0.099 Thống kê AnhViệt 159.9 00 cặp câu 100 câu 0.162 100 câu 0.301 Googl e transl ate 100 câu 0.119 Googl e transl ate 29 Nhận xét Dịch máy thống kê phụ thuộc vào liệu ... máy thống kê: dịch văn từ ngôn ngữ sang ngôn ngữ khác dựa mô hình sinh cách tự động từ ngữ liệu Bài toán: Cho câu tiếng Anh đầu vào e, tìm câu tiếng Việt v* cho xác suất điều kiện P(v|e) lớn ... Đầu vào: câu tiếng Anh e Đầu ra: câu tiếng Việt v did not go home - chọn cụm từ tiếng Anh cần dịch did not go home Anh ta - tìm cụm từ tiếng Việt tương ứng - thêm cụm từ tiếng Việt vào cuối câu...
... đó? Tất vấn đề giải báo nhằm cải tiến chất lượng dịch SMT CÔNG TRÌNH LIÊN QUAN Cáchtiếpcậndựa thống kê bước đột phá về phương pháp luâ ̣n cho dich ̣ máy , kế t quả thực tế của ̣ dich ... năng.Thực nghiệm liệu 1000 câu tiếng Anh, mô hình đạt độ xác 87,172% Trong mô hình này, ngữ liệu Tiếng Anh xóa từ chức năng, sau đưavào mô hình dịch.Bộ giải mã dựavào thông tin ngữ cảnh lưu ... h) cho thấy mô hình tăng 0,34% so với hệ thống dịch Baseline Tương tự hướng tiếpcận đầu tiên, mô hình hướng tiếpcận cải tiến chất lượng dịch máy thông qua việc xóa chèn từ chức mang lại hiệu...
... diện) tích hợp trực tiếp tri thức ngôn ngữ vào mô hình dịch Mô hình phát triển dựacáchtiếpcận dịch máy dựa ngữ Cải tiến mô hình thông tin tri thức tích hợp vào hệ thống mức độ từ Một từ mô hình ... 1990 Mô hình giả sử câu ngôn ngữ nguồn có câu dịch câu ngôn ngữ Trang 11 đích Một câu e dịch sang nhiều câu v Trong dịch thống kê, ta chọn câu v có khả câu dịch e nhiều Với cặp câu ta gọi xác suất ... dịch dựa ngữ để tích hợp vào hệ thống mình, chẳng hạn [34] thành công sử dụng cách dịch dựa ngữ mô hình dịch máy dựa cú pháp (syntax-based) Hầu hết hệ thống dịch máy thống kê sử dụng cách dịch dựa...
... pháp tiếpcận thống kê tương phản với phương pháp tiếpcậndựa luật dịch máy với dịch máy dựa ví dụ Thay xây dựng từ điển, quy luật chuyển đổi tay, hệ dịch tự động xây dựng từ điển, quy luật dựa ... toán độ xác Đầu tiên tính trung bình hình học độ xác n-gram sửa đổi, pn, sử dụng n-gram đến chiều dài N trọng lượng tích cực WN cách tổng hợp Tiếp theo, gọi c độdài cụm từ mục tiêu r chiều dài ... θ, có sẵn corpus song ngữ bao gồm S cặp câu {(es,vs) :s = 1, …, S} Với cặp câu (es,vs), biến gióng hàng kí hiệu a Tập tham số θ xác định dựavàocáchtiếpcận hợp lý cực đại corpus huấn luyện song...
... phát triển, bảo đảm tính lâu dài, thường xuyên nhằm thực an sinh xã hội bền vững Mặt khác chế hoạt động bảo hiểm tạo cho khả đảm bảo nguồn tài dồi dào, đủ khả thực dài hạn Bởi lẽ nhiều loại hình ... nước Thực tế cho thấy phận người lao động trẻ tuổi lâm vào hoàn cảnh nghèo đói không thuộc diện ƯĐXH nhiều Vì vậy, xóa đói giảm nghèo coi giải pháp có tính lâu dài bền vững cả, giúp người nghèo ... thường có điều kiện sống thiếu thốn, có thu nhập thấp, trình độ học vấn nhìn chung không cao, tiếp xúc với dịch vụ chăm sóc y tế, giáo dục cách đầy đủ Đây diện đối tượng dễ bị tổn thương chiếm tỷ...
... phương, Bưu điện Tỉnh chủ động phát huy tinh thần sáng tạo, đổi cách nghĩ cách làm, xếp máy, tổ chức, nhân sự, mở cách làm, dịch vụ mới, bước cải thiện chất lượng hoạt động theo hướng ngày hiệu ... án quan trọng có tính chất đột phá như: + Dự án ứng dựng CNTT vào lĩnh vực CCHC cửa huyện, thị xã, thành phố + Dự án bảo mật tích hợp mạng diện rộng + Đưavào hoạt động mạng Hệ thống Hội nghị ... doanh nghiệp CNTT: Hoạt động kinh doanh ngày đa dạng, động hơn, số doanh nghiệp tổ chức bán máy tính trả góp địa bàn Tỉnh tạo điều kiện cho người dân có điều kiện tiếpcận với máy tính phục vụ...
... khó khăn cần tăng cường đầu tư kinh phí, huy động tối đa số trẻ độ tuổi học, vận động học sinh bỏ học học trở lại, phụ đạo học sinh yếu, tăng cường đội ngũ giáo viên, mở rộng hình thức tổ chức ... mù chữ (XMC) giáo dục tiếp tục sau biết chữ; tích cực vận động người lớp XMC, phấn đấu đạt tiêu đến năm 2010 tỷ lệ người biết chữ độ tuổi từ 15 trở lên đạt 98%, số người có độ tuổi từ 15 đến 35 ... trước vào lớp 1, tăng cường dạy tiếng Việt cho học sinh dân tộc cấp tiểu học Tiếp tục xây dựng sách giáo dục hòa nhập cho trẻ em có hoàn cảnh khó khăn, đảm bảo công xã hội bình đẳng hội tiếp cận...