0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Using Noisy Bilingual Data for Statistical Machine Translation" pot

Báo cáo khoa học:

Báo cáo khoa học: "Using Noisy Bilingual Data for Statistical Machine Translation" pot

... Using Noisy Bilingual Data for Statistical Machine TranslationStephan VogelInteractive Systems LabLanguage Technologies ... translation model trained on bilingual data and a language model for the target language,trained on perhaps some larger monolingual data. Often the amount of clean parallel data is limited.This leads ... (Vogel et al., 1996) were trained for both the clean parallel corpus and for the extendedcorpus with the noisy Xinhua News data. Thealignment models were trained for Chinese to En-glish as well...
  • 4
  • 234
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Cohesive Phrase-based Decoding for Statistical Machine Translation" pot

... all such subtrees for a hypotheticalT and¯fh1. Fortunately, with a little analysis that ac-counts for ¯fh+1, we can show that at most two sub-trees need to be checked. For a given interruption-free¯fh1, ... constraint for word alignment. Therefore, wepropose a soft version of our cohesion constraint.We perform our interruption check, but we do notinvalidate any hypotheses. Instead, each hypothe-sis ... 72–80,Columbus, Ohio, USA, June 2008.c2008 Association for Computational LinguisticsCohesive Phrase-based Decoding for Statistical Machine TranslationColin Cherry∗Microsoft ResearchOne...
  • 9
  • 304
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Moses: Open Source Toolkit for Statistical Machine Translation" pot

... sta-tistical machine translation whose novel contributions are (a) support for linguisti-cally motivated factors, (b) confusion net-work decoding, and (c) efficient data for- mats for translation ... decoder. 5 Efficient Data Structures for Transla-tion Model and Language Models With the availability of ever-increasing amounts of training data, it has become a challenge for machine translation ... examined by the machine transla-tion system. Efficient data structures in Moses for the memory-intensive translation model and language model allow the exploitation of much larger data resources...
  • 4
  • 444
  • 1
Báo cáo khoa học:

Báo cáo khoa học: "A Polynomial-Time Algorithm for Statistical Machine Translation" pot

... polynomial-time algorithm for statistical machine translation. This algorithm can be used in place of the expensive, slow best-first search strate- gies in current statistical translation ar- ... that exploits bracket- ing information (Wu and Ng, 1995). If any brackets for the Chinese sentence can be supplied as addi- tional input information, produced for example by a preprocessing ... formalisms were originally developed for the purpose of parallel corpus annotation, with applications for bracketing, alignment, and segmen- tation. This paper finds they are also useful for...
  • 7
  • 283
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Refined Lexicon Models for Statistical Machine Translation using a Maximum Entropy Approach" pptx

... Refined Lexicon Models for Statistical Machine Translation using aMaximum Entropy ApproachIsmael Garc´ıa VareaDpto. de Inform´aticaUniv. de Castilla-La ManchaCampus ... the lexicon models used in statistical machine translation systemsdo not include any kind of linguisticor contextual information, which oftenleads to problems in performing a cor-rect word ... this problem withinthe statistical framework is to use max-imum entropy methods. In this paper,we present how to use this type of in-formation within a statistical machine translation system....
  • 8
  • 427
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Localized Prediction Model for Statistical Machine Translation" ppt

... ACL, pages 557–564,Ann Arbor, June 2005.c2005 Association for Computational LinguisticsA Localized Prediction Model for Statistical Machine TranslationChristoph Tillmann and Tong ZhangIBM ... @us.ibm.comAbstractIn this paper, we present a novel trainingmethod for a localized phrase-based predic-tion model for statistical machine translation(SMT). The model predicts blocks with orien-tation ... blocks for for which.5604 Online Training of Maximum-entropyModelThe local model described in Section 3 leads to the fol-lowing abstract maximum entropy training formulation:(8)In this formulation,...
  • 8
  • 578
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "ADP based Search Algorithm for Statistical Machine Translation" docx

... experimental results for a bilingual cor- pus are reported. 1.1 Statistical Machine Translation In statistical machine translation, the goal of the search strategy can be formulated as follows: ... additional parameter into the recursion formula for DP. In the following, we will explain this method in detail. 2.3 Recursion Formula for DP In the DP formalism, the search process is described ... A DP based Search Algorithm for Statistical Machine Translation S. Nieflen, S. Vogel, H. Ney, and C. Tillmann Lehrstuhl fiir Informatik VI RWTH Aachen - University of Technology...
  • 8
  • 480
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Minimum Error Rate Training in Statistical Machine Translation" potx

... criteria are, for example,F-Measure for parsing, mean average precision for ranked retrieval, and BLEU or multi-reference worderror rate for statistical machine translation. The useof statistical ... Minimum Error Rate Training in Statistical Machine TranslationFranz Josef OchInformation Sciences InstituteUniversity of Southern California4676 Admiralty Way, Suite 1001Marina ... are not addi-tive for different sentences, i.e. the score for a doc-ument cannot be obtained by simply summing overscores for individual sentences.4 Training Criteria for Minimum ErrorRate...
  • 8
  • 296
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Enriching Morphologically Poor Languages for Statistical Machine Translation" doc

... re-structuring for statistical machine translation. In ACL’05: Proceedings of the 43rd Annual Meeting on Asso-ciation for Computational Linguistics, pages 531–540,Morristown, NJ, USA. Association for ... suffersfrom the lack of information about its role in the sen-tence, making it hard to choose the right inflectedforms.Our method is based on factored phrase-based statistical machine translation ... tested in Greek, therewas an effort to investigate whether it is useful for other languages with similar characteristics. For thisreason, the method was adapted for Czech, whichneeds agreement...
  • 8
  • 313
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Continuous Space Language Models for Statistical Machine Translation" pdf

... becausecanittheywethatcancancanbebehavebehavebehaveitithasforgottenhasforgottenhashasforgottenforgottenbeenforgottenbeenforgottenforgotten..forgotten......Figure 1: Example of a translation ... amount of papers investigatingnew approaches to language modeling for statis-tical machine translation. Traditionally, statistical machine translation systems use a simple 3-gramback-off language ... aremany areas where automatic machine translationcould be deployed and for which considerably lessappropriate in-domain training data is available.We could for instance mention automatic...
  • 8
  • 345
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Chuong 2 nhận dạng rui roBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘITÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ