0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Research Methodology for Machine Translation" pptx

Báo cáo khoa học:

Báo cáo khoa học: "Research Methodology for Machine Translation" pptx

... different occurrences of the same form. Research Methodology 9 10 Edmundson and Hays Word: a form that represents a set of forms differing only in inflection. For example, "great" ... poration for conducting research on MT is that of convergence by successive refinements. At each stage, automatic computing machinery is used for some aspects of translation, and for collecting ... call for special definitions. Corpus: a group of articles or books selected for analysis. Form: a distinctive sequence of characters. Thus every change in spelling is a change in form;...
  • 8
  • 281
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Framework for Syntactic Translation" docx

... S1, which contains all of the information that is in the input sentence. The part of the information that is implicit in the sentence (tense, voice, and so forth) is made explicit in S1. ... certain German verb form into English, it is necessary to un- derstand the German verb form as part of a complex of features of German structure in- cluding possibly other verb forms within the ... provided so that each verb form is understood correctly as a part of that English complex. The form of an English pronoun depends on its English antecedent, while the form of a Ger- man pronoun...
  • 7
  • 508
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Topic Models for Dynamic Translation Model Adaptation" pptx

... unseen for a given domain s, we are alreadyperforming an implicit form of smoothing (whencomputing the expected counts), since each docu-ment has a distribution over all topics, and thereforewe ... Meeting of the Association for Computational Linguistics, pages 115–119,Jeju, Republic of Korea, 8-14 July 2012.c2012 Association for Computational LinguisticsTopic Models for Dynamic Translation ... a sentence contributes itscounts only to the translation table for the source itcame from, many word pairs will be unobserved for a given table. This sparsity requires smoothing. Sec-ond, we...
  • 5
  • 532
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "HINDI TO PUNJABI MACHINE TRANSLATION SYSTEM" pdf

... module finds the root word for the token and its morphological features.Morphological analyzer developed by IIT-H has been ported for Windows platform for making it usable for this system. (Goyal ... analysis without using morphology has been performed for all those tokens that are not processed by morphological analysis module. Thus, for performing inflectional analysis, rule based approach ... translated using our Machine Translation system. 3.1 Test Document 4 For our Machine Translation system evaluation, we have used benchmark sampling method for selecting the set...
  • 6
  • 458
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Phrase-Based Statistical Machine Translation as a Traveling Salesman Problem" docx

... BLEU scores as functions of time for a bigram LM; (c), (d): the same for a trigram LM. The x axis corresponds to the cumulative time for processing the test set; for (a) and (c),the y axis corresponds ... al-gorithm using a small value for the stack size andthen use it as initial point, both for the LK algo-rithm and for further Beam-Search optimization(where as before we vary the Beam-Search ... compete against one another. Inone early formulation of stack decoding for SMT(Germann et al., 2001), the authors indeed pro-posed to lazily create one stack for each subsetof source words, but...
  • 9
  • 438
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Asynchronous Binarization for Synchronous Grammars" pptx

... Transforming the entire for- est to n-ary form is intractable, however, becausethe number of hyperedges would be exponential inn. Instead, we include only the top k n-ary back-traces for each forest ... Collapsing BinarizationTo facilitate a change in binarization, we transformthe translation forest into n-ary form. In the n-aryforest, each hyperedge corresponds to an originalgrammar rule, and ... CnnThese rules are also anchored to forest nodes. AnyCiremains anchored to the same node as it was inthe n-ary forest. For the new symbol B, we intro-duce a new forest node B that does not correspondto...
  • 4
  • 278
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Evaluation of Machine Translation Quality Using Longest Common Subsequence and Skip-Bigram Statistics" doc

... structure. Therefore, systems optimized for these unigram-based measures might generate adequate but not fluent target language. Since BLEU has been used to report the perform-ance of many machine ... is allowed to form a skip-bigram. Applying such constraint, we limit skip-bigram formation to a fix window size. There-fore, computation time can be reduced and hope-fully performance can ... evaluate machine translations the machine translation community recently adopted an n-gram co-occurrence scoring proce-dure BLEU (Papineni et al. 2001). In two recent large-scale machine...
  • 8
  • 442
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Lexical Morphology in Machine Translation: a Feasibility Study" potx

... precisely the phenomena that have to be formalized and then the prototype built up for the experiment. 4.1 Phenomena to be formalized Like in any MT project, the formalisation work has to face different ... lexicon does not contain such in-formation. Consequently, we looked for a simple way to automatically extend the Italian lexicon. For example, we looked for a way to automati-cally link relational ... if machine- learning methods would do the job. The number of LFRs being relatively restrained in producing neologisms, we can say that the effort of manual formalisation is worthwhile for...
  • 9
  • 520
  • 0
Báo cáo khoa học:

Báo cáo khoa học: " The Work on Machine Translation in the Soviet Union" pot

... for the recording of the intermediary language can be used also for the recording of information in information machines. Along with work on the algorithms of machine translation from foreign ... language is strictly deductive and formal. This is just what deter- mines its importance both for general linguis- tics and for machine translation. Naturally the formal description of language ... construction of algorithms for machine translation. 5 The central problem now confronting linguists working in the field of machine translation is that of the methods of formal description of...
  • 6
  • 472
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Syntactic Stylometry for Deception Detection" pptx

... the Association for Computational Linguistics, pages 171–175,Jeju, Republic of Korea, 8-14 July 2012.c2012 Association for Computational LinguisticsSyntactic Stylometry for Deception DetectionSong ... node, e.g., PRPˆNP4→ “you”.4 Experimental Results For all classification tasks, we use SVM classi-fier, 80% of data for training and 20% for test-ing, with 5-fold cross validation.2All featuresare ... the best performance of 91.2% accuracy,2We use LIBLINEAR (Fan et al., 2008) with L2-regulization, parameter optimized over the 80% trainingdata (3 folds for training, 1 fold for testing).3Numbers...
  • 5
  • 441
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họccách trình bày báo cáo khoa họcbáo cáo khoa học toán họccách làm báo cáo khoa họctrình bày báo cáo khoa họcBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếThơ nôm tứ tuyệt trào phúng hồ xuân hươngChuong 2 nhận dạng rui roTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Quản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ