0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Left-to-Right Target Generation for Hierarchical Phrase-based Translation" doc

Báo cáo khoa học:

Báo cáo khoa học: "Applying Morphology Generation Models to Machine Translation" docx

... achieved performance of the model im-proved; the best performance achieved by Method 2is .63 points higher than the performance of Method1. We should note that the oracle performance for Method ... Thus we do not need to do anything furtherto obtain input of the form necessary for applicationof the inflection model. For the phrase-based system, we generated theannotations needed by first ... chosen for Russian and as seen in Table 5, (n=2) were chosen for Arabic for this method.5.2 Method 2In this method, the base MT system is trained to pro-duce sequences of stems in the target...
  • 9
  • 416
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Randomised Language Modelling for Statistical Machine Translation" doc

... 1) for j = 1 to qc(x) do for i = 1 to k dohi(x) ← hash of event {x, j} under hiBF[hi(x)] ← 1end for end for end for return BF3.1 Log-frequency Bloom filterThe efficiency of our scheme for ... bound on qc(x) ∈ Strain for j = 1 to M AXQCOUNT do for i = 1 to k dohi(x) ← hash of event {x, j} under hiif BF[hi(x)] = 0 thenreturn j − 1end ifend for end for The probability of overestimating ... 3-grams,the actual error rate of the former is lower for mod-els with less memory. By testing for 2-grams priorto querying for the 3-grams, we can avoid perform-ing some queries that may otherwise have...
  • 8
  • 268
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Measure Word Generation for English-Chinese SMT Systems" ppt

... target information during the measure word generation process. We do not integrate our measure word generation module into the SMT decoder since there is only little target contextual information ... of Formula (3) involves the fea-tures listed in Table 2 where the Mo-ME model only employs target features and the Bi-ME model leverages both target features and source features. For target ... can heuristically identify head words for sub-trees. For the bilingual corpus, we also per-form word alignment to get correspondences be-tween source and target words. Then, the colloca-tion...
  • 8
  • 287
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bilingual Sense Similarity for Statistical Machine Translation" ppt

... a hierarchical phrase-based SMT system as our baseline; thus, the units involved in computation of sense similarities are hierar-chical rules. 2 Hierarchical phrase-based MT system The hierarchical ... in SMT for translation selection. However, WSD techniques for SMT do so indirectly, using source-side context to help select a particular translation for a source rule. source target ... combination over target features. That is to say, given a source feature weight for fi, each target feature weight is linked to it with some probability. So that we can calculate a transformed vector...
  • 10
  • 594
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Web-Scale Features for Full-Scale Parsing" doc

... errorreduction. Results are for dependency parsing on the dev set for iters:5,training-k:1.tal errors break down by gold head. For example,the 12.1% total error reduction for attachments of anIN ... leave, inhave NN IN time, for some NN IN money, for annual NNS IN reports, onTable 8: The highest-weight features (thresholded at a count of400) of the before-word schema for a noun head and prepositionargument ... n-grams of the form cha, hca,and hac. Aggregating over all h and a (of a givenPOS pair), we determine which context words c aremost frequent in each position. For example, for h =raising...
  • 10
  • 450
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic Headline Generation using Character Cross-Correlation" doc

... probabilistic model for headline generation in which they divide head-line generation process into two steps; namely the step of distilling the information source from the observation of a document and ... 0.17252 for the same set of documents. 1 Introduction A headline is considered as a condensed summary of a document. It can be classified as the acme of text summarization. The necessity for ... step of generat-ing a title from the estimated information source, but it was for English documents. 1.1 Headline Length One of the tasks of the Document Understanding Conference of 2004 (DUC...
  • 5
  • 614
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Re-Usable Tools for Precision Machine Translation∗" pdf

... Boks 1080 Blindern; 0316 Oslo (Norway)♠Center for the Study of Language and Information, Stanford, CA 94305 (USA){ jtl@ifi.uio.no| oe@csli.stanford.edu}AbstractThe LOGON MT demonstrator assemblesindependently ... Norwegian Research Council program for building national infrastructure for languagetechnology (Fenstad et al., 2006). It is the goal for the program as well as for the project to in-clude various ... combination of di-verse grammatical frameworks, viz. LFG for Nor-wegian analysis and HPSG for English generation. While an in-depth introduction to MRS (for MT)is beyond the scope of this project note,...
  • 4
  • 448
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A CONNECTIONIST PARSER FOR STRUCTURE UNIFICATION GRAMMAR" docx

... grouping of information, thus expressing the information in- terdependencies. The language which SUG pro- vides for specifying these descriptions allows par- tiality both in the information about ... thereby also forgetting the predications over the nodes. This forgetting operation abstracts away from the existence of the forgotten node in the phrase structure. Once a node is forgotten it ... Unification Grammar is a formaliza- tion of accumulating information about the phrase structure of a sentence until this structure is com- pletely described. This information is specified in...
  • 8
  • 427
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Incremental Parsing Models for Dialog Task Structure" doc

... to improvedperformance for any method. One utterance ofcontext is best for shift-reduce and start-join; threeis best for the connection path method. The shift-reduce method performs the best. ... historyNbestFstart!completeconnection!pathsshift!reduceFigure 5: Performance of parse-based methods for subtask tree buildingFigure 5 shows the performance of the differentmethods for determining the subtask tree of the ... catalogordering domain that has been annotated for dialogacts and task/subtask information. We show thatall these methods outperform a baseline method for recovering the dialog structure.The rest...
  • 9
  • 467
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "SVD and Clustering for Unsupervised POS Tagging" docx

... map-free information-theoretic criterion—see Gao and Johnson (2008) for details. Although we find M-to-1 to be the most reliable criterion of the three, we include the other two criteria for completeness. ... Table 1 compares the per-formance of SVD2 to other leading models. Fol-lowing Gao and Johnson (2008), the number of induced tags is 17 for PTB17 evaluation and 50 for PTB45 evaluation. Thus, ... NVI scores (Reichart and Rappoport 2009) corres-ponding to the VI scores for SVD2 are 0.938 for PTB17 and 0.885 for PTB45. To examine the sensitivity of the algorithm to its four parameters,...
  • 5
  • 269
  • 0

Xem thêm

Từ khóa: Nghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘITÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ