0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Smaller Alignment Models for Better Translations: Unsupervised Word Alignment with the 0" potx

Báo cáo khoa học:

Báo cáo khoa học: "Smaller Alignment Models for Better Translations: Unsupervised Word Alignment with the 0" potx

... LinguisticsSmaller Alignment Models for Better Translations: Unsupervised Word Alignment with the 0-normAshish Vaswani Liang Huang David ChiangUniversity of Southern CaliforniaInformation Sciences ... translationrules. The dominant approach to word alignment hasbeen the IBM models (Brown et al., 1993) together with the HMM model (Vogel et al., 1996). These models are unsupervised, making them applicableto ... re-placement for GIZA++ in any existing MT pipeline.3112 MethodWe start with a brief review of the IBM and HMM word alignment models, then describe how to extendthem with a smoothed 0prior...
  • 9
  • 304
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Flow Network Models for Word Alignment and Terminology Extraction from Bilingual Corpora" docx

... [1;1], 2The empty words account for the fact that words may not be aligned with other ones, i.e. they are not exphcitely translated for example. 445 • from the source to the empty English word, ... comprises edges from the source to all the English words (including the empty one), edges from all the French words (including the empty one) to the sink, an edge from the sink to the source, and ... ing the empty one), the capacity interval is [0;1], • from the French words (excluding the empty one) to the sink, the capacity inter- val is [1;1]. • from the empty French word to the sink,...
  • 7
  • 379
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Log-linear Models for Word Alignment" ppt

... log-linear models significantly outperform IBMtranslation models. We begin by describing log-linear models for word alignment. The design of feature functionsis discussed then. Next, we present the ... in a given alignment between the source sentence and the target sentence. There-fore, the weight for the provided conventional dic-tionary can be learned. The intuition is that the con-ventional ... result in the problem that the param-eters trained with the GIS algorithm yield worsealignments even on the development corpus. Thiscan happen because with the modified model scalingfactors the...
  • 8
  • 283
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Incremental Parsing Models for Dialog Task Structure" doc

... representing the ut-terance onto the stack, before popping the top twoelements off the stack and adding the subtree for special-order into the dialog’s subtask tree.4.2 Start-Complete MethodIn the ... repre-senting the current utterance onto the stack, then97pops the top two tokens off the stack and pushes the non-terminal X; u-complete-X pops the top to-ken off the stack and pushes the non-terminal ... improvedperformance for any method. One utterance ofcontext is best for shift-reduce and start-join; threeis best for the connection path method. The shift-reduce method performs the best. With...
  • 9
  • 467
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Employing Topic Models for Pattern-based Semantic Class Discovery" doc

... capture the global context information as the topic features for better performing the WSD task. In Boyd-Graber et al. (2007), Latent Dirichlet with WordNet (LDAWN) is developed for simultaneously ... It is therefore not clear whether it can be borrowed to deal with multi-membership here. Among the various applications of topic modeling, maybe the efforts of using topic model for Word Sense ... predefine the cluster number k. We fix the k value for all dif-ferent query item q, as has been done for the top-ic model approach. For fair comparison, the same postprocessing is made for all the...
  • 9
  • 398
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Expressive Models for Word Sense Disambiguation" pot

... signif-icantly outperforms the majority sense baseline and performs as well as the state-of -the- art system re-porting results for the same set of verbs. As with the multilingual task, the models produced ... for the disambigua-tion of verbs. We plan to further evaluate our approach for other sets of words, including other parts-of-speech to allow further comparisons with other approach-es. For ... independently from the others, the data sparseness problem is minimized. Therefore, ILP seems to provide the most general-purpose frame-work for dealing with such data: it does not suffer from the limitations...
  • 8
  • 380
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Re-Ranking Models For Spoken Language Understanding Marco Dinarelli University of Trento Italy" potx

... 1 for the 1-besthypothesis) performs a Viterbi search on the FST203and outputs the n-best hypotheses and projectCperforms a projection of the FST on the output la-bels, in this case the ... many times the hypothesis ranked first by the SCLM is not the closest to the correct concept sequence, i.e. its er-ror rate using the Levenshtein alignment with the manual annotation of the corpus ... sequence length, i.e. the number of chil-dren.Furthermore, we add two decay factors: µ for the depth of the tree and λ for the length of the child subsequences with respect to the original se-quence,...
  • 9
  • 330
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Rule Markov Models for Fast Tree-to-String Translation" pot

... the order of the word language model (in Figure 4, n = 2). The stacktogether with the translated English words comprisea state of the decoder. The last column in the fig-ure shows the rule Markov ... r2onto the stack:[ NP@1VP@2] [ Bush]In step 3, we perform a scan operation, in whichwe append the English word just after the dot to the current hypothesis and move the dot after the word. Since ... after the word. Since the dot is at the end of the top rule in the stack,we perform a complete operation in step 4 where wepop the finished rule at the top of the stack. In the scan and complete...
  • 9
  • 305
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Latent Variable Models for Semantic Orientations of Phrases" pdf

... estimate the pa-rameters of the model. According to the theory of the EM algorithm, we can increase the likelihoodof the model with latent variables by iteratively in-creasing the Q-function. The ... dataset).If either of the two words in a pair in the testdataset does not appear in the training dataset, weexcluded the pair from the test dataset since the problem of unknown words is not in the scope ... orientations of the words in the neighboring sentences. Their methodis similar to Turney’s in the sense that cooccur-rence with seed words is used. The three methodsabove are based on context information....
  • 8
  • 404
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Exemplar-Based Models for Word Meaning In Context" pptx

... frequency, with de-teriorating perform ance for the highest-frequencytargets as well as for the lemmas with the highestaverage paraphrase frequency.Comparison to other models. Many of the other models ... occurs twice in the BNC , once in the sen-tence The dog will gnurge the other dog”, andonce in The old windows gnurged”, the exemplarset for gnurge contains the vectors [dog-n: 2, other-a:1] ... bag-of-words co-occurrence vectors from the BNC. These vectorsrepresent instances of a target word by the otherwords in the same sentence, lemmatized and POS-tagged, minus stop words. E.g., if the...
  • 6
  • 415
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Báo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Nghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngThơ nôm tứ tuyệt trào phúng hồ xuân hươngThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXChuong 2 nhận dạng rui roTăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ