0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Hierarchical Search for Word Alignment" ppt

Báo cáo khoa học:

Báo cáo khoa học: "Hierarchical Search for Word Alignment" ppt

... worse to align two English words atdifferent ends of the tree to the same foreign word, than it is to align two English wordsunder the same NP to the same foreign word. To see why a string distance ... apply them to word alignment.Using a foreign string and an English parsetree as input, we formulate a bottom-up search on the parse tree, with the structure of the treeas a backbone for building ... of the Association for Computational Linguistics, pages 157–166,Uppsala, Sweden, 11-16 July 2010.c2010 Association for Computational LinguisticsHierarchical Search for Word AlignmentJason...
  • 10
  • 314
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Data Cleaning for Word Alignment" pdf

... mechanism to aug-ment one source word into several source wordsor delete a source word, while a NULL insertionis a mechanism of generating several words fromblank words. Fertility uses a conditional ... scoreSW B,X for each pair of sentences where X is4, 3, 2, and 1 for word- based MT decoder.Step 3: Train phrase-based MT for full parallelcorpus. Note that we do not need to run a word aligner ... Correspondence Rate). Let us de-fine literal translation as a word- to -word transla-tion, and non-literal translation as a non word- to- word translation. Literalness is defined as a de-gree of literal...
  • 9
  • 487
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Combining Clues for Word Alignment" pdf

... source language word per row and one target language word percolumn. The cells inside the matrix can be filledwith the combined clue values for the correspond-ing word pairs. Henceforth, this ... 0.860The matrix is simply filled with all values ofcombined clues for each word pair. For ex-ample, the total clue value for the word pairs ="baggage" and t ="handbagaget" ... phrasetype labels bear much less information about spe-cific words and phrases than POS tags, therefore,a lower weight of 0.1 was chosen for these twoclues.5.2 The results For the evaluation, we used...
  • 8
  • 579
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Search for The Optimal Segmentation for Statistical Machine Translation" doc

... 2010 Student Research Workshop, pages 31–36,Uppsala, Sweden, 13 July 2010.c2010 Association for Computational LinguisticsUnsupervised Search for The Optimal Segmentation for StatisticalMachine ... is performed including the newly addedfractional counts.3.2 Parallelization of search In an iteration of the algorithm, all words are pro-cessed in random order, computing for each word the ... (i) to consistently identify the root word “anahtar” (top portion), and (ii) to match theEnglish plural word form “games” with the Turk-ish plural word form “oyunlar” (bottom portion).Monolingual...
  • 6
  • 445
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Method for Word Sense Disambiguation of Unrestricted Text" potx

... word PROCEDURE: STEP 1. Form a similarity list ]or each sense of one of the words. Pick one of the words, say W2, and using WordNet, form a similarity list for each sense of that word. For ... senses pro- vided in WordNet. The senses are ranked us- ing two sources of information: (1) the Inter- net for gathering statistics for word- word co- occurrences and (2)WordNet for measuring the ... average accuracy of 85.7% for nouns, 63.9% for verbs, 83.6% for adjectives and 86.5% for adverbs, slightly less than our re- sults. Moreover, for applications such as infor- mation retrieval...
  • 7
  • 378
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Efficient Search for Interactive Statistical Machine Translation" doc

... notrelevant for the subsequent exposition. For furtherdetails, see (Och et al., 1999).5 Word Hypotheses GraphsA word hypotheses graph is a directed acyclicgraph G = (V, E). It is a subset of the search graph ... is not part ofthe word hypotheses graph. To avoid this prob-lem, we perform a tolerant search in the word hy-potheses graph. We select the set of nodes thatcorrespond to word sequences with ... sentence.Hence, we have to perform certain simplificationsmaking the search problem feasible.Our solution is to precompute a subset of pos-sible word sequences. The search in Eq. 3 isthen constrained...
  • 8
  • 272
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Improving Domain-Specific Word Alignment for Computer Assisted Translation" potx

... domain to improve word alignments for general words and the corpus in the specific domain for domain-specific words. In other words, we will adapt the word alignment information in the general ... target words for the English word i, we add this link into . WAd) Otherwise, if there are two different links for this word: one target is a single word, and the other target is a multi -word ... indicates the words aligned to the same source word k. For example, if a Chinese word in position j is connect to an English word in position i, then . And if a Chinese word in position...
  • 4
  • 265
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Topic Models for Word Sense Disambiguation and Token-based Idiom Detection" pdf

... de-tailed information may not be available, for in-stance for languages for which such a resourcedoes not exist or for expressions that are notvery well covered in WordNet, such as idioms. For those ... general language model for information retrieval (poster abstract). In Re- search and Development in Information Retrieval,279–280.P. Sorg, P. Cimiano. 2008. Cross-lingual informationretrieval ... topic-document vectors (one for the senseand one for the context). We apply these modelsto coarse- and fine-grained WSD and find that theyoutperform comparable systems for both tasks.We also test...
  • 10
  • 371
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Domain Kernels for Word Sense Disambiguation" ppt

... of the text in which the word is located is a crucial information for WSD. For example the (domain) polysemy among the COM-PUTERSCIENCE and the MEDICINE senses of the word virus can be solved ... Thismethodology is called word expert approach (Small,1980; Yarowsky and Florian, 2002). However thisis clearly unfeasible for all-words WSD tasks, inwhich all the words of an open text should ... dis-ambiguated.On the other hand, the word expert approachworks very well for lexical sample WSD tasks (i.e.tasks in which it is required to disambiguate onlythose words for which enough training data...
  • 8
  • 306
  • 0
Báo cáo khoa học: A search for synthetic peptides that inhibit soluble N-ethylmaleimide sensitive-factor attachment receptor-mediated membrane fusion pot

Báo cáo khoa học: A search for synthetic peptides that inhibit soluble N-ethylmaleimide sensitive-factor attachment receptor-mediated membrane fusion pot

... parental SNARE proteins for SNARE complex formation, inhibiting SNAREassembly. In an initial attempt to search for the potentpeptide sequences that inhibit SNARE complex forma-tion and neurotransmitter ... theydid not reduce SNARE complex formation much. Bycontrast, these peptides inhibited SNARE complex for- mation very efficiently when added before preincuba-tion. Therefore, N-terminal-mimicking peptidesinhibited ... sothat the force generated by SNARE complex forma-tion can be faithfully transferred to the membranes[13–15].Impaired SNARE function is known to block neuro-nal exocytosis. For example,...
  • 13
  • 290
  • 0

Xem thêm

Từ khóa: Nghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíQuản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)BÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015