0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Rare Word Translation Extraction from Aligned Comparable Documents" doc

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Effective Phrase Translation Extraction from Alignment Models" ppt

... of phrase length. Tra-ditional word lexicons propose translations for onesource word, while with phrase translations, a singlehypothesis pair can span several words in the sourceor target language. ... the lenth of the phrase,causing each translation to have a score compara-ble to the product of the word to word translationswithin the phrase.7 HMM Phrase Extraction In order to compare our ... candidate translation pair defines a partition within the sentence map,and this partitioning can be scored for confidencein translation quality. We estimate translation con-fidence by measures from...
  • 8
  • 323
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervized Word Segmentation: the case for Mandarin Chinese" doc

... per -word- length level. Our overall results are comparable towhat Huang and Zhao (2007) report. However, theconsistency is quickly falling for longer words: onunigrams, f-scores range from ... performances comparable to those of Wang etal. (2011) with as simpler system.3 EvaluationIn this paper, in order to be comparable withWang et al. (2011), we evaluate our system againstthe corpora from ... densitydistributions for words vs. non-words, we observedthat the VBE at both boundaries were the most dis-criminative value. Therefore, we decided to take inaccount the VBE only at the word- candidate...
  • 5
  • 467
  • 1
Báo cáo khoa học:

Báo cáo khoa học: "Lost in Translation: Authorship Attribution using Frame Semantics" doc

... frames.Frequent Words and Frames (FWaF): The X/2most frequent features; words and frames resp.combined to a single feature vector of size X.In order to gauge the impact of translation upon ... selected from thetraining data, and to minimize the effect of skewedtraining data on the results, oversampling with sub-stitution was used on the training data.1The most frequent words, is from ... markerssuch as frequent words and n-grams are still to bepreferred.Our test corpora consist of a limited number ofauthors, from a limited time period, with translators from a similar limited...
  • 6
  • 370
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word-Class Lattices for Definition and Hypernym Extraction" doc

... frequent words F to generalizewords to word classes”. We define a word classas either a word itself or its part of speech. Givena sentence s = w1, w2, . . . , w|s|, where wiis thei-th word ... tex-tual definitions. Lattices are learned from a dataset of definitions from Wikipedia.Our method is applied to the task of def-inition and hypernym extraction and com-pares favorably to other ... are adopted also in Chinese word segmenta-tion (Jiang et al., 2008), decompounding in Ger-man (Dyer, 2009), and to represent classes of translation models in machine translation (Dyer etal.,...
  • 10
  • 567
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Term-list Translation using Mono-lingual Word Co-occurrence Vectors*" doc

... produced from the words on the basis of co-occurrence statistics. The method was applied to term-lists extracted from newspaper articles and achieved 81% translation accuracy for ambiguous words ... For each word in the given term-list, all the al- ternative translations are retrieved from a bilin- gual dictionary. A translation candidate is defined as a combi- nation of one translation ... where document-by -word matrices are processed by SVD instead of word- by -word matrices. The difference between these two is discussed in (Schuetze and Pedersen, 1997). 671 source translations...
  • 5
  • 338
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Discriminative Modeling of Extraction Sets for Machine Translation" pptx

... relationship between word alignments and extraction sets, then define our model.2.1 Extraction Sets from Word AlignmentsRule extraction is a standard concept in machine translation: word alignment ... sentences.Our extraction set model outperforms both un-supervised and supervised word aligners at pre-dicting word alignments and extraction sets. Wealso demonstrate that extraction sets ... 2007; Li et al., 2009)2 Extraction Set ModelsThe input to our model is an unaligned sentencepair, and the output is an extraction set of phrasal translation rules. Word- level alignments are...
  • 11
  • 420
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Tailoring Word Alignments to Syntactic Machine Translation" docx

... compat-ibility with the word alignment. For a constituent cof t, we consider the set of source words scthat are aligned to c. If none of the source words in the lin-ear closure s∗c(the words between ... con-structs translations using tree-to-string transducerrules. These rules are extracted from a bitext anno-tated with both English (target side) parses and word alignments. Rules are extracted from ... goal, whileinducing many aligned interior nodes hinders it.2.2 Word Alignment InteractionsWe now turn to the interaction between word align-ments and the transducer extraction algorithm. Con-sider...
  • 8
  • 285
  • 0
Tài liệu Báo cáo khoa học: Cell-free translation systems for protein engineering docx

Tài liệu Báo cáo khoa học: Cell-free translation systems for protein engineering docx

... theS30 fraction) from Escherichia coli, wheat germ, orrabbit reticulocytes. These extracts are supernatants from a 30 000 g centrifugation and contain compo-nents such as ribosomes, translation ... extracts provide translation factors and enzymes for aminoacylation, whereas inreconstituted cell-free translation systems [10] the purified compo-nents are added individually.Cell-free translation ... cell-free translation systems for enhancing the syn-thesis of biologically active proteins, the creation ofcell-like compartments and the synthesis of artificialproteins.OverviewCell-free translation...
  • 8
  • 611
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Cross-Domain Co-Extraction of Sentiment and Topic Lexicons" pdf

... andsentiment words (Mei et al., 2007; Titov and Mc-Donald, 2008; Zhao et al., 2010; Li et al., 2010b),where a topic is a cluster of words, which is differ-ent from our fine-grained topic -word extraction. Jin ... lexicon extraction, Y ∈ {1, 2, 3}, whereyi= 1 denotes the corresponding word wia sen-timent word, yi= 2 denotes wia topic word, andyi= 3 denotes wineither a sentiment nor topic word. ... forsentiment lexicon extraction. Table 3 shows the comparison results on topic lex-icon extraction. From the table, we can observe thatdifferent from the sentiment lexicon extraction task,the...
  • 10
  • 447
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Word Representations via Global Context and Multiple Word Prototypes" pdf

... context and one represen-tation per word. This is problematic becausewords are often polysemous and global con-text can also provide useful information forlearning word meanings. We present a newneural ... newneural network architecture which 1) learns word embeddings that better capture the se-mantics of words by incorporating both localand global document context, and 2) accountsfor homonymy ... sense-labeled words. However, inorder to cluster accurately, it is important to captureboth the syntax and semantics of words. While manyapproaches use local contexts to disambiguate word meaning,...
  • 10
  • 494
  • 0

Xem thêm

Từ khóa: Báo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Định tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Quản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ