0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Exploiting Parallel Texts for Word Sense Disambiguation: An Empirical Study" potx

Báo cáo khoa học:

Báo cáo khoa học: "Exploiting Parallel Texts for Word Sense Disambiguation: An Empirical Study" potx

... Exploiting Parallel Texts for Word Sense Disambiguation: An Empirical Study Hwee Tou Ng Bin Wang Yee Seng Chan Department of Computer Science National ... of senses before and after sense lump-ing is 5.07 and 3.52 respectively. After sense lumping, we trained a WSD classi-fier for each noun w, by using the lumped senses in the manually sense- tagged ... translation candidates: Sometimes, multiple and distinct Chi-nese translations appear in the aligned Chinese sentence. For example, for an English occurrence channel, both “频道” (sense 1 translation)...
  • 8
  • 380
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Expressive Models for Word Sense Disambiguation" pot

... using one's feet” and “to direct or control”. WSD can be useful for many applications, includ-ing information retrieval, information extraction and machine translation. Sense ambiguity has ... (Res-nik and Yarowsky, 1997). For example, in machine translation, WSD, or translation disambiguation, is responsible for identifying the correct translation for an ambiguous source word. There ... the sense tagged corpus and sense repositories provided for verbs in Senseval-3. There are 32 verbs with be-tween 40 and 398 examples each. The number of senses varies between 3 and 10 and...
  • 8
  • 380
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "REPRESENTATION OF TEXTS FOR INFORMATION RETRIEVAL" pdf

... OF TEXTS FOR INFORMATION RETRIEVAL N.J. Belkin, B.G. Michell, and D.G. Kuehner University of Western Ontario The representation of whole texts is a major concern of the field known as information ... the following: a. A user, recognizing an information need, presents to an IR mechanism (i.e., a collection of texts, with a set of associated activities for representing, stor- ing, matching, ... psychologically and linguistically based word- co- occurrence analysis of text [i] (figure I). POSITION RANK (r) Adjacent 1 Same Sentence 2 Adjacent Sentences 3 FOR EACH CO-OCCURRENCE OF EACH WORD...
  • 2
  • 419
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Exploiting Web Redundancy for Answer Validation" pptx

... answer. As an example, (Harabagiuand Maiorano, 1999) describes answer validation as an abductive inference process, where an answer isvalid with respect to a question if an explanation for it, ... thequestion words influence the appearance of answerwords. Therefore, we introduce additional linguis-tic techniques for pattern and query formulation,such as keyword extraction, answer type ... question and thestemmed content words of an answer key. All theanswer keys corresponding to the 198 TREC-8 ques-tions have been manually constructed by human an- notators using the TREC corpus and...
  • 8
  • 407
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Conditional Random Fields for Word Hyphenation" docx

... for Word HyphenationNikolaos TrogkanisComputer Science and EngineeringUniversity of California, San DiegoLa Jolla, California 92093-0404tronikos@gmail.comCharles ElkanComputer Science and ... condi-tional random fields. We create new train-ing sets for English and Dutch from theCELEX European lexical resource, andachieve error rates for English of less than0.1% for correctly allowed ... a randomvariable with mean p and variance p(1 − p)/N. For large N, the distribution of the random vari-able f approaches the normal distribution. Hencewe can derive a confidence interval for...
  • 9
  • 607
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Head-Driven Parsing for Word Lattices" ppt

... Journal treebank and lattice cor-pora show word error rates competitive with thestandard n-gram language model while extractingadditional structural information useful for speechunderstanding.1 ... training.1 corpus are annotated with trigram scores trainedusing a 20 thousand word vocabulary and 40 mil-lion word training sample. The word lattices have aunique start and end point, and each complete ... corpus and the Penn Treebankformat. Clitics (i.e., he’s, wasn’t) are splitfrom their hosts in the Penn Treebank (i.e., he ’s,was n’t), but not in the word lattices. The Tree-bank format cannot...
  • 8
  • 382
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Soft Syntactic Constraints for Word Alignment through Discriminative Training" pot

... Similarly,any index x /∈ [i, k] is external to T[i,k]. An in-valid span is any span for which our provided treeT[i,k]x1 i j k x2j'TFigure 3: Illustration of invalid spans. [j, j] and[j, ... alignment be the complete structure thatconnects two parallel sentences, and a link beone of the word- to -word connections that makeup an alignment. All word alignment methodsbenefit from some set of ... agriculture industryl' industrie agricole CanadienneFigure 2: An example of an ITG alignment. Ahorizontal bar across an arc indicates an inversion. An ITG chart parser provides a polynomial-time...
  • 8
  • 325
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A STOCHASTIC PROCESS FOR WORD FREQUENCY DISTRIBUTIONS" pot

... the hum- Table i: Spearman rank correlation analysis of the neighborhood density and frequency effects for empirical and theoretical words of length 4. Dutch Mand. Mand Simon dens. freq. ... function words excluded, and charts the lexical similarity effects of the subset of words with length 4 by means of boxplots. These show the mean (dotted line), the median, the upper and lower ... i.e. the set of all words at Hamming distance 1 from the target. Landauer and Streeter observed that (1) high- frequency words have more neighbors than low- frequency words (the neighborhood...
  • 8
  • 409
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "AMBIGUITY RESOLUTION IN THE HUMAN SYNTACTIC PARSER: AN EXPERIMENTAL STUDY" ppt

... natural form of a parser which utilizes abandonment would be an IPA model. The construction of more than one analysis for an ambiguity would trigger the parser to throw out the analyses and wait ... other sort can be called strong parallelism, in which the possible analyses can stay active and be expanded as new input is received. If further input is inconsistent with any of the analyses, ... a delay in beginning analy- sis, and then another delay as a result of abandon- ment. When analysis is begun again following aban- donment, it can proceed according to any of the above models,...
  • 5
  • 352
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Confidence Bands for Parallel Texts Alignment" pptx

... the European Union, where texts mustbe translated daily into eleven languages, oreven in the U.S.A. where Spanish and Englishspeaking communities are intermingled. Parallel texts (texts that ... variesaccording to language similarity. For instance,on average, it is higher for Portuguese–Spanishthan for Portuguese–English.These words end up being mainly numbersand names. Here are ... (pt) andSpanish (es).2 Webpage address: curia.eu.int3 The same languages as those in footnote 1 plusFinnish (fi) and Swedish (sv).4 No Written Questions and Debates texts for Finnishand...
  • 8
  • 463
  • 0

Xem thêm

Từ khóa: báo cáo khoa họcbáo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngchuyên đề điện xoay chiều theo dạngMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEPhát hiện xâm nhập dựa trên thuật toán k meansSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015