0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Exemplar-Based Models for Word Meaning In Context" pptx

Báo cáo khoa học:

Báo cáo khoa học: "Topic Models for Word Sense Disambiguation and Token-based Idiom Detection" pdf

... data. In Proceedings of EMNLP-09.D. McCarthy, R. Koeling, J. Weeds, J. Carroll. 2004.Finding predominant word senses in untagged text. In Proceedings of the 42nd Meeting of the Associa-tion for ... abstract). In Re-search and Development in Information Retrieval,279–280.P. Sorg, P. Cimiano. 2008. Cross-lingual informationretrieval with explicit semantic analysis. In In Work-ing Notes for ... determining the correct sense for atarget word given the context in which it occurs.WSD is an important problem in NLP and an es-sential preprocessing step for many applications,including machine...
  • 10
  • 371
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Exemplar-Based Models for Word Meaning In Context" pptx

... paraphrasing task, we findthat a simple exemplar model outperformsmore complex state-of-the-art models. 1 IntroductionDistributional models are a popular framework for representing word meaning. ... model for modeling word meaning in context, applying the model to the task of decid-ing paraphrase applicability. With a very simplevector representation and just using activation, weoutperform ... 1999). In the current paper, we use anexemplar model for computing distributional repre-sentations for word meaning in context, using thecontext to activate relevant exemplars. Comparingrepresentations...
  • 6
  • 415
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Topic Models for Dynamic Translation Model Adaptation" pptx

... explicitlysmooth the resulting ps(e|f), since many word pairswill be unseen for a given domain s, we are alreadyperforming an implicit form of smoothing (whencomputing the expected counts), since each docu-ment ... is to increase the likelihood of selecting rele-vant phrases for translation. Matsoukas et al. (2009)introduced assigning a pair of binary features toeach training sentence, indicating sentences’ ... Topicmodeling has received some use in SMT, for in- stance Bilingual LSA adaptation (Tam et al., 2007),and the BiTAM model (Zhao and Xing, 2006),which uses a bilingual topic model for learningalignment....
  • 5
  • 532
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Data Cleaning for Word Alignment" pdf

... training sentenceswhose n-gram scores are low, we can dupli-cate such training sentences in word alignment.This method is appealing, but unfortunately if weuse mgiza or GIZA++, our training ... is the following: if we witness badsentence-based scores in word- based MT, we canconsider our MT system failing to incorporating an : m mapping object for those sentences. Later in our revised ... 1 Good Points AlgorithmStep 1: Train word- based MT.Step 2: Translate all training sentences by theabove trained word- based MT decoder.Step 3: Obtain the cumulative X-gram score for each pair...
  • 9
  • 487
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Distortion Models For Statistical Machine Translation" doc

... translations in the proper word order by attempting many possible529 word reorderingsduring the translation process. Tryingall possible word reordering is an NP-Complete prob-lem as shown in (Knight, ... counting over align-ment links in the training data. Any aligner such as(Al-Onaizan et al., 1999) or (Vogel et al., 1996) canbe used to obtain word alignments. For the resultsreported in this ... the training data).5.2 Reordering with Perfect Translations In the experiments in this section, we show the util-ity of a trigram language model in restoring the correct word order for English....
  • 8
  • 485
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Structured Models for Fine-to-Coarse Sentiment Analysis" pdf

... everysentence in a document and inference was solved us-ing a min-cut algorithm. However, jointly modelingthe document label and allowing for non-binary la-bels complicates min-cut style solutions as inferencebecomes ... algorithm is outlined in Figure 3. Thealgorithm works by considering a single training in- stance during each iteration. The weight vector w isupdated in line 4 through a quadratic programmingproblem. ... validsentence-document labelings for an input s. Theweights, w, are set using the MIRA learning al-gorithm, which is an inference based online large-margin learning technique (Crammer and Singer,2003; McDonald...
  • 8
  • 347
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Method for Word Sense Disambiguation of Unrestricted Text" potx

... and adjectives in a text, using the senses pro- vided in WordNet. The senses are ranked us- ing two sources of information: (1) the Inter- net for gathering statistics for word- word co- occurrences ... word PROCEDURE: STEP 1. Form a similarity list ]or each sense of one of the words. Pick one of the words, say W2, and using WordNet, form a similarity list for each sense of that word. For ... {police, police force, constabulary, law#7} = > {force, personnel} Figure 1: Synsets and hypernyms for the differ- ent meanings, as defined in WordNet where the numbers in parentheses indicate...
  • 7
  • 378
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Combining Clues for Word Alignment" pdf

... important for our purposes to allow mul-tiple links from each word (source and target) tocorresponding words in the other language in or-der to obtain phrasal links We say that a word- to -word link ... task is tocombine available clues in order to find inter-lingual links. Clues are defined as probabilities ofassociations. In order to combine all indicationswhich are given by single clues ... task for an aligner is now to find all thelinks between the lexical items in English and thelexical items in Swedish. The natural way of doingthis for a human is to use various kinds of infor-mation,...
  • 8
  • 579
  • 0
Báo cáo khoa học:

Báo cáo khoa học: " New Models for Improving Supertag Disambiguation" pdf

... as information extraction. We extend our su- pertagging models to perform this task in a fash- ion similar to that described in Srinivas (1997b). Selected models have been trained on 200K words. ... are combined using various vot- ing strategies. The same 1000K word test corpus is used in models of classifier combination as is used in pre- vious models. We created three distinct partitions ... language models in the context of speech applications. Grishman (1995) and Hobbs et al. (1995) use phrasal information in information extraction. Alshawi (1996) uses dependency information in a...
  • 8
  • 334
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Fertility Models for Statistical Natural Language Understanding" pdf

... of words in q is denoted by g(ci), cl begins at the first word in the sentence, and ct(c) ends at the last word in the sentence. The clumps form a proper partition of E. All the words in ... modeling tech- niques for modeling clump generation are n-gram language models (Miller et al., 1995; Levin and Pier- accini, 1995; Epstein, 1996), and headword language models (Epstein, 1996). ... provides an in- crease in performance of about 2-3% for most mod- els. For General-LM, results increased by 8-10%. The Poisson and general fertility models show a 2- 5% gain in performance over...
  • 6
  • 422
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Thơ nôm tứ tuyệt trào phúng hồ xuân hươngSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)