0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Word Clustering and Word Selection based Feature Reduction for MaxEnt based Hindi NER" ppt

Báo cáo khoa học:

Báo cáo khoa học: "Word Clustering and Word Selection based Feature Reduction for MaxEnt based Hindi NER" ppt

... effectiveness of word clustering and selection as feature reduction tech-niques for MaxEnt based NER. For clustering weuse a number of word similarities like cosine sim-ilarity among words and co-occurrence, ... Ohio, USA, June 2008.c2008 Association for Computational Linguistics Word Clustering and Word Selection based Feature Reduction for MaxEnt based Hindi NERSujan Kumar SahaIndian Institute ... ofvalues for a feature is large. To overcomethis we proposed two techniques for feature reduction based on word clustering and se-lection. A number of word similarity mea-sures are proposed for clustering...
  • 8
  • 444
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Syntactic Features and Word Similarity for Supervised Metonymy Resolution" pot

... (Lakoff and Johnson, 1980; Fass, 1997;Stern, 1931)). In a place -for- people pattern,a place stands for any persons/organisations associ-ated with it, e.g., for sports teams in (2), (3), and (4), and ... Syntactic Features and Word Similarity for Supervised MetonymyResolutionMalvina NissimICCS, School of InformaticsUniversity of Edinburghmnissim@inf.ed.ac.ukKatja MarkertICCS, School of InformaticsUniversity ... occurred there (e.g., us-ing the word Vietnam for the Vietnam war). In aplace -for- product pattern a place stands for a product manufactured there (e.g., the word Bor-deaux referring to the...
  • 8
  • 603
  • 0
Tài liệu Báo cáo khoa học: Purification and cDNA cloning of a cellulase from abalone Haliotis discus hannai ppt

Tài liệu Báo cáo khoa học: Purification and cDNA cloning of a cellulase from abalone Haliotis discus hannai ppt

... dGTP and dCTP, 1.2 mMMgCl2,2pmolÆmL)1primers, 1 ngÆmL)1template DNA, and 0.05 unitsÆmL)1TaKaRa Taq DNA polymerase. Asuccessive reaction at 95 °C for 30 s, 45 °Cfor60sand72 °C for 90 ... acids of the HdEG66 was amplified.Finally, 5¢ -and3 ¢-RACE PCRs were performed usingprimers shown in Table 2, and Hd5RACE-DNA and Hd3RACE-DNA for -and3 ¢-terminal regions wereamplified, respectively. ... domain.Cellulose-binding ability and other biochemical functionsFig. 4. Structures of cDNA and genomic fragment for HdEG66. (A)structure of HdEG66 cDNA. Open and closed boxes indicate trans-lational and untranslational...
  • 8
  • 511
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "COMMON TOPICS AND COHERENT SITUATIONS: INTERPRETING ELLIPSIS IN THE CONTEXT OF DISCOURSE INFERENCE" ppt

... and bi are similar (1) Po = -~Pl, ai and bi are similar (2) P0 = Pl, ai and bi are dissimilar for some i Po =Pl ;bl Eaior biCai PO = pl , ai bi and but for example ' in other words ... antecedent and elided clauses (Levin and Prince, 1982; Kehler, 1993b). In this section we review the relevant facts for two such forms of ellipsis, namely gapping and VP-ellipsis, and also ... causal meaning of and. 1 1This behavior is not limited to the conjunction and; a similar distinction holds between symmetric and asymmet- ric uses of or and but. See Kehler (1994) for further discus-...
  • 8
  • 511
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Combining Lexical Semantic Resources with Question & Answer Archives for Translation-Based Answer Finding" doc

... stepsperformed for all parallel datasets were tokenisa-tion and stop word removal.53.4 Comparison of Word- to -Word TranslationsTable 1 gives some examples of word- to -word translations obtained for ... senses, and hence dif-ferent glosses, it is possible to extract several glosspairs for one and the same lexeme and one and thesame pair of resources. It is therefore necessary toperform word ... stemming and lemmati-sation, since the answers do not contain the ques-tion terms “mosquito” (for question 2) and “form” (for question 3), but only their inflected forms“mosquitoes” and “formed”.6...
  • 9
  • 527
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "POS Disambiguation and Unknown Word Guessing with Decision Trees" pot

... The POS of an unknown word is guessed by traversing the decision tree for unknown words, which examines contextual features along with the word ending and capitalization and returns an open-class ... Disambiguator/Guesser is a 'forest' of decision trees, one tree for each ambiguity scheme present in M. Greek and one tree for unknown word guessing. When a word with two or more tags ... each feature 4. To summarize, the training material we prepared consists of: (a) a set of training examples for each ambiguity scheme and a set of training examples for unknown words 5, and...
  • 8
  • 326
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Identification of Word Translations from Unrelated English and German Corpora" pot

... that word A is two words ahead of another word B, a second vector for the case that word A is one word ahead of word B, a third vector for A directly following B, and a fourth vector for A ... coefficient, and the Dice coefficient (see also Jones & Fur- nas, 1987). For the computation of related terms and synonyms, Ruge (1995), Landauer and Dumais (1997), and Fung and McKeown ... alignment of sentences and words in translated texts. Many studies show that for nicely parallel corpora high accuracy rates of up to 99% can be achieved for both sentence and word alignment (Gale...
  • 8
  • 438
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Smoothing a Tera-word Language Model" doc

... achieves its best performance with a 4-grammodel and gives 8.23 bits on Brown.4.4 Dirichlet FormMacKay and Peto (1995) show that based on Dirich-let priors a reasonable form for a smoothed distribu-tion ... the first word, c is the last word, and b repre-sents zero or more words in between. One way toestimate Pr(c|ab) is to look at the number of times word c has followed the previous n − 1 words ab,Pr(c|ab) ... ≤ C(ab) and we need to use the former for proper normalization. N(ab∗) denotes the numberof distinct words following ab in the training data.Absolute discounting achieves its best performancewith...
  • 4
  • 425
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Discriminative Syntactic Word Order Model for Machine Translation" pdf

... formulated asthe task of ordering a target bag of words, given asource sentence and word alignments between tar-get and source words. In this work we also assumea source dependency tree and ... target word. POSs and POSt: POS tags on the source and targetsides. For Japanese, we have a set of 19 POS tags.’+’ means making conjunction of features and prev() means using the information ... lexicalweighting features to smooth the translation prob-abilities, word count feature, and treelet-pairs count feature. These models are combined as feature func-tions in a (log)linear model for predicting...
  • 8
  • 404
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Deriving an Ambiguous Word’s Part-of-Speech Distribution from Unannotated Text" doc

... distributional and morphological information (Clark, 2003; Freitag, 2004), or by clustering words and projecting them to POS vectors (Rapp, 2005). Whereas all these studies are based on global ... consider, and the columns are suitable middle words as we find them in a corpus. Most words in our example are syntactically unambigu-ous. Only link can be either a noun or a verb and therefore ... problem for words we introduce it for the neighbor pairs, i.e. ambiguities concerning neighbor pairs are not resolved. Consider, for example, the neighbor pair “then comes”, where the middle word...
  • 4
  • 389
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngchuyên đề điện xoay chiều theo dạngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhThơ nôm tứ tuyệt trào phúng hồ xuân hươngTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Kiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)Đổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ