0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Word Clustering and Word Selection based Feature Reduction for MaxEnt based Hindi NER" ppt

Báo cáo khoa học:

Báo cáo khoa học: "Word Clustering and Word Selection based Feature Reduction for MaxEnt based Hindi NER" ppt

... effectiveness of word clustering and selection as feature reduction tech-niques for MaxEnt based NER. For clustering weuse a number of word similarities like cosine sim-ilarity among words and co-occurrence, ... Ohio, USA, June 2008.c2008 Association for Computational Linguistics Word Clustering and Word Selection based Feature Reduction for MaxEnt based Hindi NERSujan Kumar SahaIndian Institute ... ofvalues for a feature is large. To overcomethis we proposed two techniques for feature reduction based on word clustering and se-lection. A number of word similarity mea-sures are proposed for clustering...
  • 8
  • 444
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Syntactic Features and Word Similarity for Supervised Metonymy Resolution" pot

... (Lakoff and Johnson, 1980; Fass, 1997;Stern, 1931)). In a place -for- people pattern,a place stands for any persons/organisations associ-ated with it, e.g., for sports teams in (2), (3), and (4), and ... Syntactic Features and Word Similarity for Supervised MetonymyResolutionMalvina NissimICCS, School of InformaticsUniversity of Edinburghmnissim@inf.ed.ac.ukKatja MarkertICCS, School of InformaticsUniversity ... occurred there (e.g., us-ing the word Vietnam for the Vietnam war). In aplace -for- product pattern a place stands for a product manufactured there (e.g., the word Bor-deaux referring to the...
  • 8
  • 603
  • 0
Tài liệu Báo cáo khoa học: Purification and cDNA cloning of a cellulase from abalone Haliotis discus hannai ppt

Tài liệu Báo cáo khoa học: Purification and cDNA cloning of a cellulase from abalone Haliotis discus hannai ppt

... dGTP and dCTP, 1.2 mMMgCl2,2pmolÆmL)1primers, 1 ngÆmL)1template DNA, and 0.05 unitsÆmL)1TaKaRa Taq DNA polymerase. Asuccessive reaction at 95 °C for 30 s, 45 °Cfor60sand72 °C for 90 ... acids of the HdEG66 was amplified.Finally, 5¢ -and3 ¢-RACE PCRs were performed usingprimers shown in Table 2, and Hd5RACE-DNA and Hd3RACE-DNA for -and3 ¢-terminal regions wereamplified, respectively. ... domain.Cellulose-binding ability and other biochemical functionsFig. 4. Structures of cDNA and genomic fragment for HdEG66. (A)structure of HdEG66 cDNA. Open and closed boxes indicate trans-lational and untranslational...
  • 8
  • 511
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "COMMON TOPICS AND COHERENT SITUATIONS: INTERPRETING ELLIPSIS IN THE CONTEXT OF DISCOURSE INFERENCE" ppt

... and bi are similar (1) Po = -~Pl, ai and bi are similar (2) P0 = Pl, ai and bi are dissimilar for some i Po =Pl ;bl Eaior biCai PO = pl , ai bi and but for example ' in other words ... antecedent and elided clauses (Levin and Prince, 1982; Kehler, 1993b). In this section we review the relevant facts for two such forms of ellipsis, namely gapping and VP-ellipsis, and also ... causal meaning of and. 1 1This behavior is not limited to the conjunction and; a similar distinction holds between symmetric and asymmet- ric uses of or and but. See Kehler (1994) for further discus-...
  • 8
  • 511
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Combining Lexical Semantic Resources with Question & Answer Archives for Translation-Based Answer Finding" doc

... stepsperformed for all parallel datasets were tokenisa-tion and stop word removal.53.4 Comparison of Word- to -Word TranslationsTable 1 gives some examples of word- to -word translations obtained for ... senses, and hence dif-ferent glosses, it is possible to extract several glosspairs for one and the same lexeme and one and thesame pair of resources. It is therefore necessary toperform word ... stemming and lemmati-sation, since the answers do not contain the ques-tion terms “mosquito” (for question 2) and “form” (for question 3), but only their inflected forms“mosquitoes” and “formed”.6...
  • 9
  • 527
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "POS Disambiguation and Unknown Word Guessing with Decision Trees" pot

... The POS of an unknown word is guessed by traversing the decision tree for unknown words, which examines contextual features along with the word ending and capitalization and returns an open-class ... Disambiguator/Guesser is a 'forest' of decision trees, one tree for each ambiguity scheme present in M. Greek and one tree for unknown word guessing. When a word with two or more tags ... each feature 4. To summarize, the training material we prepared consists of: (a) a set of training examples for each ambiguity scheme and a set of training examples for unknown words 5, and...
  • 8
  • 326
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Identification of Word Translations from Unrelated English and German Corpora" pot

... that word A is two words ahead of another word B, a second vector for the case that word A is one word ahead of word B, a third vector for A directly following B, and a fourth vector for A ... coefficient, and the Dice coefficient (see also Jones & Fur- nas, 1987). For the computation of related terms and synonyms, Ruge (1995), Landauer and Dumais (1997), and Fung and McKeown ... alignment of sentences and words in translated texts. Many studies show that for nicely parallel corpora high accuracy rates of up to 99% can be achieved for both sentence and word alignment (Gale...
  • 8
  • 438
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Smoothing a Tera-word Language Model" doc

... achieves its best performance with a 4-grammodel and gives 8.23 bits on Brown.4.4 Dirichlet FormMacKay and Peto (1995) show that based on Dirich-let priors a reasonable form for a smoothed distribu-tion ... the first word, c is the last word, and b repre-sents zero or more words in between. One way toestimate Pr(c|ab) is to look at the number of times word c has followed the previous n − 1 words ab,Pr(c|ab) ... ≤ C(ab) and we need to use the former for proper normalization. N(ab∗) denotes the numberof distinct words following ab in the training data.Absolute discounting achieves its best performancewith...
  • 4
  • 425
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Discriminative Syntactic Word Order Model for Machine Translation" pdf

... formulated asthe task of ordering a target bag of words, given asource sentence and word alignments between tar-get and source words. In this work we also assumea source dependency tree and ... target word. POSs and POSt: POS tags on the source and targetsides. For Japanese, we have a set of 19 POS tags.’+’ means making conjunction of features and prev() means using the information ... lexicalweighting features to smooth the translation prob-abilities, word count feature, and treelet-pairs count feature. These models are combined as feature func-tions in a (log)linear model for predicting...
  • 8
  • 404
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Deriving an Ambiguous Word’s Part-of-Speech Distribution from Unannotated Text" doc

... distributional and morphological information (Clark, 2003; Freitag, 2004), or by clustering words and projecting them to POS vectors (Rapp, 2005). Whereas all these studies are based on global ... consider, and the columns are suitable middle words as we find them in a corpus. Most words in our example are syntactically unambigu-ous. Only link can be either a noun or a verb and therefore ... problem for words we introduce it for the neighbor pairs, i.e. ambiguities concerning neighbor pairs are not resolved. Consider, for example, the neighbor pair “then comes”, where the middle word...
  • 4
  • 389
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vật