0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "DISTRIBUTIONAL CLUSTERING OF ENGLISH WORDS" pptx

Báo cáo khoa học:

Báo cáo khoa học: "DISTRIBUTIONAL CLUSTERING OF ENGLISH WORDS" pptx

... simple tabulation of fre- quencies of certain words participating in certain configurations, for example of frequencies of pairs of a transitive main verb and the head noun of its direct object, ... as heads of direct objects of the verb "fire" in one year (1988) of Associated Press newswire. In this corpus, the chosen nouns appear as direct object heads of a total of 2147 distinct ... some indication of what aspects of distributional relationships may be discovered by clustering. However, we also need to evaluate clustering more rigorously as a basis for models of distributional...
  • 8
  • 310
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic clustering of collocation for detecting practical sense boundary" ppt

... z Fuzzy clustering (F1, F2)2 (Song, Cao and Bruza, 2003) Used clustering methods cover both the popularity and the variety of the algorithms – soft and hard clustering and graph clustering ... http://kibs.kaist.ac.kr Figure 2 The clustering example for 'chair' For evaluation, we try to compare clustering results and sense distribution of dictionary. In case of English, used dictionary ... the word senses numbered i of the word x. Ix is the word sense indexing function of x that gives an index to each sense of the word x. All contextual words xi±j of a central word x have...
  • 4
  • 425
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of English Topic Signatures Based on a Second Language" potx

... the English sense maps to a set of Chinese synonyms that realise the same concept. English ambiguous word wSense 1 of w Sense 2 of wChinese translation of sense 2Chinese translation of sense ... 2 1. {English topic signature 1}2. {English topic signature 2} 1. {English topic signature 1}2. {English topic signature 2} Figure 1:Process of automatic acquisition of topic signatures.For ... avoid the problem of shortage of aligned bilingual corpora. We build the topicsignatures by using Chinese -English and English- Chinese bilingual lexicons and a large amount of Chinese text, which...
  • 6
  • 471
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Oxford Dictionary of English: Current Developments" pdf

... some of the issues involved in deriving formal lexi-cal data from a natural-language dictionary.1 IntroductionThe goal of the project is to enhance the database of the Oxford Dictionary of English ... Dictionary of English: Current DevelopmentsJames McCrackenOxford University Pressmccrackj@oup.co.ukAbstractThis research note describes the early stages of a projectto enhance a monolingual English ... (a forthcomingnew edition of the 1998 New Oxford Dictionary of English) so that it contains not only the originaldictionary content but also additional sets of dataformalizing, codifying,...
  • 4
  • 584
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Topological Ordering of Function Words in Hierarchical Phrase-based Translation" pdf

... Proceedings of the 47th Annual Meeting of the ACL and the 4th IJCNLP of the AFNLP, pages 324–332,Suntec, Singapore, 2-7 August 2009.c2009...
  • 9
  • 471
  • 1
Báo cáo khoa học:

Báo cáo khoa học: "Empirical evaluations of animacy annotation" pptx

... ØvrelidDepartment of LinguisticsUniversity of PotsdamGermanylilja@ling.uni-potsdam.deAbstractThis article presents empirical evaluations of aspects of annotation for the linguis-tic property of animacy ... Proceedings of the 12th Conference of the European Chapter of the ACL, pages 630–638,Athens, Greece, 30 March – 3 April 2009.c2009 Association for Computational LinguisticsEmpirical evaluations of ... evaluation in the task of syntactic pars-ing. We show that a treatment of animacyas a lexical semantic property of nountypes enables generalization over distri-butional properties of these nouns...
  • 9
  • 382
  • 0
Báo cáo khoa học: The importance of being dimeric pptx

Báo cáo khoa học: The importance of being dimeric pptx

... feature,namely that of the surprisingly high number of pro-teins made up of two subunits (Fig. 1). This finding iseven stranger when one realizes that most of these pro-teins are made up of two identical ... of the structural stability of the coiled-coil region of the bZIP transcription factorGCN4. Biochemistry 32, 5491–5496.30 Reece LJ, Nichols R, Ogden RC & Howell EE (1991)Construction of ... Department of Experimental Medicine and Biochemical Sciences, University of Rome ‘Tor Vergata’, Rome, Italy2 INFM, University of Rome ‘Tor Vergata’, Rome, ItalyIntroductionThe world of globular...
  • 12
  • 425
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Generation of Story Highlights" pptx

... document.Without a great deal of linguistic analysis, itis possible to create summaries for a wide range of documents. Unfortunately, extracts are of- ten documents of low readability and text ... sentencecompression systems which falls short of attaininggrammaticality levels of human output. For ex-ample, Clarke and Lapata (2008) evaluate a range of state -of- the-art compression systems across ... docu-ment, P be the set of phrases, and Ps⊂ P be theset of phrases in each sentence s ∈ S . T is the set of words with the highest tf.idf scores, and Pt⊂ Pis the set of phrases containing...
  • 10
  • 406
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Phrase Clustering for Discriminative Learning" pptx

... great deal of knowledge engineering. 2 Distributed K-Means clustering K-Means clustering (MacQueen 1967) is one of the simplest and most well-known clustering algorithms. Given a set of elements ... We present a distributed version of a much simpler K-Means clustering that allows us to cluster tens of millions of elements. We demonstrate the advantages of phrase-based clusters over word-based ... able to cluster tens of thousands of words, but is not scalable enough to deal with tens of millions of phrases. Uszkoreit and Brants (2008) proposed a 1030distributed clustering algorithm...
  • 9
  • 355
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Effective Use of Function Words for Rule Generalization in Forest-Based Translation" pdf

... configuration of Joshua, with the ex-ception of the maximum number of items/rules, andthe value of k (of the k-best outputs) is set to be 200.4.2 ResultsTable 3 lists the statistics of the following ... span of v, which is theunion of corresponding spans of nodes v′thatshare an identical parse tree with v but are nei-ther antecedents nor descendants of v;• PA: the frontier set of FS, ... 62 72 82 92# of rules (M)# of tree nodes in ruleM&H-FMin-FC3-TC3-FFigure 3: Distributions of the number of tree nodes in thetranslation rule sets. Note that the curves of Min-F andC3-F...
  • 10
  • 361
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họccách trình bày báo cáo khoa họcbáo cáo khoa học toán họccách làm báo cáo khoa họctrình bày báo cáo khoa họcBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Báo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíChuong 2 nhận dạng rui roBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ