0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "DISTRIBUTIONAL CLUSTERING OF ENGLISH WORDS" pptx

Báo cáo khoa học:

Báo cáo khoa học: "DISTRIBUTIONAL CLUSTERING OF ENGLISH WORDS" pptx

... simple tabulation of fre- quencies of certain words participating in certain configurations, for example of frequencies of pairs of a transitive main verb and the head noun of its direct object, ... as heads of direct objects of the verb "fire" in one year (1988) of Associated Press newswire. In this corpus, the chosen nouns appear as direct object heads of a total of 2147 distinct ... some indication of what aspects of distributional relationships may be discovered by clustering. However, we also need to evaluate clustering more rigorously as a basis for models of distributional...
  • 8
  • 310
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Automatic clustering of collocation for detecting practical sense boundary" ppt

... z Fuzzy clustering (F1, F2)2 (Song, Cao and Bruza, 2003) Used clustering methods cover both the popularity and the variety of the algorithms – soft and hard clustering and graph clustering ... http://kibs.kaist.ac.kr Figure 2 The clustering example for 'chair' For evaluation, we try to compare clustering results and sense distribution of dictionary. In case of English, used dictionary ... the word senses numbered i of the word x. Ix is the word sense indexing function of x that gives an index to each sense of the word x. All contextual words xi±j of a central word x have...
  • 4
  • 425
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of English Topic Signatures Based on a Second Language" potx

... the English sense maps to a set of Chinese synonyms that realise the same concept. English ambiguous word wSense 1 of w Sense 2 of wChinese translation of sense 2Chinese translation of sense ... 2 1. {English topic signature 1}2. {English topic signature 2} 1. {English topic signature 1}2. {English topic signature 2} Figure 1:Process of automatic acquisition of topic signatures.For ... avoid the problem of shortage of aligned bilingual corpora. We build the topicsignatures by using Chinese -English and English- Chinese bilingual lexicons and a large amount of Chinese text, which...
  • 6
  • 471
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Oxford Dictionary of English: Current Developments" pdf

... some of the issues involved in deriving formal lexi-cal data from a natural-language dictionary.1 IntroductionThe goal of the project is to enhance the database of the Oxford Dictionary of English ... Dictionary of English: Current DevelopmentsJames McCrackenOxford University Pressmccrackj@oup.co.ukAbstractThis research note describes the early stages of a projectto enhance a monolingual English ... (a forthcomingnew edition of the 1998 New Oxford Dictionary of English) so that it contains not only the originaldictionary content but also additional sets of dataformalizing, codifying,...
  • 4
  • 584
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Topological Ordering of Function Words in Hierarchical Phrase-based Translation" pdf

... Proceedings of the 47th Annual Meeting of the ACL and the 4th IJCNLP of the AFNLP, pages 324–332,Suntec, Singapore, 2-7 August 2009.c2009...
  • 9
  • 471
  • 1
Báo cáo khoa học:

Báo cáo khoa học: "Empirical evaluations of animacy annotation" pptx

... ØvrelidDepartment of LinguisticsUniversity of PotsdamGermanylilja@ling.uni-potsdam.deAbstractThis article presents empirical evaluations of aspects of annotation for the linguis-tic property of animacy ... Proceedings of the 12th Conference of the European Chapter of the ACL, pages 630–638,Athens, Greece, 30 March – 3 April 2009.c2009 Association for Computational LinguisticsEmpirical evaluations of ... evaluation in the task of syntactic pars-ing. We show that a treatment of animacyas a lexical semantic property of nountypes enables generalization over distri-butional properties of these nouns...
  • 9
  • 382
  • 0
Báo cáo khoa học: The importance of being dimeric pptx

Báo cáo khoa học: The importance of being dimeric pptx

... feature,namely that of the surprisingly high number of pro-teins made up of two subunits (Fig. 1). This finding iseven stranger when one realizes that most of these pro-teins are made up of two identical ... of the structural stability of the coiled-coil region of the bZIP transcription factorGCN4. Biochemistry 32, 5491–5496.30 Reece LJ, Nichols R, Ogden RC & Howell EE (1991)Construction of ... Department of Experimental Medicine and Biochemical Sciences, University of Rome ‘Tor Vergata’, Rome, Italy2 INFM, University of Rome ‘Tor Vergata’, Rome, ItalyIntroductionThe world of globular...
  • 12
  • 425
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Generation of Story Highlights" pptx

... document.Without a great deal of linguistic analysis, itis possible to create summaries for a wide range of documents. Unfortunately, extracts are of- ten documents of low readability and text ... sentencecompression systems which falls short of attaininggrammaticality levels of human output. For ex-ample, Clarke and Lapata (2008) evaluate a range of state -of- the-art compression systems across ... docu-ment, P be the set of phrases, and Ps⊂ P be theset of phrases in each sentence s ∈ S . T is the set of words with the highest tf.idf scores, and Pt⊂ Pis the set of phrases containing...
  • 10
  • 406
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Phrase Clustering for Discriminative Learning" pptx

... great deal of knowledge engineering. 2 Distributed K-Means clustering K-Means clustering (MacQueen 1967) is one of the simplest and most well-known clustering algorithms. Given a set of elements ... We present a distributed version of a much simpler K-Means clustering that allows us to cluster tens of millions of elements. We demonstrate the advantages of phrase-based clusters over word-based ... able to cluster tens of thousands of words, but is not scalable enough to deal with tens of millions of phrases. Uszkoreit and Brants (2008) proposed a 1030distributed clustering algorithm...
  • 9
  • 355
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Effective Use of Function Words for Rule Generalization in Forest-Based Translation" pdf

... configuration of Joshua, with the ex-ception of the maximum number of items/rules, andthe value of k (of the k-best outputs) is set to be 200.4.2 ResultsTable 3 lists the statistics of the following ... span of v, which is theunion of corresponding spans of nodes v′thatshare an identical parse tree with v but are nei-ther antecedents nor descendants of v;• PA: the frontier set of FS, ... 62 72 82 92# of rules (M)# of tree nodes in ruleM&H-FMin-FC3-TC3-FFigure 3: Distributions of the number of tree nodes in thetranslation rule sets. Note that the curves of Min-F andC3-F...
  • 10
  • 361
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họccách trình bày báo cáo khoa họcbáo cáo khoa học toán họccách làm báo cáo khoa họctrình bày báo cáo khoa họcBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngchuyên đề điện xoay chiều theo dạngMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Nghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ