0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "A Framework of Feature Selection Methods for Text Categorization" potx

Báo cáo khoa học:

Báo cáo khoa học: "A Framework of Feature Selection Methods for Text Categorization" potx

... Proceedings of the 47th Annual Meeting of the ACL and the 4th IJCNLP of the AFNLP, pages 692–700,Suntec, Singapore, 2-7 August 2009.c2009 ACL and AFNLPA Framework of Feature Selection Methods for Text ... become one of the key tools for automatically handling and organizing text information. The problems of text classification normally involve the difficulty of extremely high dimensional feature ... across different tasks and numbers of selected features. 1 Introduction With the rapid growth of online information, text classification, the task of assigning text documents to one or more...
  • 9
  • 406
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Comparison of Document, Sentence, and Term Event Spaces" potx

... fre-quency of a term in the document space (x) and the average frequency of the same set of terms in the sentence space (y). For example, the average number of sentences for the set of terms ... increased avail-ability of full -text articles motivates us to under-stand the nature of language within the body of a document. For example, one study found that full -text articles require weighting ... coefficient of 1.6 for documents and 1.7 for sentences and terms. We conclude with an analysis of IDF stability with respect to random, journal, and section partitions of the 100,830 full-text...
  • 8
  • 354
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Suite of Shallow Processing Tools for Portuguese: LX-Suite" doc

... A Suite of Shallow Processing Tools for Portuguese:LX-SuiteAnt´onio BrancoDepartment of InformaticsUniversity of Lisbonahb@di.fc.ul.ptJo˜ao Ricardo SilvaDepartment of InformaticsUniversity ... rule could define, for example,1http://tagshare.di.fc.ul.pt2NLX—Natural Language and Speech Group, at the De-partment of Informatics of the University of Lisbon, Faculty of Sciences: http://nlx.di.fc.ul.ptthat ... This allowed the tool to reach a verygood performance, w ith values of 99.95% for re-call and 99.92% for precision.33 TokenizerTokenization is, for the most part, a simple task,as the whitespace...
  • 4
  • 270
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Part of Speech Estimation Method for Japanese Unknown Words using a Statistical Model of Morphology and Context" pptx

... estimating part of speech of unknown words in Asian languages. The cues used for estimating the part of speech of unknown words for Japanese in this paper are ba- sically the same for English, ... which is a set of word models trained for each part of speech (POS + Poisson + bigram). The second model is Equa- tion (13), which is a set of word models trained for Part of Speech Estimation ... combination of its surface form and part of speech. Two words are considered to be equal only if they have the same surface form and part of speech. 277 Table 1: Examples of word bigrams including...
  • 8
  • 397
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Study on Automatically Extracted Keywords in Text Categorization" doc

... acommon form. In addition, any of a number of feature selection metrics may be applied to furtherreduce the space, for example chi-square, or infor-mation gain (see for example Forman (2003) for ... motiva-tion for the title experiments was to compare theirperformance to that of the keywords. For all of these three feature inputs, we firstevaluated which one of the three possible feature values ... theunigrams have the best performance, al-though neither performs as well as head-lines only.1 IntroductionAutomatic text categorization is the task of assign-ing any of a set of predefined categories...
  • 8
  • 496
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Thematic segmentation of texts: two methods for two kinds of texts" pdf

... Thematic segmentation of texts: two methods for two kinds of texts Olivier FERRET LIMSI-CNRS B~t. 508 - BP 133 F-91403, Orsay Cedex, ... according to text characteristics. 3. Pre-processing of the texts As we are interested in the thematic dimension of the texts, they have to be represented by their significant features from ... from that point of view. So, we only hold for each text the lemmatized form of its nouns, verbs and adjectives. This has been done by combining existing tools. MtSeg from the Multext project...
  • 5
  • 363
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Framework for Customizable Generation of Hypertext Presentations" pdf

... Presenting information through text and hyper- text has become a major area of research and development. Complex systems must often deal with a rapidly growing amount of information. In this context, ... (producing the text string) and for- matting (determining the formatting marks to insert in the text string). Developing an appli- cation to present the information for a given domain is often a ... ferent type of specifications, each of which is optional except for the name of the exemplar: • Name: Specification of the name of the ex- emplar. • Parameters: Specification of the arguments...
  • 5
  • 419
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A THREE-VALUED FEATURE INTERPRETATION OF NEGATION STRUCTURE DESCRIPTIONS" ppt

... language for feature structures. In the present work, a framework in three-valued logic is suggested for defining the semantics of a feature structure description language, allowing for a more ... tion in a three-valued framework, for defining the seman- tics of feature structure descriptions including negation 3. This solution is a formalization of the notion of negation in Karttunen ... with a formula if the information in it contradicts the information in the formula. It is trivially incom- patible with the formula if the inconsistency is due to an excess of mformtstion...
  • 7
  • 216
  • 0
Tài liệu Báo cáo khoa học: A role of miR-27 in the regulation of adipogenesis ppt

Tài liệu Báo cáo khoa học: A role of miR-27 in the regulation of adipogenesis ppt

... adipocyteformation, without affecting myogenic differentiation. We also found thatexpression of miR-27 resulted in blockade of expression of PPARc andC ⁄ EBPa, the two master regulators of adipogenesis. ... 6 of differentiation (A). The amount of OilRed O was quantified after extraction with isopropanol. The data shown in (B) are mean value ± standard errors of the mean of an experi-ment performed ... role of miR-27 in the regulation of adipogenesisQun Lin1, Zhanguo Gao2, Rodolfo M. Alarcon1, Jianping Ye2and Zhong Yun11 Department of Therapeutic Radiology, Yale University School of...
  • 11
  • 848
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Framework for Syntactic Translation" docx

... the framework of one language. In con- sidering the translation of a certain German verb form into English, it is necessary to un- derstand the German verb form as part of a complex of features ... basis of the occurrences of certain text words that are diagnostic of the field. † This work was supported in part by the U. S. Army (Signal Corps), the U.S. Air Force ( Office of Scientific ... schematic form in Fig. 1. This framework has evolved after careful considera- tion of a number of factors. Foremost among these is the necessity of breaking down a prob- lem as complex as that of...
  • 7
  • 508
  • 1

Xem thêm

Từ khóa: báo cáo khoa họcbáo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọPhát hiện xâm nhập dựa trên thuật toán k meansTìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinChuong 2 nhận dạng rui roQuản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ