0

text categorization using bootstrapping

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning with Unlabeled Data for Text Categorization Using Bootstrapping and Feature Projection Techniques" doc

Báo cáo khoa học

... preprocessing is a set of context vectors that are represented as content words of each context. Learning with Unlabeled Data for Text Categorization Using Bootstrapping and Feature Projection ... our method is used in a text categorization task, building text categorization systems will become significantly faster and less expensive. 1 Introduction Text categorization is the task ... words tend to appear in similar contexts, we can compute the similarity by using contextual information. Words and contexts play complementary roles. Contexts are similar to the extent that...
  • 8
  • 443
  • 0
Automatic text extraction using DWT and Neural Network

Automatic text extraction using DWT and Neural Network

Kỹ thuật lập trình

... video database. However, text extraction presents a number of problems because the properties of text may vary, as well as the text sizes and the text fonts. Furthermore, texts may appear in a ... horizontal edges to obtain candidate text regions. Real Text regions are then identified using the support vector machine. Text regions usually have special texture features because they consist ... or compressed images. Text extraction from uncompressed image can be classified as either component-based or texture-based. For component-based text extraction methods, text regions are detected...
  • 5
  • 507
  • 1
Tài liệu Word Segmentation for Vietnamese Text Categorization: An online corpus approach pptx

Tài liệu Word Segmentation for Vietnamese Text Categorization: An online corpus approach pptx

Cao đẳng - Đại học

... make a preliminary text categorization experiment to examine further our approach. We only use MI3 formula in word segmentation step for the next experiment. B. Text Categorization Experiment ... approaches performing text categorization task. Nevertheless, the best performance approach for English may not be the best one for Vietnamese. To find the most appropriate text categorization approach ... Approaches to Text Categorization. Journal of Information Retrieval, Vol 1, No. 1/2, pp 67—88. [17] Yiming Yang, C.G. Chute. 1994. An example-based mapping method for text categorization...
  • 6
  • 741
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Identifying Text Polarity Using Random Walks" pptx

Báo cáo khoa học

... (2005; 2006) use a textual representation ofwords by collating all the glosses of the word asfound in some dictionary. Then, a binary text clas-sifier is trained using the textual representation ... Subjectivity analysis is the taskof identifying text that present opinions as op-posed to objective text that present factual in-formation (Wiebe, 2000). Text could be eitherwords, phrases, sentences, ... identified without consider-ing their context (Wiebe, 2000; Hatzivassiloglouand Wiebe, 2000; Banea et al., 2008). In the sec-ond category, the context of subjective text is used(Riloff and Wiebe, 2003;...
  • 9
  • 450
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An ERP-based Brain-Computer Interface for text entry using Rapid Serial Visual Presentation and Language Modeling" ppt

Báo cáo khoa học

... interfaces (BCI). Thisparadigm is widely used to build letter-by-letter text input systems using BCI. Neverthe-less using a BCI-typewriter depending only onEEG responses will not be sufficiently ... 2011.c2011 Association for Computational LinguisticsAn ERP-based Brain-Computer Interface for text entry using Rapid Serial Visual Presentation and Language ModelingK.E. Hild◦,U. Orhan†,D. ... next letters to be typed be-come highly predictable in certain contexts, partic-ularly word-internally. In applications where text generation/typing speed is very slow, the impactof language...
  • 6
  • 551
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Extracting Comparative Sentences from Korean Text Documents Using Comparative Lexical Patterns and Machine Learning Techniques" doc

Báo cáo khoa học

... In this section, we define comparative keywords and extract comparative-sentence candidates by using those keywords. 3.1 Comparative keyword First of all, we classify comparative sentences ... 153–156,Suntec, Singapore, 4 August 2009.c2009 ACL and AFNLPExtracting Comparative Sentences from Korean Text Documents Us-ing Comparative Lexical Patterns and Machine Learning Techniques Seon Yang ... Abstract This paper proposes how to automatically identify Korean comparative sentences from text documents. This paper first investigates many comparative sentences referring to pre-vious...
  • 4
  • 536
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Fragments and Text Categorization" pptx

Báo cáo khoa học

... of text categoriza-tion. For the Na¨ıve Bayes classifier this increase issignificant.1 MotivationIn the process of automatic classifying documentsinto several predefined classes – text categorization (Sebastiani, ... which can cause con-fusion. However, these statements are yet to be ver-ified.Fragments and Text Categorization Jan Blaˇt´ak and Eva Mr´akov´a and Luboˇs Popel´ınsk´yKnowledge ... – text documents are usually seenas sets or bags of all the words that have appearedin a document, maybe after removing words in astop-list. In this paper we describe a novel approachto text...
  • 4
  • 360
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Study on Automatically Extracted Keywords in Text Categorization" doc

Báo cáo khoa học

... bestate-of-the-art.3 Text Categorization ExperimentsThis section describes in detail the four experi-mental settings for the text categorization exper-iments.3.1 CorpusFor the text categorization ... improve automatic text categorization. We investigate what impact keywords have on thetask by predicting text categories on the basis ofkeywords only, and by combining full -text repre-sentations ... improve text categorization. Insummary we show that a higher perfor-mance — as measured by micro-averagedF-measure on a standard text categoriza-tion collection — is achieved when thefull-text...
  • 8
  • 496
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Comparison and Semi-Quantitative Analysis of Words and Character-Bigrams as Features in Chinese Text Categorization" potx

Báo cáo khoa học

... 2000). Few similar comparative studies have been re-ported for Text Categorization (Li et al., 2003) so far in literature. Text categorization and Information Retrieval are tasks that sometimes ... Features to Improve Text Categorization Effectiveness, Journal of Intelligent Systems, Spe-cial Issue. Dejun Xue, Maosong Sun. 2003b. A Study on Feature Weighting in Chinese Text Categorization, ... acts as a pre-requisite step in most text information proc-essing tasks such as Information Retrieval (Baeza-Yates and Ribeiro-Neto, 1999) and Text Categorization (Sebastiani, 2002). It is...
  • 8
  • 492
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Exploiting Comparable Corpora and Bilingual Dictionaries for Cross-Language Text Categorization" potx

Báo cáo khoa học

... Strapparava. 2005. Cross language text categorization by acquiring multilingual domainmodels from comparable corpora. In Proc. of theACL Workshop on Building and Using Parallel Texts(in conjunction of ... solu-tion for the Cross-Language Text Categorization task. In particular, when bilingual dictionar-ies/repositories are available, the performance ofthe categorization gets close to that of ... for the other terms inthe lexicons. We evaluate the performance of thecross-lingual text categorization, using both theBoW Kernel and the Multilingual Domain Kernel,observing that also in...
  • 8
  • 361
  • 0

Xem thêm

Tìm thêm: xác định các mục tiêu của chương trình xác định các nguyên tắc biên soạn khảo sát chương trình đào tạo của các đơn vị đào tạo tại nhật bản khảo sát chương trình đào tạo gắn với các giáo trình cụ thể xác định thời lượng học về mặt lí thuyết và thực tế tiến hành xây dựng chương trình đào tạo dành cho đối tượng không chuyên ngữ tại việt nam điều tra đối với đối tượng giảng viên và đối tượng quản lí điều tra với đối tượng sinh viên học tiếng nhật không chuyên ngữ1 khảo sát thực tế giảng dạy tiếng nhật không chuyên ngữ tại việt nam khảo sát các chương trình đào tạo theo những bộ giáo trình tiêu biểu xác định mức độ đáp ứng về văn hoá và chuyên môn trong ct các đặc tính của động cơ điện không đồng bộ đặc tuyến tốc độ rôto n fi p2 động cơ điện không đồng bộ một pha sự cần thiết phải đầu tư xây dựng nhà máy thông tin liên lạc và các dịch vụ phần 3 giới thiệu nguyên liệu từ bảng 3 1 ta thấy ngoài hai thành phần chủ yếu và chiếm tỷ lệ cao nhất là tinh bột và cacbonhydrat trong hạt gạo tẻ còn chứa đường cellulose hemicellulose chỉ tiêu chất lượng theo chất lượng phẩm chất sản phẩm khô từ gạo của bộ y tế năm 2008 chỉ tiêu chất lượng 9 tr 25