0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Multilingual Term Extraction from Domain-specific Corpora Using Morphological Structure" pdf

Báo cáo khoa học:

Báo cáo khoa học: "Chinese Term Extraction Using Different Types of Relevance" potx

... For comparison to previous work, all term candidates are extracted from the same domain corpora using the delimiter based algorithm TCE_DI (Term Candidate Extraction – Delimiter Identification) ... it is likely a term . Limited distribution information of term candi-dates in different documents often limits the abil-ity of such algorithms to distinguish terms from non-terms. There are ... candidate terms may be useful to identify domain specific terms based on two assumptions. First, terms are more likely to occur with other terms in order to express domain information. Second, term...
  • 4
  • 323
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Topical Keyphrase Extraction from Twitter" potx

... content withina certain period and/or from a certain group of peo-ple such as people in the same region. Existing workon keyphrase extraction identifies keyphrases from either individual documents ... proposed methods are very effective in topicalkeyphrase extraction from Twitter. Interestingly, ourproposed keyphrase ranking method can incorporateusers’ interests by modeling the retweet behavior.We ... 2004) to extract key-words from tweets to tag users. Topic discovery from Twitter is also related to our work (Ramage etal., 2010), but we further extract keyphrases from each topic for summarizing...
  • 10
  • 333
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Extracting Comparative Sentences from Korean Text Documents Using Comparative Lexical Patterns and Machine Learning Techniques" doc

... non-comparative sen-tences from comparative sentence candidates with a CKL2 keyword, we employ machine learning techniques (MEM and Naïve Bayes). For feature extraction from each comparative-sentence ... eliminate non-comparative sentences from the candidates. As a result, we achieved signifi-cant performance, an F1-score of 88.54%, in our experiments using various web documents. 1 Introduction ... candidates by using those keywords. 3.1 Comparative keyword First of all, we classify comparative sentences into six types and then we extract single compar-ative keywords from each type...
  • 4
  • 536
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "INSIDE-OUTSIDE REESTIMATION FROM PARTIALLY BRACKETED CORPORA" ppt

... ( (from SF0) (to San Francisco))))).) GR (Tell ((me (((about the) public) transportation)) ( (from SF0) ((to San) (Francisco .))))) GB ((Tell (me (about (((the public) transportation) ( (from ... of local maxima grows with the number of nonterminals. Finally, while SCFGs do provide a hierarchical model of the language, that structure is undetermined by raw text and only by chance will ... to the original one. Using a partially parsed corpus has several advan- tages. First, the the result grammars yield con- stituent boundaries that cannot be inferred from raw text. In addition,...
  • 8
  • 285
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Mining Entity Types from Query Logs via User Intent Modeling" pdf

... inferenceprocedures using signals from query context,click, entity, entity type, and user intent.563• We propose an efficient learning technique anda robust implementation of our models, using real-world ... place of(or in addition to) text corpora for learning seman-tic classes. Query logs can contain billions of en-tries, they provide an independent signal from text corpora, their timestamps allow ... suitable for applications where a single sensemust be determined.4.5 Model SettingsWe trained all models in Figure 1 using the trainingdata from Section 4.2 over 100 EM iterations, withtwo folds...
  • 9
  • 290
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Prototyping virtual instructors from human-human corpora" pdf

... ranging from trainers in simulatedworlds to non player characters for virtualgames. In this paper we present a novelalgorithm for rapidly prototyping virtual in-structors from human-human corpora ... 2011.c2011 Association for Computational LinguisticsPrototyping virtual instructors from human-human corpora Luciana BenottiPLN Group, FAMAFNational University of C´ordobaC´ordoba, ... withoutmanual annotation. Automatically prototyp-ing full-fledged dialogue systems from cor-pora is far from being a reality nowadays. Ouralgorithm is restricted in that only the virtualinstructor...
  • 6
  • 220
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Bootstrapping Approach to Named Entity Classification Using Successive Learners" pdf

... explored using this method. There is considerable research on NE tagging using different techniques. These include systems based on handcrafted rules (Krupka 1998), as well as systems using ... approach from the co-training-based NE bootstrapping are also discussed. 1 Introduction Named Entity (NE) tagging is a fundamental task for natural language processing and information extraction. ... user-defined named entities. That is the motivation for using unsupervised or weakly-supervised machine learning that only requires a raw corpus from a given domain for this NE research. (Cucchiarelli...
  • 8
  • 489
  • 0
Báo cáo khoa học: Human recombinant prolidase from eukaryotic and prokaryotic sources Expression, purification, characterization and long-term stability studies pptx

Báo cáo khoa học: Human recombinant prolidase from eukaryotic and prokaryotic sources Expression, purification, characterization and long-term stability studies pptx

... digestionperformed using the same conditions.N-Terminal sequenceThe sequence of the N-terminal 25 amino acids of therecombinant prolidase purified from E. coli wasunequivocally determined by automated ... properties mainly indistinguishable from those of the native prolidase from fibroblast lysate. The protein yieldwas higher from the prokaryotic source, and a detailed long -term stabilitystudy of this ... lysate obtained from a patient with PD and thus lack-ing endogenous prolidase activity (1 : 2.5). Prolidase activitywas determined as described above from day 0 to day 6.Protein determinationProtein...
  • 13
  • 227
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Learning Common Grammar from Multilingual Corpus" potx

... rewrite a non-terminal as a terminal A → w, and binary pro-ductions rewrite a nonterminal as two nontermi-nals A → BC, where A, B, C ∈ K and w ∈ Wl.The rule probabilities for each nonterminalA ... where K is aset of nonterminals, Wlis a set of terminals, andΦlis a set of rule probabilities. Note that a set ofnonterminals K is shared among languages, buta set of terminals Wland rule ... languages from non-parallelmultilingual corpora in an unsupervisedfashion. For this purpose, we assume agenerative model for multilingual corpora, where each sentence is generated from alanguage...
  • 5
  • 326
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Accurate Collocation Extraction Using a Multilingual Parser" docx

... collocational information from corpora by using a syntactic parser that supports several lan-guages. After describing the underlying method-ology (section 2), we report several extraction re-sults ... recursively.Generally speaking, a collocation extraction canbe seen as a two-stage process:I. in stage one, collocation candidates are iden-tified from the text corpora, based on criteriawhich are ... languages, and involved the following corpora: for English and French, a subpart or theHansard Corpus of proceedings from the CanadianParliament; for Italian, documents from the SwissParliament; and...
  • 8
  • 261
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họccách trình bày báo cáo khoa họcbáo cáo khoa học toán họccách làm báo cáo khoa họctrình bày báo cáo khoa họcBáo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Thơ nôm tứ tuyệt trào phúng hồ xuân hươngThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015Đổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ