0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Learning with Unlabeled Data for Text Categorization Using Bootstrapping and Feature Projection Techniques" doc

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning with Unlabeled Data for Text Categorization Using Bootstrapping and Feature Projection Techniques" doc

... two approaches using unlabeled data in text categorization; one approach combines unlabeled data and labeled data, and the other approach uses the clustering technique for text categorization. ... labeled data. While labeled data are difficult to obtain, unlabeled data are readily available and plentiful. Therefore, this paper advocates using a bootstrapping framework and a feature projection ... projection technique with just unlabeled data for text categorization. The input to the bootstrapping process is a large amount of unlabeled data and a small amount of seed information to tell...
  • 8
  • 443
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word-Class Lattices for Definition and Hypernym Extraction" doc

... learning,definitions are used to create and enrich concepts with textual information (Gangemi et al., 2003), and extract taxonomic and non-taxonomic rela-tions (Snow et al., 2004; Navigli and Velardi,2006; Navigli, ... |sk|} and b ∈ {1, . . . , |sj|},Sa,bis a score of the matching between the a-thtoken of sk and the b-th token of sj, and M0,0,M0,b and Ma,0are initially set to 0 for all a and b.The ... Westerhout and Paola Monachesi. 2007. Extrac-tion of dutch definitory contexts for eLearning pur-poses. In Proceedings of CLIN.Eline Westerhout. 2009. Definition extraction using linguistic and structural...
  • 10
  • 567
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Sub-Word Units for Open Vocabulary Speech Recognition" doc

... words;the collection of σs form the lexicon. Each unitσ is present in a segmentation with some contextc = (φl, φr) of the form φlσφr. Features based onthe context and the unit itself parameterize ... corpus with segmentations and corresponding features. The notation m ih/1:1represents unit/label :feature- value. Overlapping contextfeatures capture rich segmentation regularities associated with ... language model training text is converted intophones using the dictionary (or a letter-to-soundmodel for OOVs), and a N-gram phone LM is es-timated on this data and pruned using a relative en-tropy...
  • 10
  • 441
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Trimming CFG Parse Trees for Sentence Compression Using Machine Learning Approaches" pptx

... proposed for sentence compression (Witbrock and Mittal, 1999;Jing and McKeown, 1999; Vandeghinste and Pan,2004), this paper focuses on Knight and Marcu’snoisy-channel model (Knight and Marcu, ... Y), is produced, and 851contextual information, x (∈ X ), is observed. Torepresent whether the event (x, y) satisfies a cer-tain feature, we introduce a feature function. A feature function ... changes. Turner and Charniak (Turner and Charniak, 2005) revised and improved Knight and Marcu’s algorithm; however, their algorithm alsouses only mother and daughter relations and hasthe same...
  • 8
  • 370
  • 0
Tài liệu Báo cáo khoa học: Is ATP binding responsible for initiating drug translocation by the multidrug transporter ABCG2? docx

Tài liệu Báo cáo khoa học: Is ATP binding responsible for initiating drug translocation by the multidrug transporter ABCG2? docx

... post-hydrolysis. Therefore, the dissoci-ation of phosphate and ⁄ or ADP is likely to be responsible for resettingof the transporter. The data indicate that, like ABCB1 and ABCC1,the ‘power stroke’ for translocation ... provided the most information. For two of theproteins, ABCB1 and ABCC1, it has been demon-strated that the binding of nucleotide imparts marked and essential conformational changes within TMDs.The ... concentration, and the data were fitted with the Langmuir binding isotherm using nonlinear least-squaresregression. (B) Photoaffinity labelling of purified ABCG2R482G(0.25 lg) was undertaken using a...
  • 9
  • 564
  • 0
Tài liệu Báo cáo khoa học: a-Conotoxins as tools for the elucidation of structure and function of neuronal nicotinic acetylcholine receptor subtypes doc

Tài liệu Báo cáo khoa học: a-Conotoxins as tools for the elucidation of structure and function of neuronal nicotinic acetylcholine receptor subtypes doc

... nullmutants [72]. Immunoprecipitation and ligand bindingstudies [21] confirmed that a4b2* (with possible inclusionof a5 subunits) and a6b2* (with possible inclusion of a4 and b3 subunits) are the main ... obtained with EpI. Thisa-conotoxin was originally characterized on rat intracardiacganglia neurons and bovine chromaffin cells and assumed tobe selective for a3b2anda3b4 interfaces and unable ... target for prey capture. However, the geneticinformation for ÔunderdevelopedÕ a-conotoxins targetingother nAChR subtypes might still be present in the snails and could supply novel ligands for...
  • 15
  • 757
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Collecting Highly Parallel Data for Paraphrase Evaluation" doc

... paraphrasers”, with the result that there areno readily available large corpora and no consistentstandards for what constitutes a high-quality para-phrase. In addition to the lack of standard datasets for ... our data collection framework for use on crowdsourcing platforms such as Amazon’sMechanical Turk. Crowdsourcing can allow inex-pensive and rapid data collection for various NLPtasks (Ambati and ... 4, with 4being the best. A paraphrase identical to the sourcesentence would receive a score of 4 for meaning and 1 for dissimilarity and overall. We randomly se-lected 200 source sentences and...
  • 11
  • 418
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Mobile Touchable Application for Online Topic Graph Extraction and Exploration of Web Content" ppt

... the infor-mation space, the current search engine paradigmdoes not provide enough assistance for these kindof searches. The user has to read through the docu-ments and then eventually reformulate ... actuallylabeled with the specific relation that exists betweenthe nodes.In this way the user can explore in an uniform wayboth new information nuggets and validated back-ground information nuggets ... perform text exploration from the Web (via button labeled “i–GNSSMM”) or via Wikipedia (touching button “i–MILREX”). The Figures 2, 3, 4, 5 show results for the “i–GNSSMM” mode, and Fig. 6 for...
  • 6
  • 458
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Outilex, a Linguistic Platform for Text Processing" pdf

... Outilex, a generalist linguis-tic platform for text processing. The plat-form includes several modules implement-ing the main operations for text processing and is designed to use large-coverage ... cov-erage for French and English, originating from theformer LADL1, will be distributed with the plat-form under LGPL-LR2license.The platform aims to be a generalist base for di-verse ... work on severalprojects with specific texts, dictionaries and gram-mars.1French Laboratory for Linguistics and Information Re-trieval2Lesser General Public License for Language Resources,http://infolingu.univ-mlv.fr/lgpllr.html.3http://www.dcs.shef.ac.uk/...
  • 4
  • 428
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning to Translate with Multiple Objectives" doc

... #of features, and metrics used. Our MT models are trained with standard phrase-based Moses software (Koehn and others, 2007), with IBM M4 alignments, 4gram SRILM,lexical ordering for PubMed and ... combining metrics using machine learning for better correlation with human judgments (Liu and Gildea, 2007; Albrecht and Hwa, 2007; Gimnez and M`arquez, 2008) and may give insights for setting {pk}. ... outperform a single-objective opti-mizer in its own metric. In Figure 2, single-objective PRO focusing on optimizing RIBESonly achieves 0.68, but PMO-PRO using bothBLEU and RIBES outperforms with...
  • 10
  • 624
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểtai lieu bao cao thuc tap khoa co khitai lieu bao cao thuc tap tai khoa duoc benh vienBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọPhát hiện xâm nhập dựa trên thuật toán k meansThơ nôm tứ tuyệt trào phúng hồ xuân hươngThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Kiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namMÔN TRUYỀN THÔNG MARKETING TÍCH HỢP