0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Bayesian Word Sense Induction" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bayesian Word Sense Induction" pdf

... Introduction Sense induction is the task of discovering automat-ically all possible senses of an ambiguous word. Itis related to, but distinct from, word sense disam-biguation (WSD) where the senses ... the generated word. Then, the word sense is selected based on the word, neighbor, and topic.Boyd-Graber et al. (2007) extend the topic mod-eling framework to include WordNet senses as alatent ... sam-pling a sense from the sense distribution, thenchoosing a word from the sense- context distribu-tion. P(si= j) denotes the probability that the jth sense was sampled for the ith word token...
  • 9
  • 378
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Direct Word Sense Matching for Lexical Substitution" ppt

... all WordNet synonyms of the target word, underall its possible senses, and picking randomly oneof the synonyms as the source word. For example,the word ‘disc’ is one of the words in the Sense- val ... were excluded sincetheir sense annotation in Senseval-3 is not basedon WordNet senses. The Senseval dataset includesa set of example occurrences in context for each word, split to training and ... of the 25 words inthe Senseval sample as a target word for the sense matching task. Next, we had to pick for each target word a corresponding synonym to play the role ofthe source word. This...
  • 8
  • 362
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "SenseLearner: Word Sense Disambiguation for All Words in Unrestricted Text" doc

... describes SENSELEARNER – aminimally supervised word sense disam-biguation system that attempts to disam-biguate all content words in a text usingWordNet senses. We evaluate the accu-racy of SENSELEARNER ... modellearning Sense taggedtextsemantic modelsSenseLearnerdefinitions Word sense disambiguationTrained semanticmodels Sense taggedtextsFigure 1: Semantic model learning in SENSE- LEARNERtagged ... polyse-mous word within a given context. Applications suchas machine translation, knowledge acquisition, com-mon sense reasoning, and others, require knowledgeabout word meanings, and word sense...
  • 4
  • 399
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bayesian Symbol-Refined Tree Substitution Grammars for Syntactic Parsing" pptx

... grammars with only unary and binaryproductions. We replace lexical words with count≤ 5 in the training data with one of 50 unknownwords using lexical features, following (Petrov et al.,2006). ... of(a). The refinement annotation is hyphenated with a nonterminal symbol.morphology analysis, word segmentation (Johnsonand Goldwater, 2009), and dependency grammar in-duction (Cohen et al.,...
  • 9
  • 411
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Word Representations via Global Context and Multiple Word Prototypes" pdf

... multi-prototype VSM where word sense discrimination is first applied by clus-tering contexts, and then prototypes are built usingthe contexts of the sense- labeled words. However, inorder to ... for clustering word instances, which is used in the multi-prototype ver-sion of our model that accounts for words with mul-tiple senses.We evaluate our new model on the standardWordSim-353 (Finkelstein ... context and one represen-tation per word. This is problematic becausewords are often polysemous and global con-text can also provide useful information forlearning word meanings. We present a newneural...
  • 10
  • 494
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervized Word Segmentation: the case for Mandarin Chinese" doc

... densitydistributions for words vs. non-words, we observedthat the VBE at both boundaries were the most dis-criminative value. Therefore, we decided to take inaccount the VBE only at the word- candidate ... corresponding to thesequence of words w0w1. . . wm, and len(wi) is thelength of a word wiused here to be able to com-pare segmentations resulting in a different numberof words. This best segmentation ... hypothesis and consider com-plex morphological word structures, we expect alarge VBE at the boundaries of interesting units andmore unstable variations inside “words.” This expec-tation was confirmed...
  • 5
  • 467
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Enhanced word decomposition by calibrating the decision threshold of probabilistic models and using a model ensemble" pdf

... relative word positions andfound out that the calibrated PROMODES-H pre-dicted non-boundaries better for initial word posi-tions whereas the calibrated PROMODES for mid-and final word positions. ... term word morphology. It is worthwhilestudying this internal structure since a languagedescription using its morphological formation ismore compact and complete than listing all pos-sible words. ... morphological analy-sis: word decomposition into morphemes, build-ing morpheme dictionaries, defining morphosyn-tactical rules which state how morphemes canbe combined to valid words and defining mor-phophonological...
  • 9
  • 557
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word-Class Lattices for Definition and Hypernym Extraction" doc

... frequent words F to generalizewords to word classes”. We define a word classas either a word itself or its part of speech. Givena sentence s = w1, w2, . . . , w|s|, where wiis thei-th word ... order of symbols like in word/ phoneme lat-tices, and nodes are clusters of salient words ag-gregated using synonymy, similarity, or subtreesof a thesaurus. However, salient word selectionand aggregation ... where wiis thei-th word of s, we generalize its words wito word classes ωias follows:ωi=wiif wi∈ FP OS(wi) otherwisethat is, a word wiis left unchanged if it occursfrequently...
  • 10
  • 567
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word Vectors for Sentiment Analysis" ppt

... com-pare our model’s word representations with severalbag of words weighting methods, and alternative ap-proaches to word vector induction.4.1 Word Representation LearningWe induce word representations ... simi-larity of w with all other words w′, we can find thewords deemed most similar by the model.Table 1 shows the most similar words to givenquery words using our model’s word representationsas ... continu-ous similarities between words as distance or anglebetween word vectors in a high-dimensional space.The general approach has proven useful in taskssuch as word sense disambiguation, named...
  • 9
  • 590
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Joint Word Segmentation and POS Tagging using a Single Perceptron" docx

... last word can be a complete word ora partial word. A problem arises in whether to givePOS tags to incomplete words. If partial words aregiven POS tags, it is likely that some partial wordsare ... words12the ending characters c1and c2of two con-secutive words13a word of length l with previous word w14a word of length l with next word wTable 1: Feature templates for the baseline segmentor2 ... Chinese, are shown in Table 2.The word segmentation features are extractedfrom word bigrams, capturing word, word lengthand character information in the context. The word length features are normalized,...
  • 9
  • 576
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa học bản chất của khủng hoảng kinh tế thế giới pdftài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học công nghệ phục vụ nông nghiệp và phát triển nông thôn các tỉnh phía bắc 2006 2007 tài liệu phục vụ hội nghị10 trần thị luyến và cộng sự hoàn thiện quy trình sản xuất chitin chitosan và chế biến một số sản phẩm công nghiệp từ phế liệu vỏ tôm cua báo cáo khoa học đề tài cấp bộ nha trang 2000nghiên cứu các tài liệu báo cáo của các nhà nghiên cứu đi trước về các lập luận khoa học về trồng và phòng bệnh dịch cho hoa hồng cách quản lý sử dụng phân bón đúng cách vvbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểtai lieu bao cao thuc tap khoa co khitai lieu bao cao thuc tap tai khoa duoc benh vientai lieu bao cao thuc tap y si da khoabáo cáo khoa học ảnh hưởng của tuổi thu hoạch đến năng suất và chất lượng thức ăn của cỏ voi pennisetum purpureum cỏ ghi nê panicum maximum trồng tại đan phượng hà tây pptxtai lieu bao cao thuc tap tim hieu nhan cach mot hoc sinhbáo cáo khoa học về nghệ thuật trong lieu trai chi ditai lieu bao cao thuc tap tai khoa duoc benh vien hop lucBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíSở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXChuong 2 nhận dạng rui roKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015HIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀM