0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Learning Word Senses With Feature Selection and Order Identification Capabilities" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word Senses With Feature Selection and Order Identification Capabilities" pdf

... Learning Word Senses With Feature Selection and Order Identification CapabilitiesZheng-Yu Niu, Dong-Hong JiInstitute for Infocomm ... ofsecond order context vectors: to select better feature words in contexts to construct better second order context vectors enabling better feature selection. Since the sense associated with a word s ... counting second order co-occurrencewas 50 words.3.2 Evaluation method for feature selection For evaluation of feature selection, we used mutualinformation between feature subset and class labelset...
  • 8
  • 463
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Chinese Word Segmentation without Using Lexicon and Hand-crafted Training Data" pdf

... Chinese Word Segmentation without Using Lexicon and Hand-crafted Training Data Sun Maosong, Shen Dayang*, Benjamin K Tsou** State Key Laboratory of Intelligent Technology and Systems, ... Chinese word segmentation developed so far, both statistical and rule-based, exploited two kinds of important resources, i.e., lexicon and hand-crafted linguistic resources(manually segmented and ... 0 then y tends to be bound with z rather than with x if p(ylx)> p(zly), or tsx, (y) < 0 then y tends to be bound with x rather than with z A distinct feature of ts is that it is...
  • 7
  • 396
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word-Class Lattices for Definition and Hypernym Extraction" doc

... of salient words ag-gregated using synonymy, similarity, or subtreesof a thesaurus. However, salient word selection and aggregation is non-obvious and furthermoreit falls into word sense disambiguation, ... de-fined with TARGET, thus this frequent token isalso included in F .We use the set of frequent words F to generalizewords to word classes”. We define a word classas either a word itself ... skof sk and sjof sjas fol-lows:Sa,b=1 if ωka= ωjb0 otherwisewhere ωka and ωjbare the a-th and b-th word classesof sk and sj, respectively. In other words, thematching...
  • 10
  • 567
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Word Vectors for Sentiment Analysis" ppt

... par-ticular word occurs. The hyper-parameters of themodel are the regularization weights (λ and ν), and the word vector dimensionality β.Maximizing the objective function with respect toR, b, ψ, and ... results on a standard dataset, and introducea new dataset for the task. In both tasks we com-pare our model’s word representations with severalbag of words weighting methods, and alternative ... assessment of word represen-tations, we visualize the words most similar to aquery word using vector similarity of the learnedrepresentations. Given a query word w and an-other word w′we...
  • 9
  • 590
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning to Translate with Multiple Objectives" doc

... #of features, and metrics used. Our MT models are trained with standard phrase-based Moses software (Koehn and others, 2007), with IBM M4 alignments, 4gram SRILM,lexical ordering for PubMed and ... metricsusing machine learning for better correlation with human judgments (Liu and Gildea, 2007; Albrecht and Hwa, 2007; Gimnez and M`arquez, 2008) and may give insights for setting {pk}. We view ... samples without the need for sampling.4.2 ResultsFigures 2 and 3 show the results for PubMed and NIST, respectively. A method is better if its ParetoFrontier lies more towards the upper-right hand...
  • 10
  • 624
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Word Representations via Global Context and Multiple Word Prototypes" pdf

... for clustering word instances, which is used in the multi-prototype ver-sion of our model that accounts for words with mul-tiple senses. We evaluate our new model on the standardWordSim-353 (Finkelstein ... only local context and one represen-tation per word. This is problematic becausewords are often polysemous and global con-text can also provide useful information forlearning word meanings. We ... architecture which 1) learns word embeddings that better capture the se-mantics of words by incorporating both local and global document context, and 2) accountsfor homonymy and polysemy by learning...
  • 10
  • 494
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Discriminative Word Alignment with Conditional Random Fields" ppt

... many-to-one word alignments,where each source word is aligned with zero orone target words, and therefore each target word can be aligned with many source words. Eachsource word is labelled with ... includeindicator features for an exact string match, both with and without vowels, and the edit-distancebetween the source and target words as a real-valued feature. We also used indicator features ... source and target sentences with Tree-Tagger.2We created indicator features over thePOS tags of each candidate source and target word pair, as well as over the source word and targetPOS (and...
  • 8
  • 460
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "K-means Clustering with Feature Hashing" docx

... classes and randomly drew 100documents for each class.We used unigrams and bigrams as features and ranour method for various hash sizes m (Figure 1). Thenumber of unigrams is 33,017 and bigrams ... parameters.Let us explain in detail. In NLP, features can beoften expediently expressed with strings. For in-stance, a feature ‘the current word ends with -ing’can be expressed as a string cur:end:ing ... realesed in 2007.Ganchev and Dredze (2008) named their hashingtrick random feature mixing and empirically sup-ported it by experimenting on NLP tasks. It is simi-lar to feature hashing except...
  • 5
  • 601
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Sub-Word Units for Open Vocabulary Speech Recognition" doc

... coherence.Hybrid word/ sub -word recognizers can produce asequence of sub -word units in place of OOV words.Ideally, the recognizer outputs a complete word forin-vocabulary (IV) utterances, and sub -word ... hybridsystem’s lexicon has 83K words and 5K or 10Ksub-words. Note that the word vocabulary is com-mon to both systems and only the sub-words are se-lected using either approach. The word vocabularyused ... units9(§5.2) and one with unitslearned by our model on OOV detection and phoneerror rate. We present results using a hybrid system with 5k and 10k sub-words.We evaluate the CRF OOV detector with two...
  • 10
  • 441
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Syntactic Verb Frames Using Graphical Models" doc

... tagging and parsing, and measures of selectional preference and argumentstructure as complementary features for the classi-fier.Finally, our task-based evaluation, verb clustering with Levin ... clustersare then compared to the gold standard clusters with the purity-based F-Score from Sun and Korhonen(2009) and the more familiar Adjusted Rand Index(Hubert and Arabie, 1985). Our main point ... preferences), and possible predicate-argumentstructures. By combining the syntactic classes with unsupervised POS tagging (Teichert and Daum´e III,2009) and the selectional preferences with distribu-tional...
  • 10
  • 431
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa học bản chất của khủng hoảng kinh tế thế giới pdftài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học công nghệ phục vụ nông nghiệp và phát triển nông thôn các tỉnh phía bắc 2006 2007 tài liệu phục vụ hội nghịbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểtai lieu bao cao thuc tap khoa co khitai lieu bao cao thuc tap tai khoa duoc benh vientai lieu bao cao thuc tap y si da khoabáo cáo khoa học ảnh hưởng của tuổi thu hoạch đến năng suất và chất lượng thức ăn của cỏ voi pennisetum purpureum cỏ ghi nê panicum maximum trồng tại đan phượng hà tây pptxtai lieu bao cao thuc tap tim hieu nhan cach mot hoc sinhbáo cáo khoa học về nghệ thuật trong lieu trai chi ditai lieu bao cao thuc tap tai khoa duoc benh vien hop lucđề tài báo cáo khoa họcđề tài báo cáo khoa học sinh họcNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngTìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThơ nôm tứ tuyệt trào phúng hồ xuân hươngTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ