0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Discovering Corpus-Specific Word Senses" pot

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Finding Predominant Word Senses in Untagged Text" pptx

... similar nouns to .2.2 The WordNet Similarity PackageWe use the WordNet Similarity Package 0.05 andWordNet version 1.6.2The WordNet Similaritypackage supports a range of WordNet similarityscores. ... thesewords in the 2 domain specific corpora.5.3 DiscussionThe results for 10 of the words from the quali-tative experiment are summarized in table 3 withthe WordNet sense number for each word ... or domainat hand.SemCor comprises a relatively small sample of250,000 words. There are words where the firstsense in WordNet is counter-intuitive, because ofthe size of the corpus, and because...
  • 8
  • 371
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Discovering asymmetric entailment relations between verbs using selectional preferences" doc

... Distributional Hypothesis (Harris, 1964),verbs occurring in similar sentences are likely tobe semantically related.The Distributional Hypothesis suggests ageneric equivalence between words. Relatedmethods ... useful to better ex-plain the problem and to better understand the ap-plicability of our hypothesis.In WordNet, verbs are organized in synonymysets (synsets) and different kinds of seman-tic ... possible to ap-ply the agentive nominalization to the hypothesisvh, scan the corpus to detect those expressions inwhich the agentified hypothesis verb is the subjectof a clause governed by the...
  • 8
  • 331
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Discovering Corpus-Specific Word Senses" pot

... h,)Cik4111)11‘414Witler,1110.1/.17,cgtoserek■IltFigure 1: Local graph of the word mouseFigure 2: Local graph of the word wing3 Markov ClusteringAmbiguous words link otherwise unrelated areasof meaning E.g. rat ... an unsupervised al-gorithm which automatically discovers word senses from text. The algorithmis based on a graph model representingwords and relationships between them.Sense clusters are iteratively ... them.Sense clusters are iteratively computedby clustering the local graph of similarwords around an ambiguous word. Dis-crimination against previously extractedsense clusters enables us to discovernew...
  • 4
  • 329
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Discovering Global Patterns in Linguistic Networks through Spectral Analysis: A Case Study of the Consonant Inventories" pdf

... appear) for an ex-tensive survey). Examples include study of theWordNet (Sigman and Cecchi, 2002), syntacticdependency network of words (Ferrer-i-Cancho,2005) and network of co-occurrence of ... connections between the languageand the consonant nodes through a 0-1 matrix Aas shown by a hypothetical example in Fig. 1. Fur-ther, in (Mukherjee et al., 2007), the authors definethe Phoneme-Phoneme ... edge with weight equal to thenumber of languages in which both c and coccurtogether. In other words, PhoNet can be expressedas a matrix B (see Fig. 1) such that B = AAT−Dwhere D is a diagonal...
  • 9
  • 703
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Learning Sub-Word Units for Open Vocabulary Speech Recognition" doc

... coherence.Hybrid word/ sub -word recognizers can produce asequence of sub -word units in place of OOV words.Ideally, the recognizer outputs a complete word forin-vocabulary (IV) utterances, and sub -word ... recognize words beyond their vocab-ulary, many of which are information richterms, like named entities or foreign words.Hybrid word/ sub -word systems solve thisproblem by adding sub -word units ... units to large vo-cabulary word based systems; new words canthen be represented by combinations of sub- word units. Previous work heuristically cre-ated the sub -word lexicon from phonetic rep-resentations...
  • 10
  • 441
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Yet Another Word Alignment Tool" docx

... with Yawat. As the mouse is moved over a word, th e word and all words linkedwith it are highlighted. The highlighting is removed when the mouse leaves the word in qu estion. This allows theannotator ... assoc iated words are shown only for one wor dat a time, as determined by the location of the mousepointer. When the mouse is moved over a word in thetext, the word and all the words associated ... for creating word alignments, one design objective was to minimizemouse travel required to align words. The inter-face therefore has no ‘link words’ button but usesmouse clicks on words directly...
  • 4
  • 416
  • 1
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Guiding Statistical Word Alignment Models With Prior Knowledge" pdf

... am1specifies the indices of source wordsthat target words are aligned to.In an HMM-based word alignment model, sourcewords are treated as Markov states while targetwords are observations that are ... as 1.In building word alignment models, a special“NULL” word is usually introduced to address tar-get words that align to no source words. Since thisphysically non-existing word is not in the ... the only way to address theempty word issue.2.2.2 Utilizing Word Alignment StatisticsWhile the simple bag-of -word model puts allsource words and target words as rows in the ma-trix, another...
  • 8
  • 495
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Rethinking Chinese Word Segmentation: Tokenization, Character Classification, or Wordbreak Identification" pdf

... co-occurrence. Word based model. In this model, statistical dataabout word boundary frequencies for each characteris retrieved word- wise. For example, in the case ofa monosyllabic word only two word ... components of words, instead,they are contextual background providing informa-tion about the likelihood of whether each CB is alsoa wordbreak (WB). In other words, we model Chi-nese word segmentation ... modeling, all exiting algorithms sufferfrom the same dilemma. Word segmentation is sup-posed to identify word boundaries in a running text,and words defined by these boundaries are then com-pared with...
  • 4
  • 301
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "INTEGRATING WITH WORD BOUNDARY IDENTIFICATION SENTENCE UNDERSTANDING" docx

... Moreover, separating the issue of word boundary identification from sentence understand- ing often leads to devising word segmentation rules which are arbitrary and word specific, 2 and hence not ... rectly pre-segmented words. It performs word boundary disambiguation concurrently with sentence understanding. In our investigation, we focus on sentences with clearly ambiguous word boundaries ... special delimiters such as space to indicate word boundaries. Existing Chi- nese NLP systems therefore employ preprocessors to seg- ment sentences into words. Many techniques have been de- veloped...
  • 3
  • 360
  • 0

Xem thêm

Từ khóa: Báo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngchuyên đề điện xoay chiều theo dạngNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Tìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíTranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)chuong 1 tong quan quan tri rui roNguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015HIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ