0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "A Cascaded Linear Model for Joint Chinese Word Segmentation and Part-of-Speech Tagging" pdf

Báo cáo khoa học:

Báo cáo khoa học: "A Cascaded Linear Model for Joint Chinese Word Segmentation and Part-of-Speech Tagging" pdf

... 897–904,Columbus, Ohio, USA, June 2008.c2008 Association for Computational LinguisticsA Cascaded Linear Model for Joint Chinese Word Segmentation and Part-of-Speech TaggingWenbin Jiang†Liang Huang‡Qun ... seg-mentation only and joint segmentation and part-of-speech tagging. On the Penn Chinese Treebank 5.0, we obtain an error reduction of18.5% on segmentation and 12% on joint seg-mentation and part-of-speech ... a cascaded linear model for joint Chinese word segmentation and part-of-speech tagging. With a character-basedperceptron as the core, combined with real-valued features such as language models,...
  • 8
  • 445
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Error-Driven Word-Character Hybrid Model for Joint Chinese Word Segmentation and POS Tagging" docx

... discriminative word- character hybrid model for joint Chi-nese word segmentation and POS tagging.Our word- character hybrid model offershigh performance since it can handle bothknown and unknown words. ... ACL and the 4th IJCNLP of the AFNLP, pages 513–521,Suntec, Singapore, 2-7 August 2009.c2009 ACL and AFNLPAn Error-Driven Word- Character Hybrid Model for Joint Chinese Word Segmentation and ... litera-ture.1 IntroductionIn Chinese, word segmentation and part-of-speech (POS) tagging are indispensable steps for higher-level NLP tasks. Word segmentation and POS tag-ging results are...
  • 9
  • 338
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Hybrid Hierarchical Model for Multi-Document Summarization" ppt

... paper, we formulate ex-tractive summarization as a two step learn-ing problem building a generative model for pattern discovery and a regression model for inference. We calculate scores for sentences ... hierarchical model and re-gression model to score sentences in new docu-ments, eliminating the need for building a genera-tive model for new document clusters.3 Summary-Focused Hierarchical Model Our ... model. Then, using thesescores, we train a regression model basedon the lexical and structural characteris-tics of the sentences, and use the model toscore sentences of new documents to forma...
  • 10
  • 559
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Unified Graph Model for Sentence-based Opinion Retrieval" pdf

... The Lexicon of Chinese Positive Words, which consists of 5,054 positive words and the Lexicon of Chinese Negative Words, which consists of 3,493 negative words; (2) The opinion word lexicon ... notion of topic-sentiment word pair, which consists of a topic term and a sentiment word. A word pair maintains the asso-ciative information between the two words, and enables systems to draw ... consists of 2,812 positive words and 8,276 negative words; (3) Sentiment word lexicon and comment word lexicon from Hownet. It contains 1836 posi-tive sentiment words, 3,730 positive com-ments,...
  • 9
  • 585
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A probabilistic generative model for an intermediate constituency-dependency representation" pptx

... re-ranking model performs rather well for a limited number of candidate structures, and out-performs Charniak’s model when k = 5. In thiscase we observe a small boost in performance for the detection ... structure. It models the eventof filling B with a content word (cw), given thecontent word of the governing block, the cate-gories (cats) and functional words (f w) of B, and further information ... consistently outper-forms the PCFG model on this metric, as for UAS, and BAS. Concerning the other metrics, as thenumber of k-best candidates increases, the PCFG model outperforms the TDS-reranker...
  • 6
  • 555
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Phonotactic Language Model for Spoken Language Identification" pptx

... another. Therefore, one can easily draw the analogy between an acoustic token in bag-of-sounds and a word in bag-of-words. Unlike words in a text document, the phonotactic information that ... n-character slice for text categorization by lan-guage (Cavnar and Trenkle, 1994) and Phone Rec-ognition followed by n-gram Language Modeling, or PRLM (Zissman, 1996) . Orthographic forms of language, ... information from acous-tic model and n-gram LM for language l. We have and {,AM}LLMlllλλλ= ( 1, , )llλ∈Λ =. A maxi-mum-likelihood classifier can be formulated as follows: ()(ˆargmax...
  • 8
  • 436
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Localized Prediction Model for Statistical Machine Translation" ppt

... length.Single source and target words are denoted by and respectively, where and .We will also use a special single -word block setwhich contains only blocks for which . For the experiments in ... phrase-based model for SMTsimilar to the models presented in (Koehn et al., 2003;Och et al., 1999; Tillmann and Xia, 2003). In our pa-per, phrase pairs are named blocks and our model is de-signed ... set of candidates. This computational advantageis the main reason that we adopt the local model in thispaper.3.3 Global versus Local ModelsBoth the global and the localized log -linear models...
  • 8
  • 578
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A SPEECH-FIRST MODEL FOR REPAIR DETECTION AND CORRECTION" docx

... statistical analysis does not sup- 6We performed the same analysis for the last and first syllables in the reparandum and repair, respectively, and for normalized f0 and energy; results did not substantially ... Length of Reparandum Offset Word Frag- ments (N=288) bution of initial phonemes for all words in the corpus of 6,414 ATIS sentences, and for all fragments, single syllable fragments, and single ... Offset (N=288) a clear tendency for fragmentation at the reparandum offset to occur in content words rather than function words. 3In our pilot study of the SRI and TI utterances only, we found...
  • 8
  • 502
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Unified Statistical Model for the Identification of English BaseNP" pptx

... describe the two-passstatistical model, parameters training and Viterbialgorithm for the search of the best sequences ofPOS tagging and baseNP identification. Beforedescribing our algorithm, ... iiinnnP and (4) ),|(iiibmtwP . Thefirst and the third parameters are trigrams of T and B respectively. The second and the fourthare lexical generation probabilities. Probabilities(1) and (2) ... calculation formulas are similarwith equations (13) and (14) respectively.Before training trigram model (3), all possiblebaseNP rules should be extracted from thetraining corpus. For instance,...
  • 8
  • 482
  • 0
Báo cáo khoa học:

Báo cáo khoa học: " A Noisy-Channel Model for Document Compression" pptx

... resultin incoherence and information loss. The deletion ofcertain words and phrases may also lead to ungram-maticality and information loss.The mayor is now looking for re-election. John ... in-serted.Knight and Marcu (2000) describe in detail anoisy-channel model that explains how short sen-tences can be expanded into longer ones by inserting and expanding syntactic constituents (and words).Since ... sentences). For purpose of comparison, the Mitre data wascompressed using five systems:Random: Drops random words (each word has a50% chance of being dropped (baseline).Hand: Hand compressions...
  • 8
  • 458
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnBáo cáo quy trình mua hàng CT CP Công Nghệ NPVNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzBiện pháp quản lý hoạt động dạy hát xoan trong trường trung học cơ sở huyện lâm thao, phú thọGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015Đổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ