0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Correcting a PoS-tagged corpus using three complementary methods" pot

Báo cáo khoa học:

Báo cáo khoa học: "Correcting a PoS-tagged corpus using three complementary methods" pot

... a large fine-grained tagset, because in such cases a large ratioof the variation n-grams may actually reflect trueambiguity rather than inconsistent tagging.Another example of a method, based ... a variation and the word(s) exhibiting thevariation is called a variation nucleus (Dickinsonand Meurers, 2003). A particular variation is thus a possible candidate for an error. The variationmight ... In this tagset, eachcharacter in a tag has a particular function. Thefirst character denotes the word class. For eachword class there is a predefined number of ad-ditional characters (at most...
  • 9
  • 193
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Encoding a Parallel Corpus for Automatic Terminology" pot

... EACL '99 Encoding a Parallel Corpus for Automatic Terminology Extraction Johann Gamper European Academy Bolzano/Bozen Weggensteinstr. 12 /A, 39100 Bolzano/Bozen, Italy j gamper@eurac, ... encoding a text corpus, which serves as a basis for applying term extraction programq. 1 Introduction Text corpora are valuable resources in all areas dealing with natural language processing ... data from text material is a very work-intensive and error-prone task. Recent advances in auto- matic corpus analysis favored a modern form of terminology acquisition: (1) a corpus is a col-...
  • 2
  • 249
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Updating a Name Tagger Using Contemporary Unlabeled Data" ppt

... name tagger based on co-training de-cays as the time gap between training data (seedsand unlabeled data) and test data increases (Motaand Grishman, 2008). Compared to the originalclassifier ... USAgrishman@cs.nyu.eduAbstractFor many NLP tasks, including named en-tity tagging, semi-supervised learning hasbeen proposed as a reasonable alternativeto methods that require annotating largeamounts of training data. In ... of the ACL-IJCNLP 2009 Conference Short Papers, pages 353–356,Suntec, Singapore, 4 August 2009.c2009 ACL and AFNLPUpdating a Name Tagger Using Contemporary Unlabeled DataCristina MotaL2F...
  • 4
  • 329
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Correcting errors in speech recognition with articulatory dynamics" pot

... database, and32 ms in MOCHA. Phoneme boundaries are de-termined automatically in the MOCHA databaseby forced alignment, and by a speech-languagepathologist in the TORGO database.We approximate ... 0.27 0.25Table 3: Average difference between predictedtract variables and observed data, on [0, 1] scale.(*) Nasals are evaluated only with MOCHA data,since TORGO data lacks velum measurements.We ... measurements.We evaluate how closely transformations to thecanonical tract variables predicted by TADA matchthe data. Namely, we input the known orthographyfor each test utterance into TADA, obtain the...
  • 9
  • 322
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "CORRECTING ILLEGAL NP OMISSIONS USING LOCAL FOCUS" pdf

... (thematic) agent of the sentence. The Potential Actor Focus List (PAFL) contains all NP's that specify an ani- mate element of the database but are not the agent of the sentence. Tracking ... use of a separate actor focus. However, we think that the example they use does not argue against a separate actor focus, but illustrates the need for extensions to Sial- her's algorithm ... that we have found to be particularly prevalent: the illegal omission of NP's. Our previous analysis of the written English of ASL natives has led us to conclude that language transfer...
  • 3
  • 96
  • 0
Báo cáo khoa học: Ixocarpalactone A isolated from the Mexican tomatillo shows potent antiproliferative and apoptotic activity in colon cancer cells pot

Báo cáo khoa học: Ixocarpalactone A isolated from the Mexican tomatillo shows potent antiproliferative and apoptotic activity in colon cancer cells pot

... 20 Caceres A, Alvarez AV, Ovando AE & Samayoa BE(1991) Plants used in Guatemala for the treatment ofrespiratory diseases. 1. Screening of 68 plants againstgram-positive bacteria. J Ethnopharmacol ... known as a tomatillo, is a stapleof the Mesoamerican cuisine. In our laboratory, an ethyl acetate-solubleextract and four withanolides [ixocarpalactone A (IxoA), ixocarpalac-tone B, philadelphicalactone ... an ethyl acetate-solubleextract and four withanolides [ixocarpalactone A (IxoA)], ixocarpalactone B (IxoB), philadelphicalac-tone B (PhilB), and withaphysacarpin (Withpc)] wereisolated in pure...
  • 10
  • 310
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Compiling a Massive, Multilingual Dictionary via Probabilistic Inference" pot

... mskinner@google.comAbstractCan we automatically compose a large setof Wiktionaries and translation dictionar-ies to yield a massive, multilingual dic-tionary whose coverage is substantiallygreater than that ... lexical translations between two languages thatdo not share a translation dictionary. For exam-ple, our algorithm can conclude that Basque word‘udaherri’ is a translation of Maori word ‘koanga’in ... lexical translation cannotreplace SMT, but it is useful for several applica-tions including translating search-engine queries,library classifications, meta-data tags,2and recentapplications...
  • 9
  • 303
  • 1
Báo cáo khoa học:

Báo cáo khoa học: "Historical Change in Language Using Monte Carlo Techniques" potx

... grammar. Individuals with command of more than one language may be associated with additional gram- mars. A grammar consists of a set of rules for either parsing or generating forms in a particular ... Pennsylvania, and System Development Corporation, Santa Monica, California† A system has been programmed in JOVIAL to serve as a vehicle for test- ing hypotheses about language change through ... data may then appear in the form of a statisti- cal analysis of the behavior in the repeated trials. A simulation may yield several kinds of information of interest to a researcher. For example,...
  • 16
  • 336
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Machine Translation System Combination using ITG-based Alignments∗" pot

... offer alternatives. One must then∗This work was partially supported by the DARPA GALEprogram (Contract No HR0011-06-2-0001). Also, we wouldlike tothank the IBM Rosetta team for the availability ... how the targetwords in each translation align back to the sourcewords. In fact, it only requires a procedure for cre-ating pairwise alignments of translations that allowappropriate re-orderings. ... which are allowed in tercomhave to adhere to the following constraints: (i) A block that has an exact match cannot be moved, and(ii) for a block to be moved, it should have an exactmatch in...
  • 4
  • 175
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Creating a manually error-tagged and shallow-parsed learner corpus" pptx

... corpus Ryo NagataKonan University8-9-1 Okamoto,Kobe 658-0072 Japanrnagata @ konan-u.ac.jp.Edward Whittaker Vera SheinmanThe Japan Institute forEducational Measurement Inc.3-2-4 Kita-Aoyama, Tokyo, ... Lee and Seneff, 2008; Nagata et al., 2004;Nagata et al., 2005; Nagata et al., 2006; Tetreault etal., 2010b). This is one of the most active researchareas in natural language processing of learner ... NorthAmerican Chapter of the ACL, pages 154–162.Joel Tetreault, Elena Filatova, and Martin Chodorow.201 0a. Rethinking grammatical error annotation andevaluation with the Amazon Mechanical Turk....
  • 10
  • 467
  • 0

Xem thêm

Từ khóa: Nghiên cứu tổ hợp chất chỉ điểm sinh học vWF, VCAM 1, MCP 1, d dimer trong chẩn đoán và tiên lượng nhồi máu não cấpMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngThơ nôm tứ tuyệt trào phúng hồ xuân hươngBT Tieng anh 6 UNIT 2Tăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015