0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "An Online System for Corpus Management and Analysis in Support of Computing in the Humanities" pot

Báo cáo khoa học:

Báo cáo khoa học: "An Online System for Corpus Management and Analysis in Support of Computing in the Humanities" pot

... aspect of pure resource management, processing and analysis of docu-ments have traditionally been the domain of desk-top applications. Sometimes even to the point of command line tools. Therefore ... Frankfurt am Main,2Universit¨at BielefeldAbstractThis paper introduces eHumanities Desk-top- an online system for corpus manage-ment and analysis in support of Comput-ing in the Humanities. ... store the resource.Since the output of the tagger is a XML documentit is stored as a XML Database. Finally the in- formation about the new document is stored in the Master Data including a...
  • 4
  • 338
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "An Unsupervised System for Identifying English Inclusions in German Text" doc

... the classifi-cation results of our system and comparethem to the performance of a trained ma-chine learner in a series of in- and cross-domain experiments.1 Introduction The recognition of ... used and the architecture of our system. In Sec-tion 5, we provide an evaluation of the system out-put and compare the results with those of a series of in- and cross-domain machine learning ... While the tagger performs much better for the internet and the space travel data, it requires hand-annotatedtraining data. The lookup system, on the other hand,is essentially unsupervised and therefore...
  • 6
  • 333
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "AN EXPERT SYSTEM FOR THE PRODUCTION OF PHONEME STRINGS FROM UNMARKED ENGLISH TEXT USING MACHINE-INDUCED RULES" pdf

... consists of all of the entries from the SCL and the SEL, as well as all of the features for each entry. At this point an initial "window" on the training set is chosen. Since the inference ... t~ next word in the input. ~. Traininm Mode When UTTER is operating in training mode, the system allows the user to correct errors in transcription interactively by specifying the proper ... execution time increases comblnatorlally with the size of the training set, it is wise to begin the inference procedure with a subset of the training set. This is acceptable since there is often a...
  • 8
  • 493
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An Unsupervised Model for Joint Phrase Alignment and Extraction" ppt

... ComputationalLinguistics, pages 25–28.John DeNero and Dan Klein. 2010. Discriminative mod-eling of extraction setsfor machine translation. In Pro-ceedings of the 48th AnnualMeeting of the Association for ... Ph.D. thesis, Massachusetts Institute of Tech-nology.John DeNero and Dan Klein. 2008. The complexity of phrase alignment problems. In Proceedings of the 46thAnnual Meeting of the Association for ... model. For GIZA ++, we use the standard training reg-imen up to Model 4, and combine alignmentswith grow-diag-final -and. For the proposedmodels, we train for 100 iterations, and use the finalsample...
  • 10
  • 641
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An Ensemble Method for Selection of High Quality Parses" pdf

... both the generative parsingmodel number 2 of Collins (1999) and the rerankingparser of Charniak and Johnson (2005), both when the training and test data belong to the same domain (the in- domain ... the way f-score is ordinarily calculated, by computing the labeled precision and recall of the constituents in the whole set and using these as the arguments of the f-score equation. The ordinary ... copies of a parser, each of which trained on a different sample from the trainingdata, to predict the quality of a parse. The algorithmdoes not assume uniformity of training and test data,and...
  • 8
  • 462
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An Approximate Approach for Training Polynomial Kernel SVMs in Linear Time" doc

... vector in D-dimension space of the i-th example, and yi is the label of xi either positive or negative. The training of SVMs involves in minimize the following object (primal form, soft-margin) ... trade off training error and mar-gin. A small value for C will increase the number of training errors. To determine the class (+1 or -1) of an example x can be judged by computing the following ... support in the training set and lim-ited in the length of predefined d, which is equiva-lent to the polynomial kernel degree d. For exam-66ple, if the minimum support is 5, and d=2, then a...
  • 4
  • 416
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An Improved Parser for Data-Oriented Lexical-Functional Analysis" doc

... respect to the corpus& quot;, thus increasing the robustness of the model.2.3 The composition operation In LFG-DOP the operation for combiningfragments is carried out in two steps. First the c-structures ... using initially the indexed subtrees only.Thus only the Category-matchingcondition is enforced during the chart-parsingprocess. The Uniqueness and Coherenceconditions of the corresponding ... randomexcept for one constraint: that all the words in the test set actually occurred in the training set. The sentences from the test set were parsed and disambiguated by means of the fragments fromthe...
  • 8
  • 408
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An Integrated Environment for Computational Linguistics Experimentation" pot

... for theoretical models, and the accuracy of these models can be evalu-ated either with regard to their ability to account for the reality of a given corpus (pursuing descrip-tive aims), either ... models and methodological concerns. Finally,when other platforms usually enforce the use of adedicated document format, LinguaStream is ableto process any XML document. On the other hand,LinguaStream ... stream, the platform takes care of the scheduling of sub-tasks, and various tools allow the results to be visualisedconveniently.Fundamental principlesFirst of all, the platform makes use of declarativerepresentations,...
  • 4
  • 325
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An expressive formalism for describing tree-based grammars" docx

... con-sists of tree description and/ or of semantic formu-las. The XMG formalism furthermore supports the sharing of identifiers across dimension hence al-lowing for a straightforward encoding of the ... semantics The XMG formalismfurther supports the integration in the grammar of semantic information. More generally, the lan-guage manages dimensions of descriptions so that the content of a class ... factorizing grammar in- formation is crucial for the rapid development, the maintenance and the debugging of large scalegrammars. While much work has been deployedinto producing such factorizing...
  • 4
  • 328
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "An annotation scheme for discourse-level argumentation in research articles" doc

... amount of train- ing, including the reading of coding instructions for the two versions of the scheme (6 pages for the basic scheme and 17 pages for the full scheme), four training papers and ... determining BASIS and CONTRAST. This might have to do with the loca- tion of those types of sentences in the paper: AIM and TEXTUAL are usually found at the beginning or end of the introduction ... no training in computational linguistics performed reasonably well: they were not part of the circle of the three most similar subjects in their groups, but they were also not performing worse...
  • 8
  • 396
  • 0

Xem thêm

Từ khóa: an excellent system for studying neurotransmitter receptor accumulation in the postsynapbáo cáo khoa học ảnh hưởng của tuổi thu hoạch đến năng suất và chất lượng thức ăn của cỏ voi pennisetum purpureum cỏ ghi nê panicum maximum trồng tại đan phượng hà tây pptxkết quả nghiêncứu các đề án vnrp tóm tắt báo cáo khoa học tập 3báo cáo khoa học sử dụng chế phẩm cms của công ty vedan sản xuất thức ăn cho một số loài cá nước ngọt nuôi trong ao hồbáo cáo khoa học nghiên cứu quy trình công nghệ và thiết bị sản xuất thức ăn cho tômbáo cáo khoa họcbáo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Một số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngChuong 2 nhận dạng rui roKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)BT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtTrách nhiệm của người sử dụng lao động đối với lao động nữ theo pháp luật lao động Việt Nam từ thực tiễn các khu công nghiệp tại thành phố Hồ Chí Minh (Luận văn thạc sĩ)Chiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015