0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Assessing the Costs of Sampling Methods in Active Learning for Annotation" potx

Báo cáo khoa học:

Báo cáo khoa học: "Assessing the Costs of Sampling Methods in Active Learning for Annotation" potx

... case for measuring cost in assessing AL methods. 1 IntroductionObtaining human annotations for linguistic data islabor intensive and typically the costliest part of the acquisition of an annotated ... applicable to AL for sequential labeling in general. We make the case for measuring cost in assessing AL methods by showing that the choice of a cost function significantly affects the choice of ALalgorithm.2 ... costlythan the baseline appear above the baseline. For aspecific accuracy value on a learning curve, the cor-responding value of the cost on the random baselineis estimated by interpolation...
  • 4
  • 363
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Assessing the Role of Discourse References in Entailment Inference" pptx

... for inference. In another 28%,references could optionally support the inference of the hypothesis. In the remaining 28%, refer-ences did not contribute towards inference. The total number of ... generic framework for modeling semantic inference. TE reduces the inference requirements of many text understand-ing applications to the problem of determiningwhether the meaning of a given textual ... crucial for entailment sincethey included the main predicate of the hypothe-sis.6This calls for an increased focus on the reso-lution of event references.Transformations. Table 3 shows the...
  • 11
  • 460
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Exploring the Use of Linguistic Features in Domain and Genre Classification" potx

... the class of the majority of the items which reached it during training. The trees were grown using recursive partitioning; the splitting criterion was reduction in deviance. Using the Gini ... grave for the LPE experiments because of the ceiling effect and the small size of the complete data set, therefore, we did not rerun the corresponding experiments. Furthermore, the number of ... examples. The corresponding training sets contain the remaining 95 documents. For RIBL, test set performance is determined us- ing leave-one-out cross validation. Feature vectors contained either...
  • 8
  • 689
  • 1
Báo cáo khoa học:

Báo cáo khoa học: "Evaluating the Impact of Coder Errors on Active Learning" ppt

... another label before starting the active learning trial, but retain the distribution of the different labels in the pool data (active learning with random errors); (Table 1, ALrand, 30%). In the ... margin sampling is less sensitive to cer-tain types of noise than entropy sampling (Table 2).Because of space limitations we only show curves for margin sampling. For entropy sampling, the ... trend is the same, with results being slightlylower than for margin sampling. 4 Detecting Annotation NoiseUncertainty sampling using the margin metric se-lects instances for which the difference...
  • 9
  • 368
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Bucking the Trend: Large-Scale Cost-Focused Active Learning for Statistical Machine Translation" docx

... Sarkar. 2009. Active learning for multilingual statistical machine trans-lation. In Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th In- ternational Joint Conference ... for Computational Linguistics.Katrin Tomanek and Udo Hahn. 2009. Semi-supervised active learning for sequence labeling. In Proceedings of the Joint Conference of the 47th An-nual Meeting of ... translation). Figure 4shows the learning curves for the same systemsand selection methods as in Figure 3 but now the x-axis measures the number of foreign words in the training data. The difference between...
  • 11
  • 580
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Smaller Constituents Rather Than Sentences in Active Learning for Japanese Dependency Parsing" docx

... of Japanese dependency pars-ingthat the algorithm in Figure 4 does not generateevery pair of bunsetsus.34 Active Learning for ParsingMost of the methods of active learning for parsing in ... iscalled pool-based active learning. Following theirsequential sampling algorithm, we show in Fig-ure 1 the basic flow of pool-based active learning. Various methods for selecting informative exam-ples ... tool for the av-eraged perceptron in C++ and used them for ex-periments. We wrote the main program of active learning and some additional scripts in Perl and sh.6.5 Settings of Active Learning For...
  • 10
  • 432
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Assessing the Effect of Inconsistent Assessors on Summarization Evaluation" doc

... between the original summarizerranking and the ranking after excluding topics by one ortwo worst assessors in each category.we should examine the potential impact of incon-sistent assessors on the ... too.2Therefore, it would be better to look at whether as-sessors tend to find the same SCUs (information“nuggets”) in different summaries on the same topic,and whether they annotate them consistently. ... autoan-notated it using all remaining manually-annotatedsummaries from the same topic, and then we com-pared the resulting “autoPyramid” score with the score from the original manual annotation for thatsummary....
  • 4
  • 405
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving the Scalability of Semi-Markov Conditional Random Fields for Named Entity Recognition" pdf

... because, in manycases, the previous label of a named entity is “O”,which indicates a non-named entity. For 98.0% of the named entities in the training data of the sharedtask in the 2004 JNLPBA, the ... than the system without it (the p-value isless than 1.0 < 10−4). The result of the precedingentity information improves the performance. On the other hand, the system with preceding infor-mation ... the final performance. In this experiment, we couldnot examine the performance without filtering us-ing all the training data, because training on all the training data without filtering required muchlarger...
  • 8
  • 527
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Is the End of Supervised Parsing in Sight?" pdf

... derivations, the probability of a tree is the sum of the probabilities of the derivations producing that tree. The probability of a derivation is the product of the subtree probabilities. The original ... 402 the number of subtrees of all trees increases with the Catalan number, and only ad hoc sampling could make the method work. Since U-DOP* computes the shortest derivations (in the training ... and UML-DOP against the f-scores for U-DOP reported in Bod (2006), the CCM model in Klein and Manning (2002), the DMV dependency model in Klein and Manning (2004) and their combined model DMV+CCM....
  • 8
  • 525
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Defining the Semantics of Verbal Modifiers in the Domain of Cooking Tasks" pptx

... compute the length of the intervals between stirring events. The length of a single stirring event is a default which is part of the representation of the primitive actions. The number of stirring ... system (Karlin, 1988). SEAFACT operates in the domain of cooking tasks. The domain is limited to a mini-world con- sisting of a small set of verbs chosen because they involve rather complex ... empirical, linguistic study of recipes was con- ducted with the goals of delimiting the scope of the cooking domain, identifying important verbal mod- ifiers, and defining the semantics of those...
  • 7
  • 433
  • 0

Xem thêm

Từ khóa: báo cáo khoa học ảnh hưởng của việc thay thế cỏ xanh trong khẩu phần bằng bã dứa ủ chua đến khả năng sản xuất của bò thịt pottài liệu báo cáo khoa học bản chất của khủng hoảng kinh tế thế giới pdflam the nao de tom tat bao cáo khoa hocbáo cáo khoa họcbáo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpbáo cáo khoa học thủy sảnbáo cáo khoa học về cá trabáo cáo khoa học nghiên cứu chôm chômtrạng thái hiện sinh báo cáo khoa họcbiểu tượng văn học báo cáo khoa họctài liệu báo cáo khoa họcBáo cáo thực tập tại nhà thuốc tại Thành phố Hồ Chí Minh năm 2018Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Sở hữu ruộng đất và kinh tế nông nghiệp châu ôn (lạng sơn) nửa đầu thế kỷ XIXChuong 2 nhận dạng rui roTăng trưởng tín dụng hộ sản xuất nông nghiệp tại Ngân hàng Nông nghiệp và Phát triển nông thôn Việt Nam chi nhánh tỉnh Bắc Giang (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt nam