0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Unsupervised Discourse Segmentation of Documents with Inherently Parallel Structure" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Discourse Segmentation of Documents with Inherently Parallel Structure" pdf

... to the problem of segmenting parallel parts of documents. The task of aligning each sentence of an abstractto one or more sentences of the body has beenstudied in the context of summarization ... that it neglects the discourse structureand the lexical cohesion phenomenon.3 ModelIn this section we describe our model for discourse segmentation of documents with inherently paral-lel ... rivaling those of a pre-viously proposed supervised technique.1 IntroductionMany documents consist of parts exhibiting a highdegree of parallelism: e.g., abstract and body of academic publications,...
  • 5
  • 376
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Extraction and Approximation of Numerical Attributes from the Web" pdf

... cases manual annotation of objects with numerical properties is possible, it is a hard andlabor intensive task, and is impractical for dealing with the vast amount of objects of interest. Hence,there ... of the methods aresuitable for retrieval of numerical attributes. How-ever, most of them do not exploit the numericalnature of the attribute data.Our research is related to a sub-domain of ... the variation of theextracted numerical attribute values using infor-mation in the textual context of these values.A significant body of recent research deals with extraction of various data...
  • 10
  • 465
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Multi-Modal Annotation of Quest Games in Second Life" pdf

... location of the exclaiming avatar to determine if the exclamation was a result of their location (in the zone with the dead body) or because of something said or done by another player. Location of ... events involving multiple avatars over a span of time and space. While the design of the RAT tool will support annotation of any event of interest with only slight modifications, for our purposes, ... surface character-istics of utterances. In particular, we ask our anno-tators what is the pragmatic function of each utterance within the dialogue, a decision that often depends upon how earlier...
  • 9
  • 394
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Co-training for Predicting Emotions with Spoken Dialogue Data" pdf

... with spoken dialogue data. Al-though a large set of dialogues have been collected, only 8% of them have been annotated (10 dialogues with a total of 350 utterances), due to the laborious annotation ... data consists of the student turns in a set of 10 spoken dialogues randomly selected from a corpus of 128 qualitative physics tutoring dialogues between a human tutor and University of Pittsburgh ... corresponds to its expertise class with the highest confidence. The maximum number of iterations and the number of examples added per iteration are parameters of the system. While iteration...
  • 4
  • 381
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Predicting the fluency of text with shallow structural features: case studies of machine translation and human-written text" doc

... distinguishedfrom machine translations with high fluency with accuracy of 61%. In pairwise comparison of sen-tences with different fluency, accuracy of predict-ing which of the two is better is 90%. Results ... number of wordscomprising a given type of phrase, divided by thenumber of phrases of this type. It was computedfor PP, NP, VP, ADJP, ADVP. Two versions of the features were computed—one with ... which factors are predic-tive of good fluency.The distribution of fluency scores in the datasetis rather skewed, with the majority of the sen-tences rated as being of average fluency 3 as canbe...
  • 9
  • 438
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Topic Modelling for Multi-Party Spoken Discourse" ppt

... interested. Of course, this requires both identification of the top-ics discussed, and segmentation into the periods of topically related discussion.Work on automatic topic segmentation of textand ... twolevels, with each segment being produced from alinear combination of the distributions associated with each topic. Consequently, our model can of- ten capture the content of a sequence of words ... numbers of segments we are deal-ing with, a baseline of segmenting the discourse into equal-length segments gives both Pkand WDabout 50%. In order to investigate the effect of thenumber of underlying...
  • 8
  • 366
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Semantic Role Induction with Global Role Ordering" doc

... relation of an argument to its head in the dependency parsetree, (ii) head: head word of the argument, and (iii)pos-head: Part -of- Speech tag of head.Algorithm 1 describes the generative story of ... most of the in-tervals tend to have only a few types of SRs and agiven SR tends to occur only in a few types of in-tervals. The concept of intervals is also related tothe linguistic theory of ... the notion of primaryroles, and each interval generates a sequence of secondary roles and syntactic constituentsusing local features. The global role orderingconsists of the sequence of primary...
  • 5
  • 398
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Search for The Optimal Segmentation for Statistical Machine Translation" doc

... unaddressedproblem of unsupervised determination of the optimal morphological segmentation for statistical machine translation (SMT)and propose a segmentation metric thattakes into account both sides of the ... one but bothsides of the parallel corpus. A posssible choice isthe post -segmentation alignment accuracy. How-ever, Elming et al. (2009) show that optimizing segmentation with respect to alignment ... scheme“EN” of Habash and Sadat (2006). In Lee (2004),the goal is to match the lexical granularities of thetwo languages by starting with a fine-grained seg-mentation of the Arabic side of the corpus...
  • 6
  • 445
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Unsupervised Translation Induction for Chinese Abbreviations using Monolingual Corpora" ppt

... example,Bill Gates tends to appear together with Microsoft.The co-occurrence may imply a relationship (e.g.,Bill Gates is the founder of Microsoft). By inspec-tion of the Chinese text, we found that ... 50M).Measure Valuenumber of English entities 5Mnumber of Chinese entities 4.7Mnumber of full-abbreviation relations 51Knumber of translation entries added 210Ktotal number of translation entries ... Compared with English abbreviations (which are mo stlyacronyms and trun cations), the formation of Chinese abbreviations is much more complex.Due to the richness of Chinese abbreviations,many of...
  • 9
  • 444
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Analyzing the Errors of Unsupervised Learning" docx

... a sequence of wordsand the output y is the corresponding sequence of part -of- speech tags.In the PCFG, the input x is a sequence of POStags and the output y is a binary parse tree with yieldx. ... of EM contain valuable information about the incor-rect biases of these models. However, EM is chang-ing hundreds of thousands of parameters at once in anon-trivial way, so we need a way of ... thesummation of (1) is associated with one of the Klabels. We can form a K ×K matrix M, where eachentry Mijis the distance between the parameters in-volving label i of θ and label j of θ....
  • 9
  • 489
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa họcunsupervised discourse segmentation of documentstài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học công nghệ phục vụ nông nghiệp và phát triển nông thôn các tỉnh phía bắc 2006 2007 tài liệu phục vụ hội nghịbáo cáo khoa học tài chính côngNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngBáo cáo quy trình mua hàng CT CP Công Nghệ NPVchuyên đề điện xoay chiều theo dạngNghiên cứu tổ chức pha chế, đánh giá chất lượng thuốc tiêm truyền trong điều kiện dã ngoạiNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNghiên cứu về mô hình thống kê học sâu và ứng dụng trong nhận dạng chữ viết tay hạn chếTìm hiểu công cụ đánh giá hệ thống đảm bảo an toàn hệ thống thông tinThơ nôm tứ tuyệt trào phúng hồ xuân hươngQuản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Nguyên tắc phân hóa trách nhiệm hình sự đối với người dưới 18 tuổi phạm tội trong pháp luật hình sự Việt Nam (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀM