0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Using linguistic principles to recover empty categories" ppt

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using linguistic principles to recover empty categories" ppt

... The term recovery refers to the complete package: detection, resolution, and assignment of function tags to empty categories. 2 Empty nodes in the Penn Treebank The major types of empty category ... iterate over nodes from top down 2 for each node X 3 try to insert NP* in X 4 try to insert 0 in X 5 try to insert WHNP 0 or WHADVP 0 in X 6 try to insert *U* in X 7 try to insert a VP ellipsis ... inserted by the annotator, who is consciously following explicit linguistic principles, in this case, the principles of early GB theory. As a result, the recovery of empty categories is, for...
  • 8
  • 423
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using adaptor grammars to identify synergies in the unsupervised acquisition of linguistic structure" docx

... some types of linguistic struc-ture. Because of this, less linguistic structure needs to be “built in” to an adaptor grammar compared to acomparable PCFG. For example, the adaptor gram-mars ... tree under the adaptor grammar and the PCFGapproximation.3 Word segmentation with adaptorgrammarsWe now turn to linguistic applications of adap-tor grammars, specifically, to models of unsu-pervised ... Computational LinguisticsUsing adaptor grammars to identify synergiesin the unsupervised acquisition of linguistic structureMark JohnsonBrown UniversityMarkJohnson@Brown.eduAbstractAdaptor grammars...
  • 9
  • 643
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Multiple Sources to Construct a Sentiment Sensitive Thesaurus for Cross-Domain Sentiment Classification" doc

... automatic method to createa thesaurus that is sensitive to the sentiment ofwords expressed in different domains.• We describe a method to use the created the-saurus to expand feature vectors ... vector d ∈ RN, where thevalue of the j-th element djis set to the total numberof occurrences of the unigram or bigram wjin thereview d. To find the suitable candidates to expand avector ... have not previously been applied to the task of cross-domain sentiment classification.In our method, we use the automatically createdthesaurus to expand feature vectors in a binary clas-sifier at...
  • 10
  • 555
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Confidence Bands for Parallel Texts Alignment" pptx

... secondclass from 2769 to 5538 and so forth.With this histogram, we are able to identifythose words which are too far apart from theirexpected positions. In Figure 2, the gap in thehistogram makes ... Pointsfiltered points3297Figure 2: Histogram of the distances betweenexpected and real word positions.In order to build this histogram, we use theSturges rule (see ‘Histograms’ in Samuel Kotz etal. ... helpedJean-François Champollion to decipher the Ro-setta Stone for there was a name of a King(Ptolemy V) which occurred the same number oftimes in the ‘parallel texts’ of the stone.Each pair of texts...
  • 8
  • 463
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "USING BRACKETED PARSES TO EVALUATE A GRAMMAR CHECKING APPLICATION" ppt

... a more complex approach to evaluat- ing the performance of the system's ability to detect errors. Here, we need to look at both the 1. We use the term critique to represent an instance ... In order to coerce our system into accepting only the desired parse tree, we modified it to ac- cept only parses that satisfied bracketed forms. 6. The BSEC has the capability to report on ... used to flag errors in more conventional checkers. It cannot afford simply to ignore sen- tences that are too complex to handle. As a con- trolled sublanguage, Simplified English requires 2....
  • 8
  • 398
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Obfuscating Document Stylometry to Preserve Author Anonymity" pptx

... that there are two ways to apply this information. The first is to simply correct the term to conform to the norms as defined by the authors in K. The second approach is to incorpo-rate characteristic ... discriminators, but it also means that we do not have a threshold value to drive the feature adjustment process. Token DTR Frequency Token DTR Frequency the , of to . and ... difficult to train a classifier to distinguish between M and D’ as it is to distinguish between H and D’. In this graph, the “0” curve corresponds to the original docu-ment, and the “14” curve to...
  • 8
  • 377
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Smaller Constituents Rather Than Sentences in Active Learning for Japanese Dependency Parsing" docx

... CorporationMidtown Tower,9-7-1 Akasaka, Minato-ku,Tokyo 107-6211, Japanmsassano@yahoo-corp.jpSadao KurohashiGraduate School of Informatics,Kyoto UniversityYoshida-honmachi, Sakyo-ku,Kyoto 606-8501, ... Simon Tong and Daphne Koller. 2000. Support vec-tor machine active learning with applications to textclassification. In Proc. of ICML-2000, pages 999–1006.Kiyotaka Uchimoto, Satoshi Sekine, ... have to note that it may be easier to annotate a whole sentence than some bunsetsupairs in a sentence9. In a real annotation task, itwill be better to show a whole sentence to anno-tators...
  • 10
  • 432
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Cross-Entity Inference to Improve Event Extraction" docx

... (CLUTO toolkit)3 is used to divide it into different cohesive subtypes, each of which only contains the entities of the same background. For instance, the Air entities will be divided into ... entity. After establishing the vector space model (VSM) for each entity mention of the type, we adopt a clustering toolkit (CLUTO) to further divide the mentions into different subtypes. Finally, ... Association for Computational Linguistics, pages 1127–1136,Portland, Oregon, June 19-24, 2011.c2011 Association for Computational LinguisticsUsing Cross-Entity Inference to Improve Event Extraction...
  • 10
  • 530
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Structural Information for Identifying Similar Chinese Characters" pdf

... for computer-assisted language learning and for psycholinguistic studies. Al-though it is possible for us to employ image-based methods to identify visually similar characters, the resulting ... The sentence “經理要我構買一部計算機” also con- † We use Arabic digits to denote the four tones in Mandarin. tains an error, and we need to replace “構買” with “購買”. “構買” is considered an incorrect word, ... in similar ways, e.g., “構” with “購”, in an efficient way. It is intriguing to resort to image processing methods to find such structurally similar words, but the computational costs can be...
  • 4
  • 415
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Using Automatically Transcribed Dialogs to Learn User Models in a Spoken Dialog System" doc

... Computational LinguisticsUsing Automatically Transcribed Dialogs to Learn User Models in a SpokenDialog SystemUmar SyedDepartment of Computer SciencePrinceton UniversityPrinceton, NJ 08540, ... Atand˜Atare all assumed to belong to finite sets, and so all the conditional distributionsin our model are multinomials. Hence θ is a vec-tor that parameterizes the user model according to Pr(At= a ... . . converges to a stationary pointestimate of θ∗that is usually a local maximum.3 Target Application To test the method, we applied it to a voice-controlled telephone directory. This system...
  • 4
  • 470
  • 0

Xem thêm

Từ khóa: Nghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu tổ chức chạy tàu hàng cố định theo thời gian trên đường sắt việt namđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEQuản lý hoạt động học tập của học sinh theo hướng phát triển kỹ năng học tập hợp tác tại các trường phổ thông dân tộc bán trú huyện ba chẽ, tỉnh quảng ninhPhối hợp giữa phòng văn hóa và thông tin với phòng giáo dục và đào tạo trong việc tuyên truyền, giáo dục, vận động xây dựng nông thôn mới huyện thanh thủy, tỉnh phú thọTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Định tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíBT Tieng anh 6 UNIT 2Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt nam