0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Exploiting Named Entity Taggers in a Second Language" ppt

Báo cáo khoa học:

Báo cáo khoa học: "Exploiting Named Entity Taggers in a Second Language" ppt

... Espa˜nola para el Proce-samiento del Lenguaje Natural, (28):63–80, May.Bogdan Babych and Anthony Hartley. 2003. Improv-ing machine translation quality with automatic named entity recognition. In ... coverage of named entity extractor systems. In this setting, we assume thatwe have available an NE extractor system for Span-ish, and we want to adapt it so that it can performNER accurately in documents ... there arelanguages that lack the linguistic resources needed,for instance, dictionaries are available in electronicform for only a handful of languages. We believethat, by using machine learning...
  • 6
  • 396
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "PDT 2.0 Requirements on a Query Language" pptx

... has as many valency frames as it has meanings (t-manual, page 105). Therefore, the query language has to be able to distinguish valency frames and search for each one of them, at least as ... IntroductionSearching in a linguistically annotated treebank is a principal task in the modern computational lin-guistics. A search tool helps extract useful infor-mation from the treebank, in order ... without an analytical counterpart may appear on the tectogrammatical layer. It is necessary that the query language ad-dresses this issue and allows access to the informa-tion from the lower layers.2.2...
  • 9
  • 351
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Japanese Named Entity Recognition based on a Simple Rule Generator and Decision Tree Learning" pdf

... training data, we can obtain NE candidatesfor the rule. By comparing the candidates with thegiven answer for the training data, we can classifythem into positive examples and negative exam-ples ... Os-aka Toyota) because Japanese POS taggers knowthat TO-YO-TA is an organization name (a kindof proper noun).*:*:location-name, *:*:org-name-> ORGANIZATION,0,0Since Yokohama Honda and ... for Japanese, and hyphens indicate char-acter boundaries. Different types of charac-ters are used in Japanese: hiragana, katakana,kanji, symbols, numbers, and letters of the Ro-man alphabet....
  • 8
  • 530
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Multilingual Named Entity Recognition using Parallel Data and Metadata from Wikipedia" potx

... in an article to another article in the same language, and interwiki links which link695Figure 2: Candidate NEs for the English and Bulgariansentences according to baseline taggers. from articles ... Smith et al.(2010) to find parallel-foreign sentences using com-parable documents linked by inter-wiki links. Theapproach uses a small amount of manually annotatedarticle-pairs to train a document-level ... amounts of information andone language might use more detail than the other.The other is that the same information might be ex-pressed using a named entity in one language, andusing a non-entity...
  • 9
  • 333
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Arabic Named Entity Recognition: Using Features Extracted from Noisy Data" doc

... Bootstrapping Noisy Arabic NER DataExtracting the syntagmatic features from thetraining data yields relatively small number ofinstances. Hence the need for additional taggeddata. The new Arabic ... that Barack Obama governs ”, glossed “SrH/declared Ams/yesterday An/thatbArAk/Barack AwbAmA/Obama ytrAs/governs ”, is parsed in Figure 1. According to the phrasestructure parse, the first parent ... automatic Arabic POS -taggers. BASE employs a multi-classifier approach whereeach classifier is tagging a NE class separately.The feature selection is performed by using an in- cremental approach selecting...
  • 5
  • 249
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Bootstrapping Named Entity Recognition with Automatically Generated Gazetteer Lists" doc

... (Collins andSinger, 1999) classified NEs through co-training,(Kozareva et al., 200 5a) used self-training and co-training to detect and classify named entities in news domain, (Shen et al., ... Bootstrapping Named Entity Recognitionwith Automatically Generated Gazetteer ListsZornitsa KozarevaDept. de Lenguajes y Sistemas Inform´aticosUniversity of AlicanteAlicante, Spainzkozareva@dlsi.ua.esAbstractCurrent ... later included in the training data.We should note that for each iteration the sameamount of B, I and O classes was included. Thusthe balance among the three different classes in thetraining...
  • 7
  • 217
  • 0
Báo cáo khoa học:

Báo cáo khoa học: " Translating Named Entities Using Monolingual and Bilingual Resources" ppt

... the Arabic daily Al-Hayat. The articles have al-ready been translated into English by professionaltranslators.3 Named entity phrases in these articleswere hand-tagged, extracted, and paired ... orAnyone as a last name. One way to do this is tosearch using wild cards. Since we are not aware ofany search engine that allows wild-card Web search,we can perform a wild-card search instead ... generate translation candidates for a given phrase , words in the phrase are first trans-lated using a bilingual dictionary and they are alsotransliterated. Our candidate generator combinesthe...
  • 9
  • 297
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Resumption strategies for an in-vehicle dialogue system" ppt

... between an ongoing task (a cardgame) and a real-time task (a picture game). Theparticipants randomly had to interrupt the ongo-ing task to solve a problem in the real-time task.When studying ... example a math task)and make the participants engage in the conversa-tion.The participants (two female and six male) be-tween the ages of 25 and 36 drove a car in pairswhile interviewing ... performing an additional, safety crit-ical, task - driving. The so-called 100-car study(Neale et al., 2005) revealed that secondary taskdistraction is the largest cause of driver inatten-tion, and...
  • 8
  • 404
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Non-Projective Dependency Parsing in Expected Linear Time" pptx

... different parsing models, in particular data-driven models that can be trainedon syntactically annotated corpora (Yamada andMatsumoto, 2003; Nivre et al., 2004; McDonaldet al., 200 5a; Attardi, ... based on treebank datashow that the expected running time is in fact linear for the range of data attested in the corpora. Evaluation on data from fivelanguages shows state-of-the-art accuracy,with ... linear in sentence length for naturallyoccurring data.4.2 Parsing Accuracy In order to assess the parsing accuracy that canbe achieved with the new transition system, wetrained a deterministic...
  • 9
  • 627
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Constraints over Lambda-Structures in Semantic Under specification" pptx

... ery anaphor has exactly one antecendent; (5) antecedents are terminal nodes; (6) there are no cyclic link chains; (7) if a link chain ends at a variable then each anaphor in the chain must ... consistent renaming of bound vari- ables (a- equality). Instead of variable names, a A-structure provides a partial function on tree-nodes for expressing variable binding. An graphical illustration ... requires variables to be renamed apart but parallelism needs par- allel bound variables to be named alike. We avoid all capturing and renaming prob- lems by introducing the notion of A- structures,...
  • 7
  • 342
  • 0

Xem thêm

Từ khóa: Nghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Định tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Chuong 2 nhận dạng rui roTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Kiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtĐổi mới quản lý tài chính trong hoạt động khoa học xã hội trường hợp viện hàn lâm khoa học xã hội việt namMÔN TRUYỀN THÔNG MARKETING TÍCH HỢPQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ