0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Tài liệu Báo cáo khoa học: "Improving Statistical Machine Translation with Monolingual Collocation" pdf

Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Statistical Machine Translation with Monolingual Collocation" pdf

... 11-16 July 2010.c2010 Association for Computational LinguisticsImproving Statistical Machine Translation with Monolingual Collocation Zhanyi Liu1, Haifeng Wang2, Hua Wu2, Sheng Li1 ... paper proposes to use monolingual collocations to improve Statistical Ma-chine Translation (SMT). We make use of the collocation probabilities, which are estimated from monolingual corpora, ... Speech Translation Evalua-tion. In Processings of the International Workshop on Spoken Language Translation 2005. Philipp Koehn, Franz J. Och, and Daniel Marcu. 2003. Statistical Phrase-based Translation. ...
  • 9
  • 474
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Resolution for Machine Translation of Telegraphic Messages" docx

... leads to a mistranslation in a machine translation system. Therefore, the issue becomes how to parse tele.graphic messages accurately and efficiently to produce high quahty translation output. ... Misparsing re- duced by omissions has a far-reaching consequence in machine translation. Namely, a misparse of the input often leads to a translation into the target language which has incoherent meaning ... efficiently becomes a critical issue in machine translation. In this paper we describe a technical solution for the issue, and reSent the performance evaluation of a machine trans- tion system on telegraphic...
  • 8
  • 365
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "SUBLANGUAGES IN MACHINE TRANSLATION" pdf

... system within the computer-aided Saarbriicken Translation System (STS), i.e. in human-aided MT and in machine- aided human translation. Titles of scientific papers from German databases were machine- translated ... sublanguage notion for disambi- guation and the selection of target language equivalents in machine translation. In this paper a theoretical concept and its imple- mentation in a real MT application ... Luckhardt 1984) to use the sublanguage notion for solving some of the notorious problems in machine translation (MT) such as disambiguation and selection of target language equivalents. In...
  • 3
  • 476
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Statistical Model for Unsupervised and Semi-supervised Transliteration Mining" pptx

... thetransliteration pairs. We propose a second modelp2(e, f ) to deal with non-transliteration pairs (the“non-transliteration model”). Interpolation with thenon-transliteration model allows the transliterationmodel ... initialized with a uniform distribu-tion and λ is set to 0.5.The expected count of a multigram q (E-step) iscomputed by multiplying the posterior probabilityof each alignment a with the frequency ... standard way (Deligne and Bimbot,1995). Consider a node r which is connected with a node s via an arc labelled with the multigram q.The expected count of a transition between r and sis calculated...
  • 9
  • 521
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Word Representations via Global Context and Multiple Word Prototypes" pdf

... learningalgorithms and as extra word features in NLPsystems. However, most of these models arebuilt with only local context and one represen-tation per word. This is problematic becausewords are ... accountsfor homonymy and polysemy by learning mul-tiple embeddings per word. We introduce anew dataset with human judgments on pairs ofwords in sentential context, and evaluate ourmodel on it, showing ... other neurallanguage models.11 IntroductionVector-space models (VSM) represent word mean-ings with vectors that capture semantic and syntac-tic information of words. These representations canbe...
  • 10
  • 494
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Chinese Semantic Role Labeling with Rich Syntactic Features" ppt

... information of sub-trees in a givenparse. With help of these new features, our sys-tem achieves 93.49 F-measure with hand-craftedparses. Comparison with the best reported results,92.0 (Xue, ... arguments of a predicate are la-beled with a contiguous sequence of integers, inthe form of AN (N is a natural number); the ad-juncts are annotated as such with the label AMfollowed by a secondary ... denotea candidate constituent ck with a fixed contextwi−1[ckwi wh wj]wj+1, where whis the headword of ck, and denote predicate in focus with a context wv−2wv−1wvwv+1wv+2,...
  • 5
  • 364
  • 0
Tài liệu Báo cáo khoa học: Improving Classification of Medical Assertions in Clinical Notes

Tài liệu Báo cáo khoa học: Improving Classification of Medical Assertions in Clinical Notes" pdf

... instances with that label as positive instances and instances with any other label as negative instanc-es. The final class label is assigned by choosing the class that was assigned with the ... its performance with our original system. 4.1 Data The training set includes 349 clinical notes, with 11,967 assertions of medical problems. The test set includes 477 texts with 18,550 assertions. ... assertion categories: absent, hypothet-ical, historical, and not associated with the patient. Uzuner et al. (2009) developed the Statistical As-sertion Classifier (StAC) and showed that a ma-chine...
  • 6
  • 496
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving Automatic Speech Recognition for Lectures through Transformation-based Rules Learned from Minimal Data" ppt

... Li, 2007).1Even with all of these,however, there remains a significant gap betweenthis WER and the threshold of 25%, at which lec-ture transcripts have been shown with statistical significance ... you⇓Output all rules for replacing the incorrect ASRsequence with the correct text, using the entiresequence (a) or splices (b), with or withoutsurrounding anchors:(a) the okay one and / ok why ... how the transcripts improve, words with lower information content (e.g., a lower tf.idfscore) are corrected more often and with moreimprovement than words with higher informationcontent. The...
  • 9
  • 427
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Improving the Scalability of Semi-Markov Conditional Random Fields for Named Entity Recognition" pdf

... Onthe other hand, the system with preceding infor-mation is not significantly better than the systemwithout it5. Other non-local information may im-prove performance with our framework and this ... of the classifier on development data is 74.64(without preceding information) and 75.14 (with precedinginformation).470Table 5: Performance with filtering on the development data. (< 1.0 ... data without filtering required muchlarger memory resources (estimated to be about80G Byte) than was possible for our experimentalsetup. We thus compared the result of the recog-nizers with...
  • 8
  • 527
  • 0

Xem thêm

Từ khóa: tài liệu báo cáo khoa họctài liệu báo cáo nghiên cứu khoa họctài liệu về báo cáo khoa họcbáo cáo khoa học tài chính côngbáo cáo khoa học số loài quý hiếm tại vườn quốc gia ba bểNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namMột số giải pháp nâng cao chất lượng streaming thích ứng video trên nền giao thức HTTPNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzđề thi thử THPTQG 2019 toán THPT chuyên thái bình lần 2 có lời giảiPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu, xây dựng phần mềm smartscan và ứng dụng trong bảo vệ mạng máy tính chuyên dùngĐịnh tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíChuong 2 nhận dạng rui roTổ chức và hoạt động của Phòng Tư pháp từ thực tiễn tỉnh Phú Thọ (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtchuong 1 tong quan quan tri rui roGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtHIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ