0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "A Joint Rule Selection Model for Hierarchical Phrase-based Translation" pptx

Báo cáo khoa học:

Báo cáo khoa học: "A Joint Rule Selection Model for Hierarchical Phrase-based Translation" pptx

... China{dozhang,muli,mingzhou}@microsoft.comAbstractIn hierarchical phrase-based SMT sys-tems, statistical models are integrated toguide the hierarchical rule selection for better translation performance. Previouswork mainly focused on the selection ... the joint probability model intotwo sub-models based on the Bayes formulation,where the first sub -model is source-side rule se-lection model and the second one is the target-side rule selection ... Asia as an intern.proper rule selection for hypothesis generation, in-cluding both source-side rule selection and target-side rule selection where the source-side rule de-termines what part...
  • 6
  • 314
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Syntax-Driven Bracketing Model for Phrase-Based Translation" pptx

... VP on the right,therefore CBMF is “VP-RC”.3.3 The Integration of the SDB Model into Phrase-Based SMTWe integrate the SDB model into phrase-based SMT to help decoder perform syntax-drivenphrase ... to the binaryBTG rules.The SDB model, however, is not only limitedto phrase-based SMT using BTG rules. Since itis applied on a source span each time, any other hierarchical phrase-based or ... then8: Update bracketing instances for index j9: end if10: end if11: end for 12: for each j ∈ c do13: :=  ∪ {bracketing instances from j}14: end for 15: Output: bracketing instances...
  • 9
  • 438
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Joint Source-Channel Model for Machine Transliteration" doc

... source-channel model In view of the close coupling of the source and target transliteration units, we propose to estimate P(E,C) by a joint source-channel model, or n-gram transliteration model (TM). For ... 12,742 Table 1. Modeling statistics The most common metric for evaluating an n-gram model is the probability that the model assigns to test data, or perplexity (Jelinek, 1991). For a test set ... words sound in their original languages. For writing foreign names in Chinese, transliteration always follows the original romanization. Therefore, any foreign name will have only one Pinyin...
  • 8
  • 289
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Discriminative Latent Variable Model for Statistical Machine Translation" pdf

... model performs betterthan a maximum likelihood model; (3) how the per-formance of our model compares with a frequencycount based hierarchical system; and (4) how trans-lation performance ... decoding for the model trained on singlederivations has only a small positive effect, while for the latent variable model the impact is much larger.6 For example, our max-derivation model trainedon ... impact of accounting for allderivations in training and decoding (development set).positive count for every rule (7.8M), the discrimina-tive model only observes 1.7M rules in actual refer-ence...
  • 9
  • 291
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A MARKOV LANGUAGE LEARNING MODEL FOR FINITE PARAMETER SPACES" pptx

... diachronic change remains a topic for fu- ture investigation. As far as we know, the possibility for formally modeling the kind of saltation indicated by the Markov model has not been noted previously ... sociation for Computational Linguistics. Pitts- burgh, PA: Association for Computational Linguis- tics, 243-251. Dresher, Elan and Kaye, Jonathan (1990). "A Compu- tational Learning Model For ... (1980). Formal Principles of Language Acquisition. Cambridge, MA: MIT Press. 180 A MARKOV LANGUAGE LEARNING MODEL FOR FINITE PARAMETER SPACES Partha Niyogi and Robert C. Berwick Center for...
  • 10
  • 264
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Stacked Sub-Word Model for Joint Chinese Word Segmentation and Part-of-Speech Tagging" potx

... oftenprovides important clues for POS tagging, and thePOS tags contain much syntactic information, whichneed context information within a large window for disambiguation. For example, Huang et al. ... 1385–1394,Portland, Oregon, June 19-24, 2011.c2011 Association for Computational LinguisticsA Stacked Sub-Word Model for Joint Chinese Word Segmentation andPart-of-Speech TaggingWeiwei ... June. Association for Computational Lin-guistics.Yue Zhang and Stephen Clark. 2010. A fast decoder for joint word segmentation and POS-tagging using a sin-gle discriminative model. In Proceedings...
  • 10
  • 412
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Progressive Feature Selection Algorithm for Ultra Large Feature Spaces" doc

... efficient PFS algorithm. At the beginning of each round for feature se-lection, a uniform prior distribution is always assumed for the new CME model. A more pre-cise description of the PFS algorithm ... unlimited feature spaces for conditional maximum entropy (CME) modeling. Experi-mental results in edit region identification demonstrate the benefits of the progressive feature selection (PFS) algorithm: ... CME modeling is the ability to incorporate a variety of features in a uniform framework with a sound mathematical foundation. Recent improvements on the original incremental feature selection...
  • 8
  • 388
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Trainable Rule-based Algorithm for Word Segmentation" pdf

... adopting it for word segmentation. For example, since word seg- mentation is merely a preprocessing task for a wide variety of further tasks such as parsing, information extraction, and information ... acquire the rules, rather than expensive manual knowledge engineering. The rules produced can be inspected, which is useful for gain- ing insight into the nature of the rule sequence and for manual ... transformation-based problem, which requires an initial model, a goal state into which we wish to transform the initial model (the "gold standard"), and a series of transformations...
  • 8
  • 470
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Unified Syntactic Model for Parsing Fluent and Disfluent Speech∗" ppt

... Right-corner transformBinarized trees2are then transformed into right-corner trees using transform rules similar to thosedescribed by Johnson(1998a). This right-cornertransform is simply the ... repair above, the well-formedness rule says that the repair is well formed if the frag-ment a flight to Boston and to Denver is gram-matical. In this case the repair is well formed sincethe conjunction ... well-formedness rule. This rule states that the constituent started in the reparan-dum and repair are ultimately of syntactic types thatcould be grammatically joined by a conjunction. For example,...
  • 4
  • 581
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "A Phrase-based Statistical Model for SMS Text Normalization" ppt

... (3) This is the basic function of the channel model for the phrase-based SMS normalization model, where we used the maximum approximation for the sum over all segmentations. Then we further ... normalization model consists of two sub-models: a word-based language model (LM), characterized by1(| )nnPee−)k and a phrase-based lexical mapping model (channel model) , characterized ... bootstrap parallel data using off-the-shelf translation sys-tems for training a hierarchical statistical transla-tion model for general domain instant messaging used in Internet chat rooms....
  • 8
  • 399
  • 0

Xem thêm

Từ khóa: báo cáo khoa họcbáo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpNghiên cứu sự biến đổi một số cytokin ở bệnh nhân xơ cứng bì hệ thốngchuyên đề điện xoay chiều theo dạngNghiên cứu vật liệu biến hóa (metamaterials) hấp thụ sóng điện tử ở vùng tần số THzGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhTrả hồ sơ điều tra bổ sung đối với các tội xâm phạm sở hữu có tính chất chiếm đoạt theo pháp luật Tố tụng hình sự Việt Nam từ thực tiễn thành phố Hồ Chí Minh (Luận văn thạc sĩ)Phát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longNghiên cứu khả năng đo năng lượng điện bằng hệ thu thập dữ liệu 16 kênh DEWE 5000Định tội danh từ thực tiễn huyện Cần Giuộc, tỉnh Long An (Luận văn thạc sĩ)Thơ nôm tứ tuyệt trào phúng hồ xuân hươngThiết kế và chế tạo mô hình biến tần (inverter) cho máy điều hòa không khíKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Quản lý nợ xấu tại Agribank chi nhánh huyện Phù Yên, tỉnh Sơn La (Luận văn thạc sĩ)Tranh tụng tại phiên tòa hình sự sơ thẩm theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn xét xử của các Tòa án quân sự Quân khu (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtQUẢN LÝ VÀ TÁI CHẾ NHỰA Ở HOA KỲ