0
  1. Trang chủ >
  2. Luận Văn - Báo Cáo >
  3. Báo cáo khoa học >

Báo cáo khoa học: "Multilingual Document Clustering: an Heuristic Approach Based on Cognate Named Entities" docx

Báo cáo khoa học:

Báo cáo khoa học: "Multilingual Document Clustering: an Heuristic Approach Based on Cognate Named Entities" docx

... process non-English documents are trans-lated using simple dictionary lookup techniquesfor translating Japanese and Russian documents,and the Systran translation system for the otherlanguages ... MDC by Cognate NE IdentificationWe propose an approach for MDC based only on cognate NE identification. The NEs cate-gories that we take into account are: PERSON,ORGANIZATION, LOCATION, and MISCEL-LANY. ... other hand, methods based on language-independent representation also havelimitations. For instance, those based on thesaurusdepend on the thesaurus scope. Numbers or datesidentification can be...
  • 8
  • 421
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Ensemble Document Clustering Using Weighted Hypergraph Generated by NMF" docx

... goal, including ran-dom initialization (Fred and Jain, 2002), feature ex-traction based onrandom projection (Fern andBrod-ley, 2003) and the combination of sets of “weak”partitions (Topchy et ... 1990). Dimensional reduc-tion maps data in a high-dimensional space into alow-dimensional space, and improves both cluster-ing accuracy and speed.NMF is a dimensional reduction method (Xu ... from.For a given term -document matrix, we can ob-tainand by the following iteration (Lee andSeung, 2000):(1)(2)Here,, and represent the -th rowandthe-th columnelement of , and respectively.After...
  • 4
  • 393
  • 0
Tài liệu Báo cáo khoa học:

Tài liệu Báo cáo khoa học: "Selecting the “Right” Number of Senses Based on Clustering Criterion Functions" pdf

... solutions for all values ofk from 1 N , and then determines the mean andstandard deviation of the criterion function. Then,a score is computed for each value of k by sub-tracting the mean from ... from the criterion function, anddividing by the standard deviation. We adapt thistechnique by using the H2 criterion function, andlimit k from 1 deltaK:P K1(k) =H2(k) − mean(H2[1 deltaK])std(H2[1 ... dif-ferent configurations of our clustering approach, in order to determine how consistent the selectedvalue of k is in the face of changing feature setsand context representations. The four configura-tions...
  • 4
  • 361
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "The Treegram Index An Efficient Technique for Retrieval in Linguistic Treebanks" docx

... Index An Efficient Technique for Retrieval in Linguistic Treebanks Hans Argenton and Anke Feldhaus Infineon Technologies, DAT CIF, Postbox 801709, D-81617 Miinchen hans.argenton@infineon.com ... which han- dles the BH t (Biblia Hebraica transeripta) treebank comprising 508,650 phrase struc- ture trees with maximum degree eight and maximum height 17, containing altogether 3.3 million ... retrieval based on treegrams The base entities of the tree-retrieval problem for positional MTs are (labeled) rooted MTs where children are distin- guished by their position. Let s and t be...
  • 2
  • 327
  • 0
Báo cáo khoa học: A new clan of CBM families based on bioinformatics of starch-binding domains from families CBM20 and CBM21 potx

Báo cáo khoa học: A new clan of CBM families based on bioinformatics of starch-binding domains from families CBM20 and CBM21 potx

... with acommon ancestry, very similar tertiary structure andconserved catalytic machinery and reaction mechanism[79]. Here we propose that a clan of carbohydrate-binding modules contains CBM ... Minassian BA, Ianzano L, Meloche M, Andermann E,Rouleau GA, Delgado-Escueta AV & Scherer SW(2000) Mutation spectrum and predicted function oflaforin in Lafora’s progressive myoclonus epilepsy.Neurology ... functional, and evolutionary relationships.Proteins 29, 334–347.65 Williamson MP, Le Gal-Coeffet MF, Sorimachi K,Furniss CS, Archer DB & Williamson G (1997) Func-tion of conserved tryptophans...
  • 17
  • 476
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "A Framework for Figurative Language Detection Based on Sense Differentiation" pptx

... rep-resent senses of both an expression and a contextas sets of documents. Our hypothesis is that these document sets differ significantly if and only if an expression is used figuratevely. Thus, ... similar meanings areoften used in similar contexts. As it was men-tioned, we can treat a meaning of a metaphoricusage of an expression as an additional, not com-mon for the expression. That’s ... 90%. Our approach is also based on the idea of the relatedness between the expres-sion and the surrounding context. Unlike the men-tioned study, we do not focus our attention only on idioms....
  • 6
  • 540
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Automatic Acquisition of English Topic Signatures Based on a Second Language" potx

... as context vectors inConcept Space. A context vector is the sum of thevectors of concepts that occur in a context win-dow. If many of the concepts in a window have astrong component for one ... wChinese translation ofsense 2Chinese translation ofsense 1English-ChineseLexicon1. Chinese document 12. Chinese document 2 ChineseSearchEngineChinesesegmentationand POStagging;Chinese-EnglishLexicon1. ... only content words areincluded in our final results.One might argue that, since many Chinesewords are also ambiguous, a Chinese word mayhave more than one English translation and thustranslated...
  • 6
  • 471
  • 0
Báo cáo khoa học:

Báo cáo khoa học: " Word Sense Disambiguation in Untagged Text based on Term Weight Learning" ppt

... that wv and nq are semantically related if w~i and nq are se- mantically related and (wp, nq) and (w~i , nq) are semantically similar (Dagan et al., 1993). Us- ing the estimation, collocations ... between vl and nj. We recall that wp and nq are semantically re- lated if w~i and nq are semantically related and (wv,n q) and (w'pi,nq) are semantically similar. (a) ' and nq are ... I. Dagan, P. Fernando, and L. Lilian. 1993. Con- textual word similarity and estimation from sparse data. In Proc. of the 31th Annual Meet- ing of the ACL, pages 164-171. F. Fukumoto and...
  • 8
  • 316
  • 0
Báo cáo khoa học:

Báo cáo khoa học: "Dependency Parsing of Japanese Spoken Monologue Based on Clause Boundaries" docx

... University, Japan‡Information Technology Center, Nagoya University, Japan§ATR Spoken Language Communication Research Laboratories, JapanThe National Institute for Japanese Language, JapanFaculty ... Parsing Based on ClauseBoundariesIn accordance with the assumption described inSection 2, in our method, the transcribed sentence on which morphological analysis, clause bound-ary detection, and ... lecture andcommentary by a professional have been consid-ered as human valuable intellectual property andhave gathered attention. In applications, such asautomatic summarization, machine translation...
  • 8
  • 346
  • 0
Báo cáo khoa học: Diversity of human U2AF splicing factors Based on the EMBO Lecture delivered on 7 July 2005 at the 30th FEBS Congress in Budapest pptx

Báo cáo khoa học: Diversity of human U2AF splicing factors Based on the EMBO Lecture delivered on 7 July 2005 at the 30th FEBS Congress in Budapest pptx

... gene functions, as well as by the creationand loss of different exons. Both the emergence ofadditional genomic copies by gene duplication and ret-rotransposition, and an increase in transcript ... mRNAs and ESTs for thisgene region. Making allowance only for GT_AG,GC_AG or AT_AC splice site consensus and excludingisoforms with extensive intron retentions, the non-redundant set of longest ... CAPERb,and both CAPER (renamed CAPERa) and CAPERbwere shown to regulate transcription and alternativesplicing in a steroid hormone-dependent manner [24].Importantly, both CAPERa and CAPERb...
  • 10
  • 410
  • 0

Xem thêm

Từ khóa: báo cáo khoa học mẫubáo cáo khoa học y họcbáo cáo khoa học sinh họcbáo cáo khoa học nông nghiệpbáo cáo khoa học lâm nghiệpNghiên cứu sự hình thành lớp bảo vệ và khả năng chống ăn mòn của thép bền thời tiết trong điều kiện khí hậu nhiệt đới việt namGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitGiáo án Sinh học 11 bài 13: Thực hành phát hiện diệp lục và carôtenôitĐỒ ÁN NGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWANNGHIÊN CỨU CÔNG NGHỆ KẾT NỐI VÔ TUYẾN CỰ LY XA, CÔNG SUẤT THẤP LPWAN SLIDEPhát triển mạng lưới kinh doanh nước sạch tại công ty TNHH một thành viên kinh doanh nước sạch quảng ninhPhát triển du lịch bền vững trên cơ sở bảo vệ môi trường tự nhiên vịnh hạ longPhát hiện xâm nhập dựa trên thuật toán k meansNghiên cứu tổng hợp các oxit hỗn hợp kích thƣớc nanomet ce 0 75 zr0 25o2 , ce 0 5 zr0 5o2 và khảo sát hoạt tính quang xúc tác của chúngThơ nôm tứ tuyệt trào phúng hồ xuân hươngChuong 2 nhận dạng rui roKiểm sát việc giải quyết tố giác, tin báo về tội phạm và kiến nghị khởi tố theo pháp luật tố tụng hình sự Việt Nam từ thực tiễn tỉnh Bình Định (Luận văn thạc sĩ)Giáo án Sinh học 11 bài 15: Tiêu hóa ở động vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtGiáo án Sinh học 11 bài 14: Thực hành phát hiện hô hấp ở thực vậtBÀI HOÀN CHỈNH TỔNG QUAN VỀ MẠNG XÃ HỘIChiến lược marketing tại ngân hàng Agribank chi nhánh Sài Gòn từ 2013-2015HIỆU QUẢ CỦA MÔ HÌNH XỬ LÝ BÙN HOẠT TÍNH BẰNG KIỀMTÁI CHẾ NHỰA VÀ QUẢN LÝ CHẤT THẢI Ở HOA KỲ