báo cáo thực tập tại đến công ty outsourceit vietnam đối tượng rút trích metadata của đề tài là những bài báo khoa học và có định dạng là tập tin PDF

42 792 0
báo cáo thực tập tại đến công ty outsourceit vietnam đối tượng rút trích metadata của đề tài là những bài báo khoa học và có định dạng là tập tin PDF

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 LỜI CẢM ƠN Đầu tiên, xin gửi lời cảm ơn chân thành đến thầy ThS Huỳnh Ngọc Tín giúp đỡ giới thiệu thực tập Cơng ty Outsourceit Vietnam Khơng thế, q trình thực tập thầy bảo hướng dẫn tận tình cho tơi kiến thức lý thuyết, kỹ lập trình, cách giải vấn đề, đặt câu hỏi … Thầy người truyền động lực tơi, giúp tơi hồn thành tốt giai đoạn thực tập tốt nghiệp Cho phép gửi lời cảm ơn sâu sắc đến Công ty Outsourceit Vietnam tạo điều kiện thuận lợi giúp sinh viên khác hoàn thành giai đoạn thực tập tốt nghiệp Chân thành cảm ơn đến bạn nhóm thực tập hỗ trợ để tơi hồn thành tốt cơng việc giao Tơi xin chân thành biết ơn tận tình dạy dỗ tất quý thầy cô Khoa Công nghệ phần mềm – Trường Đại học Công Nghệ Thông Tin – Đại học Quốc gia TPHCM Lời cảm ơn chân thành sâu sắc, tơi xin gửi đến gia đình, ln sát cánh động viên giai đoạn khó khăn Sinh viên Võ Đinh Duy Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 ACKNOWLEDGMENTS I would like to send my sincere thank to Md Huynh Ngoc Tin for the support and introducing me to Outsourceit Vietnam Company From what he has taught me how to apply theory into application, the skills of raising questions, solving problems all are valuable lessons that I have learned from my dedicated tutor that helps me complete my internship well Moreover, I would like to send my appreciations to Outsourceit Vietnam Company for giving me the chance to work in professional software company with many advantages provided for internship and great colleagues network All my thanks to my internship group, who has worked with me inspirationally so that we could complete our work well With the strong support from Software Engineering Department- University of Information Technology - Vietnam National University, Ho Chi Minh City where I have been taught good fundamental knowledge which brings to me confidence and success in this internship Last but not least, my special thank is for my family who always strongly support and motivate me from all difficulties Student Vo Dinh Duy Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 ĐÁNH GIÁ KẾT QUẢ CỦA CƠ QUAN THỰC TẬP ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 ĐÁNH GIÁ KẾT QUẢ THỰC TẬP CỦA KHOA ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… ………………………………………………………………………………… Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 MỤC LỤC LỜI CẢM ƠN ACKNOWLEDGMENTS .2 ĐÁNH GIÁ KẾT QUẢ CỦA CƠ QUAN THỰC TẬP ĐÁNH GIÁ KẾT QUẢ THỰC TẬP CỦA KHOA MỤC LỤC .5 DANH MỤC BẢNG CHƯƠNG 1: TỔNG QUAN VỀ QUÁ TRÌNH THỰC TẬP 11 1.1Giới thiệu 11 Bảng 1: Tóm tắt trình thực tập tốt nghiệp 11 1.2Công ty Outsourceit Vietnam .12 1.3Đề tài thực tập 12 1.3.1Đặt vấn đề 12 1.3.2Mục tiêu 13 1.3.3Phạm vi nghiên cứu .13 1.3.4Khảo sát nghiên cứu liên quan 13 1.3.5Nội dung công việc thực 14 1.3.6Kết dự kiến 15 1.4 Mục tiêu, thời gian kế hoạch thực tập 15 1.4.1Mục tiêu: .15 1.4.2Thời gian kế hoạch thực tập: 15 Bảng 2: Kế hoạch thực tập 18 1.5 Bố cục báo cáo 18 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 19 Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 2.1Giới thiệu JAPE .19 2.2Luật JAPE 19 2.3 Độ ưu tiên Jape 21 2.3.1Brill 21 2.3.2All 21 2.3.3First 21 2.3.4Once 22 2.3.5Appelt 22 2.4Vế trái (Left-Hand Side) .22 2.4.1So khớp với chuỗi ký tự 23 2.4.2So khớp với loại thích khác (Annotation Types) .23 Bảng 3: Các đặc tính vài loại thích 27 2.4.3Macro 27 2.4.4Toán tử vế trái 28 Bảng 4: Các toán tử vế trái luật ngữ pháp JAPE 30 2.5Vế phải (Right-Hand Side) 30 CHƯƠNG 3: HIỆN THỰC CÁC LUẬT JAPE 32 3.1Hiện thực việc rút tác giả 34 3.2Hiện thực việc rút năm xuất nơi công bố 34 Hình 1: Luật idrs_publish thực thi GATE 35 3.3Hiện thực việc rút thông tin Reference .35 Hình 2: Rút thơng tin: tác giả, tiêu đề, năm xuất reference .36 CHƯƠNG 4: HIỆN THỰC HỆ THỐNG .37 4.1Thông tin tổng quan 37 Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 4.2Giao diện 37 Hình 3: Giao diện hình Build Corpus 38 Hình 4: Thêm tài liệu vào Corpus .39 Hình 5: Thêm tài liệu thành công vào Corpus 39 Hình 6: Giao diện hình Metadata Extraction 40 4.3Thực nghiệm đánh giá 41 KẾT LUẬN 42 TÀI LIỆU THAM KHẢO .43 Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 DANH MỤC BẢNG LỜI CẢM ƠN ACKNOWLEDGMENTS .2 ĐÁNH GIÁ KẾT QUẢ CỦA CƠ QUAN THỰC TẬP ĐÁNH GIÁ KẾT QUẢ THỰC TẬP CỦA KHOA MỤC LỤC .5 DANH MỤC BẢNG CHƯƠNG 1: TỔNG QUAN VỀ QUÁ TRÌNH THỰC TẬP 11 1.1Giới thiệu 11 Bảng 1: Tóm tắt q trình thực tập tốt nghiệp 11 1.2Công ty Outsourceit Vietnam .12 1.3Đề tài thực tập 12 1.3.1Đặt vấn đề 12 1.3.2Mục tiêu 13 1.3.3Phạm vi nghiên cứu .13 1.3.4Khảo sát nghiên cứu liên quan 13 1.3.5Nội dung công việc thực 14 1.3.6Kết dự kiến 15 1.4 Mục tiêu, thời gian kế hoạch thực tập 15 1.4.1Mục tiêu: .15 1.4.2Thời gian kế hoạch thực tập: 15 Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 Bảng 2: Kế hoạch thực tập 18 1.5 Bố cục báo cáo 18 CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 19 2.1Giới thiệu JAPE .19 2.2Luật JAPE 19 2.3 Độ ưu tiên Jape 21 2.3.1Brill 21 2.3.2All 21 2.3.3First 21 2.3.4Once 22 2.3.5Appelt 22 2.4Vế trái (Left-Hand Side) .22 2.4.1So khớp với chuỗi ký tự 23 2.4.2So khớp với loại thích khác (Annotation Types) .23 Bảng 3: Các đặc tính vài loại thích 27 2.4.3Macro 27 2.4.4Toán tử vế trái 28 Bảng 4: Các toán tử vế trái luật ngữ pháp JAPE 30 2.5Vế phải (Right-Hand Side) 30 CHƯƠNG 3: HIỆN THỰC CÁC LUẬT JAPE 32 3.1Hiện thực việc rút tác giả 34 3.2Hiện thực việc rút năm xuất nơi công bố 34 Hình 1: Luật idrs_publish thực thi GATE 35 3.3Hiện thực việc rút thông tin Reference .35 Trang Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 Hình 2: Rút thông tin: tác giả, tiêu đề, năm xuất reference .36 CHƯƠNG 4: HIỆN THỰC HỆ THỐNG .37 4.1Thông tin tổng quan 37 4.2Giao diện 37 Hình 3: Giao diện hình Build Corpus 38 Hình 4: Thêm tài liệu vào Corpus .39 Hình 5: Thêm tài liệu thành cơng vào Corpus 39 Hình 6: Giao diện hình Metadata Extraction 40 4.3Thực nghiệm đánh giá 41 KẾT LUẬN 42 TÀI LIỆU THAM KHẢO .43 Hình 4: Thêm tài liệu vào Corpus Error: Reference source not found Hình 5: Thêm tài liệu thành cơng vào Corpus Error: Reference source not found Hình 6: Giao diện hình Metadata Extraction .Error: Reference source not found Trang 10 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 Macro: AMOUNT_NUMBER (({Token.kind == number} (({Token.string == ","}| {Token.string == "."} ) {Token.kind == number} )* | (NUMBER_WORDS) ) (MILLION_BILLION)? ) Rule: MoneyCurrencyUnit ( (AMOUNT_NUMBER) ({Lookup.majorType == currency_unit}) ) :number > :number.Money = {kind = "number", rule = "MoneyCurrencyUnit"} Trong ví dụ trên, thấy Macro sử dụng lồng vào nhau, macro gọi macro Điều làm cho cấu trúc JAPE rõ ràng, lành mạch, giúp cho dễ dàng quan sát sửa chữa gặp lỗi Ví dụ đưa pattern để nhận diện số khoảng tiền 2.4.4 Tốn tử vế trái Nhóm tốn tử Union Kleene Ký hiệu | Giải thích Ví dụ Hoặc ({Lookup.majorType == lo cation} | {Lookup.majorType == c Trang 28 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 ountry_adj}) * Xuất nhiều ({Lookup.majorType == lo lần ? cation})* Xuất lần ({Lookup.majorType == or ganization})? + Xuất nhiều ({Lookup.majorType == co untry_adj})+ lần [number1, So khớp số lượng ({Token})[1,3] : so khớp number2] Range thích từ number1 đến number2 [number] từ đến Token dịng So khớp xác ({Token.kind==number}) thích theo số number [3] : so khớp xác Token loại number dòng Equality == {Lookup.majorType == So sánh "person"} != {Lookup.majorType != So sánh không "person"} So sánh bé {Token.length < 3} So sánh bé {Token.length = So sánh lớn {Token.length >= 3} > Regular < 3} =~ So sánh gần So khớp với Expression {Token.string =~ regular “[Dd]ogs”} expression ==~ So sánh {Token.string ==~ Trang 29 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 So khớp với regular “[Dd]ogs”} expression So sánh không gần {Token.string !~ !~ So khớp với regular “[Dd]ogs”} expression So sánh không {Token.string !=~ !=~ So khớp với regular “[Dd]ogs”} expression Contextual X contains Trả true, {X contains {Y.foo==bar} y thích loại X chứa hồn } tồn thích loại Y X within Trả true, {{X.foo==bar} within Y} Y thích loại X bao phủ hồn tồn thích loại Y Bảng 4: Các tốn tử vế trái luật ngữ pháp JAPE 2.5 Vế phải (Right-Hand Side) Vế phải luật chứa thơng tin thích tạo Nó cho phép đặt tên nhãn thích thơng qua nhãn phụ gán vế trái, cho phép tạo đặc tính cho thích Ngồi cịn hỗ trợ, cho phép người dùng đưa code Java vào Vế phải phân biệt với vế trái thông qua dấu “ > ” Rule: GazLocation ( {Lookup.majorType == location} ) Trang 30 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 :location > :location.Enamex = {kind="location", rule=GazLocation} Trong ví dụ, vùng gán nhãn phụ “location” gán nhãn Enamex, tên loại thích Loại thích Enamex có đặc tính kind rule Sau ví dụ cho thấy việc sử dụng code Java vế phải Rule: FirstName ( {Lookup.majorType == person_first} ):person > { AnnotationSet person = bindings.get("person"); Annotation personAnn = person.iterator().next(); FeatureMap features = Factory.newFeatureMap(); features.put("gender", personAnn.getFeatures().get("minorType")); features.put("rule", "FirstName"); outputAS.add(person.firstNode(), person.lastNode(), "FirstPerson", features); } Sử dụng code Java bên vế phải cho phép ta linh hoạt việc đặt đặc tính cho thích, tinh chỉnh, chọn lọc lại thích gán nhãn Ở ví dụ, đoạn code java dùng bên vế phải nhằm mục đích thêm vào giá trị đặc tính khác cho thích khác Giá trị đặc tính “gender” gán ghép dựa vào đặc tính minorType loại thích Lookup Trang 31 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 CHƯƠNG 3: HIỆN THỰC CÁC LUẬT JAPE Các luật JAPE đưa vào hệ thống IDRS kết hợp với việc xử lý thông qua code, ta rút tên tác giả, nơi công tác họ, năm xuất bản, nơi công bố reference báo Các luật JAPE hệ thống IDRS: • idrs_abstractEndWord.jape • idrs_abstractWord.jape • idrs_affiliation.jape • idrs_author.jape • idrs_authorRef.jape • idrs_line.jape • idrs_lineAffiliationAnnotation.jape • idrs_lineAuthor.jape • idrs_lineEmailAnnotation.jape Trang 32 Báo cáo thực tập tốt nghiệp • idrs_metaDataRef.jape • idrs_publish.jape • idrs_publishYearRef.jape • idrs_referencesBreak.jape • Võ Đinh Duy – 06520112 idrs_referencesWord.jape Ý tưởng cho việc rút: • Tiêu đề: dịng có kích cỡ chữ lớn phạm vi trang tiêu đề • Tác giả: thơng thường tác giả nằm dịng Dựa đặc điểm cần phân biệt dòng dòng chứa thơng tin tác giả sau lấy tác giả báo Để làm điều đó, phải phân vùng tài liệu Vùng tài liệu chứa thông tin tác giả nằm khoảng tiêu đề tóm tắt (abstract) trang Tiếp theo loại bỏ dòng chứa email, địa nơi cơng tác, ta có dịng tác giả Từ dòng tác giả ấy, ta dùng luật tách riêng tác giả, dựa luật nhận dạng Person, dấu “,” hay “and” • Năm xuất nơi cơng bố: sau khảo sát qua nhiều báo, năm xuất nơi công bố thường kèm với Vì ta nhận dạng xác loại thích thơng qua pattern vừa xuất năm xuất bản, vừa xuất nơi công bố • Tóm tắt: Vùng tài liệu chứa thơng tin tóm tắt thường nằm từ khóa “Abstract” từ khóa “1 Introduction”, “Keyword”, “Categories Trang 33 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 • Reference: khoanh vùng reference từ chỗ xuất chuỗi ký tự “References” hay “REFERENCES” hết báo.Tách reference nhỏ thông qua dấu hiệu như: number., [number], (number) Đối với reference ta tiếp tục xác định tác giả báo tham khảo đó, tên báo tham khảo, với năm xuất 3.1 Hiện thực việc rút tác giả • Bước 1: Xác định từ khóa “Abstract” thơng qua luật idrs_abstractWord • Bước 2: Dùng code để rút vùng tài liệu từ tiêu đề báo đến từ khóa “Abstract” • Bước 3: Thực thi luật idrs_line, idrs_lineAffiliationAnnotation, idrs_lineEmailAnnotation phân vùng chọn Bước Sau thực thi, ta thu thích Line (lấy tất dòng phân vùng), LineAffiliationAnnotation (dịng chứa thơng tin, địa nơi cơng tác), LineEmailAnnotation (dịng chứa thơng tin email) • Bước 4: Dựa kết bước 3, dùng code để rút dịng chứa thơng tin tác giả • Bước 5: Dùng luật idrs_author dịng để rút tác giả 3.2 Hiện thực việc rút năm xuất nơi công bố Qua khảo sát báo khoa học, ta rút pattern có chứa thơng tin năm xuất bản, nơi cơng bố sau: • Proceedings of the [nơi công bố] ,…, [năm xuất bản] Trang 34 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 • [nơi công bố] '[viết tắt năm], [năm xuất bản] • Copyright [năm xuất bản] [nơi công bố] • [năm xuất bản] [nơi công bố] Trong IDRS ta thực thi luật idrs_publish.jape vào khoanh vùng trang báo Hình 1: Luật idrs_publish thực thi GATE 3.3 Hiện thực việc rút thơng tin Reference • Bước 1: Xác định từ khóa “References” hay “REFERENCES’ thơng qua luật idrs_referencesWord • Bước 2: Dùng code để rút vùng tài liệu từ từ khóa đến cuối báo Trang 35 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 • Bước 3: Thực thi luật idrs_referencesBreak cho vùng tài liệu rút trích Bước Luật cho phép lấy dấu hiệu để có thề rút reference • Bước 4: Dựa vào vị trí break, dùng code để trút reference nhóm references • Bước 5: Áp dụng luật idrs_metaDataRef, idrs_authorRef, idrs_publishYearRef vào reference, rút tên tác giả, tiêu đề năm xuất báo Hình 2: Rút thông tin: tác giả, tiêu đề, năm xuất reference Trang 36 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 CHƯƠNG 4: HIỆN THỰC HỆ THỐNG 4.1 Thông tin tổng quan Dự án IDRS hệ thống gồm nhiều chương trình Mỗi chương trình tương ứng với tab hệ thống IDRS Tab Information Extraction công cụ xây dựng để rút trích thơng tin metadata từ báo Nó xây dựng cơng cụ Eclipse tảng Java, kết hợp với API thư viện GATE Chương trình bao gồm package chính: • tkorg.idrs.gui.extraction: chứa tập tin giao diện chương trình • tkorg.idrs.action.extraction: chứa tập tin quy định action gọi giao diện • tkorg.idrs.core.extraction: chứa tập tin xử lý cốt lỗi chương trình 4.2 Giao diện Giao diện chương trình thiết kế với hai hình chính: Build Corpus Metadata Extraction Bố cục hình phân bố hợp lý, điều giúp cho người dùng dễ quan sát sử dụng chương trình Trang 37 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 • Màn hình Build Corpus: Hình 3: Giao diện hình Build Corpus Màn hình phân chia thành vùng chính: o Vùng bên trái: cho phép người dùng duyệt thư mục máy tính để thêm vào tài liệu muốn rút trích Người dùng chọn thêm vào tài liệu thêm vào tập folder chứa tài liệu Trang 38 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 Hình 4: Thêm tài liệu vào Corpus o Vùng bên phải: cho phép xem tài liệu thêm vào corpus Các thơng tin trình bày gồm: tên tài liệu, kích thước đường dẫn tài liệu máy tính Hình 5: Thêm tài liệu thành công vào Corpus Trang 39 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 • Màn hình Metadata Extraction: Hình 6: Giao diện hình Metadata Extraction Màn hình trình bày thơng tin Metadata rút trích từ tập tài liệu Corpus Màn hình phân bố với vùng chính: o Vùng bên trái: Liệt kê danh sách tài liệu rút trích Metadata Khi người dùng muốn xem thơng tin tài liệu nào, nhấn chuột vào tài liệu đó, thông tin chi tiết hiển thị bên vùng bên phải hình o Vùng bên phải: Cho phép xem thông tin chi tiết tài liệu Vùng phía hiển thị cho người dùng thấy thơng tin Metadata rút trích như: Tiêu đề, tác giả, nơi xuất bản, năm công bố / xuất bản, tóm tắt báo tài liệu tham khảo Vùng bên cho phép người dùng xem nội dung tài liệu Trang 40 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 Ban đầu người dùng chuyển từ hình Build Corpus qua hình thơng tin Metadata khơng tự động rút trích Người sử dụng phải chọn Run để chương trình thực thi trình rút Metadata Chúng ta sử dụng Export to XML để xuất kết rút trích dạng XML, nhằm để sử dụng làm input cho chương trình khác 4.3 Thực nghiệm đánh giá Để tiến hành thực nghiệm chương trình, chúng tơi tiến hành download 200 báo khoa học máy tính trang web CiteSeer Digital Library (http://citeseer.ist.psu.edu) Kết rút trích thơng qua luật JAPE có độ xác tốt từ 89.47% đến 100% tùy theo loại Metadata Điều chứng minh phương pháp rút trích thơng tin luật có kết tốt, tương đương với việc sử dụng phương pháp máy học Tuy nhiên dùng luật ngữ pháp JAPE, kết phụ thuộc nhiều vào việc tài liệu (pdf) chuyển thành Gate Document Tài liệu sau chuyển đổi sang Gate Document có định dạng khơng cịn giống ngun mẫu, pattern JAPE định nghĩa khơng cịn xác Vì để nâng cao độ xác việc rút trích cần phải tinh chỉnh lại chuyển đổi tài liệu, hay sử dụng kết hợp với chuyển đổi khác Trang 41 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 KẾT LUẬN Qua giai đoạn thực tập, củng cố nhiều nội dung kiến thức học tập trường, tiếp cận kiến thức hoàn toàn liên quan đến vấn đề rút trích thơng tin văn lý thuyết ontology, cách sử dụng Protégé GATE, ngơn ngữ JAPE Ngồi tơi học hỏi kỹ phong cách lập trình chuyên nghiệp hơn, thông qua cách thức đặt tên, truyền biến, xây dựng cấu trúc chương trình mạch lạc… Học hỏi nâng cao kỹ giải vấn đề thông qua việc đặt câu hỏi, cách thức tìm kiếm vấn đề liên quan, cách suy nghĩ sáng tạo Ví dụ để rút trích thơng tin tác giả, ban đầu quan tâm đến luật xác định tác giả có phải Person hay khơng, luật Person GATE cung cấp dựa vào sở liệu có GATE, nên khả xác thấp Vì cách xác định tác giả thơng qua việc rút dịng thơng tin tác giả có độ xác cao Thơng qua kinh nghiệm có tham gia dự án IDRS, tơi tin tưởng học tập nhiều kinh nghiệm bổ ích cho cơng việc mai sau Đối với đề tài thực tập, nhóm chúng tơi hồn thành tốt mục tiêu ban đầu đề ra, việc rút trích thơng tin Metadata cách sử dụng luật ngữ pháp JAPE với kết xác tốt Hướng phát triển tương lai đề tài nghiên cứu vấn đề rút trích theo phương pháp máy học kết hợp hai phương pháp (máy học tập luật) để đạt hiệu tốt Trang 42 ... nghiên cứu Đối tượng rút trích metadata đề tài báo khoa học có định dạng tập tin PDF Đề tài thực tập tập trung nghiên cứu cách rút trích thơng tin metadata, cịn việc tổ chức liệu thư viện số làm giàu... tin như: thực tập công ty nào, thời gian thực tập sao, tham gia dự án …Ngồi Chương giới thiệu khái quát công ty thực tập, đề tài thực tập, mục tiêu kế hoạch đợt thực tập Trong Chương đề cập đến. .. System Vị trí thực tập Developer Bảng 1: Tóm tắt q trình thực tập tốt nghiệp Trang 11 Báo cáo thực tập tốt nghiệp Võ Đinh Duy – 06520112 1.2 Công ty Outsourceit Vietnam Công ty Outsourceit Vietnam

Ngày đăng: 15/08/2014, 19:12

Từ khóa liên quan

Mục lục

  • LỜI CẢM ƠN.

  • ACKNOWLEDGMENTS

  • ĐÁNH GIÁ KẾT QUẢ CỦA CƠ QUAN THỰC TẬP.

  • ĐÁNH GIÁ KẾT QUẢ THỰC TẬP CỦA KHOA.

  • MỤC LỤC.

    • DANH MỤC BẢNG

    • CHƯƠNG 1: TỔNG QUAN VỀ QUÁ TRÌNH THỰC TẬP.

      • 1.1 Giới thiệu.

      • Bảng 1: Tóm tắt quá trình thực tập tốt nghiệp

        • 1.2 Công ty Outsourceit Vietnam.

        • 1.3 Đề tài thực tập.

          • 1.3.1 Đặt vấn đề.

          • 1.3.2 Mục tiêu.

          • 1.3.3 Phạm vi nghiên cứu.

          • 1.3.4 Khảo sát các nghiên cứu liên quan.

          • 1.3.5 Nội dung công việc thực hiện.

          • 1.3.6 Kết quả dự kiến.

          • 1.4 Mục tiêu, thời gian và kế hoạch thực tập.

            • 1.4.1 Mục tiêu:

            • 1.4.2 Thời gian và kế hoạch thực tập:

            • Bảng 2: Kế hoạch thực tập.

              • 1.5 Bố cục báo cáo.

              • CHƯƠNG 2: CƠ SỞ LÝ THUYẾT.

              • 2.1 Giới thiệu về JAPE.

              • 2.2 Luật JAPE.

              • 2.3 Độ ưu tiên trong Jape.

Tài liệu cùng người dùng

Tài liệu liên quan