KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM

107 22 0
  • Loading ...
1/107 trang
Tải xuống

Thông tin tài liệu

Ngày đăng: 26/11/2016, 12:01

KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCMKỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCMKỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCMKỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCMKỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCMKỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM i CHUẨN Y CỦA HỘI ĐỒNG BẢO VỆ LUẬN VĂN  Luận văn tựa đề “KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM” Phan Văn Út thực nộp nhằm thỏa yêu cầu tốt nghiệp Thạc sĩ ngành Khoa Học Máy Tính Ngày bảo vệ luận văn, TP.HCM, ngày 21 tháng 11 năm 2015 Chủ tịch Hội đồng Người hướng dẫn PGS.TS Trần Công Hùng Học viện công nghệ Bưu Viễn Thông Ngày PGS.TS Đỗ Văn Nhơn Đại học Công Nghệ Thông tin TpHCM tháng năm 2015 Ngày Viện Đào Tạo Sau Đại Học GS TSKH Hoàng Văn Kiếm Ngày tháng nă m 2015 tháng năm 2015 ii LÝ LỊCH CÁ NHÂN - Họ tên: Phan Văn Út - Ngày sinh: 10 tháng 08 năm 1985 - Nơi sinh: Bình Định - Tốt nghiệp PTTH Trường Trung học phổ thông Tam Quan, Hoài Nhơn, Bình Định, năm 2004 - Tốt nghiệp Đại học ngành Tin học Trường Đại học Văn Lang, Thành phố Hồ Chí Minh - Quá trình công tác: Nơi công tác Thời gian Năm 2009 đến Chức vụ Trường CĐ Kinh tế - Công nghệ Nhân viên Trung tâm Tp HCM thông tin thư viện - Địa liên lạc: 482/2 Khu phố 3A, Phường Thạnh Lộc, Quận 12, Tp HCM - Điện thoại: 0902.051.560 - Email: phanvanut1008@gmail.com iii LỜI CAM ĐOAN Tôi xin cam đoan đề tài “Kỹ thuật nâng cao hiệu tra cứu sách Thư viện trường cao đẳng Kinh tế công nghệ TPHCM” công trình nghiên cứu Ngoài trừ tài liệu tham khảo trích dẫn luận văn này, cam đoan toàn phần hay phần nhỏ luận văn chưa công bố sử dụng để nhận cấp nơi khác Không có sản phẩm/nghiên cứu người khác sử dụng luận văn mà không trích dẫn theo quy định Tp Hồ Chí Minh, ngày 25 tháng 10 năm 2015 Tác giả luận văn Phan Văn Út iv LỜI CẢM ƠN Xin cho gửi lòng biết ơn đến Thầy PGS.TS Đỗ Văn Nhơn – người hướng dẫn luận văn cho Trong suốt thời gian thực luận văn, Thầy tận tình hướng dẫn có lời khuyên, đóng góp quý báu, giúp cho định hướng hoàn thành mục tiêu đề Tôi xin chân thành tỏ lòng biết ơn đến quý Thầy, Cô tận tình giảng dạy cho suốt năm học qua chương trình đào tạo Thạc sĩ khoa học máy tính, Trường Đại học quốc tế Hồng Bàng Cho gửi lòng biết ơn trân trọng đến người lãnh đạo quan, tạo điều kiện thuận lợi để công tác học tập Xin cảm ơn tất bạn bè động viên, giúp đỡ đóng góp cho nhiều ý kiến quý báu, qua giúp hoàn thiện cho đề tài Và cuối cùng, không quên gửi lời cảm ơn đến tác giả báo cáo nghiên cứu khoa học mà tham khảo tìm hiểu cho đề tài Luận văn hoàn thành với số kết định nhiên không tránh khỏi thiếu sót Kính mong cảm thông đóng góp ý kiến từ quý thầy cô bạn Một lần xin chân thành cảm ơn! Thành phố Hồ Chí Minh, ngày 25 tháng 10 năm 2015 Người thực Phan Văn Út v NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN Tp Hồ Chí Minh, ngày tháng năm 2015 vi NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN Tp Hồ Chí Minh, ngày tháng năm 2015 vii NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN Tp Hồ Chí Minh, ngày tháng năm 2015 viii NHẬN XÉT CỦA HỘI ĐỒNG PHẢN BIỆN Tp Hồ Chí Minh, ngày tháng năm 2015 ix MỤC LỤC CHUẨN Y CỦA HỘI ĐỒNG BẢO VỆ LUẬN VĂN i LÝ LỊCH CÁ NHÂN ii LỜI CAM ĐOAN iii LỜI CẢM ƠN iv MỤC LỤC ix DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ xii DANH MỤC CÁC BẢNG xiii DANH SÁCH CÁC KÝ HIỆU, CHỮ VIẾT TẮT xiv TÓM TẮT xv ABSTRACT xvii MỞ ĐẦU xviii CHƯƠNG 1: TỔNG QUAN VỀ ĐỀ TÀI 1.1 Giới thiệu tổng quan vấn đề nghiên cứu 1.1.1 Nhu cầu thực trạng tìm kiếm theo ngữ nghĩa kho tài liệu 1.1.2 Khảo sát số giải pháp ứng dụng tìm kiếm ngữ nghĩa kho tài liệu 1.2 Mục tiêu phạm vi nghiên cứu 1.3 Phương pháp nghiên cứu 1.4 Ý nghĩa khoa học thực tiễn đề tài 1.5 Nội dung thực CHƯƠNG CƠ SỞ LÝ THUYẾT 2.1 Giới thiệu tìm kiếm thông tin 2.1.1 Khái niệm 2.1.2 Cấu trúc hệ thống tìm kiếm thông tin 2.1.3 Đánh giá hệ thống tìm kiếm thông tin 2.2 Các mô hình phương pháp tìm kiếm thông tin 10 2.2.1 Mô Hình Boolean 11 x 2.2.2 Mô hình Boolean cải tiến (Advanced Boolean Model ) 12 2.2.3 Mô Hình Không Gian Vector(Vector Space Model) 14 2.2.4 Latent Semantic Indexing - LSI 15 2.2.5 Áp dụng xử lý ngôn ngữ tự nhiên 17 2.3 Ontology 20 2.3.1 Định nghĩa 20 2.3.2 Vai trò ontology 21 2.3.3 Các thành phần ontology 22 2.3.4 Phân loại ontology 23 2.3.5 Các ứng dụng dựa Ontology 26 2.4 Các phương pháp tính độ tương đồng ngữ nghĩa khái niệm 27 CHƯƠNG MÔ HÌNH VÀ GIẢI PHÁP 37 3.1 Một mô hình ontology cho ngữ nghĩa tài liệu 37 3.2 Xây dựng đồ thị keyphrase biểu diễn nội dung 40 3.2.1 Đánh trọng số đồ thị keyphrase biểu diễn tài liệu 40 3.2.2 Gán nhãn đồ thị keyphrase biểu diễn tài liệu 42 3.2.3 Trọng số đồ thị keyphrase biểu diễn câu truy vấn 44 3.3 Độ tương đồng ngữ nghĩa hai keyphrase 49 3.4 Độ tương đồng ngữ nghĩa hai đồ thị keyphrase 55 3.5 Xây dựng mô hình cách thức lưu trữ, tìm kiếm theo ngữ nghĩa 58 3.5.1 Mô hình Cơ sở liệu DB phục vụ việc lưu trữ 58 3.5.2 Tổ chức lưu trữ tài liệu theo ngữ nghĩa 60 CHƯƠNG CÀI ĐẶT THỬ NGHIỆM VÀ ĐÁNH GIÁ 63 4.1 Thiết kế hệ thống thử nghiệm 63 4.1.1 Mục tiêu ứng dụng 63 4.1.2 Yêu cầu chức hệ thống 63 4.1.3 Cấu trúc hệ thống 65 4.1.4 Các thiết kế xử lý 68 4.2 Kết thử nghiệm 71 73 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết đạt luận văn So với mục tiêu ban đầu đề ra, luận văn thực hoàn thành nội dung nghiên cứu Luận văn đưa nhiều cải tiến có hiệu kỹ thuật biểu diễn ngữ nghĩa xử lý tính toán độ tương đồng ngữ nghĩa tài liệu câu truy vấn Những cải tiến đề luận văn trực tiếp khắc phục hạn chế kỹ thuật tìm kiếm ngữ nghĩa, giúp tăng cường đáng kể hiệu tìm kiếm theo ngữ nghĩa Luận văn đề xuất phương pháp xử lý biểu diễn câu truy vấn thành đồ thị keyphrase có trọng số giúp xác định xác yêu cầu tìm kiếm người dùng Điều tăng cường đáng kể khả xử lý câu truy vấn hệ thống, cải thiện tính hiệu trình tìm kiếm Bên cạnh đó, trọng số cho đồ thị keyphrase biểu diễn tài liệu luận văn điều chỉnh đáng kể dựa kết khảo sát từ thực tiễn Các công thức tính trọng số xác không góp phần tăng độ xác cho toán tìm kiếm ngữ nghĩa mà việc xếp kết tìm kiếm hiệu gần với yêu cầu người dùng 5.2 Những hạn chế đề tài Các kỹ thuật đề xuất luận văn phụ thuộc nhiều vào mô hình phương pháp biểu diễn đề xuất công trình [1] Do đó, mang số hạn chế mô hình mô hình ontology chưa biểu diễn hết tri thức lĩnh vực, chưa có phương pháp tích hợp, chia sẻ ontology mà phụ thuộc nhiều vào việc xây dựng ontology hoàn toàn thủ công với kinh nghiệm chuyên gia, khiến cho việc mở rộng kết lĩnh vực, miền tri thức khác đạt vô khó khăn Bên cạnh việc biểu diễn tài liệu thành đồ thị keyphrase phải thực bán thủ công hạn chế khả áp dụng giái pháp Hiện ứng dụng thử nghiệm truy vấn đơn giản, cần 74 phải xét đến tất dạng truy vấn khác đặc biệt ngôn ngữ tự nhiên, phát triển ngôn ngữ qui ước, việc bắt lỗi chặt chẽ mặt cú pháp Phần demo chương trình chức năng, chưa ý đến tiện ích cho người dùng, số phần hệ thống đề cập mà chưa cài đặt 5.3 Hướng phát triển Tiếp tục phát triển, hoàn thiện mô hình biểu diễn tri thức, biểu diễn ngữ nghĩa tài liệu, mô hình tổ chức lưu trữ kho tài liệu theo ngữ nghĩa Vấn đề biểu diễn liệu CSDL cải tiến thêm Nghiên cứu qui trình thiết kế xây dựng ứng dụng nguyên lý Nghiên cứu thuật toán nhằm hỗ trợ tìm kiếm nhanh chóng hơn, dễ dàng hơn, cho kết xác với nhu cầu tìm kiếm người dùng Nghiên cứu công cụ hỗ trợ tự động, tự động hóa cao tốt khâu xử lý chẳng hạn mô hình giải pháp rút trích tự động keyphrase từ tài liệu sở lai ghép phối hợp mô hình có, kỹ thuật xác suất thống kê, máy học, kỹ thuật xử lý ngôn ngữ tự nhiên Nghiên cứu giải pháp lĩnh vực tìm kiếm ngữ nghĩa để tìm khả phá bỏ giới hạn tìm kiếm lĩnh vực, miền tri thức định Đưa đến giải giải pháp xây dựng kho tài liệu đa ngành, đa lĩnh vực 75 TÀI LIỆU THAM KHẢO [1] Huỳnh Thị Thanh Thương (2012), Nghiên cứu mô hình tổ chức kỹ thuật tìm kiếm có ngữ nghĩa kho tài nguyên học tập lĩnh vực CNTT, Luận văn Thạc sĩ, Trường đại học Khoa Học Tự Nhiên TP.HCM [2] Nguyễn Thị Thanh Hà, Nguyễn Trung Hiếu (2005), Xây dựng hệ thống tìm kiếm thông tin tiếng việt dựa mục từ ghép, Luận văn thạc sĩ, Trường ĐH Khoa học tự nhiên TP Hồ Chí Minh [3] Nguyễn Thị Lan Phương (2006), Tìm hiểu Search Engine ứng dụng thuật toán đối sách đa mẫu cho hệ thống tìm kiếm thông tin mạng, Luận văn thạc sĩ, Trường ĐH Bách khoa Hà Nội [4] Lê Thúy Ngọc (2008), Xây dựng hệ thống tìm kiếm thông tin theo hướng tiếp cận ngữ nghĩa, Luận văn thạc sĩ, Trường đại học Khoa Học Tự Nhiên TP.HCM [5] Huỳnh Tấn Đạt (2005), So trùng mờ đồ thị tri thức, Luận văn thạc sĩ, Trường đại học Bách Khoa TP.HCM [6] Hồ Bảo Quốc (2012), Giới thiệu tìm kiếm thông tin, Bài báo khoa học, Trường ĐH Khoa học tự nhiên TP Hồ Chí Minh [7] Nguyễn Thị Bảo Trâm (2005), Thiết kế thực dịch vụ Ontology hỗ trợ thư viện số, Luận văn thạc sĩ, Trường đại học Khoa Học Tự Nhiên TP.HCM [8] Nguyễn Thị Thanh Hà, Nguyễn Trung Hiếu (2005), Xây dựng hệ thống tìm kiếm thông tin tiếng việt dựa mục từ ghép, Luận văn thạc sĩ, Trường ĐH Khoa học tự nhiên TP Hồ Chí Minh [9] Do, VanNhon, ThanhThuong T Huynh, and TruongAn PhamNguyen (2013),"Semantic representation and search techniques for document retrieval systems." In Intelligent Information and Database Systems, pp 476-486 Springer Berlin Heidelberg 76 [10] Ayse Goker, John Davies (2009), Information Retrieval: Searching in the 21st Century, John Wiley anh Sons [11] Christopher D Manning, Prabhakar Raghavan and Hinrich Schutze (2008), Introduction to Information Retrieval, Cambridge University Press, edition [12] Henrik Bulskov Styltsvig (2006), Ontology-based Information Retrieval, A dissertation Presented to the Faculties of Roskilde University in Partial Fulfillment of the Requirement for the Degree of Doctor of Philosophy [13] Dublin core ® Metadata Initative, Dublin Core Metadata Element Set, Version 1.1, 2010, http://dublincore.org/documents/2010/10/11/dces/ PL PHỤ LỤC SƠ ĐỒ MÔ TẢ TÀI NGUYÊN Sơ đồ mô tả tài nguyên học tập điện tử 15 yếu tố xây dựng theo chuẩn từ vựng Dublin Core bổ sung thêm thành phần đặc trưng thể cấu trúc thông tin ngữ nghĩa loại tài liệu sau: Các thuộc tính chung: 1) Nhan đề (Title): Nhan đề tài liệu, tên nguồn thông tin thường tác giả nhà xuất đặt cho tài liệu 2) Tác giả (Creator): Tác giả tài liệu, bao gồm tác giả cá nhân tác giả tập thể chịu trách nhiệm nội dung 3) Chủ đề (Subject): Chủ đề tài liệu đề cập dùng để phân loại tài liệu, thể từ vựng có kiểm soát 4) Mô tả (Description): Tóm tắt, mô tả nội dung tài liệu Có thể bao gồm tóm tắt, thích, mục lục, đoạn văn để làm rõ nội dung 5) Nhà xuất (Publisher): Cơ quan, tổ chức chịu trách nhiệm tạo lập, xuất nguồn thông tin định dạng thực 6) Tác giả phụ (Contributor): Tên người tham gia cộng tác đóng góp vào nội dung tài liệu, cá nhân, tổ chức 7) Ngày tháng (Date): ngày tháng có liên quan đến việc tạo lập, xuất hay công bố tài liệu 8) Loại tài liệu (Type): Mô tả loại tài liệu Dùng thuật ngữ mô tả phạm trù kiểu: báo, báo cáo, sách, từ điển 9) Khổ mẫu (Format): Mô tả trình bày vật lý tài liệu, bao gồm; vật mang tin, kích cỡ độ dài, kiểu liệu (.doc, html, jpg, xls, phần mềm ) 10) Định danh (Identifier): Các thông tin định danh tài liệu, nguồn tham chiếu đến, chuỗi ký tự để định vị tài nguyên: URL (Uniform Resource Locators), URN (Uniform Resource Name), ISBN (International Standard Book PL Number), ISSN (International Standard Serial Number), SICI (Serial Item & Contribution Identifier), 11) Nguồn (Resource): Các thông tin xuất xứ tài liệu, tham chiếu đến nguồn mà tài liệu mô tả trích ra/tạo ra, nguồn là: URL, URN, ISBN, ISSN 12) Ngôn ngữ (Language): Các thông tin ngôn ngữ, mô tả ngôn ngữ tài liệu 13) Liên kết (Relation): Mô tả thông tin liên quan đến tài liệu khác, định danh cho nguồn thứ hai mối quan hệ với tài liệu hành Yếu tố thể kết nối nguồn tài liệu có liên quan, dùng đường dẫn (URL), URN, ISBN, ISSN 14) Diện bao quát (Coverage): Các thông tin liên quan đến phạm vi, quy mô mức độ bao quát tài liệu Phạm vi địa điểm, không gian thời gian, tọa độ 15) Bản quyền (Right): Các thông tin liên quan đến tình trạng quyền, kết nối tới thông tin tình trạng quyền dịch vụ cung cấp thông tin quyền cho tư liệu 16) Keyphrases: Danh sách keyphrase biểu diễn nội dung tài liệu Một biểu diễn tài liệu chứa thông tin mô tả cần có thêm thành phần biểu diễn nội dung tài liệu Nội dung tài liệu biểu diễn cấu trúc đơn giản danh sách keyphrase hay đồ thị keyphrase giàu ngữ nghĩa Cấu trúc thông tin loại tài liệu Dựa sở phân loại tài nguyên học tập, loại tài nguyên có chức sử dụng khác nên cấu trúc thông tin loại khác Ngoài thuộc tính chung mô tả tài nguyên học tập điện tử nêu trên, loại tài liệu gộp chứa vài thuộc tính đặc thù riêng nhằm diễn đạt chi tiết cấu trúc thông tin loại hình tài liệu Các thành tố đặc thù PL coi yếu tố mở rộng thể thông qua khung mã hóa cụ thể sau: 1) Syllabus (đề cương môn học) Loại tài nguyện mô tả chi tiết môn học đó, thông tin thể syllabus bao gồm:  Course Information: Thông tin tổng quan môn học như: đơn vị giảng dạy, danh sách giảng viên, nhận xét đánh giá sinh viên quan chức cấp  Course Description: Mô tả khái quát môn học  Course Objective: Mục tiêu môn học, mô tả khối lượng kiến thức truyền đạt qua môn học  Prerequisites: Các yêu cầu cần thiết để theo học Có thể bao gồm: môn học tiên quyết, kiến thức tảng, yêu cầu trang thiết bị, thời gian, v.v  Grading: Phương pháp đánh giá, kiểm tra cho điểm học viên  Policy: Các quy chế học vụ liên quan  Course Calendar: Thời gian biểu cho môn học, lịch trình giảng dạy chi tiết 2) Sách điện tử: bao gồm sách giáo khoa/giáo trình, sách tham khảo Sách giáo khoa tài liệu sử dụng giảng dạy Mỗi sách giáo khoa có liên hệ trực tiếp đến môn học, nên gắn liền với đề cương môn học Sách tham khảo cung cấp kiến thức chuyên ngành, liên quan đến nhiều môn học khác không gắn kết với syllabus cụ thể Sách điện tử thường bao gồm thông tin:  Preface: Lời nói đầu, lời giới thiệu tác giả sách đến người đọc  Table of Content (Mục lục): Danh sách phần, chương, đề mục lớn sách Thường kèm theo số trang  Index: Danh mục thuật ngữ đề cập sách thích cho thuật ngữ Đôi danh mục liệt kê hình vẽ bảng biểu có sách  References: Danh sách tài liệu tham khảo đến trình viết sách PL 3) Slide giảng: Slide trình chiếu phục vụ cho việc giảng dạy, phần lớn trường hợp, slide soạn dựa nội dung sách Slide thường cấu trúc trình bày cố định 4) Audio ghi âm giảng: Phần ghi âm lời giảng giảng viên lớp Loại tài nguyên cấu trúc trình bày cố định Thông thường giảng ghi âm thành nhiều tệp tin âm riêng biệt cho buổi giảng Các ghi âm tất buổi suốt khóa học tập hợp lại phát hành chung Trong số trường hợp, loại tài nguyên đính kèm theo transcript đánh máy lại nội dung ghi âm 5) Video ghi hình giảng: Tương tự Audio ghi âm giảng, khác có thêm phần video ghi hình giảng viên lúc giảng 6) Hướng dẫn thực hành hướng dẫn sử dụng thiêt bị/công cụ/phần mềm cần dùng học tập/giảng dạy Hướng dẫn thường không tuân theo cấu trúc trình bày cố định, viết thành sách hoàn chỉnh, đơn giản ghi chép thao tác cần thực hành theo thứ tự 7) Luận văn đại học/khóa luận tốt nghiệp, luận văn/luận án sau đại học: Luận văn đầy đủ tiêu chuẩn phải có người trực dõi, hướng dẫn phải bảo vệ thành công trước hội đồng chấm luận văn trường Các thuộc tính luận văn bao gồm:  Giáo viên hướng dẫn thông tin hội đồng bảo vệ  Đơn vị quản lý: Thông tin trường đại học nơi nhận luận văn nộp đến  Lời nhận xét giảng viên hướng dẫn, giảng viên phản biện luận văn, bao gồm ý kiến nhận xét đánh giá cho điểm cua riêng giảng viên luận văn  Điểm số nhận xét cuối hội đồng  Mục lục: Danh sách chương, đề mục, điểm lớn luận văn, kèm theo số trang cho mục  References: Danh sách tài liệu mà tác giả tham khảo sử dụng trình thực luận văn PL  Glossary: Danh mục thuật ngữ, hình ảnh, bảng biểu xuất luận văn, kèm theo số trang lần xuất 8) Paper - Bài báo khoa học: Kết công bố công trình nghiên cứu khoa học Được đăng tải tạp chí khoa học kỷ yêu hội thảo Cấu trúc Paper bao gồm:  Abstract: Mô tả khái quát nội dung trình bày báo  Keywords: Các từ khóa thể chủ đề báo  References: Danh sách tài liệu tham khảo trình nghiên cứu đề cập đến báo 9) Đề tài nghiên cứu khoa học  Đơn vị quản lý đề tài  Thông tin hội đồng nghiệm thu đề tài  Kết nghiệm thu 10) Đồ án môn học: Bản báo cáo đĩa CD mã nguồn đồ án mà  Thông tin môn học (tên môn học, nội dung phần kiến thức liên quan đồ án, v.v )  References: Danh sách tài liệu tham khảo đến trình thực đồ án 11) Đề thi môn học:  Barem điểm: Thang điểm cụ thể cho câu hỏi đề thi  Nội dung kiến thức: kiểm tra đề thi - xem đề cương ôn tập đề thi  Quy chế kiểm tra: quy định thông tin thời gian làm bài, thiết bị/tài liệu đem vào phòng thi, yêu cầu giải, v.v  Mục đích: Mục tiêu đề thi, nhận xét chuyên gia độ khó đề 12) Bài tập giải môn học Tập hợp dạng tập, giải, tập hợp câu hỏi, trả lời kiến thức môn học 13) Đáp án: Lời giải cho nhiều câu hỏi đề thi/bài tập PL Hướng dẫn đánh giá: Hướng dẫn người đọc so sánh nội dung đáp án với nội dung lời giải người đọc cho câu hỏi MÔ HÌNH CSDL CỦA KHO TÀI LIỆU Hình 2.1: Tổ chức CSDL kho tài liệu  Bảng publisher: chứa thông tin nhà xuất (NXB) tài liệu, bao gồm trường mô tả sau: Field Mô tả PL  idPublisher thông tin định danh NXB name tên NXB website địa chỉwebsite NXB Bảng author: chứa thông tin liên quan đến tác giả tài liệu: Field Mô tả idAuthor thông tin định danh tác giả Name tên tác giả dob thông tin ngày sinh tác giả website địa chỉwebsite tác giả nationality quốc tịch tác giả, ghi theo quy ước chuẩn ISO 3166-1  Bảng category: chứa thông tin mục đích sử dụng tài liệu: Field Mô tả idCategory thông tin định danh name mục đích sử dụng tài liệu Có mục đích việc sử dụng tài liệu bao gồm: - Tài liệu giảng dạy: mang nội dung giáo khoa, phục vụ công tác giảng dạy, chẳng hạn như: giảng điện tử, sách giáo khoa, sách nâng cao, … - Tài liệukiểm tra/đánh giá: Mang nội dung liên quan đến việc kiểm tra đánh giá trình giảng dạy ví dụ như: đề thi mẫu, giải mẫu, … - Tài liệu tra cứu: Được sử dụng chủ yếu công tác nghiên cứu, tham khảo chuyên môn, nội dung loại tài liệu chưa chuẩn hóa thành giáo khoa  Bảng type: lưu thông tin loại hình (dạng) tài liệu với thuộc tính: Field Mô tả idType thông tin định danh name tên loại tài liệu idCategory thông tin mục đích sử dụng tài liệu, tham chiếu khóa ngoại đến bảng category PL detail_table_name tên table lưu thông tin đặc thù loại tài liệu Ta phân loại dạng tài liệu theo mục đích sử dụng sau: - Tài liệu giảng dạy: sách giáo khoa, sách tham khảo, slide giảng, video ghi hình giảng, audio ghi âm giảng, hướng dẫn sử dụng công cụ, cookbook tutorial - Tài liệu kiểm tra/đánh giá: đề kiểm tra mẫu, tập, đáp án hướng dẫn đánh giá - Tài liệu nghiên cứu/tham khảo: đồ án môn học, khóa luận/ luận văn đại học, luận văn thạc sĩ, luận án tiến sĩ, báo khoa học, báo cáo kỹ thuật, đề tài NCKH, kỷ yếu hội thảo/Tạp chí khoa học  Bảng document: bảng chứa thông tin liên quan trực tiếp đến tài liệu bảng quan trọng CSDL, bao gồm yếu tố theo sơ đồ mô tả tài nguyên trên: Field Mô tả idDocument title thông tin định danh tiêu đề tài liệu, trích xuất trực tiếp từ tài liệu nhà xuất tài liệu, tham chiếu khóa ngoại đến bảng publisher dạng/loại hình tài liệu, tham chiếu khóa ngoại đến bảng type định dạng tài liệu chủ đề tài liệu, đồng thời cho biết tài liệu lưu đâu thư mục quy chuẩn, tham chiếu khóa ngoại đến bảng directory người trực tiếp đóng góp tài liệu vào hệ thống, tham chiếu khóa ngoại đến bảng MEMBER giới thiệu/mô tả tài liệu Thông tin người tải tài liệu lên hệ thống nhập ngày tài liệu thêm vào hệ thống ngày tài liệu xuất Thông tin trích xuất từ tài nguyên người tải lên idPublisher idType format idSubject idMember description date added date_publish PL language file_name source link_image rights coverage keyphrase_list keyphrase_graph kg_id  tài nguyên nhập vào ngôn ngữ sử dụng tài liệu Tên tập tin tài liệu lưu thông tin vị trí lưu trữ tài nguyên bên hệ thống (địa đường dẫn tài liệu) Ở mục lưu tên file tập tin không cần thiết phải lưu toàn đường dẫn theo cấu trúc thư mục Lý phần đường dẫn đến file tài nguyên không cố định, thay đổi linh động trình xây dựng ta cần cố định đường dẫn, phần lại cần gán thêm tên file vào bên để tạo thành đường dẫn đầy đủ lưu thông tin đường dẫn đến trang bìa loại tài liệu Mục linh động số tài liệu trang bìa bị hỏng thông tin quyền mà người sử dụng hệ thống có tài liệu thông tin giới hạn không gian hay thời gian đề cập tài liệu Danh sách keyphrase đặc trưng ngữ nghĩa tài liệu Đồ thị keyphrase biểu diễn tài liệu Danh sách keyphrase đặc trưng tài liệu Bảng relationship: thể mối liên hệ tài liệu kho, gồm trường: Field Mô tả thông tin định danh tên gọi mối quan hệ cho biết quan hệ có tham số hay không Mô tả mối quan hệ ngôn ngữ tự nhiên, mô tả tham số quan hệ is_reflexive cho biết quan hệ phản xạ hay không oposite_direction_name Nếu quan hệ X định nghĩa không phản xạ, thuộc tính chứa tên quan hệ X’ cho D1 X D2 D2 X’ D1 idRelationship name hasParameter Description PL 10  Bảng document_author: bảng phụ thể mối liên hệ tài liệu tác giả tài liệu Field Mô tả idDocument thông tin định danh tài liệu, tham chiếu khóa ngoại đến bảng document tin định danh tác giả, tham chiếu khóa ngoại đến bảng author idAuthor  Bảng document_relationship: bảng phụ thể mối liên hệ loại tài nguyên với Field Mô tả idSource thông tin định danh tài liệu thứ nhất, tham chiếu khóa ngoại đến bảng document idTarget thông tin định danh tài liệu thứ hai, tham chiếu khóa ngoại đến bảng document idRelation thông tin định danh loại quan hệ mà tài liệu có liên quan đến nhau, tham chiếu khóa ngoại đến bảng relationship parameter  tham số quan hệ Các bảng *_detail: lưu thông tin đặc thù loại tài liệu Ngoài thuộc tính chung mô tả tài nguyên bảng document, loại tài liệu gộp chứa vài thuộc tính đặc thù riêng nhằm diễn đạt chi tiết cấu trúc thông tin loại hình tài liệu  Bảng type_structure: Để tiện việc xử lý, ta có bảng type_structure lưu trữ thông tin trường liệu bảng *_detail Mỗi field bảng *_detail tương ứng với records bảng type_structure Các thông tin lưu trữ bảng type_structure bao gồm: PL 11 Field Mô tả Thông tin xác định loại tài liệu, xác định tên cụ thể bảng *_detail field_name Tên “field” bảng *_detail field kết hợp với id_type làm thành khóa type_structure display_name Tên ngôn ngữ tự nhiên hiển thị cho người dùng loại siêu liệu mà “field” lưu trữ Description Mô tả cho “field” search_for_keyphrase cho biết tài liệu tải lên hệ thống có cần tiến hành tìm rút trích keyphrase từ thông tinh “field” hay không id_type [...]... tổ chức, quản lý thử nghiệm và xây dựng một ứng dụng thử nghiệm dưới dạng một hệ thống truy hồi tài liệu theo ngữ nghĩa trên nền web Ứng dụng thử nghiệm này hướng đến mục đích phục vụ cho việc tìm kiếm tài liệu học tập của sinh viên tại thư viện trường cao đẳng Kinh tế công nghệ TpHCM 1.3 Phương pháp nghiên cứu Xuất phát từ việc phân tích các phương pháp và kỹ thuật đã có, đặc biệt là kỹ thuật được... vực CNTT trong phạm vi thư viện của Trường cao đẳng Kinh tế công nghệ TpHCM Luận văn đặt mục tiêu đưa ra được một số cải tiến trong mô hình biểu diễn và nhất là các phương pháp kỹ thụật giải quyết các vấn đề của bài toán đánh giá độ tương đồng ngữ nghĩa của tài liệu Các đề xuất sẽ nhắm đến việc cải thiện hiệu quả khâu tìm kiếm theo ngữ nghĩa trên cả hai bình diện cải tiến sự hiệu quả (thông qua hai độ... khá cao và cần thiết Do đó, mục tiêu của ứng dụng đặt ra là xây dựng được một hệ thống quản lý tài nguyên học tập về một lĩnh vực đặc biệt như CNTT với khả năng tìm kiếm liên quan đến thông tin tri thức hay nội dung của tài liệu Các tác động của kết quả nghiên cứu :  Góp phần nâng cao hiệu quả công tác tổ chức quản lý và chia sẽ các nguồn tài nguyên học tập  Nâng cao chất lượng đào tạo và hiệu quả. .. chức năng không chỉ hỗ trợ tìm kiếm dựa trên từ khóa, tìm kiếm theo hệ thống thư mục mà còn hỗ trợ tìm kiếm dựa trên tri thức của lĩnh vực hay theo ngữ nghĩa, trả về tập tài liệu kết quả đúng nhất với ý định của người dùng Ứng dụng đã được cài đặt, thử nghiệm tại trường cao đẳng Kinh tế công nghệ Thành phố Hồ Chí Minh Kết quả thực nghiệm bước đầu cho thấy giải pháp đã đề xuất là khả quan và có khả... liệu sẵn có 3 thư ng tập trung nhiều tài liệu đặc chủng và chuyên ngành không dễ có thể tìm thấy trên Internet Hiện nay người dùng thư ng có một số lựa chọn sau khi tìm nguồn thông tin từ các bộ sưu tập sẵn có: Các thư viện điện tử: Thông thư ng, đây là địa điểm đầu tiên cần nghĩ đến khi tìm kiếm tài liệu tham khảo khoa học Nhiều thư viện lớn hiện nay đã tin học hoá thư mục để có thể tra cứu qua các... thị keyphrase  Đặc biệt là các phương pháp và kỹ thuật dựa trên các ontology sẽ được vận dụng một cách linh hoạt có sự phát triển để tạo ra các mô hình, các ngôn ngữ đặc tả, kỹ thuật tổ chức kho tài liệu có ngữ nghĩa phục vụ việc xử lý lưu trữ và tìm kiếm theo ngữ nghĩa một cách hiệu quả hơn Luận văn đã đưa ra được nhiều cải tiến có hiệu quả trong kỹ thuật biểu xvi diễn ngữ nghĩa và xử lý tính toán... liệu 7 Nghiên cứu các phương pháp biểu diễn tri thức hiện đại, đặc biệt là các ontology phục vụ cho việc biểu diễn và xử lý ngữ nghĩa Nghiên cứu xây dựng giải pháp bao gồm: + Các phương pháp tổ chức lưu trữ, cập nhật + Các kỹ thuật: xử lý tìm kiếm cơ bản, tìm kiếm có ngữ nghĩa (semantic search) Khảo sát và nghiên cứu các công cụ, công nghệ liên quan Xây dựng hệ ứng dụng quản lý tìm kiếm sách học tập... dụng quản lý tìm kiếm sách học tập về lĩnh vực CNTT trong phạm vi của trường Cao đẳng Kinh tế công nghệ TpHCM 8 CHƯƠNG 2 CƠ SỞ LÝ THUYẾT 2.1 Giới thiệu về tìm kiếm thông tin 2.1.1 Khái niệm Tìm kiếm thông tin (Information Retrieval - IR) là tìm kiếm tài nguyên (thư ng là các tài liệu – documents) trên một tập các dữ liệu phi cấu trúc (thư ng là các văn bản dạng Text) được lưu trữ trên máy tính nhằm thỏa... dựa trên nhiều thông tin về ngữ nghĩa hơn Các kỹ thuật đánh giá độ tương đồng ngữ nghĩa hay còn gọi là so khớp ngữ nghĩa (semantic matching) đang tỏ ra rất hứa hẹn trong việc thay đổi một cách nền tảng kỹ thuật truy hồi thông tin với độ chính xác và độ bao phủ cao hơn 1.2 Mục tiêu và phạm vi nghiên cứu Trên cơ sở nghiên cứu tìm hiểu các phương pháp, kỹ thuật biểu diễn, xử lý ngữ nghĩa của tài liệu,... nguồn tri thức về lĩnh vực nhất định nào đó Hướng tiếp cận chính cho việc nguyên cứu các hệ thống này là sử dụng các kỹ thuật trong xử lý ngôn ngữ tự nhiên và công nghệ ontology 2.1.3 Đánh giá hệ thống tìm kiếm thông tin Hiệu quả của một hệ truy tìm thông tin có thể được đánh giá theo các tiêu chuẩn sau:  Để đánh giá hiệu quả truy tìm của hệ thống, người ta sử dụng đến hai độ đo cơ bản là độ chính xác
- Xem thêm -

Xem thêm: KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM, KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM, KỸ THUẬT NÂNG CAO HIỆU QUẢ TRA CỨU SÁCH TẠI THƯ VIỆN TRƯỜNG CAO ĐẲNG KINH TẾ CÔNG NGHỆ TP.HCM

Gợi ý tài liệu liên quan cho bạn

Nạp tiền Tải lên
Đăng ký
Đăng nhập