Mô hình ứng dụng dịch vụ web ngữ nghĩa tìm kiếm tài liệu điện tử trong thư viện điện tử

87 12 0
  • Loading ...
1/87 trang

Thông tin tài liệu

Ngày đăng: 31/12/2018, 19:14

1 ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG HỒNG ANH CƠNG HÌNH ỨNG DỤNG DỊCH VỤ WEB NGỮ NGHĨA TÌM KIẾM TÀI LIỆU ĐIỆN TỬ TRONG THƯ VIỆN ĐIỆN TỬ LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Thái Nguyên - Năm 2015 Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THƠNG TIN VÀ TRUYỀN THƠNG HỒNG ANH CƠNG HÌNH ỨNG DỤNG DỊCH VỤ WEB NGỮ NGHĨA TÌM KIẾM TÀI LIỆU ĐIỆN TỬ TRONG THƯ VIỆN ĐIỆN TỬ CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học: TS PHẠM THẾ QUẾ Thái Nguyên - Năm 2015 LỜI CẢM ƠN Để hồn thành luận văn tơi nhiều động viên giúp đỡ cá nhân tập thể Trước hết, cho xin bày tỏ lòng biết ơn sâu sắc đến TS Phạm Thế Quế hướng dẫn thực đề tài nghiên cứu Xin bày tỏ lòng biết ơn chân thành tới thầy cô giáo, người đem lại cho kiến thức vô quý giá, có ích năm học vừa qua Cảm ơn Trường Đại học Văn hóa Thể thao Du lịch Thanh Hóa tạo điều kiện cho tơi trình học tập Cũng xin gửi lời cám ơn chân thành tới Ban Giám hiệu, Phòng Đào tạo, Khoa sau đại học, Đại học Công nghệ thông tin truyền thông Thái Nguyên, tạo điều kiện cho tơi q trình học tập nghiên cứu Cuối tơi xin gửi lời cám ơn đến gia đình, bạn bè đồng nghiệp, tập thể lớp Khoa học máy tính K12G, người ln bên tơi, động viên khuyến khích tơi q trình thực đề tài nghiên cứu Học viên Hồng Anh Cơng ii LỜI CAM ĐOAN Tên tơi Hồng Anh Cơng, học viên cao học lớp Khoa học máy tính K12G, khóa 2013-2015 Tơi xin cam đoan luận văn thạc sĩ „„Mơ hình ứng dụng dịch vụ Web ngữ nghĩa tìm kiếm tài liệu điện tử thư viện điện tử‟‟ cơng trình nghiên cứu riêng tơi, số liệu kết nghiên cứu luận văn trung thực không trùng với đề tài khác Tôi xin cam đoan giúp cho việc thực luận văn cảm ơn thơng tin trích dẫn luận văn rõ nguồn gốc Học viên Hồng Anh Cơng iii MỤC LỤC LỜI CẢM ƠN i LỜI CAM ĐOAN ii MỤC LỤC iii DANH MỤC CÁC TỪ VIẾT TẮT vi DANH MỤC CÁC BẢNG vii DANH MỤC CÁC HÌNH viii MỞ ĐẦU CHƯƠNG 1: DỊCH VỤ WEB NGỮ NGHĨA 1.1 Web nghữ nghĩa 1.1.1 Đặt vấn đề 1.1.2 Nhược điểm World Wide Web 1.1.3 Web ngữ nghĩa [6] 1.1.4 Đặc điểm Web ngữ nghĩa [6] 1.1.5 Siêu liệu (Metadata) [4] 1.1.6 Một số ứng dụng dựa Semantic Web [2] 11 1.1.7 Kiến trúc Web ngữ nghĩa [5] 12 1.1.8 Ngôn ngữ tả tài nguyên 13 1.1.9 Ontology [12] 18 1.2 Dịch vụ Web (Web Services) [3] 20 1.2.1 Giới thiệu 20 1.2.2 Đặc điểm dịch vụ Web 21 1.2.3 Kiến trúc dịch vụ Web [3] 22 1.2.4 Các thành phần dịch vụ Web [3] 23 1.2.5 Quy tắc xây dựng Web ngữ nghĩa 26 1.2.6 Xây dựng dịch vụ Web 27 KẾT LUẬN CHƢƠNG 29 CHƯƠNG 2: ỨNG DỤNG DỊCH VỤ WEB NGỮ NGHĨA TÌM KIẾM TÀI LIỆU TRONG THƯ VIỆN ĐIỆN TỬ 29 2.1 Khái niệm thư viện điện tử [10] 30 2.1.1 Thư viện điện tử 30 2.1.2 Đặc điểm, thành phần thư viện điện tử 30 2.1.3 Lợi ích thư viện điện tử 31 2.2 Cấu trúc thư viện điện tử [13] 33 2.2.1 Cấu trúc thông tin tập hợp đối tượng số 33 2.2.2 Các yếu tố cấu thành hệ thống thư viện số 34 2.3 hình tìm kiếm tài liệu thư viện điện tử dựa dịch vụ Web35 2.3.1 Đặt vấn đề 35 2.3.2 Một số khái niệm, thuật ngữ sử dụng thư viện điện tử 37 2.3.3 Các thành phần 37 2.3.4 Tìm kiếm tài liệu dựa Semantic Web Service thư viện điện tử 40 2.3.5 Công cụ xây dựng Ontology – Protégé 41 KẾT LUẬN CHƯƠNG 43 CHƯƠNG THIẾT KẾ HỆ THỐNG VÀ TRIỄN KHAI ỨNG DỤNG 44 3.1 Phân tích hệ thống tìm kiếm tài liệu thư viện điện tử 44 3.1.1 Các giai đoạn xây dựng hệ thống 44 3.1.2 Phân tích chức tìm kiếm hệ thống 45 3.2 Các quyền hệ thống tìm kiếm tài liệu thư viện điện tử 46 3.3 Thiết kế hệ thống tìm kiếm tài liệu thư viện điện tử 47 3.3.1 Biểu đồ Login 47 3.3.2 Biểu đồ Logout 47 3.3.3 Biểu đồ Import thông tin từ website 48 3.3.4 Biểu đồ Import thông tin thủ công tay 48 3.3.5 Biểu đồ Xem thông tin 49 3.3.6 Biểu đồ Sửa thông tin 49 3.3.7 Biểu đồ Xóa thơng tin 50 3.3.8 Biểu đồ Tìm kiếm thơng tin 50 3.4 Thiết kế Ontology 51 3.4.1 Các bước xây dựng Ontology 51 3.4.2 Thiết kế hình liệu Ontology 54 3.5 Chương trình thử nghiệm đánh giá 60 3.5.1 Trang chủ hệ thống 60 3.5.2 Màn hình hiển thị tất kết tìm kiếm 60 3.5.3 Màn hình hiển thị tìm kiếm tài liệu xác 61 3.5.4 Màn hình hiển thị thông tin tài liệu 61 3.5.5 Màn hình hiển thị thơng tin tác giả 62 3.5.6 Đánh giá chương trình thử nghiệm 62 KẾT LUẬN 63 TÀI LIỆU THAM KHẢO 65 DANH MỤC CÁC TỪ VIẾT TẮT Thuật ngữ tả ý nghĩa Viết tắt B2B Business To Business B2C Business To Customer CNTT Công nghệ thông tin CSDL Cơ sở liệu HTTP Hypertext Transfer Protocol IE Information Extraction RDF Resource Description Framework RDFS Resource Description Framework Schema SOAP Simple Object Access Protocol SQL Structured Query Language SW Semantic web URI Uniform Resource Identifier UDDI Universal Description, Discovery, and Integration W3C World Wide Web Consortium WWW World Wide Web WSDL Web Service Description Language XML Extensible Markup Language vii DANH MỤC CÁC BẢNG Số bảng Bảng 3.1 Tên bảng Các quyền hệ thống Trang DANH MỤC CÁC HÌNH Số hiệu Tên hình 1.1 Kiến trúc semantic web 1.2 Kiến trúc dịch vụ web 1.3 Các thành phần dịch vụ web 1.4 Phát triển dịch vụ web ngữ nghĩa 2.1 Các yếu tố cấu thành hệ thống thư viện số 2.2 Một số thí dụ web ngữ nghĩa hoạt động thư viện điện tử 2.3 Một số chế hoạt động web sevice 2.4 Thành phần Service Provider 2.5 Service Consumer 2.6 Kết nối dịch vụ (Binding) 2.7 hình hệ thống tìm kiếm tài liệu điện tử thư viện điện tử 3.1 Sơ đồ tổng quan hệ thống 3.2 Biểu đồ Login 3.3 Biểu đồ Logout 3.4 Biểu đồ Import thông tin từ Website 3.5 Biểu đồ Import tay 3.6 Biểu đồ xem thôn tin 3.7 Biểu đồ Sửa thơng tin 3.8 Biểu đồ Xóa thơng tin 3.9 Biểu đồ Tìm kiếm thơng tin Trang 55 chí, gọi đối tượng số  Phục vụ mục đích: tìm kiếm thơng tin tài liệu thư viện điện tử Số hóa Trung tâm Học liệu ĐHTN tnu.edu.vn/ 55  Phục vụ đối tượng: Bạn đọc có nhu cầu tìm kiếm thơng tin tài liệu, sách, báo, tạp chí  Phạm vi Ontology: thư viện điện tử toàn quốc Bước 2: Xem xét việc kế thừa Ontology có sẵn Khơng có thừa kế từ Ontology có sẵn Bước 3: Liệt kê thuật ngữ quan trọng Ontology Tài liệu, lĩnh vực, loại tài liệu, thư viện, thời gian, nội dung tài liệu Bước 4: Xây dựng lớp cấu trúc lớp phân cấp Với toán ta xây dựng Ontology định nghĩa tài liệu thư viện điện tử có class chính:  Linh_vuc: class tả lĩnh vực mà tài liệu cụ thể đề cập đến  Loai_tai_lieu: class tả loại tài liệu đề cập đến  Thoi_gian: class tả yếu tố thời gian có liên quan đến tài liệu  Thu_vien: class tả thư viện liên quan tài liệu  Tac_gia: class tả tác giả có liên quan tài liệu  Noi_dung: class tả nội dung tài liệu  Tai_lieu: class bao quát nhất, miêu tả cụ thể rõ ràng đối tượng tài liệu Class chứa liệu liên quan đến tất class lại Bước 6: Định nghĩa thuộc tính quan hệ cho lớp, định nghĩa ràng buộc thuộc tính quan hệ lớp Để trình bày rõ Class Ontology thư viện điện tử, miêu tả kèm theo sơ đồ Class liên quan Class Linh_vuc: Class ta định nghĩa class miêu tả thuộc tính lĩnh vực liên quan đến tài liệu thư viện điện tử là:  Id_linh_vuc: class class Linh_vuc, thể ID lĩnh vực mà tài liệu liên quan  Ten_linh_vuc: object property liên hệ class Linh_vuc class Tai_lieu ID_linh_vuc Số hóa Trung tâm Linh_vuc Học liệu - ĐHTN Tenh_ttlpi:n//hw_wvwu.lcrctnu.edu.vn/ 56 Hình 3.10: Sơ đồ tả class Linh_vuc Class Loai_tai_lieu: Class định nghĩa class liên quan đến vấn đề phân loại tài liệu là:  Id_loai_tai_lieu: class class Loai_tai_lieu, thể ID phân loại tài liệu  Ten_loai_tai_lieu: object property liên hệ class Loai_tai_lieu class Tai_lieu ID_loai_tai_lieu Loai_tai_lieu Ten_loai_tai_lieu Hình 3.11: Sơ đồ tả class Loai_tai_lieu Class Thu_vien Class định nghĩa class liên quan đến thư viện cụ thể Class Thu_vien có class sau:   class Id_thu_vien: class class Thu_vien, thể ID thư viện có liên quan tài liệu Ten_thu_vien: object property liên hệ class Thu_vien Tai_lieu ID_Thu_vien Ten_thu_vien Thu_Vien Hình 3.12: Sơ đồ tả class Thu_vien Class Thoi_gian: Class định nghĩa class mặt thời gian liên quan đến tài liệu Class Thoi_gian có class sau:  Id_thoi_gian: class thể ID thời gian liên quan đến tài liệu  Loai_thoi_gian object property liên hệ class Thoi_gian class Tai_lieu Số hóa Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/ 57 ID_thoi_gian 58 Thoi_gian Loai_thoi_gian Hình 3.13: Sơ đồ tả class Thoi_gian Class Tac_gia: Class định nghĩa class mặt tác giả liên quan đến tài liệu Class Tac_gia có class sau:  Id_tac_gia: thể ID tác gải có liên quan đến tài liệu  Ho_ten: object property liên hệ class Tac_gia class Tai_lieu  Trinh_do: thể thông tin trình độ học vấn tác giả ID_Tac_gia Tac_gia Ho_ten Trinh_do Hình 3.14: Sơ đồ tả class Tac_gia Class Noi_dung: Class định nghĩa class nội dung văn Class Noi_dung bao gồm:  Trich_luoc_noi_dung: object property liên hệ class Noi_dung class Van_ban  Noi_dung_day_du: class thể nội dung đầy đủ văn Trich_luoc_noi_dung Số hóa Trung tâm Học liệu - ĐHTN Noi_dung http://www.lrc-tnu.edu.vn/ Noi_dung_day_du Hình 3.15: Sơ đồ tả class Noi_dung Class Tai_lieu: Class Tai_lieu class đặc biệt Ontology Class Tai_lieu chứa class con, Object Properties Data Properties để liên kết với class khác tạo thành Ontology hoàn chỉnh thư viện điện tử Class Tai_lieu chứa Object Properties sau:  ID_tai_lieu: class thể ID tài liệu cụ thể  Ten_loai_tai_lieu: object property liên kết class Tai_lieu class Loai_tai_lieu  Ten_thu_vien: object property liên kết class Tai_lieu class Thu_vien  Ten_linh_vuc: object property liên kết class Tai_lieu class Linh_vuc  Loai_thoi_gian: object property liên kết class Tai_lieu class Thoi_gian  Trich_luoc_noi_dung: object property liên kết class Tai_lieu class Noi_dung  Ten_tac_gia: object property liên kết class Tai_lieu class Tac_gia ID_tai_lieu Ten_loai_tai_lie Trich_luoc_ noi_dung Ten_tac_gia Số hóa Trung tâm Học liệu ĐHTN Tai_lieu Ten_thu_vien Ten_linh_vu Loai_thoi_gia tnu.edu.vn/ Hình 3.16: Sơ đồ tả class Tai_lieu Tổng quát Ontology Từ sơ đồ trên, sơ đồ tổng quát thể liên kết class Ontology sau: Linh_vuc Thu_vien Loai_tai_lieu Ten_linh_vuc Ten_thu_vien Ten_tai_lieu Loai_thoi_gian Tai_lieu Ten_tac_gia Trich_luoc_noi_dung Thoi_gian Tac_gia Noi_dung Hình 3.17: Sơ đồ tả tổng qt Ontology Bước 7: Tạo thực thể cho lớp Để xây dựng thực thể cho lớp, sử dụng cơng cụ Protégé Hình 3.18: Ontology tài liệu xây dựng công cụ Protége Sử dụng công cụ Protége tạo thực thể Linh_vuc, Loai_tai_lieu, Tai_lieu, Thu_vien, 3.5 Chương trình thử nghiệm đánh giá 3.5.1 Trang chủ hệ thống Hình 3.19: Trang chủ hệ thống 3.5.2 Màn hình hiển thị tất kết tìm kiếm Hình 3.20: Màn hình hiển thị tất kết tìm kiếm Đối với kết thực nghiệm với hệ thống tìm kiếm tài liệu thư viện điện tử, ứng dụng cho phép người dùng tìm kiếm tài liệu mức tìm kiếm nâng cao đưa gợi ý cho người dùng có nhiều kết trùng 61 3.5.3 Màn hình hiển thị tìm kiếm tài liệu xác Hình 3.21: Màn hình hiển thị tìm kiếm tài liệu xác Lần lượt nhập thơng tin cần tìm kiếm để kiểm tra Kết chương trình thể kết tìm kiếm tài liệu liên quan đến nội dung cần kết cho độ xác cao 3.5.4 Màn hình hiển thị thơng tin tài liệu Hình 3.22 Màn hình hiển thị thơng tin tài liệu 62 Nhập thơng tin cần tìm kiếm để kiểm tra Kết tìm kiếm tài liệu liên quan đến nội dung cần kết cho độ xác cao 3.5.5 Màn hình hiển thị thơng tin tác giả Hình 3.23 Màn hình hiển thị thơng tin tác giả Đây phần thể thông tin tên đề tài, cán hướng dẫn đề tài học viên thực để tài 3.5.6 Đánh giá chương trình thử nghiệm Trong trình nghiên cứu xây dựng Web ngữ nghĩa trợ giúp tra cứu tìm kiếm tài liệu thư viện điện tử dựa Ontology Website cho phép người dùng tìm kiếm tài liệu xác Sử dụng ngơn ngữ truy vấn SPARQL truy vấn liệu Việc truy vấn không tìm theo liệu túy, mà dựa liệu có nghĩa, theo element định nghĩa RDF trước Trong q trình tìm kiếm thơng tin hệ thống hỗ trợ tìm kiếm xác tìm gần Với tìm kiếm xác, người dùng nhập đầy đủ xác từ khóa cần tìm, lúc có hai trường hợp xảy ra:  Nếu từ khóa cần tìm tên loại tài liệu kết trả tất thực thể có quan hệ với tài liệu 63  Ngược lại, từ khóa cần tìm khơng phải tên loại tài liệu kết trả thông tin thực thể liên quan tồn ứng dụng  Với tìm kiếm gần đúng, người dùng cần nhập phần chuỗi từ khóa cần tìm, kết trả tập tên thực thể mà có chứa phần giống với chuỗi gõ vào Sau người dùng chọn chức hiển thị thơng tin chi tiết để xem KẾT LUẬN Kết đạt luận văn Việc nghiên cứu, ứng dụng dịch vụ Web để xây dựng website tìm kiếm tài liệu thư viện điện tử thu kết ban đầu đáng khích lệ Về mặt lý thuyết, nghiên cứu nêu nét đặc trưng, ưu web semantic Bên cạnh đó, dựa việc tìm hiểu ngơn ngữ, cơng cụ hỗ trợ lập trình web ngữ nghĩa, luận văn đưa Ontology tài liệu thư viện điện tử, xây dựng website tìm kiếm tài liệu theo chuẩn semantic web Nắm công nghệ Web ngữ nghĩa, điểm khác biệt Web ngữ nghĩa Web truyền thống 64 Về ứng dụng minh họa, với mục tiêu làm rõ thêm lý thuyết, luận văn ứng dụng dịch vụ Web ngữ nghĩa với công cụ hỗ trợ Protégé OwlDotNetApi Cụ thể, xây dựng tài liệu thư viện điện tử, khai thác tính 64 truy xuất tài liệu tả ngữ nghĩa nhằm chia tài nguyên thông tin tài liệu thực tìm kiếm kết xác Đối với kết thực nghiệm với hệ thống tìm kiếm tài liệu thư viện điện tử Trang web chứng minh tảng lý thuyết nghiên cứu kết hợp hình phát triển cơng cụ hỗ trợ phát triển với công nghệ NET Ứng dụng cho phép người dùng tìm kiếm tài liệu mức tìm kiếm nâng cao đưa gợi ý cho người dùng có nhiều kết trùng Với việc sử dụng hệ truy vấn SPARQL, việc truy vấn liệu khơng tìm theo liệu túy, mà dựa liệu có nghĩa, theo element định nghĩa RDF trước Đây cách xử lý dựa công cụ mã nguồn mở xu hướng nghiên cứu mở rộng xử lý ngôn ngữ tự nhiên tương lai Luận văn đưa công cụ cần thiết để phát triển ứng dụng Web ngữ nghĩa hiệu Cùng với đa dạng thông tin nhu cầu cần thiết sử dụng thông tin hiệu nhanh chóng Đặc biệt, với xu hướng đưa ứng dụng lên web Web ngữ nghĩa ngày trở nên thực tiễn Hạn chế hệ thống Ontology mức độ nhỏ, cần phải có liệu Ontology đầy đủ để đánh giá mức độ xử lý tìm kiếm xác mức độ đáp ứng người dùng truy cập ứng dụng lúc Ngoài ra, chưa có kết nối liệu trích rút từ WWW liệu Ontology Chức trích rút thuộc tính tự động nghiên cứu có nhiều điểm chưa thống nghiên cứu khác giới Bên cạnh đó, việc cài đặt máy local, chưa triển khai lên server Internet 65 TÀI LIỆU THAM KHẢO [1] Dr Harald Sack, Hasso-Plattner-Institut, Universität Potsdam, Semantic Web Technologies Lecture Semantic Web Technologies, 2012 [2] Universität PotsdamFreitag, Dr.Harald Sack, Hasso-Plattner-Institut, Semantic Web Technologies Semantic Technologies Research Group @ HPI3 Lecture Semantic Web Technologies, 2012 [3] Ethan Cerami, Web Services Essentials, 2012 [4] Andrew Perez-Lopez, John Hebeler, Matthew Fisher, Ryan Blace, Semantic Web Programming, Wiley Publishing, Manhattan, 2009 [5] IGI.Global.Semantic.Web.Technologies.and.E.Business.Jan.2007 [6] Oxford.Press.Agency.and.the.Semantic.Web.Nov.2006 66 [7] Antoniou, G and F van Harmelen, A Semantic Web Primer, MIT Press, Cambridge, MA, 2003 [8] Ebook “Web service with SOAP” [9] Nguyễn Minh Hiệp Sử dụng Greenstone để xây dựng sưu tập thư viện số// Tạp chí thư viện Việt Nam, 2007 - số - tr.12 – 17 [10] Nguyễn Tiến Đức Xây dựng thư viện điện tử vấn đề số hoá tài liệu Việt Nam// Tạp chí thơng tin liệu, 2005.- số - tr 14 – 18 Internet [11] http://www.w3schools.com/webweb_semantic.asp Trang viết semantic web w3schools [12] http://www.w3.org/TRrdf-sparql-query Hệ truy vấn SPARQL [13] http://nlv.gov.vn/nghiep-vu-thu-vien/semantic-web-va-thu-vien-so.html [14] http://protégé.stanford.edu Trang chủ công cụ Protégé [15] http://www.thuvien.net [16] http://www.nghiepvuthuvien.com ... web Nội dung luận văn gồm chương: Chương 1: Dịch vụ Web ngữ nghĩa Chương 2: Mơ hình ứng dụng dịch vụ Web ngữ nghĩa tra cứu tìm kiếm tài liệu thư viện điện tử Chương 3: Cài đặt ứng dụng Dịch vụ. .. 29 CHƯƠNG 2: ỨNG DỤNG DỊCH VỤ WEB NGỮ NGHĨA TÌM KIẾM TÀI LIỆU TRONG THƯ VIỆN ĐIỆN TỬ 29 2.1 Khái niệm thư viện điện tử [10] 30 2.1.1 Thư viện điện tử 30 2.1.2... tầng Web cụ thể Các ứng dụng hoạt động theo mơ hình Client/Server Để hiểu thêm vấn đề này, em chọn đề tài “Mơ hình ứng dụng dịch vụ Web ngữ nghĩa tìm kiếm tài liệu điện tử thư viện điện tử nhằm
- Xem thêm -

Xem thêm: Mô hình ứng dụng dịch vụ web ngữ nghĩa tìm kiếm tài liệu điện tử trong thư viện điện tử , Mô hình ứng dụng dịch vụ web ngữ nghĩa tìm kiếm tài liệu điện tử trong thư viện điện tử

Gợi ý tài liệu liên quan cho bạn

Nhận lời giải ngay chưa đến 10 phút Đăng bài tập ngay