ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

68 593 1
ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  Lương Đỗ Long ỨNG DỤNG WEB NGỮ NGHĨA TRONG LƯU TRỮ VÀ QUẢN LÍ CÁC TÀI LIỆU SỐ LUẬN VĂN THẠC SĨ KHOA HỌC HÀ NỘI - 2011 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ  Lương Đỗ Long ỨNG DỤNG WEB NGỮ NGHĨA TRONG LƯU TRỮ VÀ QUẢN LÍ CÁC TÀI LIỆU SỐ Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 60.48.05 LUẬN VĂN THẠC SĨ KHOA HỌC Cán hướng dẫn khoa học: PGS TS Đỗ Trung Tuấn HÀ NỘI - 2011 LỜI CAM ĐOAN Tôi xin cam đoan luận văn: “ỨNG DỤNG WEB NGỮ NGHĨA TRONG LƯU TRỮ VÀ QUẢN LÍ CÁC TÀI LIỆU SỐ” kết nghiên cứu riêng tôi, không chép riêng Các số liệu bảng biểu hồn tồn xác nội dung luận văn có tham khảo sử dụng tài liệu, thông tin đuợc đăng tải tác phẩm, tạp chí trang web theo danh mục tài liệu luận văn Hà nội, ngày 02 tháng 05 năm 2011 Tác giả luận văn Lương Đỗ Long i LỜI CẢM ƠN Trước tiên xin chân thành cảm ơn PGS.TS Đỗ Trung Tuấn, người thầy hướng dẫn tận tình, bảo thẳng thắn động viên nhiều để tơi hồn thành luận văn Tơi xin chân thành cảm ơn thầy, cô giáo Trường Đại học Công nghệ đặc biệt thầy, cô giáo môn Hê thống Thông tin giảng dạy, động viên tạo điều kiện thuận lợi cho tơi q trình học tập làm luận văn Sau cùng, xin đuợc gửi lời cám đến bạn đồng nghiệp, bạn học viên cao học khóa 15 - người động viên, giúp đỡ suốt trình học tập thực luận văn Hà nội, Mùa hè năm 2011 Tác giả luận văn Lương Đỗ Long ii MỤC LỤC Chương TỔNG QUAN VỀ WEB NGỮ NGHĨA 1.1 Khái niệm Web ngữ nghĩa Siêu liệu .1 1.1.1 Khái niệm 1.1.2 Siêu liệu .2 1.2 Kiến trúc Web ngữ nghĩa .3 1.3 Ngôn ngữ Cơ cấu mô tả tài nguyên Bản thể luận 1.3.1 Ngôn ngữ mô tả tài nguyên RDF 1.3.2 Bản thể luận 15 1.3.3 Lược đồ RDF truy vấn RDF .16 Kết luận 23 Chương TIẾP CẬN WEB NGỮ NGHĨA TRONG LƯU TRỮ VÀ QUẢN LÍ TÀI LIỆU SỐ 24 2.1 Web ngữ nghĩa thư viện số .24 2.1.1 Thư viện số ngữ nghĩa 24 2.1.2 Tổ chức tri thức thư viện 26 2.1.3 Web ngữ nghĩa thư viện số 26 2.2 Kiến trúc thư viện số ngữ nghĩa 30 2.3 Bản thể luận cho thư viện số ngữ nghĩa .31 2.3.1 Bản thể luận biểu ghi thư mục .31 2.3.2 Bản thể luận cho cấu trúc nội dung 33 2.3.3 Cơ phân loại 34 2.3.4 Xây dựng Bản thể luận 36 2.4 Thư viện số ngữ nghĩa mạng xã hội .37 2.5 Tìm kiếm thư viện ngữ nghĩa 38 iii 2.5.1 Tìm kiếm dựa phân loại .38 2.5.2 Tìm kiếm ngữ nghĩa 38 Kết luận 40 Chương Xây dựng thư viện số ngữ nghĩa dựa phần mềm JeromeDL 41 3.1 Giới thiệu phần mềm JeromeDL 41 3.2 Kiến trúc Bản thể luận JeromeDL 42 3.2.1 Kiến trúc JeromeDL 42 3.2.2 Bản thể luận JeromeDL 44 3.3 Truy vấn JeromeDL 48 3.4 Sử dụng JeromeDL 51 Kết luận 53 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 54 TÀI LIỆU THAM KHẢO 56 iv Bảng kí hiệu thuật ngữ viết tắt Tên viết tắt WWW Tiếng Việt Mạng toàn cầu Tiếng Anh W3C Tổ chức Mạng toàn cầu World Wide Web World Wide Web Consortium RDF Cơ cấu mô tả tài nguyên Resource Description Framework RDFS Lược đồ Cơ cấu mô tả tài Resource Description Framework nguyên Scheme XML Ngôn ngữ đánh dấu mở rộng v eXtensible Markup Language Danh mục hình ảnh Hình 1.1 Kiến trúc Web ngữ nghĩa Hình 1.2 Đồ thị RDF 11 Hình 1.3 Quan hệ kế thừa 17 Hình 1.4 Khơng gian miền giới hạn thuộc tính RDFS .20 Hình 2.1 Các thành phần hỗ trợ thư viện số ngữ nghĩa .26 Hình 2.2 Biểu diễn cấu trúc tài liệu dạng RDF 29 Hình 2.3 Kiến trúc thư viện số ngữ nghĩa 31 Hình 2.4 Bản thể luận BibTeX 32 Hình 2.5 Một dạng phân cấp 35 Hình 2.6 Một Bản thể luận Cys 35 Hình 2.7 Quá trình tìm kiếm thư viện số ngữ nghĩa 39 Hình 2.8 Quá trình chia sẻ liệu RDF .40 Hình 3.1 Giao diện JeromeDL 42 Hình 3.2 Kiến trúc JeromeDL .43 Hình 3.3 Bản thể luận MarcOnt 44 Hình 3.4 Bản thể luận cấu trúc nội dung 46 Hình 3.5 Mạng xã hội JeromeDL .48 Hình 3.6 Các bước truy vấn JeromeDL .49 Hình 3.7 Giao diện chức tìm kiếm ngữ nghĩa 52 Hình 3.8 Giao diện chức xuất tài liệu 53 vi Danh mục bảng biểu Bảng Các lớp RDFS 18 Bảng Các thuộc tính RDFS .19 Bảng Các lớp, thuộc tính, thể Bản thể luận MarcOnt 45 Bảng Các lớp, thuộc tính, thể Bản thể luận cấu trúc nội dung 47 vii MỞ ĐẦU Web ngữ nghĩa (hay Semantic Web) hệ mở rộng Web đưa Tim Berners-Lee vào khoảng năm 1998 Mục tiêu ban đầu Semantic Web để hỗ trợ người dùng tìm kiếm thơng tin mạng cách nhanh chóng, chuẩn xác thông minh so với công cụ tìm kiếm truyền thống Theo định nghĩa tổ chức World Wide Web Consortium (W3C), web ngữ nghĩa mở rộng WWW cách thêm vào mô tả ý nghĩa (hay ngữ nghĩa) thông tin dạng mà chương trình mà máy tính hiểu cho phép xử lí thơng tin có hiệu Web ngữ nghĩa cố gắng để máy tính hiểu khái niệm, mối quan hệ khái niệm, thuộc tính tiến trình chúng Trong trường hợp này, máy tính có khả kết luận trích xuất thơng tin có giá trị từ liệu tồn Web ngữ nghĩa khơng phải Trí tuệ nhân tạo (AI), xem loại web thơng minh, hay hệ phát triển web Nền tảng làm nên web ngữ nghĩa siêu liệu (metadata) thể luận Siêu liệu hiểu đơn giản liệu liệu, thể luận định nghĩa từ vựng sử dụng miền ứng dụng khác Các siêu liệu dùng để biểu diễn cho loại tài nguyên (thực thể khái niệm) Một cách để biểu diễn khái niệm, mối quan hệ chúng tài liệu sử dụng ngôn ngữ mô tả tài nguyên RDF (Resource Description Framework) Các tài liệu số (tài nguyên) thường đường lưu trữ truy cập qua cổng thông tin thư viện số Các thư viện số ngồi chức lưu trữ tài liệu số, cịn có chức cho phép người sử dụng tìm kiếm tài liệu có liên quan cách nhanh Các siêu liệu cách tiếp cận cho việc biên mục, phân loại hỗ trợ tìm kiếm tài liệu số Trong cách biểu diễn siêu liệu, tài liệu số “cấu trúc hóa” vào siêu liệu Bất kì thơng tin thư viện số biểu diễn siêu liệu, với cách biểu diễn thuận lợi cho việc quản lí người dùng dễ dàng tìm kiếm tài liệu gốc Ngoài ra, cách tiếp cận cho phép thư viện số dễ dàng chia sẻ tài nguyên với dựa chuẩn đặc tả chung Việc tích hợp ngữ nghĩa vào viii Quản lí tài nguyên Quản lí người dùng Hiển thị tài nguyên Duyệt tài nguyên Tìm kiếm tài nguyên Hình 3.2 Kiến trúc JeromeDL Trong kiến trúc JeromeDL đặc biệt nhấn mạnh vào phần ứng dụng Web ngữ nghĩa dựa siêu liệu Các phần JeromeDL bao gồm:  Quản lí tài nguyên: Các tài nguyên miêu tả ngữ nghĩa theo thể luận Jerome (đề cập phần sau), cộng với tập mục nội dung tài nguyên miêu tả biểu ghi thư mục MARC21 BibTeX Trong JeromeDL, người dùng bình thường thêm tài nguyên vào CSDL thông qua giao diện Web, để thực việc quản trị, JeromeDL cung cấp riêng giao diện cho quản trị viên, cho phép quản li thêm siêu liệu (Các biểu ghi thư mục MARC21, BibTeX, Bản thể luận) vào sở tri thức, tài liệu đưa lên, phải quản tri viên phê duyệt xuất cho người dùng  Tìm kiếm duyệt tài nguyên: thực hiên truy vấn tài nguyên theo yêu cầu người dùng dựa liệu ngữ nghĩa  Quản lí hồ sơ người dùng: Quản lí người sử dụng thư viện, mối quan hệ người dùng với cộng đồng sử dụng thư viện 43  Quản lí chia sẻ tài nguyên: Cung cấp cổng giao tiếp với hệ thống khác Cơ sở liệu JeromeDL không truy vấn nội hệ thống mà cịn cho phép thư viện ứng dụng khác sử dụng 3.2.2 Bản thể luận JeromeDL Trong JeromeDL có loại Bản thể luận, Bản thể luận Biểu ghi thư mục, Bản thể luận cấu trúc tài liệu, Bản thể luận FOAFRealm (dựa Bản thể luận FOAF, mô tả mối quan hệ người dùng tương tác họ với tài nguyên) i Bản thể luận Biểu ghi thư mục Mục đích việc xây dựng Bản thể luận Biểu ghi thư mục để giải cho tài ngun, khơng cần thiết phải mơ tả đầy đủ toàn nội dung tài liệu Hiện có nhiều định dạng cho việc xây dựng biểu ghi thư mục (Dublin Core, BibTeX, MARC21), JeromeDL đề xuất Bản thể luận bao quát toàn định dạng biểu ghi thư mục khác nhau, MarcOnt Với MarcOnt ta dễ dàng chuyển đổi qua lại định dạng, kế thừa từ Dublin Core, BibTeX, MARC21 or dit sE Hình 3.3 Bản thể luận MarcOnt Trong JeromeDL để chuyển đổi từ định dạng biểu ghi thư mục sang dạng ngữ nghĩa bao gồm ba bước Cho ví dụ, để chuyển đổi biểu ghi thư mục MARC21 sang dạng ngữ nghĩa MartOnt gồm bước sau: (1) Chuyển têp 44 tin MARC21 sang định dạng XML, gọi tệp tin MARC-XML; (2) Chuyển tệp tin MARC21-XML dạng RDF (tệp tin MARC-RDF); (3) Chuyển đồ thị RDF tới dạng MartOnt Các lớp, thuộc tính thể cụ thể MarcOnt liệt kê chi tiết Bảng Các lớp, thuộc tính, thể Bản thể luận MarcOnt Các lớp marcont:AccessMedium, marcont:Article, marcont:Book, marcont:Booklet, marcont:Cluster, marcont:Collection, marcont:Conference, marcont:Coverage, marcont:DemoSession, marcont:Event, marcont:Faculty, marcont:Inbook, marcont:Incollection, marcont:Inproceedings, marcont:Institute, marcont:Journal, marcont:Lab, marcont:LightingTalk, marcont:Manual, marcont:Mastersthesis, marcont:Meeting, marcont:Misc, marcont:Organization, marcont:PhDthesis, marcont:PosterSession, marcont:Presentation, marcont:Proceedings, marcont:PublicationMedium, marcont:Resource, marcont:Review, marcont:ShortTalk, marcont:SocialMedium, marcont:Talk, marcont:Techreport, marcont:Tutorial, marcont:University, marcont:Unpublished, marcont:WebSite, marcont:Workshop Các thuộc tính marcont:hasAbstract, marcont:hasAddress, marcont:hasAffiliation, marcont:hasAuthor, marcont:hasBeginDate, marcont:hasContents, marcont:hasContributor, marcont:hasCoverage, marcont:hasCreator, marcont:hasDCMIType, marcont:hasDOI, marcont:hasDate, marcont:hasDescription, marcont:hasDomain, marcont:hasEdition, marcont:hasEditor, marcont:hasEndDate, marcont:hasHumanCreator, marcont:hasISBN, marcont:hasISSN, marcont:hasIdentifier, marcont:hasJournal, marcont:hasKeyword, marcont:hasMonth, marcont:hasNote, marcont:hasNumber, marcont:hasOrder, marcont:hasOrganization, marcont:hasOriginalPublicationMedium, marcont:hasPages, marcont:hasPagesFrom, marcont:hasPagesTo, marcont:hasPublisher, marcont:hasRelatedEvent, marcont:hasReview, marcont:hasReviewDate, marcont:hasReviewer, marcont:hasReviewComment, marcont:hasSchool, marcont:hasSeries, marcont:hasSource, marcont:hasSponsor, marcont:hasTitle, marcont:hasTopic, marcont:hasURL, marcont:hasVolume, marcont:hasYear, marcont:howPublished, marcont:isPartOf, marcont:isPeerOf, marcont:presentedAt, marcont:publishedIn 45 Các thể ii marcont:IElectronic, marcont:IInternational, marcont:IInternet, marcont:ILocal, marcont:INational, marcont:IPrinted Bản thể luận Cấu trúc nội dung Không xây dựng thể luận cho biểu ghi thư mục, JeromeDL xây dựng thể luận cho cấu trúc nội dung tài liệu Cấu trúc nội dung tài liệu tổ chức khác tùy theo vào loại tài liệu, ví dụ: sách chia thành chương, tài liệu video lại chia thành phần, tập khác Hình 3.4 Bản thể luận cấu trúc nội dung JeromeDL cố gắng xây dựng Bản thể luận cấu trúc nội dung cách uyển chuyển cho thêm hay bớt khái niệm không ảnh hưởng đến liệu tồn trước đo Bản thể luận Cấu trúc nội dung với biểu ghi thư mục cung cấp cách nhìn tổng thể mô tả tài liệu hỗ trợ đủ cho việc tìm kiếm 46 Bảng Các lớp, thuộc tính, thể Bản thể luận cấu trúc nội dung jeromedl:BinaryResource, jeromedl:Chapter, jeromedl:ComputedResource, jeromedl:Context, jeromedl:DynamicCollection, jeromedl:DynamicCollectionType, jeromedl:ImageResource, jeromedl:InformationObject, jeromedl:MediaPart, jeromedl:MediaResource, jeromedl:Page, jeromedl:Part, jeromedl:Resource, jeromedl:ResourceType, jeromedl:ResourcesAggregationService, jeromedl:SubmissionStatusType Các lớp Các thuộc tính iii jeromedl:actsOn, jeromedl:hasAttachment, jeromedl:hasBookType, jeromedl:hasCollectionOrder, jeromedl:hasCollectionSpecification, jeromedl:hasCollectionType, jeromedl:hasContext, jeromedl:hasCopyrightsOwner, jeromedl:hasCover, jeromedl:hasCurrentVersion, jeromedl:hasDescription, jeromedl:hasFileSize, jeromedl:hasInvocationParam, jeromedl:hasMimeType, jeromedl:hasNumberOfPages, jeromedl:hasPages, jeromedl:hasPart, jeromedl:hasParts, jeromedl:hasPosition, jeromedl:hasPreviousVersion, jeromedl:hasRepresentation, jeromedl:hasSimplerRepresentation, jeromedl:hasSpecification, jeromedl:hasSubmissionStatus, jeromedl:hasUploadDate, jeromedl:hasVersionComment, jeromedl:hasVersionCreator, jeromedl:hasVersionDate, jeromedl:hasVersionNumber, jeromedl:invokesService, jeromedl:isPeerReviewed, jeromedl:isPreprintVersion, jeromedl:isScaledToFit, jeromedl:isSizeWithSubCollections, jeromedl:isUnion, jeromedl:isUploadedBy, jeromedl:isVisible, jeromedl:publishedAt Bản thể luận FOAFRealm Để quản lí hồ sơ người dùng, JeromeDL sử dụng thể luận FOAFRealm FOAFTRealm cải tiến FOAF với nhiều khái niệm cho phù hợp với mạng xã hội gắn liền với siêu liệu thư viện Chi tiết FOAFRealm xem [15] JeromeDL tận dụng lợi tối đa mạng xã hội việc hỗ trợ người dùng Người dùng tạo bookmarks tài liệu, bình luận gợi ý cho người tài liệu thuộc lĩnh vực mà họ quan tâm, người bạn họ tham chiếu đến 47 Hình 3.5 Mạng xã hội JeromeDL 3.3 Truy vấn JeromeDL Thuật tốn tìm kiếm JeromeDL bao gồm ba bước chình, mơ tả hình 3.6 Trong bước u cầu siêu liệu khác [7]:  Bước A: Đầu tiên tìm kiếm qua tập mục nội dung tài nguyên nội dung giải người  Bước B: Tìm kiếm mơ tả biểu ghi thư mục  Bước C: Bước cuối tìm kiếm theo ngữ nghĩa với định hướng người dùng, bước dựa mô tả ngữ nghĩa tài nguyên thông tin phân loại 48 Hình 3.6 Các bước truy vấn JeromeDL Thuật tốn tìm kiếm JeromeDL thiết kế nhằm thỏa mãn mục tiêu sau [7]: - Các kết trả truy vấn khơng chứa trực tiếp giá trị câu truy vấn - Các giá trị cấu truy vấn phải phân giải ngữ cảnh người dùng Các mục tiêu đặt việc tổ hợp kĩ thuật tìm kiếm nội dung văn bản, tìm kiếm biểu ghi thư mục, tìm kiếm ngữ nghĩa dựa mô tả ngữ nghĩa tài nguyên Giai đoạn tìm kiếm ngữ nghĩa chuẩn bị truy vấn RDF, ngồi câu truy vấn cơng thêm thơng tin sở thích người dùng nhằm loại bỏ kết không cần thiết Một người dùng lĩnh vực mà người quan tâm hồ sơ mình, thơng tin bình luận, giải người dùng tài nguyên mạng lưới bạn bè sử dụng để tim kiếm Giả mã thuật toán tìm kiếm mơ tả chi tiết procedure SEMANTIC_SEARCH(QO) : RO 49 // – fulltext search – phase A – RO.results ←FULLTEXT_QUERY(QO.fulltext); // – properties search – for each p ∈ QO.properties begin if p.name == ”keyword” then for each v ∈ p.values values ←GET_SIMPLE_FORM(v); end for end if RO ←FIND_RESOURCES(p); end for end procedure SEMANTIC_SEARCH procedure FIND_RESOURCES(property) : RO // – phase B – RO.results ←XMLQ(property, Type.Marc21); RO.results ←RO.results ∨ XMLQ(property, Type.BibTeX); // – phase C – RO.results ←RO.results ∨ RDFQ(property); if not SizeOf(RO.results)∈ then RO ←EXPAND_QUERY(property, RO); end if end procedure FIND_RESOURCES Ở QO đối tượng truy vấn với tên thuộc tính giá trị làm tiêu chí tìm kiếm; RO đối tượng kết trả Thủ tục FULLTEXT_QUERY (bước A) tìm kiếm tài nguyên dựa tập mục văn mang nội dung 50 tài liệu Trường hợp mục nội dung khơng tương thích, hệ thống tìm kiếm lời bình luận, giải người dùng Ở bước C, thủ tục RDFQ thực truy vấn vào kho chứa RDF Trường hợp số ghi trả (số lượng tài liệu) nằm phạm vi , thủ tục EXPAND_QUERY gọi Trường hợp số ghi nhỏ giá trị MIN, hệ thống tìm kiếm dựa khái niệm tương đương cao hơn, chẳng hạn với từ khóa người dùng đưa vào tìm kiếm miền từ khóa có nghĩa tương tự (ví dụ: P2P ~ Mạng chia sẻ ~ Mạng đồng đẳng) Trường hợp số ghi lớn giá trị MAX, hệ thống loại bỏ tài nguyên mà có khái niệm tương đương, lấy kết mức thấp phân loại [7] JeromeDL cung cấp sở hạ tầng truyền thông cho hệ thống khác truy nhập vào hệ thống JeromeDL dựa giao thức SOAP, sử dụng Web services để xây dựng mạng chia sẻ ngang hàng P2P cho phép JeromeDL kết nối với dịch vụ khác 3.4 Sử dụng JeromeDL JeromeDL chia đối tượng sử dụng thành bốn loại khác nhau: - Người dùng khơng đăng kí: Đối tượng loại khơng có hồ sơ CSDL hệ thống Họ duyệt tìm kiếm tài liệu, khơng thể sử dụng chức tạo bookmarks - Người dùng đăng kí (thành viên): Đối tượng có tài khoản CSDL quản lí thể luận FOAFRealm - Các nhóm người dùng: Là tập hợp thành viên nhóm liên kết Các thành viên nhóm xuất tài liệu lên thư viện - Quản trị hệ thống: Đây thành viên có quyền lực cao hệ thống Họ có sử dụng tất chức hệ thống, chẳng hạn phê duyệt tài liệu, đánh lại mục, làm CSDL, cấu hình mạng, v.v Hệ thống JeromeDL cung cấp cho người dùng kiểu tìm kiếm sau: - Tìm kiếm đơn giản dựa từ khóa - Tìm kiếm nâng cao dựa biểu ghi thư mục 51 - Tìm kiếm ngữ nghĩa: người dùng cung cấp trực tiếp câu truy vấn RDF sử dụng mẫu truy vấn có sẵn, chẳng hạn: “Show me all resources written by a friends of mine” (Liệt kê tất tài liệu viết bạn tơi) Hình 3.7 Giao diện chức tìm kiếm ngữ nghĩa Sau tìm kiếm kết quả, hiển thị tài liệu việc chọn kết từ danh sách trả về, sau đánh giá, tạo bookmarks Để xuất tài liệu, người dùng chọn tài liệu cần xuất cung cấp thông tin (các siêu liệu) mà JeromeDL đề xuất 52 Hình 3.8 Giao diện chức xuất tài liệu Kết luận Trong chương giới thiệu hệ thống thư viện số ngữ nghĩa JeromeDL Đây hệ thống phần mềm mã nguồn mở cung cấp đầy đủ chức thư viện số ngữ nghĩa JeromeDL xây dựng ba loại thể luận: Bản thể luận biểu ghi thư mục MarcOnt, Bản thể luận cấu trúc nội dung tài liệu, Bản thể luận FOAFRealm quản lí thành viên mạng xã hội Dựa thể luận này, cho phép xây dựng nên công cụ tìm kiếm ngữ nghĩa (bao gồm tìm kiếm theo từ khóa dựa mục) 53 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Web ngữ nghĩa đời đánh dấu bước phát triển công nghệ Web, tạo cách thức việc tiếp cận thông tin Tuy nhiên việc ứng dụng Web ngữ nghĩa vào cách lĩnh vực cụ thể nhiều thách thức, cần hỗ trợ lĩnh vực chuyên ngành khác Luận văn trình bày ứng dụng điển hình cụ thể Web ngữ nghĩa thư viện số ngữ nghĩa Tuy chưa bao hàm hết vấn đề, song từ kết đặt rút số kết luận:  Web ngữ nghĩa cung cấp chế cho phép máy tính “hiểu” xử lí thơng tin  Thư viện số ngữ nghĩa kết hợp công nghệ Web ngữ nghĩa Web 2.0 Bằng cách tích hợp ngữ nghĩa vào thư viện số làm cho thư viện số ngữ nghĩa có nhiều ưu điểm trội so với thư viện khác, hỗ trợ chế tìm kiếm ngữ nghĩa chia sẻ tài nguyên với hệ thống khác cách thuận lợi  Các biểu ghi thư mục siêu liệu quan trọng, việc xây dựng Bản thể luận cho biểu ghi thư mục vấn đề then chốt việc xây dựng thư viện số ngữ nghĩa  Mạng xã hội với ưu nó, tích hợp vào thư viện số làm cho thư viện không đơn nơi cung cấp thông tin chiều mà nơi tạo nhóm liên kết, chia sẻ tạo tri thức, thúc đẩy phát triển tổ chức Trong luận văn dừng lại mức bao quát ứng dụng thư viện số ngữ nghĩa, kế thừa từ mơ hình thư viện số ngữ nghĩa đề cập, số vấn đề tồn đọng cần phát triển: - Xây dựng thể luận mạnh việc biểu diễn ngữ nghĩa tài liệu, chẳng hạn thể luận nội dung tài liệu Tăng cường khả suy luận ngữ nghĩa 54 - Áp dụng kĩ thuật xử lí ngơn ngữ tự nhiên việc phân tích câu truy vấn cách đầy đủ - Xây dựng mạng xã hội ảo có tương tác cao, phát huy sức mạnh cá nhân việc chia sẻ tri thức cho cộng đồng thông qua thư viện 55 TÀI LIỆU THAM KHẢO Tiếng Việt Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú (2009) “Giáo trình khai phá liệu Web” Nhà xuất Giáo dục Việt Nam Nguyễn Thị Mỹ Trang, Hoàng Hữu Hạnh (2009) “Xây dựng Ontology cho thư viện số” Tạp chí Khoa học, Đại học Huế, Số 53 Tiếng Anh H Peter Alesso, Craig F Smith (2006) “Thinking on the Web: Berners-Lee, Godel and Turing” John Wiley & Sons, Inc Thomas B Passin (2004) “Explorer’s Guide to the Semantic Web” Manning Publications Co Grigoris Antoniou, Frank van Harmelen (2008) “A Semantic Web Primer” Massachusetts Institute of Technology Sebastian Ryszard Kruk, Bill McDaniel (2009) “Semantic Digital Libraries” Springer Sebastian Ryszard Kruk (2005) “JeromeDL – A Digital Library on the Semantic Web” Digital Enterprise Research Institute Sebastian Ryszard Kruk, Bernhard Haslhofer, Piotr Piotrowski, Adam Westerski, Tomasz Woroniecki (2006) “Role of Ontologies in Semantic Digital Libraries” NKOS Workshop Sebastian R Kruk, Stefan Decker, Bernhard Haslhofer, Predrag Kneževic, Sandy Payette, Dean Krafft (2007) “Tutorial – Semantic Digital Libraries” DERI NUI Galway, University of Vienna, Fraunhofer IPSI, Cornell University 10 Sebastian Ryszard Kruk, Stefan Decker, Lech Zieborak (2005) “JeromeDL Adding Semantic Web Technologies to Digital Libraries ” Digital Enterprise Research Institute , NUI Galway, Ireland 56 11 Sebastian Ryszard Kruk, Tomasz Woroniecki, Adam Gzella, Maciej Dąbrowski (2005) “JeromeDL – a Semantic Digital Library” Digital Enterprise Research Institute , NUI Galway, Ireland 12 Sebastian Ryszard Kruk, Mariusz Cygan, Ewelina Kruk, Sławomir, Grzonkowski, Tomasz Woroniecki (2007) “JeromeDL 2.0.1 User Guide ” Digital Enterprise Research Institute , NUI Galway, Ireland Internet 13 http://semanticweb.org 14 http://www.w3schools.com/semweb/default.asp 15 http://semdl.info/ 16 http://www.jeromedl.org 17 http://xmlns.com/foaf/spec/ 57 ... web ngữ nghĩa, thành phần làm nên web ngữ nghĩa Chương 2: Tiếp cận Web ngữ lưu trữ quản lí tài liệu số Tìm hiểu cách quản lí tài liệu số thư viện số Nghiên cứu cách tích hợp ngữ nghĩa vào tài nguyên... Web ngữ nghĩa, thành phần tảng nó, URI, XML, Ngơn ngữ thể luận, Ngơn ngữ RDF lược đồ RDF, v.v 23 Chương TIẾP CẬN WEB NGỮ NGHĨA TRONG LƯU TRỮ VÀ QUẢN LÍ TÀI LIỆU SỐ Một cách lưu trữ quản lí tài liệu. .. văn: ? ?ỨNG DỤNG WEB NGỮ NGHĨA TRONG LƯU TRỮ VÀ QUẢN LÍ CÁC TÀI LIỆU SỐ” kết nghiên cứu riêng tôi, không chép riêng Các số liệu bảng biểu hồn tồn xác nội dung luận văn có tham khảo sử dụng tài liệu,

Ngày đăng: 17/02/2014, 21:02

Hình ảnh liên quan

Bảng kí hiệu thuật ngữ viết tắt - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Bảng k.

í hiệu thuật ngữ viết tắt Xem tại trang 7 của tài liệu.
Hình 1.1. Kiến trúc của Web ngữ nghĩa i.  Unicode và định danh tài nguyên thống nhất  - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 1.1..

Kiến trúc của Web ngữ nghĩa i. Unicode và định danh tài nguyên thống nhất Xem tại trang 15 của tài liệu.
Mơ hình cơ bản của RDF gồm ba bộ phận sau: - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

h.

ình cơ bản của RDF gồm ba bộ phận sau: Xem tại trang 21 của tài liệu.
Mơ hình RDF thể hiện một mơ hình ở mức trừu tượng để định nghĩa siêu dữ liệu. Cú pháp RDF được dùng để tạo ra và trao đổi siêu dữ liệu, vì thế RDF dựa trên  cú pháp XML - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

h.

ình RDF thể hiện một mơ hình ở mức trừu tượng để định nghĩa siêu dữ liệu. Cú pháp RDF được dùng để tạo ra và trao đổi siêu dữ liệu, vì thế RDF dựa trên cú pháp XML Xem tại trang 22 của tài liệu.
Bảng 1. Các lớp trong RDFS [1] - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Bảng 1..

Các lớp trong RDFS [1] Xem tại trang 29 của tài liệu.
Bảng 2. Các thuộc tính trong RDFS [1] - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Bảng 2..

Các thuộc tính trong RDFS [1] Xem tại trang 30 của tài liệu.
Hình 1.4. Không gian miền và giới hạn của thuộc tính RDFS - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 1.4..

Không gian miền và giới hạn của thuộc tính RDFS Xem tại trang 31 của tài liệu.
Hình 2.1. Các thành phần hỗ trợ thư viện số ngữ nghĩa - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 2.1..

Các thành phần hỗ trợ thư viện số ngữ nghĩa Xem tại trang 37 của tài liệu.
Hình 2.2. Biểu diễn cấu trúc tài liệu dưới dạng RDF - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 2.2..

Biểu diễn cấu trúc tài liệu dưới dạng RDF Xem tại trang 40 của tài liệu.
Hình 2.3. Kiến trúc thư viện số ngữ nghĩa - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 2.3..

Kiến trúc thư viện số ngữ nghĩa Xem tại trang 42 của tài liệu.
Ví dụ Một bản thể luận biểu ghi thư mục của BiBTeX được biểu diễn như hình dưới đây:  - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

d.

ụ Một bản thể luận biểu ghi thư mục của BiBTeX được biểu diễn như hình dưới đây: Xem tại trang 43 của tài liệu.
Hình 2.6. Một Bản thể luận Cys ii. Phân loại phân nhóm  - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 2.6..

Một Bản thể luận Cys ii. Phân loại phân nhóm Xem tại trang 46 của tài liệu.
Hình 2.5. Một dạng cây phân cấp - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 2.5..

Một dạng cây phân cấp Xem tại trang 46 của tài liệu.
Hình 2.7. Quá trình tìm kiếm trong thư viện số ngữ nghĩa - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 2.7..

Quá trình tìm kiếm trong thư viện số ngữ nghĩa Xem tại trang 50 của tài liệu.
Hình 3.1. Giao diện của JeromeDL - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.1..

Giao diện của JeromeDL Xem tại trang 53 của tài liệu.
Hình 3.2. Kiến trúc của JeromeDL - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.2..

Kiến trúc của JeromeDL Xem tại trang 54 của tài liệu.
Hình 3.3. Bản thể luận MarcOnt - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.3..

Bản thể luận MarcOnt Xem tại trang 55 của tài liệu.
Bảng 3. Các lớp, thuộc tính, thể hiện của Bản thể luận MarcOnt - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Bảng 3..

Các lớp, thuộc tính, thể hiện của Bản thể luận MarcOnt Xem tại trang 56 của tài liệu.
Hình 3.4. Bản thể luận cấu trúc nội dung - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.4..

Bản thể luận cấu trúc nội dung Xem tại trang 57 của tài liệu.
Bảng 4. Các lớp, thuộc tính, thể hiện của Bản thể luận cấu trúc nội dung Các lớp jeromedl:BinaryResource, jeromedl:Chapter,  - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Bảng 4..

Các lớp, thuộc tính, thể hiện của Bản thể luận cấu trúc nội dung Các lớp jeromedl:BinaryResource, jeromedl:Chapter, Xem tại trang 58 của tài liệu.
Hình 3.5. Mạng xã hội trong JeromeDL 3.3. Truy vấn trong JeromeDL  - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.5..

Mạng xã hội trong JeromeDL 3.3. Truy vấn trong JeromeDL Xem tại trang 59 của tài liệu.
Hình 3.6. Các bước trong truy vấn JeromeDL - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.6..

Các bước trong truy vấn JeromeDL Xem tại trang 60 của tài liệu.
Hình 3.7. Giao diện chức năng tìm kiếm ngữ nghĩa - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.7..

Giao diện chức năng tìm kiếm ngữ nghĩa Xem tại trang 63 của tài liệu.
Hình 3.8. Giao diện chức năng xuất bản tài liệu Kết luận  - ứng dụng web ngữ nghĩa trong lưu trữ và quản lí các tài liệu số

Hình 3.8..

Giao diện chức năng xuất bản tài liệu Kết luận Xem tại trang 64 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan