Nghiên cứu web ngữ nghĩa và ứng dụng vào xử lý thông tin du lịch

26 296 0
Nghiên cứu web ngữ nghĩa và ứng dụng vào xử lý thông tin du lịch

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Header Page of 126 -1- BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG NGUYỄN THỊ THU HẰNG NGHIÊN CỨU WEB NGỮ NGHĨA VÀ ỨNG DỤNG VÀO XỬ LÝ THƠNG TIN DU LỊCH Chun ngành: Khoa học máy tính Mã số: 60.48.01 TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT ĐÀ NẴNG - 2011 Footer Page of 126 Header Page of 126 -2- Cơng trình hồn thành ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS Lê Văn Sơn Phản biện 1: PGS TS Lê Mạnh Thạnh Phản biện 2: TS Nguyễn Tấn Khơi Luận văn bảo vệ Hội đồng chấm Luận văn tốt nghiệp thạc sỹ kỹ thuật Đại học Đà Nẵng vào ngày 18 tháng 06 năm 2011 * Có thể tìm hiểu luận văn tại: - Trung tâm Thơng tin - Học liệu, Đại học Đà Nẵng - Trung tâm Học liệu, Đại học Đà Nẵng Footer Page of 126 Header Page of 126 -3- MỞ ĐẦU Lý chọn đề tài Trong năm qua, phát triển World Wide Web nội dung, người sử dụng cải tiến cơng nghệ cơng cụ tìm kiếm hồn tồn thay đổi cách thức tri thức thơng tin thu thập chia sẻ Thu thập thơng tin chưa trở nên dễ dàng rộng mở cho người sử dụng nay, nhiên số trường hợp đáng kể kết thu thơng qua cơng cụ tìm kiếm có chứa lượng lớn kết khơng liên quan Ngun nhân xuất phát từ đơn giản web tại, cản trở phát triển thơng tin Trong mơ hình này, máy tính làm nhiệm vụ gửi nhận liệu thể thơng tin dạng thơ mà người đọc hiểu xử lý XML đời trở thành cơng cụ trao đổi liệu hệ thống, nâng cao tích hợp ứng dụng Tuy nhiên, giải pháp dựa XML cho q trình tích hợp ứng dụng hệ thống chưa đủ, liệu chuyển đổi thiếu mơ tả tường minh ngữ nghĩa Vì thế, thách thức đặt làm để khai thác thơng tin Web cách hiệu quả, mà cụ thể làm để máy tính trợ giúp xử lý tự động chúng Những nỗ lực phát triển gần cơng nghệ thơng tin truyền thơng nhằm giải vấn đề này, khơng thơng tin học thuật mà tất dạng liệu chuyển giao Web Trong nỗ lực phát triển đó, mối quan tâm phát triển Web ngữ nghĩa trọng tâm Tim Berners-Lee tổ chức W3C Theo Lee, “web ngữ nghĩa mở rộng web thơng thường mà thơng tin định nghĩa rõ ràng cho người Footer Page of 126 Header Page of 126 -4- máy tính làm việc với cách hiệu hơn” Web ngữ nghĩa đời bước tiến vượt bậc dựa vào khả làm việc với thơng tin “thơng minh” thay đơn lưu trữ thơng tin Với lớn mạnh khả lưu giữ thơng tin ngữ nghĩa, web ngữ nghĩa trở thành hệ web cho tương lai Hiện nay, nước ta, lĩnh vực du lịch lĩnh vực nhiều tiềm phát triển, việc ứng dụng xây dựng web ngữ nghĩa du lịch giúp ích cho việc trao đổi chia sẻ thơng tin du lịch Internet Và lý tơi chọn đề tài: “Nghiên cứu Web ngữ nghĩa ứng dụng vào xử lý thơng tin du lịch” Mục tiêu nhiệm vụ nghiên cứu Luận văn nghiên cứu sử dụng cơng nghệ Web ngữ nghĩa làm ngơn ngữ mơ hình hóa cho lĩnh vực du lịch; nghiên cứu RDF RDF Schema; nghiên cứu ontology lý thuyết có liên quan để hỗ trợ việc xây dựng ontology du lịch Đối tượng phạm vi nghiên cứu a) Đối tượng nghiên cứu Đối tượng nghiên cứu cụ thể là: nghiên cứu lý thuyết Web ngữ nghĩa, RDF ontology; tìm hiểu thơng tin liên quan du lịch Việt Nam; tham khảo ứng dụng dự án có tạp chí khoa học mạng Internet b) Phạm vi nghiên cứu Trong phạm vi giới hạn đề tài, luận văn nghiên cứu xây dựng tập từ vựng địa điểm du lịch Việt Nam, tổ chức lưu trữ liệu ứng dụng với Protégé, khai thác tính truy xuất liệu ontology Phương pháp nghiên cứu Với mục tiêu trên, luận văn sử dụng phương pháp nghiên cứu Footer Page of 126 Header Page of 126 -5- lý thuyết phương pháp nghiên cứu thực nghiệm để thực đề tài Ý nghĩa khoa học thực tiễn đề tài a) Ý nghĩa khoa học Hiểu vận dụng kiến thức RDF, Ontology, RDF/XML, RDF Schema, OWL Cung cấp giải pháp xây dựng ontology Xây dựng tập từ vựng địa điểm du lịch Việt Nam Khai thác tính đọc/xuất, truy vấn tài liệu có mơ tả ngữ nghĩa b) Ý nghĩa thực tiễn Việc nghiên cứu web ngữ nghĩa ứng dụng vào xử lý thơng tin du lịch mà cụ thể thơng tin địa điểm du lịch Việt Nam làm sở nhằm phục vụ việc tra cứu, chia sẻ thơng tin du lịch Việt Nam Đồng thời, kết nghiên cứu đề tài làm tảng để giải tốn xử lý ngữ nghĩa khác thực tiễn, Bố cục luận văn Luận văn chia làm chương: Chương trình bày nội dung nghiên cứu tổng quan web ngữ nghĩa, kiến trúc web ngữ nghĩa khái niệm URI, RDF, RDF Scheme, Ontology Giới thiệu số ngơn ngữ xây dựng web ngữ nghĩa số ứng dụng web ngữ nghĩa Chương sâu vào nghiên cứu RDF, Ontology đối tượng cần thiết để xây dựng RDF Ontology Đồng thời, q trình nghiên cứu phân tích RDF Ontology đưa giải pháp ngơn ngữ cơng cụ để xây dựng ứng dụng web ngữ nghĩa Chương giới thiệu ứng dụng, phân tích ứng dụng đề giải pháp xây dựng ứng dụng Tiến hành xây dựng ontology, xử lý liệu, cài đặt ứng dụng đưa số kết thực ứng dụng Footer Page of 126 Header Page of 126 -6- Chương 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA 1.1 WEB THƠNG THƯỜNG 1.1.1 Các đặc tính web Web thơng thường chủ yếu tập trang HTML siêu liên kết xem trình duyệt thiết bị khác chủ yếu dành cho người truy cập đọc 1.1.2 Các tiện ích web Web làm giảm thời gian truy cập thơng tin số lần giao tác, làm giao dịch rẻ gần khơng tốn phí cho truyền thơng siêu phương tiện giới Nhiều cộng đồng hưởng lợi từ web 1.1.3 Các ứng dụng web 1.1.4 Các hạn chế web thơng thường Mặc dù web thơng thường cung cấp nhiều tiện ích đáng kinh ngạc khơng cung cấp đủ cấu trúc để hỗ trợ cải tiến máy tính xử lý nội dung Trong người dùng cần thơng tin tốt trình bày web phép cải tiến nhiều ứng dụng Như vậy, web thơng thường chủ yếu dịch vụ truyền tải tài liệu tập trung vào nhu cầu người đọc sử dụng trình duyệt Tuy nhiên, cơng nghệ web thơng thường khơng đủ hỗ trợ nhiều u cầu tính tốn phức tạp Cơng nghệ web cần thiết để cấu trúc thơng tin, cải thiện tìm kiếm đặt ngữ nghĩa vào thơng tin 1.2 GIỚI THIỆU WEB NGỮ NGHĨA 1.2.1 Khái niệm Web ngữ nghĩa: web có liệu thơng minh mà máy xử lý Ngồi định nghĩa liệu thơng minh liệu mà độc lập với ứng dụng, biên soạn, phân loại thành phần hệ thống thơng tin rộng lớn (ontology) Footer Page of 126 Header Page of 126 -7- 1.2.2 Lợi ích việc sử dụng web ngữ nghĩa Web ngữ nghĩa với thơng tin đưa xác định rõ ý nghĩa cho phép máy tính người hợp tác làm việc tốt Web ngữ nghĩa mang lại cấu trúc cho nội dung trang web có ý nghĩa, tạo mơi trường mà máy tính dễ dàng thực nhiệm vụ phức tạp cho người dùng Web ngữ nghĩa đặt tên khái niệm đơn giản URI, nên cho phép thể khái niệm mà họ nghĩ với nỗ lực tối thiểu 1.2.3 Tính cần thiết việc sử dụng web ngữ nghĩa Web ngữ nghĩa giải số vấn đề mà kiến trúc cơng nghệ thơng tin phải đối mặt: − Thơng tin q tải − Phá vỡ hệ thống Stovepipe − Tích hợp nội dung nghèo nàn 1.3 KIẾN TRÚC WEB NGỮ NGHĨA Hình Kiến trúc Web ngữ nghĩa (phiên 4) Đây phiên hồn thiện năm 2006 giả định tám tầng thay bảy tầng phiên trước Footer Page of 126 Header Page of 126 -8- 1.3.1 Tầng - Unicode URI 1.3.2 Tầng - XML 1.3.3 Tầng – RDF RDF Schema 1.3.4 Tầng – Ontology Rules 1.3.5 Tầng - Logic 1.3.6 Tầng - Proof 1.3.7 Tầng - Trust 1.3.8 Tầng – User Interface & Applications Đây tầng riêng biệt nằm kiến trúc hệ thống 1.4 NGƠN NGỮ CHO WEB NGỮ NGHĨA Như mơ tả mục 1.3, tầng kiến trúc web ngữ nghĩa quy chuẩn với chuẩn W3C đề xuất cộng đồng nghiên cứu web ngữ nghĩa thống sử dụng thực tế Theo đó, liệu web ngữ nghĩa dựa sở XML mơ hình hóa RDF RDF chọn chuẩn trao đổi liệu web ngữ nghĩa Ngơn ngữ ontology chuẩn hóa OWL dựa sở RDF(S); ontology cung cấp từ vựng cho việc trao đổi thơng tin ứng dụng dịch vụ Web Bên cạnh đó, ngơn ngữ truy vấn SPARQL sử dụng rộng rãi khuyến nghị W3C, chưa trở thành chuẩn thật 1.5 CÁC ỨNG DỤNG SỬ DỤNG WEB NGỮ NGHĨA Web có ngữ nghĩa cho phép tăng cường chức năng, mức độ thơng minh tính tự động hố nhiều ứng dụng có Những lĩnh vực ứng dụng đặc biệt hứa hẹn cho web có ngữ nghĩa dịch vụ Web, quản lý tri thức thương mại điện tử Footer Page of 126 Header Page of 126 -9- Chương 2: CÁC CƠNG NGHỆ XÂY DỰNG WEB NGỮ NGHĨA 2.1 TRUY VẤN DỮ LIỆU RDF 2.1.1 Giới thiệu RDF RDF cung cấp framework cho việc mơ tả trao đổi siêu liệu tài ngun web Trong RDF, tài ngun web định danh URI sử dụng URI để tạo phát biểu tài ngun Để làm cho máy dễ xử lý, RDF kế thừa cú pháp dựa XML Do đó, RDF cung cấp khả tương tác ứng dụng trao đổi thơng tin web mà máy hiểu 2.1.1.1 Mơ hình RDF Mơ hình liệu RDF gồm ba đối tượng sau: - Tài ngun (Resource): đối tượng thấy web Các tài ngun ln định danh URI - Thuộc tính (Property): Một thuộc tính khía cạnh, đặc điểm, đặc tính hay mối quan hệ cụ thể dùng để mơ tả tài ngun - Phát biểu (Statement): Phát biểu RDF cung cấp tài ngun chủ thể, thuộc tính đối tượng Mỗi phát biểu biểu diễn theo cấu trúc ba gọi “triple” có ba thành phần bản: Chủ-thể, Thuộc-tính, Đối-tượng (Subject, Predicate, Object) 2.1.1.2 Các cách hiển thị RDF a) N3 N3 hay Notation3 phá vỡ đồ thị RDF thành triple riêng nó, triple có chứa chủ thể, thuộc tính đối tượng tách khoảng trống b) Đồ thị RDF Một tập hợp RDF triple tạo thành đồ thị RDF Tập hợp nút đồ thị RDF tập chủ thể đối tượng triple, Footer Page of 126 Header Page 10 of 126 - 10 - cung đồ thị thuộc tính RDF triple khái niệm hóa biểu đồ sau: Chủ thể Thuộc tính Đối tượng c) RDF/XML Phương thức thứ ba sử dụng XML để biểu diễn liệu RDF Vì có cú pháp cấu trúc mạnh nên XML tảng tốt cho xử lý tự động tài liệu RDF 2.1.1.3 Cú pháp RDF/XML RDF sử dụng XML mã hóa cú pháp trao đổi nó, gọi cú pháp dựa XML RDF/XML kết hợp cú pháp ngơn ngữ XML khả mơ tả tài ngun thơng qua URI 2.1.2 RDF Schema RDF Schema (RDFS) mở rộng RDF phép mơ tả phân loại lớp thuộc tính RDFS định nghĩa lớp thuộc tính để mơ tả lớp, thuộc tính tài ngun khác 2.1.2.1 Lớp RDFS Trong RDFS, lớp nhóm tài ngun web có liên quan với Chúng xác định cách sử dụng tập từ vựng RDF rdfs:Class, rdfs:Resource định nghĩa nút (node) rdf:type, rdfs:subClassOf định nghĩa thuộc tính 2.1.2.2 Thuộc tính RDFS Thuộc tính RDFS quan hệ chủ thể đối tượng RDF Thuộc tính hay sử dụng rdfs:range, rdfs:domain, rdfs:subClassOf rdfs:subPropertyOf Tương tự mơ tả lớp, thuộc tính định nghĩa thẻ rdf:Property 2.1.3 Lưu trữ liệu RDF Một vài hệ thống phát triển cho việc lưu trữ truy vấn Footer Page 10 of 126 Header Page 12 of 126 - 12 - − Domain Ontology: lấy tri thức từ lĩnh vực xác định − Task Ontology: lấy tri thức tác vụ riêng biệt − Application Ontology 2.2.2 Phương thức xây dựng Ontology Một số ngun tắc việc xây dựng ontology thơng qua cơng đoạn sau đây: Xác định miền phạm vi ontology Xem xét việc kế thừa ontology có sẵn Liệt kê thuật ngữ quan trọng ontology Xây dựng lớp cấu trúc lớp phân cấp Xác định thuộc tính quan hệ cho lớp Xác định giới hạn thuộc tính quan hệ lớp Tạo thực thể cho lớp 2.2.3 Ngơn ngữ biểu diễn Ontology Ngơn ngữ ontology chuẩn phát triển gần OWL từ tổ chức W3C Xây dựng dựa RDF RDFS, OWL định nghĩa kiểu quan hệ thể RDF cách sử dụng tập từ vựng XML để phân cấp mối quan hệ tài ngun khác OWL phát triển có nhiều tiện lợi để biểu diễn ý nghĩa ngữ nghĩa so với XML, RDF RDFS, OWL đời sau ngơn ngữ nên có khả biểu diễn nội dung web mà máy hiểu Các phiên OWL OWL chia làm ba phiên ngơn ngữ con: OWL Lite, OWL DL OWL Full Lựa chọn ngơn ngữ để sử dụng Một cách bản, ngơn ngữ sử dụng nên có nhiều biểu cảm cần thiết phức tạp tốt Footer Page 12 of 126 Header Page 13 of 126 - 13 - Các thành phần ontology OWL − Lớp (Classes): sử dụng để tạo nhóm có đặc điểm − Thực thể (Individuals): thành viên lớp, làm rõ lớp − Thuộc tính (Properties): liên kết hai đối tượng với Mỗi thuộc tính có thuộc tính nghịch đảo tương ứng Các kiểu thuộc tính OWL Có hai kiểu thuộc tính thuộc tính Object Datatype Thuộc tính Object mối quan hệ hai thực thể, liên kết từ thực thể đến thực thể Thuộc tính Datatype mơ tả mối quan hệ thực thể giá trị liệu OWL có kiểu thuộc tính thứ ba thuộc tính Annotation sử dụng để thêm thơng tin vào lớp, vào thực thể thực thể khác thuộc hai kiểu object/datatype Domain Range thuộc tính Thuộc tính có domain range cụ thể Các thuộc tính liên kết thực thể thuộc domain đến thực thể thuộc range Nhìn chung, domain thuộc tính range thuộc tính nghịch đảo ngược lại 2.3 CƠNG CỤ VÀ PHẦN MỀM XÂY DỰNG WEB NGỮ NGHĨA 2.3.1 Protégé Protégé phần mềm mã nguồn mở miễn phí viết Java thao tác ontology nhiều định dạng khác bao gồm RDF(S), OWL XML Schema 2.3.2 OwlDotNetApi OwlDotNetApi viết C# cung cấp API cho ứng dụng NET dựa phân tích cú pháp RDF Drive API sử dụng mơ hình liệu từ RDF Drive để xây dựng đồ thị liên kết trực tiếp từ ontology OWL Footer Page 13 of 126 Header Page 14 of 126 - 14 - Chương 3: XÂY DỰNG ỨNG DỤNG MINH HỌA XỬ LÝ THƠNG TIN DU LỊCH 3.1 GIỚI THIỆU ỨNG DỤNG Với kiến thức tìm hiểu web ngữ nghĩa trên, luận văn nghiên cứu sử dụng cơng nghệ web ngữ nghĩa vào xây dựng ứng dụng minh họa nhằm phục vụ cho việc lưu trữ, tìm kiếm, truy vấn thơng tin địa điểm du lịch Việt Nam đồng thời để hiểu rõ lĩnh vực web ngữ nghĩa Mục tiêu ứng dụng để cải thiện kết tìm kiếm truy xuất nhiều thơng tin liên quan cho mục đích sử dụng người dùng Vì vậy, chương trình ứng dụng cung cấp chia sẻ thơng tin địa điểm du lịch theo hai phương thức: • Tìm kiếm thơng tin Hệ thống hỗ trợ tìm kiếm xác tìm gần Với tìm kiếm xác, người dùng nhập đầy đủ xác từ khóa cần tìm, lúc có hai trường hợp xảy ra: + Nếu từ khóa cần tìm tên điểm đến du lịch kết trả tất thực thể có quan hệ với địa điểm + Ngược lại, từ khóa cần tìm khơng phải tên điểm đến du lịch kết trả thơng tin thực thể liên quan có tồn ứng dụng Với tìm kiếm gần đúng, người dùng cần nhập phần chuỗi từ khóa cần tìm, kết trả tập tên thực thể mà có chứa phần giống với chuỗi gõ vào Sau người dùng chọn chức hiển thị thơng tin chi tiết để xem • Duyệt phân cấp dựa ontology Giao diện phân cấp tổ chức theo thứ tự hình 3.1 sau: Footer Page 14 of 126 Header Page 15 of 126 - 15 - Địa điểm - Tỉnh/Thành phố - Chi tiết địa điểm Địa điểm Tỉnh/Thành phố Chi tiết địa điểm Địa danh Lễ hội Ẩm thực Hình Minh họa phân cấp duyệt thơng tin Trước tiên, người sử dụng chọn mục điểm đến, hệ thống hiển thị tỉnh/thành phố Tiếp theo chọn tỉnh/thành phố để xem thơng tin địa điểm chọn Hệ thống hiển thị thơng tin chi tiết địa điểm chọn thơng tin khác liên quan đến địa điểm Kèm theo đó, hệ thống cung cấp danh sách thơng tin đặc trưng địa điểm chọn 3.2 HƯỚNG TIẾP CẬN VÀ GIẢI PHÁP * Giải pháp kỹ thuật Chương trình ứng dụng thực xử lý thơng tin thơng qua cơng nghệ web ngữ nghĩa có giải pháp đề cập: - Mơi trường phát triển: Visual Studio - Thi hành IE/Firefox - Ngơn ngữ sử dụng: C# ASP.net - Chương trình sử dụng cơng cụ Protégé, OwlDotNetApi Việc lựa chọn tảng NET cơng cụ phát triển cho phép khả tương tác nhiều ngơn ngữ * Thiết kế ontology Trước hết khơng có giải pháp bắt buộc mơ hình ontology Các hướng tiếp cận khác khả thi giải pháp tốt phụ thuộc vào ứng dụng Footer Page 15 of 126 Header Page 16 of 126 - 16 - Một ngơn ngữ ontology phổ biến Web Ontology Language (OWL) Có hình thái OWL khác (OWL Full, OWL Lite OWL DL) mà khác chủ yếu tính phức tạp tính biểu cảm Cách tiếp cận trình bày báo cáo dựa OWL DL (Logic mơ tả) Đối với thiết kế ontology, Protégé (Protégé-OWL) lựa chọn để sử dụng cơng cụ mạnh mẽ phổ biến thời cho mục đích Trong ứng dụng này, ontology tích hợp vào thư mục máy cục để tiện cho việc minh họa ứng dụng Tuy nhiên lấy ontology trực tiếp từ Internet (nếu có) Các ontology thường lưu dạng tập tin có đi: rdf, rdfs, owl, daml, xml, Ontology ứng dụng lưu với tập tin owl * Quản lý tài ngun ứng dụng Quản lý tài ngun ứng dụng bao gồm việc thêm, sửa xóa thơng tin tài ngun Chức chưa triển khai ứng dụng nên thực cách thao tác trực tiếp với ontology ứng dụng thơng qua cơng cụ Protégé * Sử dụng thư viện mã nguồn mở OWLDotNetAPI Để sử dụng OwlDotNetApi, trước hết phải import thư viện DLL biên dịch sẵn vào Visual Studio project Bước tạo đồ thị OWL từ tập tin ontology: IOwlParser parser = new OwlXmlParser(); IOwlGraph graph = parser.ParseOwl(địa_chỉ_chứa_tập_tin_owl); Một đồ thị OWL tạo ra, phương thức gọi để thực thi ứng dụng Để truy xuất thơng tin chi tiết đồ thị sử dụng thuộc tính ChildEdges ParentEdges Footer Page 16 of 126 Header Page 17 of 126 - 17 - 3.3 PHÂN TÍCH ỨNG DỤNG 3.3.1 Mơ hình use-case Dựa mơ tả ứng dụng, phần xây dựng mơ hình usecase nhằm cung cấp cách chi tiết chức tìm kiếm thơng tin, xem thơng tin địa điểm cụ thể (duyệt thơng tin) xem thơng tin chi tiết địa điểm Mơ hình use-case thể hình 3.2 sau: Duyệt thô ng tin Xem thông tin chi tiết Người sử dụng Tìm kiếm Hình Minh họa mơ hình usecase ứng dụng 3.3.2 Đặc tả chức - Chức tìm kiếm: Chức cho phép người sử dụng tìm thơng tin hệ thống cách nhập từ khóa thơng tin muốn tìm Hệ thống vào ontology tìm tất URIs liên quan đến từ khóa muốn tìm trả kết - Chức duyệt thơng tin: Chức cho phép người sử dụng xem thơng tin phân cấp hệ thống cách chọn mục thơng tin cần xem Hệ thống vào ontology tìm thực thể phân cấp liên quan đến mục thơng tin chọn trả kết cho người sử dụng Footer Page 17 of 126 Header Page 18 of 126 - - 18 - Chức xem thơng tin chi tiết: Chức cho phép người sử dụng xem thơng tin chi tiết tài ngun hệ thống cách nhấn chọn tên tài ngun muốn xem thơng tin chi tiết Hệ thống vào ontology tìm URIs cho tài ngun cần tìm Dựa vào URIs tìm được, hệ thống theo địa để tìm thơng tin chi tiết tài ngun trả kết tìm 3.4 XÂY DỰNG ONTOLOGY Mục đích sử dụng ontology ứng dụng giúp mơ hình hóa dễ dàng tri thức chung lĩnh vực du lịch Tất lớp đặt theo tên danh từ tất thuộc tính có tên với tiền tố hình thức động từ has (như hasName) is (như isRegionOf) Mỗi bước xây dựng ontology trình bày chi tiết sau: 3.4.1 Xác định miền phạm vi ontology Lĩnh vực cần xây dựng ontology thơng tin liên quan đến địa điểm du lịch, mà cụ thể xem xét thơng tin chi tiết địa điểm chọn địa danh để thăm quan, nơi ăn uống, nơi ở, Miền mà ontology bao trùm khái niệm thơng tin mơ tả điểm đến du lịch, địa danh có điểm đến, nơi ăn uống - nơi - nơi vui chơi giải trí – nơi tham quan tìm hiểu thuộc điểm đến Tri thức lĩnh vực du lịch ontology chia sẻ theo cách cho phép người dùng tìm địa điểm du lịch cần đến đất nước Việt Nam 3.4.2 Sử dụng lại ontology có Với ứng dụng này, khơng có ontology có sẵn sử dụng lại 3.4.3 Xác định thuật ngữ quan trọng Bước viết thơng tin thuật ngữ khái niệm quan trọng Danh sách ứng cử khái niệm địa điểm du lịch sau: - Địa điểm Footer Page 18 of 126 - Địa danh Header Page 19 of 126 - 19 - - Khách sạn - Nhà hàng - Nơi ăn uống - Qn bar - Nơi mua sắm - Qn cà phê - Lễ hội - Chợ - Đặc sản - Siêu thị Tiếp đó, dựa khái niệm để định nghĩa quan hệ chúng Một số quan hệ bao gồm: địa danh thuộc điểm đến, khách sạn thuộc điểm đến, có điểm đến, có thơng tin chi tiết, … 3.4.4 Xác định lớp xây dựng phân cấp lớp Danh sách thuật ngữ khái niệm mơ tả tổ chức thành lớp sau tổ chức chúng thành cấu trúc lớp phân cấp Các lớp xây dựng sau: − Lớp mơ tả bao gồm: Địa điểm Chi tiết địa điểm − Chi tiết địa điểm bao gồm thơng tin chi tiết địa điểm nên có lớp con: Địa danh, Khách sạn, Nơi ăn uống, Nơi mua sắm, Lễ hội, Đặc sản o Lớp Nơi ăn uống mơ tả nơi phục vụ ăn uống thuộc địa điểm chọn gồm có lớp con: Nhà hàng, Qn cà phê, Qn Bar o Lớp Nơi mua sắm mơ tả nơi phục vụ nhu cầu mua sắm địa điểm chọn gồm có lớp con: Chợ, Siêu thị − Địa điểm thuộc vùng miền nên có thêm lớp Vùng miền Chương trình soạn thảo Protége sử dụng để mã hố ontology áp dụng hướng tiếp cận từ xuống hình 3.8 sau: Footer Page 19 of 126 Header Page 20 of 126 - 20 - Hình Minh họa lớp ontology Protégé 3.4.5 Xác định thuộc tính lớp Các thuộc tính lớp mơ tả tính chất lớp mối quan hệ với lớp khác Việc xác định thuộc tính phức tạp Các thuộc tính Datatype dễ dàng nhận biết thuộc tính Object – thuộc tính biểu diễn quan hệ thực thể Từ phân cấp lớp mơ tả trên, thuộc tính đối tượng lớp xây dựng sau: − Lớp Destination (Địa điểm): hasOtherName, hasDescription, hasRestaurant, hasCafes, có thuộc hasLocation, hasBar, hasHotel, tính hasName, hasPlaceName, hasLocalfood, hasFestival, hasMarket, hasSuperMarket − Lớp Region (Vùng miền): có thuộc tính hasDestination − Lớp Characteristic (Chi tiết địa điểm): có thuộc tính: hasName, hasOtherName, hasDescription − Lớp Festival (Lễ hội): lớp lớp Characteristic, ngồi thuộc tính kế thừa từ Characteristic có thuộc tính hasTime − Lớp EatingAndDrinking (Ăn uống): lớp lớp Characteristic, ngồi thuộc tính kế thừa từ Characteristic có thuộc tính: hasPhone, hasFax, hasAdress Footer Page 20 of 126 Header Page 21 of 126 − - 21 - Lớp Bar, Cafe’s, Restaurant (Nhà hàng): lớp lớp EatingAndDrinking có thuộc tính kế thừa từ EatingAndDrinking − Lớp Hotel (Khách sạn): lớp lớp Characteristic Lớp Hotel ngồi thuộc tính kế thừa từ Characteristic có thuộc tính: hasPhone, hasFax, hasAdress, hasStandard − Lớp LocalFood (Đặc sản): lớp lớp Characteristic có thuộc tính kế thừa từ Characteristic − Lớp PlaceName (Địa danh): lớp lớp Characteristic Lớp PlaceName ngồi thuộc tính kế thừa từ Characteristic có thuộc tính hasLocation − Lớp Shopping (Mua sắm): lớp lớp Characteristic Lớp Shopping ngồi thuộc tính kế thừa từ Characteristic có thuộc tính hasAdress − Lớp Market (Chợ): lớp lớp Shopping có thuộc tính kế thừa từ Shopping − Lớp SuperMarket (Siêu thị): lớp lớp Shopping Lớp SuperMarket ngồi thuộc tính kế thừa từ Shopping có thuộc tính: hasPhone, hasFax 3.4.6 Mơ tả thuộc tính xác định quan hệ cho lớp Bước xử lý thuộc tính bao gồm giới hạn kiểu liệu, domain range Thơng thường, thuộc tính Object có range lớp với thuộc tính Datatype có range giá trị string, integer Range domain thuộc tính xác định sau: − Thuộc tính hasName: tên địa điểm tên thành phần thuộc chi tiết địa điểm Footer Page 21 of 126 Header Page 22 of 126 - 22 - Thuộc tính hasOtherName: tên gọi khác địa điểm tên thành phần thuộc chi tiết địa điểm Thuộc tính hasDescription: mơ tả thơng tin địa điểm thành phần thuộc chi tiết địa điểm − OWL Type: DatatypeProperty Domain: Characteristic ∪ Destination Range: xsd:String Thuộc tính hasLocation: mơ tả vị trí địa điểm địa danh thuộc địa điểm − OWL Type: DatatypeProperty Domain: PlaceName ∪ Destination Range: xsd:String Thuộc tính hasPhone: số điện thoại siêu thị, khách sạn nơi ăn uống Thuộc tính hasFax: số fax siêu thị, khách sạn nơi ăn uống − OWL Type: DatatypeProperty Domain: SuperMarket ∪ Hotel ∪ EatingAndDrinking Range: xsd:String Thuộc tính hasAdress: địa khách sạn, nơi mua sắm nơi ăn uống − OWL Type: DatatypeProperty Domain: Shopping ∪ Hotel ∪ EatingAndDrinking Range: xsd:String Thuộc tính hasTime: thời gian diễn lễ hội − OWL Type: DatatypeProperty Domain: Festival Range: xsd:String Thuộc tính hasStandard: xếp hạng khách sạn OWL Type: DatatypeProperty Domain: Hotel Range: xsd:String Footer Page 22 of 126 Header Page 23 of 126 − - 23 - Thuộc tính hasPlaceName: mơ tả quan hệ địa điểm địa danh Thuộc tính hasRestaurant: mơ tả quan hệ địa điểm nhà hàng Thuộc tính hasCafes: mơ tả quan hệ địa điểm qn cà phê Thuộc tính hasBar: mơ tả quan hệ địa điểm qn bar Thuộc tính hasHotel: mơ tả quan hệ địa điểm khách sạn Thuộc tính hasLocalFood: mơ tả quan hệ địa điểm đặc sản Thuộc tính hasFestival: mơ tả quan hệ địa điểm lễ hội Thuộc tính hasMarket: mơ tả quan hệ địa điểm chợ Thuộc tính hasSuperMarket: mơ tả quan hệ địa điểm siêu thị Thuộc tính hasDestination: mơ tả quan hệ vùng địa điểm OWL Type: ObjectProperty Domain range thuộc tính object xác định theo lược đồ quan hệ lớp mơ tả hình 3.10 sau: Hình 3.10 Lược đồ quan hệ lớp ontology Footer Page 23 of 126 Header Page 24 of 126 - 24 - 3.4.7 Xây dựng thực thể Bước cuối hồn chỉnh ontology với thực thể đòi hỏi nhiều thời gian Cuối cùng, ontology ứng dụng định nghĩa 14 lớp 29 thuộc tính Sau mã hóa Protégé, nội dung ontology lưu trữ tập tin semTravel.owl * Sử dụng ontology Ontology khai báo thơng qua URI: http://www.semanticweb.org/ontologies/2011/2/Ontology13001962 99906.owl 3.5 XÂY DỰNG ỨNG DỤNG Phần mơ tả chi tiết module sử dụng phương thức thực thi để phát triển ứng dụng Trước hết, để thực mã hóa chức đặc tả trên, lược đồ lược đồ cộng tác xây dựng cho chức nhằm trình tự thực cơng việc tương tác qua lại đối tượng, quan hệ đối tượng giúp hình dung khía cạnh động ứng dụng Tiếp theo, tiến hành xây dựng lớp thành phần phát triển ứng dụng: Bước đầu tích hợp C# với sở tri thức OWL thơng qua OwlDotNetApi Visual Studio: using OwlDotNetApi; Sau tiến hành xây dựng lớp thành phần ứng dụng bao gồm: Lớp FindDB: chứa thuộc tính phương thức liên quan tìm kiếm tài ngun ontology Nó xử lý việc tìm kiếm thơng tin ứng dụng semTravel.owl: tập tin owl chứa ontology địa điểm du lịch Footer Page 24 of 126 Header Page 25 of 126 - 25 - Lớp DBDisplay: Truy xuất ontology để lấy thơng tin, liệu Lớp InfoDisplay: Sử dụng lớp OwlDotNetApi để giao tiếp với thành phần semTravel.owl OwlDotNetApi: có nhiệm vụ kết hợp C# Owl Trong số lớp OwlDotNetApi có số lớp sử dụng ứng dụng: OwlXmlParser, OwlGraph, OwlEdgeCollection, OwlEdge, OwlNode, OwlClass, OwlProperty, OwlIndividual 3.6 CÀI ĐẶT ỨNG DỤNG - Kết thực tìm kiếm điểm đến du lịch: Hình 24 Minh họa trang kết tìm kiếm - Kết thực tìm kiếm với từ khóa bất kỳ: Hình 25 Minh họa trang kết tìm kiếm Footer Page 25 of 126 Header Page 26 of 126 - 26 - KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Kết luận Luận văn nghiên cứu trình bày kiến thức web ngữ nghĩa kiến thức RDF, RDF Schema, ontology ngun tắc dùng để thiết kế ontology tốt Qua luận văn đạt số kết sau: Về lý thuyết, luận văn sâu nghiên cứu nhiều kiến thức RDF ontology, từ hiểu cơng nghệ web ngữ nghĩa để dựa vào triển khai ứng dụng khác, đồng thời cung cấp giải pháp để xây dựng ontology Về ứng dụng minh hoạ, với mục tiêu làm rõ thêm lý thuyết, luận văn ứng dụng xây dựng web ngữ nghĩa với cơng cụ hỗ trợ Protégé OwlDotNetApi Cụ thể xây dựng tập từ vựng địa điểm du lịch Việt Nam, khai thác tính truy xuất tài liệu có mơ tả ngữ nghĩa nhằm chia sẻ tài ngun thơng tin du lịch thực tìm kiếm với kết xác hơn, đồng thời tận dụng hết nguồn tài ngun hệ thống Hướng phát triển Sẽ hồn thiện ontology để hỗ trợ q trình truy xuất tìm kiếm thơng tin hiệu Phát triển ứng dụng với chức bổ sung cập nhật thơng tin ontology Sử dụng reasoner ontology HemiT hay Pellet để xây dựng module suy diễn dựa sở tri thức ứng dụng nhằm truy vấn liệu hiệu Footer Page 26 of 126 ... ngữ nghĩa ứng dụng vào xử lý thơng tin du lịch Mục tiêu nhiệm vụ nghiên cứu Luận văn nghiên cứu sử dụng cơng nghệ Web ngữ nghĩa làm ngơn ngữ mơ hình hóa cho lĩnh vực du lịch; nghiên cứu RDF RDF... XÂY DỰNG ỨNG DỤNG MINH HỌA XỬ LÝ THƠNG TIN DU LỊCH 3.1 GIỚI THIỆU ỨNG DỤNG Với kiến thức tìm hiểu web ngữ nghĩa trên, luận văn nghiên cứu sử dụng cơng nghệ web ngữ nghĩa vào xây dựng ứng dụng minh... có mơ tả ngữ nghĩa b) Ý nghĩa thực tiễn Việc nghiên cứu web ngữ nghĩa ứng dụng vào xử lý thơng tin du lịch mà cụ thể thơng tin địa điểm du lịch Việt Nam làm sở nhằm phục vụ việc tra cứu, chia

Ngày đăng: 20/05/2017, 15:46

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan