KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

52 1.2K 0
KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG KHOA CÔNG NGHỆ THÔNG TIN Báo cáo: KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA Sinh viên thực hiện: NHÓM Giảng viên: P.GS TS Trần Đình Quế Lớp: D09CNPM2 NHÓM – D09CNPM2 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA Mục lục KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA I I.1 NHÓM – D09CNPM2 Sự phát triển, tiến hóa web Tổng quan World Wide Web Web hay World Wide Web Internet thành phần bật hệ thống Nói cách khác, nhờ có trang Web mà người ta biết đến hữu Internet giới ảo tạo song hành với giới vật lý hàng tỉ người sử dụng Web Sự tiến hóa Web bắt đầu từ xuất Trải qua hệ, từ 1.0 tức loại Web thông tin đến 2.0 tức Web giao tiếp xã hội 3.0 loại Web có khả nhận thức, đến lượt xuất hệ - Web 4.0 mà đầu nội dung số mang đặc trưng cộng sinh qua lại người vật, tức nội dung trang Web Công nghệ thông tin tiến hóa tạo nội dung số vừa hữu ích, tiện lợi hấp dẫn, lại vừa thích đáng giàu cảm xúc Từ iTunes đến Amazon, từ Netflix đến New York Times, người ta nhận dấu hiệu xuất ngày nhiều loại nội dung số 4.0 Và cho dù chưa có định nghĩa thỏa đáng Web 4.0, hội thảo “tương lai kỹ thuật số” tổ chức vào cuối năm không đề cập đến trung tâm vấn đề lên nội dung 4.0 mà đưa chúng vào ứng dụng thiết thực đời sống, nghiên cứu, học tập vào môi trường kinh doanh mới, nơi khách hàng không dừng lại mức giao tiếp mà nhập vào môi trường tạo nên sản phẩm hay dịch vụ quan tâm Trên thực tế, xuất hệ Web kéo theo thay đổi đời sống xã hội hoạt động kinh tế khoa học kỹ thuật nhờ vào khai thác ứng dụng Khi Web 1.0 trở thành thứ tiện ích thông tin kéo theo phong trào thành lập công ty kinh doanh Internet tạo nên tượng bùng nổ dotCom năm 1997-2000 Web 2.0 chi phối cung cách lề lối giao tiếp xã hội mà định hình nên tảng thương mại điện tử Việc điện tử hóa hoạt động người, từ y tế điện tử đến phủ điện tử việc mở rộng từ Internet cố định sang Internet di động trở thành thực giai đoạn Web 3.0 với tính tự nhận thức thúc đẩy việc sản xuất thiết bị thông minh hơn, bao gồm siêu máy tính đủ lực để giải vấn đề toàn cầu chiến lược kinh doanh doanh nghiệp Chúng ta không nhận xuất hệ Web 4.0 không điểm lại lịch sử tiến hóa hệ trước KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA I.2 Web 1.0 I.2.1 Định nghĩa NHÓM – D09CNPM2 Web 1.0 khái niệm giai đoạn ban đầu tiến hóa World Wide Web (www) kéo dài từ năm 1995-2004, tập trung vào phương pháp tiếp cận xuống (1 chiều) sử dụng web giao diện người dùng Xét mặt kỹ thuật, thông tin web đóng (nội dung tĩnh) chỉnh sửa từ bên thông qua người quản trị web, tính “động” Công nghệ web 1.0 tập trung vào khía cạnh trình bày, khả tạo từ nội dung có sẵn I.2.2 Quá trình phát triển Thế hệ Web 1.0 đời năm 1997 cha đẻ World Wide Web (WWW) Tim Berners-Lee Năm 1989 Burners-Lee đưa ý niệm không gian siêu văn toàn cầu mà theo thông tin hay nội dung, thường gọi trang web tiếp cận thông qua nhận dạng chung Trang web công cụ tìm kiếm web đời năm 1990, cổ máy tìm kiếm mạnh Worm WWW năm 1993, Yahoo 1994, Web Crawlers 1994, AltaVista 1995 Berners-Lee định nghĩa Web 1.0 cấu trúc thông tin để đọc, tương tự không gian để quảng bá thông tin đến công chúng, bảng quảng cáo hàng hóa hay dịch vụ đến khách hàng Với tính ban đầu hạn chế Web 1.0 thực tạo nên sốt hình thành vội vã công ty kinh doanh Internet, tạo nên tượng bùng nổ dotCom Giá trị công ty công nghệ tăng lên nhanh Có tuần quỹ đầu tư mạo hiểm đổ vào Thung lũng Silicon đến tỉ đôla Cisco định giá cao đến 400 tỉ Mỹ kim từ tháng đến tháng 11 năm 2000 giá thảm hại 210 tỉ Cùng thời gian đó, cổ phiếu PriceLine từ 94 USD xuống USD, Go.com đánh 790 triệu USD, Boo.com đốt cháy 160 triệu đôla I.3 I.3.1 Web 2.0 Định nghĩa Web 2.0 hệ thứ (bắt đầu từ năm 2004) chuẩn web dịch vụ lưu trữ (hosting) với mục đích thuận tiện việc chia sẻ, hợp tác sáng tạo người dùng Nó dạng nâng cấp kỷ thuật từ web 1.0 mà thay đổi cách phát triển phần mềm cách sử dụng người dùng cuối KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA I.3.2 NHÓM – D09CNPM2 Quá trình phá triển Dougherty hội thảo tổ chức năm 2004 Theo đó, 2.0 hệ Web mà người sử dụng vừa đọc thông tin hay nội dung, vừa viết hay bổ sung vào để tạo nên thông tin hay nội dung Đây thứ cấu trúc hai chiều tạo nên giao tiếp hay tương tác người lập trang Web người sử dụng, người sử dụng với Ở đỉnh cao Web 2.0 trang mạng xã hội, điển Facebook, My Space, Twitter hay Daily Motion, You Tube mà người ưa thích chủ đề tìm đến với để trao đổi quan điểm, hình ảnh, đoạn phim hay bổ sung ý tưởng lời bình luận Các nhà thiết kế sử dụng giao thức AJAX, Flex Google Web Toolkit để tạo nên dễ dàng cho người sử dụng khai thác kỹ thuật tương tác blog, RSS, wiki, mashup, tag Trên thực tế, nhân tố tạo nên Web 2.0 xuất sớm; trải qua suy thoái thời hậu dotCom trang web chứa nhân tố Google, Amazon, eBay sống sót phát triển nhanh chóng Ngày 2.0 dòng Web phổ biến mang nhiều ứng dụng tất lĩnh vực, từ học tập, nghiên cứu đến thương mại, quản trị việc tạo cộng đồng mạng đa dạng, động, tràn đầy sức sống I.3.3 Đặc điểm - Web đóng vai trò tảng, chạy ứng dụng - Là nơi tập hợp trí tuệ cộng đồng - Dữ liệu đóng vai trò then chốt - Phần mềm cung cấp dạng dịch vụ web nâng cấp không ngừng - Phát triển ứng dụng dễ dàng nhanh chóng - Phần mềm chạy nhiều tảng thiết bị di động, thiết bị cầm tay (PDA) - Giao diện ứng dụng phong phú Ban đầu, web 2.0 trọng tới yếu tố công nghệ, nhấn mạnh tới vai trò tảng ứng dụng Nhưng đến hội thảo Web 2.0 tổ chức lần thứ vào tháng 2/2005 yếu tố cộng đồng nhấn mạnh NHÓM – D09CNPM2 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA I.3.4 Web đóng vai trò tảng Giống nhiều khái niệm quan trọng khác, web 2.0 ranh giới cố định mà lõi hấp dẫn Web 2.0 tập quy tắc thực hành chặt chẽ để kết hợp thành phần từ lõi I.4 Web 1.0 Web 2.0 Web 1.0 Web 2.0 Tổ chức lưu trữ Tập trung Phân tán Đối tượng Cá nhân độc quyền Cộng đồng chia sẻ Cung cấp Nội dung Dịch vụ Tương tác Chỉ đọc Đọc, viết Giao tiếp hệ thống Truyền phát Đồng Nội dung Tĩnh, tạo sẵn trước, Tự sản sinh, tự đề xuất thay đổi KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Hình Web 1.0 vs Web 2.0 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Hình Phân loại ứng dụng Web 1.0 vs Web 2.0 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA I.5 Semantic Web I.5.1 Định nghĩa NHÓM – D09CNPM2 Các trang web cấu thành thẻ HTML câu chữ tự nhiên, nhằm hướng dẫn cho trình duyệt biểu diễn thông tin người dùng nhìn thấy Máy hiểu định thông minh với thông tin mà biểu diễn Về phía nhà phát triển xử lý tài liệu phạm vi toàn cầu (các máy tìm kiếm không thỏa mãn hiệu năng) Giải pháp để giải vấn đề chỉnh sửa lại tài liệu web cách thêm phần liệu mở rộng với mục đích cho phép máy hiểu nghĩa tài liệu Và để làm điều ta cần xây dựng công cụ tác tử chạy web để xử lý tài liệu phạm vi toàn cầu, web gọi web ngữ nghĩa (semantic web) I.5.2 Những hạn chế HTML Hiện nay, WWW chủ yếu dựa Hyper Text Markup Language (ngôn ngữ đánh dấu siêu văn - HTML), tập quy ước đánh dấu sử dụng để mã hóa nội dung văn xen kẻ với đối tượng đa phương tiện (hình ảnh, âm thanh, video) mẫu tương tác khác Hầu hết chúng sử dụng để máy hiểu cách trình bày liệu web Các thẻ siêu liệu (metada tag) cung cấp phương thức mà máy tính phân loại nội dung trang web, ví dụ: Các thành phần nội dung biểu diễn HTML câu chữ vô hồn mà máy tính hiểu mặt ngữ nghĩa quan hệ, ràng buộc liên quan đến liệu mà trình diễn I.5.3 Giải pháp Web ngữ nghĩa Web ngữ nghĩa xuất dựa ngôn ngữ thiết kế đặc biệt để mô tả liệu RDF (Resource Description Framework), Web Ontology Language (OWL), Extensible Markup Language (XML) HTML có nhiệm vụ mô tả tài liệu liên kết chúng RDF, OWL, XML với ràng buộc mô tả thứ người, hội họp, du lịch, … 10 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Các công nghệ kết hợp với để cung cấp mô tả nhằm bổ sung thay nội dung tài liệu Web Do đó, nội dung biểu thân giống phần liệu mô tả sở liệu, hay đánh dấu tài liệu (XHTML) xen kẽ với XML biểu diễn liệu phân cấp XML Máy đọc mô tả cho phép quản lý nội dung để thêm ý nghĩa cho nội dung Nghĩa để mô tả cấu trúc tri thức, phải có thông tin mô tả nội dung Bằng cách này, máy tự xử lý tri thức, cách sử dụng trình xử lý lập luận, suy diễn, suy luận tương tự người, kết xử lý có ý nghĩa giúp máy tính tự động trình thu thập nghiên cứu thông tin Ví dụ thẻ HTML để biểu diễn liệu web thông thường blog Cũng với thông tin mô tả web ngữ nghĩa blog I.6 Web 3.0 I.6.1 Định nghĩa Theo Tim Berners-Lee, Web ngữ nghĩa mô tả thành phần Web 3.0 Web ngữ nghĩa sử dụng Web 3.0 I.6.2 Quá trình phát triển Giữa lúc Web giao tiếp xã hội 2.0 thời kỳ thịnh hành dấu hiệu hệ Web bắt đầu xuất Nếu bạn sử dụng máy ảnh kỹ thuật số có tích hợp GPS để ghi lại hình ảnh tải chúng lên mạng xã hội Flickr trang Web cho bạn thấy hình ảnh tương tự tác giả khác chụp ngày, đường phố, kiện hay nhân vật Thế hệ web tạo cho máy tính khả đọc hiểu nội dung đó, liên kết nội dung tương tự vào lại với Khả tương tự mạnh nơi cỗ máy tìm kiếm Web Google Search Khi đặt câu hỏi “tìm nhà nghỉ hè gần nice”, máy tính hiểu “nghỉ hè” có ý nghĩa nào, “nice” thành phố miền nam nước Pháp, “gần” đồng nghĩa với ưu tiên khoảng cách từ bán kính nhỏ đến lớn, từ 1, đến 10, 15km Ý niệm việc thiết kế kỹ thuật Web giúp cho máy tính đọc hiểu ý nghĩa đó, gọi web 10 38 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Lưu ý đăng ký số cung cấp dịch vụ web để phát hiện, đó, thích hợp để sử dụng ngôn ngữ mô tả vũ đạo, dàn nhạc để mô tả trao đổi dịch vụ cần thiết cho liên kết IV.5 Các chức mô tả khám phá Yêu cầu khám phá dịch vụ web đòi hỏi khả tìm kiếm dịch vụ web dựa mô tả chức năng(“FD” hình 3-2) tiêu chuẩn khác Bởi mô tả chức đòi hỏi phải có máy xử lý văn nhiều đơn vị cung cấp dịch vụ đọc nhiều đơn vị yêu cầu, ngôn ngữ thích hợp để đại diện cho mô tả chức là: - Web thân thiện( dựa URIs khả mở rộng toàn cầu) Rõ ràng Có khả thể chức tương lai Có khả thể từ vựng mối quan hệ chức có Đây lĩnh vực cần tiếp tục việc tiêu chuẩn hóa Một lỗ lực OWL-S 38 39 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA V NHÓM – D09CNPM2 Khám phá dịch vụ Web ngữ nghĩa (Dựa theo tài liệu: Web Service Modeling Ontology (WSMO) - An Ontology for Semantic Web Services) Dựa theo tài liệu này, khung khái niệm phân biệt rõ ràng bước việc khám phá: - Goal discovery: Bước nói việc trừu tượng hóa mục tiêu cụ thể khách hàng để định nghĩa trước, tái sử dụng thức hóa mục tiêu - Web service discovery:Công đoạn có liên hệ với việc thức hóa mục tiêu thức hóa dịch vụ web việc chọn lựa dịch vụ web có khả thường xuyên yêu cầu - Service discovery: sử dụng dịch vụ web phù hợp với bước để tiến sát dịch vụ thực tế sau giao diện web, công đoạn cuối kiểm tra việc dịch vụ có thực hiệncác mục tiêu người yêu cầu chúng hay không Bây chọn mục tiêu tập dịch vụ web để xem xét cho ánh xạ tiến trình để định nghĩa sẵn sàng công cụ khám phá Với mục đích đó, làm rõ việc biểu ngôn ngữ, lí luận chứng minh công cụ cần cho việc ánh xạ việc giới thiệu phương pháp khám phá V.1 Các phương pháp khám phá V.1.1 Keyword-based Discovery Là biện pháp ban đầu cho thực khám phá dịch vụ web KD biện pháp tốt cho việc định nghĩa ngữ nghĩa có giới hạn không tường minh ngôn ngữ tự nhiên, KD sử dụng cho việc lọc xếp nhanh chóng khối đồ sộ mục tiêu, mô tả dịch vụ Để thiết kế KD tốt phải cấu câu hỏi trả lời Lựa chọn KD muốn tìm mối quan hệ từ khóa cung cấp người dùng lấy từ thể học (Ontologies) chứa mục tiêu/dịch vụ thức Về bảnđược hiểu ánh xạ từ khóa từ tập yêu cầu người dùng sang khái niệm định danh từ thể có sẵn 39 40 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Một tiếp cận khác cho KD với thể thức logic Lúc từ khóa xác nhận tốt định danh chúng chọn lưu trữ ngữ nghĩa tính chất, thuộc tính chúng sử dụng Mỗi từ khóa tìm kiếm thể ánh xạ quy định phương diện người dùng định danh thuộc tính tình phương diện khác KD nguyên mô tả không rõ ràng sử dụng logic Kết phương pháp không khả thi với yêu cầu biến thể WSML V.1.2 Discovery Based on Simple Descriptions of Services a Trạng thái không hạn chế Chúng ta giới hạn ngôn ngữ mong muốn cho việc định nghĩa dịch vụ web hay goal Như vậy, nhiều yêu cầu dùng định lí chứng minh thức đầy đủ ngôn ngữ để kiểm tra trách nhiệm thêm vào phụ lục tài liệu Đây cách tiếp cận phần biến thể lõi WSML sở, WSML DL (trong WSML đầy đủ) tốt Một cụm lí luận ứng viên có giá trị dùng cho Việc thực thi nguyên mẫu Chúng ta khép lại nhìn với tên Hệ thống riêng biệt Vampire SNARK Hướng phức tạp lựa chọn định lí thực nguyên mẫu khía cạnh khác cho việc thực thi kiểm tra trách nhiệm, b Thu hẹp DL Ở phiên trên, không giới hạn phép biểu cho mô tả mục đích dịch vụ web Tuy nhiên, giới hạn WSML DL cú pháp OWL DL, lợi dụng xếp hiệu lí luận RACER, FACT++, Pellet RACER cung cấp hiệu xếp lí luận cho SHIQ với nguyên lí chưa hoàn thiện danh sách FACT++ cung cấp SHIF(D) 40 41 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Pellet cung cấp lí luận mạnh hoàn thiện cho OWL DL định danh SHIN(D) OWL đặc tính đảo ngược(SHON(D)) mạnh không hoàn thiện OWL DL đầy đủ (SHOIN(D)) DBSD thể Semantic web Fred dự án SWF sử dụng Logic Sắp xếp cho việc thiết lập mô hình tính toán phức tạp Các thử nghiệm dự áncho thấy việc đung định lí xếp phát thiết lập nguyên tắc bao hàm kiểm tra dịch vụ có sẵn riêng lẻ Điều việc dùng DL biện pháp hiệu để kiểm tra tập hợp con.các dịch vụ web với cách tiếp cận: V.1.3  Sắp xếp mối liên hệ mục tiêu trước phân loại để phân rã chúng mục tiêu trước Việc xác định dựa vào mục tiêu xác định trước thông qua mgMediator  Sắp xếp mối quan hệ mục tiêu tinh chế với dịch vụ phân loại tính toán cho yêu cầu phân loại (mặc dù ta biết số trang web dự kiến có số lượng lớn nhiều so với số mục tiêu tinh chế) Discovery Based on Rich Descriptions of Services a Thiết lập dựa mô hình Về mô hình thiết lập sở tiếp cận với dịch vụ web làm giàu mô tả ngữ nghĩa, cần nắm thự sực quan hệ đầu vào đầu ra/kết thực thi dịch vụ web cho tốt thức hóa ngôn ngữ lệnh Với thích nghĩa đơn giản giới hạn mô tả dịch vụ hay mục tiêu, cần dùng xếp đầy đủ thức đưa tài liệu b Logic giao dịch Việc thực nghĩa vụ khác trang web sử dụng Logic giao dịch theo quy tắc reification Luật yêu cầu mô tả mục tiêu dịch vụ web xác đinh trước , dc thêm vào WSML-Rule Logic giao dịch dùng để chứng minh nghĩa vụ trang web không yêu cầu thêm ngôn ngữ mô tả goal hay dịch vụ web 41 42 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA V.2 Tích hợp V.2.1 Mô tả mục tiêu dịch vụ web NHÓM – D09CNPM2 Loại mô hình: Chúng ta cần mô tả dịch vụ hình thức cụ thể cho việc tiếp cận: vd muốn làm DL mà lại có mô tả tốt dịch vụ trật tự logic cách dung DL chích xuất mô tả trừu tượng trực tiếp từ mô tả Việc trừu tượng hoa yêu cầu thức hóa đo độ hữu dụng thực nghiệm Thành phần biến thể WSML: Chúng ta xem xét làm mà WSML khác sử dụng cho loại trang web phát dịch vụ khác thực tương thích Bất kì loại dịch vụ web phát dựa nguyên tắc tên miền thể học dựa vào mô tả thể học WSML – Core đủ V.2.2 Xếp hạng Xem xét việc kết hợp phương pháp tiếp cận việc phát dịch vụ web đòi hỏi không xếp hạng dịch vụ web phù hợp với sử dụng từ khóa mà để xếp hạng kết phù hợp việc khám phá giao dịch V.3 Giao diện Trong phần V này, thảo luận công cụ phát Điều đưa dự kiến phác thảo giao diện cần đáp ứng mô tả thô sau đây: Mục tiêu thức dựa từ khóaKD , đơn giản DBSD, Phong phú DBRD Các khái niệm dự kiến cấp xác Bộ phát phải trả danh sách dịch vụ web toàn phần phù hợp với bảng xếp hạng dịch vụ web Vì cần giao diện cho phép nhập mô tả từ khóa mục tiêu mục tiêu đơn giản DBSD với danh sách xếp hạng 42 43 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA V.4 NHÓM – D09CNPM2 Kiến trúc Thành phần: Các thành phần: Quản lí giao tiếp: quản lí thông tin yêu cầu gửi đến Có trách nhiệm quản lí nguồn gốc định dạng kết mục tiêu Message Parser Phân tích cú pháp tin nhắn: Phân tích tin nhắn triết xuất thành phần tin nhắn như: điều kiện gửi, hiệu ứng, phận chúng đến Proof Generator Lưu ý: Ở thêm bước dịch thật nhằm biền đổi biểu thức logic chứa tin nhắn WSML đến định dạng mục tiêu kết The Reasoner Manager : tóm tắt từ giao diện khác kết cung cấp API phổ biến đến Proof Generator Quản lí cân tải kết giao thức mạng Lưu ý: kiến trúc lưu trữ kho liệu phần thấy công cụ phát tích hợp với đăng kí 43 44 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Giả định người có định danh đăng kí API cung cấp đầy đủ mô tả dịch vụ dịnh danh Khi công cụ khám phá cần lưu bên liên quan registry với thông tin nhận diện => đòi hỏi đồng hóa giữ đăng kí Một cỗ máy khám phá yêu cầu việc lưu trữ đăng kí lẫn mục tiêu Có kho liêu lưu trữ cho phép phân loại trước trừu tượng hóa thời điểm xuất liên kết dịch vụ kho liệu để xác định trước mục tiêu Điều làm việc khám phá có hiệu lọc nhanh Việc phân tích kho liệu phần quan trọng cho phép khả mở rộng khám phá Các yêu cầu thành phần khác Ở cấp giao diện chức năng, có thêm vài thành phần thành phần đăng kí Bản thể học (ontologies)… VI Khai phá liệu cho khám phá dịch vụ VI.1 Khai phá liệu hoạt động Khai phá liệu việc tìm kiếm mô hình liệu khác biệt, xu hướng tồn trong liệu lớn, thường dạng tiềm Công việc khai phá liệu bao gồm xác định vấn đề, tiền xử lý liệu, mô hình hóa liệu đánh giá mô hình Điều yêu cầu nhà phân tích phải có hiểu biết miền ứng dụng, có trước kiến thức liên quan, liệu phải sẵn có để khai phá mục tiêu người dùng cuối Một mục tiêu việc khai phá liệu xác định, bước chuẩn bị liệu cho việc khai phá Bước tiền xử lý liệu nhằm loại bỏ độ nhiễu hay sai lệch Xử lý không quán thiếu liệu để đảm bảo chất lượng cho liệu biến thành liệu có cấu trúc cụ thể Bước tiền xử lý phần quan trọng, liên quan đến việc xác định cách dịch vụ web khai phá Mô hình liệu kết việc sử dụng quy tắc suy luận từ tiền xử lý liệu xây dựng mô hình cho phù hợp với tập liệu Bước mô hình hóa liệu đề cập đến việc áp dụng kết hợp nhiều kỹ thuật khai phá cho việc xác định mẫu từ tập liệu thu Các mẫu phụ thuộc vào hoạt động khai phá liệu mô tả bảng sau: 44 45 NHÓM – D09CNPM2 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA Hoạt động khai phá Mục tiêu Phương pháp tiếp cận Mô hình dự đoán (phân lớp, dự đoán giá trị) Dự đoán nhu cầu tương lai Cây định, mạng dựa vào liệu có Neural, Bayes, hồi quy tuyến tính phi tuyến tính Phân lớp phân đoạn Phân vùng liệu thành đoạn Demographic, mạng Neural Phân tích liên kết Thiết lập liên kết hạng mục Đếm số lần xuất hạng mục chẳng hạn thuật toán Apriori Phân tích độ lệch Phát dì thường, hoạt động bất thường Các kỹ thuật thống kê trực quan hóa Mô hình dự đoán giải vấn đề cách nhìn vào kinh nghiệm khứ kết hợp với câu trả lời biết, sau dự kiến trường hợp dựa đặc trưng cần thiết liệu Quá trình xử lý cho phép dự đoán giá trị chưa rõ biến cần dự đoán cho giá trị biết biến khác Mô hình dự đoán phân lớp sử dụng để dự đoán giá trị rời rạc, mô hình dự đoán giá trị, mô hình hồi quy sử dụng để dự đoán giá trị liên tục Phân cụm hay phân đoạn giải vấn đề cách xác định đối tượng tương tự tập liệu Các hoạt động phân tích liên kết thiết lập liên kết đối tượng với cách tìm kiếm hạng mục cho bao hàm có mặt hạng mục khác tập liệu Phân tích liên kết khám phá chuỗi thời gian tương tự cho xác định xuất tương tự, xuất tương tự tập liệu thời gian Việc phân tích tìm hiểu mối quan hệ thời gian liệu chuỗi thời gian cách kết hợp chuỗi liệu tương tự chuỗi cho, thành chuỗi khác Phân tích độ lệch liên quan đến việc xác định dị thường, hoạt động kiện bất thường tập liệu sai lệch Bước cuối liên quan đến việc giải thích nguồn gốc mô hình, luật Gồm hoạt động lọc, tái cấu trúc, trực quan hóa liệu sử dụng để trích xuất tri thức cách có ý nghĩa dễ hiểu cho người dùng VI.2 Ứng dụng khai phá liệu dịch vụ Web 45 46 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA VI.2.1 NHÓM – D09CNPM2 Ứng dụng doanh nghiệp Các dịch vụ web chi phí dự đoán: Giám sát hiệu năng: VI.2.2 Ứng dụng kỹ thuật Dịch vụ cải tiến: Dịch vụ đề xuất: VI.3 Khai phá liệu cho khám phá liệu VI.3.1 Đặt vấn đề Việc tìm kiếm dịch vụ web cách sử dụng máy tìm kiếm web dịch vụ Salcentral hay UDDI bị giới hạn từ khóa kết hợp với tên, địa điểm, doanh nghiệp, … (xác định cho khái niệm tái sử dụng) Một người dùng có nhu cầu xác định vị trí cụ thể làm cách xác định tên dịch vụ cụ thể Với UDDI, người dùng tìm kiếm tên nhà cung cấp dịch vụ duyệt đăng ký (registry) lược đồ phân cấp khác mà hỗ trợ NAICS UNSPSC Tuy nhiên người dùng thường quan tâm tới chức dịch vụ nên họ thường bắt đầu gõ tên dịch vụ, thuộc tính khác nhà cung cấp thường lựa chọn để phân biệt dịch vụ Việc kết hợp truy vấn đến tập dịch vụ dựa tên dịch vụ Nếu truy vấn không chứa xác từ tên dịch vụ, dịch vụ không trả Do tên dịch vụ Web ngắn, thường không từ, điều vô cần thiết để câu truy vấn có chứa từ tên dịch vụ mong muốn Việc kết hợp dịch vụ mức độ chuỗi xâu đồng nghĩa với câu truy vấn mà không trả tập dịch vụ giống dịch vụ có chức giống Truy vấn mức độ chuỗi xâu khác lại có nghĩa giống trả kết không khớp Đây trở ngại lớn tìm kiếm dịch vụ web người dùng quan tâm đến chức dịch vụ Phương pháp khám phá dịch vụ dựa từ khóa cho kết trả thấp kết có chứa từ đồng nghĩa khái niệm có mức độ trừu tượng cao thấp để mô tả dịch vụ thường không trả Ví dụ tên dịch vụ “SMS” không trả người dùng truy vấn “Mobile Message Service” mà khái niệm giống 46 47 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Vấn đề tiếp cận cách: trả cho người dùng tập kết mở rộng gợi ý cho người dùng thuật ngữ khác có liên quan Các máy tìm kiếm sử dụng ontology để trả tập kết mở rộng bao gồm lớp cha, lớp lớp đồng cấp Mặc dù phương pháp cải thiện kết trả kết lớn mà liên quan đến đối tượng tìm kiếm, có kết nghèo nàn, kết mà người sử dụng không quan tâm Một số phương pháp tiếp cận khác đề xuất nhằm tăng cường tương tự ngữ nghĩa cho việc mở rộng câu truy vấn với đồng nghĩa, ẩn dụ, Điều mang lại số cải thiện nhỏ mức độ câu truy vấn ngắn, câu truy vấn dài cải thiện, chí tệ Sự thiếu hụt ngữ nghĩa dẫn tới phát triển ngôn ngữ dựa OWL-S DAML cho dịch vụ mô tả WSDL, nơi mà dịch vụ phù hợp với khả dựa yếu tố đầu vào, đầu ra, điều kiện bắt buộc, ảnh hưởng, ontology sử dụng để mã hóa mối quan hệ khái niệm Phương pháp tiếp cận thứ gợi ý cho người dùng thuật ngữ liên quan đến câu truy vấn vừa nhập vào dựa truy vấn tương tự người dùng khác, điều thực kỹ thuật phân cụm khai phá liệu Trong máy tìm kiếm Web trước phương pháp tiếp cận nắm bắt mối quan hệ nội truy vấn mà bỏ qua mối quan hệ liên truy vấn tồn câu truy mà người sử dụng gửi phiên tìm kiếm Khi người dùng tìm thấy dịch vụ Web với chức yêu cầu, người dùng gửi câu tìm kiếm khác mà đồng nghĩa với truy vấn ban đầu Điều giả định nhu cầu người dùng dịch vụ không thay đổi tìm thấy dịch vụ thỏa mãn Vì tập thuật ngữ tìm kiếm sử dụng liên tục phiên tìm kiếm tạo thành lối mòn đại diện cho nhu cầu dịch vụ người Phân cụm dựa phiên tìm kiếm thay cho tìm kiếm cá thể tận dụng vấn đề cách tận dụng lợi phát người dùng ngụ ý truy vấn nhật ký máy chủ Web để cung cấp liên kết ngữ nghĩa từ khóa Nếu truy vấn phân cụm độc lập với truy vấn khác sử dụng phiên tìm kiếm, kết phân cụm có thuật ngữ tìm kiếm có mức độ đồng nghĩa cao ích lợi Nói cách khác, việc thực phân cụm dựa phiên tìm kiếm, kết “SMS” “Mobile Message Service” phân nhóm VI.3.2 Phương pháp phân cụm 47 48 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Bước 1: Tiền xử lý liệu 1.1 Trích xuất thực thể có liên quan với từ nhật ký người dùng truy vấn nhật ký máy chủ Web 1.2 Tạo mô tả truy vấn dịch vụ kết hợp cách hợp thực thể có loại nhật ký 1.3 Tập mẫu phiên tìm kiếm cách nhóm thực thể theo địa IP máy khách máy chủ Web Bước 2: Thực phiên tìm kiếm giống 2.1 Tính toán mức độ tương đồng Jaccard độc lập với từ tìm kiếm mô tả dịch vụ cặp dịch vụ Web 2.2 Tạo mẫu ma trận tương đồng cách hợp hệ số tương đồng thành phần Bước 3: Thực phân cụm 3.1 Áp dụng phân cấp cụm từ mẫu nhóm lấy từ ma trận tương đồng 3.2 Lưu trữ cụm đăng ký UDDI phép cải thiện tìm kiếm Hình Các truy vấn nhóm vào phiên làm việc VI.3.3 Tiền xử lý liệu Dữ liệu cần thiết cho phân cụm phiên truy vấn lấy từ nhật ký người dùng truy vấn nhật ký máy chủ web Nhật ký truy vấn chứa từ tìm kiếm 48 49 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 số thông tin xác định truy vấn gửi địa IP máy gửi thời gian gửi Các thực thể cần thiết từ nhật ký máy chủ web thực thể tương ứng với thực thể nhật ký truy vấn, trang mô tả dịch vụ theo truy vấn Dữ liệu từ nguồn củng cố cho việc kết hợp mô tả dịch vụ truy vấn phù hợp Mỗi thực thể mẫu nhật ký truy vấn có quan hệ – nhiều với thực thể nhật ký máy chủ web Các quan hệ nắm bắt cách kết hợp truy vấn ghi lại từ nhật ký truy vấn với mô tả dịch vụ ghi lại nhật ký máy chủ web Như ta có kết có cấu trúc: Truy vấn {Mô tả dịch vụ} với truy vấn từ tìm kiếm sử dụng tập mô tả dịch vụ tương ứng mà người dùng xem tập kết trả từ truy vấn VI.3.4 Phiên tìm kiếm giống Một phiên tìm kiếm định nghĩa tập truy vấn gửi theo trình tự người dùng để xác định dịch vụ cụ thể Nó tương tự giao dịch hay phiên máy chủ khai phá web Do phương pháp tiếp cận để xác định tương tự Một tập câu truy vấn xác định cách sử dụng địa IP với thời gian ghi lại nhật ký máy chủ Web Địa IP dùng để xác định người dùng, thời gian để xác định phiên khác người dùng Các thực thể địa IP nhóm lại với xếp theo thời gian để có tất tìm kiếm thực người dùng Các phiên khác phân biệt dựa ngưỡng thời gian Độ tương tự cặp phiên tìm kiếm dấu hiệu liên quan đến Ví dụ phiên tìm kiếm có chứa nhiều từ khóa giống có mô tả dịch vụ giống có lẽ liên quan đến Phiên tìm kiếm tương tự tính toán dựa giống tập từ tìm kiếm sử dụng tập mô tả dịch vụ xem phiên tìm kiếm Độ giống phiên tìm kiếm X, Y xác định sau: similarity (X,Y) = similarity search term (X, Y) + similarityservice descriptions (X, Y) Hệ số Jaccard tính toán độ tương tự cách sử dụng tập từ tìm kiếm mô tả dịch vụ X, Y Phương pháp tính toán độ tương tự dựa thuộc tính xuất tập liệu so sánh Một thuộc tính mà không mô tả tập liệu coi không quan trọng Với phiên tìm kiếm chuyển thành vector nhị phân Một biểu diễn truy vấn, biểu diễn 49 50 NHÓM – D09CNPM2 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA mô tả dịch vụ xem Giá trị thể có mặt truy vấn mô tả dịch vụ, độ dài vector tương ứng với tổng truy vấn khác tổng mô tả dịch vụ khác Độ tương đồng từ tìm kiếm mô tả dịch vụ xem cho công thức sau: similaritysearch term (X, Y) = (TXY) / (TX + TY + TXY) similarityservice descriptions (X, Y) = (DXY) / (DX + DY + DXY) Txy số lượng từ tìm kiếm có X Y Tx, Ty số lượng từ tìm kiếm có X , Y Dxy số lượng mô tả dịch vụ có X Y Dx, Dy số lượng mô tả dịch vụ X, Y Ví dụ, xét phiên tìm kiếm ta có kết sau: Query vector SD Vector q1 q2 q3 q4 X= 1 0 Y= 1 ID001 ID002 ID003 ID005 ID007 ID008 ID012 X = 1 1 Y = 1 1 similaritysearch term (X, Y) = 0.25 similarityservice descriptions (X, Y) = 0.429 similarity (123.456.789, 234.567.890) = 0.679 Xây dựng ma trận tương đồng làm đầu vào cho việc phân cụm Một thuật toán phân cụm thường đòi hỏi ma trận tương đồng để xác định cụm phiên tìm kiếm 50 51 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA VI.3.5 NHÓM – D09CNPM2 Phân cụm phiên tìm kiếm Phương pháp tạo phân cấp phân cụm thường sử dụng truy vấn thông tin cho việc phân nhóm tài liệu tương tự Phương pháp sử dụng chiến lược từ lên bắt đầu cách đặt trường hợp cụm riêng sau tiếp tục hợp cụm với tiêu chí thỏa mãn dừng lại Lý sử dụng phương pháp sau Thứ nhất, độ tương tự phiên tìm kiếm có dựa số lượng truy vấn phổ biến mô tả dịch vụ mà họ chia sẻ Điều có nghĩa phiên tìm kiếm gán cho cụm chúng có nhiều truy vấn mô tả dịch vụ phổ biến Thứ hai, thuật toán phải có khả chống nhiễu độ sai lệch Vì người dùng nhập truy vấn tùy tiện không liên quan đến truy vấn khác phiên, giá trị ngoại lai có mặt Thứ ba, khối lượng truy vấn lớn thuật toán cần mở rộng Sau cụm hình thành, hỗ trợ cho từ tìm kiếm cụm tính sau gán trọng số Các trọng số sử dụng để dự đoán nhu cầu sử dụng dịch vụ người dùng Tùy thuộc vào kích thước số lượng từ tìm kiếm mà tạo nên cụm, tất từ tìm kiếm cụm giới hạn cho người từ phiên tìm kiếm tương tự 51 52 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM – D09CNPM2 Tài liệu tham khảo [1] Fensel, D., & Keller, U (2005) WWW or What is Wrong with Web service Discovery [2] http://www.w3.org/TR/ws-arch [3] JUANWANG, A., & QIAN, K (2005) Component Oriented Programming [4] Nayak, R (2008) Data mining in web services discovery and monitoring [5] Yu, L (2007) Introduction Semantic Web & Semantic Web Service 52 [...]... rộng, nâng cấp một website tĩnh hầu như là phải làm mới lại 20 21 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 website 21 22 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA III III.1 NHÓM 5 – D09CNPM2 Các công nghệ dịch vụ Web và Web ngữ nghĩa Các công nghệ dịch vụ Web Hình 3 Semantic Web architecture stack III.1.1 XML Là một chuẩn mở do W3C đưa ra cho cách thức mô tả dữ liệu, nó được sử dụng để định nghĩa các thành... tìm thấy một dịch vụ web thích hợp Khám phá dịch vụ là một dịch vụ tạo điều kiện cho quá trình thực hiện ra dịch vụ đó Đó là một hợp lý và có thể được thực hiện bởi đại diện, yêu cầu đại diện của nhà cung cấp hoặc đại diện khác Hình 3-2: “quá trình khám phá mở rộng trên hình 1-1: mô tả quá trình việc tham gia một dịch vụ web khi khám phá dịch vụ được sử dụng 29 30 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM... gia một dịch vụ web Hình 3-2: Quá trình khám phá 30 31 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 Dịch vụ tham gia sử dụng trong quá trình khám phá dịch vụ được tiến hành trong các bước sau: 1 Các đối tượng yêu cầu và nhà cung cấp “được biết đến với nhau” a Khám phá dịch vụ bằng cách nào đó được cả hai mô tả dịch vụ web( “WSD” trong hình 3-2) và một mô tả liên quan đến chức năng dịch vụ( “FD”)... chức năng của dịch vụ Web + Loại dịch vụ - tModel: chứa các thông tin về loại dịch vụ được sử dụng Những thông tin về dịch vụ Web được sử dụng và công bố lên mạng sử dụng giao thức này Nó sẽ kích hoạt các ứng dụng để tìm kiếm thông tin của dịch vụ Web khác nhằm xác định xem dịch vụ nào sẽ cần đến nó III.2 Các công nghệ Web ngữ nghĩa Hình 4 Semantic Web Stack 26 27 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA III.2.1... -Theo Tim Berners-Lee, Web ngữ nghĩa được mô tả như một thành phần của Web 3.0 Web ngữ nghĩa đôi khi được sử dụng như là -Dịch vụ Web (Web Service) là một loại ứng dụng Khách – Chủ (Client – Server) phân tán Trong đó, có một ứng dụng đóng vai trò máy chủ (server) cung cấp các giao diện 12 13 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA phương pháp tiếp cận trên xuống (1 chiều) về sử dụng web cũng như về giao diện... có thể biểu diễn được trên Web IV Khám phá dịch vụ IV.1 Quá trình khám phá dịch vụ Nếu thực thể yêu cầu mong muốn sự tương tác với đại diện cung cấp dịch vụ và nó không thật sự biết những gì đại diện của nhà cung cấp dịch vụ muốn tham gia, sau đó là thực thể yêu cầu cần phải khám phá một ứng viên thích hợp Khám phá là một hành động xác định mô tả máy xử lý của một dịch vụ web có thể đã biết từ trước... thập dữ liệu web, việc thu thập bản mô tả dịch vụ ở bất cứ nơi nào nó tìm thấy chúng, với đơn vị cung cấp không có kiến thức về nó hoặc nếu khám phá dịch vụ được thực hiện như một đăng kí( như UDDI), sau đó đơn vị cung cấp có thể chủ động xuất bản mô tả dịch vụ b và mô tả chức năng trực tiếp khám phá dịch vụ Đơn vị yêu cầu cung cấp các tiêu chí khám phá dịch vụ để lực chọn một mô tả dịch vụ web dựa trên... Microsoft.Net… - Ngày nay dịch vụ Web đang rất phát triển, những lĩnh vực trong cuộc sống có thể áp dụng và tích hợp dịch vụ Web là khá rộng lớn như dịch vụ chọn lọc và phân loại tin tức (hệ thống thư viện có kết nối đến web portal để tìm kiếm 15 16 KHÁM PHÁ DỊCH VỤ WEB NGỮ NGHĨA NHÓM 5 – D09CNPM2 được dùng để các thông tin cần hạn chế mối đe thiết); ứng dụng cho dọa này các dịch vụ du lịch (cung cấp giá... chuẩn của dịch vụ ngữ nghĩa được xác định bởi một số cơ quan đưa ra các tiêu chuẩn Điều quan trọng là các bên phải đồng ý( theo nghĩa được mô tả trong Sử dụng dịch vụ web) ngữ nghĩa bất kể làm thế nào để đạt được Bước này cũng yêu cầu các bên đồng ý( theo nghĩa được mô tả trong Sử dụng dịch vụ web) trên mô tả cũng dịch vụ được sử dụng Tuy nhiên, kể từ khi đơn vị yêu cầu được mô tả dịch vụ web ở bước... máy khách (client) sẽ yêu cầu dịch vụ từ máy chủ này II.2 Dịch vụ Web và Web Web thông thường Định nghĩa Dịch vụ web Web 1.0 Web 2.0 Web 3.0 - Web 1.0 là một khái niệm chỉ giai đoạn ban đầu trong sự tiến hóa của World Wide Web (www) kéo dài từ năm 1995-2004, tập trung vào -Web 2.0 là thế hệ thứ 2 (bắt đầu từ năm 2004) của chuẩn web và các dịch vụ lưu trữ (hosting) với mục đích thuận tiện trong việc chia

Ngày đăng: 30/12/2015, 20:26

Từ khóa liên quan

Mục lục

  • Tài liệu tham khảo

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan