Nghiên cứu và phát triển hệ thống rút trích ontology từ web

52 911 11
Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Chương 1: Mở đầu Chương 2: Tổng quan Ontology Chương 3: Các hướng tiếp cận trong việc xây dựng Ontology Chương 4: Quy trình rút trích Ontology từ dữ liệu web Chương 5: Framework Chương 6: Kết luận và hướng

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊNKHOA CÔNG NGHỆ THÔNG TINBỘ MÔN CÔNG NGHỆ PHẦN MỀMNGUYỄN HOÀN – HOÀNG XUÂN THẢONGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG RÚT TRÍCH ONTOLOGYTỪ WEBKHÓA LUẬN TỐT NGHIỆP CỬ NHÂN CNTTTP.HCM, 2010 TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊNKHOA CÔNG NGHỆ THÔNG TINBỘ MÔN CÔNG NGHỆ PHẦN MỀMNGUYỄN HOÀN 0612109HOÀNG XUÂN THẢO 0612416NGHIÊN CỨU PHÁT TRIỂN HỆ THỐNG RÚT TRÍCH ONTOLOGYTỪ WEBKHÓA LUẬN TỐT NGHIỆP CỬ NHÂN TIN HỌCGIÁO VIÊN HƯỚNG DẪNTS.TRẦN MINH TRIẾTNIÊN KHÓA 2006– 2010 NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………Khóa luận đáp ứng yêu cầu của LV cử nhân tin học.TpHCM, ngày …… tháng …… năm 2010Giáo viên hướng dẫn NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………………Khóa luận đáp ứng yêu cầu của LV cử nhân tin học.TpHCM, ngày …… tháng …… năm 2010Giáo viên phản biện LỜI CÁM ƠNChúng em xin chân thành cảm ơn Khoa Công Nghệ Thông Tin, trường Đại Học Khoa Học Tự Nhiên, Tp.HCM đã tạo điều kiện tốt cho chúng em thực hiện đề tài này.Chúng em xin chân thành cảm ơn Thầy Trần Minh Triết, là người đã tận tình hướng dẫn, chỉ bảo chúng em trong suốt thời gian thực hiện đề tài. Chúng em cũng xin gửi lời cảm ơn sâu sắc đến quý Thầy Cô trong Khoa đã tận tình giảng dạy, trang bị cho chúng em những kiến thức quí báu trong những năm học vừa qua.Chúng em xin gửi lòng biết ơn sâu sắc đến Ba, Mẹ, các anh chị bạn bè đã ủng hộ, giúp đỡ động viên chúng em trong những lúc khó khăn cũng như trong suốt thời gian học tập nghiên cứu.Mặc dù chúng em đã cố gắng hoàn thành luận văn trong phạm vi khả năng cho phép, nhưng chắc chắn sẽ không tránh khỏi những thiếu sót, kính mong sự cảm thông tận tình chỉ bảo của quý Thầy Cô các bạn.Nhóm thực hiệnNguyễn Hoàn & Hoàng Xuân Thảo ĐỀ CƯƠNG CHI TIẾTTên Đề Tài: Nghiên cứu phát triển hệ thống rút trích ontology từ webGiáo viên hướng dẫn: TS.Trần Minh TriếtThời gian thực hiện: từ ngày //2009 đến ngày //2010Sinh viên thực hiện: Nguyễn Hoàn (0612109) – Hoàng Xuân Thảo(0612416)Loại đề tài: Nội Dung Đề Tài (mô tả chi tiết nội dung đề tài, yêu cầu, phương pháp thực hiện, kết quả đạt được, …):•Kế Hoạch Thực Hiện:12/01/2009-26/02/2009:Tìm hiểu công nghệ XNA.27/02/2009-15/03/2009: Mô tả các đặc trưng chính của Product Line game sẽ xây dựng.15/03/2009-20/03/2009:Nêu phân tích các vấn đề sẽ phát sinh trong quá trình xây dựng.21/03/2009-10/04/2009: Đưa ra các giải pháp cho các vấn đề lựa chọn giải pháp thích hợp.11/04/2009-01/05/2009: Xây dựng ứng dụng game.02/05/2009-30/06/2009:Xây dựng các công cụ hỗ trợ cho việc chuẩn hóa tài nguyên biên tập bản đồ vùng chiến sự.01/07/2009-07/07/2009:Cải tiến ứng dụng game các công cụ. Xác nhận của GVHD Ngày tháng năm 2010SV Thực hiện MỤC LỤC DANH MỤC CÁC HÌNH DANH MỤC CÁC BẢNG [...]... Rút trích Ontology Rút trích ontology là một trong những thao tác trên ontology. Việc rút trích nhắm đến việc lấy ra những yếu tố (các khái niệm) từ các nguồn khác nhau, tạo thành ontology. Việc xây dựng một ontology một cách thủ công là một việc tốn nhiều thời gian công sức.Vì vậy nhu cầu cần những phương pháp xây dựng ontology tự động hoặc bán tự động xuất hiện, các phương pháp rút trích ontology. .. Kiến trúc chung của hệ thống CRCTOL [35] Hệ thống do Maddi Reddy Govind các đồng sự [36] phát triển, khai thác từ tập hợp các văn bản có liên hệ, rút trích ontology theo phương pháp thống kê Các từ trong văn bản được đếm số lần xuất hiện (đếm tất cả các từ) Nhóm tác giả sử dụng phương pháp thống kê Latent Semantic Indexing (LSI) để biểu diễn một văn bản bằng những concept Ontology được xây dựng... [24] vào năm 2001 Cuối cùng là OWL, ra đời vào năm 2003 do Dean Schreiber [25] đề xuất Đây là kết quả của nhóm nghiên cứu Web -Ontology (WebOnt) do W3C thành 16 lập vào năm 2001, mục tiêu của nhóm là nghiên cứu phát triển một ngôn ngữ đánh dấu mới dành cho web ngữ nghĩa OWL có hầu hết các chức năng của DAML+OIL 2.5 Ứng dụng Hình 2 Ba lĩnh vực ứng dụng của ontology [2] 2.5.1 Tìm Kiếm Thông Tin và. .. thiệu Ontology  Định nghĩa  Phân loại Ontology  Ứng dụng 2.1 Giới thiệu Ontology trở thành một lĩnh vực nghiên cứu phổ biến có mặt trong nhiều lĩnh vực từ xử lý ngôn ngữ tự nhiên, công nghệ tri thức, các hệ thống trao đổi, tích hợp thông tin cho đến biểu diễn quản lý tri thức Ontology cung cấp chia sẻ tri thức về một domain, giúp dễ dàng giao tiếp giữa người các hệ thống ứng dụng Ontology. .. của ontology 32 Chương 5 Chi tiết quy trình 6 bước rút trích ontology từ WWW khi áp dụng vào môi trường Website tiếng Việt 33 Hệ thống 34 35 Preparation 1 website được download về lưu trong local repository Trong đây, các page sẽ được check xem có thuộc về website hay không? Chi tiết - 1 webpage thuộc về 1 website nếu cùng bắt đầu giống với URL của trang homepage của website đó Ps là các tập hợp webpage... trong ontology làm nhân ban đầu Heyer Gerhard các đồng sự [34] dùng phương pháp thống kê dựa trên ngữ liệu lớn để rút trích ra các quan hệ ngữ nghĩa từ những văn bản không có cấu trúc Điểm khác ở đây là họ thống kê sự cùng xuất hiện các các cặp từ đưa ra độ do mức độ quan trọng của một cặp từ (significance measure) Bằng cách giữ nguyên một từ trong cặp từ, ta thu được một danh sách các cặp từ cùng... Giansalvatore, Paolo [38] Hasan, Srinivas, Saravanakumar [39] Han Hyoil Elmasri Ramez [40] 21 Phương pháp XLNNTN XLNNTN ThốngThốngThốngThốngThống kê Máy học Máy học Máy học Máy học Jörg-Uwe, Raphael, Alexander [41] Du C Timon, Li Feng, King Irwin [42] Kết hợp Máy học Bảng 3 Tóm tắt các công trình nghiên cứu có liên quan 3.2 Phương pháp dựa trên việc xử lý ngôn ngữ tự nhiên Hệ thống. .. đưa ra hệ thống RoadRunner [38], hệ thống này sẽ sản sinh tự động các wrapper tùy vào từng trang web cụ thể bằng cách so sánh các trang web HTML với nhau để xem sự giống khác nhau của chúng Hệ thống RoadRunner dựa vào một cặp trang web, trong đó chọn một trong số đó làm wrapper ban đầu, rồi dần dần làm mịn wrapper này bằng việc so sánh với trang còn lại (gọi là các mẫu) để xem sự khác biệt giống... của phương pháp: • Website được sử dụng phải thể hiện một chủ đề nhất định: Nhờ giả định này, các khái niệm được rút trích từ Website này sẽ cùng liên quan đến một chủ đề Điều này hoàn toàn phù hợp với định nghĩa ontology [ref đến phần đã viết ở trên] đảm bảo chất lượng ontology kết quả của phương pháp • Các trang web được viết bằng HTML: Phương pháp rút trích ontology từ WWW dựa vào cấu trúc các... Andreas Steinmetz Ralf [33] cũng sử dụng các tài liệu thu được từ web để làm giàu ontology có sẵn (ở đây nhóm tác giả sử dụng ontology thuộc về domain y khoa) đưa ra một phương pháp bán tự động với sự trợ giúp của kỹ sư về ontology (ontology engineer) Hệ thống sẽ sử dụng ngữ liệu thu được từ các kết quả tìm kiếm được từ web thông qua máy tìm kiếm Google để lập ra một tập hợp các khái niệm ứng viên . NHIÊNKHOA CÔNG NGHỆ THÔNG TINBỘ MÔN CÔNG NGHỆ PHẦN MỀMNGUYỄN HOÀN – HOÀNG XUÂN THẢONGHIÊN CỨU VÀ PHÁT TRIỂN HỆ THỐNG RÚT TRÍCH ONTOLOGYTỪ WEBKHÓA LUẬN TỐT. NHIÊNKHOA CÔNG NGHỆ THÔNG TINBỘ MÔN CÔNG NGHỆ PHẦN MỀMNGUYỄN HOÀN 0612109HOÀNG XUÂN THẢO 0612416NGHIÊN CỨU VÀ PHÁT TRIỂN HỆ THỐNG RÚT TRÍCH ONTOLOGYTỪ WEBKHÓA LUẬN

Ngày đăng: 16/01/2013, 15:30

Hình ảnh liên quan

DANH MỤC CÁC HÌNH - Nghiên cứu và phát triển hệ thống rút trích ontology từ web
DANH MỤC CÁC HÌNH Xem tại trang 9 của tài liệu.
DANH MỤC CÁC HÌNH - Nghiên cứu và phát triển hệ thống rút trích ontology từ web
DANH MỤC CÁC HÌNH Xem tại trang 9 của tài liệu.
DANH MỤC CÁC BẢNG - Nghiên cứu và phát triển hệ thống rút trích ontology từ web
DANH MỤC CÁC BẢNG Xem tại trang 10 của tài liệu.
DANH MỤC CÁC BẢNG - Nghiên cứu và phát triển hệ thống rút trích ontology từ web
DANH MỤC CÁC BẢNG Xem tại trang 10 của tài liệu.
Hình 2 Đồ thị của một phần ontology WordNet [14] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 2.

Đồ thị của một phần ontology WordNet [14] Xem tại trang 15 của tài liệu.
Hình 2 Các ngôn ngữ đánh dấu ontology [19] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 2.

Các ngôn ngữ đánh dấu ontology [19] Xem tại trang 16 của tài liệu.
Hình 2 Ba lĩnh vực ứng dụng của ontology [2] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 2.

Ba lĩnh vực ứng dụng của ontology [2] Xem tại trang 17 của tài liệu.
Hình 2 Kiến trúc chung của hệ thống OntoBroker [26] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 2.

Kiến trúc chung của hệ thống OntoBroker [26] Xem tại trang 18 của tài liệu.
Hình 2 Một đoạn trang web được gán nhãn bằng OntoBroker [26] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 2.

Một đoạn trang web được gán nhãn bằng OntoBroker [26] Xem tại trang 18 của tài liệu.
Hình 2 Market place sử dụng ontology [8] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 2.

Market place sử dụng ontology [8] Xem tại trang 20 của tài liệu.
Hình 3 Tổng quát thành phần xử lý ngôn ngữ tự nhiên của Hasti [31] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 3.

Tổng quát thành phần xử lý ngôn ngữ tự nhiên của Hasti [31] Xem tại trang 23 của tài liệu.
Hình 3 Thiết kế chung của phương pháp [32] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 3.

Thiết kế chung của phương pháp [32] Xem tại trang 24 của tài liệu.
Hình 3 Kiến trúc chung của hệ thống CRCTOL [35] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 3.

Kiến trúc chung của hệ thống CRCTOL [35] Xem tại trang 25 của tài liệu.
Hình 3 Một phần đồ thị hai phía sinh ra từ hệ thống [36] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 3.

Một phần đồ thị hai phía sinh ra từ hệ thống [36] Xem tại trang 26 của tài liệu.
Hình 3 Quy trình thu nhận Ontology [41] - Nghiên cứu và phát triển hệ thống rút trích ontology từ web

Hình 3.

Quy trình thu nhận Ontology [41] Xem tại trang 28 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan