Ứng dụng semantic web để xây dựng hệ thống tra cứu thông tin về văn hóa tây nguyên

13 765 3
Ứng dụng semantic web để xây dựng hệ thống tra cứu thông tin về văn hóa tây nguyên

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG PHẠM KHÁNH THIỆN ỨNG DỤNG SEMANTIC WEB ĐỂ XÂY DỰNG HỆ THỐNG TRA CỨU THÔNG TIN VỀ VĂN HÓA TÂY NGUYÊN Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60.48.01 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT Đà Nẵng - Năm 2011 2 Công trình ñược hoàn thành tại ĐẠI HỌC ĐÀ NẴNG Người hướng dẫn khoa học: PGS.TS Võ Trung Hùng Phản biện 1 : Phản biện 2 : . Luận văn sẽ ñược bảo vệ trước Hội ñồng chấm Luận văn tốt nghiệp thạc sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày …. tháng … năm ……. Có thể tìm hiểu luận văn tại: • Trung tâm Thông tin-Học liệu, Đại học Đà Nẵng • Trung tâm học liệu Đại học Đà Nẵng 3 MỞ ĐẦU 1. Lý do chọn ñề tài Web 2.0 là một bước ñột phá về công nghệ và ñã ñạt ñược những thành tựu rất ñáng kể trong việc nâng cao tính tương tác cũng như ñẩy nhanh tốc ñộ xử lý ñáp ứng yêu cầu của người dùng. Tuy nhiên trong xã hội thông tin ñương ñại nhu cầu của người dùng không dừng lại ở việc cải thiện tốc ñộ mà còn phải cải thiện chất lượng xử lý của trang web theo yêu cầu ngày càng nâng cao. Web 3.0 (Semantic web) ra ñời nhằm ñáp ứng những yêu cầu về chất lượng ñó. Với ñặc ñiểm chính là nâng cao khả năng chia sẻ tài nguyên và tăng “sự hiểu biết” trong quá trình xử lý dữ liệu của máy tính. Vì vậy Semantic web ñã ñi sâu vào phân tích và ñịnh hướng dữ liệu ñồng thời hỗ trợ phát triển ứng dụng Semantic web mở rộng trên nhiều lĩnh vực khác nhau. Một trong những lĩnh vực thế mạnh của Semantic web là xử lý và tìm kiếm thông tin. Việc phân tích và ñịnh hướng nội dung lưu trữ cho phép ta chúng ta xây dựng những cơ sở dữ liệu phục vụ tìm kiếm chính xác hơn. Mặc khác, việc máy tính có thể “hiểu” ñược dữ liệu sẽ giúp tìm ñược nhiều thông tin có liên quan ñến nội dung cần tìm. Khu vực Tây Nguyên hiện nay có nhiều dân tộc cùng chung sống. Đây không chỉ là ñịa bàn chiến lược về kinh tế, chính trị, an ninh quốc phòng mà còn là khu vực có hệ thống di sản văn hóa vật thể và phi vật thể phong phú, ñộc ñáo mang ñậm bản sắc văn hóa của các tộc người thiểu số. Cùng với việc ñầu tư phát triển kinh tế - xã hội, nâng cao ñời sống cho ñồng bào các dân tộc, công tác bảo tồn và phát huy những giá trị văn hóa của các dân tộc Tây nguyên, một trong bảy vùng văn hóa 4 lớn của ñất nước cũng ñang ngày càng ñược quan tâm. Song, hiện nay VHTN hầu hết ñược lưu giữ trong bảo tàng, trong sách, tài liệu, không ñược nhiều người biết ñến, trong khi nhu cầu giao lưu văn hóa, kinh tế, xã hội giữa các dân tộc, vùng miền là nhu cầu thường xuyên, lâu dài. Ngày nay, với sự phát triển của CNTT, các dịch vụ web ngày càng trở nên phổ biến thì việc xây dựng hệ thống tra cứu thông tin về VHTN là ñiều cần làm và cần có một hệ thống web thông minh hơn nhằm phục vụ cho việc tìm hiểu về VHTN, rút ngắn khoảng cách thông tin giữa ñồng bằng và miền núi, giữa các dân tộc, ñồng thời giới thiệu bản sắc văn hóa vùng Tây nguyên ñến với ñông ñảo người dân trên mọi miền tổ quốc và cả thế giới. Với những lí do trên tôi chọn ñề tài “Ứng dụng Semantic web ñể xây dựng hệ thống tra cứu thông tin về VHTN”. 2. Mục ñích nghiên cứu Mục ñích chính của ñề tài là kết hợp giữa việc nghiên cứu công nghệ Semantic web với nhu cầu khai thác những thông tin về văn hóa khu vực Tây Nguyên của người dùng. Đề tài phát triển theo hướng nâng cao chất lượng tìm kiếm tra cứu thông tin về văn hóa của các dân tộc Tây Nguyên. Xác ñịnh những yêu cầu của công việc là thực hiện ñể xây dựng một trang Semantic web ta thấy cần phải nghiên cứu và thực hiện các công việc sau: Về mặt thuyết, trước tiên ta cần tìm hiểu Semantic web. Tìm hiểu và chọn những công cụ ñể phát triển một cách hiệu quả nhất. Sau ñó ta cần phải ñưa ra ñược những ñiểm mờ và phân tích giải quyết nó ñể khi tiến hành xây dựng sẽ không gặp phải sự cố không mong ñợi. Về mặt phát triển ứng dụng ta cần xây dựng một trang web ñể ứng dụng tra cứu về văn hóa của các dân tộc Tây Nguyên. Chương trình phải ñáp ứng ñúng hai yêu cầu cốt lõi ñó là tìm kiếm chính xác hơn và tùy chọn tìm kiếm nhiều dữ liệu liên quan hơn. 3. Đối tượng và phạm vi nghiên cứu 5 - Tìm hiểu các lý thuyết về Semantic Web và VHTN. - Tìm hiểu, nghiên cứu các phương pháp xây dựng và lưu trữ dữ liệu trong Semantic Web, các công cụ dùng ñể thực hiện triển khai hệ thống thành chương trình như Visual Studio, các ngôn ngữ lập trình, các gói thư viện mở rộng. - Đề tài tập trung vào nghiên cứuứng dụng Semantic web vào lĩnh vực quản lý các thông tin về VHTN. Đồng thời xây dựng một chương trình minh họa dùng ñể tìm kiếm các thông tin về VHTN. 4. Phương pháp nghiên cứu Để thực hiện ñề tài này chúng tôi kết hợp hai nhóm phương pháp nghiên cứu chính, ñó là: - Phương pháp nghiên cứu lý thuyết. - Phương pháp nghiên cứu thực tế. 5. Ý nghĩa khoa học và thực tiễn của ñề tài - Về mặt khoa học, ñề tài nghiên cứu tiếp cận với công nghệ mới về xử lý thông tin của Semantic Web. Nghiên cứu ñề xuất hướng phát triển một ứng dụng ñảm bảo tính chính xác thông tin. - Về mặt thực tiễn, ứng dụng thành quả của công nghệ thông tin vào lĩnh vực văn hóa. Việc xây dựng hệ thống tra cứu thông tin về VHTN có ý nghĩa hết sức thiết thực trong việc tìm hiểu, nghiên cứu và gìn giữ bản sắc văn hóa các dân tộc vùng Tây Nguyên. 6. Cấu trúc của luận văn Nội dung của luận văn ñược chia thành 3 chương: Chương 1: Tổng quan về Semantic Web. Chương 2: Giải pháp xây dựng ứng dụng Semantic Web. Chương 3: Phát triển ứng dụng. 6 CHƯƠNG 1: TỔNG QUAN VỀ SEMANTIC WEB Trong chương này chúng tôi giới thiệu tổng quan nhất về WebSemantic web. Quy trình xây dựng một trang Semantic web, trong chương này chúng tôi cũng ñề cập ñến các công cụ hỗ trợ tốt nhất cho lĩnh vực Semantic web hiện nay cũng như các khái niệm về văn hóa, thực trạng và nhu cầu tra cứu về VHTN. 1.1. Semantic web 1.1.1. Giới thiệu về Semantic web 1.1.1.1. World wide web và những hạn chế của nó 1.1.1.2. Sự ra ñời của Semantic web 1.1.2. Quy trình xây dựng Semantic web Phần này tôi trình bày mô hình cải tiến của mô hình Noy và McGuinness : (1) Xác ñịnh mục ñích phát triển ontology. (2) Kỹ thuật nắm bắt ontology (ontology capture). (3) Xem xét sử dụng lại các ontology ñang tồn tại. (4) Mã hoá ontology (ontology coding). (5) Cải tiến ontology. (6) Tích hợp các ontology thành phần. (7) Kiểm thử. (8) Duy trì. 1.1.3. Một số ứng dụng có sẵn của Semantic web 1.1.3.1. Công cụ tìm kiếm Kngine Công cụ tìm kiếm Kngine dùng ñể tìm kiếm theo yêu cầu với việc phân tích ngữ nghĩa. Trang web này ñược chia thành các mục ñể người dùng có thể tìm kiếm trong miền nhỏ hơn, cho kết quả chính xác hơn. 1.1.3.2. Công cụ tìm kiếm Swoogle 7 Đây là công cụ tìm kiếm kết hợp giữa việc thu thập văn bản theo ngữ nghĩa (SWDs). Ứng dụng này khai thác thuật toán PageRank nên mặc dù phải truy xuất trên nhiều miền dữ liệu khác nhau nhưng vẫn có tốc ñộ tương ñối nhanh. 1.1.3.3. Công cụ tìm kiếm Hakia Hakia là công ty công nghệ tìm kiếm ngữ nghĩa. Nhiệm vụ của Hakia là triển khai các giải pháp tìm kiếm ngữ nghĩa ñể ñáp ứng những thách thức của người dùng với hiệu quả kinh doanh cao và chi phí thấp. 1.1.3.4. Trang web microformats. Microformats tập hợp dữ liệu trên các ñịnh dạng sẵn có hiện nay ñể phân tích và tái sử dụng. 1.2. Công cụ và công nghệ liên quan ñến Semantic web Trong phần này, chúng tôi trình bày sơ lược về các công cụ, công nghệ liên quan ñến Semantic web. 1.2.1. Công cụ xây dựng ontology Protégé 1.2.1.1. Bộ công cụ WebODE 1.2.1.2. Bộ công cụ OilED 1.2.1.3. Bộ công cụ Protégé 1.2.2. Truy vấn trên dữ liệu Semantic web 1.2.3. Thư viện phát triển ứng dụng 1.2.3.1. Jena – Một Framework của Semantic web 1.2.3.2. Công cụ hỗ trợ lập trình phát triển Semantic web trên nền tảng .NET 1.3. Văn hóa Tây Nguyên 1.3.1. Văn hóa và ñặc trưng VHTN 1.3.1.1. Khái niệm văn hóa 8 Văn hóa là từ thường ñược hiểu theo nghĩa rộng hẹp khác nhau. Trong hoạt ñộng giao tiếp hàng ngày, văn hóa ñược dùng theo nghĩa hẹp ñể chỉ học thức, lối sống. Văn hóa trong ñề tài này ñược hiểu theo nghĩa rộng, ñó là toàn bộ những gì do con người sáng tạo ra có tính giá trị, có thể là văn hoá vật thể, phi vật thể. 1.3.1.2. Đặc trưng VHTN Đặc trưng văn hóa của một dân tộc là những giá trị tiêu biểu về tinh thần và vật chất mà dân tộc ñó ñã tích lũy trong quá trình lịch sử, nó có tính bền vững, có ý nghĩa lâu dài, có giá trị khu biệt. Tây nguyên có nhiều thành phần dân tộc ñang sinh sống, nguồn gốc là các dân tộc thiểu số gồm: Ba Na, Xê ñăng, Gia Rai, Êñê, Giẻ-Triêng, BRâu, Rơ Mâm, K'Ho…, ñời sống của các dân tộc Tây Nguyên gắn với nương rẫy, tự cấp tự túc, phụ thuộc nhiều vào thiên nhiên cho nên họ sùng bái các lực lượng thiên nhiên, họ quan niệm những gì liên quan cuộc sống cũng có thần. Từ ñặc ñiểm ñó mà VHTN rất ña dạng và phong phú, với những ñặc trưng ñược chia từng loại như sau: Văn hóa lễ hội, luật tục, kiến trúc, nhạc cụ dân tộc, trang phục, ẩm thực, ngôn ngữ . 1.3.2. Nhu cầu việc tra cứu VHTN 1.3.3. Hiện trạng hệ thống phục vụ tra cứu VHTN Để có cơ sở xây dựng hệ thống mới, tôi tiến hành khảo sát hiện trạng hệ thống phục vụ tra cứu hiện tại theo 2 nguồn thông tin, ñó là nguồn thông tin trực tiếp các sở VH-TT&DL và qua mạng Google. Kết quả sau khi tiến hành khảo sát thực tế có thể nói chưa có 1 hệ thống phục vụ tra cứu thông tin VHTN hoàn hảo và ñầy ñủ thông tin ñể giúp người sử dụng có thể tra cứu mọi lúc mọi nơi một cách nhanh chóng, tiết kiệm chi phí. 9 CHƯƠNG 2: GIẢI PHÁP XÂY DỰNG ỨNG DỤNG SEMANTIC WEB Trong chương này chúng tôi trình bày các bước tìm hiểu về các yêu cầu của bài toán, phân tích và chọn giải pháp cũng như công nghệ ñể thực hiện bài toán từ ñó ñịnh hướng xây dựng một ứng dụng Semantic web tiện lợi nhất. 2.1. Giới thiệu bài toán Việc xây dựng một chương trình ứng dụng giải quyết một bài toán thực tế cần thực hiện rất nhiều công việc khác nhau, ta ñi vào công việc ñầu tiên là xác ñịnh các yêu cầu của bài toán. 2.1.1. Yêu cầu bài toán 2.1.1.1. Đặt vấn ñề  Đối tượng sử dụng Với nội dung của bài toán này ta thấy ñối tượng sử dụng là những người nghiên cứu, sinh viên các trường ñại học, cao ñẳng, học sinh các trường phổ thông và du khách…Trang web này mong muốn phát triển ñể liên kết với website của bộ VH-TT & DL cũng như website của các tỉnh, Sở VH-TT & DL của các tỉnh trong khu vực Tây Nguyên.  Yêu cầu bài toán Bài toán ñặt ra những yêu cầu xây dựng một trang web có chức năng hỗ trợ tìm kiếm thông tin về VHTN ñáp ứng các yêu cầu như: - Cho phép người dùng nhập dữ liệu ñộng. - Cho phéo người dùng có thể tùy chọn hướng truy xuất dữ liệu từ dân tộc, lễ lội, nhạc cụ,… - Trang tìm kiếm phải ñáp ứng hai chức năng chính ñó là tìm kiếm theo tên dân tộc và tìm kiếm theo tùy biến. - Tạo các trang web thông tin về các dân tộc, kiến trúc, lễ hội, nhạc cụ,… 10 2.1.1.2. Phân tích vấn ñề N ế u theo cá ch l ậ p trì nh v ớ i web 2.0 thì cá c thông tin liên quan ñế n m ộ t dân t ộ c có th ể bao g ồ m nh ữ ng thông tin nh ư “l ễ h ộ i”, “trang ph ụ c”, “ki ế n trúc”,… Nhì n t ổ ng quá t ta th ấ y cá ch nà y t ươ ng ñố i ổ n nh ư ng xé t chi ti ế t h ơ n ta th ấ y r ằ ng d ữ li ệ u củ a cá c bả ng thông tin liên quan r ấ t khó có th ể thay ñổ i. D ữ li ệ u quan h ệ gi ữ a cá c dân t ộ c cũ ng là m ộ t v ấ n ñề . V ớ i yêu c ầ u phé p ng ườ i dù ng thêm b ớ t cá c quan h ệ , ñ i ề u nà y cũ ng lạ i r ấ t khó th ự c thi v ớ i cá c h ệ quả n trị c ơ s ở d ữ li ệ u tr ướ c ñ ây. T ừ nh ữ ng khó kh ă n trên tôi ñư a ra g iả i phá p ñó là s ử dụ ng công ngh ệ Semantic web ñể giả i quy ế t bà i toá n. Công ngh ệ Semantic web v ớ i ñặ c ñ i ể m l ư u tr ữ d ữ li ệ u d ướ i ñị nh dạ ng XML và mô hình d ữ li ệ u thông minh nên vi ệ c l ư u tr ữ d ữ li ệ u có tí nh tù y bi ế n cao và h ỗ tr ợ tìm ki ế m nhanh, thông tin ch ấ t l ượ ng h ơ n. V ớ i công vi ệ c xá c ñị nh là phá t tri ể n m ộ t trang Semantic web tôi xây d ự ng ứ ng d ụ ng g ồ m 2 ph ầ n chính ñ ó là xây d ự ng ontology và thi ế t k ế xây d ự ng trình duy ệ t thông minh ñể hi ể n th ị k ế t qu ả .  Ontology Trong ph ầ n này chúng ta xây d ự ng các l ớ p, các thu ộ c tính t ạ o nh ữ ng m ố i quan h ệ ñồ ng c ấ p và phân c ấ p theo nh ữ ng chu ẩ n ñ ã ñượ c ñị nh ngh ĩ a b ở i t ổ ch ứ c W3C và c ả nh ữ ng ñị nh ngh ĩ a m ớ i riêng bi ệ t cho ch ươ ng trình.  Trình duyệt web Ph ầ n trình duy ệ t ta không xây d ự ng m ộ t trình duy ệ t m ớ i hoàn toàn ñ áp ứ ng ñầ y ñủ các yêu c ầ u truy c ậ p d ữ li ệ u ở b ấ t k ỳ ontology nào mà ta xây d ự ng trình duy ệ t t ươ ng t ự các ứ ng d ụ ng web nh ằ m hi ể n th ị thông tin c ơ s ở d ữ li ệ u ñ ã xây d ự ng. 2.1.2. Giải pháp 11 C ấ u trúc c ủ a m ộ t máy tìm ki ế m theo công ngh ệ Semantic web, v ề c ơ b ả n c ũ ng có c ấ u trúc t ươ ng t ự v ớ i m ộ t máy tìm ki ế m thông th ườ ng, bao g ồ m 2 thành ph ầ n chính là giao di ệ n truy v ấ n và ki ế n trúc bên trong. Giao diện truy vấn : - Cho phép người dùng nhập yêu cầu tìm kiếm - Hiển thị kết quả tìm kiếm Phần kiến trúc bên trong : là ph ầ n c ố t lõi c ủ a máy tìm ki ế m bao g ồ m các thành ph ầ n: - Phân tích yêu cầu - Tìm kiếm kết quả cho yêu cầu - Dữ liệu tìm kiếm, mạng ngữ nghĩa S ự khác bi ệ t trong c ấ u trúc c ủ a máy tìm ki ế m ng ữ ngh ĩ a so v ớ i tìm ki ế m thông th ườ ng n ằ m ở ph ầ n ki ế n trúc bên trong, c ụ th ể ở 2 ph ầ n: phân tích câu h ỏ i và t ậ p d ữ li ệ u tìm ki ế m. Mô hình ñượ c ñề xu ấ t trong lu ậ n v ă n cho ứ ng d ụ ng tìm ki ế m ng ữ ngh ĩ a nh ư sau: Hình 2.1. Mô hình ứng dụng tìm kiếm thông tin 2.1.3. Giải quyết yêu cầu 2.1.3.1. Suy luận dữ liệu Metadata Ontology Search Engine OWLDotNetAPI/SPARQ Web Browser 12 Semantic web h ỗ tr ợ suy lu ậ n d ữ li ệ u thông minh nh ằ m h ỗ tr ợ vi ệ c suy lu ậ n d ữ li ệ u theo quy t ắ c c ủ a ontology. Ngôn ng ữ Ontology h ỗ tr ợ r ấ t nhi ề u các suy lu ậ n khác nhau. Tuy nhiên, trong gi ớ i h ạ n c ủ a ñồ án này chúng tôi ch ỉ ñư a ra hai lo ạ i hình suy lu ậ n d ữ li ệ u sau:  Suy lu ậ n ngang c ấ p là suy lu ậ n d ự a trên cùng m ộ t thu ộ c tính c ủ a hai ñố i t ượ ng quan h ệ . Ví d ụ A là b ạ n c ủ a B thì B c ũ ng là b ạ n c ủ a A. Thu ộ c tính là bạn là thu ộ c tính hai chi ề u. Hình 2.2. Mô tả suy luận ngang cấp trong Semantic web  Suy lu ậ n ng ượ c là cách suy lu ậ n d ự a trên các thu ộ c tính khác nhau c ủ a hai ñố i t ượ ng. Ví d ụ A là b ố c ủ a B thì B là con c ủ a A. Thu ộ c tính là b ố và thu ộ c là con là hai thu ộ c tính ng ượ c nhau. Hình 2.3. Mô tả suy luận ngược trong Semantic web Ch ươ ng trình h ỗ tr ợ hai Properties c ơ b ả n là Properties ñả o ng ượ c và Properties t ươ ng ñươ ng. Thu ậ t toán Filling s ẽ tìm ki ế m t ấ t c ả các Người A Người B Khai báo thuộc tính là bạn của A và B Suy luận từ dữ liệu khai báo với thuộc tính là bạn của B và A Người A Người B Khai báo thuộc tính là bố của A và B Suy luận từ dữ liệu khai báo với thuộc tính là con của B và A 13 thông tin ch ư a ñượ c khai báo ñể ñ i ề n ñầ y ñủ thông tin ph ụ c v ụ yêu c ầ u tìm ki ế m. 2.1.3.2. Các chức năng chính Ch ứ c n ă ng c ơ b ả n c ủ a ứ ng d ụ ng là tìm ki ế m, vi ệ c áp d ụ ng k ỹ thu ậ t tìm ki ế m trên Ontology s ẽ tr ả v ề nh ữ ng k ế t qu ả chính xác h ơ n nh ờ nh ữ ng ư u ñ i ể m v ề l ư u tr ữ d ữ li ệ u RDF so v ớ i d ữ li ệ u truy ề n th ố ng, có cách t ổ ch ứ c d ữ li ệ u ñơ n gi ả n, ñồ ng nh ấ t, c ấ u trúc b ộ ba giúp d ễ truy xu ấ t thông tin b ở i các h ệ th ố ng suy lu ậ n.  Duyệt theo ngữ nghĩa Duy ệ t cây phân c ấ p, theo lo ạ i hình d ị ch v ụ : cung c ấ p cách tìm ki ế m ñị a ñ i ể m theo phân c ấ p trên cây Ontology. Ng ườ i dùng không c ầ n nh ậ p thông tin tìm ki ế m mà v ẫ n có th ể tìm ki ế m ñượ c tài li ệ u c ầ n thi ế t b ằ ng cách duy ệ t cây theo lo ạ i hình d ị ch v ụ .  Tìm kiếm theo từ khóa Cách tìm ki ế m ph ổ bi ế n và có nhu c ầ u nhi ề u nh ấ t là tìm ki ế m theo t ừ khóa. T ừ khóa chính là t ừ g ợ i ý ñể so sánh nó v ớ i các thông tin c ủ a d ữ li ệ u qua ñ ó s ẽ tìm ra k ế t qu ả c ầ n thi ế t.  Tìm kiếm nâng cao H ệ th ố ng ñư a ra m ộ t s ố tùy ch ọ n làm ñ i ề u ki ệ n ng ườ i dùng d ự a vào m ộ t s ố g ợ i ý ñ ó ñể ñư a ra ñ i ề u ki ệ n phù h ợ p v ớ i yêu c ầ u c ủ a mình. S ử d ụ ng cách tìm ki ế m nâng cao s ẽ có k ế t qu ả chính xác h ơ n. 2.2. Các công cụ hỗ trợ 2.2.1. Công cụ xây dựng ứng dụng Protégé 2.2.1.1. Đặc ñiểm của Protégé Đ ây là ph ầ n m ề m mi ễ n phí và ñượ c phát tri ể n b ở i tr ườ ng Đạ i h ọ c Stanford và Mark Musen. Ch ứ c n ă ng n ổ i b ậ t nh ấ t c ủ a ph ầ n m ề m này là cho phép ng ườ i dùng s ử dụ ng t ạ o ra các ontology ñể phát tri ể n Semantic web theo ñ úng chu ẩ n c ủ a ngôn ng ữ W3C OWL. 14 2.2.1.2. Protégé sử dụng giao diện ñồ họa Ph ầ n m ề m h ỗ tr ợ ng ườ i s ử dụ ng l ậ p trì nh t ươ ng tá c b ằ ng giao di ệ n m ộ t cá ch nhanh chó ng, phù h ợ p gi ữ a suy nghĩ củ a ng ườ i l ậ p trì nh và n ộ i dung mà cá c l ớ p Protégé tạ o ra. 2.2.1.3. Protégé phát triển ñể tích hợp các công cụ Protégé cung c ấ p m ộ t s ố ñ i ể m m ở r ộ ng n ơ i các nhà phát tri ể n có th ể ch ủ ñộ ng thêm các thành ph ầ n mà ta th ườ ng g ọ i là plug-ins. 2.2.2. Bộ Visual Studio.Net Visual Studio.NET là m ộ t môi tr ườ ng tích h ợ p tri ể n khai ph ầ n m ề m. Nó ñượ c thi ế t k ế ñể l ậ p ra m ộ t ti ế n trình vi ế t mã, g ỡ r ố i và biên d ị ch thành m ộ t assembly d ễ dàng. Visual Studio.NET có m ộ t ứ ng d ụ ng multiple-document-interface r ấ t tinh vi, qua ñ ó ng ườ i dùng có th ể liên k ế t m ọ i th ứ ñể phát tri ể n ñ o ạ n mã c ủ a mì nh, bao g ồ m: Text Editor : cho phé p vi ế t ñ o ạ n mã C#. Design view editor : nó cho phép ñặ t giao di ệ n ng ườ i dùng và các control d ữ li ệ u truy c ậ p trong d ự án. Các cửa sổ hỗ trợ : cho phép xem và s ử a ñổ i nh ữ ng khía c ạ nh khác nhau trên d ự án. Biên dịch trong lòng môi trường : ñể thay cho vi ệ c ch ạ y trình biên d ị ch C# t ừ dòng l ệ nh. Intergated MSDN help : Visual studio.NET có th ể g ọ i tài li ệ u MSDN. 2.2.3. Thư viện phát triển ứng dụng Trong ph ầ n nà y sẽ trình bày v ề hai công cụ h ỗ tr ợ ng ườ i l ậ p trì nh phá t tri ể n Semantic web d ự a trên n ề n t ả ng .NET mà tôi ñ ã l ự a ch ọ n ñể th ự c hi ệ n ñề tài. 2.2.3.1. SemWeb 15 SemWeb v ớ i các tính n ă ng c ố t lõi nh ư ñọ c/ghi d ữ li ệ u XML v ớ i b ộ ba RDF, liên t ụ c l ư u tr ữ d ữ li ệ u v ớ i n ề n t ả ng SQL và các truy v ấ n SPARQL c ơ b ả n ñã ñượ c ki ể m nghi ệ m nhi ề u l ầ n.  Giấy phép Đ ây là b ả n mã ngu ồ n m ở , ñượ c s ử d ụ ng mi ễ n phí.  Đặc ñiểm của Semweb M ộ t s ố ñặ c ñ i ể m n ổ i tr ộ i ñ ó là t ố c ñộ x ử lý và kh ả n ă ng giao ti ế p v ớ i các c ơ s ở d ữ li ệ u liên k ế t ñể truy c ậ p d ữ li ệ u. 2.2.3.2. OwlDotNetApi OwlDotNetApi là m ộ t OWL API v ớ i b ộ phân tích cú pháp vi ế t b ằ ng C# theo công ngh ệ .NET d ự a trên phân tích cú pháp RDF Drive. Hoàn toàn phù h ợ p v ớ i ñặ c ñ i ể m k ỹ thu ậ t c ủ a W3C.  Chức năng M ụ c tiêu c ủ a OwlDotNetApi là ñọ c/ghi d ữ li ệ u c ủ a XML d ự a trên ñồ th ị v ớ i các c ạ nh t ươ ng ứ ng v ớ i thu ộ c tính liên k ế t và các ñỉ nh t ươ ng ứ ng v ớ i các nút hay còn g ọ i là các l ớ p. Xu ấ t phát t ừ vi ệ c ñồ th ị hoá n ộ i dung c ủ a d ữ li ệ u nên OwlDotNetApi ñ áp ứ ng ñượ c h ầ u h ế t t ấ t c ả các chu ẩ n mà W3C ñư a ra. Tuy nhiên vi ệ c truy c ậ p d ữ li ệ u không thông qua câu l ệ nh truy v ấ n nên vi ệ c l ậ p trình v ớ i th ư vi ệ n này ch ư a thu ậ n l ợ i v ề th ờ i gian x ử lý. OwlDotNetApi có hai ph ầ n chính là l ớ p ch ứ c n ă ng và l ớ p giao ti ế p. 2.2.3.3. Ví dụ Ph ầ n này s ẽ gi ớ i thi ệ u s ố l ệ nh c ơ b ả n trong th ư vi ệ n này. 16 CHƯƠNG 3: PHÁT TRIỂN ỨNG DỤNG Đ ây là ch ươ ng t ổ ng h ợ p và là câu tr ả l ờ i chính xác nh ấ t ñầ y ñủ nh ấ t cho nh ữ ng gì chúng tôi ñ ã trình bày ở 2 ch ươ ng tr ướ c. 3.1. Mô hình hoạt ñộng của hệ thống Ứ ng d ụ ng ñượ c vi ế t trên n ề n web nên vi ệ c qu ả n lý c ậ p nh ậ t, hi ệ u ch ỉ nh thông tin c ủ a ng ườ i qu ả n tr ị c ũ ng nh ư vi ệ c truy xu ấ t và tìm ki ế m d ữ li ệ u c ủ a ng ườ i dùng ñầ u cu ố i ñề u thông qua m ạ ng internet. Ở ñ ây ng ườ i duy ệ t web ñ óng vai trò trung gian theo s ơ ñồ x ử lý sau: Hình 3.1. Quy trình truy xuất dữ liệu 3.2. Quy trình xây dựng ứng dụng Để thi ế t k ế công c ụ tìm ki ế m ng ữ ngh ĩ a ứ ng d ụ ng trên, lu ậ n v ă n ñề xu ấ t mô hình h ỗ tr ợ vi ệ c tìm g ồ m các công ñ o ạ n sau: - Giai ñoạn 1 : Thiết kế Ontology - Giai ñoạn 2: Xây dựng ứng dụng Xử lý truy vấn Hiển thị kết quả Câu truy vấn Thông tin trả về Ontology Nhận câu truy vấn Gởi yêu cầu Nhận kết quả 17 3.3. Xây dựng ontology Ontology là n ề n t ả ng ñể xây d ự ng d ữ li ệ u cho ứ ng d ụ ng. D ữ li ệ u trên ontology có th ể là n ộ i dung thông tin c ũ ng có th ể là liên k ế t ñế n các ontology khác có chung k ế t n ố i. Trong n ộ i dung c ủ a ñề tài này chúng tôi ch ỉ ñề c ậ p ñế n v ấ n ñề xây d ự ng thông tin và s ử d ụ ng l ạ i thông tin ñ ó theo mô hình Semantic web mà ch ư a m ở r ộ ng ra các thông tin trên nh ữ ng ontology có s ẵ n trên internet. 3.3.1. Mô hình biểu diễn Ontology V ớ i m ụ c ñ ích chia nh ỏ thông tin ñể qu ả n lý chúng tôi ti ế n hành xây d ự ng các ñố i t ượ ng ñượ c phân chia thành các l ớ p, các cá th ể và các m ố i quan h ệ . Trong ontology này t ấ t c ả các thông tin v ề VHTN s ẽ ñượ c phân rã và l ư u tr ữ d ướ i các d ạ ng khác nhau. 3.3.2. Thực hiện xây dựng HignOnt Vi ệ c xây d ự ng ontology t ươ ng t ự nh ư cách nh ậ p d ữ li ệ u vào c ơ s ở d ữ li ệ u. Phân tích các ñối tượng của ứng dụng tôi chia thành các ñối tượng: - Lớp : DanToc, VanHoa, NgonNgu, NghienCuu - Thuộc tính: CuaDanToc, … - Cá thể: Kinh, BaNa… Hình 3.2. Các phân cấp lớp trong HighlandResource Ontology 18 3.3.2.1. Lớp - Lớp DanToc trong HignOnt dùng ñể lưu các cá thể là các dân tộc thuộc VHTN. Các cá thể dân tộc ñều là con của lớp này. Lớp này là lớp nhỏ nhất và không ñược chia thành các lớp con. - Lớp VanHoa : thể hiện thông tin các loại hình văn hóa của các dân tộc tây nguyên. Lớp này có thể chứa các cá thể hoặc các lớp con tương ứng với dữ liệu thành phần của VHTN. Trong ñề tài này chúng tôi chia thành các lo ạ i hình v ă n hóa t ươ ng ứ ng v ớ i các l ớ p con nh ư sau: L ớ p KienTruc, L ớ p NhacCu, L ớ p LeHoi . - Lớp NgonNgu thể hiện thông tin các loại hình ngôn ngữ mà các dân tộc sử dụng hoặc ngôn ngữ của các công trình nghiên cứu về VHTN. Lớp này không ñược chia nhỏ thành các lớp con. - Lớp nghienCuu mô tả thông tin của các công trình nghiên cứu về VHTN. 3.3.2.2. Thuộc tính Các thu ộ c tính th ể hi ệ n m ố i quan h ệ gi ữ a các ñố i t ượ ng d ữ li ệ u (individual) v ớ i nhau ho ặ c quan h ệ v ớ i d ữ li ệ u. Ngôn ng ữ ontology chia thu ộ c tính ra thành hai lo ạ i khác nhau là thu ộ c tính quan h ệ và thu ộ c tính d ữ li ệ u. Trong ứ ng d ụ ng này ta phát tri ể n ứ ng d ụ ng v ớ i các thu ộ c tính sau:  Thuộc tính dữ liệu Đ ây là m ộ t s ố thu ộ c tính d ữ li ệ u c ơ b ả n có trong ch ươ ng trình. - Thuộc tính coTieuDe thể hiện một công trình nghiên cứu tiêu ñề cụ thể là gì và ñược quy ñịnh là kiểu dữ liệu chuỗi. - Thuộc tính coNoiDung thể hiện một công trình có thông tin nội dung xác ñịnh và ñược quy ñịnh kiểu dữ liệu văn bản. - Thuộc tính namXuatBan thể hiện năm xuất bản của công trình nghiên cứu cụ thể. Thuộc tính này kiểu số. 19 - Thuộc tính coTen thể hiện thông tin tên của một dân tộc, loại nhạc cụ, loại hình kiến trúc…và tên có kiểu dữ liệu là chuỗi. - Thuộc tính diaDiem thể hiện nơi lưu trữ của một công trình nghiên cứu hoặc thông tin cư trú của một dân tộc. Hình 3.3. Các thu ộ c tính d ữ li ệ u trong ứ ng d ụ ng  Thuộc tính quan hệ Đ ây là m ộ t s ố thu ộ c tính quan h ệ c ơ b ả n có trong ch ươ ng trình. - Thuộc tính veDanToc khai báo công trình nghiên cứu về tây nguyên cụ thể ñang xét có liên quan ñến dân tộc nào. Thuộc tính này thể hiện mối quan hệ giữa một nghiên cứu cụ thể và các dân tộc. - Thuộc tính duaTrenNgonNgu thể hiện mối liên quan giữa công trình nghiên cứu ñó với các ngôn ngữ thể hiện trên các báo cáo, các bài báo liên quan… - Thuộc tính veLoaiHinhVanHoa thể hiện mối quan hệ giữa công trình nghiên cứu ñó về loại hình văn hóa nào. 20 Hình 3.4. Các thu ộ c tính quan h ệ trong ứ ng d ụ ng 3.3.2.3. Cá thể Các cá th ể là các thông tin chính th ể hi ệ n n ộ i dung d ữ li ệ u c ủ a ứ ng d ụ ng. Trong ứ ng d ụ ng này tôi ch ỉ ñư a ra m ộ t s ố cá th ể tiêu bi ể u cho t ừ ng nhóm l ớ p và th ể hi ệ n ñượ c m ố i quan h ệ gi ữ a các ñố i t ượ ng. - Cá thể DT_Kinh lưu thông tin về dân tộc kinh mà ứng dụng cần có liên quan ñến dân tộc này. Người quản trị có thể thêm vào các thông tin chưa ñược khai báo mà người dùng yêu cầu. - Cá thể NN_Viet lưu thông tin về ngôn ngữ Tiếng Việt. Đây là cá thể chứa thông tin và thể hiện mối quan hệ với các cá thể khác sẽ ñược giới thiệu bên dưới. - Cá thể VH_KT_NhaRong lưu thông tin về loại hình văn hóa nhà rông của tây nguyên. Cá thể này là con của lớp Kiến trúc thuộc lớp Văn Hóa. <owl:DanToc rdf:about="#DT_Kinh"> <rdf:type rdf:resource="&owl;Thing"/> <rdfs:label>Dân tộc kinh</rdfs:label> <rdfs:comment>lưu thông tin về dân tộc kinh như tên gọi là kinh…</rdfs:comment> <diaDiem>Tất cả vùng miền thuộc ñất nước Việt Nam</diaDiem> </owl: DanToc >

Ngày đăng: 31/12/2013, 10:21

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan