XÂY DỰNG hệ THỐNG hỗ TRỢ tìm KIẾM tài LIỆU THEO NGỮ NGHĨA CHO THƯ VIỆN TRƯỜNG cđ KTKT TP HCM

61 198 0
XÂY DỰNG hệ THỐNG hỗ TRỢ tìm KIẾM tài LIỆU THEO NGỮ NGHĨA CHO THƯ VIỆN TRƯỜNG cđ KTKT TP HCM

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

ĐẠI HỌC QUỐC GIA TP HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN  LÊ THỊ THU THẢO XÂY DỰNG HỆ THỐNG HỖ TRỢ TÌM KIẾM TÀI LIỆU THEO NGỮ NGHĨA CHO THƯ VIỆN TRƯỜNG CĐ KTKT TP.HCM KHÓA LUẬN CAO HỌC NGÀNH KHOA HỌC MÁY TÍNH Mã số: 60.48.01.01 NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS ĐỖ VĂN NHƠN TP HỒ CHÍ MINH – NĂM 2016 LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu thân Các số liệu, kết trình bày khóa luận trung thực Những tư liệu sử dụng khóa luận có nguồn gốc trích dẫn rõ ràng, đầy đủ Người thực Lê Thị Thu Thảo MỤC LỤC Trang Mục lục Danh mục bảng Danh mục hình vẽ Danh mục ký hiệu, chữ viết tắt Mở đầu CHƯƠNG TỔNG QUAN 1.1 Giới thiệu tổng quan vấn đề nghiên cứu 1.1.1 Thực trạng nhu cầu xây dựng hệ thống hỗ trợ tìm kiếm tài liệu theo ngữ nghĩa cho thư viện Trường CĐ KTKT TP.HCM 1.1.2 Khảo sát số giải pháp ứng dụng tìm kiếm tài liệu thư viện 13 1.2 Mục tiêu nghiên cứu 15 1.3 Đối tượng nghiên cứu 15 1.4 Phạm vi nghiên cứu 16 1.5 Ý nghĩa thực tiễn đề tài 16 CHƯƠNG CƠ SỞ LÝ THUYẾT 17 2.1 Hệ thống tìm kiếm thông tin 17 2.1.1 Cấu trúc hệ thống tìm kiếm thơng tin 17 2.1.2 Phân loại hệ thống tìm kiếm thơng tin 18 2.1.2.1 Hệ thống tìm kiếm thơng tin dựa từ khóa 18 2.1.2.2 Hệ thống tìm kiếm thơng tin dựa khái niệm hay ngữ nghĩa 18 2.1.3 Các phương pháp tìm kiếm thơng tin 19 2.1.3.1 Tìm kiếm thơng tin theo hướng tiếp cận thống kê 19 2.1.3.2 Tìm kiếm thông tin theo hướng ngữ nghĩa 20 2.1.4 Đánh giá hệ thống tìm kiếm thông tin 21 2.2 Ontology 22 2.2.1 Khái niệm Ontology 22 2.2.2 Định nghĩa Ontology 22 2.2.3 Thành phần Ontology 23 2.2.4 Phân loại ontology 24 2.2.5 Vai trò Ontology 24 2.2.6 Các hướng tiếp cận xây dựng ontology 25 2.2.7 Phương pháp xây dựng Ontology 26 2.2.7.1 Xây dựng Ontology 26 2.2.7.2 Ngôn ngữ xây dựng Ontology 26 CHƯƠNG MÔ HÌNH VÀ CƠNG CỤ PHÁT TRIỂN 28 3.1 Mơ hình Ontology cho ngữ nghĩa tài liệu 28 3.1.1 Tập hợp K keyphrase 28 3.1.2 Tập hợp C lớp keyphrase 28 3.1.3 Tập hợp RKC quan hệ keyphrase lớp 29 3.1.4 Tập hợp RCC quan hệ lớp 29 3.1.5 Tập hợp RKK quan hệ keyphrase 30 3.2 Công cụ xây dựng ontology 31 3.3 Thư viện Lucene 32 3.4 Công cụ tách từ tiếng Việt vnTokenizer 35 3.5 Công cụ gán nhãn từ loại tiếng Việt vnTagger 37 CHƯƠNG CÀI ĐẶT ỨNG DỤNG 38 4.1 Thiết kế hệ thống 38 4.1.1 Mục tiêu ứng dụng 38 4.1.2 Yêu cầu chức hệ thống 38 4.1.2.1 Yêu cầu hệ thống 38 4.1.2.2 Chức hệ thống 38 4.1.3 Cấu trúc hệ thống 39 4.2 Cài đặt ứng dụng 40 4.2.1 Môi trường cài đặt 40 4.2.1.1 Phần cứng 40 4.2.1.2 Phần mềm 40 4.2.2 Xây dựng Ontology 40 4.2.2.1 Thiết kế lớp 41 4.2.2.2 Thuộc tính lớp 43 4.2.2.3 Các mối quan hệ 43 4.2.2.4 Xây dựng thực thể 48 4.2.3 Xây dựng thành phần tạo mục 48 4.2.4 Xây dựng thành phần truy vấn 48 4.3 Giao diện chương trình 52 4.3.1 Màn hình tìm kiếm xác 52 4.3.2 Màn hình tìm kiếm theo ngữ nghĩa 52 4.4 Kết thử nghiệm 54 CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 56 5.1 Kết đạt 56 5.2 Hạn chế 56 5.3 Hướng phát triển 57 TÀI LIỆU THAM KHẢO 58 DANH MỤC CÁC BẢNG Bảng 3.1 Ví dụ quan hệ “thuộc về” Bảng 3.2 Mối quan hệ lớp sơ đồ phân cấp Bảng 3.3 Các loại quan hệ keyphrase Bảng 3.4 Bảng thẻ từ loại Bảng 4.1 Bảng mô tả lớp Bảng 4.2 Một số tính đối tượng, biến sử dụng chương trình Bảng 4.3 Thống kê kết tìm kiếm thử nghiệm DANH MỤC CÁC HÌNH VẼ Hình 1.1 Trang web tra cứu tài liệu thư viện trường CĐ KTKT TPHCM Hình 1.2 Phiếu đăng ký mượn sách dành cho học sinh sinh viên Hình 1.3 Phiếu đăng ký mượn sách dành cho cán bộ, giáo viên, nhân viên Hình 1.4 Màn hình kết tra cứu sách Hình 2.1 Cấu trúc hệ thống tìm kiếm thơng tin Hình 2.2 Các phương pháp tìm kiếm thơng tin Hình 3.1 Ví dụ sơ đồ phân cấp Hình 3.2 Các thành phần ứng dụng tìm kiếm Hình 3.3 Tiến trình lập mục 10 Hình 3.4 Qui trình chuyển đổi nội dung tìm kiếm 11 Hình 3.5 Tiến trình phân tích q trình lập mục 12 Hình 3.6 Quy trình tách từ 13 Hình 4.1 Cấu trúc tổng quát hệ thống 14 Hình 4.2 Minh họa lớp Ontology 15 Hình 4.3 Minh họa quan hệ phân cấp lớp 16 Hình 4.4 Quy trình xử lý hệ thống tìm kiếm 17 Hình 4.5 Màn hình tìm kiếm xác 18 Hình 4.6 Màn hình tìm kiếm theo ngữ nghĩa 19 Hình 4.7 Màn hình tìm kiếm theo ngữ nghĩa dùng tốn tử AND 20 Hình 4.8 Màn hình tìm kiếm theo ngữ nghĩa dùng toán tử OR DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT CĐ KTKT: Cao đẳng kinh tế kỹ thuật CNTT : Công nghệ thông tin CSDL : Cơ sở liệu IR : Information Retrieval MỞ ĐẦU Ngày nay, với vận động phát triển khơng ngừng ngành khoa học máy tính, việc đưa tri thức người vào máy tính vấn đề nhiều người quan tâm Ngày có nhiều hệ thống xây dựng để hỗ trợ thay người nhiều lĩnh vực khác giáo dục, y học, toán học, cơng nghệ, hóa học, địa chất, khoa học máy tính, tài chính, kinh doanh, quốc phòng Xuất phát từ mục tiêu áp dụng công nghệ tri thức vào thực tiễn, kết hợp với nhu cầu cần cải thiện hệ thống tra cứu thông tin cho thư viện Trường Cao đẳng KTKT TP.HCM, chọn đề tài “Xây dựng hệ thống hỗ trợ tìm kiếm tài liệu theo ngữ nghĩa cho thư viện Trường Cao đẳng KTKT TP.HCM” để làm khóa luận tốt nghiệp Thạc sĩ Xin chân thành cảm ơn quý thầy cô trường Đại học Cơng Nghệ Thơng Tin tận tình dạy bảo cung cấp cho tơi nhiều kiến thức bổ ích suốt thời gian học tập trường Đặc biệt, tơi xin chân thành cảm ơn Phó giáo sư tiến sĩ Đỗ Văn Nhơn, người thầy tận tâm, nhiệt tình hướng dẫn bảo cho tơi suốt trình thực đề tài Xin cảm ơn bạn bè, đồng nghiệp động viên, giúp đỡ đóng góp nhiều ý kiến q báu, giúp tơi hồn thiện đề tài Và cuối cùng, xin cảm ơn tác giả báo cáo nghiên cứu khoa học mà tơi tham khảo tìm hiểu để thực đề tài Khóa luận hồn thành với số kết định nhiên không tránh khỏi nhiều thiếu sót Kính mong đóng góp ý kiến từ quý thầy cô bạn Học viên thực Lê Thị Thu Thảo Chương Tổng quan CHƯƠNG TỔNG QUAN 1.1 Giới thiệu tổng quan vấn đề nghiên cứu 1.1.1 Thực trạng nhu cầu xây dựng hệ thống hỗ trợ tìm kiếm tài liệu theo ngữ nghĩa cho thư viện Trường CĐ KTKT TP.HCM Cùng với phát triển mạnh mẻ công nghệ thông tin, hệ thống giáo dục năm qua có đổi phát triển đáng kể Các ứng dụng công nghệ thông tin vào lĩnh vực giáo dục phải kể đến như: - Ứng dụng quản lý giáo dục: quản lý sinh viên, quản lý giảng viên, quản lý hồ sơ, quản lý trang thiết bị, quản lý thư viện, … - Các ứng dụng hỗ trợ giảng dạy, học tập - Các lớp học trực tuyến, chương trình đào tạo từ xa - Các kho chứa tài nguyên học tập - … Trong giáo dục tiến thư viện khơng thể tách rời với dạy học Thư viện nơi bổ sung, cập nhật kiến thức mới, mở rộng cho sinh viên lĩnh vực tri thức so với khuôn khổ qui định nội dung, chương trình kế hoạch đào tạo nhà trường Thư viện cầu nối thông tin người sử dụng Thư viện yếu tố quan trọng, thước đo đánh giá vai trò, chức năng, nhiệm vụ, hiệu đào tạo trường học Do trường học cơng tác thơng tin thư viện giữ vai trò đặc biệt quan trọng thiếu Việc khai thác hiệu thông tin thư viện trở thành nhiệm vụ hàng đầu công tác thư viện trường học [1] Qua khảo sát thực tế Trường CĐ KTKT TP.HCM, thư viện có 18000 đầu sách với 58000 sách thuộc nhiều chuyên ngành, số lượng học sinh sinh viên cán giáo viên đến mượn sách tra cứu thông tin tài liệu thư viện trường hàng ngày đơng Tuy có quy mơ vậy, hầu hết việc quản lý thư viện lại thực thủ công bán thủ công Chương Cài đặt ứng dụng ObjectProperty: laKeyphraseCua SubClassOf: KeyPhrare CoKhi DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf: KeyPhrare Dien DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf: KeyPhrare QTKD DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf: KeyPhrare MTKTT DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf: KeyPhrare 10 ThietKeWeb DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k01_001,k01_002,k01_003,…} 11 DoHoa DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k02_001,k02_002,k02_003,…} 12 THVP DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k03_001,k03_002,k03_003,…} 13 HDH DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k04_001,k04_002,k04_003,…} 45 Chương Cài đặt ứng dụng 14 TuDienTH DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k05_001,k05_002,k05_003,…} 15 TTNT DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k06_001,k06_002,k06_003,…} 16 CSDL DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k07_001,k07_002,k07_003,…} 17 LapTrinh DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k08_001,k08_002,k08_003,…} 18 MangMT DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k09_001,k09_002,k09_003,…} 19 PhanCung DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k10_001,k10_002,k10_003,…} 20 ToanRR DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k11_001,k11_002,k11_003,…} 21 CNPM DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT 46 Chương Cài đặt ứng dụng Sach={k12_001,k12_002,k12_003,…} 22 PTTKHT DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k13_001,k13_002,k13_003,…} 23 CTDL DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k14_001,k14_002,k14_003,…} 24 LTDT DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:CNTT Sach={k15_001,k15_002,k15_003,…} 25 TKMH3D DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf:DOHOA Sach={k21_001,k21_002,k21_003,…} 26 TKA2D DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf: DOHOA Sach={k23_001,k23_002,k23_003,…} 27 HoatHinh2D DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf: DOHOA Sach={k24_001,k24_002,k24_003,…} 28 XuLyAnh DataProperty: key_phrase ObjectProperty: laKeyphraseCua SubClassOf: DOHOA Sach={k22_001,k22_002,k22_003,…} 47 Chương Cài đặt ứng dụng 4.2.2.4 Xây dựng thực thể - Thực thể Tác giả: 117 - Thực thể Nhà xuất bản: 38 - Thực thể Sách: 200 - Thực thể keyphrase: 450 4.2.3 Xây dựng thành phần tạo mục Thành phần tạo mục bao gồm chức định liệu lập mục, thực phân tích tài liệu, tạo mục lưu trữ xuống tập mục Thành phần dựa lớp có sẵn Lucene phát triển số lớp bổ sung cho việc phân tích hỗ trợ ngơn ngữ Tiếng Việt, giao diện người dùng… 4.2.4 Xây dựng thành phần truy vấn Thành phần truy vấn bao gồm chức như: nhận thơng tin truy vấn, biên dịch tìm kiếm, trình bày kết liên kết đến tài liệu gốc… lớp biên dịch truy vấn tìm kiếm dựa thành phần có sẵn Lucene 48 Chương Cài đặt ứng dụng Hình 4.4 Quy trình xử lý hệ thống tìm kiếm • Chuẩn bị liệu cho hệ thống tìm kiếm thực qua bước: Đọc file ontology Tạo liệu từ file ontology: CreateNodes Tạo mục tìm kiếm: IndexReader, IndexWriter Trong đó: - Bước 3: Lucene hỗ trợ - Bước 2: xây dựng • Quy trình xử lý hệ thống tìm kiếm thực qua bước: Người dùng nhập câu truy vấn từ giao diện hình Xử lý tách từ cho câu truy vấn: VietTokenizer _tokenizer Xử lý gán nhãn từ cho câu truy vấn: VietnameseTagger 49 Chương Cài đặt ứng dụng Thực loại bỏ từ vô nghĩa, dư thừa: querryTagger Xây dựng câu truy vấn Lucene: MultiFieldQueryParser a Sử dụng IndexWriter vào việc phân tích lưu trữ Lucene b Sử dụng IndexReader vào việc tìm kiếm Lucene Thực tìm kiếm: LuceneSearch Đánh giá kết tìm kiếm xếp hạng kết tìm kiếm: TopDoc Sắp xếp kết trình bày: TopDoc.Sort(score) Hiển thị kết tìm kiếm lên hình Trong đó: - Các bước 5, 6, 7: Lucene hỗ trợ - Các bước 2, 3, 4, 8: xây dựng • Một số tính đối tượng, biến sử dụng: Bảng 4.2 Một số tính đối tượng, biến sử dụng chương trình STT Tên baseM: OWLManager owlOntology: OWLOntology searchFactory: SearchFactory indexManager: IndexManager indexManager query vnTokenizer vnTagger Mô tả Đối tượng gọi đến thao tác quản lý Ontology Đối tượng chứa nội dung tập tin owl Ở Sach_v04 Đối tượng lớp bọc lớp ontology Ở class Sach, TacGia, NXB, chuyên mục CNTT, DoHoa… Đối tượng xây dựng lớp ứng dụng thư viện Lucene Kết nối tool Lucene owlOntology - queryStr - hasTokenize Tìm kiếm sử dụng hàm MultiFieldQueryParser Lucene Nếu hasTokenize bật việc sử dụng vnTokenizer sử dụng Tách từ tiếng Việt Gán nhãn từ loại tiếng Việt 50 Ghi Chú Đây thao tác sử dụng để search thơng thường Search theo từ khóa cổ điển Chương Cài đặt ứng dụng • Các thuật toán: - Thuật toán load liệu từ file ontology vào cấu trúc tìm kiếm Lucene Hàm đệ quy: Void addIndividual (IndexWrite iw, Sach s) { Lấy trường Mã_Sách (s) → iw.Data.MaSach Lấy trường Tựa_Sách (s) → iw.Data.TuaSach Lấy trường Năm_XB (s) → iw.Data.NamXB Trong Thơng_Tin_KeyPharse (s) { Lấy Thông_Tin_KeyPharse (s) → iw.Data.KeyPharse[] (đầy đủ dấu) → im.Data.KeyPharse[] (loại bỏ dấu Việt) } Trong Thông_Tin_Tác_Giả (s) { Lấy Thông_Tin_Tác_Giả (s) → iw.Data.TacGia[] (đầy đủ dấu) → im.Data.TacGia[] (loại bỏ dấu Việt) } Trong Thơng_Tin_NXB (s) { Lấy Thơng_Tin_NXB (s) → iw.Data.NXB[] (đầy đủ dấu) → im.Data.NXB[] (loại bỏ dấu Việt) } } - Hàm gọi xây dựng: Void indexSampleData() { Khởi tạo IndexWrite iw từ API Lucene Sach[] cacSach = Lấy từ DAO tất sách (getAllSachInstance) có hệ thống Trong cacSach { Lấy s từ cacSach addIndividual (iw, s); } } 51 Chương Cài đặt ứng dụng 4.3 Giao diện chương trình 4.3.1 Màn hình tìm kiếm xác Hình 4.5 Màn hình tìm kiếm xác Cho phép người dùng tìm kiếm sách có tựa đề, tên tác giả, tên nhà xuất hay tập từ khóa nội dung sách có chứa từ trùng với từ người dùng nhập vào - Người dùng nhập cụm từ có chứa từ khóa cần tìm - Hệ thống tìm kiếm trả sách mà phần tựa đề, tên tác giả, tên nhà xuất hay tập từ khóa nội dung tài liệu có chứa xác từ câu truy vấn người dùng Ví dụ: Người dùng nhập câu truy vấn “ kỹ thuật xử lý ảnh”, hệ thống tiến hành tách câu truy vấn thành tập từ: “kỹ”, “thuật”, “xử”, “lý”, “ảnh” Sau tiến hành đánh mục tìm kiếm Kết trả tất sách có chứa từ “kỹ”, “thuật”, “xử”, “lý”, “ảnh” phần tựa đề, tên tác giả, tên nhà xuất hay tập từ khóa nội dung sách 4.3.2 Màn hình tìm kiếm theo ngữ nghĩa 52 Chương Cài đặt ứng dụng Hình 4.6 Màn hình Tìm kiếm theo ngữ nghĩa Cho phép người dùng tìm kiếm sách có tựa đề, tên tác giả, tên nhà xuất hay tập từ khóa nội dung sách có chứa cụm từ trùng với từ khóa câu truy vấn người dùng nhập vào sau hệ thống xử lý chọn lọc lại từ khóa - Người dùng nhập cụm từ có chứa từ khóa có sách cần tìm - Hệ thống tìm kiếm trả sách mà phần tựa đề, tên tác giả, tên nhà xuất hay tập từ khóa nội dung tài liệu có chứa từ khóa hệ thống chọn lọc lại từ câu truy vấn người dùng - Người dùng lựa chọn tìm kiếm theo AND OR Ví dụ: Người dùng nhập câu truy vấn “ kỹ thuật xử lý ảnh”, hệ thống tiến hành tách câu truy vấn thành tập từ: “kỹ thuật”, “xử lý ảnh” Sau tiến hành đánh mục tìm kiếm Kết trả tất sách có chứa từ “kỹ thuật”, “xử lý ảnh” phần tựa đề, tên tác giả, tên nhà xuất hay tập từ khóa nội dung sách 53 Chương Cài đặt ứng dụng Hình 4.7 Màn hình Tìm kiếm theo ngữ nghĩa dùng tốn tử AND Hình 4.8 Màn hình Tìm kiếm theo ngữ nghĩa dùng tốn tử OR 4.4 Kết thử nghiệm Kết đánh giá tiến hành thử nghiệm tìm kiếm sách chuyên ngành CNTT thuộc nhóm mơn học: Đồ họa, Tốn rời rạc, Lý thuyết đồ thị, Cơ sở liệu, Tin học văn phòng 54 Chương Cài đặt ứng dụng Bảng 4.3 Thống kê kết tìm kiếm thử nghiệm Câu hỏi stt Số tài liệu tìm (T) Số tài liệu tìm liên quan (S) Số tài liệu liên quan (U) Độ xác (S/T) Độ bao phủ (S/U) q1 Html 16 16 16 1 q2 Ngôn ngữ Html 16 16 16 1 q3 Ngôn ngữ thiết kế web html 6 16 0.4 q4 Xuất web 4 1 q5 Xuất trang web lên internet 0.6 0.8 q6 Thiết kế giao diện web 3 0.6 q7 Tạo giao diện cho trang web 5 1 q8 Thiết kế Đồ họa 3d 0.9 1.3 q9 dùng Photoshop ghép ảnh chụp 8 1 q10 toán tập hợp 2 0.4 q11 toán Ánh xạ 2 0.5 q12 Tính Đại số boole 4 1 q13 Tìm thuật toán khung 8 0.8 q14 Kỹ thuật xử lý khung 10 8 0.8 q15 Thuật toán xếp đồ thị 4 0.8 Kết thực nghiệm: hệ thống tìm hầu hết tài liệu có liên quan đến nội dung cần tìm xếp theo thứ tự độ liên quan giảm dần 55 Chương Kết luận hướng phát triển CHƯƠNG KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 5.1 Kết đạt Mặc dù kết đạt chương trình minh họa khiêm tốn, qua khóa luận này, ta thấy rõ tầm quan trọng việc biểu diễn tri thức ứng dụng đời sống thực tiễn, đặc biệt ứng dụng lĩnh vực giáo dục Việc nghiên cứu, xây dựng ứng dụng hỗ trợ tìm kiếm tài liệu theo ngữ nghĩa cho thư viện Trường Cao đẳng KTKT TP.HCM thu kết sau: - Đã xây dựng ứng dụng hỗ trợ tìm kiếm tài liệu chuyên ngành CNTT theo ngữ nghĩa cho thư viện Trường Cao đẳng KTKT TP.HCM với chức sau: + Tìm kiếm tài liệu cách so trùng xác tất từ câu truy vấn người dùng + Tìm kiếm tài liệu cách chọn lọc lại từ khóa câu truy vấn người dùng 5.2 Hạn chế Do thời gian nghiên cứu có hạn nên ứng dụng chưa thực tính sau: - Chưa cho phép truy cập, hiệu chỉnh cập nhật Ontology - Một hạn chế lớn ứng dụng chưa tập hợp kiến thức chuyên gia lĩnh vực CNTT để xây dựng sở tri thức nên số lượng chất lượng tri thức thu thập hạn chế, mang tính chủ quan, dễ dẫn tới nhiều trường hợp thiếu sót hay dư thừa - Đề tài tập trung nghiên cứu xây dựng ứng dụng phục vụ lĩnh vực cụ thể lĩnh vực CNTT giới hạn phạm vi tài liệu sách in tiếng Việt có thư viện - Ứng dụng thử nghiệm truy vấn đơn giản, kết tìm kiếm phụ thuộc vào tập keyphrase xây dựng ontology 56 Chương Kết luận hướng phát triển 5.3 Hướng phát triển Để ứng dụng đưa vào sử dụng thực tiễn thư viện Nhà trường cần phải tiếp tục nghiên cứu thực phần việc sau: - Tiếp tục xây dựng hoàn thiện ứng dụng - Bổ sung thêm tri thức để ứng dụng cho kết tìm kiếm tốt - Xây dựng Ontology cho ngành khác để mở rộng phạm vi tra cứu thông tin toàn thư viện - Xây dựng ứng dụng chạy web Đề tài hoàn thành với số kết định nhiên không tránh khỏi thiếu sót Kính mong thơng cảm đóng góp ý kiến quý thầy cô bạn 57 TÀI LIỆU THAM KHẢO Tiếng Việt Lê Quỳnh Chi (2008), “Thư viện đại học góp phần nâng cao chất lượng đào tạo”, Tạp chí Thư viện Việt Nam (2), tr 18-23 Nguyễn Công Nhật (2008), “Semantic web thư viện số”, Tạp chí Thư viện Việt Nam (14), tr 24-29 Lê Bá Lâm (2011), “Hệ thống quản trị thư viện tích hợp mã nguồn mở Koha, hội lý tưởng cho thư viện Việt Nam”, Tạp chí Thư viện Việt Nam (28), tr 30-35 Huỳnh Thị Thanh Thương (2012), Nghiên cứu mơ hình tổ chức kỹ thuật tìm kiếm có ngữ nghĩa kho tài nguyên học tập lĩnh vực CNTT, Luận văn Thạc sĩ trường Đại học Khoa học tự nhiên TP.HCM Nguyễn Lê Tùng Khánh (2013), Ứng dụng semantic web xây dựng hệ thống tra cứu thông tin thư viện trường CĐ Công Nghệ Thông Tin, Luận văn Thạc sĩ trường Đại học Đà Nẵng Nhóm Đỗ Phúc (2004), Phát triển hệ thống S.E hỗ trợ tìm kiếm thông tin, thuộc lãnh vực CNTT Internet qua từ khóa tiếng Việt, Báo cáo KH Sở KHCN TPHCM Lương Quý Tịnh Hà (2009), Xây dựng công cụ tìm kiếm tài liệu học tập truy vấn ngôn ngữ tự nhiên kho học liệu mở tiếng Việt, Luận văn Thạc sĩ trường Đại học CNTT TP.HCM Phạm Hoàng Linh (2013), Ứng dụng semantic web xây dựng hệ thống tìm kiếm văn ngành giáo dục, Luận văn Thạc sĩ trường Đại học Đà Nẵng Đỗ Văn Nhơn (2014), Nghiên cứu xây dựng hệ thống hỗ trợ chọn lọc tin tỉnh Bình Dương báo mạng, Báo cáo KQNCKH Bình Dương 10 Cao Thị Thu Hương (2006), Nghiên cứu đánh giá hệ truy xuất thông tin, Luận văn Thạc sĩ trường Đại học Bách khoa Hà Nội 11 Đồng Thị Bích Thủy, Hồ Bảo Quốc (2003), Ứng dụng xử lý ngơn ngữ tự nhiên hệ tìm kiếm thơng tin văn tiếng Việt, Đại học Khoa học tự nhiên TP.HCM 58 12 Phan Văn Út (2015), Kỹ thuật nâng cao hiệu tra cứu sách thư viện trường Cao đẳng kinh tế công nghệ TP.HCM, Luận văn Thạc sĩ trường Đại học quốc tế Hồng Bàng 13 Phạm Minh Quân (2003), “Hiểu sử dụng Dublin Core”, Bản tin Liên hiệp Thư viện, tr.28-36 14 Thư viện trường Cao đẳng KTKT TP.HCM (10.2016), http://ktkthcm.edu.vn/index.php/thuvien/book 15 Huỳnh Đức Việt, Võ Duy Thanh, Võ Trung Hùng (2010), “Nghiên cứu ứng dụng mã nguồn mở Lucene để xây dựng phần mềm tìm kiếm thơng tin văn bản”, tạp chí Khoa học Công nghệ, Đại học Đà nẵng (4), tr.307-316 16 Lưu Văn Tăng (2009), Phát triển công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn tiếng Việt, Luận văn Thạc sĩ trường Đại học Khoa học tự nhiên Hà Nội 17 Nguyễn Ngọc Đan Thanh (2014), “Ứng dụng kỹ thuật tìm kiếm thông tin vào hệ thống tra cứu tài liệu thư viện trường Đại học Trà Vinh”, tạp chí Khoa học Công nghệ (12), tr.17-23 Tiếng Anh 18 Phuong Le Hong, Azim Roussanaly, Thi Minh Huyen Nguyen, Mathias Rossignol (2010), “An empirical study of maximum entropy approach for partof-speech tagging of Vietnamese texts”, Processdings of TALN 2010 19 Dhana Nandini (2014), Semantic Web and Ontology, Publisher: Bookboon 20 Henrik Bulskov Styltsvig (2006), “Ontology-based Information Retrieval”, A dissertation Presented to the Faculties of Roskilde University in Partial Fulfillment of the Requirement for the Degree of Doctor of Philosophy 21 Christopher D Manning, Prabhakar Raghavan, Hinrich Schütze (2008), “An Introduction to Information Retrieval”, Cambridge University Press Cambridge, England 59 ... vi đề tài Xây dựng hệ thống hỗ trợ tìm kiếm tài liệu theo ngữ nghĩa cho thư viện Trường CĐ KTKT TP. HCM , đề tài đặt mục tiêu nghiên cứu tìm hiểu kỹ thuật tìm kiếm theo ngữ nghĩa từ xây dựng ứng... cơng cụ để xây dựng hệ thống tìm kiếm thơng tin theo ngữ nghĩa Qua đó, xây dựng ứng dụng hỗ trợ tìm kiếm tài liệu chuyên ngành CNTT theo ngữ nghĩa cho thư viện Trường CĐ KTKT TP. HCM Đề tài tập trung... thống hỗ trợ tìm kiếm tài liệu chuyên ngành CNTT theo ngữ nghĩa cho thư viện Trường CĐ KTKT TP. HCM Hệ thống đáp ứng chức sau: - Hỗ trợ tìm kiếm theo ngữ nghĩa tài liệu có sở liệu Việc tìm kiếm bao

Ngày đăng: 23/12/2018, 06:16

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan