Cá nhân hóa truy vấn dựa trên sở thích người dùng

46 183 0
Cá nhân hóa truy vấn dựa trên sở thích người dùng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Hoàng Thị Minh Tâm TÊN ĐỀ TÀI LUẬN VĂN CÁ NHÂN HÓA TRUY VẤN DỰA TRÊN SỞ THÍCH NGƯỜI DÙNG Chuyên ngành : Công nghệ thông tin LUẬN VĂN THẠC SĨ KĨ THUẬT Công nghệ thông tin NGƯỜI HƯỚNG DẪN KHOA HỌC : TS Vũ Tuyết Trinh Hà Nội – Năm 2014 MỤC LỤC CHƯƠNG I GIỚI THIỆU 1.1 Đặt vấn đề 1.2 Mục đích, phạm vi nghiên cứu 1.3 Bố cục luận văn CHƯƠNG II CÁC KỸ THUẬT XỬ LÝ TRUY VẤN DỰA TRÊN SỞ THÍCH NGƯỜI DÙNG 2.1 Biểu diễn sở thích 2.1.1 Sở thích chọn lọc 2.1.2 Sở thích tham gia 11 2.2 Sở thích ẩn 14 2.3 Kết hợp sở thích 16 2.4Thứ tự ưu tiên, xếp hạng 18 2.5 Lựa chọn sở thích sử dụng cho truy vấn 19 2.6 Xử lý truy vấn dựa sở thích người dùng 23 2.6.1 Phương pháp SPA 23 2.6.2 Phương pháp PPA 27 CHƯƠNG III ỨNG DỤNG TRUY VẤN THƯ VIỆN SÁCH TRUYỆN 33 3.1 Yêu cầu ứng dụng 33 3.2 Xây dựng hệ thống 34 3.2.1 Kiến trúc hệ thống 34 3.2.2 Xử lý truy vấn cá nhân hóa 36 3.3 Đánh giá 42 KẾT LUẬN 45 TÀI LIỆU THAM KHẢO 45 DANH MỤC CÁC HÌNH VẼ Hình Ví dụ hồ sơ người dùng Error! Bookmark not defined Hình Ví dụ đồ thị cá nhân hoá Error! Bookmark not defined Hình Một phần đồ thị cá nhân Jon Error! Bookmark not defined Hình Một câu truy vấn đầu trang đồ thị cá nhân Error! Bookmark not defined Hình Ví dụ đồ thị với mức độ tới hạn Error! Bookmark not defined Hình Cơ sở liệu sách Error! Bookmark not defined Hình Cơ sở liệu sở thích Error! Bookmark not defined Hình Mô hình xử lý truy vấn dựa sở thích người dùng Error! Bookmark not defined Hình Kết truy vấn không kết hợp sở thích Error! Bookmark not defined Hình 10 Kết truy vấn kết hợp sở thích……… …………………… …………………… Error! Bookmark not defined CHƯƠNG I GIỚI THIỆU 1.1 Đặt vấn đề Một người sử dụng truy cập hệ thống thông tin với mục đích tìm kiếm thông tin cần thiết, phải thực lại truy vấn vài lần chọn lọc thông qua nhiều kết đạt yêu cầu Do phong phú thông tin người dùng không đồng trang web Những người sử dụng khác mong đợi câu trả lời khác cho truy vấn sở thích hay mục tiêu không giống nhau,v.v Nhưng hầu hết hệ thống tìm kiếm chưa đáp ứng yêu cầu Sở thích có mặt nơi sống hàng ngày Và gần đây, chúng ý nhiều đến việc phát triển phần mềm, điển hình ứng dụng tìm kiếm thông tin Sở thích giới thực thể nhiều dạng khác người có thông tin đối tượng Chúng ta làm kiểm tra biểu lộ tự nhiên người ước muốn vấn đề Cuộc sống hàng ngày với phong phú sở thích đến từ cảm nhận ảnh hưởng khác Trong giới thực này, trả lại cách nhanh chóng mong muốn thường xuyên xảy ra, “tôi thích A B” Loại ưa thích phổ biến trực quan cho người Nghĩ đến sở thích có nghĩa mong muốn “tốt hơn”, điều có chút liên quan đến toán học: Toán học ánh xạ chúng vào thành thứ tự phận chặt Con người thường xuyên đề cấp đến vấn đề ưa thích, thông thường với không diễn tả phạm vi số cụ thể Sở thích trình bày rõ ràng cụ thể dựa tập thuộc tính định danh với miền quan hệ giá trị, theo cách nói ẩn dụ “thuộc ước muốn” Cụ thể hơn, sở thích thể qua giá trị thuộc tính, qua mối quan hệ thực thể Những giá trị sở thích hoàn toàn có liên quan Mối quan hệ sở thích mức độ nào, có, yếu tố liên quan phụ thuộc lẫn (bởi sở thích đặc biệt nhau) Nhưng có phần khác giới thực hướng tới tiết kiệm chi phí công nghệ đưa phải tối ưu Một cách dễ hiểu xếp hạng được xem phần sở thích Do mô hình sở thích ràng buộc không trọn vẹn, điều chứng tỏ nhiều ngành khoa học khác nhau, đặc biệt khoa học máy tính môn học Và việc lưu sở thích người dùng có ý nghĩa lớn: (1) Ngữ nghĩa trực quan: Sở thích đóng vai trò quan trọng xử lý mô hình Điều đòi hỏi cách trực quan giải thích rõ ràng hệ thống tìm kiếm Mô hình sở thích người dùng nên bao gồm biểu diễn ph i số phương pháp phân hạng… (2) Nền tảng toán học ngắn gọn: điều tất yếu, tảng toán học phải cân ngữ nghĩa trực quan (3) Xây dựng mở rộng mô hình sở thích: Sở thích đầy đủ xây dựng quy nạp từ vấn đề đơn giản (4) Các xung đột sở thích phải không nguyên nhân làm cho hệ thống bị lỗi: kết cấu động sở thích phức tạp phải hỗ trợ có mặt xung đột Mô hình sở thích thực tồn với xung đột, không ngăn chặn chúng gây lỗi chúng xảy (5) Xây dựng truy vấn sở thích: Sự phù hợp giới thực làm cầu nối mong muốn tin cậy Sự thể cần thiết cho mô hình truy vấn khác phù hợp với mô hình ngôn ngữ truy vấn sở liệu có trước Vì vậy, ta lưu trữ sở thích người dùng, hệ thống có hội trả kết tập trung hơn, phạm vi tìm thấy nhỏ hơn, làm hài lòng người dùng Với lí đây, luận văn nhằm mục đích tìm hiểu “Cá nhân hóa truy vấn dựa sở thích người dùng” xây dựng ứng dụng “Tìm kiếm thư viện sách truyện” áp dụng cá nhân hóa truy vấn 1.2 Mục đích, phạm vi nghiên cứu Đề tài nhằm mục đích:  Tìm hiểu sở thích người dùng ảnh hưởng đến trình đánh giá truy vấn  Tìm hiểu kỹ thuật cá nhân hóa truy vấn  Xây dựng ứng dụng minh họa 1.3 Bố cục luận văn Đề tài “Cá nhân hóa truy vấn dựa sở thích người dùng” ứng dụng demo “Tìm kiếm thư viện sách truyện” chia làm chương sau: Chương 2: Kỹ thuật truy vấn dựa sở thích người dùng Tìm hiểu mô hình hóa sở thích kỹ thuật xử lý truy vấn dựa sở thích người dùng Chương 3: Ứng dụng truy vấn thư viện sách truyện Xây dựng ứng dụng thư viện sách truyện áp dụng kỹ thuật truy vấn dựa sở thích người dùng để tìm kiếm Kết luận: Tổng kết lại vấn đề nghiên cứu số hướng nghiên cứu tương lai CHƯƠNG II CÁC KỸ THUẬT XỬ LÝ TRUY VẤN DỰA TRÊN SỞ THÍCH NGƯỜI DÙNG Chúng ta tập trung vào sở thích hồ sơ người dùng thuật toán cá nhân hoá truy vấn Sở thích khái niệm toán học ứng dụng [7], triết học [8], AI [20], sở liệu [15] Việc xác định sở thích [13] cần xây dựng cụ thể, không xem xét khả hạn chế tùy ý hồ sơ người dùng Bên cạnh đó, cá nhân hóa lĩnh vực nghiên cứu rộng, có cách tiếp cận khác từ lọc thông tin tới đối tượng toán [19, 11], tác nhân [2] bối cảnh truy vấn, chẳng hạn vị trí người sử dụng, thời gian, thiết bị…, phương pháp tiếp cận cá nhân hoá truy vấn [18,4] Georgia Koutrika, Yannis Ioannidis [16] sở liệu [14] tảng cho đề tài Trước hết, cá nhân truy vấn trình thực thi truy vấn liên quan đến sở thích lưu trữ hồ sơ người dùng với mục đích cung cấp câu trả lời cá nhân Các truy vấn tập trung vào người dùng tạo thay đổi hướng tới ‘cá nhân’, tính toán dựa đặc điểm người [18] Các thành phần cần thiết cá nhân hóa truy vấn gồm mô hình để lưu trữ sở thích, phạm vi xác định loại câu trả lời cá nhân tạo cho truy vấn hồ sơ người sử dụng, thuật toán cá nhân hóa truy vấn Một câu trả lời cá nhân xây dựng việc xác định K số sở thích ưu tiên hàng đầu từ hồ sơ người sử dụng, số L (L ≤ K) tiêu chí mà làm hài lòng người dùng Tham số K L quy định trực tiếp người sử dụng có nguồn gốc dựa tiêu chuẩn bối cảnh truy vấn, chẳng hạn vị trí người sử dụng, thời gian, thiết bị, vv Cá nhân hóa truy vấn thu qua hai giai đoạn: (Lựa chọn sở thích) Sở thích đầu vào K bắt nguồn từ hồ sơ người dùng (Câu trả lời cá nhân) Đây kết kết hợp câu truy vấn với sở thích câu trả lời cá nhân trả đáp ứng (ít nhất) L tiêu chí sở thích K Một hệ thống cần nắm bắt mức độ khác quan tâm [1], truy vấn trả liệu phù hợp kèm liệu so sánh khác Trong chương này, tìm hiểu đầy đủ vấn đề liên quan đến biến thể sở thích, liên kết sở thích, kết truy vấn xếp hạng dựa vào mức độ quan tâm Từ giải toán cá nhân hóa truy vấn xây dựng ứng dụng minh họa 2.1 Biểu diễn sở thích Để cá nhân hoá, xây dựng cho người dùng hồ sơ cá nhân có cấu trúc liên quan đến mô hình truy vấn Không tính tổng quát, tập trung vào truy vấn sở liệu quan hệ Hồ sơ sở thích người dùng thể đồ thị mức độ cao so với lược đồ sở liệu, kết hợp sở thích với sở liệu Đây trừu tượng hóa cách sử dụng hồ sơ cá nhân nhiều sở liệu với thông tin tương tự khác lược đồ, tái cấu trúc lược đồ Đối với thuộc tính RA bảng quan hệ R, cho DA miền giá trị Chúng ta tập trung vào cá nhân hóa truy vấn, lưu trữ sở thích mức độ truy vấn con, gọi thành phần sở thích Các giá trị sở thích lưu trữ sở thích chọn lọc (thành phần chọn lọc sở thích), mối quan hệ sở thích lưu trữ sở thích tham gia (thành phần tham gia sở thích) 2.1.1 Sở thích chọn lọc Thành phần chọn lọc giá trị sở thích lưu trữ hồ sơ người dùng Đối với điều kiện q, thành phần chọn lọc sở thích thuộc tính RA cho giá trị phù hợp (hay không) thể mức độ quan tâm đến q, ký hiệu doi (q), định nghĩa sau: doi(q) = < dT(u), dF(u) > với ∀ u∈ DA đáp ứng điều kiện q, dT(u), dF(u) ∈ [-1,1] dT(u)*dF(u) ≤ Với định nghĩa này, ta phân biệt yếu tố có liên quan tới sở thích: Hóa trị, mức độ quan tâm, độ đàn hồi Hóa trị (Valence) Sở thích đa dạng, tích cực (thể ưa thích), tiêu cực (thể không thích) không quan tâm Chúng biểu diễn thông qua hai giá trị dT (u) dF(u) u∈ DA Trong dT (u) thể ưa thích sở thích tích cực, cho thấy mức độ quan tâm tới u (mức độ thích) Và dF (u) biểu diễn mức độ không quan tâm tới u, mức độ không thích ngày tăng dF giảm (mức độ -1 giá trị khó chịu nhất) Mức độ cho thấy không quan tâm tới u Sở thích với dT (u) = dF (u) = 0, không lưu trữ hồ sơ Mức độ quan tâm (Concern) Sở thích diện (liên quan đến có mặt giá trị) (liên quan đến vắng mặt giá trị) Một mối quan tâm người sử dụng thể Theo định nghĩa, dT (u) thể mối quan tâm người dùng cho có mặt giá trị u thuộc tính RA dF(u) thể mối quan tâm người dùng cho vắng mặt giá trị xét Sự quan tâm mạnh mẽ tới có mặt u kết hợp với không quan tâm đến giá trị khác u quan tâm nhiều tới giá trị (vắng mặt u) Tính đàn hồi (Elasticity) Sở thích xác đàn hồi phụ thuộc vào miền DA giá trị tuyệt đối số Nếu miền DA giá trị tuyệt đối với độc lập lẫn giá đó, sở thích coi xác đàn hồi không tất Với sở thích biểu diễn giá trị số liên tục miền DA đáp ứng yêu cầu người dùng, trường hợp đó, coi đàn hồi Độ đàn hồi xác định hàm dT (u), dF (u) Có nhiều hàm biểu diễn sở thích đàn hồi Để đơn giản, sử dụng e (d) để biểu diễn hàm đàn hồi để phân biệt với doi(q) (sở thích xác) e(d) có miền giá trị từ -1 đến Từ yếu tố ta phân loại sỏ thích: Sở thích tích cực, sở thích tiêu cực; Sở thích có mặt, sở thích vắng mặt; Sở thích đàn hồi Ví dụ: Hãy xem xét sở liệu phim mô tả lược đồ đây, khóa gạch chân: THEATRE(tid, name, phone, region, ticket), PLAY(tid, mid, date), GENRE(mid, genre) MOVIE(mid, title, year, duration) CAST(mid, aid, award, role) ACTOR(aid, name) DIRECTED(mid, did), DIRECTOR(did, name) Một phim chiếu rạp có thông tin liên quan tên phim, năm sản xuất, thời lượng, nhà hát chiếu phim (tên, điện thoại, địa điểm, vé), lịch chiếu phim, thể loại phim, diễn viên chính, đạo diễn Jon muốn lựa chọn phim để đặt vé, quan tâm đến sở thích ông Sở thích Jon phát biểu sau: (p1) Ông thích giám đốc W Allen (p2) Ông không thích phim phát hành trước năm 1980 (P3) Ông thích vé giá khoảng Euro (p4) Ông thích phim có thời lượng dao động khoảng 2h (p5) Ông thật hạnh phúc phim nhạc kịch (p6) Ông không đến nhà hát không trung tâm thành phố Theo đó, ta phân biệt loại sở thích Jon sau: Về hóa trị, p1, p3 thể sở thích tích cực (sự ưa thích), p2, p5, p6 thể sở thích tiêu cực (không thích) Về mối quan tâm, người ta quan tâm đến diện (có mặt) giá trị, không quan tâm trường hợp ngược lại Ví dụ: Jon có quan tâm tích cực phim đạo diễn W Allen (sở thích có mặt), ông không quan tâm W Allen đạo diễn phim Mặt khác, ông thích nhà hát trung tâm thành phố ông không thích đến nhà hát không trung tâm Vậy p1 10 truy vấn ban đầu Q với id vắng mặt danh sách phần kết trả thuật toán Danh sách kết quả, R, xếp theo giảm mức độ quan tâm Một liệu từ danh sách trả dựa chứng liệu có mức độ quan tâm lớn so với mức độ trước Bằng chứng cung cấp hình thức mức độ quan tâm tối đa (MEDI) mà không kết đạt Đây mức độ quan tâm thiết lập tối đa sở thích làm hài lòng điểm thuật toán Ban đầu, toàn sở thích Khi thuật toán thu kết với truy vấn theo thứ tự, sở thích liên quan đến cách trước không áp dụng, chúng xóa khỏi sở thích Các liệu R có mức độ quan tâm trở thành lớn MEDI đầu Tuy nhiên, họ không loại bỏ từ R Bằng cách này, thuật toán biết liệu gặp không tạo Kể từ R lệnh giảm mức độ quan tâm, có trỏ đến liệu không nêu ra, trỏ di chuyển phía danh sách Thuật toán chấm dứt sở thích liên quan đến truy vấn lại không đủ để đáp ứng tiêu chí L, kết đầu lại liệu R - Đánh giá: Phương pháp tiến so với phương pháp SPA, khắc phục hầu hết vấn đề tồn Nó cho phép tạo phần tự giải thích kết Mặt khác, thực thi việc xếp hạng kết dựa vào sở thích từ K chọn hài lòng không chọn PPA xử lý hiệu có sở thích vắng mặt 1-n cho phép phục hồi nhanh chóng liệu 32 CHƯƠNG III ỨNG DỤNG TRUY VẤN THƯ VIỆN SÁCH TRUYỆN Thư viện sách truyện hệ thống tra cứu thông tin sách truyện áp dụng cá nhân hóa Thông tin sách phong phú đa dạng bao gồm: tên sách, tác giả, nhà xuất bản, ngôn ngữ, thể loại, lĩnh vực, độ tuổi thông tin khác số trang, số lượt xem, số lượt tải Mỗi người dùng có hồ sơ riêng định nghĩa sẵn sở thích cá nhân Mỗi người sử dụng cần tra cứu thông tin sách, hệ thống tự động xử lý truy vấn cá nhân hóa dựa sở thích có mà không cần định nghĩa lại Trên sở đó, ứng dụng xây dựng gồm hai phần: Quản lý hồ sơ người dùng tìm kiếm sách thư viện (1) Quản lý hồ sơ người dùng: sâu vào mô hình lưu trữ sở thích người dùng (2) Tìm kiếm sách: Áp dụng cá nhân hóa truy vấn dựa sở thích người dùng Mục đích giúp trả kết tìm kiếm với phạm vi nhỏ hơn, làm hài lòng người dùng 3.1 Yêu cầu ứng dụng Phần mềm sâu vào chức chính: quản lý sở thích tìm kiếm dựa sở thích - Yêu cầu thiết kế CSDL  Dữ liệu nhập vào điều khiển phải quy định kiểu liệu CSDL, không định dạng quy định đưa thông báo lỗi cho người nhập liệu biết  Mỗi dòng bảng phải Trong bảng dòng giống hệt Điều kiện dòng liệu tương đương với điều kiện bảng có khóa khác trống  Thứ tự cột bảng không quan trọng xác định thông qua tên  Thứ tự dòng không quan trọng, cột, dòng đổi chỗ cho nhau, xem liệu bảng với thứ tự khác dòng, tùy theo yêu cầu 33  Quan hệ có lượng dư thừa liệu cho phép người sử dụng thêm, sửa đổi hay xóa dòng liệu mà không gây lỗi ko quan bảng Các thuộc tính gom nhóm cách tùy ý thành lược đồ quan hệ - Yêu cầu giao diện:  Giao diện phải dễ nhìn, độ rộng phải vừa với hình(độ rộng 100%), tránh tình trạng thiết kế giao diện lớn đọ rộng hình phải sử dụng đến ngang  - Các trang phải có giao diện thống nhất, không nhập nhằng, trình bày khoa học Các yêu cầu chất lượng phần mềm  Phần mềm hoạt động tốt, ổn định trình duyệt, trình bày đẹp, giao diện dễ nhìn -  Thích nghi tốt hệ điểu hành : Window, Vista  Xử lý nhanh thông tin Các yêu cầu tương tác  Khi phát lỗi, hệ thống phải thông báo cho người dùng 3.2 Xây dựng hệ thống 3.2.1 Kiến trúc hệ thống Cơ sở liệu sách truyện xây dựng với hai phận chính: (a) Thông tin sách: Tên sách, tác giả, năm xuất bản, nhà xuất bản, thể loại, lĩnh vực, số trang, số lượt tải, số lượt xem,… (b) Sở thích người dùng: Thông tin người dùng, sở thích người dùng tác giả, ngôn ngữ, lĩnh vực, thể loại, số trang, số lượt tải, số lượt xem,… Ánh xạ vào sở liệu sách truyện ta có bảng tương ứng sau: (1) Thông tin sách: bảng Sách, Nhà xuất bản, Thể loại, Lĩnh vực, … 34 Hình Cơ sở liệu sách (2) Sở thích người dùng: Người dùng, sở thích thể loại, lĩnh vực, nhà xuất bản, độ tuổi, tác giả,… Biểu diễn sở thích người dùng theo định nghĩa doi(q) = < dT(u), dF(u) >; mức độ liên kết d 35 Hình Cơ sở liệu sở thích Đối với bảng lưu trữ thông tin sở thích khác tương tự trình bày Như hồ sơ người dùng lưu trữ sở liệu gồm thông tin người dùng thông tin sở thích 3.2.2 Xử lý truy vấn cá nhân hóa  Phát biểu truy vấn Câu truy vấn dựa SQL chuẩn Đầu vào liệu bao gồm hai thành phần: (a) Câu truy vấn ban đầu SQL chuẩn Ví dụ: Select * From Books where Books.SoTrang= “66” (b) Hồ sơ sở thích người dùng hướng cấu trúc sở thích tiêu chí L: 36 doi(q) = < dT(u), dF(u) > (thành phần chọn lọc sở thích) với ∀ u∈ DA làm hài lòng sở thích q, dT(u), dF(u) ∈ [-1,1] dT(u)*dF(u) ≤ doi (q) = , d ∈ [0, 1] (thành phần tham gia sở thích) Ví dụ:  Xử lý truy vấn dựa sở thích Hình Mô hình xử lý truy vấn dựa sở thích người dùng  Quản lý hồ sơ người dùng bao gồm: Thêm mới, Sửa, Xóa thông tin sở thích người dùng Thành phần sở thích bao gồm: Sở thích lĩnh vực, thể loại, độ tuổi, ngôn ngữ, tác giả sách 37 Mô tả tóm tắt:  Tên chức năng: Thêm  Mục đích: Giúp người dùng thêm thông tin sở thích cá nhân  Tác nhân: Người sử dụng  Tóm lược: Khi người dùng đăng nhập thành công lựa chọn chức thêm mới, sửa, xóa thông tin sở thích cá nhân Với chức thêm mới, hệ thống kiểm tra thông tin người dùng nhập vào, không hợp lệ thông báo lỗi cho phép nhập lại Nếu thông tin nhập vào đầy đủ hợp lệ, hệ thống cho phép thêm thông tin vào CSDL Sau người dùng thêm mới, họ kiểm tra lại thông tin nhập vào cách dễ dàng, đồng thời sửa xóa sở thích Mô tả kịch bản:  Thông tin đầu vào: Thuộc tính, giá trị, dT, dF, mức độ liên kết  Điều kiện đầu vào: dT.dF ≤  Dòng kiện chính: Hành động tác nhân Phản ứng hệ thống Chọn chức đăng nhập có tài khoản sau đăng kí xong hệ thống tự động cho thành viên vào Hiển thị trang đăng kí (nếu yêu cầu) trang đăng nhập Nhập thông tin tài khoản để đăng nhập Kiểm tra thông tin đăng nhập, Gửi thông tin đăng nhập tới hệ thống cho phép truy cập hệ thống, sai thông báo lỗi, ngược lại, thông báo đăng nhập thành công 38 Nháy nút Sở thích menu Mở trang quản lý sở thích cá nhân Chọn danh mục sở thích cần thêm Hiển thị trang thêm sở thích tương (chọn thuộc tính) ứng 10 Chọn giá trị, dT, dF, mức độ liên kết 11 Hệ thống kiểm tra điều kiện, hợp lệ chèn thêm ghi vào sở liệu Và ngược lại thông báo lỗi cho người dùng nhập lại (gọi thủ tục thêm sở thích) Các chức khác sửa, xóa sở thích mô tả tương tự chức thêm  Cấu trúc sở thích: (1) Sở thích lĩnh vực bao gồm thuộc tính: Mã sở thích, tên lĩnh vực, mã người dùng, mức độ thích mức độ quan tâm đến trường hợp khác, cuối mức độ liên kết sở thích lĩnh vực với sở thích khác (2) Sở thích thể loại bao gồm thuộc tính: Mã sở thích, tên thể loại, mã người dùng, mức độ thích mức độ quan tâm đến trường hợp khác, cuối mức độ liên kết sở thích thể loại với sở thích khác (3) Sở thích ngôn ngữ bao gồm thuộc tính: Mã sở thích, tên ngôn ngữ, mã người dùng, mức độ thích mức độ quan tâm đến trường hợp khác, cuối mức độ liên kết sở thích ngôn ngữ với sở thích khác (4) Sở thích độ tuổi bao gồm thuộc tính: Mã sở thích, độ tuổi, mã người dùng, mức độ thích mức độ quan tâm đến trường hợp khác, cuối mức độ liên kết sở thích độ tuổi với sở thích khác (5) Sở thích tác giả bao gồm thuộc tính: Mã sở thích, tên tác giả, mã người dùng, mức độ thích mức độ quan tâm đến trường hợp khác, cuối mức độ liên kết sở thích tác giả với sở thích khác 39 Các sở thích liên kết với nhờ ID người dùng Mỗi người dùng có hồ sơ riêng với thành phần sở thích định nghĩa  Xử lý Preferences: Xây dựng thủ tục gọi đến SQL server xử lý kết hợp truy vấn ban đầu sở thích cá nhân Sau đó, ta thu truy vấn giúp đưa kết cá nhân hóa tốt  SQL Server (a) Thủ tục Thêm sở thích lĩnh vực: if(md1 md2>0) (md1=0 and md2=0) begin (Thông báo: Giá trị chọn không hợp lý,chọn lại giá trị') end insert into Like_LinhVuc (b) Thủ tục sửa sở thích lĩnh vực: if(md1 md2>0) (md1=0 and md2=0) begin (Thông báo: Giá trị chọn không hợp lý,chọn lại giá trị') end update Like_LinhVuc (c) Thủ tục xóa sở thích lĩnh vực: delete Like_LinhVuc where ID (e) Truy vấn dựa sở thích người dùng: Begin R: = {}; Pactive: = PK; MEDI: = (Pactive) (tính toán theo công thức (6)); Xây dựng Qs (truy vấn có mặt truy vấn vắng mặt 1-1) ( if dT>0, dF≤ 0) Qa (truy vấn vắng mặt 1-n) (if dT≤0, dF>0) 40 Foreach qi ∈ Qs 2.1 if sở thích khác Qs, Qa không đáp ứng tiêu chí L dừng thuật toán 2.2 thực thi qi 2.3 Foreach t trả qi, t ∉ R thực thi truy vấn có mặt truy vấn vắng mặt với liệu t: Qi (t) thu P : = {prefs hài lòng t kết qi Qi } thực thi truy vấn vắng mặt 1- n với liệu t: Qi (t) thu A : = {các sở thích hài lòng t kết Qi } Prefs =P Prefs ∪A ; : = PK - Prefs if t đáp ứng tiêu chí L tính toán dt (dt mức độ quan tâm) vào dT, dF, thành phần lọc thành phần tham gia sở thích chọn R: = add (R, t, Prefs , Prefs , dt) end for 2.4 output tất t ∈ R với dt ≥ MEDI 2.5 Pactive: = Pactive – {sở thích qi}; MEDI: = (Pactive) end for Foreach qi ∈ Qa 3.1 if phần lại sở thích Qa không đáp ứng tiêu chí L dừng thuật toán trả tập R 3.2 thực thi qi 3.3 Foreach t trả qi, t ∉ R truy thực truy vấn vắng mặt 1-n Qi (t); lưu t vào danh sách thỏa mãn vấn Qi thu danh sách Ids : = add (Ids , t) Prefs : = {prefs hài lòng t kết Qi } 41 Prefs d: = PK - Prefs if t đáp ứng tiêu chí L tính toán dt vào dT dF truyền vào; gán R danh R: = add (R, t, Prefs , Prefs , dt) sách end for 3.4 output tất t ∈ R chưa có đầu với dt ≥ MEDI 3.5 Pactive: = Pactive – {sở thích qi}; MEDI: = (Pactive) end for if sở thích truy vấn Qa đáp ứng tiêu chí L 4.1 thực thi Q 4.2 Foreach t trả Q, t ∉ R, t ∉ Ids Prefs : = {tất truy vấn vắng mặt 1-n } if t đáp ứng tiêu chí L tính toán dt với dT dF tương ứng gán R danh sách R: = add (R, t, Prefs , Prefs , dt) End for output liệu lại từ R End 3.3 Đánh giá (1)Với câu truy vấn: Select * From Books where Books.SoTrang= “66” Tập kết thu sau: 42 Hình Ví dụ truy vấn không kết hợp sở thích (2)Với câu truy vấn : Select * From Books where Books.SoTrang= “66” Kết hợp Preference: Tập kết thu phạm vi nhỏ đáp ứng yêu cầu sở thích người dùng: 43 Hình 10 Ví dụ truy vấn kết hợp sở thích Kết truy vấn đáp ứng L tiêu chí thỏa mãn sở thích cá nhân tích lũy danh sách R có thứ tự giảm mức độ quan tâm Như vậy, việc kết hợp truy vấn với sở thích cá nhân mang lại hài lòng cho người dùng mà giúp thu hẹp phạm vi tìm kiếm, cho phép phục hồi nhanh chóng liệu 44 KẾT LUẬN Tôi tìm hiểu vào cá nhân hóa truy vấn mô hình sở thích, cá nhân hoá thuật toán truy vấn hiệu quả, hàm xếp hạng, thử nghiệm kết Cá nhân hoá quyền truy cập sở liệu thông tin [10] mở cánh cửa cho thách thức hội cho tương lai Kết hợp sở thích cá nhân với khía cạnh khác bối cảnh truy vấn gọi đến tùy biến khác, chẳng hạn thời gian vị trí người sử dụng, ngày, thiết bị sử dụng để truy vấn, chắn thách thức nghiên cứu ưu tiên tương lai gần Hơn nữa, kể từ truy vấn cá nhân làm thay đổi trải nghiệm tìm kiếm, người sử dụng giao diện cần để cung cấp cách đơn giản để giải thích hệ thống thực để cá nhân hoá truy vấn hoàn thiện Vì vậy, hướng nghiên cứu thú vị hướng tới thiết kế giao diện người dùng cho phép người dùng kiểm soát mức độ cá nhân hóa truy vấn, giúp làm giảm bớt câu trả lời không xác Một vấn đề khác thú vị biểu diễn sở thích với mô hình cao có ánh xạ từ lược đồ sở liệu, thuật toán (bán) tự động xây dựng hồ sơ người dùng TÀI LIỆU THAM KHẢO [1] Agrawal, R., Wimmers, E A Framework for Expressing and Combining Preferences Proc.of ACM SIGMOD, 2000 [2] André E., Rist, T From adaptive hypertext to personalized web companions Comm of the ACM, 45(5), 43-46, 2002 [3] Borzsonyi, S., Kossmann, D., Stocker, K The Skyline Operator Proc of ICDE, 421–430, 2001 [4] Bruno, N., Chaudhuri, S., Gravano, L Top- k Selection Queries over Relational Databases: Mapping Strategies and Performance Evaluation ACM TODS, 27(2), 153187, 2002 [5] Chomicki, J Preference Formulas in Relational Queries ACM TODS, 28(4), 427– 466, 2003 [6] Koutrika, G., Ioannidis, Y Personalization of Queries in Database Systems Proc of ICDE, 2004 45 [6] Collins, A., Quillian, M Retrieval Time from Semantic Memory J of Verbal Learning and Verbal Behaviour, Vol 8, 240-247, 1969 [7] Fishburn, P Preference Structures and Their Numerical Representations Theor Comput Sci 217, 359–383, 1999 [8] Hansson, S O Preference Logic In Handbook of Philosophical Logic, D Gabbay, Ed Vol.8, 2001 [9] Ilyas, I., Shah, R Aref, W., Vitter, J., Elmagarmid, A Rank-aware Query Optimization.Proc of ACM SIGMOD, 2004 [10] Internet Movies Database Available at www.imdb.com [11] Karypis, G Evaluation of Item-Based Top-N Recommendation Algorithms Proc of CIKM, 247-254, 2001 [12] Kießling, W., Köstler, G Preference SQL-Design, Implementation, Experiences Proc of VLDB, 2002 [13] Kießling, W Foundations of preferences in database systems Proc of VLDB, 2002 [14] Koutrika, G., Ioannidis, Y Personalization of Queries in Database Systems Proc of ICDE, 2004 [15] Lacroix, M., Lavency, P Preferences: Putting More Knowledge into Queries Proc of VLDB, 217–225, 1987 [16] Liu F., Yu C., Meng W Personalized Web Search by Mapping User Queries to Categories.Proc of ACM CIKM, 558-565, 2002 [17] Papadias, D., Tao, Y., Fu, G., Seeger, B An Optimal and Progressive Algorithm for Skyline Queries Proc of ACM SIGMOD, 467–478, 2003 [18] Pitkow, J., Schutze, H., et al Personalized Search Comm of the ACM, 45(9), 2002 [19] Shahabi, C., Banaei-Kashani, F., Chen, Y., McLeod D Yoda: An Accurate and Scalable Web-based Recommendation System Proc of COOPIS, 2001 [20] Wellman,M.P., Doyle, J Preferential semantics for goals Proc of the National Conf on AI, 698–703, 1991 [21] Zhu, L., Meng W Learning-Based Top-N Selection Query Evaluation over Relational Databases Proc of WAIM, 2004 46 ... trung vào cá nhân hóa truy vấn, lưu trữ sở thích mức độ truy vấn con, gọi thành phần sở thích Các giá trị sở thích lưu trữ sở thích chọn lọc (thành phần chọn lọc sở thích) , mối quan hệ sở thích lưu... vào truy vấn ban đầu xây dựng truy vấn Trên sở xây dựng truy vấn cá nhân kết hợp tập hợp truy vấn con, truy vấn ánh xạ một nhiều sở thích K chọn Mỗi truy vấn xây dựng cách mở rộng truy vấn ban... sở thích người dùng ảnh hưởng đến trình đánh giá truy vấn  Tìm hiểu kỹ thuật cá nhân hóa truy vấn  Xây dựng ứng dụng minh họa 1.3 Bố cục luận văn Đề tài Cá nhân hóa truy vấn dựa sở thích người

Ngày đăng: 25/07/2017, 21:33

Từ khóa liên quan

Mục lục

  • bia

  • muc luc

  • danh muc cac hinh ve

  • chuong 1

  • chuong 2

  • chuong 3

  • ket luan

  • tai lieu tham khao

Tài liệu cùng người dùng

Tài liệu liên quan