NGHIÊN CỨU PHƯƠNG PHÁP HỌC CHUYỂN GIAO CHO LỌC CỘNG TÁC 8 LUẬN VĂN THẠC SĨ KỸ THUẬT

58 709 0
NGHIÊN CỨU PHƯƠNG PHÁP HỌC CHUYỂN GIAO CHO LỌC CỘNG TÁC 8 LUẬN VĂN THẠC SĨ KỸ THUẬT

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỤC LỤC MỤC LỤC...................................................................................................................................... iii DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT .......................................................................................v DANH MỤC CÁC BẢNG .............................................................................................................. vi DANH MỤC CÁC HÌNH ............................................................................................................. vii MỞ ĐẦU ......................................................................................................................................... 1 CHƯƠNG 1: TỔNG QUAN VỀ HỌC CHUYỂN GIAO ............................................................... 3 1.1. Giới thiệu chung .................................................................................................................. 3 1.2. hái niệm à đ nh nghĩa ..................................................................................................... 3 1.3. Phân oại các phương pháp học chuy n giao ...................................................................... 4 1.3.1. Học chuy n giao quy nạp (Inductive transfer learning) ...................................................... 4 1.3.2. Học chuy n giao t ng cường (Transductive transfer learning) ........................................... 5 1.3.3. Học chuy n giao hông giám át (Un uper i ed tran fer earning) ................................... 5 1.3.4. Tổng k t phân oại các phương pháp học chuy n giao: ...................................................... 6 1.4. Chuy n giao tri thức thông qua í dụ huấn luyện (Transferring knowledge of instances) . 7 1.4.1. Chuy n giao tri thức thông qua í dụ huấn luyện trong học quy nạp ................................. 7 1.4.2. Chuy n giao tri thức thông qua í dụ huấn luyện trong học t ng cường ............................ 8 1.5. Chuy n giao tri thức từ bi u diễn đặc trưng ........................................................................ 9 1.5.1. Chuy n giao tri thức từ bi u diễn đặc trưng trong học chuy n giao quy nạp .................... 9 1.5.2. Chuy n giao tri thức từ bi u diễn đặc trưng trong học chuy n giao t ng cường ................ 9 1.5.3. Chuy n giao tri thức từ bi u diễn đặc trưng trong học hông giám át .............................. 9 1.6. Chuy n giao tri thức từ các quan hệ .................................................................................. 10 1.7. Ứng dụng của học chuy n giao ......................................................................................... 10 1.8.Kết luận chương 1 ................................................................................................................... 10 CHƯƠNG 2: LỌC CỘNG TÁC BẰNG PHƯƠNG PHÁP HỌC CHUYỂN GIAO .................... 12 2.1. Phát i u ài toán ọc c ng tác .......................................................................................... 12 2.2. M t số nghiên cứu iên quan ............................................................................................. 13 iv 2.3. Lọc c ng tác dựa ào nhớ ............................................................................................ 14 2.3.1. Phương pháp U erBa ed à ItemBa ed ............................................................................ 15 2.3.2. Hạn ch của phương pháp U er-Ba ed à Item-Based ..................................................... 16 2.3.3. Phương pháp cải ti n ......................................................................................................... 17 2.4. Phương pháp học chuy n giao cho lọc c ng tác ............................................................... 18 2.4.1. Học chuy n giao từ người d ng đ n sản phẩm ................................................................. 18 2.4.2. Học chuy n giao từ sản phẩm đ n người d ng ................................................................. 20 2.4.3. K t hợp gi a hai ki u quan át .......................................................................................... 22 2.4.3.1. Phương pháp Tran fer - UserBased ....................................................................... 23 2.4.3.2. Phương pháp Tran fer -ItemBased ......................................................................... 27 2.5. Ví dụ minh họa .................................................................................................................. 30 2.6. Kết luận chương 2 ........................................................................................................... 37 CHƯƠNG 3. THỬ NGHIỆM VÀ ĐÁNH GIÁ ............................................................................ 38 3.1. D liệu thử nghiệm ........................................................................................................... 38 3.2. Phương pháp thử nghiệm .................................................................................................. 39 3.3. K t quả thử nghiệm ........................................................................................................... 40 3.4. Đánh giá t quả ............................................................................................................... 43 3.5. Kết luận chương 3 ........................................................................................................... 45 KẾT LUẬN ................................................................................................................................... 47 TÀI LIỆU THAM KHẢO ............................................................................................................. 48

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN THANH HẢI ĐỀ TÀI NGHIÊN CỨU PHƯƠNG PHÁP HỌC CHUYỂN GIAO CHO LỌC CỘNG TÁC LUẬN VĂN THẠC SĨ KỸ THUẬT HÀ NỘI, 2013 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THÔNG - NGUYỄN THANH HẢI ĐỀ TÀI NGHIÊN CỨU PHƯƠNG PHÁP HỌC CHUYỂN GIAO CHO LỌC CỘNG TÁC CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN MÃ SỐ: 60.48.01.04 LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC: TS NGUYỄN DUY PHƯƠNG HÀ NỘI, 2013 i LỜI CẢM ƠN Trong thời gian học tập Học viện Công nghệ Bưu Viễn thơng em quan tâm dạy bảo, hướng dẫn tận tình thầy cô giáo, em xin gửi lời cảm ơn chân thành tới thầy, cô Đặc biệt xin gửi lời cảm ơn trân trọng tới thầy giáo TS Nguyễn Duy Phương, người tận tình hướng dẫn em suốt trình thực uận n tốt nghiệp Bên cạnh đ em c ng nhận ự tạo u iện h trợ nhiệt tình cán , trợ tinh thần đoàn nh, Ch hoa uốc t Sau đại học, nhận ự chia phối hợp ới t tập th ớp M12CQCT01 B in trân trọng cảm ơn các Bạn Cuối c ng xin n i ời cảm ơn tới gia đình nh ng người thân yêu nh ng người uôn uôn đ ng iên, h trợ trình học tập chương trình Thạc k thuật Học iện Cơng nghệ Bưu iễn thơng, đặc iệt q trình tốt nghiệp, thực hoàn thành uận n Trân trọng! Học viên Nguyễn Thanh Hải ii LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu riêng tơi Các ố liệu, k t nêu uận n trung thực chưa công ố cơng trình hác Hà Nội, ngày tháng năm 2013 Tác giả luận văn Nguyễn Thanh Hải iii MỤC LỤC MỤC LỤC iii DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT .v DANH MỤC CÁC BẢNG vi DANH MỤC CÁC HÌNH vii MỞ ĐẦU CHƯƠNG 1: TỔNG QUAN VỀ HỌC CHUYỂN GIAO 1.1 Giới thiệu chung 1.2 hái niệm đ nh nghĩa 1.3 Phân oại phương pháp học chuy n giao 1.3.1 Học chuy n giao quy nạp (Inductive transfer learning) 1.3.2 Học chuy n giao t ng cường (Transductive transfer learning) 1.3.3 Học chuy n giao hông giám át (Un uper i ed tran fer earning) 1.3.4 Tổng k t phân oại phương pháp học chuy n giao: 1.4 Chuy n giao tri thức thơng qua í dụ huấn luyện (Transferring knowledge of instances) 1.4.1 Chuy n giao tri thức thông qua í dụ huấn luyện học quy nạp 1.4.2 Chuy n giao tri thức thơng qua í dụ huấn luyện học t ng cường 1.5 Chuy n giao tri thức từ bi u diễn đặc trưng 1.5.1 Chuy n giao tri thức từ bi u diễn đặc trưng học chuy n giao quy nạp 1.5.2 Chuy n giao tri thức từ bi u diễn đặc trưng học chuy n giao t ng cường 1.5.3 Chuy n giao tri thức từ bi u diễn đặc trưng học hông giám át 1.6 Chuy n giao tri thức từ quan hệ 10 1.7 Ứng dụng học chuy n giao 10 1.8.Kết luận chương 10 CHƯƠNG 2: LỌC CỘNG TÁC BẰNG PHƯƠNG PHÁP HỌC CHUYỂN GIAO 12 2.1 Phát i u ài toán ọc c ng tác 12 2.2 M t số nghiên cứu iên quan 13 iv 2.3 Lọc c ng tác dựa nhớ 14 2.3.1 Phương pháp U erBa ed ItemBa ed 15 2.3.2 Hạn ch phương pháp U er-Ba ed Item-Based 16 2.3.3 Phương pháp cải ti n 17 2.4 Phương pháp học chuy n giao cho lọc c ng tác 18 2.4.1 Học chuy n giao từ người d ng đ n sản phẩm 18 2.4.2 Học chuy n giao từ sản phẩm đ n người d ng 20 2.4.3 K t hợp gi a hai ki u quan át 22 2.4.3.1 Phương pháp Tran fer - UserBased 23 2.4.3.2 Phương pháp Tran fer -ItemBased 27 2.5 Ví dụ minh họa 30 2.6 Kết luận chương 37 CHƯƠNG THỬ NGHIỆM VÀ ĐÁNH GIÁ 38 3.1 D liệu thử nghiệm 38 3.2 Phương pháp thử nghiệm 39 3.3 K t thử nghiệm 40 3.4 Đánh giá 3.5 t 43 Kết luận chương 45 KẾT LUẬN 47 TÀI LIỆU THAM KHẢO 48 v DANH MỤC CÁC KÝ HIỆU, VIẾT TẮT Từ viết tắt Từ đầy đủ Nghĩa từ CF Collaborative Filtering Lọc c ng tác ITL Inductive Transfer Learning Học chuy n giao quy nạp MAE Mean Absolute Error Đ đo trung ình giá tr tuyệt đối l i TL Transfer Learning Học chuy n giao TTL Transductive Transfer Learning Học chuy n giao t ng cường STC Self-Taught Clustering Tự phân cụm UTL Unsupervised Transfer Learning Học chuy n giao hông giám át vi DANH MỤC CÁC BẢNG Bảng 1.1 Phân loại phương pháp học chuyển giao Bảng 1.2 Phân loại theo tình trạng liệu Bảng 2.1 Ma trận đánh giá người dùng - sản phẩm 13 Bảng 2.2 Ma trận đánh giá theo quan sát từ người dùng 20 Bảng 2.3 Ma trận đánh giá theo quan sát từ sản phẩm 22 Bảng 2.4 Ma trận đánh giá ban đầu 31 Bảng 2.5 Ma trận đánh giá quan sát theo người dùng 33 Bảng 2.6 Ma trận đánh giá quan sát theo sản phẩm 34 Bảng 2.7 Bảng mức độ tương tự sản phẩm 35 Bảng 2.8 Ma trận kết Transfer – UserBased sau vòng lặp t=1 36 Bảng 2.9 Bảng mức độ tương quan người dùng 36 Bảng 2.10 Ma trận kết phương pháp Transfer-UserBased 37 Bảng 3.1 Bảng ví dụ đánh giá độ đo trung bình tuyệt đối 40 Bảng 3.2 Kết thực nghiệm phương pháp học chuyển giao dựa vào người dùng 41 Bảng 3.3: Kết thực nghiệm phương pháp học chuyển giao dựa vào sản phẩm 42 Bảng 3.4 Giá trị MAE tập ml -100K 44 vii DANH MỤC CÁC HÌNH Hình 2.1 Thuật tốn Transfer -UserBased 23 Hình 2.2 Thuật toán Transfer-ItemBased 27 Hình 3.1 Kết thực nghiệm phương pháp học chuyển giao dựa vào người dùng 42 Hình 3.2 Kết thực nghiệm phương pháp học chuyển giao dựa vào sản phẩm 43 Hình 3.3 Giá trị MAE tập ml-100K 44 MỞ ĐẦU Ngày ới ng nổ Internet người hơng cịn phải đối diện với vấn đ thi u thông tin n a ại phải đối diện với vấn đ tải thông tin Đ ng g p hệ thống tư ấn d ch vụ ứng dụng thương mại điện tử ngày trở ên quan trọng cần thi t việc giúp đỡ hách hàng nhanh ch ng ựa chọn nh ng sản phẩm ph hợp C thuật đ lọc thơng tin cho hệ thống tư ấn lọc theo n i dung Content-Ba ed Fi tering ọc c ng tác Collaborative Filtering Trong đ ọc c ng tác hai thác nh ng hía cạnh iên quan đ n th i quen dụng sản phẩm c ng đồng người d ng c c ng thích đ gợi nh ng sản phẩm thích hợp cho m i người d ng Do tính chất đơn giản hiệu cao nên ọc c ng tác áp dụng thành công cho nhi u hệ thống thương mại điện tử Trong trình nghiên cứu tri n khai ứng dụng, ên cạnh nh ng vấn đ chung ài tốn ọc c ng tác tính thưa thớt d liệu huấn luyện, xử d ng mới, hàng h a yêu cầu áp dụng nâng cao người thuật học máy hác đ t dự đoán cho ọc c ng tác trọng quan tâm nghiên cứu Hướng tới mục tiêu đ tài em nghiên cứu áp dụng phương pháp học chuy n giao cho lọc c ng tác đ cải thiện k t dự đoán lọc c ng tác, nâng cao chất ượng hệ thống tư ấn Luận n gồm chương tập trung nghiên cứu nh ng vấn đ sau: Chương 1: Tổng quan học chuyển giao Chương trình ày tổng quan v phương pháp học chuy n giao N i dung Chương trình ày nh ng ki n thức ản v học chuy n giao Phân oại phương pháp học chuy n giao, phương pháp chuy n giao tri thức, phân tích lợi th hạn ch m i phương pháp học chuy n giao Trên nghiên cứu phương pháp học chuy n giao, lựa chọn phương pháp cụ th giải quy t ài toán lọc c ng tác 35 Ta xác đ nh mức đ tương tự gi a nh ng sản phẩm theo công thức (2.2) : Ta bảng k t quả: Bảng 2.7 Bảng mức độ tương tự sản phẩm p1 p2 p3 p4 p5 p6 p7 p1 - 0.962 -0.808 -0.375 -0.778 -0.866 p2 0.962 - -0.97 0.333 -0.5 -0.578 -0.866 p3 -0.808 -0.97 - -0.971  0.721 p4 0.333 -0.971 -  -0.866 p5 -0.375 -0.5   - 0.862  p6 -0.778 -0.578 0 0.862 - p7 -0.866 -0.866 0.721 -0.866  - Bước 2: Ta tìm tập K1={p4}, K2={p1}, K3={p7}, K4={p1}, K5={p6}, K6={p5}, K7={p3} theo công thức Bước 3: Tính dự đốn đánh giá theo cơng thức ta k t quả: 36 Bảng 2.8 Ma trận kết Transfer – UserBased sau vòng lặp t=1 Sản phẩm Người dùng p1 p2 p3 p4 p5 p6 p7 u1 5 u2 5 u3 1 u4   u5     Lặp lần 2: K thừa nhãn phân oại chắn ước ta thực quan át theo người d ng: Bước 1: Với  ta tìm tập: S1={u2, u3, u4, u5}, S2={u1, u3, u4, u5}, S3={u1, u3, u4, u5}, S4={u1, u2, u3, u5}, S5={u1, u2, u3, u4} Tính đ tương tự gi a người d ng theo công thức (2.1) ta bảng k t quả: Bảng 2.9 Bảng mức độ tương quan người dùng u1 u2 u3 u4 u5 u1 - 0.951 -0.056 -0.04 0.832 u2 0.951 - -0.67 0.617 u3 -0.056 -0.67 - 0.11 0.5 u4 -0.04 0.617 0.11 - u5 0.832 0.5 - 37 Bước 2: Ta xác đ nh tập K1={u2}, K2={u1}, K3={u5}, K4={u2}, K5={u1} theo cơng thức Bước 3: Tính dự đốn đánh giá người d ng theo công thức ta k t quả: Bảng 2.10 Ma trận kết phương pháp Transfer-UserBased Sản phẩm Người dùng p1 p2 p3 p4 p5 p6 p7 u1 5 u2 5 u3 1 u4 2 u5 5 Tất giá tr  đánh giá, thuật toán t thúc  Phương pháp học chuyển giao từ sản phẩm đến người dùng Ta tính tương tự ước phương pháp học chuy n giao từ người d ng đ n sản phẩm ta thực tính tốn dựa iệc quan át theo ản phẩm trước 2.6 Kết luận chương Chương giới thiệu v lọc c ng tác dựa ài toán ọc c ng tác hai phương pháp nhớ: ItemBa ed U erBased Trên pháp ọc c ng tác ản, luận hai phương n xây dựng hai phương pháp ọc dựa phương pháp học chuy n giao M i phương pháp thực trình chuy n giao tri thức từ người d ng đ n sản phẩm ngược lại Phương pháp cải thiện chất ượng dự đoán phương pháp ọc trường hợp d liệu thưa 38 CHƯƠNG THỬ NGHIỆM VÀ ĐÁNH GIÁ Hiệu lọc c ng tác xác đ nh dựa n ng thuật toán dự đoán xác đánh giá hách hàng Chương ẽ ti n hành i m nghiệm đánh giá hiệu phương pháp lọc c ng tác dựa U er a ed, ọc c ng tác dựa ItemBased, lọc c ng tác dựa Tran fer-UserBased, lọc c ng tác dựa Transfer-ItemBa ed o ánh 3.1 t gi a phương pháp ới Dữ liệu thử nghiệm Thuật toán ọc c ng tác thử nghiệm d liệu MovieLens nh m nghiên cứu GroupLens thu c trường đại học Minnesota MovieLens gồm c ba b d liệu: B d liệu thứ ml-100K bao gồm 100.000 đánh giá 943 người d ng cho 1682 phim Giá tr đánh giá thực từ đ n Mức đ thưa thớt d liệu đánh giá 98.7% B d liệu thứ hai ml-1M bao gồm 1000.000 đánh giá 6000 người d ng cho 4000 phim B d liệu thứ ba ml-10M bao gồm 10.000.000 đánh giá 72000 người d ng Người d ng mô tả thơng tin cá nhân tuổi, giới tính, ngh nghiệp zip code… Phim mô tả thông tin tựa phim, đạo diễn, rating,… Lần ượt chọn ngẫu nhiên 200, 400, 600 người d ng tập ml-100K àm d liệu huấn luyện, 200 người d ng lựa chọn ngẫu nhiên ố ại đ àm tập ki m tra Chọn ngẫu nhiên 1000, 2000, 3000 người d ng tập ml-1M àm d liệu huấn luyện, 1000 người d ng lựa chọn ngẫu nhiên ố ại đ àm tập ki m tra Chọn ngẫu nhiên 10000, 20000, 40000 người d ng tập ml-1M àm d liệu huấn luyện, 10000 người d ng lựa chọn ngẫu nhiên ố ại đ àm tập ki m tra Đ thử nghiệm khả n ng phương pháp đ xuất so với nh ng phương pháp hác trường hợp c d liệu, chúng tơi thay đổi số ượng đánh giá m i người d ng tập ki m tra cho số ượng đánh giá i t lần ượt 5, 10 20, phần ại nh ng đánh giá cần dự đoán 39 Chọn  = 14, =0.8 cho tập d liệu huấn luyện đ thực tính tốn theo mơ hình học chuy n giao Đi u c nghĩa, iệc tính tốn mức đ tương tự gi a cặp người d ng sản phẩm thực cặp người d ng sản phẩm giao 2/3 sản phẩm người d ng c ng đánh giá Tập gi ng gi a cặp người d ng sản phẩm lấy tập inh c mức đ tương tự 0.8 (rất giống nhau) 3.2 Phương pháp thử nghiệm Trước tiên, toàn d liệu thử nghiệm chia thành hai phần, m t phần Utr sử dụng àm d liệu huấn luyện, phần ại Ute sử dụng đ ki m tra Tập Utr chứa 75% đánh giá tập Ute chứa 25% đánh giá D liệu huấn luyện sử dụng đ xây dựng mô hình theo thuật tốn mơ tả Với m i người d ng i thu c tập d liệu ki m tra, đánh giá (đã c ) người d ng chia àm hai phần Oi Pi Oi coi i t, hi đ Pi đánh giá cần dự đoán từ d liệu huấn luyện Oi Độ đo trung bình giá trị tuyệt đối lỗi Đ đo tính ằng trung ình giá tr tuyệt đối gi a hiệu đánh giá theo dự đoán đánh giá thực t hách hàng u ới tất mặt hàng thu c tập Pu (3.1) ˆu Trong đ n tổng số đánh giá tất người dung, ry giá tr đánh giá u theo dự đoán người d ng u ới sản phẩm y, ry giá tr đánh giá thực t Sai số dự đốn tồn tập d liệu ki m tra tính ằng trung ình c ng sai số dự đoán cho m i hách hàng thu c Ute  MAE MAE  u uU te U te (3.2) Hoặc M E tính ằng cơng thức: (3.3) 40 Trong đ n tổng số đánh giá tất người dung, pi,j giá tr đánh giá theo dự đoán người d ng i ới sản phẩm j, ri,j giá tr đánh giá thực t Giá tr M E thấp t dự đốn dự đốn tốt Ví dụ: Bảng 3.1 Bảng ví dụ đánh giá độ đo trung bình tuyệt đối Đánh giá theo dự Đánh giá thực tế đoán người dùng Phim P1 U1 P2 U2 P3 U3 5 P4 U4 P5 U5 P6 3.3 Khán giả U6 Kết thử nghiệm Các phương pháp ọc c ng tác dựa học chuy n giao Transfer-U erBa ed Transfer-ItemBased hác ới phương pháp ọc c ng tác dựa U erBa ed ItemBased ch phương pháp lọc c ng tác dựa học chuy n giao thực việc đồng quan át huấn luyện theo người d ng ản phẩm Hai trình này, thực iên ti p, lặp ặp lại, m i trình ại bổ xung thêm nhãn đánh giá 41 chắn àm ti n đ dự đốn nhãn đánh giá cho q trình au Vì ậy phương pháp lọc c ng tác dựa học chuy n giao đưa nhi u dự đoán đánh giá phương pháp U erBa ed ItemBa ed túy Phương pháp Tran fer-U erBa ed Tran fer-ItemBa ed hơng tính tốn đ tương quan gi a người d ng tập người d ng U mà tính tốn tập người d ng c ố đánh giá giao tối thi u  sản phẩm Si, hơng tính tốn đ tương tự gi a sản phẩm tập sản phẩm P mà tính tốn tập ản phẩm giao tối thi u  người d ng Cx Đi u giúp hạn ch nh ng ảnh hưởng vấn đ d liệu thưa thớt àm cho dự đốn đánh giá xác Do tập d liệu tương đối lớn iệc đồng quan át d liệu huấn luyện theo người d ng ản phẩm, việc ki m nghiệm nhi u thời gian, ì ậy đây, ta o ánh t ki m nghiệm phương pháp Tran fer-U erBa ed Transfer-ItemBased theo đ thưa thớt d liệu, bỏ qua việc o ánh t ki m nghiệm theo ích thước tập hàng x m hác Với tập d liệu mà ố ượng đánh giá i t lần ượt 5, 10, 15 20 ta chọn  3, 6, 10, 14 nghĩa tính tốn đ tương quan gi a người d ng đ tương tự gi a sản phẩm nh ng người d ng, ản phẩm c giao 2/3 đánh giá  Phương pháp học chuyển giao dựa vào người dùng K t ki m nghiệm Bảng 3.2 Kết thực nghiệm phương pháp học chuyển giao dựa vào người dùng Số đánh giá i t trước MAE 0.62128 10 0.59447 15 20 0.53854 0.51292 42 0.62 0.6 0.58 MAE 0.56 0.54 MAE 0.52 0.5 0.48 0.46 movielens5 movielens10 movielens15 Movielens movielens20 Hình 3.1 Kết thực nghiệm phương học chuyển giao dựa vào người dùng  Phương pháp học chuyển giao dựa vào sản phẩm K t ki m nghiệm Bảng 3.3: Kết thực nghiệm phương pháp học chuyển giao dựa vào sản phẩm Số đánh giá i t trước 10 15 MAE 0.59856 0.57201 0.50778 20 0.50712 43 0.62 0.6 0.58 MAE 0.56 0.54 MAE 0.52 0.5 0.48 0.46 movielens5 movielens10 movielens15 Movielens movielens20 Hình 3.2 Kết thực nghiệm phương pháp học chuyển giao dựa vào sản phẩm 3.4 Đánh giá kết Phương pháp học chuy n giao dựa người d ng Tranfer-UserBased phương pháp học chuy n giao dựa ản phẩm Transfer- ItemBased o ánh với hai phương pháp U erBa ed ItemBa ed lọc c ng tác trình ày Ta c ảng o ánh au : 44 Bảng 3.4 Giá trị MAE tập ml -100K Số đánh giá i t trước Phương pháp 10 15 20 UserBased 0.82314 0.78935 0.81359 0.66134 ItemBased 0.93971 0.82314 0.81359 0.78188 Transfer-UserBased 0.62128 0.59447 0.53854 0.51292 Transfer-ItemBased 0.59856 0.57201 0.50778 0.50712 0.9 0.8 0.7 MAE 0.6 UserBased 0.5 ItemBased TF-UserBased 0.4 TF-ItemBased 0.3 0.2 0.1 Movielens5 Movielens10 Movielens15 Movielens20 Hình 3.3 Giá trị MAE tập ml-100K Giá tr MAE bảng ước ượng từ trung ình 10 lần thử nghiệm ngẫu nhiên t thử nghiệm cho thấy hai phương pháp ọc c ng tác phương pháp học chuy n giao đ u cho k t tốt o ới phương pháp ọc U erBa ed ItemBa ed Sai ố MAE phương pháp học chuy n giao dựa người d ng học chuy n giao dựa ản phẩm đ u nhỏ số ượng 45 đánh giá cho trước người d ng Đi u đ c th khẳng đ nh phương pháp đ xuất cải thiện đáng k t dự đoán cho ọc c ng tác Trong trường hợp d liệu tương đối đầy đủ, cụ th hi i t trước nhi u đánh giá người d ng tập ki m tra, phương pháp học chuy n giao dựa người d ng học chuy n giao dựa ản phẩm cho lại k t tương đương Tuy nhiên, hi d liệu đi, cụ th hi bi t trước 10 đánh giá người d ng i m tra đa ố trường hợp, học chuy n giao dựa ản phẩm cho sai số MAE nhỏ o ới học chuy n giao dựa người d ng L chủ y u ực ượng tập Cx xác đ nh theo (2.13) lớn ực ượng tập Si xác đ nh theo (2.9) Đi u cho phép dự đoán nhãn phân oại bổ ung trình huấn luyện theo người d ng tốt 3.5 Kết luận chương Phương pháp ọc c ng tác ằng phương pháp học chuy n giao trình ày luận n m t cách ti p cận Bằng cách k t hợp cách quan át: quan át theo người d ng quan át theo ản phẩm đ huấn luyện b d liệu đánh giá Trong đ , trình quan át theo người d ng ẽ bổ ung nhãn phân oại chắn cho q trình tính tốn mức đ tương tự gi a cặp sản phẩm Ngược lại, trình quan át theo ản phẩm c ng ẽ bổ ung nhãn phân loại chắn cho q trình tính toán mức đ tương tự gi a cặp người d ng Bằng cách này, trường hợp d liệu đầu thưa thớt đánh giá hệ thống c th đưa tư ấn c ích Ưu m chủ y u phương pháp việc phân oại đồng thời theo người d ng ản phẩm cho phép dụng thông tin từ nh ng nh m người d ng sản phẩm tương tự nhờ cải thiện đ xác phân oại hi c d liệu K t thử nghiệm d liệu Mo ieLen cho thấy phương pháp đ xuất cho k t tốt hai phương pháp hác trường c đầy đủ d liệu trường hợp c d liệu Trong thử nghiệm ban đầu, phương pháp ọc c ng tác dựa theo người d ng, ọc c ng tác dựa theo sản phẩm phương pháp lọc c ng tác ằng phương pháp học chuy n giao o ánh qua t thử nghiệm dựa 46 đ đo ản M E Các i m thử thực thuật toán ới tập d liệu c đ lớn hác C n t ki m thử cách ti p cận lọc c ng tác ằng phương pháp học chuy n giao àm iệc tốt cách ti p cận lọc c ng tác túy Đặc biệt, trường hợp d liệu thưa thớt 47 KẾT LUẬN Trong luận n em trình ày phương pháp cải ti n thay th cho hai phương pháp truy n thống lọc c ng tác MemoryBa ed U erBa ed ItemBa ed Hai phương pháp cải ti n Transfer-U erBa ed Tran fer-ItemBased xây dựng dựa n n tảng phương pháp học chuy n giao, mà cụ th thuật chuy n giao tri thức từ í dụ huấn luyện cho học chuy n giao quy nạp Hai phương pháp đưa nhằm cải thiện nh ng hạn ch cố h u hệ thống lọc c ng tác dựa nhớ tình trạng thưa thớt v d liệu Các phương pháp ọc c ng tác dựa học chuy n giao đưa m t phương án tính đ tương quan gi a người d ng đ tương tự gi a ản phẩm m t cách tin cậy hi dựa nh ng người d ng, ản phẩm phải c giao tối thi u  sản phẩm, người ình chọn, qua đ oại bỏ thông tin hông tin cậy thu từ nh ng người d ng, ản phẩm c q ình chọn giao với người ản phẩm cần dự đoán đánh giá Bằng cách ti n hành ặp ặp lại lần ượt trình quan át theo người d ng quan át theo ản phẩm, m i trình ại bổ sung thêm nh ng nhãn phân oại chắn cho trình au, quy nạp tri thức từ d liệu huấn luyện bổ xung àm đầy dần ình chọn  àm giảm ảnh hưởng tình trạng d liệu thưa thớt Các t thử nghiệm cho thấy phương pháp ọc c ng tác dựa học chuy n giao cho k t dự đoán tốt nhi u so với phương pháp U erBa ed ItemBa ed túy Đặc biệt tình trạng d liệu thưa thớt, hi phương pháp c c ME lớn phương pháp dựa học chuy n giao c ME chấp nhận Do thời gian nghiên cứu c hạn, n ng ực inh nghiệm chưa nhi u, luận n tốt nghiệp hông tránh hỏi nh ng thi u đ ng g p t hạn ch Em mong i n các thầy, cơ, ạn đ luận hồn chỉnh Xin trân trọng cảm ơn! n em 48 TÀI LIỆU THAM KHẢO [1] TS Nguyễn Duy Phương, TS Từ Minh Phương (2008), “Lọc c ng tác ằng phương pháp học đa nhiệm” [2] A Blum, T Mitchell (1998) “Combining labeled and unlabeled data with cotraining” [3] A Yun- n Chen and D McLeod, “Collaborative Filtering for Information Recommendation Systems” [4] B Sarwar, G arypi , J on tan, and J Ried (2001), “Item-Based Collaborative Filtering Recommendation Algorithms” [5] C.C ggarwa , J.L Wo f, L Wu, and P.S.Yu (1999), “Horting Hatches an Egg: A New Graph-Theoretic Approach to Collaborative Filtering” [6] Diploma Thesis, Stephan Spiegel “A Hybrid Approach to Recommender Systems based on Matrix Factorization” [7] G doma iciu , Tuzhi in (2005), “Toward the Next Generation of Recommender Systems: A Survey of the State-of-the-Art and Possible Extensions” [8] J S Breese, D Heckerman, and C Kadie (1998), “Empirical analysis of Predictive Algorithms for Collaborative Filtering” [9] J Wen, W Zhou (2012) “An Improved Item-based Collaborative Filtering Algorithm Based on Clustering Method” [10] J.L Herlocker, J.A Konstan, L.G Terveen, and J.T Riedl (2004), “Evaluating Collaborative Filtering Recommender Systems” [11] Michael J Pazzani, Daniel Billsus “Content-based Recommendation Systems” [12]Mukund Deshpande, George Karypis “ Item-Based Top-N Recommendation Algorithm” [13] Rajat Raina, Alexis Battle, Honglak Lee, Benjamin Packer, Andrew Y.Ng “Self-taught Learning: Transfer Learning from Unlabeled Data” 49 [14] R Jin, L Si, and C Zhai (2003), “Preference-Based Graphic Models for Collaborative Filtering” [15] Sinno Jia in Pan “Transfer Learning” [16] Sinno Jian in Pan, uiang Yang, Fe ow (2010) “A Survey on Transfer Learning” [17] T Hofmann (2004), “Latent Semantic Models for Collaborative Filtering” [18] Wei Wang, Zhi-Hua Zhou (2010) “A New Analysis of Co-Training” [19] X Su, T M ho hgoftaar (2009), “A Survey of Collaborative Filtering Techniques” [20] matriain, M Torren , P Re nic , M Zan er “Incremental collaborative filtering via evolutionary co-clustering” [21] Z Huang, H Chen, D Zeng (2004), “Applying Associative Retrieval Techniques to Alleviate the Sparsity Problem in Collaborative Filtering” [22] Z Huang, D Zeng, H Chen (2007), “Analyzing Consumer-product Graphs: Empirical Findings and Applications in Recommender Systems” [23] Z Huang, H Chen, D Zeng (2004), “Applying Associative Retrieval Techniques to Alleviate the Sparsity Problem in Collaborative Filtering” ... với tác ụ đích ta c th phân oại phương pháp học truy n giao theo bảng sau: Bảng 1.1 Phân loại phương pháp học chuyển giao Phân oại phương pháp học C Học truy n thống Phương pháp t ng cường Học. .. n giao tri thức, phân tích lợi th hạn ch m i phương pháp học chuy n giao Trên nghiên cứu phương pháp học chuy n giao, lựa chọn phương pháp cụ th giải quy t ài toán lọc c ng tác 2 Chương 2: Lọc. .. tỏ phương pháp thực đ tài, mục ti p theo em trình phương pháp ọc c ng tác dựa nhớ Ti p đ n phương pháp ọc c ng tác dựa phương pháp học chuy n giao 2.3 Lọc cộng tác dựa vào nhớ Lọc c ng tác dựa

Ngày đăng: 23/05/2014, 16:47

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan