Khai thác quan hệ xã hội trong tư vấn xã hội

66 196 0
Khai thác quan hệ xã hội trong tư vấn xã hội

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠN Trước tiên, em xin bày tỏ lòng biết ơn chân thành sâu sắc tới Thầy giáo, PGS-TS Hà Quang Thụy tận tình bảo, hướng dẫn, động viên giúp đỡ em suốt trình thực đề tài Em xin gửi lời cảm ơn sâu sắc tới quý Thầy Cô giáo Khoa Công nghệ thông tin nói riêng trường Đại học Công nghệ - Đại Học Quốc Gia Hà Nội nói chung, truyền đạt kiến thức quý báu cho em năm học qua Em xin gửi lời cảm ơn tới anh chị, bạn em sinh viên nhóm “Tư vấn xã hội” Phòng thí nghiệm Công nghệ tri thức KT-Lab giúp em nhiều việc hỗ trợ kiến thức chuyên môn để hoàn thành tốt khóa luận Em xin gửi lời cảm ơn sâu sắc tới công ty DataSection Việt Nam tạo điều kiện tốt cho em thực đề tài công ty Đồng thời, em xin gửi lời cảm ơn tới anh chị công ty giúp đỡ em suốt trình thực đề tài Con xin nói lên lòng biết ơn vô hạn đến Bố Mẹ, Bố Mẹ nguồn chăm sóc, động viên, khích lệ đường học vấn Cuối cùng, xin gửi lời cảm ơn tới anh chị bạn, đặc biệt thành viên lớp K56CB ủng hộ, giúp đỡ suốt trình học tập giảng đường đại học thực đề tài Tôi xin chân thành cảm ơn! Hà Nội, ngày tháng 12 năm 2014 Sinh viên Thái Thị Hoài i TÓM TẮT Tóm tắt: Hệ tư vấn đóng vai trò quan trọng việc gợi ý thông tin liên quan tới sở thích người dùng Sự phát triển nhanh chóng phương tiện xã hội Facebook1, Twitter2, Google+3 … dẫn đến lượng người dùng khổng lồ tạo kết nối, mối quan hệ tường minh tiềm ẩn cho nhiều tiềm khai thác để tư vấn Tư vấn xã hội sử dụng tài nguyên từ phương tiện xã hội bổ sung vào tư vấn trở thành chủ đề nghiên cứu nhận quan tâm đặc biệt, đặc biệt nhóm nghiên cứu Huan Liu Hao Ma Nói riêng, khai thác ngữ cảnh xã hội toàn cục cục vào hệ tư vấn đề tài nghiên cứu thời [4, 6, 13] Khóa luận tập trung vào giải pháp khai thác ngữ cảnh xã hội vào hệ tư vấn dựa tiếp cận Jiliang Tang cộng sự, 2014 [13] Khóa luận đề nghị mô hình tư vấn dựa khai thác ngữ cảnh xã hội từ phương tiện xã hội Facebook, phương án định lượng hạng người dùng sản phẩm lựa chọn Khóa luận xây dựng phần mềm thi hành mô hình đề xuất nói Tiến hành thử nghiệm miền liệu điện thoại di động thông minh Samsung page Facebook từ hệ thống cửa hàng bán điện thoại di động Cellphones (https://www.facebook.com/cellphones.befirst.always) với 870 người dùng 1050 đánh giá cho thấy tính khả quan với độ đo sai số NMAE khoảng 0.13 đánh giá mô hình tư vấn Từ khóa: hệ tư vấn, ngữ cảnh xã hội, tư vấn xã hội https://facebook.com https://twitter.com https://plus.goolge.com ii LỜI CAM ĐOAN Tôi xin cam đoan kỹ thuật sử dụng ngữ cảnh xã hội hệ tư vấn phương tiện xã hội trình bày khóa luận thực hướng dẫn PGS.TS Hà Quang Thụy Tất tham khảo từ nghiên cứu liên quan nêu nguồn gốc cách rõ ràng từ danh mục tài liệu tham khảo khóa luận Trong khóa luận, việc chép tài liệu, công trình nghiên cứu người khác mà không rõ tài liệu tham khảo Hà Nội, ngày tháng 12 năm 2014 Tác giả Thái Thị Hoài iii Mục lục LỜI CẢM ƠN i TÓM TẮT ii LỜI CAM ĐOAN iii Danh sách thuật ngữ từ viết tắt vi Danh sách bảng vii Danh sách hình vẽ viii Mở đầu Chương Giới thiệu chung hệ tư vấn tư vấn xã hội 1.1.Hệ tư vấn truyền thống 1.1.1.Giới thiệu chung hệ tư vấn 1.1.2.Bài toán tư vấn truyền thống 1.1.3.Phân loại hệ tư vấn 1.1.4 Các thách thức hệ tư vấn 12 1.2.Tư vấn xã hội 14 1.2.1.Phương tiện xã hội 14 1.2.2.Khái niệm tư vấn xã hội 15 1.2.3.Các toán tư vấn xã hội 16 Tóm tắt chương 17 Chương Khai thác quan hệ xã hội tư vấn xã hội 19 2.1 Ứng dụng lý thuyết xã hội khai phá phương tiện xã hội 19 2.1.1 Lý thuyết xã hội vai trò liên quan đến người dùng 19 2.1.2 Lý thuyết xã hội vai trò liên quan đến mối quan hệ 21 2.1.3 Lý thuyết xã hội nhiệm vụ liên quan nội dung 23 2.2 Nhân tử ma trận xác suất tư vấn xã hội 24 2.2.1 Ý tưởng phương pháp nhân tử ma trận 25 2.2.2 Nội dung phương pháp 26 2.2.3 Học tư vấn với yếu tố mối quan hệ xã hội tiềm ẩn, tường minh 27 iv 2.3.Khai thác ngữ cảnh xã hội toàn cục, cục cho tư vấn xã hội 30 2.3.1 Khai thác ngữ cảnh xã hội cục 30 2.3.2 Khai thác bối cảnh xã hội toàn cục 32 2.3.3 Một số phương pháp trích chọn đặc trưng cục bộ, toàn cục 33 Tóm tắt chương 38 Chương Một mô hình tư vấn xã hội dựa quan hệ xã hội Facebook 39 3.1 Giới thiệu sơ 39 3.1.1 Ngữ cảnh xã hội cục 39 3.1.2 Ngữ cảnh xã hội toàn cục 39 3.2 Mô hình tổng quan 40 3.2.1 Chi tiết bước pha mô hình 44 Tóm tắt chương 48 Chương Thực nghiệm đánh giá 49 4.1 Giới thiệu chung 49 4.2 Phần mềm thực nghiệm 50 4.3 Dữ liệu 51 4.4 Kết thực nghiệm nhận xét 52 Tóm tắt chương 55 Kết luận 56 Kết đạt khóa luận 56 Định hướng tương lai: 56 Tài liệu tham khảo 57 Tài liệu tiếng Việt 57 Tài liệu tiếng Anh 57 v Danh sách thuật ngữ từ viết tắt Tiếng Anh/Từ viết tắt Tiếng Việt/Cụm từ đầy đủ Follower Người theo dõi GLSPFS Global and local structure preservation framework for feature selection Item mục (còn dịch "mặt hàng", "sản phẩm", "dịch vụ" ) L21RFS Robust Feature Selection via l2,1-norm minimization LLE Local Linear Embedding LLFS Local-learning Based Feature Selection LPP Linear Preserve Projection LTSA Local Tangent Space Alignment MF Matrix Factorization Recommender system | Recommendation Hệ tư vấn hệ gợi ý system Social media Phương tiện xã hội Social network Mạng xã hội Social recommendation system Hệ tư vấn xã hội SoRec Social Recommend SoReg Social Regularization Spammer Kẻ gửi thư rác SPFS Similarity Preserving Feature Selection TFIDF Term Frequency Frequency vi Inverse Document Danh sách bảng Bảng Ma trận user-item Bảng Ví dụ ma trận user-item 25 Bảng Cấu hình hệ thống thực thực nghiệm 50 Bảng Các công cụ phần mềm sử dụng 51 vii Danh sách hình vẽ Hình 1 Tư vấn dựa nội dung Hình Tư vấn dựa lọc cộng tác Hình Tư vấn dựa phương pháp lai 12 Hình Thống kê phát triển ngày tăng Twitter Facebook[6] 15 Hình Thông tin xã hội biểu diễn ma trận user - user S[6] 16 Hình Dự đoán liên kết cách sử dụng vector đặc trưng cho cặp người dùng[6] 17 Hình Đồ thị kết nối xã hội [11] 28 Hình 2 Ma trận user-item tương ứng[11] 28 Hình Ma trận dự đoán đánh giá user-item[11] 28 Hình Ví dụ người dùng kết nối xã hội với sở thích tương tự 31 Hình Một mô hình tư vấn phương tiện xã hội Facebook 43 Hình Một đoạn liệu mẫu 45 Hình 3 Một đoạn liệu gán nhãn quan điểm người dùng 46 Hình Một đoạn liệu comment sản phẩm tách 52 Hình Thông tin người dùng thu thập 52 Hình Kết xếp hạng người dùng 53 Hình 4 Kết thực nghiệm cho hạng sản phẩm 54 viii Mở đầu Ngày nay, phương tiện xã hội phát triển nhanh chóng, tăng theo cấp số nhân Với phát triển đó, phương tiện xã hội góp phần làm giàu nguồn tài nguyên thông tin cho khai phá liệu, mở miền liệu mới, đa dạng cho khai phá liệu Theo số liệu thống kê4, đến cuối tháng năm 2014, số người dùng tích cực trang mạng xã hội 1,35 tỷ người, tăng 14% so với kỳ năm 2013 Với Twitter, số lượng Tweet sinh ngày đạt mức 400 triệu (tính đến tháng năm 2012, theo Dave Feinlenib5) Số lượng người dùng mạng tăng, dẫn đến số lượng kết nối người dùng với tăng lên đáng kể Điều cho thấy tiềm khai phá liệu phương tiện xã hội lớn Bên cạnh đó, kéo theo vấn đề tải thông tin, gây khó khăn không nhỏ cho việc thực khai phá liệu thực ứng dụng liên quan, có hệ tư vấn Các hệ thống tư vấn truyền thống thướng dựa vào đánh giá chuyên gia với tiêu chuẩn cụ thể, dựa vào đánh giá người dùng Tuy nhiên, với lượng liệu khổng lồ phong phú số lượng chủng loại, lĩnh vực lớn Như vậy, hệ tư vấn dựa vào người đảm đương Trong thực tế, cần tham khảo ý kiến người khác, thường tìm đến bạn bè, người thân để nghe họ tư vấn Phương pháp độ xác cao yêu cầu tính nhanh chóng lại đáp ứng tức Hệ tư vấn giúp cho người dùng hiểu sản phẩm doanh nghiệp, hay giúp cho người dùng thao tác tốt dịch vụ trực tuyến Từ giúp cho doanh nghiệp, nhà cung cấp dịch vụ cải tiến tốt hệ thống để đảm bảo hài lòng chủ quan khách hàng, mở rộng số lượng người dùng quan tâm, quảng bá thương hiệu, hình ảnh doanh nghiệp, dịch vụ… Mục tiêu toán tư vấn đưa gợi ý sát với sở thích, quan tâm người dùng Khóa luận đề cập tới hệ tư vấn có sử dụng ngữ cảnh xã hội, bao gồm ngữ cảnh xã hội toàn cục, cục Ngữ cảnh xã hội toàn cục xét đến danh tiếng người dùng toàn mạng xã hội Ngữ cảnh xã hội cục xét đến quan hệ bạn bè, hàng xóm, k láng giếng gần người dùng Hướng tiếp cận dựa nghiên cứu gần Jiliang Tang cộng [18] Nội dung khóa luận chia thành chương sau: Chương 1: Khóa luận giới thiệu khái quát hệ tư vấn truyền thống hệ tư vấn xã hội, đồng thời khóa luận trình bày số phương pháp để giải http://investor.fb.com http://www.forbes.com/sites/davefeinleib/ toán tư vấn truyền thống toán tư vấn xã hội Ngoài ra, chương nêu lên nhìn tổng quan xu hướng phát triển số phương tiện xã hội phổ biến Twitter, Facebook…Từ thấy tiềm khai thác mạng xã hội để sử dụng vào hệ tư vấn phương tiện xã hội Chương 2: Khóa luận trình bày chi tiết phương pháp ma trận nhân tử tư vấn tiềm khai thác ngữ cảnh phương tiện xã hội tư vấn Nổi bật chương đề cập đến ý tưởng thực việc khai thác ngữ cảnh vào hệ tư vấn áp dụng khóa luận Chương 3: Khóa luận trình bày tư tưởng phương pháp thực toán tư vấn phương tiện xã hội Facebook Đồng thời, khóa luận giới thiệu chi tiết pha bước thực mô hình giới thiệu với miền liệu tập đánh giá sản phẩm điện thoại thông minh Samsung Chương 4: Khóa luận trình bày số thực nghiệm việc đưa sản phẩm tư vấn dưuạ đánh giá người dùng số đặc trưng với miền sản phẩm điện thoại di động thông minh Samsung Kết thực nghiệm cho kết sai số trung bình tuyệt đối chuẩn xấp xỉ 0.13, chứng tỏ mô hình thực nghiệm cho kết tốt Phần kết luận: Tóm lược kết đạt khóa luận định hướng phát triển tương lai 3.2.1 Chi tiết bước pha mô hình 3.2.1.1 Trích xuất liệu Từ tập liệu công ty Data Section Việt Nam cung cấp, khóa luận phân tích để trích xuất tập liệu cần có Trước tiên việc đọc phân tích liệu, khóa luận nhận thấy page Facebook Cellphones có pageID “114771895207322” Do đó, khóa luận tiến hành trích xuất liệu liên quan đến page này, loại bỏ liệu không cần thiết Do file liệu cung cấp có định dạng file json, nên việc xác định phần liệu (chủ đề, comment…) thực thông qua ký tự phân tách phần(content, dấu {…) Đầu vào: Tập liệu có sẵn, tập tên sản phẩm điện thoại di động thông minh Samsung Đầu ra: Tập liệu liên quan đến page Cellphones Các bước: Đọc liệu có sẵn, xác định page ID Cellphones 114771895207322 Tìm liệu page: a Đọc dòng file b Nếu dòng có chứa “114771895207322” ghi file output c Nếu không bỏ qua, đọc dòng Phân tách liệu dòng từ file output thành kiểu String thông qua biểu thức quy Trích xuất tên sản phẩm, đánh giá người dùng dành cho sản phẩm từ dòng liệu Trả tên sản phẩm nói đến, tập đánh giá người dùng với sản phẩm Ví dụ sau minh họa phần liệu mẫu có Quan sát đoạn liệu này, ta thấy rằng, dòng liệu có cấu trúc file json Nếu dòng liệu post url tham số fid comment_id Dựa vào biểu thức quy mà ta tìm liệu cần lấy thông qua hàm spit() Java cung cấp Từ ta lấy số lượng like post thông qua url 44 Hình Một đoạn liệu mẫu 3.2.1.2 Đánh giá quan điểm người dùng Từ tập đánh giá trích xuất với tập từ thể quan điểm định nghĩa trước, tiến hành gán nhãn quan điểm cho đánh giá người dùng Trong đó, tập từ thể quan điểm định nghĩa sau: BAD_SENTIMENT = { "chả", "chê", "xấu", "tệ", "kém", "shit", "tồi", "chán", "nản", "ghét", "thua", "chậm" }; GOOD_SENTIMENT = { "ngon", "tốt", "bền", "được", "chuẩn", "thích", "yêu", "nhanh", "khỏe", "đẹp", "hay", "tiện" }; WEIGHT_SENTIMENT = { "ghê", "vãi", "hơn", "khá", "nhất", "rất" , "được", "hơi", "tạm"}; Trong đó, BAD_SENTIMENT tập từ negative, GOOD_SENTIMENT tập từ positive, WEIGHT_SENTIMENT tập từ thể mức độ đánh giá người dùng(nhấn mạnh ý khen, chê) Tập nhãn xác định số nguyên có giá trị đoạn [1, 5] Trong đó, thể quan điểm đánh giá xấu, 2: xấu, 3: trung lập, 4: tốt, 5: tốt Đầu vào: Tập câu đánh giá người dùng, tập từ thể quan điểm, tập nhãn Đầu ra: Tập câu gán nhãn Các bước: Đọc câu đánh giá Lặp hết độ dài câu đánh giá: 45 a Kiểm tra câu có chưa tập từ thể quan điểm hay không? i Nếu có, tiếp tục kiểm tra chứa từ negative hay positve ii Kiểm tra từ mức độ đánh giá iii Trả nhãn gán cho câu tương ứng giá trị nguyên từ 1-5 b Nếu không, bỏ qua Trả tập câu gán nhãn Ví dụ sau minh họa phần việc gán nhãn cho câu đánh giá người dùng: Hình 3 Một đoạn liệu gán nhãn quan điểm người dùng Các từ khoanh tròn từ thể quan điểm người dùng Khoanh hình vuông nhãn câu đánh giá Từ ta có nhận xét rằng, câu đánh giá người dùng dành cho sản phẩm post giới thiệu Mà người dùng đề cập đến sản phẩm khác Điều vô tình tạo nhiễu trình xử lý gán nhãn Tuy nhiên, phương pháp đánh giá xác phần quan điểm người dùng dành cho sản phẩm mà họ quan tâm 3.2.1.3 Xếp hạng người dùng, sản phẩm Với phương pháp đề xuất, việc xếp hạng sản phẩm dựa vào điểm số sản phẩm đánh giá người dùng Từ tập liệu gán nhãn quan điểm người dùng, với số lượng like thu thập post, khóa luận tiến hành đánh hạng cho sản phẩm tương ứng với post Ý tưởng việc xác định hạng sản phẩm(bài post) dựa vào hai yếu tố đề cập rateFactor1 rateFactor2 46 a) Xếp hạng sản phẩm Đầu vào: Tập liệu gán nhãn quan điểm người dùng, số lượng like post Đầu ra: Hạng post(sản phẩm tương ứng) Các bước: Tính tổng số comment post Tính số comment gán nhãn cao(>=3), số comment gán nhãn thấp(< 3) Tính rateFactor1 = goodComment / (badComment + goodComment) Tính rateFactor2 = 0.3   likeNumer  0.7   commentNumber likeNumber  commentNumber ratePost = rateFactor1 + rateFactor2 Trả hạng sản phẩm đánh giá b) Xếp hạng người dùng Để xếp hạng người dùng, khóa luận dựa vào số lượng like đánh giá người dùng với post page Tương tự với việc xếp hạng sản phẩm, xếp hạng người dùng, trọng số like comment tương ứng 0.3 0.7 Lý xác định trọng số đề cập phần Đầu vào: Số lượng like số lượng đánh giá post page Đầu ra: Hạng người dùng Các bước: Lấy thông tin người dùng thông qua restFb API: bao gồm số lượng like comment người dùng Tính hạng người dùng: rateUser = 0.3  numberLike  0.7  numberComment numberLike  numberComment Trả kết hạng người dùng 47 3.2.1.4 Tư vấn cho người dùng Từ kết có bước ta rút tập sản phẩm người dùng quan tâm nhiều thông qua giá trị hạng sản phẩm Hạng cao sản phẩm đánh giá tốt có nhiều người quan tâm Tương tự với tập liệu hạng người dùng Người dùng có hạng lớn chứng tỏ họ có ảnh hưởng lớn cộng đồng người dùng có quan tâm đến dòng sản phẩm điện thoại di động thông minh Samsung Do mà đánh giá họ đánh giá cao Kết hợp hai yếu tố trên, ta đưa danh sách sản phẩm đánh hạng tốt có tham gia đánh giá người dùng có hạng cao Tóm tắt chương Chương khóa luận trình bày tư tưởng phương pháp thực toán tư vấn phương tiện xã hội Facebook số công trình liên quan Khóa luận giới thiệu chi tiết pha bước thực pha hệ thống Trong chương tiếp theo, khóa luận tiến hành thực nghiệm phương pháp xây dựng đánh giá kết đạt 48 Chương Thực nghiệm đánh giá 4.1 Giới thiệu chung Dựa vào mô hình đề xuất chương 3, khóa luận tiến hành thực nghiệm việc trích chọn chủ đề (tên sản phẩm) đánh giá người dùng với sản phẩm tương ứng Để làm rõ mô hình đề xuất pha mô hình, thực nghiệm miền sản phẩm điện thoại thông minh Samsung tiến hành Mục đích trình thực nghiệm nhằm đưa sản phẩm tốt, đánh giá cao để tư vấn cho người dùng page Facebook Cellphones Qua rút dòng sản phẩm người dùng quan tâm Nói cách khác, thực nghiệm trình thực hóa mô hình nêu Chương Từ đó, giúp cho Cellphones đưa chiến lược bán hàng để nâng cao doanh số (nên nhập kho dòng sản phẩm nào…); cung cấp cho Samsung thị hiếu người dùng Việt Nam để hãng đưa giải pháp cải tiến, mở rộng thị trường Tập liệu dùng để tiến hành thực nghiệm file liệu lọc tách từ tập liệu nguồn ban đầu, gồm có 4283 ghi Mỗi ghi(dòng) gồm có url post page Facebook Cellphones, với đánh giá người dùng(nếu có) với post đó(sản phẩm) Định dạng file json, mà việc phân tích liệu thực dễ dàng Các phương thức tiến hành thực nghiệm giới thiệu Chương Để cụ thể hóa bước thực mô hình nêu, khóa luận tiến hành xây dựng module để xử lý sau: - Vnu.ktlab.hoaitt_56.Algorithms: gồm có class thực thuật toán đánh giá quan điểm người dùng, tính hạng người dùng tính hạng post - Vnu.ktlab.hoaitt_56.Data: gồm class object thể thông tin liệu comment, post, user… - Vnu.ktlab.hoaitt_56.Programs: gồm có class thực chức cài đặt package khác class thực việc gom post nói sản phẩm - Vnu.ktlab.hoaitt_56.Utilities: package có class định nghĩa tập keyword thể quan điểm người dùng (tập từ negative, positive, từ mang trọng số) tập keyword tên sản phẩm điện thoại di động thông minh Samsung Bên cạnh đó, package chứa class xử lý việc đọc file, tách liệu thành tập liên quan đến postType comment 49 Hình Các module phần mềm 4.2 Phần mềm thực nghiệm Cấu hình phần cứng Thành phần Chỉ số CPU 2.5 GHz Core Intel RAM GB OS Windows 8.1 Bộ nhớ 500GB Bảng Cấu hình hệ thống thực thực nghiệm Các phần mềm sử dụng 50 STT Tên phần mềm Tác giả Nguồn Eclipse Standard 4.3.2 Kepler – 64 bit restFb API Open source software http://restfb.com/ Json simple 1.1.1 A simple Java toolkit https://code.google.com/p/jso n-simple/ Microsoft Excel 2013 Microsoft https://store.office.com https://www.eclipse.org Bảng Các công cụ phần mềm sử dụng 4.3 Dữ liệu Khóa luận thực nghiệm miền liệu tương tác đánh giá khách hàng miền sản phẩm điện thoại di động thông minh hãng Samsung(Samsung Galaxy) Tập liệu thô ban đầu công ty Data Section Việt Nam cung cấp, bao gồm liệu nhiều page, forum khác nhau, thuộc nhiều miền liệu khác như: ca nhạc, phim, tác giả tiếng…Từ tập liệu này, thực việc trích chọn liệu liên quan page https://www.facebook.com/cellphones.befirst.always Đây page thức hệ thống cửa hàng bán điện thoại di động Cellphones có số lượng đại lý lớn, đặc biệt thị trường thành phố Hà Nội thành phố Hồ Chí Minh Mặt khác, nhà phân phối nhận nhiều đánh giá tích cực từ cộng đồng người dùng trang mạng xã hội khác tinhte.vn, nhattao.vn, vn-zoom.com…Điều phản ánh mức độ tin tưởng người dùng với nhà phân phối xác tương tác page Facebook Tập đánh giá post thu thập tính đến ngày 10/10/2014 Căn vào liệu cung cấp trang http://www.Samsung.com/vn trang chủ Samsung để giới thiệu dòng sản phẩm điện thoại hãng cho người dùng biết; thực việc định nghĩa tập sản phẩm điện thoại thông minh hãng gồm có 27 dòng sản phẩm khác nhau: { "s3 mini", "trend lite", "trend plus", "note 4", "note 3", "note 2", "grand prime", "grand 2", "ace 3", "ace 2", "ace dous", "pocket neo", "y dous", "s dous", "mega 6.3", "s4 zoom", "s5", "s4", "s3", "trend", "core", "grand", "mega", "young", "beam", "win", "fame"} Một số quan sát trình thực nghiệm cho thấy, có số đánh giá người dùng sử dụng ký tự xuống dòng nhiều lần, làm cho việc đọc file liệu gặp số lỗi Điều cần phải ý lần đọc file liệu Bộ liệu sau lọc tách từ nguồn liệu ban đầu có 4283 ghi, bao gồm tên sản phẩm, đánh giá người dùng ứng với sản phẩm Hình mô tả phần liệu tách được: 51 Hình Một đoạn liệu comment sản phẩm tách 4.4 Kết thực nghiệm nhận xét Quá trình thực nghiệm mô tả chương đề cập Trong trình thực xếp hạng cho người dùng, khóa luận thu liệu với 868 người dùng tham gia đánh giá sản phẩm page Facebook, với tổng số đánh giá xấp xỉ 1050 đánh giá khác Sau phần liệu thu thập được: Hình Thông tin người dùng thu thập Trong hình mô tả thông tin người dùng gồm có id, tên người dùng, Likes Comments tương ứng số lượng like đánh người dùng thực page Facebook Cellphones 52 Nhằm phục vụ cho việc xếp hạng người dùng, khóa luận thực việc tính hạng cho người dùng thông qua số lượng like comment người dùng page Facebook Lý trọng số like comment đề cập trên, tương ứng 0.3 0.7 Như vậy, với người dùng comment mà chưa có like độ quan tâm họ giảm bớt; theo công thức tính hạng cho kết cao Hay người dùng like mà không comment, đặt câu hỏi liệu like có phải like ảo hay không? Nhằm tránh trường hợp thế, khóa luận lọc tập người dùng vừa có like vừa có comment để xếp hạng Kết thu tập gồm 19 người dùng có trọng số cao thể hình sau: Hình 4 Kết xếp hạng người dùng Với hình trên, cột userId người dùng, cột thứ tên người dùng, cột lại theo thứ tự số lượng comment, like, hạng người dùng Quan sát tập người dùng rút này, ta thấy có xuất người dùng CellphoneS-We Love Phones Đây tên page mà ta xét Người dùng like comment có số lượng lớn Hiển nhiên, page họ nên người quản trị thường xuyên tương tác người dùng khác Bỏ qua trường hợp này, tập người dùng lại có hạng cao Với bước thực đề cập Chương 3, thực nghiệm thu kết sau: 53 Hình Kết thực nghiệm cho hạng sản phẩm Nhận xét: o Từ tập định nghĩa sản phẩm ban đầu có 27 tên sản phẩm khác điện thoại di động thông minh Samsung, thực nghiệm thu kết đánh giá sản phẩm {grand, note 4, s5, trend, win} Điều cho thấy thị hiếu người dùng dành cho tập sản phẩm hãng có xu hướng quan tâm nhiều đến sản phẩm nói Các dòng sản phẩm lại đầu tư chưa người dùng thực quan tâm đến o Trong số sản phẩm thu được, grand note hai sản phẩm đánh giá cao Điều chứng tỏ người dùng đặc biệt quan tâm đến hai dòng sản phẩm Từ chất lượng, giá đến tính trội Đánh giá Để đánh giá độ xác việc tư vấn từ phương pháp thực mô hình mô tả Chương 3, khóa luận sử dụng sai số sau[4]: Sai số bậc hai bình phương trung bình: 54 RMSE  (rij  rij )  n ij (4.1) Sai số trung bình tuyệt đối (MAE): | r ij  rij | ij MAE  n (4.2) Sai số trung bình tuyệt đối chuẩn (NMAE): NMAE  MAE rmax  rmin (4.3) Trong đó, rij đánh giá dự đoán mà mô hình thực được, rij đánh giá thực tế Để thu đánh giá thực tế, khóa luận dựa vào kinh nghiệm cá nhân tiến hành đánh giá thủ công comment thu thập phần Kết thu RMSE  0.98, MAE  0.53, NMAE  0.13 Qua thấy, sai số nhỏ, nằm khoảng chấp nhận Từ cho thấy kết thực nghiệm tốt, có tính áp dụng cao thực tiễn Ứng dụng: Từ kết thực nghiệm thu được, đưa nhìn tổng quát cho Samsung để họ thay đổi chiến lược quảng bá sản phẩm cải thiện dòng sản phẩm chưa đánh giá cao Đồng thời, tiếp tục củng cố, nâng cấp dòng sản phẩm người dùng ưa chuộng Tất nhiên, sản phẩm đánh hạng thấp hay chưa đánh giá, tùy thuộc vào nhiều yếu tố Trong có vấn đề liệu thưa đề cập chương Kết thực nghiệm khóa luận kỳ vọng áp dụng vào thực tiễn theo dõi thị hiếu người dùng cho hãng điện thoại Samsung Tóm tắt chương Trong chương này, tiến hành thực nghiệm, xem xét đánh giá kết trình thử nghiệm mô hình tư vấn phương tiện xã hội Facebook, ứng với miền sản phẩm điện thoại di động thông minh Samsung Qua phân tích cho thấy phương pháp sử dụng khóa luận áp dụng thực tiễn 55 Kết luận Kết đạt khóa luận Trong khóa luận này, dựa nghiên cứu Jiliang Tang cộng sự, đề xuất mô hình tư vấn dựa ngữ cảnh xã hội toàn cục, cục từ phương tiện xã hội Facebook Đồng thời, khóa luận xây dựng phần mềm thi hành mô hình đề xuất nói Tiến hành thực nghiệm miền liệu sản phẩm điện thoại di động thông minh, kết thu sản phẩm người dùng đánh giá cao, với tập người dùng xếp hạng cao Sai số trung bình tuyệt đối chuẩn mô hình khóa luận thực nghiệm cho kết xấp xỉ 0.13 Sai số có giá trị nhỏ, chứng tỏ mô hình thực nghiệm đạt kết tốt Từ đó, sử dụng sản phẩm để tư vấn cho người dùng quan tâm đến dòng điện thoại di động thông minh Do hạn chế thời gian, nên khóa luận chưa xử lý hết vấn đề câu đánh giá người dùng, ví dụ trường hợp người dùng sử dụng teencode, ký tự không dấu… Hơn tập thuật ngữ đánh giá tiếng Việt đưa chưa đầy đủ, nên việc đánh giá quan điểm người dùng nhiều hạn chế Mặt khác, vấn đề người dùng comment post gặp phải số tình thay đưa đánh giá quan điểm sản phẩm, người dùng lại so sánh với sản phẩm khác; người dùng tag bạn bè họ vào comment… Định hướng tương lai Hệ thống tư vấn sử dụng mô hình đề xuất cần cải tiến kết tốt Trước mắt, giá trị trọng số like comment tập {0,6 – 0.9} cần khảo sát công phu để nhận giá trị trọng số cho kết tốt Đồng thời, liệu để thực nghiệm cần thu thập thêm để làm giàu tập liệu học Lâu dài, phương pháp dựa vào mạng xã hội niềm tin để tăng hiệu tư vấn nghiên cứu để áp dụng vào hệ thống Việc mở rộng miền ứng dụng từ miền điện thoại di động thông minh sang miền ứng dụng khác cần quan tâm 56 Tài liệu tham khảo Tài liệu tiếng Việt [1] Hà Quang Thụy, Phan Xuân Hiếu, Đoàn Sơn, Nguyễn Trí Thành, Nguyễn Thu Trang, Nguyễn Cẩm Tú, Giáo trình khai phá liệu Web, Nhà xuất Giáo Dục Việt Nam, 2009 [2] Nguyễn Song Hà, Hệ thống tư vấn website cho máy tìm kiếm dựa khai phá query log, Khóa luận tốt nghiệp, Trường ĐHCN-ĐHQGHN, 2009 Tài liệu tiếng Anh [4] Jiliang Tang, Xia Hu, Huan Liu, Social Recommendation: A Review, Social Netw Analys Mining 3(4): 1113-1133, 2013 [5] Reza Zafarani, Mohammad Ali Abbasi, Huan Liu, Social Media Mining: An Introduction, Cambridge University Press, pp 290 - 313, 2014 [6] Jiliang Tang, Jie Tang and Huan Liu, Recommendation in Social Media: Recent Advance and New Frontiers, A KDD’2014 Tutorial (August 24, 2014), 2014 [7] King I, Lyu MR, Ma Hao, Introduction to social recommendation, In: Proceedings of the 19th international conference on World wide web ACM, New York, pp 1355–1356, 2010 [8] Guy I, Carmel D, Social recommender systems, In: Proceedings of the 20th international conference companion on World wide web ACM, New York, pp 283– 28, 2011 [9] Massa P, Avesani P, Trust-aware recommender systems, In: Proceedings of the 2007 ACM conference on recommender systems ACM, New York, pp 17–24, 2007 [10] Koren Y, Factorization meets the neighborhood: a multifaceted collaborative filtering model, In: Proceeding of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining ACM, New York, pp 426–434, 2008 [11] Ma Hao, Yang Haixuan, Lyu Michael R., King Irwin, Sorec: social recommendation using probabilistic matrix factorization, In: Proceeding of the 17th ACM conference on Information and knowledge management ACM, New York, pp 931–940, 2008 [12] Francesco Ricci, Lior Rokach, Bracha Shapira, Paul B Kantor, Recommender 57 systems handbook, Springer [13] Jiliang Tang, Yi Chang, Huan Liu, Mining social media with social theories: a survey, SIGKDD Explorations 15(2): 20-29, 2013 [14] Jiliang Tang, Xia Hu, Huiji Gao, Huan Liu, Exploiting Local and Global Social Context for Recommendation, IJCAI 2013, 2013 [15] Ma Hao, King Irwin, Lyu Michael R., Learning to recommend with explicit and implicit social relations, ACM TIST 2(3): 29, 2011 [16] X Liu, Global and Local Structure Preservation for Feature Selection, IEEE Trans Neural Netw Learning Syst 25(6): 1083-1095, 2014 [17] Ma Hao, On measuring social friend interest similarities in recommender systems, SIGIR 2014: 465-474, 2014 [18] Nicola Barbieri, Giuseppe Manco, Ettore Ritacco, Probabilistic Approaches to Recommendations, Morgan & Claypool Publishers, 2014 58

Ngày đăng: 05/11/2016, 13:39

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan