Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác

110 112 0
Nghiên cứu và phát triển một số độ đo liên kết trong bài toán khuyến nghị cộng tác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Phạm Minh Chuẩn NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ ĐỘ ĐO LIÊN KẾT TRONG BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN Hà Nội - 2018 BỘ GIÁO DỤC ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Phạm Minh Chuẩn NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ ĐỘ ĐO LIÊN KẾT TRONG BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC Ngành: Hệ thống thông tin Mã số: 9480104 LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS Lê Thanh Hương PGS.TS Trần Đình Khang Hà Nội - 2018 LỜI CAM ĐOAN Tôi xin cam đoan tất nội dung luận án “Nghiên cứu phát triển số độ đo liên kết tốn khuyến nghị cộng tác” cơng trình nghiên cứu riêng tơi, hướng dẫn PGS.TS Lê Thanh Hương PGS.TS Trần Đình Khang Tất kết quả, số liệu luận án trung thực chưa công bố cơng trình Hà Nội, ngày tháng năm 2018 TM TẬP THỂ HƯỚNG DẪN KHOA HỌC TÁC GIẢ LUẬN ÁN PGS.TS Lê Thanh Hương Phạm Minh Chuẩn LỜI CẢM ƠN Tơi xin bày tỏ lòng biết ơn tới Trường Đại học Bách khoa Hà Nội, Viện Công nghệ Thông tin Truyền thông, Bộ môn Hệ thống thông tin tạo điều kiện thuận lợi cho tơi q trình học tập Trường Tơi muốn gửi lời cảm ơn đặc biệt tới tập thể hướng dẫn trực tiếp PGS.TS Lê Thanh Hương PGS.TS Trần Đình Khang Thầy ln tận tình giúp đỡ, đưa lời khuyên, định hướng khoa học q báu để tơi triển khai hồn thành cơng việc nghiên cứu Đồng thời tơi xin cảm ơn PGS.TS Lê Hồng Sơn Trung tâm Tính tốn Hiệu cao – ĐH KHTN – ĐHQGHN tạo điều kiện, giúp đỡ hoàn thành luận án Xin chân thành cảm ơn thầy cô, đồng nghiệp Bộ môn Hệ thống Thông tin, Viện Công nghệ Thông tin Truyền thông, Trường Đại học Bách khoa Hà Nội nơi học tập, thực đề tài nghiên cứu nhiệt tình giúp đỡ động viên tơi suốt q trình nghiên cứu Xin cám ơn bạn sinh viên thuộc Bộ môn Hệ thống thông tin, Viện CNTT & TT, đặc biệt bạn Nguyễn Đăng Tuấn Anh lớp kỹ sư tài CNTT K58 hỗ trợ việc thu thập liệu để phục vụ cho q trình thực nghiệm Cảm ơn Khoa Cơng nghệ Thơng tin Trường Đại học Sư phạm Kỹ thuật Hưng Yên, nơi công tác tạo điều kiện cho tơi suốt q trình nghiên cứu hoàn thành luận án Xin gửi lời cám ơn đến thầy cô, nhà khoa học, đồng nghiệp bạn bè thân hữu động viên giúp đỡ tơi q trình nghiên cứu Cuối tơi muốn bày tỏ lòng biết ơn sâu sắc tới gia đình, nơi ni dưỡng nguồn động lực để tơi vượt trở ngại khó khăn để hồn thành luận án Nghiên cứu sinh Phạm Minh Chuẩn MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC GIẢI THÍCH CÁC KÝ HIỆU CHỮ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ MỞ ĐẦU 10 TỔNG QUAN VỀ BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC 15 1.1 Bài toán khuyến nghị cộng tác mạng đồng tác giả 15 1.1.1 Mạng xã hội mạng đồng tác giả 15 1.1.2 Bài toán khuyến nghị cộng tác 19 1.1.3 Tổng quan độ đo liên kết mạng đồng tác giả 25 1.2 Một số kiến thức liên quan 33 1.2.1 Các phương pháp phân lớp 33 1.2.2 Phân cụm mờ phân cụm bán giám sát mờ 37 1.2.3 Phân tích theo chủ đề 40 1.3 Kết luận 42 CÁC ĐỘ ĐO LIÊN KẾT MỞ RỘNG TRONG MẠNG ĐỒNG TÁC GIẢ 43 2.1 Độ đo liên kết dựa trọng số mở rộng 43 2.2 Các độ đo liên kết dựa nội dung báo 45 2.3 Thuật tốn tính độ đo liên kết đánh giá độ phức tạp thuật toán 50 2.4 Đánh giá độ đo liên kết mạng đồng tác giả 58 2.4.1 Chuẩn bị liệu 58 2.4.2 Kịch thực nghiệm 60 2.4.3 Kết thực nghiệm 63 2.5 Kết luận 77 BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC 78 3.1 Giới thiệu 78 3.2 Khuyến nghị cộng tác 79 3.3 Khuyến nghị cộng tác tăng cường 88 3.3 Kết luận 96 KẾT LUẬN KIẾN NGHỊ 97 TÀI LIỆU THAM KHẢO 99 DANH MỤC CÁC CÔNG TRÌNH ĐÃ CƠNG BỐ CỦA LUẬN ÁN 108 GIẢI THÍCH CÁC KÝ HIỆU CHỮ VIẾT TẮT Chữ viết tắt Chữ viết đầy đủ Giải thích AA Adamic & Adar Độ đo liên kết AA Khu vực đường cong ROC AUC Area under the ROC curve Một thước đo để đánh giá xem xét tất ngưỡng phân lớp CN Common Neighbours Độ đo liên kết láng giềng chung JC Jaccard Coefficient Độ đo liên kết dựa hệ số Jaccard LDA Latent Dirichlet Allocation Phương pháp phân tích chủ đề OSN Online Social Network Mạng xã hội trực tuyến OHUSN Online HomogeneousUndirected Social Networks Mạng xã hội vô hướng đồng trực tuyến SMO Sequential Minimal Optimization Tối ưu hóa cực tiểu SVM Support Vector Machines Máy véc-tơ hỗ trợ WAA Weighted Adamic & Adar Độ đo liên kết trọng số dựa AA WCN Weighted Common Neighbours Độ đo liên kết trọng số dựa láng giềng chung WJC Weighted Jaccard Coefficient Độ đo liên kết trọng số dựa JC TF-IDF Term Frequency - Inverse Document Frequency Trọng số từ SPIRES Stanford Public Information Retrieval System Hệ thống truy xuất thông tin công khai Stanford NCSTRL Networked Computer Science Technical Reference Library Mạng thư viện tham chiếu khoa học máy tính AMC Applied Mathematics and Computation Tạp chí tốn ứng dụng tính tốn BJ Biophysical Journal Tạp chí lý sinh CF Collaborative Filtering Lọc cộng tác CB Content-based Dựa nội dung KMC Keywords match count Đếm từ khóa chung AKMC Abtract keywords match count Đếm từ chung nội dung tóm tắt FCM Fuzzy C-means Phân cụm mờ SSSFC Semi-Supervised Standard Fuzzy Clustering Phân cụm bán giám sát mờ SMOTE Synthetic Minority Over-sampling Technique Phương pháp lấy mẫu dựa ‘Over-sampling’ GBOOST Grandient Boosting Thuật toán phân lớp Gboost XGBOOST eXtreme Grandient Boosting Thuật toán phân lớp mở rộng XGboost DANH MỤC CÁC BẢNG Bảng 1.1 Danh sách quan hệ cộng tác báo 18 Bảng 1.2 Các phương pháp phân lớp sử dụng 32 Bảng 2.1 Thống kê liệu 59 Bảng 2.2 Thống kê tập liệu 60 Bảng 2.3 Kịch thực nghiệm với độ đo liên kết trọng số 60 Bảng 2.4 Kịch thực nghiệm với độ đo liên kết dựa nội dung báo 61 Bảng 2.5 Các tổ hợp độ đo liên kết sử dụng phân lớp với kịch 62 Bảng 2.6 Các tổ hợp độ đo liên kết sử dụng phân lớp với kịch 62 Bảng 2.7 Giá trị Recall@N với tham số tối ưu AMC 65 Bảng 2.8 Giá trị Recall ứng với tham số tối ưu BJ 67 Bảng 2.9 Giá trị số đánh giá AMC tổ hợp độ đo liên kết trọng số mở rộng 69 Bảng 3.1 Thống kê tập liệu 83 Bảng 3.2 Tập đặc trưng thực nghiệm khuyến nghị cộng tác 83 Bảng 3.3 Số chủ đề tối ưu ứng với tổ hợp đặc trưng liệu 84 Bảng 3.4 Giá trị số Recall trung bình ứng với tổ hợp đặc trưng liệu 84 Bảng 3.5 Giá trị số Precision trung bình ứng với tổ hợp đặc trưng liệu 84 Bảng 3.6 Giá trị số F1-measure trung bình ứng với tổ hợp đặc trưng liệu 85 Bảng 3.7 Số chủ đề tối ưu ứng với tổ hợp đặc trưng liệu 85 Bảng 3.8 Giá trị số Recall trung bình ứng với tổ hợp đặc trưng liệu 85 Bảng 3.9 Giá trị số Precision trung bình ứng với tổ hợp đặc trưng liệu 86 Bảng 3.10 Giá trị số F1-measure trung bình ứng với tổ hợp đặc trưng liệu 86 Bảng 3.11 So sánh giá trị số F1-measure trọng số cộng tác theo công thức (1.1) (3.1) ứng với tác giả khuyến nghị 95 DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ Hình 1.1 Tiếp cận dự đốn liên kết dựa độ đo liên kết 16 Hình 1.2 Tiếp cận dự đoán liên kết dựa phân lớp 17 Hình 1.3 Minh họa mạng đồng tác giả với liệu Bảng 1.1 từ năm 2000 đến 2002 dạng đồ thị 18 Hình 1.4 Trực quan cho mơ hình LDA 41 Hình 2.1 Minh họa độ đo liên kết mở rộng 46 Hình 2.2 So sánh số đánh giá Recall@N độ đo liên kết trọng số AMC 63 Hình 2.3 So sánh số đánh giá Recall@N độ đo liên kết trọng số BJ 63 Hình 2.4 Giá trị Recall@N với số lượng chủ đề tham số  LDAcosin AMC 64 Hình 2.5 So sánh độ đo liên kết trọng số (#CN) với độ đo liên kết mở rộng AMC 65 Hình 2.6 So sánh độ đo liên kết trọng số (#AA) với độ đo liên kết mở rộng AMC 65 Hình 2.7 So sánh độ đo liên kết trọng số (#JC) với độ đo liên kết mở rộng AMC 66 Hình 2.8 Giá trị Recall ứng với số lượng chủ đề tham sốđộ đo liên kết LDAcosin BJ 66 Hình 2.9 So sánh độ đo liên kết trọng số (#CN) với độ đo liên kết mở rộng BJ 67 Hình 2.10 So sánh độ đo liên kết trọng số (#AA) với độ đo liên kết mở rộng BJ 68 Hình 2.11 So sánh độ đo liên kết trọng số (#JC) với độ đo liên kết mở rộng BJ 68 Hình 2.12 So sánh tiêu chí đánh giá tổ hợp độ đo liên kết (Weight1, Weight1_#) AMC 69 Hình 2.13 So sánh tiêu chí đánh giá tổ hợp độ đo liên kết (Weight2, Weight2_#) AMC 70 Hình 2.14 So sánh tiêu chí đánh giá tổ hợp độ đo liên kết (Weight3, Weight3_#) AMC 70 Hình 2.15 So sánh giá trị AUC ứng với tổ hợp độ đo liên kết (Weight#, Weight#_#) AMC 71 Hình 2.16 So sánh tiêu chí đánh giá tổ hợp độ đo liên kết (Weight1, Weight1_#) BJ 72 bình Recall, Precision F1-measure hai trường hợp ứng với α, β tối ưu Các giá trị trung bình Recall, Precision F1-measure trường hợp thứ (sử dụng công thức (3.1) trọng số cộng tác toàn phần luận án đề xuất) nhỉnh so với trường hợp 1, cụ thể Precision đạt 0.225309 so với 0.218866 F1-measure 0.352285 so với 0.344331, giá trị Recall hai trường hợp cao xấp xỉ 0.922564 0.921026 Tuy kết cải thiện chưa nhiều thấy việc áp dụng tính trọng số cộng tác tổng thể theo công thức (3.1) làm cho giá trị mịn (phân tách hơn) giúp việc lựa chọn ứng cử viên khuyến nghị cộng tác tăng cường thêm xác Để so sánh cách chi tiết giá trị số F1-measure tác giả thực khuyến nghị cộng tác áp dụng trọng số cộng tác theo công thức (1.1) (3.1), giá trị F1-measure tác giả có khác biệt áp dụng trọng số cộng tác tổng thể theo công thức (1.1) (3.1) Bảng 3.11 Cụ thể, có 18/65 tác giả kết F1-measure nhận có khác biệt, trọng số cộng tác theo cơng thức (3.1) có 15 tác giả nhận giá trị F1-measure ứng cao so với công thức (1.1) có tác giả nhận giá trị F1-measure thấp so với công thức (1.1) Về tỷ lệ phần trăm cải thiện, công thức (3.1) tỷ lệ cải thiện thấp 3.57 % cao 42.86 % Tuy nhiên, ba tác giả có giá trị F1-measure ứng với cơng thức (3.1) thấp công thức (1.1) chiếm tỷ lệ thấp %, 25.93 % 18.18 % 94 Bảng 3.11 So sánh giá trị số F1-measure trọng số cộng tác theo công thức (1.1) (3.1) ứng với tác giả khuyến nghị Mức độ cải thiện Id Trọng số cộng tác Trọng số cộng tác STT tác giả theo công thức (1.1) theo công thức (3.1) so với (1.1) (%) 0.421053 0.47619 13.10 0.344828 0.357143 3.57 16 0.333333 0.363636 9.09 23 0.4 0.47619 19.05 25 0.1 0.142857 42.86 27 0.157895 0.15 -5.00 31 0.705882 0.736842 4.39 34 0.266667 0.352941 32.35 36 0.285714 0.333333 16.67 10 41 0.416667 0.434783 4.35 11 43 0.296296 0.344828 16.38 12 49 0.3 0.222222 -25.93 13 50 0.105263 0.117647 11.76 14 54 0.416667 0.434783 4.35 15 55 0.428571 0.5 16.67 16 56 0.428571 0.5 16.67 17 63 0.333333 0.375 12.50 18 64 0.333333 0.272727 -18.18 95 công thức (3.1) 3.3 Kết luận Trong mục này, để đánh giá hiệu độ đo liên kết mở rộng đề xuất chương 2, luận án tiến hành thực nghiệm phương pháp khuyến nghị cộng tác dựa phân lớp phân cụm bám giám sát mờ Thông qua kết thực nghiệm, nhận thấy độ đo liên kết mở rộng dựa nội dung tóm tắt báo (SPLC) kết hợp với độ đo liên kết trọng số cho kết cải thiện đáng kể so với tổ hợp bao gồm độ đo liên kết trọng số tập liệu D1 - D4 cải hai phương pháp khuyến nghị cộng tác Ngoài ra, việc áp dụng phương pháp phân cụm bán giám sát mờ vào khuyến nghị cộng tác cho hiệu khuyến nghị tốt so với dựa phân lớp Điều cho thấy, phân cụm bán giám mờ có tiềm áp dụng cho tốn khuyến nghị cộng tác nói chung khuyến nghị cộng tác nói riêng Ngồi ra, luận án đề xuất phương pháp khuyến nghị cộng tác tăng cường mạng đồng tác giả, nhằm trợ giúp nhà nghiên cứusở để định xem mối cộng tác cần tăng cường Phương pháp đề xuất dựa trọng số cộng tác mức độ tương quan tổng thể nhằm tăng cường hiệu cho hệ thống khuyến nghị cộng tác Kết thực nghiệm mạng đồng tác giả xây dựng từ tập báo đăng tạp chí BJ từ năm 2006 đến 2017 cho thấy F1-measure phương pháp đề xuất đạt giá trị cao α = 0.4 β >= 0.45; F1-measure trung bình đạt lớn α = 0.4 β = 0.49 giá trị trung bình chung F1-measure áp dụng trọng số cộng tác với công thức (3.1) mà tác giả đề xuất 0.35229 so với 0.34433 số cộng tác tính theo cơng thức (1.1) Nội dung chương liên quan đến cơng trình nghiên cứu CT4 CT6 cơng bố tạp chí nước 96 KẾT LUẬN KIẾN NGHỊ Kết luận: Luận án hoàn thành nội dung nghiên cứu, đáp ứng mục tiêu ban đầu đặt Nghiên cứu, đề xuất số độ đo liên kết mở rộng dựa thông tin đặc trưng (như thứ tự xuất tên tác giả, thời gian cơng bố, chủ đề tóm tắt báo) xây dựng phương pháp khuyến nghị cộng tác mạng đồng tác giả Thực nghiệm kiểm chứng đánh giá độ đo liên kết mở rộng Trên thực tế toán dự báo liên kết toán khuyến nghị cộng tác mạng đồng tác giả gặp phải vấn đề liệu thưa, độ đo liên kết đề xuất chưa phản ánh hết tính đặc thù mạng đồng tác giả, thông tin đặc trưng mạng đa dạng thứ tự tác giả, thời gian công bố đặc biệt nội dung báo Từ nhận xét đó, luận án đề xuất số cách thức để xây dựng độ đo liên kết mở rộng, nhằm góp phần vào việc cải thiện hiệu dự đốn liên kết nói chung mạng đồng tác giả Bước đầu luận án áp dụng thành cơng kỹ thuật phân tích chủ đề LDA [10] việc xác định mức độ tương đồng hai tập báo dựa chủ đề tóm tắt báo, việc áp dụng giúp cho việc xây dựng độ đo liên kết mở áp dụng cho toán khuyến nghị cộng tác mạng đồng tác giả Bài toán khuyến nghị mạng đồng tác giả có đặc thù riêng kết khuyến nghị cần có tính giải thích cao để giúp người tư vấn cộng tác nghiên cứu có thêm thơng tin để định xem nên cộng tác với Do vậy, việc sử dụng độ đo liên kết trình khuyến nghị cộng tác đưa cho người dùng minh chứng lại nên cộng tác với người việc hồn tồn hợp lý Đóng góp khoa học luận án: - Đề xuất độ đo liên kết sử dụng thông tin thứ tự tác giả thời gian công bố; độ đo liên kết dựa chủ đề tóm tắt báo; độ đo liên kết kết hợp; - Đề xuất giải pháp khuyến nghị cộng tác chưa có tác giả dựa phân cụm bán giám sát mờ thông qua độ đo liên kết - Đưa giải pháp khuyến nghị cộng tác có trước đó, sử dụng trọng số cộng tác mức độ tương quan Kết thu từ thực nghiệm Trong chương 2, luận án tiến hành thực nghiệm để đánh giá hiệu độ đo liên kết mở rộng đề xuất hai liệu AMC BJ Thông qua kết thực nghiệm cho thấy hầu hết độ đo liên kết mở rộng đề xuất có cải thiện so với độ đo trọng số Đặc biệt, kết hợp độ đo liên kết trọng số với độ đo liên kết dựa chủ đề tóm tắt nhiều trường hợp cho kết cải thiện đáng kể sử dụng phương pháp phân lớp kết hợp kỹ thuật lấy mẫu theo SMOTE [22] Trong chương 3, luận án minh họa phương pháp khuyến nghị cộng tác khuyến nghị tăng cường liệu BJ Kết thực nghiệm cho thấy hiệu khuyến nghị có nhiều khả quan, đặc biệt áp dụng 97 phân cụm bán giám sát mờ để khuyến nghị cộng tác quan trọng việc khuyến nghị nhà nghiên cứu kèm theo minh chứng mức độ tương đồng lĩnh vực nghiên cứu để người khuyến nghịsở tin tưởng định nên cộng tác với danh sách người lựa chọn Những hạn chế: Luận án tập trung nghiên cứu đề xuất độ đo liên kết dựa láng giềng chung, chưa mở rộng độ đo liên kết hai cặp tác giả có độ dài lớn (tức cặp tác giả có độ dài đường lớn mạng đồng tác giả) Phương pháp khuyến nghị đề xuất mạng đồng tác giả đơn giản, chưa xem xét thêm số thông tin khác tác địa cơng tác, hướng nghiên cứu chính, v.v Định hướng phát triển: Từ kết nghiên cứu thực hiện, hạn chế, luận án đề xuất kiến nghị sau nhằm mở rộng hướng nghiên cứu có Mở rộng độ đo liên kết để tính tốn mức độ tương đồng hai tác giả mạng đồng tác giả xem xét thêm số thông tin cá nhân tác giả Nghiên cứu chiến lược khuyến nghị lai ghép hệ khuyến nghị truyền thống để xây dựng mơ hình khuyến nghị phù hợp mạng đồng tác giả Tiếp tục nghiên cứu áp dụng phương pháp phân cụm bán giám sát mờ để xây dựng phương pháp khuyến nghị cộng tác hiệu 98 TÀI LIỆU THAM KHẢO [1] L A Adamic and E Adar (2003) "Friends and neighbors on the web," Social networks, vol 25, no 3, pp 211-230 [2] M Agarwal, H Agrawal, N Jain and M Kumar (2010) “Face recognition using principle component analysis, eigenface and neural network,” IEEE International Conference on, In Signal Acquisition and Processing IEEE, 2010 (ICSAP10), 310-314 [3] L M Aiello, A Barrat, R Schifanella, C Cattuto, B Markines and F Menczer (2012) "Friendship prediction and homophily in social media," ACM Transactions on the Web, vol 6, no 3, p [4] C G Akcora, B Carminati and E Ferrari (2011) "Network and profile based measures for user similarities on social networks," in In Information Reuse and Integration (IRI), 2011 IEEE International Conference on [5] M Al Hasan, V Chaoji, S Salem and M Zaki (2006) "Link prediction using supervised learning," in SDM06: workshop on link analysis, counter-terrorism and security [6] J Angulo and S Velasco-Forero (2010) “Semi-supervised hyperspectral image segmentation using regionalized stochastic watershed,” In Algorithms and Technologies for Multispectral, Hyperspectral, and Ultraspectral Imagery XVI, Vol 7695, p 76951F International Society for Optics and Photonics [7] C Basu, H Hirsh and W Cohen (1998) "Recommendation as classification: Using social and content-based information in recommendation," in Aaai/iaai, pp 714-720 [8] C Becker, R Rigamonti, V Lepetit and P Fua (2013) "Supervised feature learning for curvilinear structure segmentation," in International Conference on Medical Image Computing and Computer-Assisted Intervention, Springer, pp 526-533 [9] J.C Bezdek (1981) "Pattern Recognition with Fuzzy Objective Function Algorithms," Plenum, New York [10] D M Blei (2012) "Probabilistic topic models," Communications of the ACM, vol 55, no 4, pp 77-84 [11] D M Blei, A Y Ng and M I Jordan (2003) "Latent dirichlet allocation," Journal of machine Learning research, vol 3, no Jan, pp 993-1022 99 [12] D Blei and J Lafferty (2009) Text mining: Theory and applications, chapter topic models, Taylor and Francis, London [13] T Bogers and A Van den Bosch (2008) "Recommending scientific articles using citeulike," in In Proceedings of the 2008 ACM conference on Recommender systems [14] M A Brandão, M M Moro, G R Lopes and J P Oliveira (2013) "Using link semantics to recommend collaborations in academic social networks," in Proceedings of the 22nd International Conference on World Wide Web, ACM, pp 833-840 [15] J S Breese, D Heckerman and C Kadie (1998) "Empirical analysis of predictive algorithms for collaborative filtering," in In Proceedings of the Fourteenth conference on Uncertainty in artificial intelligence [16] L Breiman (2001) "Random forests," Machine learning, vol 45, no 1, pp 532 [17] R Burke (2002) "Hybrid recommender systems: Survey and experiments," User modeling and user-adapted interaction, vol 12, no 4, pp 331-370 [18] R D Burke (2007) "Hybrid web recommender systems," in P Brusilovsky, A Kobsa, & W Nejdl, editors, The Adaptive Web, Methods and Strategies of Web Personalization, volume 4321 of Lecture Notes in Computer Science, Springer, 2007, pp 377-408 [19] T M Chang and W F Hsiao (2013) "LDA-based Personalized Document Recommendation," In PACIS, pp 13 [20] C C Chang and C J Lin (2011) "LIBSVM: a library for support vector machines," ACM transactions on intelligent systems and technology (TIST), vol 2, no 3, p 27 [21] N V Chawla (2009) "Data mining for imbalanced datasets: An overview," in Data mining and knowledge discovery handbook, Springer, Boston, MA, pp 875-886 [22] N V Chawla, K W Bowyer, L O Hall and W P Kegelmeyer (2002) "SMOTE: synthetic minority over-sampling technique," Journal of artificial intelligence research, vol 16, pp 321-357 [23] B Chen, F Li, S Chen, R Hu and L Chen (2017) "Link prediction based on non-negative matrix factorization," PloS one, vol 12, no 8, p e0182968 100 [24] J Chen, S Zhao and H Wang (2011) “Risk analysis of flood disaster based on fuzzy clustering method,” Energy Procedia, 5, 1915-1919 [25] T Chen and C Guestrin (2016) "Xgboost: A scalable tree boosting system," in Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining, ACM, pp 785-794 [26] K S Chuang, H L Tzeng, S Chen, J Wu and T J Chen (2006) “Fuzzy cmeans clustering with spatial information for image segmentation,” computerized medical imaging and graphics, 30(1), 9-15 [27] C Cortes and V Vapnik (1995) "Support-vector networks," Machine learning, vol 20, no 3, pp 273-297 [28] H R De Sá and R B Prudêncio (2011) "Supervised link prediction in weighted networks," in Neural Networks (IJCNN), The 2011 International Joint Conference on, IEEE, pp 2281-2288 [29] G A de Sousa, M A Diniz, M A Brandão and M M Moro (2014) "CNARe: Co-authorship Networks Analysis and Recommendations," in Proceedings of the 9th ACM Conference on Recommender Systems, ACM, pp 329-330 [30] Y Dhote, N Mishra and S Sharma (2013) "Survey and analysis of temporal link prediction in online social networks," in In Advances in Computing, Communications and Informatics (ICACCI), 2013 International Conference on [31] Y Ding (2011) "Scientific collaboration and endorsement: Network analysis of coauthorship and citation networks," Journal of informetrics, vol 5, no 1, pp 187-203 [32] R O Duda, P E Hart and D G Stork (2001) "Pattern classification 2nd," Edition New York, p 55 [33] R C Eberchart and J Kennedy (1995) "Particle swarm optimization," in IEEE International Conference on Neural Networks, Perth, Australia [34] Y Freund and R E Schapire (1995) "A desicion-theoretic generalization of online learning and an application to boosting," in European conference on computational learning theory, Springer, Berlin, Heidelberg, pp 23-37 [35] L Getoor and C P Diehl (2005) "Link mining: a survey," Acm Sigkdd Explorations Newsletter, vol 7, no 2, pp 3-12 [36] J Golbeck and J Hendler (2006, January) "Filmtrust: Movie recommendations using trust in web-based social networks," In Proceedings of the IEEE 101 Consumer communications and networking conference, Vol 96, No 1, pp 282286 [37] Y Guisheng, Y Wansi and D Yuxin (2014) "A new link prediction algorithm: node link strength algorithm," in Computer Applications and Communications (SCAC), 2014 IEEE Symposium on, IEEE, pp 5-9 [38] I Günes, S Gündüz-Ưüdücü and Z Çataltepe (2016) "Link prediction using time series of neighborhood-based node similarity scores," Data Mining and Knowledge Discovery, vol 30, no 1, pp 147-180 [39] S Gupta, S Pandey and K K Shukla (2015) "Comparison analysis of link prediction algorithms in social network," International Journal of Computer Applications, vol 111, no 16 [40] M Hall, E Frank, G Holmes, B Pfahringer, P Reutemann and I H Witten (2009) "The WEKA data mining software: an update," ACM SIGKDD explorations newsletter, vol 11, no 1, pp 10-18 [41] T Hofmann (2004) "Latent semantic models for collaborative filtering," ACM Transactions on Information Systems (TOIS), vol 22, no 1, pp 89-115 [42] T Hofmann and D Hartmann (2005) "Collaborative filtering with privacy via factor analysis," in In Proceedings of the 2005 ACM symposium on applied computing [43] N M A Ibrahim and L Chen (2015) "Link prediction in dynamic social networks by integrating different types of information," Applied Intelligence, vol 42, no 4, pp 738-750 [44] G Jeh and J Widom (2002) "SimRank: a measure of structural-context Silarity," in In Proceedings of the eighth ACM SIGKDD international conference on Knowledge discovery and data mining [45] T Karagiannis and M Vojnovic (2009, April) "Behavioral profiles for advanced email features," In Proceedings of the 18th international conference on World wide web, pp 711-720, ACM [46] L Katz (1953) "A new status index derived from sociometric analysis," Psychometrika, vol 18, no 1, pp 39-43 [47] H Kautz, B Selman and M Shah (1997) "Referral Web: combining social networks and collaborative filtering," Communications of the ACM, 40(3), 6365 102 [48] Y Koren (2008) "Factorization meets the neighborhood: a multifaceted collaborative filtering model," in In Proceedings of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining [49] M Kubat and S Matwin (1997) "Addressing the curse of imbalanced training sets: one-sided selection," in ICML, vol 97, pp 179-186 [50] D H Lee, P Brusilovsky and T Schleyer (2011) "Recommending collaborators using social features and mesh terms," Proceedings of the Association for Information Science and Technology, vol 48, no 1, pp 1-10 [51] D Liben‐Nowell and J Kleinberg (2007) "The link‐prediction problem for social networks," Journal of the Association for Information Science and Technology, vol 58, no 7, pp 1019-1031 [52] R N Lichtenwalter, J T Lussier and N V Chawla (2010) "New perspectives and methods in link prediction.," in In Proceedings of the 16th ACM SIGKDD international conference on Knowledge discovery and data mining [53] J X F Li, W Wang, Z Chen, N Y Asabere and H Jiang (2014) "Acrec: a coauthorship based random walk model for academic collaboration recommendation," in Proceedings of the 23rd International Conference on World Wide Web, ACM, pp 1209-1214 [54] G R Lopes, M M Moro, L K Wives and J P M De Oliveira (2010) "Collaboration recommendation on academic social networks," in In International Conference on Conceptual Modeling [55] J Lu, X Yuan and T Yahagi (2007) “A method of face recognition based on fuzzy c-means clustering and associated sub-NNs,” IEEE Transactions on, Neural Networks, 18(1), 150-160 [56] Z Lu, B Savas, W Tang and I S Dhillon (2010) "Supervised link prediction using multiple sources," in Data Mining (ICDM), 2010 IEEE 10th International Conference on, IEEE, pp 923-928 [57] I Makarov, O Bulanov and L E Zhukov (2016) "Co-author recommender system," in In International Conference on Network Analysis [58] A Martin, V Gayathri, G Saranya, P Gayathri and P Venkatesan (2011) “A hybrid model for bankruptcy prediction using genetic algorithm, fuzzy c-means and MARS,” International Journal on Soft Computing ( IJSC ), 2(1), 12-24 [59] V Martínez, F Berzal and J C Cubero (2017) "A survey of link prediction in complex networks," ACM Computing Surveys (CSUR), vol 49, no 4, p 69 103 [60] D W McDonald (2003, April) "Recommending collaboration with social networks: a comparative evaluation," In Proceedings of the SIGCHI conference on Human factors in computing systems, pp 593-600, ACM [61] M Mitzenmacher (2004) "A brief history of generative models for power law and lognormal distributions," Internet mathematics, vol 1, no 2, pp 226-251 [62] J Mori, Y Kajikawa, H Kashima and I Sakata (2012) "Machine learning approach for finding business partners and building reciprocal relationships., 39(12), ," Expert Systems with Applications, vol 39, no 12, pp 10402-10407 [63] L Munasinghe (2013) Time-aware methods for link prediction in social networks (Doctoral dissertation, Ph D thesis, The Graduate University for Advanced Studies) [64] T Murata and S Moriyasu (2007) "Link prediction of social networks based on weighted proximity measures," in the IEEE/WIC/ACM international conference on In Web Intelligence [65] M E Newman (2001) "Scientific collaboration networks I Network construction and fundamental results," Physical review E, vol 64, no 1, p 016131 [66] M E Newman (2001) "Scientific collaboration networks II Shortest paths, weighted networks, and centrality," Physical review E, p 016132 [67] M E Newman (2001) "Clustering and preferential attachment in growing networks," Physical review E, vol 64, no 2, p 025102 [68] M E Newman (2004) "Who is the best connected scientist? A study of scientific coauthorship networks," in Complex networks, Springer, Berlin, Heidelberg, pp 337-370 [69] H Ogata, Y Yano, N Furugori and Q Jin (2001) "Computer supported social networking for augmenting cooperation", Computer Supported Cooperative Work (CSCW), 10(2), 189-209 [70] M Pavlov and R Ichise (2007) "Finding experts by link prediction in coauthorship networks," in In Proceedings of the 2nd International Conference on Finding Experts on the Web with Semantics-Volume 290 [71] J Platt (1998) "Sequential minimal optimization: A fast algorithm for training support vector machines" [72] J R Quinlan (2014) C4 5: programs for machine learning, Elsevier 104 [73] P Resnick, N Iacovou, M Suchak, P Bergstrom and J Riedl (1994) "GroupLens: an open architecture for collaborative filtering of netnews," in Proceedings of the 1994 ACM conference on Computer supported cooperative work, ACM, pp 175-186 [74] M R Rezaee, P M Van der Zwet, B P Lelieveldt, R J Van Der Geest and J H Reiber (2000) “A multiresolution image segmentation technique based on pyramidal segmentation and fuzzy clustering,” IEEE Transactions on, Image Processing, 9(7), 1238-1248 [75] M Sachan and R Ichise (2010) "Using abstract information and community alignment information for link prediction," in In Machine Learning and Computing (ICMLC), 2010 Second International Conference on [76] G Salton and M J McGill (1987) Introduction to Modern Information Retrieval, New York: Mc [77] B Sarwar, G Karypis, J Konstan and J Riedl (2001) "Item-based collaborative filtering recommendation algorithms," in In Proceedings of the 10th international conference on World Wide Web [78] B Sarwar, G Karypis, J Konstan and J Riedl (2002) "Incremental singular value decomposition algorithms for highly scalable recommender systems," in In Fifth International Conference on Computer and Information Science [79] S Scellato, A Noulas and C Mascolo (2011) "Exploiting place features in link prediction on location-based social networks (pp ).," in In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining [80] F Schneider, A Feldmann, B Krishnamurthy and W Willinger (2009) "Understanding online social network usage from a network perspective," in In Proceedings of the 9th ACM SIGCOMM conference on Internet measurement conference [81] U Shardanand and P Maes (1995) "Social information filtering: algorithms for automating “word of mouth”," in Proceedings of the SIGCHI conference on Human factors in computing systems, ACM Press/Addison-Wesley Publishing Co., pp 210-217 [82] N Shibata, Y Kajikawa and I Sakata (2012) "Link prediction in citation networks," Journal of the Association for Information Science and Technology, vol 63, no 1, pp 75-85 105 [83] J Tang, S Wu, J Sun and H Su (2012) "Cross-domain collaboration recommendation.," in In Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining [84] A Töscher, M Jahrer and R Legenstein (2008) "Improved neighborhood-based algorithms for large-scale recommender systems," in Proceedings of the 2nd KDD Workshop on Large-Scale Recommender Systems and the Netflix Prize Competition, ACM, p [85] S H Walker and D B Duncan (1967) "Estimation of the probability of an event as a function of several independent variables," Biometrika, vol 54, no 1-2, pp 167-179 [86] C Wang and D M Blei (2011, August) "Collaborative topic modeling for recommending scientific articles," In Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining, pp 448456, ACM [87] C Wang, V Satuluri and S Parthasarathy (2007) "Local probabilistic models for link prediction," in In Data Mining, 2007 ICDM 2007 Seventh IEEE International Conference on [88] P Wang, B Xu, Y Wu and X Zhou (2015) "Link prediction in social networks: the state-of-the-art," Science China Information Sciences, vol 58, no 1, pp 138 [89] S Wasserman and K Faust (1994) "Social Network Analysis in the Social and Behavioral Sciences," in Social Network Analysis: Methods and Applications, Cambridge University Press, pp 1-27 [90] D Whitley (1994) "A genetic algorithm tutorial," Statistics and computing, vol 4, no 2, pp 65-85 [91] B Whitman and S Lawrence (2002) "Inferring Descriptions and Similarity for Music from Community Metadata," in ICMC [92] T Wohlfarth and R Ichise (2008) "Semantic and Event-Based Approach for Link Prediction," In Proceedings of the 7th International Conference on Practical Aspects of Knowledge Management (PAKM), Yokohama - Japan [93] S Wu, J Sun and J Tang (2013) "Patent partner recommendation in enterprise social networks," In Proceedings of the sixth ACM international conference on Web search and data mining 106 [94] F Xia, Z Chen, W Wang, J Li and L T Yang (2014) "Mvcwalker: Random walk-based most valuable collaborators recommendation exploiting academic factors," IEEE Transactions on Emerging Topics in Computing, vol 2, no 3, pp 364-375 [95] S Xie and Y Feng (2015, April) "A recommendation system combining LDA and collaborative filtering method for Scenic Spot," In Information Science and Control Engineering (ICISCE), 2015 2nd International Conference on, pp 6771, IEEE [96] J Yang, L Yang and P Zhang (2015) "A New Link Prediction Algorithm Based on Local Links," in International Conference on Web-Age Information Management, Springer, pp 16-28 [97] Z Yang, R Hu and R Zhang (2016) "An improved link prediction algorithm based on common neighbors index with community membership information," in Software Engineering and Service Science (ICSESS), 2016 7th IEEE International Conference on, IEEE, pp 90 93 [98] L Yao, L Wang, L Pan and K Yao (2016) "Link Prediction Based on Common-Neighbors for Dynamic Social Network," Procedia Computer Science, vol 83, pp 82-89 [99] E Yasunori, H Yukihiro, Y Makito and M Sadaaki (2009) "On semisupervised fuzzy c-means clustering," in Fuzzy Systems, 2009 FUZZ-IEEE 2009 IEEE International Conference on, IEEE, pp 1119-1124 [100] Q Yu, C Long, Y Lv, H Shao, P He and Z Duan (2014) "Predicting coauthor relationship in medical co-authorship networks," PloS one, p e101214 [101] O R Zaiane, J Chen and R Goebel (2007, August) "DBconnect: mining research community on DBLP data," In Proceedings of the 9th WebKDD and 1st SNA-KDD 2007 workshop on Web mining and social network analysis, pp 74-81, ACM [102] J Zhang and S Y Philip (2014) "Link prediction across heterogeneous social networks: A survey," SOCIAL NETWORKS 107 DANH MỤC CÁC CƠNG TRÌNH ĐÃ CƠNG BỐ CỦA LUẬN ÁN CT1 Phạm Minh Chuẩn, Lê Thanh Hương, Trần Đình Khang, Trần Ngọc Cương (2011) Hệ thống khuyến nghị báo Tạp chí Nghiên cứu khoa học công nghệ quân sự, Số 16, 12.2011, ISSN 1859-1043, trang 136-145 CT2 Phạm Minh Chuẩn, Trịnh Khắc Linh, Trần Đình Khang, Lê Hồng Sơn (2017) Phân tích ảnh hưởng số độ đo liên kết áp dụng vào toán dự đoán liên kết mạng đồng tác giả Kỷ yếu Hội nghị Quốc gia lần thứ X Nghiên cứu ứng dụng Công nghệ thông tin (FAIR) – Đà Nẵng, 17-18/8/2017 ISBN: 978604-913-614-6, trang 760-767 CT3 Pham Minh Chuan, Cu Nguyen Giap, Le Hoang Son, Chintan Bhatt, Tran Dinh Khang (2017), Enhance Link Prediction in Online Social Networks Using Similarity Metrics, Sampling and Classification, Proceeding of the 2017 4th International Conference on Information System Design and Intelligent Applications (INDIA2017), 15-17 June 2017, Danang, Vietnam, pp 823 - 833, DOI = https://doi.org/10.1007/978-981-10-7512-4_81 CT4 Phạm Minh Chuẩn, Trần Đình Khang, Lê Thanh Hương, Trần Mạnh Tuấn, Lê Hoàng Sơn (2017) Dự báo liên kết đồng tác giả sử dụng phân cụm bán giám sát mờ Chuyên san Khoa học Tự nhiên – Kỹ thuật – Công nghệ (Đại học Thái Nguyên), Tập 173, số 13, ISSN 1859-2171, trang 45-50 CT5 Pham Minh Chuan, Le Hoang Son, Mumtaz Ali, Tran Dinh Khang, Le Thanh Huong, Nilanjan Dey (2017) Link Prediction in Co-authorship Networks based on Hybrid Content Silarity Metric Applied Intelligence, ISSN: 0924-669X doi: 10.1007/s10489-017-1086-x (SCI, 2016 IF = 1.904, Springer) CT6 Phạm Minh Chuẩn, Lê Hồng Sơn, Trần Đình Khang, Lê Thanh Hương (2017) Đề xuất mơ hình khuyến nghị cộng tác cho mạng đồng tác giả dựa số cộng tác tương quan Tạp chí Khoa học Công nghệ Việt Nam, Tập 22, Số 11, 11.2017, ISSN 1859-4794, trang 9-14 108 ...BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI Phạm Minh Chuẩn NGHIÊN CỨU VÀ PHÁT TRIỂN MỘT SỐ ĐỘ ĐO LIÊN KẾT TRONG BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC Ngành: Hệ thống thông tin Mã số: 9480104... cứu phát triển đề tài 14 CHƯƠNG 1 TỔNG QUAN VỀ BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC Trong chương này, luận án trình bày tổng quan toán khuyến nghị cộng tác mạng đồng tác giả, độ đo liên kết dựa trọng số. .. tham số  độ đo liên kết LDAcosin BJ 66 Hình 2.9 So sánh độ đo liên kết trọng số (#CN) với độ đo liên kết mở rộng BJ 67 Hình 2.10 So sánh độ đo liên kết trọng số

Ngày đăng: 04/11/2018, 23:06

Từ khóa liên quan

Mục lục

  • MỤC LỤC

  • MỞ ĐẦU

  • 1. TỔNG QUAN VỀ BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC

  • 2. CÁC ĐỘ ĐO LIÊN KẾT MỞ RỘNG TRONG MẠNG ĐỒNG TÁC GIẢ

  • 3. BÀI TOÁN KHUYẾN NGHỊ CỘNG TÁC

  • KẾT LUẬN VÀ KIẾN NGHỊ

  • TÀI LIỆU THAM KHẢO

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan