nghiên cứu và phát triển thuật toán tìm phần tử chính yếu trong mạng xã hội và ứng dụng

33 517 0
nghiên cứu và phát triển thuật toán tìm phần tử chính yếu trong mạng xã hội và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

NGHIÊN CỨU VÀ PHÁT TRIỂN THUẬT TOÁN TÌM PHẦN TỬ CHÍNH YẾU TRONG MẠNG XÃ HỘI VÀ ỨNG DỤNG Học viên : ĐỖ VĂN MẠNH Giảng viên hướng dẫn : PGS.TS. ĐỖ PHÚC TRƯỜNG ĐẠI HỌC LẠC HỒNG KHOA CÔNG NGHỆ THÔNG TIN ĐỀ TÀI: 1 NỘI DUNG ỨNG DỤNG CÁC ĐỘ ĐO CENTRALITY TÌM KEY PLAYER 5 GIỚI THIỆU ĐỀ TÀI 1 TỔ CHỨC CỦA MẠNG XÃ HỘI 2 PHÂN TÍCH MẠNG XÃ HỘI 3 CÁC ĐỘ ĐO CENTRALITY TRONG MẠNG XÃ HỘI 4 CHƯƠNG TRÌNH DEMO 6 2  Phân tích mạng xã hội (Social Network Analysis – SNA) hiện đang là một trong các chủ đề được quan tâm nghiên cứu. Phân tích mạng xã hội bao gồm việc nghiên cứu các quan hệ, kết nối, mẫu truyền thông và hành vi giữa các nhóm xã hội khác nhau…  Các phương pháp "phân tích mạng xã hội" đã được nghiên cứu và ứng dụng ngày càng nhiều hơn trong các nghiên cứu xã hội học nói riêng và khoa học xã hội nói chung. Tại Việt Nam, phương pháp phân tích mạng xã hội còn khá mới mẻ, do đó việc ứng dụng phương pháp phân tích này còn khá hạn chế. GIỚI THIỆU ĐỀ TÀI 1. 3  Đi kèm với phân tích nói trên là bài toán xác định phần tử chính yếu (Key player) hay còn gọi là những tác nhân quan trọng trong mạng xã hội.  Phần tử chính yếu là các phần tử trong mạng được xem là quan trọng xét theo một điều kiện nào đó. Có thể nói rằng, key player là những node có khả năng điều khiển luồng thông tin, là những node nổi bật nhất và có tầm ảnh hưởng đến các node khác trong mạng xã hội.  Độ đo Centrality là đơn vị đo lường xác định các mối liên kết của một đỉnh trong đồ thị. Thông qua Centrality, ta có thể phát hiện được thực thể nào trong mạng là quan trọng và có tầm ảnh hưởng đến những thực thể khác. GIỚI THIỆU ĐỀ TÀI 1. 4  Dựa vào bài toán tìm đường đi ngắn nhất qua các đỉnh của một đồ thị. Có thể xem mạng xã hội như một đồ thị, các thực thể trong mạng là các đỉnh (node) của đồ thị, mối quan hệ giữa các thực thể trong mạng là các cạnh (link) của đồ thị.  Bài toán đặt ra là xây dựng thuật toán dựa vào các độ đo Centrality và đường đi ngắn nhất đi qua các đỉnh của đồ thị, từ đó xác định thực thể nào là quan trọng nhất, có tầm ảnh hưởng lớn nhất tới các thực thể khác trong mạng xã hội. GIỚI THIỆU ĐỀ TÀI 1. 5  Trong phân tích mạng xã hội, ta xem xét mạng xã hội như là đồ thị mạng bao gồm các đỉnh (nodes), các cạnh (links). Node biểu diễn tập các tác nhân, thực thể, còn link biểu diễn mối quan hệ (relation) giữa các tác nhân, thực thể đó: 2 TỔ CHỨC CỦA MẠNG XÃ HỘI 2. Một đỉnh trong mạng XH A B D C E A B D C E đồ thị có hướng đồ thị vô hướng 6 TẬP ĐỈNH (Nodes). TẬP CẠNH (Links)  Phân tích mạng xã hội (SNA) ngày càng phổ biến. Quan hệ xã hội và kết nối mạng là những thành phần quan trọng của đời sống con người  Các nhà khoa học máy tính đã sử dụng phương pháp phân tích mạng xã hội (SNA) để nghiên cứu các trang Web, lưu lượng truyền thông trên internet, mức độ phổ biến thông tin,…  Lý thuyết đồ thị cung cấp một tập hợp các khái niệm trừu tượng và phương pháp phân tích của đồ thị. Những điều này kết hợp với các công cụ phân tích khác và các phương pháp phát triển đặc biệt cho sự hình dung và phân tích của các mạng xã hội, hình thành cơ sở của những gì chúng ta gọi là phương pháp phân tích mạng xã hội – SNA PHÂN TÍCH MẠNG XÃ HỘI 3. 7  Trong Phạm vi của lý thuyết đồ thị và phân tích mạng, có nhiều biện pháp để nghiên cứu mô hình thông tin liên lạc cũng như cấu trúc của một mạng xã hội. Trong đó biện pháp Centrality là một trong các biện pháp được nghiên cứu nhiều nhất nhằm xác định tầm quan trọng tương đối của một đỉnh trong đồ thị  Centrality mô tả vị trí tương đối của một tác nhân trong bối cảnh của mạng xã hội của mình: CÁC ĐỘ ĐO TRUNG TÂM TRONG MẠNG 4. 8 1. Độ đo trung tâm theo bậc (Degree Centrality). 2. Độ đo trung tâm dựa trên trung gian (Betweenness Centrality). 3. Đo đo trung tâm theo sự lân cận (Closeness Centrality) CÁC ĐỘ ĐO TRUNG TÂM TRONG MẠNG 4. 9  Cho đồ thị G = (V, E) có n đỉnh. - Degree centrality của một đỉnh chính là tng số cc liên kết tới đỉnh đó trong đồ thị (tng số cạnh kề của một đỉnh). - Trường hợp đồ thị có hướng, degree centrality được tnh bởi 2 gi trị: in-degree v out-degree. * In-degree: tng số liên kết từ cc node khc đến node đang xét. * Out-degree: tng số liên kết từ node đang xét đến cc node khc. CÁC ĐỘ ĐO TRUNG TÂM TRONG MẠNG 4. 1. Độ đo trung tâm theo bậc (Degree Centrality). 10 [...]... khác  24 5 ỨNG DỤNG CÁC ĐỘ ĐO CENTRALITY TÌM KEY PLAYER Việc xác định được các giá trị độ đo Centrality đã làm nền tảng để tiếp cận giải quyết bài toán tìm phần tử chính yếu (key player) trong mạng xã hội của đề tài  Quy trình tìm phần tử chính yếu được thực hiện thông qua các bước cơ bản sau:  Bước 1: Tính toán tìm tất cả các đường đi ngắn nhất từ 1 đỉnh đến tất cả các đỉnh còn lại trong đồ thị... cả các đỉnh  Bước 2: Tính toán độ đo trung tâm theo bậc của tất cả các đỉnh trong đồ thị  Bước 3: Tính toán tìm độ đo trung tâm theo trung gian của tất cả các đỉnh trong đồ thị  Bước 4: Tính toán độ đo trung tâm theo sự lân cận của mỗi đỉnh trong đồ thị  Bước 5: Dựa vào các độ đo trung tâm -> Đưa ra kết quả  25 5  ỨNG DỤNG CÁC ĐỘ ĐO CENTRALITY TÌM KEY PLAYER Bước 1: tìm tất cả các đường đi ngắn... nhất, là đỉnh có tầm ảnh hưởng lớn đến các đỉnh khác 29 5  ỨNG DỤNG CÁC ĐỘ ĐO CENTRALITY TÌM KEY PLAYER Bước 3: Tìm Betweenness Centrality: Ý Tưởng: để tìm độ đo Betwenneess Centrality của 1 đỉnh ta dựa vào các đường đi ngắn nhất của đỉnh đó tới các đỉnh còn lại tìm được bằng thuật toán BFS và công thức 2.3  Xét lại VD 2: Ta đã tìm được các độ đo Betwenneess Centrality của từng đỉnh:  CB... Miền giá trị của độ đo này nằm trong khoảng [0 1], node có giá trị càng lớn thì node đó sẽ có sự ảnh hưởng càng lớn đến việc phân bổ cấu trúc của các cụm hay nhóm trong mạng càng lớn Một tác nhân có vai trò trung tâm càng lớn trong mạng thì sẽ có tầm ảnh hưởng lớn trong việc kiểm soát mọi thông tin trao đổi giữa các tác nhân khác trong mạng 15 4 CÁC ĐỘ ĐO TRUNG TÂM TRONG MẠNG 2 Độ đo trung tâm dựa trên... TRONG MẠNG 2 Độ đo trung tâm dựa trên trung gian (Betweenness Centrality) VD2: Cho một mạng xã hội có các tác nhân: v1, v2, v3, v4, v5, v6 và các link: (v1,v2); (v1,v3); (v2,v4); (v3,v2); (v3,v4); (v4,v5); (v4,v6) Ta coi Mạng xã hội trên như là một đồ thị như sau: v1 v2 v3 v4 v6 v5 16 4 CÁC ĐỘ ĐO TRUNG TÂM TRONG MẠNG 2 Độ đo trung tâm dựa trên trung gian (Betweenness Centrality) Ta thấy công thức... 4 CÁC ĐỘ ĐO TRUNG TÂM TRONG MẠNG 3 Độ đo trung tâm theo sự lân cận (Closeness Centrality) Xét lại VD2, ta sử dụng lại Bảng 1 để tìm độ đo Closeness Centrality của các đỉnh trong đồ thị:  Theo công thức I:  Xét đỉnh v1: Độ đo khoảng cách từ đỉnh v1 đến cách đỉnh còn lại trong mạng length(v1,t) là 18, ta có: 1 1 CC ( v1 )  d tV \v1  G ( v1,t )  18  0.06 Tương tự ta tìm được các độ đo closeness... thay đổi rất lớn vì sẽ mất đi 2 đỉnh v5 và v6 30 5  ỨNG DỤNG CÁC ĐỘ ĐO CENTRALITY TÌM KEY PLAYER Bước 4: Tìm Closeness Centrality:  Ý tưởng: dựa vào sự truy vết đường đi trong thuật toán BFS ta tính được tổng độ dài của đường đi từ 1 đỉnh đến các đỉnh 1 còn lại và công thức (2.5) CC ( v )   tV \ v d G (v, t )  Xét lại VD 2: Từ bảng 1, ta sử dụng các độ dài (length(v,t)) từ 1 đỉnh... sau khi đẩy các u vào 28 Như vậy, để tìm đường đi ngắn nhất từ đỉnh 1 đến đỉnh 6 ta đi theo trình tự các đỉnh: đỉnh 1 → đỉnh 2 → đỉnh 4 → đỉnh 6 5 ỨNG DỤNG CÁC ĐỘ ĐO CENTRALITY TÌM KEY PLAYER Bước 2: Tìm Degree Centrality  Ý tưởng: ta duyệt từng đỉnh, mỗi đỉnh ta xét các đỉnh lân cận với nó Lặp lại cho tới khi không còn đỉnh để duyệt  Do đồ thị có hướng nên ta xét in-degree và out-degree:  ... hưởng quan trọng trong mạng 13 4 CÁC ĐỘ ĐO TRUNG TÂM TRONG MẠNG 2 Độ đo trung tâm dựa trên trung gian (Betweenness Centrality)  Betweenness centrality của một đỉnh được tính bằng tổng số các đường đi ngắn nhất ngang qua đỉnh đang xét chia cho tổng số các đường đi ngắn nhất của toàn mạng Nói cách khác thì Betweenness Centrality là độ đo dùng để xác định vị trí của tác nhân trong mạng mà nó... nào gần S hơn sẽ được duyệt trước) S v1 u1 u2 u3 v2 … v3 um … vn Phải duyệt sau vn 26 5 ỨNG DỤNG CÁC ĐỘ ĐO CENTRALITY TÌM KEY PLAYER Giải thuật BFS như sau: Bước 1: Khởi tạo:  Các đỉnh đều ở trạng thái chưa đánh dấu, ngoại trừ đỉnh xuất phát S là đã được đánh dấu  Một hàng đợi (Queue), ban đầu chỉ có một phần tử S Hàng đợi dùng để chứa các đỉnh sẽ được duyệt theo thứ tự ưu tiên theo chiều rộng  . NGHIÊN CỨU VÀ PHÁT TRIỂN THUẬT TOÁN TÌM PHẦN TỬ CHÍNH YẾU TRONG MẠNG XÃ HỘI VÀ ỨNG DỤNG Học viên : ĐỖ VĂN MẠNH Giảng viên hướng dẫn :. tích nói trên là bài toán xác định phần tử chính yếu (Key player) hay còn gọi là những tác nhân quan trọng trong mạng xã hội.  Phần tử chính yếu là các phần tử trong mạng được xem là quan. truyền thông và hành vi giữa các nhóm xã hội khác nhau…  Các phương pháp "phân tích mạng xã hội& quot; đã được nghiên cứu và ứng dụng ngày càng nhiều hơn trong các nghiên cứu xã hội học nói

Ngày đăng: 27/11/2014, 08:06

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan