Codepython sample(update) chuabosungynghiacum (5)

14 5 0
Codepython sample(update) chuabosungynghiacum (5)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

VÍ DỤ ĐỒ THỊ HAI PHÍA Google Colab dùng Jupiter (trong Anaconda có) https://www.youtube.com/watch?v=UaellPmi8CU&t=289s I GIỚI THIỆU Hiện bóng đá mơn thể thao u thích giới Việc giao lưu thể thao mang lại sức khỏe cho cầu thủ đem lại nhiều lợi ích: Thắt chặt mối quan hệ quốc gia, khẳng định vị tinh thần quốc gia, liên đoàn, đội tuyển Việc chuyển nhượng cầu thủ nhằm nhu cầu cho đội bóng câu lạc trở nên mạnh điều thiết yếu Sự cạnh để đạt vị trí cầu thủ đội bóng điều quan dùng để phân tích Mơn học mạng xã hội phân tích mạng chuyển nhượng cầu thủ độ đo (dựa đường đi, phổ, khoảng cách, ), khai thác liệu mạng (gom cụm) GVHD: Nguyễn Thị Kim Phụng II XÁC ĐỊNH BÀI TOÁN Input: Tập liệu ban đầu nguồn liệu Kaggle qua tiền xử lý liệu Ouput: Đưa độ đo, đưa cộng đồng phục vụ cho việc phân tích mạng xã hội “Top 250 Football transfers from 2000 to 2018” III III DỮ LIỆU III.1 Giới thiệu nguồn liệu Link dataset: https://www.kaggle.com/vardan95ghazaryan/top-250-football-transfersfrom-2000-to-2018 Dữ liệu Top 250 Football transfers from 2000 to 2018 cung cấp tảng Kaggle chứa liệu việc chuyển nhượng cầu thủ từ năm 2000 đến 2018 Dữ liệu gồm 3104 dòng với 10 thuộc tính bao gồm: STT Thuộc tính Kiểu liệu Mô tả Name of a football char Tên cầu thủ chơi player Position char bóng Vị trí chơi Các giá trị CentreForward CentreBack Other Age int Tuổi GVHD: Nguyễn Thị Kim Phụng Team_from Char Tên đội bán League_from Char Liên đoàn bán Team_to Char Tên đội mua League_to Char Liên đoàn mua Season Char Mùa giải Market Value Float Giá thị trường 10 Transfer_fee Float Phí chuyển nhượng III.2 Xử lý phân tích liệu III.2.1.Làm liệu Bộ liệu nhìn chung có vài thuộc tính bị thiếu liệu,cần loại bỏ khỏi dataset GVHD: Nguyễn Thị Kim Phụng Hình đọc liệu từ file csv loại bỏ liệu trùng rỗng Dữ liệu đọc từ file csv đưa vào dataframe Sau xố bỏ liệu trùng lặp rỗng Kết nhận liệu 245 dòng cột III.2.2.Chuyển đổi dataframe thành đồ thị - Đồ thị phía Node: vị trí cầu thủ sân (Position) đội tuyển mua cầu thủ đó(Team_to), Edge: mối quan hệ việc đội tuyển mua vị trí đội hình bóng đá - Hình đưa liệu từ dataframe vào đồ thị vơ hướng Có thể thấy có 13 vị trí sân Số đội tuyển 108 Số cạnh 245 - Code hiển thị đồ thị phía GVHD: Nguyễn Thị Kim Phụng Hình code hiển thị đồ thị phía Hình Đồ thị phía Nhìn vào đồ thị thầy đội vịng mua nhiều vị trí kỳ chuyển nhượng cầu thủ vị trí nhiều đội bóng để ý GVHD: Nguyễn Thị Kim Phụng - Đồ thị phía Node: đội tuyển có mua cầu thủ (Team_to) Edge: Hai đội tuyển mua vị trí nối với để tạo thành cạnh, ý nghĩa nói lên cạnh tranh hai đội tuyển thị trường chuyển nhượng mua vị trí Weight : Trọng số số vị trí trùng mà hai đội tuyển mua Hình Code hiển thị đồ thị phía GVHD: Nguyễn Thị Kim Phụng Hình Đồ thị phía - Xuất liệu đồ thị phía file csv để thực Gephi Hình Xuất liệu đồ thị phía file csv - Đồ Thị phía Gephi GVHD: Nguyễn Thị Kim Phụng Hình đồ thị phía Gephi IV THUẬT TỐN PHÁT HIỆN CỘNG ĐỒNG IV.1 Thực thi thuật toán Louvain Gephi GVHD: Nguyễn Thị Kim Phụng Hình Đồ thị Louvain Dễ thấy thuật toán rút cụm IV.2 Thực thi Python import matplotlib.cm as cm import matplotlib GVHD: Nguyễn Thị Kim Phụng Hình 10 Code chạy thuật tốn Louvain Hình 11 Đồ thị phân cụm sử dụng Louvain GVHD: Nguyễn Thị Kim Phụng Hình 12 danh sách cụm Số cụm: Cụm thứ 0: Paris SG,Juventus,Man City,SSC Napoli,Watford,Hertha BSC,Atlético-MG,Club Tijuana Ý nghĩa cụm thứ 0: …….(SV bổ sung) Cụm thứ 1: Atlético Madrid, Real Madrid, Everton, Monaco, Leicester, AS Roma, Athletic Bilbao, Huddersfield, Bay Leverkusen, AFC Ajax, Lazio, Monterrey, Werder Bremen, Bournemouth, Cardiff, Flamengo, Bayern Munich, Pyramids FC, Nasr, TSG Hoffenheim, SaintÉtienne, Shakhtar D., Sporting CP, Sharjah FC, JS Suning, PSV Eindhoven, LOSC Lille, SPAL, FC Basel GVHD: Nguyễn Thị Kim Phụng Ý nghĩa cụm thứ 1: … Cụm thứ 2: Inter, Fulham, TJ Quanjian, Bor M'gladbach, AC Milan, Udinese Calcio, Brighton, Sampdoria, RB Leipzig, Nottm Forest, Wolves, VfL Wolfsburg, Stoke City, Genoa, Celtic, Ahli, Cagliari Calcio, Bologna, Sassuolo, Espanyol, VfB Stuttgart, Stade Rennais, FC Empoli, América, FC Porto, 1.FSV Mainz 05, Leeds, Benfica, Sounders FC , Dep La Coruña, HB CFFC, CD Cruz Azul, Toulouse, Urawa Reds, SC Freiburg, Benevento Ý nghĩa cụm thứ 2: …….(SV bổ sung) Cụm thứ 3: Liverpool, Man Utd, Chelsea, FC Barcelona, West Ham, Arsenal, Bor Dortmund, Valencia CF, Southampton, Real Betis, Villarreal CF, Marseille, Sevilla FC, Torino, Real Sociedad, FC Schalke 04, OGC Nice, Fiorentina, Tigres UANL, Olympique Lyon, Spartak Moscow, Middlesbrough, Krasnodar, Celta de Vigo, West Brom, Newcastle, Atalanta, Hannover 96, Los Angeles FC, Boca Juniors, Loko Moscow, Getafe CF, Dynamo Kyiv, Girona FC, E Frankfurt Ý nghĩa cụm thứ 3: …….(SV bổ sung) V XẾP HẠNG CÁC ĐỘI BĨNG a) Thuật tốn Pagerank (Thực thi Gephi) GVHD: Nguyễn Thị Kim Phụng Hình 13 Top đội bóng xếp hạng theo pagerank dung Gephi Kết có khơng có khác biệt code python Gephi Hai kết trùng khớp từ thông số đến thứ hạng b) Thuật toán closeness_centrality (Thực thi Gephi) Kết closeness centrality thể hiển top độ gần node đến tất node mạng Nó đồng nghĩa với việc top đội bóng phải cạnh tranh khốc liệt, mức độ cạnh tranh cao GVHD: Nguyễn Thị Kim Phụng Hình 14 Top đội bóng xếp hạng theo closeness centrality (Phần code python bạn tự làm) VI TÀI LIỆU THAM KHẢO [1] https://en.wikipedia.org/wiki/Betweenness_centrality [2] https://en.wikipedia.org/wiki/Louvain_method

Ngày đăng: 26/07/2023, 19:19

Tài liệu cùng người dùng

Tài liệu liên quan