Detection of Influential Individuals, Communities, and Link Prediction in Social Networks
Detekce významných uzlů, komunit a predikce linků v sociálních sítích
bakalářská práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/183056Identifikátory
SIS: 247678
Kolekce
- Kvalifikační práce [11241]
Autor
Vedoucí práce
Oponent práce
Hric, Jan
Fakulta / součást
Matematicko-fyzikální fakulta
Obor
Informatika se specializací Umělá inteligence
Katedra / ústav / klinika
Katedra teoretické informatiky a matematické logiky
Datum obhajoby
29. 6. 2023
Nakladatel
Univerzita Karlova, Matematicko-fyzikální fakultaJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
dobývání znalostí|sociální sítě|detekce významných uzlů|detekce komunit|predikce linků|reprezentace znalostíKlíčová slova (anglicky)
data mining|social networks|detection of influential individuals|community detection|link prediction|knowledge representationMetody z oblasti analýzy sociálních sítí poskytují celou řadu nástrojů pro lepší pochopení struktury studovaných sítí. Těžiště práce spočívá ve stu- diu problematiky detekce komunit v sociálních sítích. V textu představíme šest z nejznámějších algoritmů pro detekci komunit a jejich hybridní vari- anty, které kombinují hrubé klastrovací techniky s metodami pro vytváření menších a jemnějších komunit. Text pak vysvětluje i podstatu metrik pou- žívaných pro kvantifikaci vlastností detekovaných komunit. Různou velikost řešených problémů zohledňují použité datasety, konkrétně Zachary karate klub a dataset Enron. Výsledky provedených experimentů jsou základem pro posouzení vlastností analyzovaných algoritmů a vyvození závěrů a doporučení pro budoucí využití metod analýzy sociálních sítí v praxi. Důležitým aspek- tem práce je přirozeně i určení adekvátního počtu komunit ve zkoumaných datech, protože ten je parametrem mnoha algoritmů pro detekci komunit. Ze stejného důvodu je třeba ověřit, zda může i nehierarchický shlukovací algo- ritmus vytvářet hierarchii dílčích komunit. K provedení všech zmiňovaných experimentů jsme použili systém CGAT - Config-based Graph Analysis Tool pro detekci komunit, který byl navržen a implementován v rámci řešené práce a je její součástí.
Social network analysis provides several means to better understand the structure of the underlying social networks. This thesis is focused on the area of community detection in social networks. We discuss six of the main community detection algorithms and their hybrid variants involving a com- bination of rough and fine partitioning techniques. The text explains the measures used to quantify the detected communities' properties. For dif- ferent problem sizes, the Zachary's karate club and Enron email datasets were used. Further, the work concentrates on experiments that provide per- formance assessment for the investigated methods. Based on the obtained results, we draw conclusions towards recommendations for a reliable usage of the findings in practice. At the same time, we aim to identify the appropriate number of communities in the data at hand since this is a parameter of many community detection algorithms. For the same reason, we also investigate whether non-hierarchical clustering algorithms could be used to form a sub- community hierarchy. All of the mentioned experiments were run by means of a community detection system CGAT - Config-based Graph Analysis Tool we developed and implemented as a part of the thesis.