Comparative Analysis of Outlier Detection Models for Transaction Monitoring
Komparativní analýza modelů detekce odlehlých pozorování pro účely monitoringu transakcí
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/194829Identifikátory
SIS: 260176
Kolekce
- Kvalifikační práce [18159]
Autor
Vedoucí práce
Oponent práce
Kukačka, Jiří
Fakulta / součást
Fakulta sociálních věd
Obor
Ekonomie a finance se specializací Finanční trhy a datová analýza
Katedra / ústav / klinika
Institut ekonomických studií
Datum obhajoby
18. 9. 2024
Nakladatel
Univerzita Karlova, Fakulta sociálních vědJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
odhledlá pozorování, anomálie, model, dataKlíčová slova (anglicky)
outliers, anomaly, model, dataDetekce odlehlých pozorování je klíčovou součástí různých oblastí, jako jsou finance a kybernetická bezpečnost, protože pomáhá identifikovat anomálie, které mohou poskytnout cenné poznatky pro čištění dat a rozhodování. Zvyšující se dostupnost velkých a komplexních datových souborů vedla ke zvyšující se poptávce po efektivních modelech detekce odlehlých pozorování. I když existuje mnoho přístupů, je potřeba komplexního výzkumu, který porovná a vyhodnotí tyto modely, aby porozuměl jejich výkonu a vhodnosti pro různé soubory dat a specifické scénáře. Tato práce si klade za cíl provést komparativní analýzu modelů detekce odlehlých hodnot, aby bylo možné získat náhled na jejich silné a slabé stránky a jejich použitelnost v reálném světě. Izolační les, klastrová analýza a kopule jsou modely, které jsou všechny vhodné pro různé případy použití. Další metody jsou zmiňovány především proto, že transakční data používaná pro trénování těchto modelů jsou často bez označení, případně jejich značení není spolehlivé a hodnocení výkonnosti těchto modelů je často dělané na expertní znalosti jedince. Klasifikace JEL C39, C52, G21, L59, O16, O33 Klíčová slova odhledlá pozorování,...
Outlier detection is a critical task in various domains, such as finance and cyber- security, as it helps identify anomalies that can provide valuable insights for data cleansing and decision-making. The increasing availability of large and complex datasets has led to a growing demand for effective outlier detection models. While numerous approaches exist, there is a need for comprehensive research that compares and evaluates these models to understand their performance and suitability for different datasets and outlier scenarios. This thesis aims to con- duct a comparative analysis of outlier detection models and apply them to data used in transaction monitoring, to gain insights into their strengths, weaknesses, and real-world applicability in this field. The models examined include Isolation Forest, cluster-based analysis, and copulas, each suitable for different sets of use cases. Given the challenges of evaluating transaction monitoring data due to missing or unreliable data labels, this comparative analysis seeks to provide a clear understanding of how these models perform under such conditions and how can they be evaluated based on the expert-based knowledge. JEL Classification C39, C52, G21, L59, O16, O33 Keywords outliers, anomaly, model, data Title Comparative Analysis of Outlier...