dc.contributor.advisor | Krištoufek, Ladislav | |
dc.creator | Kohoutová, Petra | |
dc.date.accessioned | 2024-10-09T06:41:03Z | |
dc.date.available | 2024-10-09T06:41:03Z | |
dc.date.issued | 2024 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/194829 | |
dc.description.abstract | Outlier detection is a critical task in various domains, such as finance and cyber- security, as it helps identify anomalies that can provide valuable insights for data cleansing and decision-making. The increasing availability of large and complex datasets has led to a growing demand for effective outlier detection models. While numerous approaches exist, there is a need for comprehensive research that compares and evaluates these models to understand their performance and suitability for different datasets and outlier scenarios. This thesis aims to con- duct a comparative analysis of outlier detection models and apply them to data used in transaction monitoring, to gain insights into their strengths, weaknesses, and real-world applicability in this field. The models examined include Isolation Forest, cluster-based analysis, and copulas, each suitable for different sets of use cases. Given the challenges of evaluating transaction monitoring data due to missing or unreliable data labels, this comparative analysis seeks to provide a clear understanding of how these models perform under such conditions and how can they be evaluated based on the expert-based knowledge. JEL Classification C39, C52, G21, L59, O16, O33 Keywords outliers, anomaly, model, data Title Comparative Analysis of Outlier... | en_US |
dc.description.abstract | Detekce odlehlých pozorování je klíčovou součástí různých oblastí, jako jsou finance a kybernetická bezpečnost, protože pomáhá identifikovat anomálie, které mohou poskytnout cenné poznatky pro čištění dat a rozhodování. Zvyšující se dostupnost velkých a komplexních datových souborů vedla ke zvyšující se poptávce po efektivních modelech detekce odlehlých pozorování. I když existuje mnoho přístupů, je potřeba komplexního výzkumu, který porovná a vyhodnotí tyto modely, aby porozuměl jejich výkonu a vhodnosti pro různé soubory dat a specifické scénáře. Tato práce si klade za cíl provést komparativní analýzu modelů detekce odlehlých hodnot, aby bylo možné získat náhled na jejich silné a slabé stránky a jejich použitelnost v reálném světě. Izolační les, klastrová analýza a kopule jsou modely, které jsou všechny vhodné pro různé případy použití. Další metody jsou zmiňovány především proto, že transakční data používaná pro trénování těchto modelů jsou často bez označení, případně jejich značení není spolehlivé a hodnocení výkonnosti těchto modelů je často dělané na expertní znalosti jedince. Klasifikace JEL C39, C52, G21, L59, O16, O33 Klíčová slova odhledlá pozorování,... | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Fakulta sociálních věd | cs_CZ |
dc.subject | outliers | en_US |
dc.subject | anomaly | en_US |
dc.subject | model | en_US |
dc.subject | data | en_US |
dc.subject | odhledlá pozorování | cs_CZ |
dc.subject | anomálie | cs_CZ |
dc.subject | model | cs_CZ |
dc.subject | data | cs_CZ |
dc.title | Comparative Analysis of Outlier Detection Models for Transaction Monitoring | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2024 | |
dcterms.dateAccepted | 2024-09-18 | |
dc.description.department | Institute of Economic Studies | en_US |
dc.description.department | Institut ekonomických studií | cs_CZ |
dc.description.faculty | Faculty of Social Sciences | en_US |
dc.description.faculty | Fakulta sociálních věd | cs_CZ |
dc.identifier.repId | 260176 | |
dc.title.translated | Komparativní analýza modelů detekce odlehlých pozorování pro účely monitoringu transakcí | cs_CZ |
dc.contributor.referee | Kukačka, Jiří | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Ekonomie a finance se specializací Finanční trhy a datová analýza | cs_CZ |
thesis.degree.discipline | Economics and Finance with specialisation in Financial Markets and Data Analysis | en_US |
thesis.degree.program | Economics and Finance | en_US |
thesis.degree.program | Ekonomie a finance | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Fakulta sociálních věd::Institut ekonomických studií | cs_CZ |
uk.taxonomy.organization-en | Faculty of Social Sciences::Institute of Economic Studies | en_US |
uk.faculty-name.cs | Fakulta sociálních věd | cs_CZ |
uk.faculty-name.en | Faculty of Social Sciences | en_US |
uk.faculty-abbr.cs | FSV | cs_CZ |
uk.degree-discipline.cs | Ekonomie a finance se specializací Finanční trhy a datová analýza | cs_CZ |
uk.degree-discipline.en | Economics and Finance with specialisation in Financial Markets and Data Analysis | en_US |
uk.degree-program.cs | Ekonomie a finance | cs_CZ |
uk.degree-program.en | Economics and Finance | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Detekce odlehlých pozorování je klíčovou součástí různých oblastí, jako jsou finance a kybernetická bezpečnost, protože pomáhá identifikovat anomálie, které mohou poskytnout cenné poznatky pro čištění dat a rozhodování. Zvyšující se dostupnost velkých a komplexních datových souborů vedla ke zvyšující se poptávce po efektivních modelech detekce odlehlých pozorování. I když existuje mnoho přístupů, je potřeba komplexního výzkumu, který porovná a vyhodnotí tyto modely, aby porozuměl jejich výkonu a vhodnosti pro různé soubory dat a specifické scénáře. Tato práce si klade za cíl provést komparativní analýzu modelů detekce odlehlých hodnot, aby bylo možné získat náhled na jejich silné a slabé stránky a jejich použitelnost v reálném světě. Izolační les, klastrová analýza a kopule jsou modely, které jsou všechny vhodné pro různé případy použití. Další metody jsou zmiňovány především proto, že transakční data používaná pro trénování těchto modelů jsou často bez označení, případně jejich značení není spolehlivé a hodnocení výkonnosti těchto modelů je často dělané na expertní znalosti jedince. Klasifikace JEL C39, C52, G21, L59, O16, O33 Klíčová slova odhledlá pozorování,... | cs_CZ |
uk.abstract.en | Outlier detection is a critical task in various domains, such as finance and cyber- security, as it helps identify anomalies that can provide valuable insights for data cleansing and decision-making. The increasing availability of large and complex datasets has led to a growing demand for effective outlier detection models. While numerous approaches exist, there is a need for comprehensive research that compares and evaluates these models to understand their performance and suitability for different datasets and outlier scenarios. This thesis aims to con- duct a comparative analysis of outlier detection models and apply them to data used in transaction monitoring, to gain insights into their strengths, weaknesses, and real-world applicability in this field. The models examined include Isolation Forest, cluster-based analysis, and copulas, each suitable for different sets of use cases. Given the challenges of evaluating transaction monitoring data due to missing or unreliable data labels, this comparative analysis seeks to provide a clear understanding of how these models perform under such conditions and how can they be evaluated based on the expert-based knowledge. JEL Classification C39, C52, G21, L59, O16, O33 Keywords outliers, anomaly, model, data Title Comparative Analysis of Outlier... | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Fakulta sociálních věd, Institut ekonomických studií | cs_CZ |
thesis.grade.code | A | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |