dc.contributor.advisor | Baruník, Jozef | |
dc.creator | Mattanelli, Matyáš | |
dc.date.accessioned | 2023-11-08T00:00:32Z | |
dc.date.available | 2023-11-08T00:00:32Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/186153 | |
dc.description.abstract | This thesis investigates the effect of binning numerical variables on the per- formance of credit risk models. The differences are evaluated utilizing five publicly available data sets, six evaluation metrics, and a rigorous statistical test. The results suggest that the binning transformation has a positive and significant effect on the performance of logistic regression, feedforward artifi- cial neural network, and the Naïve Bayes classifier. The most affected aspect of model performance appears to be its ability to differentiate between eligible and ineligible customers. The obtained evidence is particularly pronounced for moderately-sized data sets. In addition, the findings are robust to the inclusion of missing values, the elimination of outliers, and the exclusion of categorical features. No significant positive effect of the binning transformation was found for the decision tree algorithm and the Random Forest model. | en_US |
dc.description.abstract | Tato práce zkoumá vliv diskretizace numerických proměnných na výkonnost modelů kreditního rizika. Rozdíly ve výkonnosti jsou vyhodnoceny s využitím pěti veřejně dostupných datových souborů, šesti indikátorů výkonnosti a stati- stického testu. Výsledky naznačují, že diskretizace má pozitivní a významný vliv na výkonnost logistické regrese, neuronové sítě a naivního Bayes klasi- fikátoru. Nejvíce ovlivněným aspektem výkonnosti modelu se zdá být jeho schopnost rozlišovat mezi dobrými a špatnými klienty. Výsledky jsou zvláště patrné pro středně velké datové soubory. Závěry jsou odolné vůči chybějícím hodnotám, eliminaci extrémních pozorování a vyloučení kategorických proměn- ných. Pro rozhodovací strom a náhodný les nebyl nalezen žádný významný pozitivní účinek diskretizace na výkonnost. | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Fakulta sociálních věd | cs_CZ |
dc.subject | Credit risk | en_US |
dc.subject | binning | en_US |
dc.subject | machine learning | en_US |
dc.subject | performance | en_US |
dc.subject | Kreditní riziko | cs_CZ |
dc.subject | diskretizace | cs_CZ |
dc.subject | strojové učení | cs_CZ |
dc.subject | výkonnost | cs_CZ |
dc.title | Binning numerical variables in credit risk models | en_US |
dc.type | diplomová práce | cs_CZ |
dcterms.created | 2023 | |
dcterms.dateAccepted | 2023-09-21 | |
dc.description.department | Institut ekonomických studií | cs_CZ |
dc.description.department | Institute of Economic Studies | en_US |
dc.description.faculty | Faculty of Social Sciences | en_US |
dc.description.faculty | Fakulta sociálních věd | cs_CZ |
dc.identifier.repId | 248262 | |
dc.title.translated | Diskretizace numerických proměnných v modelech kreditního rizika | cs_CZ |
dc.contributor.referee | Teplý, Petr | |
thesis.degree.name | Mgr. | |
thesis.degree.level | navazující magisterské | cs_CZ |
thesis.degree.discipline | Ekonomie a finance se specializací Finanční trhy a datová analýza | cs_CZ |
thesis.degree.discipline | Economics and Finance with specialisation in Financial Markets and Data Analysis | en_US |
thesis.degree.program | Economics and Finance | en_US |
thesis.degree.program | Ekonomie a finance | cs_CZ |
uk.thesis.type | diplomová práce | cs_CZ |
uk.taxonomy.organization-cs | Fakulta sociálních věd::Institut ekonomických studií | cs_CZ |
uk.taxonomy.organization-en | Faculty of Social Sciences::Institute of Economic Studies | en_US |
uk.faculty-name.cs | Fakulta sociálních věd | cs_CZ |
uk.faculty-name.en | Faculty of Social Sciences | en_US |
uk.faculty-abbr.cs | FSV | cs_CZ |
uk.degree-discipline.cs | Ekonomie a finance se specializací Finanční trhy a datová analýza | cs_CZ |
uk.degree-discipline.en | Economics and Finance with specialisation in Financial Markets and Data Analysis | en_US |
uk.degree-program.cs | Ekonomie a finance | cs_CZ |
uk.degree-program.en | Economics and Finance | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Tato práce zkoumá vliv diskretizace numerických proměnných na výkonnost modelů kreditního rizika. Rozdíly ve výkonnosti jsou vyhodnoceny s využitím pěti veřejně dostupných datových souborů, šesti indikátorů výkonnosti a stati- stického testu. Výsledky naznačují, že diskretizace má pozitivní a významný vliv na výkonnost logistické regrese, neuronové sítě a naivního Bayes klasi- fikátoru. Nejvíce ovlivněným aspektem výkonnosti modelu se zdá být jeho schopnost rozlišovat mezi dobrými a špatnými klienty. Výsledky jsou zvláště patrné pro středně velké datové soubory. Závěry jsou odolné vůči chybějícím hodnotám, eliminaci extrémních pozorování a vyloučení kategorických proměn- ných. Pro rozhodovací strom a náhodný les nebyl nalezen žádný významný pozitivní účinek diskretizace na výkonnost. | cs_CZ |
uk.abstract.en | This thesis investigates the effect of binning numerical variables on the per- formance of credit risk models. The differences are evaluated utilizing five publicly available data sets, six evaluation metrics, and a rigorous statistical test. The results suggest that the binning transformation has a positive and significant effect on the performance of logistic regression, feedforward artifi- cial neural network, and the Naïve Bayes classifier. The most affected aspect of model performance appears to be its ability to differentiate between eligible and ineligible customers. The obtained evidence is particularly pronounced for moderately-sized data sets. In addition, the findings are robust to the inclusion of missing values, the elimination of outliers, and the exclusion of categorical features. No significant positive effect of the binning transformation was found for the decision tree algorithm and the Random Forest model. | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Fakulta sociálních věd, Institut ekonomických studií | cs_CZ |
thesis.grade.code | A | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |