Zobrazit minimální záznam

Diskretizace numerických proměnných v modelech kreditního rizika
dc.contributor.advisorBaruník, Jozef
dc.creatorMattanelli, Matyáš
dc.date.accessioned2023-11-08T00:00:32Z
dc.date.available2023-11-08T00:00:32Z
dc.date.issued2023
dc.identifier.urihttp://hdl.handle.net/20.500.11956/186153
dc.description.abstractThis thesis investigates the effect of binning numerical variables on the per- formance of credit risk models. The differences are evaluated utilizing five publicly available data sets, six evaluation metrics, and a rigorous statistical test. The results suggest that the binning transformation has a positive and significant effect on the performance of logistic regression, feedforward artifi- cial neural network, and the Naïve Bayes classifier. The most affected aspect of model performance appears to be its ability to differentiate between eligible and ineligible customers. The obtained evidence is particularly pronounced for moderately-sized data sets. In addition, the findings are robust to the inclusion of missing values, the elimination of outliers, and the exclusion of categorical features. No significant positive effect of the binning transformation was found for the decision tree algorithm and the Random Forest model.en_US
dc.description.abstractTato práce zkoumá vliv diskretizace numerických proměnných na výkonnost modelů kreditního rizika. Rozdíly ve výkonnosti jsou vyhodnoceny s využitím pěti veřejně dostupných datových souborů, šesti indikátorů výkonnosti a stati- stického testu. Výsledky naznačují, že diskretizace má pozitivní a významný vliv na výkonnost logistické regrese, neuronové sítě a naivního Bayes klasi- fikátoru. Nejvíce ovlivněným aspektem výkonnosti modelu se zdá být jeho schopnost rozlišovat mezi dobrými a špatnými klienty. Výsledky jsou zvláště patrné pro středně velké datové soubory. Závěry jsou odolné vůči chybějícím hodnotám, eliminaci extrémních pozorování a vyloučení kategorických proměn- ných. Pro rozhodovací strom a náhodný les nebyl nalezen žádný významný pozitivní účinek diskretizace na výkonnost.cs_CZ
dc.languageEnglishcs_CZ
dc.language.isoen_US
dc.publisherUniverzita Karlova, Fakulta sociálních vědcs_CZ
dc.subjectCredit risken_US
dc.subjectbinningen_US
dc.subjectmachine learningen_US
dc.subjectperformanceen_US
dc.subjectKreditní rizikocs_CZ
dc.subjectdiskretizacecs_CZ
dc.subjectstrojové učenícs_CZ
dc.subjectvýkonnostcs_CZ
dc.titleBinning numerical variables in credit risk modelsen_US
dc.typediplomová prácecs_CZ
dcterms.created2023
dcterms.dateAccepted2023-09-21
dc.description.departmentInstitut ekonomických studiícs_CZ
dc.description.departmentInstitute of Economic Studiesen_US
dc.description.facultyFaculty of Social Sciencesen_US
dc.description.facultyFakulta sociálních vědcs_CZ
dc.identifier.repId248262
dc.title.translatedDiskretizace numerických proměnných v modelech kreditního rizikacs_CZ
dc.contributor.refereeTeplý, Petr
thesis.degree.nameMgr.
thesis.degree.levelnavazující magisterskécs_CZ
thesis.degree.disciplineEkonomie a finance se specializací Finanční trhy a datová analýzacs_CZ
thesis.degree.disciplineEconomics and Finance with specialisation in Financial Markets and Data Analysisen_US
thesis.degree.programEconomics and Financeen_US
thesis.degree.programEkonomie a financecs_CZ
uk.thesis.typediplomová prácecs_CZ
uk.taxonomy.organization-csFakulta sociálních věd::Institut ekonomických studiícs_CZ
uk.taxonomy.organization-enFaculty of Social Sciences::Institute of Economic Studiesen_US
uk.faculty-name.csFakulta sociálních vědcs_CZ
uk.faculty-name.enFaculty of Social Sciencesen_US
uk.faculty-abbr.csFSVcs_CZ
uk.degree-discipline.csEkonomie a finance se specializací Finanční trhy a datová analýzacs_CZ
uk.degree-discipline.enEconomics and Finance with specialisation in Financial Markets and Data Analysisen_US
uk.degree-program.csEkonomie a financecs_CZ
uk.degree-program.enEconomics and Financeen_US
thesis.grade.csVýborněcs_CZ
thesis.grade.enExcellenten_US
uk.abstract.csTato práce zkoumá vliv diskretizace numerických proměnných na výkonnost modelů kreditního rizika. Rozdíly ve výkonnosti jsou vyhodnoceny s využitím pěti veřejně dostupných datových souborů, šesti indikátorů výkonnosti a stati- stického testu. Výsledky naznačují, že diskretizace má pozitivní a významný vliv na výkonnost logistické regrese, neuronové sítě a naivního Bayes klasi- fikátoru. Nejvíce ovlivněným aspektem výkonnosti modelu se zdá být jeho schopnost rozlišovat mezi dobrými a špatnými klienty. Výsledky jsou zvláště patrné pro středně velké datové soubory. Závěry jsou odolné vůči chybějícím hodnotám, eliminaci extrémních pozorování a vyloučení kategorických proměn- ných. Pro rozhodovací strom a náhodný les nebyl nalezen žádný významný pozitivní účinek diskretizace na výkonnost.cs_CZ
uk.abstract.enThis thesis investigates the effect of binning numerical variables on the per- formance of credit risk models. The differences are evaluated utilizing five publicly available data sets, six evaluation metrics, and a rigorous statistical test. The results suggest that the binning transformation has a positive and significant effect on the performance of logistic regression, feedforward artifi- cial neural network, and the Naïve Bayes classifier. The most affected aspect of model performance appears to be its ability to differentiate between eligible and ineligible customers. The obtained evidence is particularly pronounced for moderately-sized data sets. In addition, the findings are robust to the inclusion of missing values, the elimination of outliers, and the exclusion of categorical features. No significant positive effect of the binning transformation was found for the decision tree algorithm and the Random Forest model.en_US
uk.file-availabilityV
uk.grantorUniverzita Karlova, Fakulta sociálních věd, Institut ekonomických studiícs_CZ
thesis.grade.codeA
uk.publication-placePrahacs_CZ
uk.thesis.defenceStatusO


Soubory tohoto záznamu

Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail
Thumbnail

Tento záznam se objevuje v následujících sbírkách

Zobrazit minimální záznam


© 2017 Univerzita Karlova, Ústřední knihovna, Ovocný trh 560/5, 116 36 Praha 1; email: admin-repozitar [at] cuni.cz

Za dodržení všech ustanovení autorského zákona jsou zodpovědné jednotlivé složky Univerzity Karlovy. / Each constituent part of Charles University is responsible for adherence to all provisions of the copyright law.

Upozornění / Notice: Získané informace nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora. / Any retrieved information shall not be used for any commercial purposes or claimed as results of studying, scientific or any other creative activities of any person other than the author.

DSpace software copyright © 2002-2015  DuraSpace
Theme by 
@mire NV