Application of the logit leaf algorithm for customer churn prediction in the energy distribution industry in the Czech Republic
Aplikace algoritmu logit leaf pro predikci spotřebitelů opouštějících daného distributora v odvětví energetiky v České republice
bachelor thesis (DEFENDED)

View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/185241Identifiers
Study Information System: 249589
Collections
- Kvalifikační práce [18337]
Author
Advisor
Referee
Petit, Mathieu
Faculty / Institute
Faculty of Social Sciences
Discipline
Economics and Finance
Department
Institute of Economic Studies
Date of defense
12. 9. 2023
Publisher
Univerzita Karlova, Fakulta sociálních vědLanguage
English
Grade
Very good
Keywords (Czech)
logit leaf algorithm, customer churn, energy distribution industry, Czech RepublicPráce zkoumá determinanty migrace zákazníků v českém energetickém sektoru. Za tímto účelem poskytla společnost MND Energie, a.s., jeden z největších českých dodavatelů energií, databázi sestávající z informací (např. průměrná spotřeba, tarif, sociodemografické charakteristiky) o 9254 zákaznících, kterým ke konci roku 2019 skončila smlouva na odběr zemního plynu. Hlavním cílem práce je sestavit model schopný predikovat pravděpodobnost neprodloužení smluv jednotlivých zákazníků. Před datem ukončení smlouvy byla část zákazníků, náhodně vybraných z databáze, přímo informována o možnosti uzavření nové smlouvy se zafixovanou cenou. Práce v souladu se svým hlavním cílem vyhodnocuje vliv tohoto postupu na pravděpodobnost přechodu k jinému dodavateli. Experiment byl zatím proveden pouze v roce 2019. Práce se tedy zabývá úlohou strojového učení pod dohledem prováděnou na průřezových datech. Jako způsob získání požadovaných předpovědí byl zvolen logit leaf model (LLM). Algoritmus byl publikován v roce 2018 a navazuje na předchozí výzkum v této oblasti. Jeho hlavní přínos spočívá v kombinaci dvou obecně uznávaných přístupů, rozhodovacích stromů a logistické regrese, s cílem eliminovat jejich nevýhody. Výkonnost LLM byla hodnocena ve srovnání s výkonností jeho dvou stavebních prvků použitých samostatně....
The thesis investigates determinants of losing customer (customer churn) in the Czech energy sector. For this purpose, the data from MND Energie, a.s., one of the largest Czech energy suppliers, on average consumption, tariff, and sociodemographic characteristics about 9254 of their customers whose natural gas contracts terminated at the end of 2019 are used. The main goal of this thesis is to build a model capable of predicting probability of non-renewal of the individual customers' contracts. Before the contract termination date, some of the customers randomly selected from the dataset were directly notified of the possibility of a new fixed-price contract. The thesis, in compliance with its main goal, evaluates the influence of this treatment on the churn probability. The experiment has so far only been carried out in 2019. Thus, the thesis deals with supervised machine learning task performed on cross-sectional data. The logit leaf model (LLM) was chosen as the way of obtaining the desired predictions. The LLM algorithm used in this thesis was published in 2018 and it builds on previous research in this area. Its main contribution lies in combining the two generally accepted approaches, decision trees and logistic regression, in order to eliminate their disadvantages. LLM's performance was...