dc.contributor.advisor | Polák, Petr | |
dc.creator | Kotlan, Ivan | |
dc.date.accessioned | 2023-11-07T01:21:31Z | |
dc.date.available | 2023-11-07T01:21:31Z | |
dc.date.issued | 2023 | |
dc.identifier.uri | http://hdl.handle.net/20.500.11956/184964 | |
dc.description.abstract | The goal of this study is first to provide superior predictions of Czech GDP growth to the o cial estimates of the Czech Statistical O ce and the proxy estimation of the Czech National Bank. Secondly, to expand the literature that focuses on machine-learning predictions that utilizes data with various sampling frequency. Although in the first goal, this thesis did not succeed as all models, namely Ridge and Random Forest, failed to beat the predictions of o cial institutes, the thesis contributes to the yet scarce literature on mixed-frequency machine-learning prediction. Since no machine-learning model accounts for data with various frequencies, the thesis shows how to transform variables so that any machine-learning model can utilize them. Furthermore, di erent dataset modifications are explored, such as the prediction time: end of the reference quarter (nowcast) and 40 days after the reference quarter (backcast), standardized and non-standardized datasets. And finally, for the superior Ridge model, the e ect of so-called high-frequency variables (sampled every week) is explored. While Random Forest showed little e ect by using di erent versions of the dataset, in the case of the Ridge model, the type of dataset had a significant e ect. While the non-standardized Ridge produces better overall... | en_US |
dc.description.abstract | Cílem této práce je za prvé poskytnout p esn jöí p edpov r stu HDP eské republiky neû oficiální odhad eského statistického ú adu a eské národní banky. Zadruhé rozöí it literaturu, zkoumající predikce asov˝ch ad s pouûitím strojového u ení vyuûívající data s r zn˝mi frekvencemi. P estoûe pouûité mod- ely (Ridge model a Random Forest) nedokázaly p ekonat odhady oficiálních in- stitucí, tato práce p isp la sv˝mi v˝sledky k rozöí ení zatím málo prozkoumané oblasti zab˝vající se vyuûitím strojového u ení s daty o libovoln˝ch frekvencích. Vzhledem k tomu, ûe neexistuje model strojového u ení, kter˝ by um l praco- vat s daty o r zn˝ch frekvencí, tato práce ukazuje, jak prom nné transformo- vat do podoby vhodné pro jak˝koliv model. Dále je zkoumán efekt pouûití r zn˝ch typu datset . Datasety se liöily v asu p edpov di; konec sou asného tvrtletí (nowcast) a 40 dní po referen ním tvrtletí (backcast), typu trnasfor- mace dataset; pouûití standardizovan˝ch a nestandardizovan˝ch dat a nakonec na nejlepöím modelu (Ridge) je zkoumán vliv tzv. vysokofrekven ních prom n- n˝ch (na t˝denní bázi). Zatímco u Random Forestu typ datasetu nehrál v˝z- namnou roli, v p ípad Ridge modelu rozdíln˝ dataset siln ovlivnil odhadované hodnoty. Hlavní rozdíl pak byl mezi netransformovan˝m a transformovan˝m datasetem, kdy p i pouûití... | cs_CZ |
dc.language | English | cs_CZ |
dc.language.iso | en_US | |
dc.publisher | Univerzita Karlova, Fakulta sociálních věd | cs_CZ |
dc.subject | Predikce HDP | cs_CZ |
dc.subject | strojové učení | cs_CZ |
dc.subject | GDP nowcasting | en_US |
dc.subject | machine learning | en_US |
dc.title | Prediction of Czech GDP using mixed-frequency machine learning models | en_US |
dc.type | bakalářská práce | cs_CZ |
dcterms.created | 2023 | |
dcterms.dateAccepted | 2023-09-11 | |
dc.description.department | Institut ekonomických studií | cs_CZ |
dc.description.department | Institute of Economic Studies | en_US |
dc.description.faculty | Fakulta sociálních věd | cs_CZ |
dc.description.faculty | Faculty of Social Sciences | en_US |
dc.identifier.repId | 249443 | |
dc.title.translated | Predikce českého HDP pomocí strojového učení se smíšenou frekvencí | cs_CZ |
dc.contributor.referee | Kukačka, Jiří | |
thesis.degree.name | Bc. | |
thesis.degree.level | bakalářské | cs_CZ |
thesis.degree.discipline | Ekonomie a finance | cs_CZ |
thesis.degree.discipline | Economics and Finance | en_US |
thesis.degree.program | Ekonomické teorie | cs_CZ |
thesis.degree.program | Economics | en_US |
uk.thesis.type | bakalářská práce | cs_CZ |
uk.taxonomy.organization-cs | Fakulta sociálních věd::Institut ekonomických studií | cs_CZ |
uk.taxonomy.organization-en | Faculty of Social Sciences::Institute of Economic Studies | en_US |
uk.faculty-name.cs | Fakulta sociálních věd | cs_CZ |
uk.faculty-name.en | Faculty of Social Sciences | en_US |
uk.faculty-abbr.cs | FSV | cs_CZ |
uk.degree-discipline.cs | Ekonomie a finance | cs_CZ |
uk.degree-discipline.en | Economics and Finance | en_US |
uk.degree-program.cs | Ekonomické teorie | cs_CZ |
uk.degree-program.en | Economics | en_US |
thesis.grade.cs | Výborně | cs_CZ |
thesis.grade.en | Excellent | en_US |
uk.abstract.cs | Cílem této práce je za prvé poskytnout p esn jöí p edpov r stu HDP eské republiky neû oficiální odhad eského statistického ú adu a eské národní banky. Zadruhé rozöí it literaturu, zkoumající predikce asov˝ch ad s pouûitím strojového u ení vyuûívající data s r zn˝mi frekvencemi. P estoûe pouûité mod- ely (Ridge model a Random Forest) nedokázaly p ekonat odhady oficiálních in- stitucí, tato práce p isp la sv˝mi v˝sledky k rozöí ení zatím málo prozkoumané oblasti zab˝vající se vyuûitím strojového u ení s daty o libovoln˝ch frekvencích. Vzhledem k tomu, ûe neexistuje model strojového u ení, kter˝ by um l praco- vat s daty o r zn˝ch frekvencí, tato práce ukazuje, jak prom nné transformo- vat do podoby vhodné pro jak˝koliv model. Dále je zkoumán efekt pouûití r zn˝ch typu datset . Datasety se liöily v asu p edpov di; konec sou asného tvrtletí (nowcast) a 40 dní po referen ním tvrtletí (backcast), typu trnasfor- mace dataset; pouûití standardizovan˝ch a nestandardizovan˝ch dat a nakonec na nejlepöím modelu (Ridge) je zkoumán vliv tzv. vysokofrekven ních prom n- n˝ch (na t˝denní bázi). Zatímco u Random Forestu typ datasetu nehrál v˝z- namnou roli, v p ípad Ridge modelu rozdíln˝ dataset siln ovlivnil odhadované hodnoty. Hlavní rozdíl pak byl mezi netransformovan˝m a transformovan˝m datasetem, kdy p i pouûití... | cs_CZ |
uk.abstract.en | The goal of this study is first to provide superior predictions of Czech GDP growth to the o cial estimates of the Czech Statistical O ce and the proxy estimation of the Czech National Bank. Secondly, to expand the literature that focuses on machine-learning predictions that utilizes data with various sampling frequency. Although in the first goal, this thesis did not succeed as all models, namely Ridge and Random Forest, failed to beat the predictions of o cial institutes, the thesis contributes to the yet scarce literature on mixed-frequency machine-learning prediction. Since no machine-learning model accounts for data with various frequencies, the thesis shows how to transform variables so that any machine-learning model can utilize them. Furthermore, di erent dataset modifications are explored, such as the prediction time: end of the reference quarter (nowcast) and 40 days after the reference quarter (backcast), standardized and non-standardized datasets. And finally, for the superior Ridge model, the e ect of so-called high-frequency variables (sampled every week) is explored. While Random Forest showed little e ect by using di erent versions of the dataset, in the case of the Ridge model, the type of dataset had a significant e ect. While the non-standardized Ridge produces better overall... | en_US |
uk.file-availability | V | |
uk.grantor | Univerzita Karlova, Fakulta sociálních věd, Institut ekonomických studií | cs_CZ |
thesis.grade.code | A | |
uk.publication-place | Praha | cs_CZ |
uk.thesis.defenceStatus | O | |