Predicting the outcomes of tennis matches. How important is the factor of different surfaces?
Předpovídání výsledků tenisových zápasů. Jak důležitý je faktor různých povrchů?
bachelor thesis (DEFENDED)
View/ Open
Permanent link
http://hdl.handle.net/20.500.11956/190596Identifiers
Study Information System: 259870
Collections
- Kvalifikační práce [17632]
Author
Advisor
Referee
Palanský, Miroslav
Faculty / Institute
Faculty of Social Sciences
Discipline
Economics and Finance
Department
Institute of Economic Studies
Date of defense
10. 6. 2024
Publisher
Univerzita Karlova, Fakulta sociálních vědLanguage
English
Grade
Excellent
Keywords (Czech)
tenis, sázkové kurzy, předpovídaní zápasů, ATP, logistická regreseKeywords (English)
tennis, betting odds, predicting matches, ATP, logistic regressionTato práce se zaměřuje na předpovídání výsledků ATP zápasů v tenise s cílem prozkoumat důležitost tenisových povrchů. Pro analýzu bylo definováno devět nových povrchových proměnných na základě dvou různých klastrových method. Tyto proměnné byly začleněny do modelů, které byly následně odhadnuty po- mocí logistické regrese. Takový přístup nám umožňuje robustně sledovat, jak se vliv specializace na konkrétní povrch promítá do pravděpodobnosti vítězství v zápase. Přesnost těchto modelů se pohybovala mezi 63% a 65%, přičemž modely zahrnující vliv specializace na povrch vykazují vyšší přesnost predikcí. Na základě několika hodnotících metrik výsledky potvrzují, že specializace na povrch je při předpovídání tenisových zápasů klíčovou proměnnou. Jsme také schopni určit, že nejpřesnější metrikou pro měření specializace povrchu je rozdíl v normalizované procentuální úspěšnosti na daném povrchu. Analýza navíc ukazuje, že specializace na travnaté kurty je ve srovnání s antukovými nebo tvrdými kurty nejdůležitější. Nakonec definujeme sázkové strategie založené na předpovězených pravděpodobnostech z modelů a jsme schopni dosáhnout kladné návratnosti investic (ROI). Zohlednění vlivu specializace na povrch zvyšuje ROI u nenaivních sázkových strategií. Klasifikace JEL C10, C38, C53, L83 Klíčová slova tenis,...
This thesis focuses on predicting the outcomes of ATP tennis matches with the aim of investigating the effect of different tennis surfaces. We define nine surface variables based on two different clustering methods, and incorporate these variables into models that were estimated using logistic regression. Such approach allows us to robustly observe how the effect of specializing on a spe- cific surface translates into the match winning probability. The accuracy of the models ranges from 63% to 65%, with the models incorporating the effect of surface specialization displaying a superior predictive accuracy. Based on several evaluation metrics, the results confirm that surface specialization is a crucial variable when predicting tennis matches. We are also able to identify that the most accurate metric to measure surface specialization is the difference in normalized winning rate. Moreover, the analysis reveals that the specializa- tion on grass courts is the most important compared to clay or hard courts. Lastly, we formalize betting strategies based on the predicted probabilities from the models, and we are able to achieve positive out-of-sample return on invest- ment (ROI). Accounting for the effect of surface specialization increases ROI on the non-naive betting strategies. JEL Classification...