Webový portál pro fotbalové fanoušky
Loading...
Date
Authors
Bučka, Timotej
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Táto práca sa zaoberá predikciou výsledkov futbalových zápasov na základe predchádzajúcich výkonov tímov. Cieľom je preskúmať predpovedateľnosť zápasov v anglickej Premier League a EFL Championship a vytvoriť aplikáciu, ktorá používateľom zobrazí aktuálne predpovede a zápasové štatistiky. Príznaky ako aktuálna forma, priemerný počet gólov na zápas a vzájomná bilancia boli vypočítané z údajov zo sezón od roku 1993/1994, a použité pri klasifikácii. Bolo preskúmaných osem rôznych klasifikačných algoritmov, pričom algoritmus logistickej regresie dosiahol najlepšie výsledky v oboch ligách. V prípade Premier League dosiahol model na testovacej sade presnosť 55%. V porovnaní s predpoveďami stávkových kancelárií bola výkonnosť modelov porovnateľná. Zápasy s jasným favoritom bolo možné spoľahlivo predpovedať, avšak pre zápasy medzi vyrovnanými týmami bola predikcia značne horšia.
This thesis focuses on predicting the outcomes of football matches based on teams' past performances. Its aim is to explore match predictability in the English Premier League and the EFL Championship, and to implement an application that provides users with up-to-date predictions and relevant statistics. Features such as recent form, goals per game, and head-to-head performance were calculated using data from seasons starting in 1993/1994 and were used as inputs for classification. Eight different classification algorithms were explored, with logistic regression achieving the best performance for both leagues. For the Premier League, the model reached a test set accuracy of 55%. When compared to bookmaker predictions, the performance is comparable but shows the random nature of football matches. It was possible to predict the results of matches with a clear favourite on a consistent basis, but in matches between two evenly matched teams, this has not been the case.
This thesis focuses on predicting the outcomes of football matches based on teams' past performances. Its aim is to explore match predictability in the English Premier League and the EFL Championship, and to implement an application that provides users with up-to-date predictions and relevant statistics. Features such as recent form, goals per game, and head-to-head performance were calculated using data from seasons starting in 1993/1994 and were used as inputs for classification. Eight different classification algorithms were explored, with logistic regression achieving the best performance for both leagues. For the Premier League, the model reached a test set accuracy of 55%. When compared to bookmaker predictions, the performance is comparable but shows the random nature of football matches. It was possible to predict the results of matches with a clear favourite on a consistent basis, but in matches between two evenly matched teams, this has not been the case.
Description
Keywords
zber dát , príprava dát , klasifikácia , dolovanie dát , strojové učenie , logistická regresia , futbal , Premier League , EFL Championship , Python , data collection , data preparation , classification , data mining , machine learning , logistic regression , football , Premier League , EFL Championship , Python
Citation
BUČKA, T. Webový portál pro fotbalové fanoušky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, Ph.D. (předseda)
RNDr. Marek Rychlý, Ph.D. (člen)
doc. Ing. Zdeněk Vašíček, Ph.D. (člen)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
Ing. Ivana Burgetová, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
Result of defence
práce byla úspěšně obhájena
