JANEČEK, J. Predikce úspěšnosti fotbalistů s využitím metod strojového učení [online]. Brno: Vysoké učení technické v Brně. CESA. 2024.
Student Jan Janeček vypracoval bakalářskou práci, ve které se zabývá predikcí úspěšnosti hráče na základě informací sesbíraných během tréninků. První kapitola práce obsahuje povrchní rešerši, která místy zabíhá ke zbytečným faktům, zároveň jsou zde pasáže, které by se hodilo zařadit spíše do kapitoly čtvrté, kde se pracuje přímo s daty. Navazující druhá kapitola obsahuje podrobnější popis prvků architektury umělé neuronové sítě a jejich funkce. Popis je poměrně zdařilý a odpovídá úrovni bakalářské práce. Ve třetí kapitole je čtenář seznámen s použitým datasetem. Tato část práce je pravděpodobně nejzdařilejší. Autor jasně popisuje měřené parametry, přičemž komentuje i jejich kontext pro použití v rámci zadání práce. Z množství parametrů pak vybírá ty, jež by pravděpodobně měly být nápomocny ke splnění cílů práce. Kapitola pátá se týká tvorby samotného modelu. Autor správně popisuje vliv některých hyperparametrů jako je např. počet neuronů v jednotlivých vrstvách. Zároveň ale kapitola obsahuje pouze jednu tabulku s výsledky. Ty byly dosaženy jednoduchou brute force optimalizací. Na snímku 5.1 autor ukazuje průběh učení modelu s použitím optimalizátoru Adam, aby v další kapitole mluvil o optimalizátoru Ftrl, který není nikde dříve zmíněn. V diskuzi se čtenář dozví, že model generuje stále stejný outcome. Tento fakt jej v praxi činí nepoužitelným. Autor však správně poukazuje na dílčí problémy a prostor pro zlepšení. Práce je zhotovena na 24 stranách textu a pracuje s 20 zdroji. Student pravidelně konzultoval i přes to, že tempo vypracování nebylo nutně konstantní. Práce obsahuje minimum překlepů a pravopisných chyb. I přes nefunkčnost řešení student prokázal schopnost pracovat s daty a diskutovat možné příčiny nezdaru. Práci navrhuji na hodnocení D, 65 bodů.
Cílem bakalářské práce studenta Jana Janečka bylo predikovat přínos nasazení hráče do sestavy pomocí tréninkových dat a metod strojového učení. Teoretická část obsahuje příliš obecné, místy redundantní pasáže. Zároveň v ní chybí popis stávajících metod používaných v řešené či příbuzné oblasti. K dosažení cíle student zvolil postup založený na umělé neuronové síti. Volba tohoto modelu je argumentována rozsáhlým souborem dat, který se však skládá z údajů pouze od 25 sportovců, přičemž se jedná o čtyři různé typy hráčů. Jedním z bodů zadání je průzkumová analýza dat. V práci přesto postrádám objektivní nebo alespoň vizuální kontrolu relevantnosti vybraných příznaků a ověření, zda měla být použitá data ze všech tří tréninkových dnů (např. posouzením vztahů/rozdílů mezi příznaky z různých tréninků). Bylo by také užitečné porovnat kvalitu predikce na základě vybraného souboru příznaků s řešením využívajícím všechny dostupné příznaky nebo příznaky vybrané oběma experty. Student se pokusil optimalizovat hyperparametry a topologii vytvořeného modelu, ale tabulka 5.1 poukazuje na zanedbatelný vliv topologie na kvalitu predikce. To je pravděpodobně způsobeno nefunkčností prediktoru, což student nakonec v práci přiznává. Oceňuji diskuzi limitací implementovaných metod a spolupráci studenta s odborníky při výběru příznaků. Formální stránka je na dobré úrovni. Zadání práce je splněno, i když bych očekávala větší experimentování a větší snahu o dosažení kvalitních výsledků v tak zajímavém praktickém úkolu. Hodnocení: D 62 b.
eVSKP id 159346