WALICA, R. Modelování tenisového zápasu pomocí Markovského řetězce [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2023.

Posudky

Posudek vedoucího

Hrabec, Pavel

Autor bezezbytku splnil zadané cíle. Práce je vhodně členěna do 3 kapitol. První přibližuje základní pravidla tenisu tak, aby se i člověk, který tenis nikdy neviděl zvládnul zorientovat v dalších kapitolách. Ve druhé kapitole jsou připomenuty základní matematické pojmy, které jsou poté použity ve třetí kapitole pro formování a zdokonalování modelu tenisového gamu, tiebreaku, setu a celého zápasu. Nemalou součástí práce byl samotný sběr dat, kdy se podařilo sebrat údaje o průběhu 11601 validních (pouze ze soutěžních a dohraných zápasů) gamů vybraného profesionálního hráče. Sebraná data jsou pak využita k naplnění pravděpodobností přechodu Markovských řetězců modelujících jednotlivé části tenisového zápasu. Autor provázal testy statistických hypotéz se svou znalostí tenisu a tyto testy hypotéz jsou vhodně použity ať už pro rozšíření řetězců, nebo pro agregaci některých pravděpodobností přechodu. Je vhodné ocenit fakt, že práce vznikala v průběhu celého roku, a autorův svědomitý přístup jak k samotným výpočtům, tak ke tvorbě celého textu. Práci považuji za velmi zdařilou a drobné výtky lze mít spíš k nenaplněnému potenciálu (nad rámec zadání), než k práci samotné. Práce by například snesla důkladnější srovnání s publikovanými články z podobné oblasti, které povětšinou nahrazují jakékoli snahy o matematické ověření zkoumaných částí Markovova řetězce silnými expertními výroky, jejichž platnost dále neověřují. Práci doporučuji k obhajobě s hodnocením B.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod B
Vlastní přínos a originalita B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii C
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací C
Samostatnost studenta při zpracování tématu C
Navrhovaná známka
B

Posudek oponenta

Hübnerová, Zuzana

Práce je věnována zajímavé aplikaci Markovových řetězců při analýze výsledků tenisových zápasů. Úvodní kapitola připomíná pravidla hry tenisu, dále jsou zavedeny potřebné pojmy, zmíněn web scraping. Práce je zaměřena na analýzu zápasů nejlepšího německého hráče Zvereva. Po přípravě dat je věnována pozornost vhodnému modelu pro pravděpodobnosti přechodu mezi jednotlivými stavy v gamu, případně tiebreaku nebo setu. Vlivy možných faktorů jako je typ povrchu kurty či fakt, zda hráč podává nebo ne, případně shodnosti některých pravděpodobnostní přechodu jsou ověřovány Pearsonovým testem případně testem poměrem věrohodnosti. V závěru jsou využity zvolené absorpční řetězce, resp. jejich fundamentální matice, k odhadu parametrů zápasu. Téma práce mi přijde velmi zajímavé, jde o krásnou ukázku využití Markovových řetězců na reálných datech. Aplikace Markovových řetězců je dotažena až k výpočtu pravděpodobností absorpce řetězce v daném absorpčním stavu (výhry Zvereva nebo jeho protihráče) a střední hodnoty počtu kroků, které řetězec stráví v neabsorpčních stavech, když vychází z nějakého neabsorpčního stavu a skončí v absorpčním stavu (střední délka gamu, střední délka tiebreaku, střední délka setu, případně střední délka zápasu na 2 nebo 3 vítězné sety). Zmínka o web scrapingu výsledků Zvereva z dvou webových stránek naznačuje, že Bc. Walica si dal práci s přípravou dat, která vyžaduje vždy značné úsilí a to nebývá mnohdy doceněno. V online příloze práce lze nalézt zpracovávaná data společně s matlabovskými kódy. Grafická prezentace dat v práci je povedená, viz např. obr. 4.14. Markovovy řetězce jsou přehledně znázorněny přechodovými diagramy, sázení rozměrných matic přechodu musela být velká zábava. Dle mého názoru, by postupné ověřování shodnosti pravděpodobností pomocí Pearsonova testu užité v práci mohlo být nahrazeno ověřováním hypotéz o parametrech modelu vhodné logistické regrese s faktory typ povrchu, podání/příjem a přechod mezi uzly. Mohly by pak být ověřovány hypotézy o shodnostech pravděpodobností přechodu na různých typech povrchů zvlášť nebo ověřovány významnosti interakcí mezi faktory. Navíc by takovým přístupem byla lépe kontrolována chyba I. druhu testů – viz např. závěr u tabulky 4.5 nebo 4.16, kde každý z testů má chybu I druhu 5%.  Přijde mi škoda, že práce není napsaná s pečlivější myslí. Pro ukázku zde uvádím své poznámky: - U uvedení testů dobré shody v části 3.2.1 chybí předpoklad nezávislosti pokusů. - V definici 3.5 chybí zmínka, že pravděpodobnostní funkce je nenulová pouze pokud součet složek vektoru je n. - Domnívám se, že definice 3.6 je chybná a navíc vůbec nezapadá do následujícího textu. - V definici 3.17 chybí vysvětlení pojmu pravděpodobnosti f_ii. - Na str. 24 chybí hodnota testového kritéria. Nejde k nekonečnu, jak je naznačeno. - Řetězec na obr. 4.4 vlevo jistě nelze použít k popsání situace na obr. 4.4. vpravo, jak je zmíněno v textu, už jen proto, že neobsahuje absorpční stavy. - Přepočet pravděpodobnosti pro „model bez výhod“ na str. 27 není korektní, protože neuvažuje situace až teoreticky nekonečného cyklu mezi shodou a výhodami. - Slovní formulace hypotéz na str. 24, 26, 28, 29 atd. by zasloužily i přesnější matematický zápis. Například z formulace hypotézy na str. 19 nahoře není zřejmé, zda jde o shodnost celého řádku (všechny pravděpodobnosti multinomického rozdělení, nebo pouze její j-té složky). Dále není jasné, co je čas t uvedený v odhadu. V odvození testového kritéria není uvedeno maximum věrohodnostní funkce ale pouze jeho násobek. -V práci se v některých místech zaměňují odhady pravděpodobností a pravděpodobnosti (viz např. vysvětlení za (4.2)).  Závěrem bych chtěla říci, že Bc. Walica své diplomové práci evidentně věnoval nemalé úsilí, jak při samotném sběru dat tak při hledání vhodného modelu, který pak použil k odhadům středních délek gamu, tiebreaku, setu a délky zápasu a pravděpodobnostem výhry Zvereva nebo jeho protihráče na různých typech povrchu. Kvůli svým výše uvedeným výtkám mu ale navrhuji hodnocení C.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání B
Postup a rozsah řešení, adekvátnost použitých metod C
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry C
Využitelnost výsledků v praxi nebo teorii B
Logické uspořádání práce a formální náležitosti C
Grafická, stylistická úprava a pravopis C
Práce s literaturou včetně citací C
Navrhovaná známka
C

Otázky

eVSKP id 150045