KLANICA, J. Posilované učení pro hraní robotického fotbalu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Z hlediska aktivity studenta a celkových výsledků hodnotím práci jako výbornou, navrhuji tedy stupeň A. Student pronikl do náročné oblasti posilovaného učení, vynaložil v rámci obou semestrů značné úsilí a vytvořil funkční řešení, které snese srovnání s výzkumnými výsledky mezinárodních týmů.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Práce vyžadovala nastudování pokročilých metod posilovaného učení, které jdou výrazně nad rámec toho, co je vyučováno v rámci bakalářského programu, a také vytvoření řešení, provozované na výkonných GPU, které upravuje simulační prostředí simulovaného robotického fotbalu Google. Student se těchto úkolů zhostil výborně, vytvořil funkční systém a vyhodnotil výsledky v náročných experimentech. Přestože se nadějný nápad kompenzace zrakového omezení robotů pomocí paměťového modulu neosvědčil, práce splnila hlavní cíl, když ukázala potřebu věrného modelování reálných senzorických omezení v simulovaných systémech. S výsledky jsem tedy spokojen. | ||
| Práce s literaturou | Jan Klanica velmi aktivně získával a studoval relevantní studijní materiály a na základě nich vytvořil velmi dobrý přehled aktuálního výzkumu v dané oblasti. | ||
| Aktivita během řešení, konzultace, komunikace | Student byl během řešení v obou semestrech velmi aktivní, celkově věnoval práci výrazně nadlimitní úsilí, každý týden posílal zprávy o postupu prací a pravidelně konzultoval zásadní kroky ve směrování práce. | ||
| Aktivita při dokončování | Vývojové práce, experimenty i technická zpráva byly dokončeny v dostatečném předstihu, měl jsem možnost připomínkovat několik průběžných verzí textu a moje zpětná vazba byla vždy řádně začleněna do dalších verzí. | ||
| Publikační činnost, ocenění | - |
Práca splnila zadanie, popísala teóriu jej metódy bez vážnejších pochybení, a obsahuje zaujímavú analýzu v podobe analýzy dynamiky učenia, aj najlepšej naučenej stratégie. Jej riešenie považujem za nadpriemerné a navrhujem známku B.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | |||
| Rozsah splnění požadavků zadání | |||
| Rozsah technické zprávy | |||
| Prezentační úroveň technické zprávy | 75 | Kapitoly majú logickú náväznosť. Vytkol by som kapitolu 2.6, ktorá ma iba motivačný zmysel, a jej poznatky sa hodia skôr do úvodu. Pochopitelnosť je miestami obmedzená chybami vo formálnej notácii, a nejasnými obrázkami. V podstatných prípadoch sa ale dajú domyslieť. Príklady: - Obr. 2.2 obsahuje akési "bubliny" okolo agentov, ktoré majú nejasný význam. - Notácia odmien je 3x rôzna na strane 10 (definicie MRP) ,12 (obr. 2.4),13 (formula 2.1). - Chyba vo formule očakávanej hodnoty, formula 2.3. - Použitie termínu veta pre definíciu. - Občasné vágne vyjdarenia, ako na str. 17 "... MHA umožňuje modelu zaměřit se na různé vztahy mezi tokeny v sekvenci a zachytit složité závislosti, FFN poskytuje nelineární transformaci, která umožňuje modelu extrahovat složitější nelineární vztahy a vzory mezi jednotlivými tokeny v sekvenci, čímž obohacuje jejich reprezentaci pro následné zpracování" - Neznámy interval okolo krivky v obrazkoch vyhodnoceni (napr. obr 5.1). po konzultacii bolo vyjasnené. | |
| Formální úprava technické zprávy | 95 | Citovanie občas prebiehalo formou "ten a ten a ďalši v []" | |
| Práce s literaturou | 65 | Úvod bez citácií. Citovanie preprintov pri dostupnosti recenzovaných verzií (napr. citace 3) Občasné tvrdenia bez citácií (napr. str 17. rezidualne prepojenia umoznuji gradientum volnejsi prochazet siti, alebo súťaž RoboCup v kap. 2.6). | |
| Realizační výstup | 90 | Kód obsahuje readme, je zdokumentovaný. Validácie je v poriadku, je ale škoda že systém nebol trénovaný aj v režime self-play; takto sa systém často naučí obísť AI v simulátore a prísť k jednoduchému riešeniu situácie. Na validácii metód je ale tento systém dostatočný k pozorovaniu rozdielov. | |
| Využitelnost výsledků | Práca prináša úzke nové poznatky v smere vplyvu obštrukcie viditeľnosti na chovanie agentov v simulátore. |
eVSKP id 161676