KLANICA, J. Posilované učení pro hraní robotického fotbalu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Smrž, Pavel

Z hlediska aktivity studenta a celkových výsledků hodnotím práci jako výbornou, navrhuji tedy stupeň A. Student pronikl do náročné oblasti posilovaného učení, vynaložil v rámci obou semestrů značné úsilí a vytvořil funkční řešení, které snese srovnání s výzkumnými výsledky mezinárodních týmů.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Práce vyžadovala nastudování pokročilých metod posilovaného učení, které jdou výrazně nad rámec toho, co je vyučováno v rámci bakalářského programu, a také vytvoření řešení, provozované na výkonných GPU, které upravuje simulační prostředí simulovaného robotického fotbalu Google. Student se těchto úkolů zhostil výborně, vytvořil funkční systém a vyhodnotil výsledky v náročných experimentech. Přestože se nadějný nápad kompenzace zrakového omezení robotů pomocí paměťového modulu neosvědčil, práce splnila hlavní cíl, když ukázala potřebu věrného modelování reálných senzorických omezení v simulovaných systémech. S výsledky jsem tedy spokojen.
Práce s literaturou Jan Klanica velmi aktivně získával a studoval relevantní studijní materiály a na základě nich vytvořil velmi dobrý přehled aktuálního výzkumu v dané oblasti.
Aktivita během řešení, konzultace, komunikace Student byl během řešení v obou semestrech velmi aktivní, celkově věnoval práci výrazně nadlimitní úsilí, každý týden posílal zprávy o postupu prací a pravidelně konzultoval zásadní kroky ve směrování práce.
Aktivita při dokončování Vývojové práce, experimenty i technická zpráva byly dokončeny v dostatečném předstihu, měl jsem možnost připomínkovat několik průběžných verzí textu a moje zpětná vazba byla vždy řádně začleněna do dalších verzí.
Publikační činnost, ocenění -
Navrhovaná známka
A
Body
95

Posudek oponenta

Fajčík, Martin

Práca splnila zadanie, popísala teóriu jej metódy bez vážnejších pochybení, a obsahuje zaujímavú analýzu v podobe analýzy dynamiky učenia, aj najlepšej naučenej stratégie. Jej riešenie považujem za nadpriemerné a navrhujem známku B.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání
Rozsah splnění požadavků zadání
Rozsah technické zprávy
Prezentační úroveň technické zprávy 75 Kapitoly majú logickú náväznosť. Vytkol by som kapitolu 2.6, ktorá ma iba motivačný zmysel, a jej poznatky sa hodia skôr do úvodu. Pochopitelnosť je miestami obmedzená chybami vo formálnej notácii, a nejasnými obrázkami. V podstatných prípadoch sa ale dajú domyslieť. Príklady: - Obr. 2.2 obsahuje akési "bubliny" okolo agentov, ktoré majú nejasný význam. - Notácia odmien je 3x rôzna na strane 10 (definicie MRP) ,12 (obr. 2.4),13 (formula 2.1). - Chyba vo formule očakávanej hodnoty, formula 2.3. - Použitie termínu veta pre definíciu. - Občasné vágne vyjdarenia, ako na str. 17 "... MHA umožňuje modelu zaměřit se na různé vztahy mezi tokeny v sekvenci a zachytit složité závislosti, FFN poskytuje nelineární transformaci, která umožňuje modelu extrahovat složitější nelineární vztahy a vzory mezi jednotlivými tokeny v sekvenci, čímž obohacuje jejich reprezentaci pro následné zpracování" - Neznámy interval okolo krivky v obrazkoch vyhodnoceni (napr. obr 5.1). po konzultacii bolo vyjasnené.
Formální úprava technické zprávy 95 Citovanie občas prebiehalo formou "ten a ten a ďalši v []"
Práce s literaturou 65 Úvod bez citácií. Citovanie preprintov pri dostupnosti recenzovaných verzií (napr. citace 3) Občasné tvrdenia bez citácií (napr. str 17. rezidualne prepojenia umoznuji gradientum volnejsi prochazet siti, alebo súťaž RoboCup  v kap. 2.6).
Realizační výstup 90 Kód obsahuje readme, je zdokumentovaný. Validácie je v poriadku, je ale škoda že systém nebol trénovaný aj v režime self-play; takto sa systém často naučí obísť AI v simulátore a prísť k jednoduchému riešeniu situácie. Na validácii metód je ale tento systém dostatočný k pozorovaniu rozdielov.
Využitelnost výsledků Práca prináša úzke nové poznatky v smere vplyvu obštrukcie viditeľnosti na chovanie agentov v simulátore.
Navrhovaná známka
B
Body
80

Otázky

eVSKP id 161676