Posudky závěrečné kvalifikační práce

Z hlediska aktivity studenta a celkových výsledků hodnotím práci jako výbornou, navrhuji tedy stupeň A. Student pronikl do náročné oblasti posilovaného učení, vynaložil v rámci obou semestrů značné úsilí a vytvořil funkční řešení, které snese srovnání s výzkumnými výsledky mezinárodních týmů.

Dílčí hodnocení
Kritérium	Známka	Body	Slovní hodnocení
Informace k zadání			Práce vyžadovala nastudování pokročilých metod posilovaného učení, které jdou výrazně nad rámec toho, co je vyučováno v rámci bakalářského programu, a také vytvoření řešení, provozované na výkonných GPU, které upravuje simulační prostředí simulovaného robotického fotbalu Google. Student se těchto úkolů zhostil výborně, vytvořil funkční systém a vyhodnotil výsledky v náročných experimentech. Přestože se nadějný nápad kompenzace zrakového omezení robotů pomocí paměťového modulu neosvědčil, práce splnila hlavní cíl, když ukázala potřebu věrného modelování reálných senzorických omezení v simulovaných systémech. S výsledky jsem tedy spokojen.
Práce s literaturou			Jan Klanica velmi aktivně získával a studoval relevantní studijní materiály a na základě nich vytvořil velmi dobrý přehled aktuálního výzkumu v dané oblasti.
Aktivita během řešení, konzultace, komunikace			Student byl během řešení v obou semestrech velmi aktivní, celkově věnoval práci výrazně nadlimitní úsilí, každý týden posílal zprávy o postupu prací a pravidelně konzultoval zásadní kroky ve směrování práce.
Aktivita při dokončování			Vývojové práce, experimenty i technická zpráva byly dokončeny v dostatečném předstihu, měl jsem možnost připomínkovat několik průběžných verzí textu a moje zpětná vazba byla vždy řádně začleněna do dalších verzí.
Publikační činnost, ocenění			-

Posudek oponenta

Fajčík, Martin

Práca splnila zadanie, popísala teóriu jej metódy bez vážnejších pochybení, a obsahuje zaujímavú analýzu v podobe analýzy dynamiky učenia, aj najlepšej naučenej stratégie. Jej riešenie považujem za nadpriemerné a navrhujem známku B.

Dílčí hodnocení
Kritérium	Body	Slovní hodnocení
Náročnost zadání
Rozsah splnění požadavků zadání
Rozsah technické zprávy
Prezentační úroveň technické zprávy	75	Kapitoly majú logickú náväznosť. Vytkol by som kapitolu 2.6, ktorá ma iba motivačný zmysel, a jej poznatky sa hodia skôr do úvodu. Pochopitelnosť je miestami obmedzená chybami vo formálnej notácii, a nejasnými obrázkami. V podstatných prípadoch sa ale dajú domyslieť. Príklady: - Obr. 2.2 obsahuje akési "bubliny" okolo agentov, ktoré majú nejasný význam. - Notácia odmien je 3x rôzna na strane 10 (definicie MRP) ,12 (obr. 2.4),13 (formula 2.1). - Chyba vo formule očakávanej hodnoty, formula 2.3. - Použitie termínu veta pre definíciu. - Občasné vágne vyjdarenia, ako na str. 17 "... MHA umožňuje modelu zaměřit se na různé vztahy mezi tokeny v sekvenci a zachytit složité závislosti, FFN poskytuje nelineární transformaci, která umožňuje modelu extrahovat složitější nelineární vztahy a vzory mezi jednotlivými tokeny v sekvenci, čímž obohacuje jejich reprezentaci pro následné zpracování" - Neznámy interval okolo krivky v obrazkoch vyhodnoceni (napr. obr 5.1). po konzultacii bolo vyjasnené.
Formální úprava technické zprávy	95	Citovanie občas prebiehalo formou "ten a ten a ďalši v []"
Práce s literaturou	65	Úvod bez citácií. Citovanie preprintov pri dostupnosti recenzovaných verzií (napr. citace 3) Občasné tvrdenia bez citácií (napr. str 17. rezidualne prepojenia umoznuji gradientum volnejsi prochazet siti, alebo súťaž RoboCup v kap. 2.6).
Realizační výstup	90	Kód obsahuje readme, je zdokumentovaný. Validácie je v poriadku, je ale škoda že systém nebol trénovaný aj v režime self-play; takto sa systém často naučí obísť AI v simulátore a prísť k jednoduchému riešeniu situácie. Na validácii metód je ale tento systém dostatočný k pozorovaniu rozdielov.
Využitelnost výsledků		Práca prináša úzke nové poznatky v smere vplyvu obštrukcie viditeľnosti na chovanie agentov v simulátore.

Posudky

Posudek vedoucího

Smrž, Pavel

Posudek oponenta

Fajčík, Martin

Otázky