HUDÁK, D. Využití zpětnovazebné učení a induktivní syntézy pro konstukci robustních kontroléru v POMDPs [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Češka, Milan

Vzhledem k obtížnému zadání, samostatné práci a velice kvalitnímu zpracovaní realizační i textové části DP, navrhuji hodnotit tuto práci známkou A. Vzhledem k tomu, že dosažené výsledky mají značný publikační potenciál, navrhuji práci ocenit cenou děkana a případně uvážit do soutěže IT SPY.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Jednalo se o náročné zadání s výzkumným zaměřením, které vyžadovalo nastudování pokročilých technik pro řešení Markovských rozhodovacích procesů s částečným pozorováním (tzv. POMDP) a pokročilých technik pro zpětnovazebné učení. Během práce na DP student narazil na problémy s existujícími nástroji pro zpětnovazebné učení v POMDP a tudíž musel nad rámec původního zadání značnou část metod pro zpětnovazebné učení re-implementovat. Student se dobře zorientoval v dané problematice a podařilo se mu samostatně vyřešit nastalé komplikace a těžké zadání splnit. Celkově jsem by z jeho prací velmi spokojen a plánujeme dosažené výsledky dále vylepšit a dotáhnout do kvalitní publikace (viz níže).
Práce s literaturou Student se samostatně seznámil s existující literaturou a velice kvalitně zpracoval úvodní teoretickou část včetně existujících přístupů k řešenému problému.
Aktivita během řešení, konzultace, komunikace Student byl již od začátku semestru velice aktivní, dodržoval dohodnuté termíny a dostatečně konzultoval svůj postup. Velice oceňuji, že student pracoval samostatně a prokázal schopnost se sám zorientovat v relativně obtížné a pro studenta nové oblasti.
Aktivita při dokončování Student zvládl realizační i textovou část DP dokončit včas, a tak mohla být výsledná podoba DP dostatečně konzultována. Připomínky k textu student zodpovědně zapracoval a mohu konstatovat, že výsledný text je dobře logicky strukturován a celková kvalita prezentace včetně angličtiny je na velmi vysoké úrovni – toto demonstruje schopnost studenta samostatně vypracovat kvalitní odborný text.
Publikační činnost, ocenění Aktuálně student komunikuje s odborníky z FI MUNI v oblasti zpětnovazebného učení ohledně rozšíření této DP a přípravy publikace na některou ze špičkových AI konferencí. Výsledky dosažené v DP jsou velice slibné a tudíž předpokládám, že během léta se nám podaří publikaci dokončit – počítáme přitom s aktivním zapojením studenta.
Navrhovaná známka
A
Body
92

Posudek oponenta

Holík, Lukáš

Velmi pěkná vědecká práce. Viz. výše.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Problematika formální syntézy ve stochastickém prostředí je náročné téma, kombinace formálních metod s učením neuronových sítí je aktuální živé výzkumné téma s prvními výsledky. Učení neuronových sítí je magie, do které student pravděpodobně musel proniknout bez výrazné pomoci školitele. Orientace v nástrojích jako PAYNT je náročný úkol.
Rozsah splnění požadavků zadání Zadání bylo splněno ve v všech bodech, a studentův výstup, implementace, překonává výsledky state of the art metod v oblasti.
Rozsah technické zprávy Práce by mohla být,  stručnější, text je i přes obšírnost kvalitní a relevantní, nemám proto výrazné výhrady. V diskusi vlastního řešení bych očekával o něco více formálního matematického textu na úkor povídání. Toto jsou ale jen velmi drobné výhrady. Text je velmi kvalitní.
Prezentační úroveň technické zprávy 90 Jedinou mou výtkou je snad délka, a ne zcela jasná relevance kapitol úvodu k vlastní práci. Relevantní úvod určitě je, jedná se o obšírnější úvod do syntézy a strojového učení, jen mi chybí konkrétnější vazby. Jinak je text velmi kvalitní.
Formální úprava technické zprávy 100 Velmi pěkná angličtina a bezchybná typografie.
Práce s literaturou 100 Do hloubky nastudováno množství náročné technické literatury, v textu se s ní pracuje formálně bezchybně.
Realizační výstup 95 Student implementoval algoritmus syntézy agentů, který kombinuje nástroj PAYNT,  a učení neuronových sítí. Aplikoval a vylepšil metody nedávno publikované na špičkových fórech, které jeho implementace poměrně přesvědčivě překonává. Jedná se o extrémně pozitivní výsledek, který bude pravděpodobně publikovatelný na podobném prestižním fóru. Navíc, v částí práce související s učením neuronových sítí se studentovi tuším mohlo dostat jen omezeného vedení, protože skupina školitele zde má jen omezenou zkušenost. Celkově jde o úctyhodný výkon a výsledek.
Využitelnost výsledků Zajímavý pokrok v živé oblasti výzkumu kombinace formálních metod a učení neuronových sítí v pravděpodobnostní syntéze. Pravděpodobně povede k pěkné publikaci a skupina bude ve vzýkumu tématu pokračovat.
Navrhovaná známka
A
Body
95

Otázky

eVSKP id 157079