SMÍŠKOVÁ, L. Zpětnovazebné učení pro POMDPs s využitím modelů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Češka, Milan

V rámci dopracované BP studentka byla schopna splnit minimalistickou verzi zadání. Realizační výstup je ale stále minimální a dále nepříliš použitelný. Kvalita textu je i v dopracované verzi poměrně slabá a přepracované části textu opět nebyly před odevzdáním téměř diskutovány. Na druhou stranu se celkově podařilo BP vylepšit a to zejména experimentální část. Proto navrhuji tuto dopracovanou BP hodnotit známkou E.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Jednalo se o mírně obtížnější zadání, které vyžadovalo pochopení pokročilých technik pro řešení Markovských rozhodovacích procesů s částečným pozorováním (tzv. POMDP) a základních technik pro zpětnovazebné učení. Zadání umožňovalo poměrně široké možnosti realizace, ale studentka se bohužel dostala pouze k naprosto minimalistickému řešení, přestože si odevzdání BP o rok odložila. Navržené a implementované řešení realizuje jistou formu integrace formálních metod a učení (hlavní bod zadání), celkově však nejsem s odvedenou prací příliš spokojen. Ačkoliv se jedná o přepracovanou BP (po předchozím hodnocení F), realizační i textová část je stále poměrně slabá. Aktivita a komunikace během řešení i dopracování BP byla rovněž na minimální úrovni. Mohu však konstatovat, že aspoň zásadní nedostatky byly v rámci dopracování redukovány.
Práce s literaturou Práci s literaturou považuji za podprůměrnou. Studentka nebyla schopna použít doporučenou literaturu ke zpracování teoretické části. Zejména chybí rozumný popis relevantních přístupů pro řešení POMDP, a to jak z oblasti formálních metod tak z oblasti zpětnovazebného učení.
Aktivita během řešení, konzultace, komunikace V průběhu prvního semestru byla aktivita spíše minimální a v druhém semestru se pouze mírně zlepšovala. Studentka se sice snažila pracovat samostatně, ale i přes moje opakované upozornění nebyla schopna dostatečně konzultovat aktuální stav BP a demonstrovat realizační část. V podobném duchu bohužel probíhala i aktivita při dopracovávání BP.
Aktivita při dokončování Dokončování BP bylo velice problematické, jelikož do poslední chvíle nebylo jasné, jak bude realizační výstup vypadat. Tudíž, na sepsání textu zbylo velice málo času a měl jsem pouze minimální šanci výsledný text korigovat. Zásadní kapitoly jsem bud viděl těsně před odevzdáním anebo vůbec (např. experimentální vyhodnocení). Toto se bohužel zásadně podepsalo na kvalitě výsledného textu. Rovněž dokončování přepracované BP bylo problematické a klíčové úpravy byly provedeny na poslední chvíli a tudíž jsem neměl možnost je korigovat.
Publikační činnost, ocenění Vzhledem k značně slabé realizační části a velice slabému textovému zpracování není možné uvažovat o žádné publikaci či využití této BP.
Navrhovaná známka
E
Body
56

Posudek oponenta

Andriushchenko, Roman

Jedná se o uspokojivý realizační výstup a dobře zpracované téma, jehož kvalitu snižuje podprůměrná formální úprava textové zprávy. Rozsáhlejší experimentální vyhodnocení prezentované v aktualizované verzi práce svědčí o potenciálu navrženého přístupu.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání
Rozsah splnění požadavků zadání
Rozsah technické zprávy Technická zpráva má cca 55 normostran. Obsah úvodních kapitol je vyhovující. Kapitola popisující kombinaci induktivní syntézy a posilovaného učení je však dost krátká. Kapitola popisující experimentální vyhodnocení byla v aktualizované verzi významně rozšířena.
Prezentační úroveň technické zprávy 90 Logická struktura a celkový obsah kapitol jsou vyhovující. Bohaté použití (vlastních) příkladů přispívá k pochopitelnosti práce pro čtenáře. V aktualizované verzi BP zásadní nedostatky byly odstraněny.
Formální úprava technické zprávy 55 I když některé nedostatky byly odstraněny, formální úprava technické zprávy stále trpí řadou problémů: špatná kapitalizace, chyby v interpunkci, chybějící popisky u některých grafů, nevyhovující sazba pseudokódu, apod. Celkově formální úprava výrazně zhoršuje čitelnost jinak logicky dobře navrženého textu. Jazyková úroveň textu je vyhovující.
Práce s literaturou 80 Autor využívá vhodné studijní prameny a jednoznačně odlišuje převzaté informace od vlastního přínosu. Na druhou stranu, kapitola o RL zaslouží více citací, rovněž nejsou citovány některé použité knihovny.
Realizační výstup 75 Programové řešení je minimalistické, avšak je plně funkční a splňuje zadání. Implementace byla tentokrát testována na rozšířené sadě POMDP benchmarků a stále nedemonstruje velmi působivé výsledky, nicméně na některých modelech někdy dokáže identifikovat lepší kontroléry než dosavadní řešení.
Využitelnost výsledků Vzhledem k nepůsobivým experimentálním výsledkům se neočekávají žádné publikační výstupy. Na druhou stranu, práce demonstrovala výhody navrženého řešení pro vybrané modely, což svědčí o jeho potenciálu.
Navrhovaná známka
D
Body
62

Otázky

eVSKP id 162598