KĽUČIAR, A. Zlepšování vysvětlitelnosti výrazů generovaných genetickým programováním [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Sekanina, Lukáš

Diplomová práce splnila pouze základní cíl, zejména kvůli velmi zjednodušenému přístupu k posouzení vysvětlitelnosti vygenerovaných výrazů a použití zjednodušené metodologie při práci s CGP. Očekával jsem mimo jiné, že diplomant použije sofistikovanější přístup, než poskytuje pouhé měření velikosti výrazu. Vzhledem k dosaženým výsledkům navrhuji hodnocení stupněm D - uspokojivě.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem práce bylo pomocí různých omezení zavedených do kartézského genetického programování (CGP) zlepšit vysvětlitelnost výrazů, které CGP generuje pro řešení úloh z oblasti regrese a klasifikace. Zadání bylo průměrně obtížné. Pro vyhodnocení diplomant zvolil sedm úloh, pro které pomocí CGP nalezl referenční řešení. Zavedená omezení pro CGP (velikost výrazu a komplexita množiny funkcí) jsou základní. Vysvětlitelnost byla hodnocena pouze podle velikosti výrazů a částečně i dle složitosti elementárních funkcí ve výrazech.  Zadání bylo splněno. Před dokončením projektu se diplomant potýkal s technickými problémy s použitou knihovou pro CGP, které vedly k nutnosti posunout termín odevzdání práce. Získané výsledky by mohly být zajímavější, pokud by si na závěrečné experimenty diplomant naplánoval více času. 
Práce s literaturou Student samostatně získával a využíval studijní materiály k řešení diplomové práce.
Aktivita během řešení, konzultace, komunikace Diplomant pracoval samostatně, konzultoval řídce, intenzita konzultací se zvýšila několik týdnů před odevzdáním projektu. 
Aktivita při dokončování Před dokončením projektu se diplomant potýkal s technickými problémy s použitou knihovou pro CGP, které vedly k nutnosti posunout termín odevzdání práce. Předfinální verzi práce, kterou jsem dostal tři dny před odevzdáním, byla konzultována.
Publikační činnost, ocenění Není známo.
Navrhovaná známka
D
Body
68

Posudek oponenta

Piňos, Michal

Práce působí dojmem, že byla dělána ve spěchu, což je vidět hlavně v sekci s experimenty, kdy jsou podkapitoly s výsledky experimentů pro jednotlivé datové sady čím dál kratší, až na konec podkapitola obsahuje jen grafy bez dalšího vysvětlení. Nicméně, zadáni bylo jistým způsobem splněno, ikdyž s výhradami. Úroveň práce pozvedá hlavně množství provedených experimentů, kterých, jak se zdá, bylo dostatek.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Obecně bych zadání diplomové práce hodnotil jako obtížnější zadání, jelikož se jedná o vysvětlitelnost a interpretovatelnost výrazů generovaných genetickým programováním, což představuje komplexní disciplínu kombinující mnoho různých prvků. Avšak, zohledním-li konkrétní způsob zpracování ze strany studenta - především zjednodušený přístup spočívající pouze v omezení velikosti a složitosti generovaných výrazů úpravou parametrů algoritmu CGP -  hodnotím náročnost zadání jako průměrně obtížné.
Rozsah splnění požadavků zadání Student formálně splnil všechny body zadání, nicméně úroveň a hloubka zpracování některých částí by mohla být lepší. Mám na mysli hlavně body 3 a 4, spočívající v návrhu a implementaci modifikací CGP pro generování vysvětlitelnějších výrazů. Zde byla použita pouze "modifikace" spočívající v nastavení parametrů (počtu a/nebo funkcí uzlů) CGP mřížky, což vlastně není žádná modifikace, nýbrž nastavení CGP algoritmu.
Rozsah technické zprávy Od úvodu po závěr technická zpráva obsahuje 51 stran.
Prezentační úroveň technické zprávy 65 Celkově lze říci, že technická zpráva pokrývá zadané téma, nicméně její prezentační úroveň je nedostatečná z hlediska srozumitelnosti, přesnosti i využití vhodných formátovacích a vizuálních prvků. V teoretické části chybí obrázky, diagramy či jiné vizuální pomůcky, které by výrazně napomohly pochopení. Místo toho zůstává text převážně lineární a pro čtenáře obtížně sledovatelný. V technické zprávě bych na určitých místech rovněž očekával matematické formulace místo textového popisu. Teoretické kapitoly jsou často založeny na jediném zdroji, který je uveden na začátku dané sekce. V průběhu textu již dále chybí konkrétní citace či odkazy na jednotlivá tvrzení, což čtenáři ztěžuje orientaci v tom, co je převzato z literatury a co je vlastní interpretací autora. V několika případech jsou navíc uvedeny nepřesné nebo nepravdivé informace. Například na obrázku 2.8 jsou body ležící na Pareto křivce označeny jako nedominantní (asi špatně přeloženo z anglického non-dominated tedy nedominované). Dále dochází k záměně pojmů GP a CGP, což vede ke zmatečnému popisu a nejednoznačné interpretaci některých pasáží. Špatné výrazy jsou použity na více místech, jako je například "trénování CGP". Za nevhodné dále považuji také uvádění citací přímo v nadpisech podkapitol.
Formální úprava technické zprávy 75 Práce je psána spisovnou slovenštinou a nalezl jsem jen pár chyb. Jazyková úroveň textu je na dobré úrovni a z typografického hlediska je práce převážně konzistentní. Nicméně, po formální stránce práce obsahuje několik nedostatků. Například, na některých místech chybí odpovídající uzavírací závorka. Dále jsem narazil na výrazy, u nichž není zřejmé, zda se jedná o zavedené odborné překlady, či autorovu vlastní jazykovou konstrukci - například pojem parsimonálný tlak.
Práce s literaturou 65 Jak již bylo zmíněno, jednotlivé sekce jsou většinou postaveny na jednom zdroji, ze kterého autor převzal strukturu kapitoly a většinu textu. V kapitolách pak chybí odkazy na jednotlivé pojmy a tvrzení a není tak jasné co přesně bylo převzato a odkud - chybí tedy původní zdroje. Autor často vybíral ze starých a (alespoň tedy pro mě) neobvyklých zdrojů.
Realizační výstup 65 Realizační výstup spočívá v implementaci experimentů, který využívá knihovnu dCGP pro symbolickou regresi. Student pak realizoval experimenty na sedmi datových sadách. Z implementačního hlediska moc práce provedeno nebylo, celý zdrojový kód i s komentáři má kolem 500 řádků a skládá se ze dvou python souborů. Kód je ovšem srozumitelný, dobře čitelný a okomentovaný. Silnější stránkou realizačního výstupu je dostatečné množství provedených běhů experimentů. Horší je poté analýza výsledků provedených experimentů, kde nebyly zvoleny vhodné grafy a ne vždy bylo jasné jaké je nastavení parametrů experimentů.
Využitelnost výsledků Práce nepřináší žádné nové poznatky a ani neobsahuje žádné publikovatelné výsledky.
Navrhovaná známka
D
Body
66

Otázky

eVSKP id 158145