KĽUČIAR, A. Zlepšování vysvětlitelnosti výrazů generovaných genetickým programováním [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Diplomová práce splnila pouze základní cíl, zejména kvůli velmi zjednodušenému přístupu k posouzení vysvětlitelnosti vygenerovaných výrazů a použití zjednodušené metodologie při práci s CGP. Očekával jsem mimo jiné, že diplomant použije sofistikovanější přístup, než poskytuje pouhé měření velikosti výrazu. Vzhledem k dosaženým výsledkům navrhuji hodnocení stupněm D - uspokojivě.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Cílem práce bylo pomocí různých omezení zavedených do kartézského genetického programování (CGP) zlepšit vysvětlitelnost výrazů, které CGP generuje pro řešení úloh z oblasti regrese a klasifikace. Zadání bylo průměrně obtížné. Pro vyhodnocení diplomant zvolil sedm úloh, pro které pomocí CGP nalezl referenční řešení. Zavedená omezení pro CGP (velikost výrazu a komplexita množiny funkcí) jsou základní. Vysvětlitelnost byla hodnocena pouze podle velikosti výrazů a částečně i dle složitosti elementárních funkcí ve výrazech. Zadání bylo splněno. Před dokončením projektu se diplomant potýkal s technickými problémy s použitou knihovou pro CGP, které vedly k nutnosti posunout termín odevzdání práce. Získané výsledky by mohly být zajímavější, pokud by si na závěrečné experimenty diplomant naplánoval více času. | ||
| Práce s literaturou | Student samostatně získával a využíval studijní materiály k řešení diplomové práce. | ||
| Aktivita během řešení, konzultace, komunikace | Diplomant pracoval samostatně, konzultoval řídce, intenzita konzultací se zvýšila několik týdnů před odevzdáním projektu. | ||
| Aktivita při dokončování | Před dokončením projektu se diplomant potýkal s technickými problémy s použitou knihovou pro CGP, které vedly k nutnosti posunout termín odevzdání práce. Předfinální verzi práce, kterou jsem dostal tři dny před odevzdáním, byla konzultována. | ||
| Publikační činnost, ocenění | Není známo. |
Práce působí dojmem, že byla dělána ve spěchu, což je vidět hlavně v sekci s experimenty, kdy jsou podkapitoly s výsledky experimentů pro jednotlivé datové sady čím dál kratší, až na konec podkapitola obsahuje jen grafy bez dalšího vysvětlení. Nicméně, zadáni bylo jistým způsobem splněno, ikdyž s výhradami. Úroveň práce pozvedá hlavně množství provedených experimentů, kterých, jak se zdá, bylo dostatek.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | Obecně bych zadání diplomové práce hodnotil jako obtížnější zadání, jelikož se jedná o vysvětlitelnost a interpretovatelnost výrazů generovaných genetickým programováním, což představuje komplexní disciplínu kombinující mnoho různých prvků. Avšak, zohledním-li konkrétní způsob zpracování ze strany studenta - především zjednodušený přístup spočívající pouze v omezení velikosti a složitosti generovaných výrazů úpravou parametrů algoritmu CGP - hodnotím náročnost zadání jako průměrně obtížné. | ||
| Rozsah splnění požadavků zadání | Student formálně splnil všechny body zadání, nicméně úroveň a hloubka zpracování některých částí by mohla být lepší. Mám na mysli hlavně body 3 a 4, spočívající v návrhu a implementaci modifikací CGP pro generování vysvětlitelnějších výrazů. Zde byla použita pouze "modifikace" spočívající v nastavení parametrů (počtu a/nebo funkcí uzlů) CGP mřížky, což vlastně není žádná modifikace, nýbrž nastavení CGP algoritmu. | ||
| Rozsah technické zprávy | Od úvodu po závěr technická zpráva obsahuje 51 stran. | ||
| Prezentační úroveň technické zprávy | 65 | Celkově lze říci, že technická zpráva pokrývá zadané téma, nicméně její prezentační úroveň je nedostatečná z hlediska srozumitelnosti, přesnosti i využití vhodných formátovacích a vizuálních prvků. V teoretické části chybí obrázky, diagramy či jiné vizuální pomůcky, které by výrazně napomohly pochopení. Místo toho zůstává text převážně lineární a pro čtenáře obtížně sledovatelný. V technické zprávě bych na určitých místech rovněž očekával matematické formulace místo textového popisu. Teoretické kapitoly jsou často založeny na jediném zdroji, který je uveden na začátku dané sekce. V průběhu textu již dále chybí konkrétní citace či odkazy na jednotlivá tvrzení, což čtenáři ztěžuje orientaci v tom, co je převzato z literatury a co je vlastní interpretací autora. V několika případech jsou navíc uvedeny nepřesné nebo nepravdivé informace. Například na obrázku 2.8 jsou body ležící na Pareto křivce označeny jako nedominantní (asi špatně přeloženo z anglického non-dominated tedy nedominované). Dále dochází k záměně pojmů GP a CGP, což vede ke zmatečnému popisu a nejednoznačné interpretaci některých pasáží. Špatné výrazy jsou použity na více místech, jako je například "trénování CGP". Za nevhodné dále považuji také uvádění citací přímo v nadpisech podkapitol. | |
| Formální úprava technické zprávy | 75 | Práce je psána spisovnou slovenštinou a nalezl jsem jen pár chyb. Jazyková úroveň textu je na dobré úrovni a z typografického hlediska je práce převážně konzistentní. Nicméně, po formální stránce práce obsahuje několik nedostatků. Například, na některých místech chybí odpovídající uzavírací závorka. Dále jsem narazil na výrazy, u nichž není zřejmé, zda se jedná o zavedené odborné překlady, či autorovu vlastní jazykovou konstrukci - například pojem parsimonálný tlak. | |
| Práce s literaturou | 65 | Jak již bylo zmíněno, jednotlivé sekce jsou většinou postaveny na jednom zdroji, ze kterého autor převzal strukturu kapitoly a většinu textu. V kapitolách pak chybí odkazy na jednotlivé pojmy a tvrzení a není tak jasné co přesně bylo převzato a odkud - chybí tedy původní zdroje. Autor často vybíral ze starých a (alespoň tedy pro mě) neobvyklých zdrojů. | |
| Realizační výstup | 65 | Realizační výstup spočívá v implementaci experimentů, který využívá knihovnu dCGP pro symbolickou regresi. Student pak realizoval experimenty na sedmi datových sadách. Z implementačního hlediska moc práce provedeno nebylo, celý zdrojový kód i s komentáři má kolem 500 řádků a skládá se ze dvou python souborů. Kód je ovšem srozumitelný, dobře čitelný a okomentovaný. Silnější stránkou realizačního výstupu je dostatečné množství provedených běhů experimentů. Horší je poté analýza výsledků provedených experimentů, kde nebyly zvoleny vhodné grafy a ne vždy bylo jasné jaké je nastavení parametrů experimentů. | |
| Využitelnost výsledků | Práce nepřináší žádné nové poznatky a ani neobsahuje žádné publikovatelné výsledky. |
eVSKP id 158145