HAVRDA, K. Umělá neuronová síť pro generování věrohodného paleo-artu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Posudky

Posudek vedoucího

Řičánek, Dominik

Student Kryštof Havrda zpracovával téma využití moderních generátorů pro vytváření paleo-artu, což je umělecké vyobrazení prehistorických scén. Už před přijetím tématu byl student varován, že jde o poměrně složitou úlohu, především protože generátory se skládají z hned několika modelů strojového učení, které si pan Havrda musel nastudovat. Studentovi se podařilo doučit difuzní model „Stable Diffusion“ (SM) pro generování jím vybraných tří typů ptakoještěrů. Student dále komentuje problémy, na které narazil a musel vyřešit při průběhu doučování modelu. Takto vygenerované rekonstrukce pak porovnává s obrázky vygenerovanými pomocí nedoučeného SM a modelu DALL-E. K porovnání používá sofistikovaný algoritmus, kombinující různé metody pro extrahování významných parametrů jako např. ORB, histogram obrazu či porovnání s pomocí CLIP. Po doplnění nedostatků z minulého roku pan Havrda prokázal dostatečné bakalřské schopnosti a práci doporučuji k obhajobě se stupněm C (79b).

Navrhovaná známka
C
Body
79

Posudek oponenta

Horák, Karel

Student zpracoval bakalářskou práci na téma generování paleo-artu (umělecká vizualizace pravěkého života) a to pomocí umělé neuronové sítě. Formálně sestává odborná část práce z 38 stran textu od úvodu po závěr, kdy v loňském roce to bylo 28 stran. Teoretické části, která změn nedoznala, je pak věnováno 18 stran a praktické části včetně zhodnocení výsledků zbývajících 20 stran. V práci se původně vyskytovalo velké množství závažných gramatických chyb a netechnických formulací, které jsou nyní z velké části opraveny a zůstalo pouze několik málo typografických chyb, např. slovní spojení “s pěti sty” namísto číselného označení na str. 34 dole apod. Formálně tak student vesměs opravil, co mu bylo v předchozím posudku vytýkáno. První bod zadání rešerše metod student splnil kapitolou 1.7, v níž vyjmenoval některé metody pro generování syntetických obrazů, byť výčet metod není kompletní a popis vybraných metod není vždy jasný. Druhý bod zadání tvorby trénovací množiny student na základě výtky předchozího posudku opravil, byť rozsah trénovací množiny vstupních obrazů v práci uvedených druhů prehistorických zvířat je stále minimální - např. sedm obrazů pro trénovací fázi u druhu Sinomacrops. U takto limitovaného datasetu by měl student u obhajoby vysvětlit, jaký vliv na výstupní obrazy omezená trénovací množina má a jak by se změnila s řádově vyšším počtem vstupních vzorků (alespoň kvalifikovaně odhadnout funkci sítě, neboť do obhajoby práce student úpravu datasetu pro objektivní posouzení vlivu počtu vzorků zřejmě nestihne). Třetí bod zadání naučení neuronové sítě je splněn, byť stále je s ohledem na nízký počet trénovacích dat diskutabilní, zda je síť naučena dostatečně na generování věrohodných obrazů. Povaha úlohy bohužel znemožňuje zcela objektivní posouzení kvality výstupu, protože k vizuální podobě prehistorických zvířat neexistuje obecně uznávaný model (etalon) vzhledu. Čtvrtý bod zadání student splnil vesměs pomocí nástroje CLIP, kdy zmíněným modelem porovnal vektorové reprezentace vstupních (učících) a výstupních (generovaných) obrazů, tedy jejich vizuální podobnost. Proti původním výtkám ohledně absence objektivního posouzení podobnosti zde student doplnil zejména kap. 3.0.7 s tabulkami a textem od str. 43, v nichž uvádí statistické parametry vstupních a výstupních obrazových dat pro porovnání. Tím lze bod 4 zadání považovat za splněný. Student původní výtky loňského posudku opravil, byť především v rovině formálních nedostatků. Stále tak přetrvávají pochybnosti o kvalitě výsledného modelu pro generování uměleckého paleo-artu. Přesto předložená práce podle mého názoru již splňuje požadavky na bakalářkou práci.

Navrhovaná známka
D
Body
60

Otázky

eVSKP id 167445