HAVRDA, K. Umělá neuronová síť pro generování věrohodného paleo-artu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Student Kryštof Havrda zpracovával téma využití moderních generátorů pro vytváření paleo-artu, což je umělecké vyobrazení prehistorických scén. Už před přijetím tématu byl student varován, že jde o poměrně složitou úlohu, především protože generátory se skládají z hned několika modelů strojového učení, které si pan Havrda musel nastudovat. Jako plus hodnotím pravidelnou docházku na konzultace, i když často nebyl student schopný zcela splnit zadání z předchozích konzultací a dostal se tak do zbytečného časového presa. Špatné plánování a nakládání s časem se bohužel značně podepsalo na výsledné práci, které zcela chybí abstrakt a klíčová slova. Co se obsahu týče, student kvalitně strukturuje teoretickou část, která je ovšem plná gramatických chyb a hovorové češtiny. Až po kapitolu 1.7 jde o studentovu práci – kapitola 1.7 nazvaná „State of the art v generování obrázků“ obsahuje pouze parafráze z různých zdrojů. Studentovi se podařilo doučit difuzní model „Stable Diffusion“ (SM) pro generování jím vybraných tří typů ptakoještěrů. Student dále komentuje problémy, na které narazil a musel vyřešit při průběhu doučování modelu. Takto vygenerované rekonstrukce pak porovnává s obrázky vygenerovanými pomocí nedoučeného SM a modelu DALL-E. Nevyužívá však žádných metrik porovnání a pouze předkládá vygenerované obrázky vedle sebe. Závěr je méně než stručný a opět se v něm odráží nevhodná práce s časem. Práce nicméně má potenciál a pokud student opraví jazykovou stránku, doplní chybějící části, provede kvantitativní porovnání generovaných rekonstrukcí a patřičně rozšíří text praktické části, zvažoval bych lepší hodnocení. V momentálním stavu musím hodnotit F (49b).
Student zpracoval bakalářskou práci na téma generování paleo-artu (umělecká vizualizace pravěkého života) a to pomocí umělé neuronové sítě. Formálně sestává odborná část práce z 28 stran textu od úvodu po závěr, teoretické části je věnováno 18 stran, praktické části včetně zhodnocení výsledků pak zbývajících 10. Z formálního hlediska však v práci především chybí list abstraktu a klíčových slov, a to jak v češtině, tak angličtině, přesněji řečeno je vložen list šablony bez vyplněných polí. V práci se vyskytuje velké množství gramatických chyb, typicky např. titulek obrázku 1.10 nebo slovo „oběkt“ namísto „objekt“ v popisku obrázku 1.16. V práci dále student často používá netechnické, pro VŠ absolventskou práci neakceptovatelné, formulace např. „vzorek je poté prohnán sítí“ na str. 17 dole nebo „sice ano model jsem něco málo naučil ale obrázky které jsem dostal na výstupu vypadali jako něco úplně jiné“ na str. 31 nahoře a řada dalších. První bod zadání rešerše metod student splnil kapitolou 1.7, v níž vyjmenoval některé metody pro generování syntetických obrazů, byť výčet metod není kompletní a popis vybraných metod není vždy jasný. Druhý bod zadání tvorby trénovací množiny nelze považovat za splněný, neboť na dodaném USB jsou sice ve třech adresářích umístěny snímky v práci uvedených druhů zvířat, nejsou ale zařazeny a popsány, zda se jedná o výstupní generované snímky či vstupní data pro trénování. Dále i pokud by byly správně řazeny a popsány, byl by jich pro trénování difuzního modelu zcela nedostatečný počet, např. 22 snímků druhu Sinomacrops bondei a podobné počty u zbývajících dvou druhů. Třetí bod zadání naučení neuronové sítě je tak splněn pouze formálně a jen částečně, kdy student naučil / doučil vybraný model na několika málo snímcích vybraných druhů zvířat. Výsledky na str. 34 tomu odpovídají, kdy podobnost vizualizace prvního druhu ptakoještěra generovaného studentem na obr. 3.1 je téměř nulová s výstupem srovnávacího modelu DALLE-3 na obr. 3.2 se stejným vstupním zadáním. Ani čtvrtý bod zadání nelze považovat za zcela splněný, neboť student porovnal sady pouze dvou ze tří vybraných druhů zvířat, nadto pouze umístěním srovnávaných obrazů nad sebe bez další technické analýzy podobnosti, např. míry překryvu barevných složek snímků ve vhodně zvoleném barevném prostoru, míra shody geometrických parametrů zvířat na srovnávaných snímcích aj. Z hlediska i jen formálních požadavků pak práce nesplňuje všechny předepsané náležitosti, konkrétně chybí list abstraktu a klíčových slov. Práci tak nelze i s odhlédnutím od nevalné odborné kvality popsané výše hodnotit uspokojivým stupněm E příp. lépe. Předloženým textem student neprokázal dostatečné odborné kvality pro vysokoškolskou kvalifikační práci technického směru, a proto ji hodnotím stupněm F. Komisi pak navrhuji umožnit studentovi dopracování a rozšíření práce, protože samotný postup studenta není zcela chybný.
eVSKP id 159831