PEŠEK, D. Umělá neuronová síť pro rekonstruování vymřelých druhů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Předložená bakalářská práce „Umělá neuronová síť pro rekonstruování vymřelých druhů“ studenta Davida Peška řeší problematiku naučení umělé neuronové sítě generující rekonstrukci živočichů na data set řádu pěvců z databáze DNA. Práce je členěna do 8 kapitol (61 stran) a 6 příloh. Jednotlivé kapitoly mají odpovídající rozsah. Práci jak po pedagogické stránce, tak po odborné vedl konzultant Ing. Dominik Řičánek. Vzhledem k náročnosti zadání, rozsahu samostudia, dosažených výsledků a k vlastní odevzdané bakalářské práci navrhuji zkušební komisi hodnocení B/80 bodů.
Bakalářská práce Davida Peška se zabývá možností úpravy modelu GPT-2 pro generování obrázků ptáků na základě zvolené části jejich DNA sekvence. Pro začátek bych chtěl zvolené zadání ohodnotit jako velmi obtížné a pro bakalářskou práci ambiciózní. Student v teoretické části práce poměrně podrobně popisuje používané generativní modely jako GAN, variační autoenkodéry a difůzní modely. Tato část je doplněna popisem používané ztrátové funkce používaných generativních modelů a po ní následuje popis parametrizace slov používaný u textových modelů. Jak zmiňuji výše, tak tato část je zpracována poměrně dobře, ale vytknul bych špatnou práci se zdroji, kdy jsou citovány především obrázky, ale již ne tolik text. Co ale vnímám jako velký nedostatek, který pak dále ovlivňuje praktickou část práce, je chybějící rešerše týkající se genetiky, genetického kódu a základů jejího fungování. Díky tomuto je pak samotné provedení praktické části od začátku problematické. Student používá pro přeučování použitých modelů velmi malý dataset, který čítá necelých 30 druhů (!), což je dáno malým množstvím dostupných DNA sekvencí, ale zároveň příliš málo pro úspěšné přeučení modelu pro takto složitou aplikaci. Je také velmi odvážné tvrdit, že zvolený enzym COX-1 v sobě obsahuje dostatek informací pro rekonstrukci vzhledu daného živočicha a rozdělení bází enzymu na šestice s tvrzením "je možné, že tímto bylo ztraceno nějaké množství informací ..., ale vstupní sekvence by jinak byla příliš dlouhá" také nezní příliš šťastně. Také zcela nerozumím tomu, proč byly generovány vlastní DNA sekvence a jak byly vyhodnocovány vygenerované snímky a jejich kvalita. Na rozsahu práce je vidět, že byla tvořena v časovém spěchu a příbytek proti semestrální práci, která je převzata jako teoretická část, tvoří cca 12 stran čistého textu. Členění praktické části práce do kapitol je nevhodné, kapitoly jsou velmi stručné a dosažené výsledky jsou popsány a vyhodnoceny nedostatečně. Na druhou stranu situaci zlepšuje přiložený kód, ke kterému můžu říci, že spolu s odevzdanou prací prokazuje bakalářské schopnosti studenta. S přihlédnutím ke všemu výše zmíněnému navrhuji hodnocení 60 bodů a známku D.
eVSKP id 151786