KUCHAŘ, J. Automatická tvorba animovaného videa na základě textového příběhu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Smrž, Pavel

Celkově hodnotím aktivitu studenta při řešení bakalářské práce stupněm D - uspokojivě. Zadání splnil, nicméně realizační výstup i technická zpráva vykazují nedokonalosti, kterým se bylo možné vyhnout, kdyby se práci věnoval soustavněji po oba semestry.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Téma vyžadovalo nastudování oblasti generování animovaného videa a propojení s doménou procedurální animace a konzistence textových scénářů s dalšími částmi systému. Realizovaný systém sice zaostal za očekáváním, nicméně splnil zadání a ukázal na problémy, které jsou typické pro dnešní volně dostupné modely automatické animace a vytváření videovýstupů.
Práce s literaturou Student byl při shromažďování a využívání studijních materiálů průměrně aktivní, získal přehled v jednotlivých oblastech, nedokázal však plně propojit zpracované směry výzkumu do konzistentního celku.
Aktivita během řešení, konzultace, komunikace Aktivita studenta byla v obou semestrech kolísavá, nakonec ale věnoval práci očekávaný čas a úsilí a podařilo se mu práci dovést do uspokojivého stavu. Konzultace byly spíše nahodilé a vývoj se soustředil především do druhé půle letního semestru.
Aktivita při dokončování Technická zpráva nebyla dokončena v dostatečném předstihu, zejména po stránce jazykové a typografické trpí bohužel odevzdaná verze textu mnoha problémy.
Publikační činnost, ocenění -
Navrhovaná známka
D
Body
65

Posudek oponenta

Švec, Tomáš

Pozitivním aspektem práce je zhodnocení existujících metod generování animací na základě difúzních modelů. Technická zpráva je sepsána srozumitelně a výhrady lze najít spíše ve formě stylistických, gramatických a místy logických nedostatků. Důvodem nižšího hodnocení je především kvalita výsledného produktu, kdy i ve vzorových videích vybraných a odevzdaných přímo studentem lze nalézt velké diskrepance v kontinuitě narativu, vizuálního stylu a velké množství artefaktů ve vygenerovaných pohybech. Pro zlepšení kvality výstupů by bylo zřejmě nutné věnovat větší časový prostor odladění integrace jednotlivých modelů a jejich parametrů.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Jedná se o zadání bakalářské práce standardní náročnosti.
Rozsah splnění požadavků zadání Body zadání byly splněny následovně: 1. Splněno. 2. Splněno. 3. Splněno, ovšem s vážnějšími výhradami ke kvalitě výsledného produktu, viz hodnocení realizačního výstupu. 4. Splněno s menší výhradou, uživatelská studie se nezaměřovala na strukturu vyprávění. 5. Splněno.
Rozsah technické zprávy Rozsah technické zprávy odpovídá očekávání pro práci tohoto typu.
Prezentační úroveň technické zprávy 70 Prezentační úroveň technické zprávy je na průměrné úrovni. Text je členěn logicky a zachovává návaznost jednotlivých kapitol. Práce je také pochopitelná pro čtenáře. K obsahové stránce pak lze vznést následující výhrady a komentáře: V kapitole 2.1 by bylo dobré zachovat nastíněné pořadí popisu částí latentního difúzního modelu. Úvod kapitoly 2.3 s jednotlivými pojmy by měl být vyčleněn do samostatné kapitoly. Přehledně jsou zpracovány tabulky s hodnocením jednotlivých modelů v kapitole 2. Kapitola 2.5.1 - "Z nedohledatelného důvodu chybí pozice dlaní, to však není pro tuto práci podstatné." - Chybí zde odůvodnění. V celé kapitole 4 student místy zachází do velkých implementačních detailů a naopak některé aspekty implementace (např. technická integrace jednotlivých knihoven a modelů) by si zasloužily podrobnější popis. Ačkoliv se jedná také o stylistickou chybu, musím i v tomto bodu hodnocení zmínit poměrně časté subjektivní komentáře a evaluace selektovaných metod ("některé fungují skvěle, jiné příšerně", "z mého testování funguje model skvěle" apod.). Jednak se tento typ hodnocení do technické zprávy nehodí, hlavně ale není podložený konkrétními daty.
Formální úprava technické zprávy 70 Formální úprava technické zprávy je na průměrné úrovni. Výslednému dojmu pomáhá její zpracování v nástroji LaTeX. Naopak její úroveň sráží množství stylistických nedostatků, zejména: Již zmíněné subjektivně formulované závěry Chybějící čárky ve složených větách Chyby ve skloňování Některé kostrbaté formulace Překlepy a gramatické chyby (ji/jí, narozdíl/na rozdíl apod.) Vyzdvihnout lze kvalitu použitých diagramů, které byly zpracovány vektorově, ve střízlivých barvách a srozumitelně. Obecně je z formální úpravy technické zprávy poznat, že byla dokončována pod časovým tlakem.
Práce s literaturou 80 Použitá literatura víceméně odpovídá očekávanému rozsahu a zaměření pro toto téma. Student cituje především vědecké články, repozitáře na githubu a další internetové zdroje. Velká část zdrojů pochází z Cornell University. Nebylo zjištěno žádné porušení citační etiky, zvyklostí ani norem.
Realizační výstup 56 Systém byl podle zadání implementován, výsledná vygenerovaná videa ovšem obsahují velké množství obrazových artefaktů a nelogických pohybů. V mnoha případech rozbíjejí kontinuitu nejen narativu, ale také celkové vizuální koncepce videa. Při posouzení oproti JSON scénářům také ne vždy plně reflektují textový vstup od uživatele. Jedná se spíše o práci kompilačního charakteru spojující dohromady několik modelů a nástrojů a dávají k dispozici uživatelské rozhraní. Ačkoliv je znát, že student věnoval úsilí integraci těchto nástrojů, výsledný produkt bohužel působí nedokončeným dojmem. Uživatelská studie byla zpracována poměrně dobře, oproti zadání v ní chybí zhodnocení struktury vyprávění. Počet 10 účastníků není sice příliš průkazný, pro rozsah bakalářské práce ale akceptovatelný.
Využitelnost výsledků Jak bylo zmíněno v ostatních bodech, jedná se o práci kompilačního charakteru, která spíše řeší lokální problémy s integrací jednotlivých nástrojů a modelů, nepřináší nic navíc oproti dostupným komerčním řešením.
Navrhovaná známka
D
Body
68

Otázky

eVSKP id 155488