KUCHAŘ, J. Automatická tvorba animovaného videa na základě textového příběhu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Celkově hodnotím aktivitu studenta při řešení bakalářské práce stupněm D - uspokojivě. Zadání splnil, nicméně realizační výstup i technická zpráva vykazují nedokonalosti, kterým se bylo možné vyhnout, kdyby se práci věnoval soustavněji po oba semestry.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Téma vyžadovalo nastudování oblasti generování animovaného videa a propojení s doménou procedurální animace a konzistence textových scénářů s dalšími částmi systému. Realizovaný systém sice zaostal za očekáváním, nicméně splnil zadání a ukázal na problémy, které jsou typické pro dnešní volně dostupné modely automatické animace a vytváření videovýstupů. | ||
Práce s literaturou | Student byl při shromažďování a využívání studijních materiálů průměrně aktivní, získal přehled v jednotlivých oblastech, nedokázal však plně propojit zpracované směry výzkumu do konzistentního celku. | ||
Aktivita během řešení, konzultace, komunikace | Aktivita studenta byla v obou semestrech kolísavá, nakonec ale věnoval práci očekávaný čas a úsilí a podařilo se mu práci dovést do uspokojivého stavu. Konzultace byly spíše nahodilé a vývoj se soustředil především do druhé půle letního semestru. | ||
Aktivita při dokončování | Technická zpráva nebyla dokončena v dostatečném předstihu, zejména po stránce jazykové a typografické trpí bohužel odevzdaná verze textu mnoha problémy. | ||
Publikační činnost, ocenění | - |
Pozitivním aspektem práce je zhodnocení existujících metod generování animací na základě difúzních modelů. Technická zpráva je sepsána srozumitelně a výhrady lze najít spíše ve formě stylistických, gramatických a místy logických nedostatků. Důvodem nižšího hodnocení je především kvalita výsledného produktu, kdy i ve vzorových videích vybraných a odevzdaných přímo studentem lze nalézt velké diskrepance v kontinuitě narativu, vizuálního stylu a velké množství artefaktů ve vygenerovaných pohybech. Pro zlepšení kvality výstupů by bylo zřejmě nutné věnovat větší časový prostor odladění integrace jednotlivých modelů a jejich parametrů.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Jedná se o zadání bakalářské práce standardní náročnosti. | ||
Rozsah splnění požadavků zadání | Body zadání byly splněny následovně: 1. Splněno. 2. Splněno. 3. Splněno, ovšem s vážnějšími výhradami ke kvalitě výsledného produktu, viz hodnocení realizačního výstupu. 4. Splněno s menší výhradou, uživatelská studie se nezaměřovala na strukturu vyprávění. 5. Splněno. | ||
Rozsah technické zprávy | Rozsah technické zprávy odpovídá očekávání pro práci tohoto typu. | ||
Prezentační úroveň technické zprávy | 70 | Prezentační úroveň technické zprávy je na průměrné úrovni. Text je členěn logicky a zachovává návaznost jednotlivých kapitol. Práce je také pochopitelná pro čtenáře. K obsahové stránce pak lze vznést následující výhrady a komentáře: V kapitole 2.1 by bylo dobré zachovat nastíněné pořadí popisu částí latentního difúzního modelu. Úvod kapitoly 2.3 s jednotlivými pojmy by měl být vyčleněn do samostatné kapitoly. Přehledně jsou zpracovány tabulky s hodnocením jednotlivých modelů v kapitole 2. Kapitola 2.5.1 - "Z nedohledatelného důvodu chybí pozice dlaní, to však není pro tuto práci podstatné." - Chybí zde odůvodnění. V celé kapitole 4 student místy zachází do velkých implementačních detailů a naopak některé aspekty implementace (např. technická integrace jednotlivých knihoven a modelů) by si zasloužily podrobnější popis. Ačkoliv se jedná také o stylistickou chybu, musím i v tomto bodu hodnocení zmínit poměrně časté subjektivní komentáře a evaluace selektovaných metod ("některé fungují skvěle, jiné příšerně", "z mého testování funguje model skvěle" apod.). Jednak se tento typ hodnocení do technické zprávy nehodí, hlavně ale není podložený konkrétními daty. | |
Formální úprava technické zprávy | 70 | Formální úprava technické zprávy je na průměrné úrovni. Výslednému dojmu pomáhá její zpracování v nástroji LaTeX. Naopak její úroveň sráží množství stylistických nedostatků, zejména: Již zmíněné subjektivně formulované závěry Chybějící čárky ve složených větách Chyby ve skloňování Některé kostrbaté formulace Překlepy a gramatické chyby (ji/jí, narozdíl/na rozdíl apod.) Vyzdvihnout lze kvalitu použitých diagramů, které byly zpracovány vektorově, ve střízlivých barvách a srozumitelně. Obecně je z formální úpravy technické zprávy poznat, že byla dokončována pod časovým tlakem. | |
Práce s literaturou | 80 | Použitá literatura víceméně odpovídá očekávanému rozsahu a zaměření pro toto téma. Student cituje především vědecké články, repozitáře na githubu a další internetové zdroje. Velká část zdrojů pochází z Cornell University. Nebylo zjištěno žádné porušení citační etiky, zvyklostí ani norem. | |
Realizační výstup | 56 | Systém byl podle zadání implementován, výsledná vygenerovaná videa ovšem obsahují velké množství obrazových artefaktů a nelogických pohybů. V mnoha případech rozbíjejí kontinuitu nejen narativu, ale také celkové vizuální koncepce videa. Při posouzení oproti JSON scénářům také ne vždy plně reflektují textový vstup od uživatele. Jedná se spíše o práci kompilačního charakteru spojující dohromady několik modelů a nástrojů a dávají k dispozici uživatelské rozhraní. Ačkoliv je znát, že student věnoval úsilí integraci těchto nástrojů, výsledný produkt bohužel působí nedokončeným dojmem. Uživatelská studie byla zpracována poměrně dobře, oproti zadání v ní chybí zhodnocení struktury vyprávění. Počet 10 účastníků není sice příliš průkazný, pro rozsah bakalářské práce ale akceptovatelný. | |
Využitelnost výsledků | Jak bylo zmíněno v ostatních bodech, jedná se o práci kompilačního charakteru, která spíše řeší lokální problémy s integrací jednotlivých nástrojů a modelů, nepřináší nic navíc oproti dostupným komerčním řešením. |
eVSKP id 155488