ROSECKÝ, R. Automatická tvorba animovaného videa na základě textového příběhu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Smrž, Pavel

Z hlediska aktivity studenta během řešení hodnotím práci z pohledu vedoucího stupněm D - uspokojivě. Výsledek splnil zadání, ale kvalita řešení není příliš vysoká a technická zpráva ani realizační výstup nesvědčí o hlubším pochopení moderních metod generování videa.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadání bylo průměrně obtížné, vyžadovalo seznámit se s moderními metodami generování videa a s využitím existujících předtrénovaných modelů vytvořit systém, zaměřený na zachování konzistence generovaných objektů a postav. Práce splnila zadání, studentovi se však nepodařilo plně proniknout do pokročilých metod a výsledky spíše zaostaly za očekáváním.
Práce s literaturou Richard Rosecký nebyl při získávání a využívání studijních materiálů a vědeckých článků, týkajících se nejmodernějších technik a postupů v dané oblasti, přiliš aktivní, nakonec však shromáždil a v zpracoval adekvátní množství zdrojů a sepsal přehled poznání v akceptovatelné podobě.
Aktivita během řešení, konzultace, komunikace Aktivitu studenta nelze označit za soustavnou, v druhém semestru ale zvýšil svoje úsilí a práci úspěšně dokončil. Konzultace byly zvláště na konci řešení práce spíše nahodilé, takže se nepodařilo detailně probrat některé komponenty řešení.
Aktivita při dokončování Definitivní obsah práce se mnou bohužel nebyl konzultován, technickou zprávu jsem měl možnost důkladně pročíst až po odevzdání.
Publikační činnost, ocenění -
Navrhovaná známka
D
Body
65

Posudek oponenta

Švec, Tomáš

Práce přináší základní přehled dostupných modelů a postupů v oblasti generování videa, avšak praktická část a realizace vlastního řešení zůstaly nedotažené a nepřinesly očekávané výsledky. V textu se opakovaně vyskytují formální a jazykové chyby, struktura a návaznost kapitol je slabší a místy znesnadňuje orientaci v obsahu. Práce s literaturou je pouze základní a v realizaci není patrný větší přínos nad rámec rešerše. Výsledky jsou diskutabilní a pro praktické použití nevhodné. Celkově práce splňuje minimální požadavky pro udělení známky D (60 bodů).

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Zadání této diplomové práce je průměrně obtížné – student měl k dispozici širokou škálu veřejně dostupných nástrojů a modelů, přesto bylo nutné zvládnout základní přehled současných metod a vyzkoušet jejich praktické použití. Náročnost zadání odpovídá obvyklým pracím v dané specializaci.
Rozsah splnění požadavků zadání Student splnil většinu teoretických požadavků zadání a přehledově popsal dostupné metody, nicméně technická část – tedy úprava a praktické vylepšení modelů – byla nedostatečná a výsledky nejsou přesvědčivé. Praktické přínosy práce jsou omezené, implementované změny modelů nepřinesly očekávané zlepšení a validace výsledků zůstala povrchní. Výsledkem je, že práce naplňuje zadání pouze částečně a s vážnějšími výhradami, zejména k úrovni praktického výstupu.
Rozsah technické zprávy Rozsah technické zprávy odpovídá běžným požadavkům na diplomovou práci. Práce splňuje minimální požadovaný rozsah i obvyklé normy pro podobné typy zadání. Obsah jednotlivých částí je vyvážený a žádná kapitola výrazně nechybí.
Prezentační úroveň technické zprávy 60 Některé odstavce práce nejsou věcně ukončeny. V textu je opakovaně využíváno výrazů jako „model trpí“ nebo „výsledky jsou slabé“, aniž by byly konkrétní problémy vždy jasně vysvětleny. Model Sora je označen jako nejlepší na současném trhu bez zdůvodnění - to lze nalézt až později v textu. Některé kapitoly, zejména praktická část, jsou pouze stručně popsány a chybí jim hlubší rozbor; návrh řešení je formulován vágně a bez jasné návaznosti na úvodní cíle. Jako mírně pozitivní bych vyzdvihl snahu o srozumitelnou prezentaci teorie na začátku práce, chybí tam popis U-Net architektury. Vcelku použitelným s výhradami se jeví i srovnání jednotlivých dostupných modelů.
Formální úprava technické zprávy 55 Formální úprava práce je na podprůměrné úrovni. V textu se vyskytují překlepy, stylistické i gramatické chyby. Orientaci v práci komplikují rovněž zavádějící pojmy ("generace" místo "generování", "kvantizace kvality", "strádá na modely", "nezanechávají konzistentní tvar", "objektiv trénování" apod.). Obecně text na některých místech působí buď jako vygenerovaný pomocí nedokonalé AI, nebo minimálně jako nepříliš povedený překlad z angličtiny. Ve větě "Verze 2 má konzistentně lepší hodnocení konzistence subjektu a často má lepší hodnocení i v ostatních kategoriích kromě celkové konzistence." jsem se upřímně ztratil. Věta "Výsledky jsou nepřesvědčivé..." působí rezignovaně a nepatří se subjektivním zabarvením do akademické práce.
Práce s literaturou 60 Výběr literatury pokrývá hlavně obecné zdroje k difuzním a generativním modelům. Chybí hlubší záběr na nejnovější publikace i kritičtější srovnání používaných metod. Bibliografické citace jsou časté, ale často neúplné (například chybí čísla stránek nebo roky vydání) a formát není zcela jednotný. Dobře nepůsobí ani přímé hypertextové odkazy namísto očíslování daného odkazu.
Realizační výstup 55 Realizační výstup je nejslabším článkem práce. Jediných srovnatelně zlepšujících výsledků pro implementovaný model bylo dosaženo za cenu snížení dynamiky výsledného videa, je tedy diskutabilní, zda jsou tyto výsledky relevantní. Jako pozitivní lze pouze hodnotit sebereflexi autora a alespoň snahu o objektivní vyhodnocení (byť neúspěšných) výsledků pokusů o zlepšení modelu.
Využitelnost výsledků Výsledky realizace bohužel praktickou využitelnost postrádají. Jako použitelné se jeví srovnání dostupných modelů a teoretický úvod, k tomu ale slouží již dostupné přehledy a publikace.
Navrhovaná známka
D
Body
60

Otázky

eVSKP id 164458