CHUDÝ, D. Nástroj pro automatické zarovnání titulků [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Student pracoval průměrným tempem. Vytvářel řešení, které byly občas nešťastné, ale nakonec vedly k výsledku. Vyvažoval své nevyzrálé programátorské schopnosti svou pílí. Vytvořil řešení, které je průměrné, ale jeho technická dokumentace je kvalitní. Hodnotím známkou C (75 bodů).
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Cílem práce bylo vytvořit aplikaci umožňující automatické přečasování titulků na video s jiným střihem. Původní požadavky byly, aby aplikace fungovala i bez nesestříhaného videa a využívala například jazykové modely. Realizace a požadavky byly ale zjednodušeny. | ||
Práce s literaturou | Student využíval doporučené zdroje a nacházel další vhodné literární prameny, které konzultoval. | ||
Aktivita během řešení, konzultace, komunikace | Student konzultoval pravidelně. Konzultace si nahrával a zpětně se na ně vyptával. Jeho programátorské a návrhářské schopnosti však nejsou největší. Často to vedlo k nepochopení základní konceptů a nešťastným implementačním chybám. | ||
Aktivita při dokončování | Student nestíhal. Musel odložit odevzdání, aby stihl dopsat aplikaci do odevzdatelné podoby a aby byla technická dokumentace kompletní. Technickou dokumentaci konzultoval důkladně a je pěkně sepsána. | ||
Publikační činnost, ocenění |
Textová zpráva je zatížena jen menším počtem nedostatků a je pochopitelná. Výsledná aplikace podává dobré výsledky při zarovnání titulků u různých druhů videí. Aplikace byla také testována na různých datech a porovnána s alternativními nástroji.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Práce zahrnuje implementaci analýzy zvukové stopy ve videu, výpočet její podobnosti s jinou zvukovou stopou a úpravu souboru titulků na základě zjištěného rozdílu mezi stopami. Dále výsledná aplikace zahrnuje implementaci klasických prvků GUI a vizualizaci vstupních dat a titulků. Autor také shromáždil dataset pro testování. | ||
Rozsah splnění požadavků zadání | Všechny body zadání byly splněny. | ||
Rozsah technické zprávy | Zpráva je informačně hodnotná a popisuje dobře problematiku. Výpisy v implementační kapitole místy popisují až moc nezajímavé implementační detaily, spojené s využitím knihoven. | ||
Prezentační úroveň technické zprávy | 89 | Práce je dobře strukturována a kapitoly na sebe vhodně navazují. V textu se vyskytuje hodně vhodných odkazů na jiné sekce apod. Jasné obrázky dobře doplňují text na mnoha místech. Algoritmy, rovnice a obrázky jsou doplněny jasným popisem. Stav současných řešení by mohl být raději uveden v teoretické kapitole než v úvodu, který je neobvykle dlouhý. Obrázky z výsledné implementace by bylo lépe přesunout z návrhové sekce do implementační. Implementační sekce 4.3 obsahuje v menší míře teoretický popis použitých nástrojů. V některých částech se nachází nepřesné informace, např. MPEG (pracovní skupina) či H.264 (standardizovaný kompresní formát) jsou nesprávně označeny jako „kodeky“ v podsekci 2.4.1. Výsledky měření mohly být reprezentovány spíše jako grafy než tabulky. V současném stavu jsou místy hůře čitelné. Příloha obsahuje zajímavé podrobné výsledky jednotlivých měření. | |
Formální úprava technické zprávy | 85 | V práci se vyskytuje jen menší množství překlepů a špatných tvarů slov. Místy se objevuje nevhodně použitá první a druhá mluvnická osoba. V některých větách chybí přísudek, např. str. 31 v sekci „Misc“. Zakončení bodů seznamů je nekonzistentní, např. str. 27 a 28 kde jedny končí čárkami a jedny tečkami. Není jednotné ani v rámci jednoho seznamu. Graf na obrázku 2.2 nemá v popiscích os použité jednotky. Společný popisek s názvem „Lag“ pro všechny tři grafy se zdá být relevantní jen k poslednímu z trojice, zatímco u předchozích by bylo lépe označit osu jinak. U obrázku 2.7 chybí popisek s číslem. Obrázky 2.11 a 4.7 nejsou referencovány v textu. Mezi výskytem obrázku 3.5 a jeho jedinou referencí v textu je 21 stran. Celkově jsou obrázky pěkné a většinou ve vektorové podobě. V obrázcích i popiscích jsou dobře využity barvy. V rovnici 2.2 není jasně definována funkce d a v rovnici 2.3 proměnná f .Styl algoritmů 1 a 2 není konzistentní. Na koncích stran 29, 37, 43 a 47 jsou zbytečně velké prázdné prostory. | |
Práce s literaturou | 94 | V práci jsou použity vhodné odborné zdroje. Reference navíc obsahují podrobnější informace jako čísla kapitol ve zdroji. Reference na literaturu je v jednom místě použita jako předmět věty, nekonzistentně se zbytkem výskytů. Poznámky pod čarou vhodně doplňují text o dodatečné informace, namísto častých odkazů na Wikipedii by však mohly být použity odbornější zdroje. Odkazy na převzaté části v textu by bylo lépe sjednotit do poznámek pod čarou. | |
Realizační výstup | 90 | Aplikace je funkční, obsahuje přívětivé grafické rozhraní a dovoluje uživateli nahrát dva soubory videa a jeden soubor titulků. Výsledkem je pak nový soubor titulků, který je přečasován na základě rozdílu mezi prvním a druhým videem. Aplikace je celkem úspěšná na připravených ukázkových scénách i na jiných datech. Při spuštění na Linuxu dochází k pádům aplikace. V aplikaci nejsou ošetřeny chyby, například použití stejného souboru pro oba videové vstupy. Výjimky nejsou pravděpodobně zpracovávány a zobrazeny uživateli a aplikace často indikuje probíhající výpočet, i když došlo k chybě. Kód je vhodně strukturován. | |
Využitelnost výsledků | Výsledná aplikace dokáže s dobrou přesností zarovnat titulky u kratších videí. Videa delší než hodinu či příliš dlouhé a časté střihy již vedou k chybám. Aplikace je užitečná a po vylepšení by mohla sloužit jako velmi dobrý nástroj, ke kterému prozatím neexistuje mnoho snadno použitelných alternativ. |
eVSKP id 144735