BERKA, J. Sledování postavy [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Předložená bakalářská práce je na dobré prezentační a formální úrovni. V práci se vyskytují pouze drobné chyby (např. text v obr. 13; vzorec 8.1...). Rozsah práce je 40 stran. V úvodní části jsou popsány teoretické základy, druhá část je vlastní prací studenta. Pro zvládnutí práce bylo nutné se orientovat v literatuře, která převážně popisuje aplikaci využitých algoritmů. Literární zdroje jsou v práci citovány. Student během semestru pravidelně konzultoval postup prací. Je škoda, že místo vylepšení 2D varianty strávil značnou část času prací na 3D variantě, která se mu však díky špatnému popisu úprav nutných pro obecná data nepovedla zdárně dokončit. Dosažené výsledky jsou slibným začátkem pro další práci a svědčí o bakalářských schopnostech studenta.
Pan Jiří Michael Berka zpracovával bakalářskou práci věnující se sledování pózy člověka – zde je pózou myšleno držení těla subjektu, a ne jeho souřadnice v prostoru. Práce je celkově velmi kvalitně zpracovaná; úvody jednotlivých kapitol jsou stručné, ale výstižné, a zároveň je obsah kapitol dostatečně podrobný. Mohu tedy vytknout jen drobnosti, jako je chybějící historický kontext odhadu pózy v hlavním úvodu nebo chybějící zmínky k jiným obrazovým modelům, než je RGB, například YIQ, v kapitole 1. Digitální obraz. Po jazykové stránce je práce dobrá, s jen občasnými hrubkami, např. v podkapitole 5.2. „Na rozdíl od 2D odhad“. Doporučuji dávat si pozor na přímý překlad, např. „raw data“ nejsou „surová data“, a používání anglických slov, např. „hip kinematika“. Poslední výtkou je síla některých tvrzení. Například diskretizace obrazu nemusí nutně vést na 8bitové pixely, ale bude záležet na bitové hloubce. Bylo by vhodné v budoucích technických pracích promýšlet i takto nepatrná tvrzení do důsledku. Velmi se mi líbí odbornost práce, demonstrovaná autorem. Jednotlivé kapitoly jsou čtivé a aktuální. Především mě potěšila 3. kapitola, kde autor kromě aktuálního úvodu do neuronových sítí také správně definuje perceptron jakožto binární klasifikátor a neplete jej s obecným umělým neuronem. Teoretická část má rozsah 21 stran, ve zbylých 19 stranách se autor věnuje vývoji programu v jazyce Python za použití knihovny OpenPose. Autor úspěšně vyvinul aplikaci schopnou porovnávat a vyhodnocovat pózu uživatele při tréninku. Uživatelovu pózu porovnává s daty „trenéra“, která jsou v uložena ve formátu JSON. Pro vyhodnocování autor vytvořil grafické rozhraní umožňující nejen sledování výchylky jednotlivých klíčových bodů na těle cvičícího, ale také umožňuje uživateli posouvat se v čase a sledovat tak podrobně celý průběh cviku. Autor musel vyřešit netriviální problémy, na které v průběhu řešení narazil, jako například normalizace bodů uživatele, aby bylo možné je porovnat s trenérem, nebo různou délkou trvání cviků. Ve 2D řešení došel k funkčnímu prototypu. Při řešení 3D verze aplikace narazil na nedostatky OpenPose, které by z časových důvodů nebylo reálné vyřešit. Autor ovšem nastínil řešení, kterému se může potenciálně věnovat v budoucí práci. Pan Berka nadmíru splnil zadání, včetně všech jeho bodů, a prokázal tak nadprůměrné bakalářské schopnosti. Práci tedy hodnotím za A (98 b).
eVSKP id 160114