WÓJCIK, J. Systém počítačového vidění pro rozpoznávání emocí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.

Posudky

Posudek vedoucího

Janáková, Ilona

Pan Wójcik pracoval na svém tématu velmi aktivně, a to již při jeho volbě, kdy si zajímavé a náročné zadání na téma vizuálního rozpoznání emocí navrhl sám. Pravidelně konzultoval, kdy konzultace většinou spočívaly v předvedení vykonané práce a vlastního návrhu dalšího postupu. Aktivitu a zájem o téma projevil i sepsáním kvalitního příspěvku na studentskou konferenci EEICT. Předložený dokument, čítající se všemi formálními náležitostmi 79 stran, je podle mého názoru velmi dobře zpracovaný. Je čtivý, srozumitelný, graficky a stylisticky dobře upravený. Vyskytuje se jen několik drobných překlepů. Student využil celkem 40 anglicky psaných zdrojů. Upozornila bych jen na to, že některé zdroje nejsou odkazovány v textu. Podle mě všech známých skutečností i dle výsledku porovnání systémem Theses není dokument plagiátem (míra podobnosti 2,3 % je daná formálními náležitostmi práce). Již v teoretické části (kap.1) je u návrhu možných řešení provedeno vlastní testování hned pěti popsaných přístupů a je zhodnocena jejich využitelnost pro navrhovanou aplikaci. Student také vyhledal, zhodnotil a pracně prošel, upravil a rozšířil vhodné rozsáhlé datasety. Tři metody, DeepFace, OpenFace a OpenPose, tedy přístupy využívající odlišných typů extrahovaných příznaků - z obličeje, akcí obličeje i pozice bodů těla (využita detekce paží), vhodně upravil a řádně samostatně otestoval. OpenFace sám o sobě neklasifikoval emoce, jen detekoval některé akce obličeje, proto student navrhl a naučil rozhodovací strom. Nespokojil se s využitím jednoho vybraného přístupu, ale vhodně všechny tři zkombinoval. Spojení metod pracující v reálném čase, vzhledem k tomu, že byly aplikace naprogramovány v jiných jazycích a vzhledem k omezenému výpočetnímu výkonu, bylo komplikované a student strávil možnostmi kombinace mnoho času, přesto se mu povedlo najít uspokojivé řešení v podobě spojení dvou kamer. Vytvořil vhodné uživatelské rozhraní, které umožňuje jednoduché ovládání aplikace a několik možných režimů nastavení a vizualizace výsledků. Rozhraní také nabízí mód trénování – přeučení rozhodovacího stromu na nového uživatele, které výrazně zlepšilo celkovou správnost rozpoznání. Vzhledem k tomu, jak jsou projevy emocí různých lidí rozdílné a i jejich posouzení na snímcích je i pro člověka náročné a velmi subjektivní a jednotlivé klasifikace jsou neohraničené, lze dosažené výsledky, ověřené vedle upravených datasetů i na 23 osobách, podle mě považovat za velmi uspokojivé. Pan Wójcik dle mého názoru splnil všechny body zadání. Odvedl mnoho kvalitní a časově náročné práce s vysokou odbornou úrovní a velkým přínosem pro další výzkum a prokázal tak jistě inženýrské schopnosti, a proto práci doporučuji k obhajobě s hodnocením A (95 b).

Navrhovaná známka
A
Body
95

Posudek oponenta

Bilík, Šimon

Diplomová práce Jana Wojcika se zabývá vývojem systému pro rozpoznání emocí s možným využitím pro práci s lidmi s poruchou autistického spektra. Tato práce má 71 stran a řadí se tak mezi rozsáhlejší práce. V podrobně a kvalitně zpracovaném teoretickém úvodu student popisuje příznaky vhodné pro rozpoznávání emocí ze snímků obličeje a gest, dále pak vybrané dostupné detekční modely a existující datasety. V této části bych vytknul občasnou méně přehlednou práci se zkratkami a vzhledem k častému používání příznaků AU v dalším textu bych práci doplnil souhrnou tabulkou s vysvětlením těchto příznaků. V další části práce student popisuje metodiky, které využíval pro vyhodnocení svých experimentů a také výsledky prvních experimentů s modely DeepFace a OpenFace pro rozpoznání emocí z výrazu tváře a OpenPose pro rozpoznání emocí z gest. Tyto popisy jsou opět podrobné, student zde vysvětluje provedené experimenty a diskutuje možné příčiny objevených nedostatků. Výtky bych měl ke struktuře textu, kvůli které je popis hůře čitelný. V poslední části student diskutuje návrh scény, techniky pro augmentaci dat použitých pro učení modelů a porovnává výsledky modelu trénovaného na augmentovaných datech s výsledky dosaženými v předchozí kapitole spolu s vyhodnocením kvality modelů. Za účelem zvýšení přesnosti navrhovaného systému se rozhodnul pro kombinace všech tří výše zmíněných přístupů, kdy v textu popisuje své experimenty a vzniklé problémy (způsobené hlavně sdílením HW a jiných programovacích jazyků bez sdíleného API). Většinu těchto problémů se mu pak povedlo vyřešit a modely úspěšně spojil do programu se základním GUI a možností přeučení na konkrétních osobách, který pak otestoval s uspokojivými výsledky. Student touto prací podle mého názoru prokázal své magisterské schopnosti a přes několik spíše formálních nedostatků vytvořil funkční a poměrně komplexní systém pro rozpoznávání vybraných základních emocí. Navrhuji proto hodnocení 90 body a známkou A.

Navrhovaná známka
A
Body
90

Otázky

eVSKP id 151683