ZLOTÝ, P. Rozpoznání gest ruky v obraze [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2010.

Posudky

Posudek vedoucího

Janáková, Ilona

Úkolem studenta bylo navrhnout a implementovat algoritmy pro rozpoznání gest ruky. Pan Zlotý zpracoval celou práci samostatně. I přes několik výzev prakticky své počínání nekonzultoval, což by vzhledem k dosaženým výsledkům nebylo tak zlé jako to, že své výsledky ani průběžně nedemonstroval. Kvalitu práce tedy mohu posuzovat pouze z dokumentace a prezentace semestrální práce a z bakalářské práce. Nicméně množství otestovaných metod a postupů je v rámci rozsahu standardních bakalářských prací a vzhledem k tomu, že student zatím neabsolvoval žádný magisterský kurz počítačového vidění, více než úctyhodné. I když z práce není přesně jasné, do jaké míry byly metody převzaté - pouze teoreticky nebo včetně implementace nebo i se závěry a úpravami, i kdyby metody pouze nastudoval a vyzkoušel, jak se jistě stalo vzhledem k evidentně vlastním obrázkům, svědčí to o věnovaném čase a úsilí a výborné práci s literaturou. Použité metody byly i částečně zhodnoceny po stránce možností použití a jejich výhod a nevýhod. Vybrané postupy jednotlivých fází zpracování byly vhodně zkombinovány. Práce je logicky členěna a řešena jako spojení teoretického popisu přímo s praktickou realizací (což právě ztěžuje rozpoznání vlastní invence studenta). Občas se vyskytují drobné překlepy a ne úplně odborné formulace, ale hlavní myšlenka je vždy patrná. Přiložené CD obsahuje velké množství zdrojových m-filů i databázi snímků. Bohužel v práci i na CD chybí jakýkoliv popis zdrojového kódu. Není tedy vůbec jasné, který m-file slouží k čemu a který je "ten finální". Soubory navíc není možné spustit bez úpravy cest. Tuto "nedotaženost" výstupu i vzhledem k nedostatečnému závěrečnému zhodnocení a ověření úspěšnosti použitého postupu rozpoznání gest bych zmínila jako hlavní nedostatek práce. Práce pana Zlotého svědčí o, na bakaláře, poměrně hlubokých znalostech a pochopení dané oblasti počítačového vidění a o vysokém zájmu o tuto problematiku. Svými výsledky prokázal bakalářské schopnosti. Vzhledem k výše zmiňované povaze konzultací, bych si dovolila položit také několik otázek k obhajobě: - Bylo by možné namísto fúze výsledků segmentace (kůže + pohyb) sledovat pohyb až na snímcích po segmentaci barvy kůže? - Pohyb byl tedy ve výsledné realizaci zjišťován ze složky V v HSV modelu? Jak je využito filtrace šumu maskou s Gaussovým rozložením pro segmentaci na základě barvy kůže?

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) C 15/20
Formální zpracování práce B 16/20
Využití literatury A 10/10
Splnění zadání B 42/50
Navrhovaná známka
B
Body
83

Posudek oponenta

Horák, Karel

Pan Zlotý vypracoval bakalářskou práci na téma "Rozpoznání gest ruky v obraze". Zadání práce lze považovat za standardně náročné z hlediska odborného i časového. Úkolem studenta bylo navrhnout algoritmus pro detekci lidské kůže v obrazu, rozpoznání ruky a jejich základních gest vedoucích k možnému ovládání počítače. Rozsah práce je relativně nízký a čítá 40 stran od úvodu po závěr, jednotlivé kapitoly jsou však logicky členěny do tří hlavních oddílů. V první kapitole je popsáno předzpracování obrazu, konkrétně odstranění šumu a zmenšení rozlišení snímku, ve druhé kapitole se pak student zabývá segmentací částí lidského těla na základě barevné informace a na základě detekce pohybu ruky. Výsledky obou segmentačních metod pak kombinuje a získává separované popředí odpovídající lidské kůži. Vzhledem k jednoduchosti vybraných metod zde však chybí rozbor použitelnosti a limitní příklady, v nichž ani barevná segmentace ani detekce pohybu nezaznamenají žádný objekt. Student v práci několikrát používá morfologické operace eroze a dilatace bez vysvětlení konkrétního cíle, kterého má být na obrazu dosaženo. Odstranění separátních hodnot, jak je v práci filtrace poněkud nepřesně nazývána, je vlastnost morfologické operace uzavření, nikoliv důvod provedení této operace. Obdobně chybí přesná specifikace a zdůvodnění tvarů a velikostí použitých strukturních elementů, které jsou pro tuto operaci klíčové. Poslední kapitola je věnována algoritmu pro rozpoznávání gest ruky. Kromě lokalizace oblasti ruky je zde zpracována detekce tvaru ruky pro rozpoznání konkrétního gesta pomocí metody histogramů orientace. Metoda je vhodně zvolená a má dostatečný diskriminační potenciál, chválím dobrou práci s literaturou. Obecně v práci chybí jasná a přehledná interpretace výsledků např. v podobě tabulky obsahující výřez ruky ze snímku spolu s výslednou klasifikací. Formálně má práce dobrou úroveň, ale bylo by vhodné finální práci před odevzdáním přečíst a odstranit gramatické chyby a některé stylisticky zavádějící formulace (např. na str. 32 nelze hovořit o "dvojrozměrné kameře", maximálně o dvojrozměrném snímku pořízeného kamerou a na str. 35 se pod formulací "profiltrování pohybu" může ukrývat téměř cokoliv). Ačkoliv je předložený text poněkud kostrbatý a ne příliš dobře čtivý, má práce celkově dobrou odbornou i formální úroveň, může sloužit jako výchozí bod pro práci v magisterském studiu a proto ji doporučuji k obhajobě před komisí.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Formální zpracování práce C 7/10
Interpretace výsledků a jejich diskuse D 12/20
Odborná úroveň práce B 44/50
Splnění požadavků zadání A 18/20
Navrhovaná známka
B
Body
81

Otázky

eVSKP id 22146