ČECH, J. Detekce změn v obraze [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.

Posudky

Posudek vedoucího

Richter, Miloslav

Zadání je možné považovat za splněné. Student si však za řešení zvolil scény, se zjednodušujícími podmínkami, což lze na jednu stranu považovat za dobrý přístup, na druhou stranu je výsledek hůře využitelný. Student si vytvořil pracoviště, které má ideální jednobarevné pozadí a které snímá kolmým pohledem a objekty zabírají značnou část snímku. Sada detekovaných objektů je také omezená. Přesto lze konstatovat, že navržené algoritmy jsou vybrány vhodně a v dané sestavě jsou funkční. Práce je v některých částech hůře čitelná díky nevhodným návaznostem, či chybějícímu textu. Také zde chybí lepší propojení částí mezi sebou, jako jsou návaznosti metod, jejich nastavování apod. Výběr či zamítnutí některých metod mohlo být lépe zdůvodněno. Rozsah práce je na minimální úrovni 30 stran, což by šlo doplnit například dalšími testy navržených algoritmů a zhodnocení jejich úspěšnosti. Řešení složitějších scén v práci chybí. Student pravidelně konzultoval, a i když měl rozpracovánu řadu metod, které testoval, v práci se neobjevily.

Navrhovaná známka
E
Body
57

Posudek oponenta

Zemčík, Tomáš

Práce na téma "Detekce změn v obraze" pana Jana Čecha patří svým zadáním k méně rozsáhlým, ale nikoliv triviálním pracem. Ve své první části práce obsahuje velmi jednoduchý rozbor zadání s vytyčením cílů práce. Dále pokračuje krátkou rešerší několika metod počítačového vidění (SURF, homografie), a nástrojů (AR tag) potřebných pro realizaci práce. Tato rešerše není příliš obsáhlá, postrádá nějakou hlubší strukturu a obsahuje mnohá tvrzení nepodložená důkazem nebo referencí literatury. Také obsahuje některá nesmyslná tvrzení (homografie pracuje s účelem předmětu ve scéně), původní tvrzení vytržené z kontextu a nesprávně referencované (zdroj [8]). V další části je popsáno vlastní řešení zadaného problému. Je navržena scéna pro snímání obrazu se zjednodušeným pozadím, a s identifikátorem scény realizovaným AR tagem, tento přístup smysluplně zjednodušuje zadaný problém, a považuji jej za dobrý krok k řešení. Dále jsou krátce představeny zvolené vývojové nástroje a knihovny. Dále student popisuje několik postupně zkoušených variant řešení problému. Prvním řešením je naivní algoritmus, který homografií rektifikované obrázky z různých pohledů prahováním binarizuje a hledá diference. Ve druhé verzi se pomocí významných bodů popsaných SURF deskriptorem snaží identifikovat jednotlivé předměty ve scéně porovnáním s databází předmětů. V dalších verzích práce experimentuje se segmentačními metodami watershed a lazy snapping, a Cannyho hranovým detektorem. Finální verzi algoritmu potom tvoří kombinace metod lazy snapping a Cannyho detektoru. Jednotlivé metody jsou vyhodnocovány slovně a s příklady dobře a špatně vyhodnocených snímků. Metody jsou popsány poněkud chaoticky, například u jednotlivých řešení postrádám nějaká bloková schemata nebo jiné reprezentace posloupnosti operací (u poslední metody naopak schéma vítám). Taktéž bych u jednotlivých metod uvítal podrobnější vyhodnocení, kvalitativní i kvantitativní. Na přiloženém DVD je k nalezení kompletní projekt se zdrojovými kódy, a 20 snímků pracoviště a jednotlivých zkoumaných předmětů. Zde bych očekával větší dataset. Celkově je práce po formální stránce nižšího rozsahu, s řadou gramatických, stylistických a typografických chyb, nechybí odstavec ukončený uprostřed věty, nahodile se měnící zarovnání neb o řádkování textu, nebo chybová hláška nenalezené reference. Práce se odkazuje na 14 literárních zdrojů, i když některá tvrzení nebo vztahy referenci na literaturu postrádají. I přes výše zmíněné zásadní výhrady považuji práci za krok správným směrem z řešení zadaného problému a považuji formální zadání za splněné. Práci s výhradami doporučuji k obhajobě. Celkově hodnotím 50b a stupněm E.

Navrhovaná známka
E
Body
50

Otázky

eVSKP id 151565