VAŠÍČKOVÁ, Z. Detekce a hodnocení zkreslených snímků v obrazových sekvencích [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.

Posudky

Posudek vedoucího

Kolář, Radim

Studentka Zuzana Vašíčková se v diplomové práci zabývala detekcí zkreslených snímků ve videosekvencích sítnice. V první části vytvořila modely zkreslení, které následně použila pro vytvoření učící sady pro vytvoření regresních a detekčních modelů založených na architektuře hlubokých neuronových sítí. V poslední fázi projektu studentka zjistila, že modely naučené na simulovaných datech nepodávají zcela uspokojivé výsledky na reálných datech. To ale nějak zásadně nesnižuje odvedenou a prezentovanou práci. Dále oceňuji kvalitně a pečlivě zpracovaný text (až ne nejednotný styl seznamu literatury) a také fakt, že je psaný v anglickém jazyce. Celkově studentka pracovala pilně a systematicky. Práci tak hodnotím stupněm A/90b.

Navrhovaná známka
A
Body
90

Posudek oponenta

Chmelík, Jiří

Studentka se ve své práci zabývala detekcí zkreslených snímků v obrazových sekvencích z videooftalmoskopu a jejich hodnocení z hlediska typu a míry neostrosti. Po formální stránce je práce na dobré úrovni s občasnými typografickými chybami. Řazení práce znemožňuje jasně rozlišit teoretickou část práce od vlastního přínosu studentky, což je ještě zhoršeno nestandardním používáním odkazů na literaturu vždy až na konci odstavců na místo ihned za citovanou částí. Odborná stránka práce trpí řadou nedostatků. Nerozumím, proč je pohybové rozostření obrazu modelováno pouze ve čtyřech směrech. Z textu práce není jasné, jakým způsobem je určena kvalita použitých snímků (na stupnici od 0 do 100), a proč bylo tento krok proveden. Podle dostupného programového řešení je tento převod parametrů modelů rozostření na stupnici kvality u každého modelu závislý na odlišných parametrech. Stejný stupeň kvality tedy může u různého typu zkreslení obrazu znamenat jeho odlišnou míru. Očekával bych, že budou predikovány přímo parametry tohoto zkreslení, případně nějaký obecně používaný parametr kvality obrazu. Závažným nedostatkem je, že studentka využila pouze 3 ostré obrazy pro učení neuronových sítí i regresních modelů, což mělo pravděpodobně za následek jejich přeučení, což dokazují i neuspokojivé výsledky učení regresních sítí i finální výsledky na reálných datech. Některé používané metriky hodnocení úspěšnosti nejsou v práci dostatečně vysvětleny (SROCC, PLCC, RMSE, R2). V práci postrádám zdůvodnění použití následné úpravy výstupních příznaků extrahovaných sítí ResNet50 (momenty, kvantily). Domnívám se, že využití jednoduchého regresního modelu při vstupním vektoru s mnohonásobně větší dimenzí, než je počet dostupných vzorků, povede k jeho značnému přeučení. Práce obsahuje mnoho dalších drobných nedostatků, jako například zbytečné popisy použitých funkcí místo popisu samotných metod, což znesnadňuje reprodukovatelnost navržených algoritmů v jiném programovém prostředí. Při malé učební databázi měla být uvažována její umělá augmentace. Přidání dropoutu pouze před finální klasifikátor v sítí Inception-ResNet-v2 nemohlo mít velký efekt při učení sítě, stejně jako změna nastavení parametru epsilon v algoritmu ADAM. Popis metody ADAM je neúplný. Změna standardizace/normalizace dat před sítí Inception-ResNet-v2 a ResNet50 není nikde zdůvodněna ani diskutována. Nerozumím, proč studentka využívala více různých knihoven (Keras + PyTorch) pro každou část algoritmu na místo jediné, ani proč jsou ve zdrojových kódech importovány dále nepoužívané nástroje. Na simulovaných datech bych ocenil srovnání predikovaných hodnot kvality s některými běžně používanými metrikami (PSNR, NIQE, atd.). Mnohem vyšší procentuální hodnoty detekovaných rozostřených snímků oproti manuálnímu značení ukazují, že použitý klasifikátor není schopen robustně pracovat na reálných sekvencích, což může být způsobeno přeučením modelů na trénovacích datech. V práci oceňuji, že studentka otestovala více odlišných přístupů a provedla jejich kombinaci. Všechny body zadání považuji za splněné, a práci hodnotím stupněm D (60 bodů).

Navrhovaná známka
D
Body
60

Otázky

eVSKP id 126851