ZOBANÍK, R. Doplnění chybějící části obrazu pomocí hlubokého učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Šilling, Petr

Student se dokázal šikovně zorientovat v problematice, která mu předem nebyla příliš známá. O své téma aktivně zajímal, dokázal navrhnout vhodná řešení problému a provést kvalitní experimenty. Nad rámec zadání rovněž vytvořil aplikaci pro vizuální prezentaci své práce. Vyzdvihnout bych chtěl ukázkovou spolupráci studenta.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Pro splnění cílů práce bylo zapotřebí do hloubky nastudovat různorodé přístupy pro image inpaining, a to s důrazem na moderní metody využívající strojové učení. Pan Zobaník se v tématu dokázal velmi rychle zorientovat a navrhnul nejen vhodné datové sady a metody vhodné k následnému experimentování, ale nad rámec zadání také vytvořil kvalitní grafické rozhraní pro vizuální prezentaci dosažených výsledků a porovnávání natrénovaných modelů. Zadání celkově považují za mírně obtížnější, neboť bylo převážně experimentální podoby a vyžadovalo studium metod nad rámec bakalářského studia. S výsledky práce jsem spokojen.
Práce s literaturou Student sám aktivně a z vlastní iniciativy vyhledával relevantní studijní materiály. Z konzultací bylo patrné, že si nalezené materiály nastudoval a že jim porozuměl. Hlavní část nastudované literatury tvořily vědecké články.
Aktivita během řešení, konzultace, komunikace Student pracoval průběžně a aktivně po oba semestry. Na konzultace docházel pravidelně dle vzájemné domluvy. Před každou konzultací byl vždy názorně připraven, naslouchal doporučením a aktivně se dotazoval a řešil další postup. Bylo zřejmé, že se snaží vytvořit co nejlepší možný výsledek.
Aktivita při dokončování Práce byla dokončena s dostatečnou rezervou. Technická zpráva byla konzultována a připomínky k jejímu obsahu byly řádně zapracovány. Časová rezerva u technické zprávy již však byla menší. Její finální obsah byl proto konzultován pouze omezeně.
Publikační činnost, ocenění
Navrhovaná známka
A
Body
90

Posudek oponenta

Kubík, Tibor

Celkovo je práca odvedená veľmi dobre až výborne, a to hlavne v kontexte vykonania experimentov a následného prezentovania dosiahnutých výsledkov. Vytvorenie aplikácie je určite chválihodné, no z pohľadu technickej správy to spôsobilo badateľnú degradáciu logickej štruktúry prezentovaného textu. Taktiež je škoda, že experimenty neboli prepojené s vytvorenou aplikáciou napríklad formou užívateľského testovania kvality dopĺňania chýbajúcich častí obrázkov. 

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Tému bakalárskej práce hodnotím ako priemerne obtiažnu. Ide v princípe o netriviálnu úlohu počítačového videnia, no hojne riešenú, takže existuje množstvo návodov a materiálov, z ktorých sa dá vychádzať, rovnako ako existujúcich datasetov a overených architektúr. Ťažiskom práce je naštudovanie základných princípov učenia neurónových sietí a súčasného stavu poznania v konkrétnej úlohe, výber vhodnej architektúry a datasetu a prevedenie experimentov.
Rozsah splnění požadavků zadání Všetky body zadania sú splnené. Práca predstavuje komparatívnu analýzu dvoch principiálne odlišných prístupov hlbokého učenia na doplnenie chýbajúcich častí obrazu. Ďalšia súčasť práce, ktorá dokonca nebola vyžadovaná v zadaní, je aplikácia s grafickým užívateľským rozhraním pre testovanie a porovnávanie metód pre doplnenie chýbajúcich častí obrazu.
Rozsah technické zprávy Rozsah technickej správy je v norme.
Prezentační úroveň technické zprávy 75 Technická správa ako celok pôsobí dojmom, že pri jej tvorbe nebolo samotnému autorovi jasné, či je hlavným cieľom práce demonštračná aplikácia alebo experimentovanie so zvolenými modelmi. Teoretická časť obsahuje predstavenie úlohy a metódy jej riešenia, pričom nie sú vynechané ani konvenčné metódy. Bolo by vhodné upraviť pomer rozsahov textu k základom neurónových sietí a súčasného stavu poznania v kontexte riešenej úlohy, a to v prospech druhého spomenutého. Ku príkladu, pre názornosť základných princípov neurónových sietí je využitých 5 obrázkov (o ich dôležitosti by sa dalo diskutovať), zatiaľ čo sekcia prezentujúca parciálne konvolúcie zaberá jednu tretinu strany, neobsahuje žiadnu ilustráciu a predsa ide o teoretický základ referenčného modelu celej práce. Kapitola o návrhu a implementácii dokopy obsahuje len približne jednu stranu textu zaoberajúcu sa modelmi a ich trénovaním. Zdá sa teda, že cieľom práce je demonštračná aplikácia. V tom prípade však úplne chýba užívateľské testovanie pri návrhu, makety, apod. Testovanie sa potom výlučne venuje dosiahnutým výsledkom, ktoré sú spojené s vyhodnotením natrénovaných modelov. Demonštrašná aplikácia, ktorej sú primárne venované predošlé dve kapitoly akoby neexistovala, pričom by sa dala využiť minimálne na užívateľské testovanie pri komparatívnej kvalitatívnej analýze. Zdá sa teda, že cieľom práce je porovnanie rôznych metód na doplnenie chýbajúcich častí obrazu.
Formální úprava technické zprávy 87 Veľkosť textu vo vlastných ilustráciach je v niekoľkých prípadoch (obrázok 2.3, 2.6, 2.10) príliš veľká v porovnaní s veľkostou textu práce. Niektoré obrázky nie sú v referované v texte. Ďalej by som po typografickej stránke vytkol nevhodné umiestnenie citácií za ukončujúcou bodkou vety (v niektorých prípadoch s ďalšiou extra bodkou, napr. strana 13. Jazyková stránka práce je kvalitná.
Práce s literaturou 90 Študent cituje prevažne vedecké články relevantné k riešenej problematike. V zopár prípadoch chýbajú prvky podľa normy, napr. [2, 7]. 
Realizační výstup 90 Výstupom sú skripty pre trénovanie a vyhodnotenie dvoch prevzatých modelov pre doplnenie chýbajúcich častí obrazu. Z experimentálnej stránky je ďalej výstupom komparatívna analýza zvolených metód v dvoch scenároch (maskovanie väčšej časti vstupného obrazu simulujúce odstránenie objektu a maskovanie nepravideľnou maskou), tak isto ako ablačná štúdia skúmajúca vplyv počtu AOT blokov v prípade GAN siete na kvalitu doplnenia obrazov. V neposlednom rade je výstupom demonštračná aplikácia implementovaná v PyQt s možnosťou interaktívnej tvorby masiek, aplikovania rôznych algorithmov spracovania obrazu či porovnávania výstupov pri rôznych nastaveniach modelu.
Využitelnost výsledků Výsledná aplikácia môže slúžiť na priame a efektívne empirické porovnanie rôznych prístupov k dopĺňaniu chýbajúcich častí obrazu s možnosťou tvorby ľubovoľných masiek. Efektivitu a použiteľnosť aplikácie pri testovaní modelov však nie je možné z prezentovanej práce priamo určiť, pretože chýba užívateľské testovanie. V kontexte experimentálnej roviny práca prezentuje dôkladne spracovanú ablačnú štúdiu a komparatívnu analýzu dvoch rozličných metód, spolu s kvalitnou interpretáciou výsledkov autorom.
Navrhovaná známka
B
Body
88

Otázky

eVSKP id 154508