BUBLAVÝ, M. Zvýšení rozlišení obrazu pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Španěl, Michal

Pan Bublavý se bakalářské práci průběžně věnoval a byl při řešení velmi samostatný. Dokázal nastudovat a osvojit si aspekty práce v oblasti strojového učení, tj. našel si vhodný dataset, zvolil dobrou architekturu, natrénoval síť a vyhodnotil výsledky. Práce tak nemá nějakou zásadní slabinu, jednoduše opravdu dobrá práce.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání V rámci tématu se student rozhodl pro práci s CT snímky plic. Při svých experimentech se zaměřil na neuronové sítě typu GAN, což vyžadovalo se s nimi dostatečně seznámit. Nejde o triviální typ neuronové sítě se zcela přímočarým učením. S ohledem na využití existujícího datasetu i architektury MedSRGAN bych náročnost práce hodnotil jako standardní. Zadání bylo splněno dle požadavků.
Práce s literaturou Základní doporučenou literaturu student prostudoval a sám následně vyhledával a prozkoumával další zdroje. Získané poznatky dokázal přenést do praxe a aplikovat.
Aktivita během řešení, konzultace, komunikace Student prokázal schopnost uchopit zadání a samostatně je řešit. Na konzultace docházel pravidelně a byl připraven.
Aktivita při dokončování Definitivní podoba technické zprávy byla přiměřeně konzultována.
Publikační činnost, ocenění Není známa.
Navrhovaná známka
C
Body
78

Posudek oponenta

Juránková, Markéta

Student zvolil poměrně lehkou cestu využití ověřené architektury testované na známém datasetu. Textová ani softwarová část nevybočuje z průměru.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Zadání poskytuje velký prostor pro vlastní kreativitu a specifikaci úlohy. Student zvolil nenáročnou cestu použití známe architektury a otestování na existujícím datasetu.
Rozsah splnění požadavků zadání Autor si zvolil úzkou oblast zvyšování rozlišení CT skenů, čímž se bod 3 (Vytvořte datovou sadu), stal dle mého názoru nesplnitelný. Student tak pro vyhodnocení použil existující dataset.  Bod 4 (Navrhněte architekturu neuronové sítě) je splněn s výhradou - autor vzal existující architekturu s minimální změnou aktivační funkce. Ani jedna z výhrad však není závažná natolik, aby znemožnila obhajobu práce.
Rozsah technické zprávy
Prezentační úroveň technické zprávy 70 Kapitoly mají logickou strukturu a návaznost. Rozsahy kapitol jsou úměrné a pokrývají důležité informace. Text obsahuje větší množství drobných chyb, které ruší čtenáře, pro ukázku: obr. 2.4 gaussův šum místo rozmazání gaussovým filtrem obr. 3.2 v popisku max pooling ale na obrázku znázorněný average pooling rovnice 2.1 označení SE místo MSE několikrát odkazování na stejnou kapitolu, ve které se čitatel právě nachází. Některé častí jsou těžko čitelné, příkladem je začátek kapitoly 3.1. Je těžké rozeznat, jestli autor nerozumí konvolučním neuronovým sítím, nebo není schopen je srozumitelně popsat.  Část o metodě MedSRGAN působí jako automatický překlad částí původního článků, bez hlubší znalosti a pochopení. Jako příklad "... MedSRGAN taktiež predstavuje náhodný Gaussov šum s nulovou strednou hodnotou... " v původní práci "... random Gaussian noise with zero mean and unit variation was introduced as an additional  channel... " Šum byl tedy na vstupu přidán, případně zaveden, ne představen, což je zřejmé při pochopení problematiky.  
Formální úprava technické zprávy 85 Text obsahuje minimum typografických chyb. Po jazykové stránce je občas rušivý překlad zavedených anglických pojmů (pooling vrstva přeložena jako združovacia vrstva , peak signal-to-noise ratio jako špičkový pomer signálu k šumu , ...).  V textu je možné najít několik prezentačních chyb, příklad: " ...pozostáva zo snímku s vysokým rozlíšením a k nemu súvisiacou snímkou s vysokým rozlíšením... "  
Práce s literaturou 90 Student vhodně a správně cituje dostatečné množství relevantních zdrojů.
Realizační výstup 65 Programové řešení pozůstává z jednoho, skromně komentovaného, Jupyter Notebooku.  U implementace architektury sítě MedSRGAN je dle mého názoru patrná inspirace veřejně dostupným kódem https://github.com/04RR/MedSRGAN . Pokud autor tuto implementaci využil, bylo by vhodné ji odcitovat.  V části "Experimenty a výsledky" jsou při porovnání metod opomenuty důležité informace o implementaci a trénování modelů SRCNN a SRGAN. Student zaměňuje validační a testovací sadu.
Využitelnost výsledků Jedná se o práci kompilačního charakteru, bez rozšiřujících poznatků.
Navrhovaná známka
C
Body
75

Otázky

eVSKP id 141573