MITRENGA, M. Konvoluční neuronová síť pro segmentaci obrazu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudky

Posudek vedoucího

Jirsík, Václav

Zadání bakalářská práce Michala Mitrenga na téma Konvoluční neuronová síť pro segmentaci obrazu řeší problematiku návrhu a realizace segmentace obrazu pomocí konvoluční neuronové sítě a vytvoření tréninkové množiny obrazů. Zadání z pohledu konvolučních neuronových sítí bylo náročné. Autor práce během studia neabsolvoval předmět, ve kterém se toto téma přednáší. Informace získával především samostudiem a konzultacemi. Během vypracovávání zadání BP student narazil na řadu problémů, které se mu nepodařilo efektivně a včas vyřešit. Zásadní problém nastal (aniž si to včas uvědomil) při změně použití konvoluční neuronové sítě oproti zadání semestrálního projektu – místo klasifikaci obrazu na segmentaci obrazu, což bylo provedeno po konzultaci firmou Artin s bakalářem. Bakalář pracoval samostatně, dosažené výsledky konzultoval. Výsledkem práce je teoretický rozbor problematiky počítačového vidění se zaměřením na segmentaci obrazu, úvod do problematiky umělých a konvolučních neuronových sítí, popis šesti základních topologií konvolučních neuronových sítí pro segmentaci obrazu, popis vybrané databáze obrazu Synthia a porovnání požadavků a na parametry a topologii konvolučních neuronových sítí pro klasifikaci a segmentaci obrazu. Z výše uvedených důvodů navrhuji hodnocení bakalářské práce D / 60 bodů.

Navrhovaná známka
D
Body
60

Posudek oponenta

Petyovský, Petr

Zadání bakalářské práce studenta Michala Mitrengy patřilo mezi odborně obtížné. Student si zvolil studijně náročné téma konvolučních neuronových sítí (CNN), požadující od něj další samostudium nad rámec bakalářského studijního programu, bohužel student náročnost tématu silně podcenil. Cílem práce bylo po získání odborných znalostí rozšířit dřívější diplomovou práci: „ZAPLETAL, O.: Rozpoznávání obrazů konvolučními neuronovými sítěmi - základní koncepty“ o schopnost segmentace obrazu. Vytvořit vhodnou databázi testovacích dat ve spolupráci s externí firmou, zvolit konfiguraci CNN vhodnou pro segmentaci obrazu a na vytvořené databázi testovacích snímků prezentovat dosažené výsledky. Požadovaných cílů práce nebylo dle mého názoru ani zdaleka dosaženo a množství studentem prezentovaných vlastních výsledků v práci není dostatečné. Stupeň orientace studenta v dané problematice je místy na podprůměrné úrovni, často si z faktů uváděných v práci vyvozuje mylné důsledky (viz má první otázka). Správnost zvolené koncepce student sám v závěrečné kapitole vyvrací, což sice může nastat, pokud byla tato skutečnost zjištěna v závěrečném období řešení práce, ovšem student neprovedl v závěru žádné zhodnocení této skutečnost a ani se nepokusil navrhnout jiná možná řešení vedoucí k lepším výsledkům. Problémem práce je také nerovnováha rozsahu textu věnovanému popisu teoretických a převzatých znalostí (cca. 28 stran) a popisu studentovi vlastní práce (cca. 7 stran). Z formálního hlediska je práce na podprůměrné úrovni. Množství překlepů a chybně sestavených vět je nad tolerovatelnou míru, praktická žádná strana práce není bez těchto chyb. Při čtení práce čtenář postřehne, že se několikrát v textu mění formátování tak, jak student pravděpodobně přebíral informace z různých zdrojů. (str. 29, 32, 35). Student v textu na straně 12 avizuje uvedení 4 základních metod předzpracování obrazu, ale dále již uvádí pouze dvě. Proč na straně 13, ani nikde dále v textu neuvádí principy a matematické vztahy popisující fungování konvolučních filtrů mi není jasné, jedná se přece o fundamentální znalosti nutné pro pochopení fungování CNN. Student v převzaté části práce uvádí matematické vztahy pravděpodobně pouze jako obrázky, protože další vztahy uvedené v jeho vlastní části práce již jsou psány v běžném textu nebo chybí zcela. Student tedy pravděpodobně nedokáže v textu práce samostatně prezentovat matematické vztahy na úrovni požadované od absolventa bakalářského studijního programu. Závěrečné kapitoly 7.2 a 7.3 již postrádají jakékoliv číslování obrazových a textových ukázek a pravděpodobně svědčí o časové tísni, do které se student v závěru řešení práce dostal. Práce bohužel není psána v logickém sledu, student na mnoha místech práce používá pojmy, jejichž význam je popsán až následně v dalších kapitolách práce, což výrazně stěžuje orientaci čtenáře v textu (např. pojmy: U-Net, VGG, DriNet atd.). Pokud bereme jako jeden z obecných cílů každé bakalářské práce prověřit schopnost studenta samostatněji pracovat a následně prezentovat výsledky vlastní práce, nemohu zodpovědně konstatovat, že by mě student o této své kvalitě přesvědčil. Z práce není patrná snaha studenta, dokončit zadání a prezentovat alespoň nějaké dílčí výsledky. Ve sportovní terminologii bychom hovořili o absenci tzv. „tahu na branku“. Hledat v textu práce seznam dosažených výsledků je problematický úkol. Jediným skutečným výstupem práce se tak stává kapitola 7.5 o rozsahu půl strany, která ale má spíše charakter poznámek a námětů k budoucímu směřování práce. Z textu práce není vůbec patrné množství testovacích snímků, na kterých student prováděl učení CNN. Zda jím navržené skripty v jazyce Python jsou funkční, ani to jaká část z těchto skriptů byla převzata z původní odkazující diplomové práce. Z úrovně zpracování textu práce odhaduji, že se student pravděpodobně nevěnoval řešení práce v rozsahu, který dané zadání požadovalo. Charakter textu práce a úroveň splnění zadání bohužel nesvědčí o bakalářských schopnostech studenta, a práci tedy nedoporučuji k obhajobě s hodnocením: F / 45 bodů. Komisi doporučuji, aby se přiklonila k lepšímu celkovému hodnocení práce pouze za předpokladu, že student komisi předvede alespoň jediný funkční příklad segmentace, která jím realizovaná aplikace s pomocí CNN provede. Pokud se tak nestane a student práci neobhájí, prosím komisi, aby neumožnila studentovi práci dopracovat a opětovně odevzdat v nejbližším možném termínu, neboť není pravděpodobně ve studentových silách ji během několika týdnů dopracovat do obhajitelné verze.

Navrhovaná známka
F
Body
45

Otázky

eVSKP id 111002