ŠIMUNSKÝ, M. Vliv barevných modelů na chování konvolučních neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2020.
Diplomová práce zkoumá vliv reprezentace vstupních dat na přesnost klasifikace barevných obrázků objektu v případech, kdy klasifikaci zajišťují hluboké konvoluční neuronové sítě. Svým charakterem se jedná o výzkumně orientovanou práci. Student v rámci její realizace provedl řadu časově velmi náročných experimentů, na jejichž designu se aktivně podílel. Díky své vysoké odhodlanosti a pracovní disciplíně dokázal v relativně krátkém čase vygenerovat dostatek dat pro statistické vyhodnocení navržených experimentů. Jeho nabyté zkušenosti jsou ostatně dobře patrné i v písemné části diplomové práce, a to zejména ve 3 kapitole, která se věnuje praktické realizaci experimentů a vyhodnocení získaných dat. Další silnou stránkou předloženého textu je zevrubná rešerše mapující současné poznatky ve zkoumané oblasti. Velmi kladně hodnotím i naprostou samostatnost studenta při vyhodnocování výsledků a vyvozování závěrů. Předložený text má bohužel i své nedostatky, mezi které patří zejména občasná nekonzistence textu a občasné nepřesnosti v pojmech, které se vyskytují zejména v teoretické části práce. Přínosem pro celkový dojem z práce by byla i vyšší míra užití matematických vzorců, a to zejména v části věnované topologii konvolučních neuronových sítí. I přes uvedené nedostatky však hodnotím práci známkou A. Tento stupeň hodnocení navrhuji zejména s ohledem na samostatnost studenta, rozsah realizované práce a významnost získaných výsledků.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění požadavků a cílů zadání | A | ||
Postup a rozsah řešení, adekvátnost použitých metod | A | ||
Vlastní přínos a originalita | A | ||
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry | A | ||
Využitelnost výsledků v praxi nebo teorii | A | ||
Logické uspořádání práce a formální náležitosti | B | ||
Grafická, stylistická úprava a pravopis | B | ||
Práce s literaturou včetně citací | A | ||
Samostatnost studenta při zpracování tématu | A |
Cílem diplomové práce, jak si jej student Martin Šimunský po dohodě s vedoucím práce stanovil, je „prozkoumat aktuální poznatky vlivu některých barevných modelů na chování konvoluční neuronové sítě,“ jak je uvedeno v úvodní kapitole. Prakticky lze poznamenat, že student problém zúžil tak, že zejména zvolil konkrétní architekturu konvoluční neuronové sítě, konkrétní dataset pro testování klasifikačních schopností sítě, a testoval závislost dosažené přesnosti klasifikace v závislosti na reprezentaci obrazových dat v datasetu. Na základě tohoto experimentu pak autor indikoval vhodnost jednotlivých reprezentací obrazových dat, přičemž byl doporučen RGB model. Jedná se o bezesporu aktuální téma s vysokým potenciálem praktických dopadů. V teoretické práci se autor věnuje problematice konvolučních neuronových sítí, problematice barevných modelů obrazových dat a nakonec, což zejména hodnotím kladně, je připojen současný stav poznání v oblasti zadaného výzkumného úkolu. Teoretická část práce je psána nevyrovnaně. Některé oblasti jsou zbytečně podrobné (např. rozebírání XOR problému, který s prací víceméně nesouvisí), naproti tomu byly úplně vynechány oblasti mající zásadní vliv na řešenou problematiku (zejména popis možných algoritmů učení a inicializačních algoritmů pro váhy a prahy). Kapitola 2.1.5 pak spojuje několik navzájem nesouvisejících pojmů a působí dojmem, že byla doplněna do již hotového textu. Práce s odbornou literaturou je obecně na vyšší úrovni, chybí však citace zdrojů pro některá důležitá prohlášení (např. řádky 11-16 v úvodní kapitole). Praktická část práce je tvořena popisem sady experimentů, které vytvářely klasifikátory obrazových dat kódovaných vybranými barevnými modely. Experimenty byly vystavěny zpravidla v souladu se zvyklostmi dané problematiky, dovolím si však následující poznámky: (1) Během návrhu experimentů nebyly nijak diskutovány volby algoritmu učení (zvolen byl podle Tab. 3.1 algoritmus Stochastic Gradient Descent with Momentum) ani nebyla nijak popsána volba počáteční inicializace vah a prahů sítě. (2) Vzhledem k tomu, že proces návrhu neuronové sítě je vysoce stochastický proces, prováděl autor tzv. Hlavní experiment opakovaně patnáctkrát pro každý barevný model. Je však třeba zmínit, že i samotný tzv. Inicializační experiment by bylo potřeba provést opakovaně, pokud na jeho základě autor prováděl volbu některých důležitých parametrů pro Hlavní experiment. (3) Výsledky experimentu indikují, že nejpřesnější výsledky poskytuje barevný RGB model, zatímco nejhůře hodnocený je HSV model. Není bez zajímavosti, pokud jsem správně porozuměl textu, že dataset byl reprezentován zdrojově v RGB kódování a HSV transformace je vůči RGB výrazně nelineární. Bylo by vhodné diskutovat stav, kdyby originální kódování bylo HSV (čip a elektronika použitého fotoaparátu by hypoteticky poskytovaly HSV kódované obrázky). Neprojevily by se efekty popisované v kapitole 3.5 opačně? Je bezesporu možno konstatovat, že autor splnil zadání práce, úkol řešil systematicky, reprodukovatelně a v souladu s příslušnými standardy. Text práce je srozumitelný a jednotlivé provedené kroky jsou dobře zdůvodněny. Na základě provedených experimentů autor zpravidla správně vyvozuje závěry. Kladně také hodnotím to, že autor správně rozpoznal, že provedené experimenty v žádném případě neumožňují konečné rozhodnutí týkající se zkoumaných hypotéz. Snížený stupeň hodnocení v oblasti „Postup a rozsah řešení…“ a také v oblasti celkového hodnocení navrhuji zejména z důvodu chybějícího zdůvodnění volby algoritmu trénování a algoritmu pro inicializaci vah a prahů. Oba tyto kroky významně ovlivňují kvalitu navržené neuronové sítě.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění požadavků a cílů zadání | A | ||
Postup a rozsah řešení, adekvátnost použitých metod | B | ||
Vlastní přínos a originalita | B | ||
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry | A | ||
Využitelnost výsledků v praxi nebo teorii | A | ||
Logické uspořádání práce a formální náležitosti | C | ||
Grafická, stylistická úprava a pravopis | B | ||
Práce s literaturou včetně citací | B |
eVSKP id 124348