FIALA, Z. Využití neuronových sítí pro predikci hodnot a detekci anomálií v síťových datech [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2024.

Posudky

Posudek vedoucího

Sehnalová, Pavla

Využívání strojového učení, neuronových sítí a umělé inteligence pro zpřesňování a zrychlování automatizovaných výpočtů je stále důležitější. Aplikováním základních statistických metod na specifické problémy reálného světa dostáváme uspokojivé výsledky, často však nejsou dostatečně rychlé nebo výpočetně efektivní.  V zadání této diplomové práce jsou obsaženy hned dvě témata, která jsou z pohledu praktického využití, velice aktuální, a to je predikce dat a detekce těch anomálních. Pan Fiala při řešení postupně obou témat aplikoval nejen znalosti ze základních předmětů Matematického inženýrství jako statistika či základy neuronových sítí, ale byl schopen dostudovat hlubší problematiku (detailně popsanou v kapitole 2) a provést srovnání dvou zcela odlišných přístupů pro dané řešení. K získání finálního řešení se dostával postupnými experimenty a laděním nejvhodnějšího modelu pro zpracování netriviálních dat. Nutno podotknout, že nalezení vhodných modelů, jak pro regresní analýzu, tak pro řešení pomocí neuronové sítě, neleží pouze v nastavení několika parametrů pro již existující metody. Použitá reálná data o časové odezvě serverů síťového provozu jsou specifickým typem nestacionárních časových řad s trendem a sezónností. Nastavování a ladění struktury neuronové sítě nestálo jen na pár experimentech (detailně popsáno v kapitole 3) a ani různé přístupy z pohledu regrese nepřináší zcela vyhovující výsledky v jedné z oblastí (kapitola 5). Student se v práci zabývá také předzpracováním (preprocessing) dat, které nebylo součástí zadání, ale ukázalo se jako důležitý krok pro dosažení požadovaných výsledků. Téma detekci anomálií student obsáhl částí kapitoly 4, kdy podkapitoly 4.1 a 4.2 přesahují rámec zadání a student se snažil vyřešit i následné zpracování (postprocessing) detekovaných anomálií pro opakované použití navrženého postupu.  Student Bc. Fiala zpracoval problematiku a navrhl řešení v dostatečném předstihu před odevzdáním práce. S jeho aktivním přístupem jsem byla maximálně spokojena, stejně jako s četností konzultací a vypracováním celé práce, která zdaleka neobsahuje všechny zajímavé úvahy a experimenty, které někdy nevedly ke zdárnému výsledku, nutně však přispěly k nasměrování ke správnému postupu. Jsem velice ráda, že v rámci reprezentace výsledků jsou v práci prezentovány alespoň některé dílčí experimenty a ověření, které zdůvodňují výběr nejoptimálnějšího modelu neuronové sítě. Pro práci s modely použil pan Fiala programovací jazyk Python, který se pro tvorbu prototypu ukázal jako vhodný, neubral čas k programování vzhledem k náročnosti zpracovávaného tématu. Na závěr bych si troufla říci, že sepsáním poznatků této práce bych takový vědecký článek bez okolků doporučila do recenzovaného časopisu. 

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosažené výsledky a vyvozovat z nich závěry B
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis B
Práce s literaturou včetně citací A
Samostatnost studenta při zpracování tématu A
Navrhovaná známka
A

Posudek oponenta

Hübnerová, Zuzana

Práce porovnává užití neuronových sítí a SARIMA modelů při predikci časových řad, konkrétněji časové odezvy serverů síťového provozu. V kapitolách 2 a 3 jsou přehledně vysvětleny pojmy související s neuronovými sítěmi. Autor se zaměřil na LSTM neuronovou síť, což je pro predikci časových řad vhodné. Vlastním přínosem je návrh dvou algoritmů pro detekci anomálií. Práce je psaná čitelně, přehledně, potřebné pojmy jsou zavedeny v úvodních kapitolách, grafická prezentace výstupů je zdařilá, zdroje jsou správně citovány. V textu bych uvítala diskuzi článků věnujících se porovnání obou studovaných metod tak, aby měl čtenář přehled o výsledcích ostatních autorů v tomto směru. Oceňuji pečlivou studii nastavení parametrů vybrané neuronové sítě pro minimalizaci střední kvadratické chyby a diskuzi volby optimizéru. Porovnání užití detekce anomálií pomocí navržených metod na analyzovaných datech je též zdařilé. Domnívám se, že definice Gaussovského bílého šumu v definici 5.5 je chybná. Poznámky v diskuzi nestacionarity časových řad za větou 5.12 by bylo lépe upřesnit. U predikcí v odstavci 5.5 by bylo vhodné doplnit, že parametry modelů v práci s reálnými daty neznáme a nahrazujeme je jejich odhady. Poukazovaná slabina SARIMA ve formě možnosti zohlednění pouze jedné periody lze jistě vyřešit ať už diferencováním na delší periodu, nebo užitím komplexnějšího modelu. Měla bych připomínku k diskuzi užití Boxplotu pro detekci odlehlých pozorování v kapitole 4. Tvar boxplotu napovídá, že jsou rezidua zešikmená, proto bylo detekováno takové množství odlehlých pozorování. Přes pár drobných výše uvedených výtek navrhuji hodnocení A.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků a cílů zadání A
Postup a rozsah řešení, adekvátnost použitých metod A
Vlastní přínos a originalita B
Schopnost interpretovat dosaž. výsledky a vyvozovat z nich závěry A
Využitelnost výsledků v praxi nebo teorii A
Logické uspořádání práce a formální náležitosti A
Grafická, stylistická úprava a pravopis A
Práce s literaturou včetně citací B
Navrhovaná známka
A

Otázky

eVSKP id 154109