MASÁROVÁ, T. Nástroj pro optimalizaci neuronových sítí pomocí rozšíření záznamů bezpečnostních událostí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Posudky

Posudek vedoucího

Safonov, Yehor

Studentka úspěšně splnila cíle bakalářské práce, provedla rozsáhlou rešerši existujících technik textové augmentace a vybrala vhodné přístupy specificky zaměřené na doménu záznamů bezpečnostních událostí. V praktické části úspěšně navrhla, implementovala a otestovala nástroj pro optimalizaci neuronových sítí prostřednictvím generování logových záznamů. V teoretické části práce se věnovala problematice bezpečnostního monitoringu, popsala systémy typu Log Manager, EDR, SIEM, XDR a SOAR, stejně jako různé typy a formáty logových záznamů. Dále se zaměřila na možnosti využití umělé inteligence v oblasti bezpečnostního monitoringu a zpracování logových dat pro účely strojového učení. Oceňuji detailní analýzu současného stavu textové augmentace, v jejímž rámci studentka identifikovala více než 50 relevantních zdrojů. Všechny zjištěné techniky byly následně mapovány na doménu logových záznamů a systematicky rozděleny do šesti kategorií podle jejich technických charakteristik (viz kapitola 2.2). Studentka pravidelně konzultovala a prezentovala průběžné výsledky. Prokázala schopnost práce s odbornou literaturou. V práci uvedla celkem 125 použitých zdrojů, což svědčí o pečlivosti a hloubce provedené rešerše. Práce je obsahově správně strukturovaná a všechny zdroje jsou řádně citovány. V praktické části práce porovnala knihovny pro generování náhodného obsahu (Mimesis, FauxFactory a Faker). U zvolené knihovny Faker implementovala 75 vlastních augmentačních funkcí (providerů), které byly otestovány na vzorových logových záznamech. Tyto funkce byly navrženy tak, aby pokrývaly významné entity běžně se vyskytující v logových datech. Techniky rozšíření byly aplikovány na úrovni znaků, slov, vět i celých dokumentů (logů). Pozitivně hodnotím zohlednění pokročilé augmentace – vytvoření rozhraní umožňujícího napojení moderních generativních modelů. Za jednu z hlavních předností práce považuji možnost dynamicky kombinovat všechny navržené techniky pomocí přehledně strukturovaných konfiguračních souborů, stejně jako důkladné testování vytvořeného nástroje na reálných datových sadách. Při řešení úlohy typu NER byly využity modely typu Transformer (T5) a LSTM. Jako jedinou slabší stránku práce lze zmínit drobné typografické chyby (např. na straně 30) a poměrně stručný k rozsahu práce popis principů fungování neuronových sítí. S ohledem na velmi kvalitně zpracovanou teoretickou i praktickou část, která rozsahově přesahuje běžnou úroveň bakalářské práce, navrhuji celkové hodnocení A (99 bodů).

Navrhovaná známka
A
Body
99

Posudek oponenta

Přinosil, Jiří

Bakalářská práce se zabývá návrhem a implementací nástroje pro augmentaci textových dat logových záznamů pro bezpečnostní systémy. Na práci musím vyzdvihnout zejména hlubokou a dobře zpracovanou rešerši v oblasti analýzy bezpečnostních záznamů a stávajících metod generování textových dat. Co se týče vlastního návrhu a implementace nástroje i zde se jedná o dobře odvedenou práci, a to jak po stránce implementační, tak i po stránce následného textového popisu dílčích částí. Jediné, co bych práci vytkl je příliš stručný popis testovacího procesu augmentačního nástroje (chybí popis modelu, u kterého byly augmentovaná data použity při trénování a validaci). Rovněž by bylo vhodné v tabulkách výsledků 5.1-5.4 vyznačit tučně nejvyšší dosažené hodnoty. V odevzdaných zdrojových kódech je obsah složek pm_log_utils a pm_deep_augmentation prázdný, ačkoliv dle textového popisu v práci by měl obsahovat skripty v jazyku python.

Navrhovaná známka
A
Body
98

Otázky

eVSKP id 167357