ŠŤASTNÁ, A. Nástroj pro anonymizaci záznamů bezpečnostních událostí pro aplikování technik umělé inteligence [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.

Posudky

Posudek vedoucího

Safonov, Yehor

Studentka splnila cíle bakalářské práce. Provedla analýzu, návrh a implementaci aplikace realizující API rozhraní sloužící pro anonymizaci logových záznamů s možností aplikování technik umělé inteligence. Hlavním přínosem vzniklého nástroje je možnost anonymizace vstupných dat s následující možností jejich zveřejnění a cloudového použití. Daná skutečnost v závěru umožní posunout stav vědy a techniky v doméně bezpečnostního monitoringu na novou evoluční etapu. V průběhu akademického roku studentka pravidelně konzultovala a prezentovala dosažené výsledky. Prokázala schopnost práce s odbornou literaturou. Všechny grafické a textové vstupy jsou řádně citovány. Velice kladně hodnotím textovou část bakalářské práce a dobře okomentovaný zdrojový kód. Obsah práce je rozdělen logicky a přesahuje rámec bakalářského projektu, což pozitivně ovlivňuje celkový dojem. Komplikované technické a právní aspekty jsou popsány do hloubky a předem odpovídají na veškeré otázky, které mohou čtenáře napadnout. Práce důkladně popisuje existující právní předpisy, které vstupují na arénu zpracování a anonymizaci logových záznamů (evropské, národní a lokální, např. NDA). Kladně hodnotím analýzu nové směrnice NIS2, která nabude své platnosti v roce 2024. Teoretická část práce taktéž zahrnuje popis funkcionalit SIEM systémů, podrobné srovnání kategorií logů, problematiku anonymizace logových záznamů a její vliv na techniky strojového učení. Problematika strojového učení je zde popsána hlavně s důrazem na doménu NLP (Natural Language Processing), během které studentka stručně srovnala moderní architektury hlubokých neuronových sítí (BERT, RoBERTa, GPT-3) a popsala proces tokenizace (viz kapitola 1.5.1). Studentka srovnala existující metaklíče u různých dodavatelů SIEM platforem (RSA Netwitness, QRadar, Elasticsearch), viz tabulky číslo 3.3 a 3.4. Daný přístup umožní efektivní propojení s reálnými SIEM systémy. Navíc v rámci kapitoly 3.3 studentka prezentovala zvolené metaklíče k anonymizaci, viz str. 54. Vytknout u dané tabulky lze neexistující nadpis a poměrně malou velikost písma. V rámci realizovaného rozhraní studentka zvolila použití knihovny Flask, která umožnila implementovat API rozhraní. Kladně hodnotím finální funkční stránku vzniklého rozhraní, vytvořený proces diagram, dostupný na obrázku číslo 3.3, dobře zpracované grafické schéma zpracování datových vstupů (viz schéma 3.1), možnost přímého vložení logových záznamů přes GUI rozhraní a podrobné testování aplikace na reálných datech (viz tabulky 4.3-4.7). Studentka pracovala velmi aktivně, a proto nad rámec zadání práce realizovala funkční propojení rozhraní s platformou Logstash pro sběru logových záznamů (vyvíjenou vedoucím práce). Navíc po společné domluvě a spolupráci se studentkou byl sepsán vědecký článek, který bude publikován v odborném časopisu. Z důvodu rozsáhlé a povedené praktické a teoretické časti navrhuji práci k obhajobě s finálním hodnocením A (99 bodů).

Navrhovaná známka
A
Body
99

Posudek oponenta

Jurek, Michael

Studentka Ariela Šťastná se ve své bakalářské práci zaměřila tvorbu nástroje na anonymizaci záznamů událostí. V teoretické části popsala a porovnala současný stav řešení bezpečnostního monitoringu, popis problematiky logování a základů metod umělé inteligence pro anonymizaci dat. Studentka ve své práci porovnala existující nástroje pro anonymizaci logů. Dále se zabývala právním rámcem ochrany osobních údajů a vytvořila vlastní metodiku pro anonymizaci osobních údajů. V praktické části studentka vytvořila webovou aplikaci pro extrakci citlivých informací ze záznamů událostí pomocí regexů pro nestrukturované záznamy a pomocí meta klíčů ze záznamů JSON. Studentka provedla testování nástroje na záznamu událostí z reálné a virtualizované infrastruktury, kde provedla porovnání obou přístupů. Z pohledu kvality kódu dle standardu pep8 bych vytknul drobné nedostatky (např. chybí mezery mezi funkcemi). Doporučuji si projít knihu Čistý kód od R. C. Martina. Při popisu umělé neuronové sítě by bylo vhodné uvést matematický popis neuronu a popsat aktivační funkce. Studentka si připravila přehledné video demonstrující funkčnost aplikace. Kladně hodnotím provedení práce v anglickém jazyce, které je na velmi vysoké úrovni. Z formální stránky bych podotknul, že větší tabulky (např. záznamy z Elastic Stack logů) je lepší uvádět do příloh práce. Tabulka na straně 54 neobsahuje popis, tudíž není zahrnuta do výpisů tabulek. Dále bych vytknul nevhodné grafické provedení této tabulky. (Není vhodné používat mezerník k zarovnání.) Dále oceňuji bohatost použité literatury, kde studentka čerpá jednak z elektronických zdrojů, vědeckých a odborných článků, webů, tak i z právních norem. Teoretická i praktická stránka práce jsou zpracovány velmi dobře. Studentka splnila zadání bakalářské práce. Proto navrhuji známku A (95 bodů) a doporučuji k obhajobě.

Navrhovaná známka
A
Body
95

Otázky

eVSKP id 151229