ŽERNOVIČ, M. Aplikace pro sběr záznamů událostí z počítačové infrastruktury [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.

Posudky

Posudek vedoucího

Safonov, Yehor

Student splnil cíle bakalářské práce, provedl analýzu, návrh a implementaci aplikace sloužící pro sběr záznamů událostí z počítačové infrastruktury a umožňující napojení libovolného modelu NLP sítě. Vytvořená aplikace je škálovatelná, nezávislá na konkrétním modelu, podporuje moderní protokoly napojení na zdroje logů a umožňuje několik režimů fungování. Konkrétně: dávkové a přímé přeposílání záznamů událostí na konkrétní model neuronové sítě a režim pasivního třídění dat pro účely přípravy datových sad pro AI modely. Z teoretického pohledu student nastudoval problematiku bezpečnostního monitoringu, provedl analýzu a srovnání existujících formátů a protokolů pro napojení zdrojů logů, popsal techniky hlubokého učení, problematiku NLP včetně moderních Transformer architektur. Práce obsahuje rozsáhlou analýzu řešení pro sběr logových záznamů (viz kapitola 4). V rámci dané kapitoly definoval a podrobně popsal několik způsobů řešení problémů, které následně prakticky otestoval (viz kapitoly 4.1-4.4). Pro implementační účely student zvolil cestu pomocí existujících open-source nástrojů pro sběr logů. Finální volba padla na řešení Logstash, jejíž výběr byl řádně argumentován poskytnutým srovnáním v tabulkách číslo 4.1 a 4.2. Kladně hodnotím finální funkční stránku vzniklého rozhraní umožňujícího konzumovat data z různých zdrojů logů pomocí pull a push přístupu, s jejichž následným dávkováním pro různé případy užití. Výslednou platformu student otestoval na pěti unikátních zdrojích logů. Proces integrace a testování je názorně prezentován na obrázku 6.4. V rámci testování vyvinutého API rozhraní provedl napojení na poskytnutý vedoucí model nerunové sítě typu BERT a srovnal rychlost rozhraní při řešení QA problémů na CPU a GPU. V průběhu akademického roku pravidelně konzultoval a včas prezentoval dosažené výsledky. Student prokázal výbornou schopnost práce s odbornou literaturou. Všechny textové a grafické vstupy jsou řádně citovány. Praktický výstup práce je dobře okomentován a podpořen povedenými grafickými ukázkami. Obsahově je práce správně logicky rozdělena a přesahuje rozsah bakalářského projektu. Vytknout lze jedině anglické schéma číslo 3.5 (str. 35), které není přeloženo a dostatečně technicky popsáno. Student pracoval velmi aktivně, a proto nad rámec zadání práce realizoval funkční propojení rozhraní s platformou pro anonymizaci logových záznamů (vyvíjenou vedoucím práce ve spolupráci s jinými studenty). Navíc po společné domluvě a spolupráci s vedoucím práce byl sepsán odborný článek. Z důvodu rozsáhlé teoretické části a kvalitního výstupu praktické časti navrhuji práci k obhajobě s finálním hodnocením A (98 bodů).

Navrhovaná známka
A
Body
98

Posudek oponenta

Dobiáš, Patrik

Bakalářská práce se zabývá sběrem logů z počítačové infrastruktury a jejím hlavním cílem byl návrh a implementace aplikace realizující API rozhraní, která bude umožňovat efektivní sběr logů napříč celou počítačovou infrastrukturou. V teoretické části student popisuje platformu SIEM a dále záznamové soubory, kde se zabývá jejich strukturou, zdroji a také standardy, které jsou používány. Následuje popis neuronových sítí, který je za mě v práci navíc vzhledem k tomu, že výsledná aplikace má pouze data pro tyto sítě připravit a nebylo teda potřeba přesně popisovat, jak tyto sítě fungují. Poté už se student zabýval analýzou a porovnáním tří typů řešení, které je možné pro aplikaci využít. Následně student popsal experimentální pracoviště a jeho vlastní implementaci API rozhraní v Pythonu, které s využitím nástroje Logstash umožňuje sběr různých typů logů. Aplikace také umožňuje práci v různých režimech, které student porovnává s ohledem na následnou efektivitu při zpracování logů neuronovou sítí. Tímto považuji cíle bakalářské práce za splněné. Zdrojové kódy implementace jsou přehledně rozděleny a vhodně dokumentovány jak komentáři přímo v kódu, tak i návodem na spuštění, který srozumitelně popisuje všechny potřebné kroky. Z formální stránky je práce na vysoké úrovni a oceňuji velké množství obrázků a výpisu, díky kterým je práce velmi přehledná. Práci navrhuji k obhajobě s hodnocením A (97 bodů).

Navrhovaná známka
A
Body
97

Otázky

eVSKP id 151240