Nástroj pro optimalizaci neuronových sítí pomocí rozšíření záznamů bezpečnostních událostí

Loading...
Thumbnail Image

Date

Authors

Masárová, Tereza

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

S rastúcou zložitosťou moderných sietí a informačných systémov sa zvyšuje aj množstvo záznamov generovaných týmito zariadeniami, ktoré sú nepretržito zhromažďované a analyzované s cieľom odhaľovať hrozby a chrániť pred kybernetickými útokmi. Cieľom tejto bakalárskej práce je návrh a implementácia nástroja na rozšírenie bezpečnostných logov, ktoré slúžia na tréning neurónových sietí a zlepšuje ich generalizačné schopnosti. Teoretická časť sa zameriava na analýzu aktuálneho stavu v oblasti bezpečnostného monitoringu, technológie logovania a využitie techník umelej inteligencie pre bezpečnostný monitoring. Rieši problematiku kategorizácie logov, moderných metód augmentácie textových údajov a ich aplikáciu na zvýšenie kvality a variability dát. Počas analýzy aktuálneho stavu bolo identifikovaných a preskúmaných viac ako 50 odborných článkov a publikácií zaoberajúcich sa textovou augmentáciou, ktoré boli neskôr realizované v rámci vývoja nástroja. Praktická časť zahŕňa návrh, implementáciu a experimentálne testovanie nástroja, ktorý umožní rozšírenie bezpečnostných logov generovaných rôznymi technológiami s cieľom zvýšiť efektivitu trénovania neurónových sietí. V rámci návrhu bola definovaná architektúra nástroja, identifikované typy dát vhodné na augmentáciu a vybrané vhodné knižnice na generovanie údajov. Nástroj umožňuje vytvárať nové logové záznamy prostredníctvom 75 generátorov využívajúcich moderných knižníc na generovanie syntetických dát a textových súborov na ktoré sa aplikuje 24 rôznych techník textovej augmentácie. Následne bol nástroj otestovaný na množine modelov neurónových sietí, kde sa sledoval vplyv augmentovaných dát na zlepšenie presnosti a generalizačných schopností.
With the increasing complexity of modern networks and information systems, the volume of records generated by devices is also growing. These records are continuously collected and analyzed to detect threats and protect against cyberattacks. The aim of this bachelor’s thesis is to design and implement a tool for augmenting security logs used to train neural networks, thereby improving their generalization capabilities. The theoretical part focuses on analyzing the current state of security monitoring, logging technologies, and the use of artificial intelligence techniques in security monitoring. It addresses the challenges of log categorization, modern methods of text data augmentation, and their application to enhance the quality and variability of data. During the analysis phase, more than 50 scientific articles and publications related to text augmentation were identified and studied, serving as the foundation for the tool's development. The practical part includes the design, implementation, and experimental testing of a tool that enables the augmentation of security logs generated by various technologies, with the goal of increasing the efficiency of neural network training. As part of the design, the tool's architecture was defined, data types suitable for augmentation were identified, and appropriate libraries for data generation were selected. The tool allows for the creation of new log records using 75 generators that leverage modern libraries for generating synthetic data and text files, which are further enhanced using 24 different text augmentation techniques. Subsequently, the tool was tested on a set of neural network models to evaluate the impact of augmented data on improving accuracy and generalization performance.

Description

Citation

MASÁROVÁ, T. Nástroj pro optimalizaci neuronových sítí pomocí rozšíření záznamů bezpečnostních událostí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

sk

Study field

bez specializace

Comittee

doc. Ing. Jan Jeřábek, Ph.D. (předseda) JUDr. Ing. František Kasl, Ph.D. (místopředseda) Ing. Eva Holasová (člen) Ing. Michal Skořepa, Ph.D. (člen) Ing. Adrián Tomašov, Ph.D. (člen) RNDr. Ing. Pavel Šeda, Ph.D. (člen)

Date of acceptance

2025-06-17

Defence

Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Stručně popište model, na kterém probíhala validace augmentačního nástroje. Studentka obhájila bakalářskou práci a odpověděla na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO