Datové sady pro síťovou bezpečnost

but.committeedoc. Dr. Ing. Petr Hanáček (předseda) prof. RNDr. Alexandr Meduna, CSc. (člen) doc. Ing. Jiří Jaroš, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) Ing. Ondřej Kanich, Ph.D. (člen) Mgr. Ing. Pavel Očenášek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykčeština (Czech)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorTisovčík, Petercs
dc.contributor.authorSetinský, Jiřícs
dc.contributor.refereeHranický, Radekcs
dc.date.accessioned2023-07-17T08:06:55Z
dc.date.available2023-07-17T08:06:55Z
dc.date.created2023cs
dc.description.abstractV oblasti síťové bezpečnosti se používají techniky strojového učení pro efektivní detekci anomálií a malwaru v síťovém provozu. Pro natrénování síťového klasifikátoru s vysokou úspěšností je potřeba kvalitní datová sada. Cílem práce je modifikace datové sady pomocí metod strojového učení za účelem zlepšení kvality datové sady, která povede na natrénování modelu s vyšší úspěšností. Datová sada je zanalyzována shlukovacím algoritmem a každý shluk je charakterizován statistickým popisem vyplývající z atributů vstupní datové sady. Statistický popis spolu s informacemi o původním klasifikátoru je použit pro výpočet skóre. Skóre slouží jako váha při modifikační fázi. Shluková analýza umožní vyfiltrovat data, která jsou důležitá pro natrénování výsledného modelu. Navržený přístup umožňuje zmírnit redundanci datové sady a nebo ji rozšířit o chybějící data. Výsledkem je modifikační framework, který je schopen redukovat datové sady nebo provádět jejich agregaci za účelem vytvoření kompaktní datové sady, která bude reflektovat aktuální síťový provoz. Na vytvořených datových sadách se podařilo natrénovat modely dosahující vyšší úspěšnosti v porovnání s existujícím řešením.cs
dc.description.abstractIn network security, machine learning techniques are used to effectively detect anomalies and malware in network traffic. A quality dataset is needed to train a network classifier with high accuracy. The aim of this paper is to modify the dataset using machine learning techniques to improve the quality of the dataset which will lead to training the model with a higher accuracy. The dataset is analyzed by a clustering algorithm and each cluster is characterized by a statistical description resulting from the attributes of the input dataset. The statistical description along with the information of the original classifier is used to compute the score. The score serves as a weight in the modification phase. Cluster analysis allows to filter out the data that are important for training the final model. The proposed approach allows us to mitigate the redundancy of the dataset or to augment it with missing data. The result is a modification framework that is able to reduce the datasets or perform their aggregation in order to create a compact dataset that reflects the actual network traffic. Models were trained on the created datasets and achieved higher accuracy compared to the existing solution.en
dc.description.markAcs
dc.identifier.citationSETINSKÝ, J. Datové sady pro síťovou bezpečnost [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other148469cs
dc.identifier.urihttp://hdl.handle.net/11012/211954
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectShlukovánícs
dc.subjectDatové sadycs
dc.subjectSíťová bezpečnostcs
dc.subjectStrojové učenícs
dc.subjectKvalita datové sadycs
dc.subjectAugumentace datcs
dc.subjectRedukce datcs
dc.subjectDGAcs
dc.subjectDoHcs
dc.subjectModifikace datcs
dc.subjectÚspěšnost modelucs
dc.subjectClusteringen
dc.subjectDatasetsen
dc.subjectNetwork securityen
dc.subjectMachine learningen
dc.subjectQuality of dataseten
dc.subjectData augmentationen
dc.subjectData reductionen
dc.subjectDGAen
dc.subjectDoHen
dc.subjectData modificationen
dc.subjectModel accuracyen
dc.titleDatové sady pro síťovou bezpečnostcs
dc.title.alternativeData Sets for Network Securityen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2023-06-22cs
dcterms.modified2023-06-22-10:22:32cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid148469en
sync.item.dbtypeZPen
sync.item.insts2023.07.17 10:06:55en
sync.item.modts2023.07.17 09:31:47en
thesis.disciplineKybernetická bezpečnostcs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačových systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.51 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_148469.html
Size:
11.83 KB
Format:
Hypertext Markup Language
Description:
review_148469.html
Collections