Vytvoření a analýza datové sady TLS komunikace
Loading...
Date
Authors
Dvořák, Tomáš
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato práce se zabývá vývojem automatizačního nástroje pro sběr dat ze šifrovaného síťového provozu a jejich následnou analýzu. Pro izolaci jednotlivých aplikací a zajištění reprodukovatelnosti síťového prostředí bylo využito prostředí Microsoft Sandbox. Vyvinutý nástroj, implementovaný v jazyce Python, umožňuje simulaci uživatelské činnosti za účelem vytvoření kvalitnější datové sady. Pro ověření kvality získaných dat byla provedena analýza pomocí statistických metod a metod strojového učení, konkrétně učení bez učitele (shluková analýza) a učení s učitelem (Random Forest). Hlavním výstupem práce je funkční nástroj pro sběr dat, výsledná datová sada a výsledky analýz potvrzující efektivitu a kvalitu nástroje.
This thesis focuses on the development of an automation tool for collecting data from encrypted network traffic and conducting subsequent analysis. Microsoft Sandbox was used to isolate individual applications and ensure reproducibility of the network environment. The developed tool, implemented in Python, simulates user activity to generate a higher-quality dataset. To verify the quality of the collected data, statistical analysis and machine learning methods were applied, specifically unsupervised learning (cluster analysis) and supervised learning (Random Forest). The main outcomes of the work are a functional data collection tool, the resulting dataset, and analysis results confirming the effectiveness and reliability of the tool.
This thesis focuses on the development of an automation tool for collecting data from encrypted network traffic and conducting subsequent analysis. Microsoft Sandbox was used to isolate individual applications and ensure reproducibility of the network environment. The developed tool, implemented in Python, simulates user activity to generate a higher-quality dataset. To verify the quality of the collected data, statistical analysis and machine learning methods were applied, specifically unsupervised learning (cluster analysis) and supervised learning (Random Forest). The main outcomes of the work are a functional data collection tool, the resulting dataset, and analysis results confirming the effectiveness and reliability of the tool.
Description
Keywords
TLS , SSL , značky , značkování , otisk , otisky , komunikace , síťová komunikace , šifrovaná komunikace , analýza , analýza komunikace , síť , automatizace , automatizační nástroj , izolace aplikací , izolované prostředí , Windows Sandbox , shlukování , shluková analýza , statistika , statistická analýza , TLS , SSL , fingerprint , fingerprinting , communication , network communication , cyphered communication , analysis , network analysis , network , automation , automation tool , isolation of application , isolated enviroment , Windows Sandbox , clustering , clustering analysis , statistics , statistical analysis
Citation
DVOŘÁK, T. Vytvoření a analýza datové sady TLS komunikace [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Počítačové sítě
Comittee
doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda)
prof. Ing. Tomáš Hruška, CSc. (člen)
Ing. Ondřej Lengál, Ph.D. (člen)
doc. Ing. Ondřej Ryšavý, Ph.D. (člen)
Ing. Martin Hrubý, Ph.D. (člen)
Ing. Vojtěch Mrázek, Ph.D. (člen)
Date of acceptance
2025-06-24
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných, např. formátu datové sady použité pro experimenty či způsobu práce s anotací PCAP dat. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C - dobře.
Result of defence
práce byla úspěšně obhájena
