Shluková analýza šífrovaného provozu
Loading...
Date
Authors
Vorontsov, Mykola
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Zvyšující se využívání šifrovacích protokolů, jako je QUIC, zlepšuje bezpečnost, ale ztěžuje analýzu síťového provozu kvůli absenci datových náplní. Tato práce zkoumá využití metod učení bez učitele, zejména shlukovacích algoritmů, k analýze šifrovaných síťových toků pomocí základních atributů exportovaných přes IPFIX. Algoritmy K-Means a HDBSCAN jsou testovány na datasetu CESNET-QUIC22 a hodnoceny pomocí metrik homogenity a normalizované vzájemné informace. Bhattacharyyova vzdálenost slouží k posouzení oddělitelnosti tříd. Výsledky ukazují, že shlukování umožňuje identifikaci vzorců provozu i v šifrovaném prostředí a nabízí praktické využití pro klasifikaci a detekci anomálií.
The increasing use of encryption protocols like QUIC enhances Internet security but complicates network traffic analysis by removing access to payload data. This thesis explores unsupervised machine learning, focusing on clustering algorithms, to group encrypted network flows using basic flow-level features exported via IPFIX. K-Means and HDBSCAN are applied to the CESNET-QUIC22 dataset and evaluated using homogeneity and normalized mutual information. The Bhattacharyya distance is used to assess class separability. Results show that clustering can reveal meaningful traffic patterns and application groups, offering practical methods for encrypted traffic classification and anomaly detection.
The increasing use of encryption protocols like QUIC enhances Internet security but complicates network traffic analysis by removing access to payload data. This thesis explores unsupervised machine learning, focusing on clustering algorithms, to group encrypted network flows using basic flow-level features exported via IPFIX. K-Means and HDBSCAN are applied to the CESNET-QUIC22 dataset and evaluated using homogeneity and normalized mutual information. The Bhattacharyya distance is used to assess class separability. Results show that clustering can reveal meaningful traffic patterns and application groups, offering practical methods for encrypted traffic classification and anomaly detection.
Description
Keywords
Šifrovaný síťový provoz , shluková analýza , učení bez učitele , analýza síťového provozu na základě toků , K-Means , HDBSCAN , protokol QUIC , ipfixprobe , dataset CESNET-QUIC22 , inženýrství atributů , statistická analýza , Bhattacharyyova vzdálenost , složitost klasifikace , shlukování síťových toků , detekce anomálií , identifikace aplikací , klasifikace provozu. , Encrypted network traffic , cluster analysis , unsupervised learning , flow-based traffic analysis , K-Means , HDBSCAN , QUIC protocol , ipfixprobe , CESNET-QUIC22 dataset , feature engineering , statistical analysis , Bhattacharyya distance , classification complexity , network flow clustering , anomaly detection , application fingerprinting , traffic classification.
Citation
VORONTSOV, M. Shluková analýza šífrovaného provozu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda)
Ing. Bohuslav Křena, Ph.D. (člen)
Ing. Jan Pluskal, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)
Ing. Jiří Matoušek, Ph.D. (člen)
Date of acceptance
2025-06-19
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.
Result of defence
práce byla úspěšně obhájena
