Nástroj pro anonymizaci záznamů bezpečnostních událostí pro aplikování technik umělé inteligence
Loading...
Date
Authors
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Systémy SIEM zohrávajú v rámci bezpečnostného monitoringu zásadnú úlohu. Zozbierané záznamy agregujú, normalizujú a filtrujú, čo predstavuje základ pre aplikovanie techník dolovania dát. Týmto spôsobom SIEMy prezentujú výborný zdroj veľkých objemov normalizovaných dát. Tieto dáta nesú potenciál pre dosiahnutie pokroku v bezpečnostnom výskume, dolovaní dát a umelej inteligencii, kde môžu viesť k zlepšeniu existujúcich metód prieskumu, sprehľadneniu skenovania siete a odhaleniu sofistikovanejších vektorov útoku. Avšak jedným z hlavných problémov pre využívanie týchto dát je skutočnosť, že dáta v logových záznamoch sú v mnohých prípadoch citlivé a môžu predstavovať riziko z hľadiska bezpečnosti. Z toho dôvodu bol vytvorený nástroj pre anonymizáciu citlivých údajov v logových záznamoch, ktorý zachováva korelácie medzi dátami. Hlavným cieľom bakalárskej práce je zamerať sa na technické a právne aspekty spracovania logov a anonymizáciu pre umelú inteligenciu. V rámci výskumu bola vykonaná analýza najčastejšie sa vyskytujúcich dát v logoch spolu s vyhodnotením ich rizikovosti, výsledkom čoho je vytvorenie kategórií dát vzhľadom na ich citlivosť. V práci je ďalej prezentovaná analýza súčasných SIEM systémov spolu s meta kľúčmi, ktoré využívajú.
SIEM systems play a fundamental role in security monitoring. They aggregate, normalise, and filter the collected event records, which presents core tasks for applying data mining techniques. In this way, SIEMs present a great source of large amounts of normalised data. These data carry potential for achieving progress in security research, data mining, and artificial intelligence, where they could improve existing methods of investigation, make the scanning of network traffic more clear, and detect more sophisticated vectors of attack. However, one of the main problems for the use of these data is the fact that the data contained in log files are in many cases sensitive and could pose a risk to security. Due to this, the processing, as well as sharing of the data, is restricted by legislation. Considering everything that has been mentioned above, a tool for anonymization of sensitive data in log files, which works along with persisting the correlations among data was developed. The main aim of the bachelor thesis is to focus on the technical and legal level of log processing and anonymization for AI. Within the research, the analysis of the most frequently occurring data in the log files and their risk assessment was performed, resulting in the creation of categories of data, based on their sensitivity. In the work, an analysis of the present SIEM systems along with the meta keys they use is performed.
SIEM systems play a fundamental role in security monitoring. They aggregate, normalise, and filter the collected event records, which presents core tasks for applying data mining techniques. In this way, SIEMs present a great source of large amounts of normalised data. These data carry potential for achieving progress in security research, data mining, and artificial intelligence, where they could improve existing methods of investigation, make the scanning of network traffic more clear, and detect more sophisticated vectors of attack. However, one of the main problems for the use of these data is the fact that the data contained in log files are in many cases sensitive and could pose a risk to security. Due to this, the processing, as well as sharing of the data, is restricted by legislation. Considering everything that has been mentioned above, a tool for anonymization of sensitive data in log files, which works along with persisting the correlations among data was developed. The main aim of the bachelor thesis is to focus on the technical and legal level of log processing and anonymization for AI. Within the research, the analysis of the most frequently occurring data in the log files and their risk assessment was performed, resulting in the creation of categories of data, based on their sensitivity. In the work, an analysis of the present SIEM systems along with the meta keys they use is performed.
Description
Keywords
Anonymizácia, AI, Cyberlaw, GDPR, Hlboké učenie, Logové záznamy, Neurónové siete, NDA, NLP, Pseudonymizácia, SIEM, Umelá inteligencia., Anonymisation, Artificial Intelligence, AI, Cyberlaw, Deep Learning, GDPR, Log Records, Neural Network, Natural Language Processing, NDA, NLP, Pseudonymisation, SIEM.
Citation
ŠŤASTNÁ, A. Nástroj pro anonymizaci záznamů bezpečnostních událostí pro aplikování technik umělé inteligence [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
bez specializace
Comittee
doc. Ing. Jiří Hošek, Ph.D. (předseda)
JUDr. MgA. Jakub Míšek, Ph.D. (místopředseda)
Ing. Marek Sikora (člen)
Ing. Ľubomír Mráz (člen)
Ing. Michal Moravec (člen)
Ing. Karel Kuchař (člen)
Date of acceptance
2023-06-13
Defence
Studentka prezentovala výsledky své práce a komise byla seznámena s posudky.
Studentka obhájila bakalářskou práci a odpověděla na otázky členů komise a oponenta.
Otázky oponenta:
Jakým způsobem může uživatel hromadně ověřit, zda-li anonymizace byla úspěšná?
Jak lze ověřit zachování korelace mezi anonymizovanými záznamy událostí?
Proč si myslíte, že šifrování komunikace v rámci interního systému je “navíc”?
Jak by se daly vylepšit uvedené regulární výrazy? (Zaměřte se na IPv4 a MAC adresy.)
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení