Optimalizace klasifikačních modelů pro detekci maligních domén
but.committee | doc. Dr. Ing. Petr Hanáček (předseda) doc. Ing. Michal Bidlo, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) prof. Ing. Tomáš Hruška, CSc. (člen) Mgr. Kamil Malinka, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie a umělá inteligence | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hranický, Radek | en |
dc.contributor.author | Pouč, Petr | en |
dc.contributor.referee | Jeřábek, Kamil | en |
dc.date.created | 2024 | cs |
dc.description.abstract | Tato diplomová práce se zaměřuje na rozvoj pokročilých metod pro detekci škodlivých doménových jmen s využitím optimalizačních technik v oblasti strojového učení. Práce zkoumá a hodnotí účinnost různých optimalizačních strategií pro klasifikaci. Jako nástroje pro hodnocení jsem vybral klasifikační algoritmy, které se liší v jejich přístupu, včetně hlubokého učení, techniky rozhodovacích stromů, nebo hledání hyperrovin. Tyto metody byly posouzeny na základě schopnosti efektivně klasifikovat doménová jména v závislosti na použitých optimalizačních technikách. Optimalizace zahrnovala vytvoření přesně označených datových sad, aplikaci technik zpracování dat, pokročilou selekci atributů, řešení nerovnováhy tříd a ladění hyperparametrů. Experimentální část práce prokazuje vynikající úspěšnost kombinováním jednotlivých metod. Přičemž nejlepší modely CNN dosahovaly až 0.9926 F1 při současném snížení FPR na hodnotu 0.300%. Přínos práce spočívá v poskytnutí konkrétních metod a strategií pro efektivní detekci škodlivých doménových jmen v oblasti kybernetické bezpečnosti. | en |
dc.description.abstract | This thesis focuses on the development of advanced methods for malicious domain name detection using optimization techniques in machine learning. The thesis investigates and evaluates the effectiveness of different optimization strategies for classification. As evaluation tools, I selected classification algorithms that differ in their approach, including deep learning, decision tree techniques, or hyperplane search. These methods are investigated in terms of their ability to effectively classify domain names depending on the implemented optimization techniques. Optimization strategies include the creation of ground-truth datasets, application of data processing methods, advanced feature selection, solving the class imbalance problem, and hyperparameter tuning. The final part of the paper presents a detailed analysis of the benefits of each optimization approach. The experimental part of the study demonstrates exceptional results by combining several methodologies. The top CNN models obtained up to 0.9926 F1 while lowering FPR to 0.3%. The contribution of this study is to provide specific methodologies and tactics for the successful identification of malicious domain names in the cybersecurity area. | cs |
dc.description.mark | C | cs |
dc.identifier.citation | POUČ, P. Optimalizace klasifikačních modelů pro detekci maligních domén [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 154617 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/248995 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Optimalizace | en |
dc.subject | Klasifikace | en |
dc.subject | Extrakce příznaků | en |
dc.subject | Strojové učení | en |
dc.subject | Projekt FETA | en |
dc.subject | Ladění hyperparametrů | en |
dc.subject | Malware | en |
dc.subject | Phishing | en |
dc.subject | Kybernetická bezpečnost | en |
dc.subject | Ground-truth | en |
dc.subject | Nerovnováha tříd | en |
dc.subject | Zpracování dat | en |
dc.subject | Virus Total | en |
dc.subject | Verifikace domén | en |
dc.subject | Optimization | cs |
dc.subject | Classification | cs |
dc.subject | Feature Engineering | cs |
dc.subject | Machine Learning | cs |
dc.subject | FETA Project | cs |
dc.subject | Hyperparameter Tuning | cs |
dc.subject | Malware | cs |
dc.subject | Phishing | cs |
dc.subject | Cybersecurity | cs |
dc.subject | Ground-truth | cs |
dc.subject | Imbalance handling | cs |
dc.subject | Data processing | cs |
dc.subject | Virus Total | cs |
dc.subject | Domain verification | cs |
dc.title | Optimalizace klasifikačních modelů pro detekci maligních domén | en |
dc.title.alternative | Optimization of Classification Models for Malicious Domain Detection | cs |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2024-06-20 | cs |
dcterms.modified | 2024-06-20-11:26:58 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 154617 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:38:29 | en |
sync.item.modts | 2025.01.15 14:37:56 | en |
thesis.discipline | Kybernetická bezpečnost | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |