Detekce škodlivých webových stránek pomocí strojového učení

but.committeedoc. Dr. Ing. Petr Hanáček (předseda) prof. Ing. Martin Drahanský, Ph.D. (místopředseda) doc. Ing. Radim Burget, Ph.D. (člen) doc. Ing. Vladimír Drábek, CSc. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " B ". Otázky u obhajoby: Jaké jste u webových stránek, resp. Java script kódu z nich, využíval labelování - pouze malicious/benign, nebo více kategorií ? Popište přesněji (např. schématem) vektorizaci na vstupu LSTM. Komentujte, zda bylo pro všechny dokumenty možné extrahovat všechny parametry, nebo jste některé musel pokládat za "missing features".cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBeneš, Karelen
dc.contributor.authorŠulák, Ladislaven
dc.contributor.refereeČernocký, Janen
dc.date.created2018cs
dc.description.abstractTáto práca sa zaoberá problematikou škodlivého kódu na webe so zameraním na analýzu a detekciu škodlivého JavaScriptu umiestneného na strane klienta s využitím strojového učenia. Navrhnutý prístup využíva známe i nové pozorovania s ohľadom na rozdiely medzi škodlivými a legitímnymi vzorkami. Tento prístup má potenciál detekovať nové exploity i zero-day útoky. Systém pre takúto detekciu bol implementovaný a využíva modely strojového učenia. Výkon modelov bol evaluovaný pomocou F1-skóre na základe niekoľkých experimentov. Použitie rozhodovacích stromov sa podľa experimentov ukázalo ako najefektívnejšia možnosť. Najefektívnejším modelom sa ukázal byť Adaboost klasifikátor s dosiahnutým F1-skóre až 99.16 %. Tento model pracoval s 200 inštanciami randomizovaného rozhodovacieho stromu založeného na algoritme Extra-Trees. Viacvrstvový perceptrón bol druhým najlepším modelom s dosiahnutým F1-skóre 97.94 %.en
dc.description.abstractThis thesis deals with the problem of web-based malware focusing on the analysis and detection of malicious JavaScript placed on the client side using machine learning techniques.Proposed approach benefits from both known and new observations regarding differencesbetween malicious and benign samples. Such approach has a potential to detect brand newexploits and zero-day attacks. System for such detection has been implemented using multiple machine learning models. Performance of the models has been evaluated with F1-scoreby executing multiple experiments. According to the experiments, the application of decision tree classifiers was the most effective option. The most effective model was Adaboostclassifier which reached F1-score up to 99.16 %. This model worked with 200 instances ofrandomized decision tree based on Extra-Trees algorithm. Multi-layer Perceptron was thesecond-best model with achieved F1-score up to 97.94 %.cs
dc.description.markBcs
dc.identifier.citationŠULÁK, L. Detekce škodlivých webových stránek pomocí strojového učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.cs
dc.identifier.other114656cs
dc.identifier.urihttp://hdl.handle.net/11012/84973
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectškodlivý softwareen
dc.subjectdrive-by-downloaden
dc.subjectdetekcia škodlivých URLen
dc.subjectškodlivý JavaScripten
dc.subjectstrojové učenieen
dc.subjectstatická analýyaen
dc.subjectwebové hrozbyen
dc.subjecthlboké učenieen
dc.subjectmalwarecs
dc.subjectdrive-by-downloadcs
dc.subjectmalicious URL detectioncs
dc.subjectmalicious JavaScriptcs
dc.subjectmachine learningcs
dc.subjectstatic analysiscs
dc.subjectweb-based threatscs
dc.subjectdeep learningcs
dc.titleDetekce škodlivých webových stránek pomocí strojového učeníen
dc.title.alternativeDetection of Malicious Websites using Machine Learningcs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2018-06-20cs
dcterms.modified2020-05-10-16:13:14cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid114656en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:27:42en
sync.item.modts2025.01.15 16:59:33en
thesis.disciplineBezpečnost informačních technologiícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.44 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-20487_v.pdf
Size:
86.09 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-20487_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-20487_o.pdf
Size:
87.62 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-20487_o.pdf
Loading...
Thumbnail Image
Name:
review_114656.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
file review_114656.html
Collections