Classification of Potentially Malicious File Clusters via Machine Learning

but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Michal Bidlo, Ph.D. (člen) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Na základě čeho byly voleny hodnoty hyperparametrů u metody Random forest? V závěru uvádíte, že z experimentů vyplynulo, že klasifikace malware na úrovni shluků souborů typu PE, APK a .NET je možná s nižší přesností než při klasickém použití úrovně souborů. O jak velký rozdíl se jedná a jakou výhodou je vyvážen?cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimíren
dc.contributor.authorHolop, Patriken
dc.contributor.refereeZendulka, Jaroslaven
dc.date.accessioned2022-06-11T22:53:49Z
dc.date.available2022-06-12cs
dc.date.available2022-06-11T22:53:49Z
dc.date.created2019cs
dc.description.abstractTáto práca navrhuje alternatívu súčasných metód klasifikácie malvéru na úrovni súborov, ktoré sú často založené na detekcii špecifických postupností bytov v daných súboroch. Experimentáciou bolo potvrdené, že je možné klasifikovať potenciálnu hrozbu aj na úrovni zoskupení súborov založenej na spoločných vlastnostiach súborov v danom zoskupení. To bolo dosiahnuté dôkladným výberom vlastností troch typov súborov - PE, APK a .NET. Porovnaním niekoľkých metód strojového učenia boli vybraté klasifikátory s najvyššou presnosťou a implementovaná webová služba poskytujúca API pre klasifikáciu, ktoré bolo použité pre integráciu s interným systémom spoločnosti Avast zodpovedného za tvorbu súborových zoskupení. Táto práca taktiež diskutuje možné nedostatky a navrhuje kroky pre zlepšenie dosiahnutej presnosti klasifikácie.en
dc.description.abstractThis thesis proposes an alternative to currently used malware classification approaches on the file-level often based on the detection of specific byte sequences. The experimentation proved that a cluster-level classification based on the shared properties of files in the cluster is possible. That was achieved by a careful selection of the properties of the three file types - PE, APK and .NET. By comparing various machine learning methods the highest scoring classifiers were selected and a web service providing API for classification was implemented, which was used for the integration with the internal clustering system of the Avast company. This thesis also discusses drawbacks of the proposed  approach and suggests steps for improving the classification.cs
dc.description.markAcs
dc.identifier.citationHOLOP, P. Classification of Potentially Malicious File Clusters via Machine Learning [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.cs
dc.identifier.other122120cs
dc.identifier.urihttp://hdl.handle.net/11012/180236
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsPřístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/letcs
dc.subjectstrojové učenieen
dc.subjectzhlukovanieen
dc.subjectklasifikáciaen
dc.subjectantivírusen
dc.subjectanalýzaen
dc.subjectmalvéren
dc.subjectmachine learningcs
dc.subjectclusteringcs
dc.subjectclassificationcs
dc.subjectantiviruscs
dc.subjectanalysiscs
dc.subjectmalwarecs
dc.titleClassification of Potentially Malicious File Clusters via Machine Learningen
dc.title.alternativeClassification of Potentially Malicious File Clusters via Machine Learningcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2019-06-12cs
dcterms.modified2019-07-08-13:31:29cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid122120en
sync.item.dbtypeZPen
sync.item.insts2022.06.12 00:53:49en
sync.item.modts2022.06.12 00:13:26en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-21927_v.pdf
Size:
85.51 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-21927_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-21927_o.pdf
Size:
87.52 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-21927_o.pdf
Loading...
Thumbnail Image
Name:
review_122120.html
Size:
1.47 KB
Format:
Hypertext Markup Language
Description:
review_122120.html
Collections