Optimalizace heuristické analýzy spustitelných souborů

but.committeeprof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Dr. Ing. Pavel Zemčík, dr. h. c. (místopředseda) Ing. Bohuslav Křena, Ph.D. (člen) doc. Ing. Ondřej Ryšavý, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " B ". Otázky u obhajoby: Nebylo by možné využít pro klasifikaci metodu Multi-Naive Bayes nebo kombinaci více klasifikačních metod?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHruška, Tomášcs
dc.contributor.authorWiglasz, Michalcs
dc.contributor.refereeKřoustek, Jakubcs
dc.date.created2012cs
dc.description.abstractTato bakalářská práce byla vypracována v průběhu studijního pobytu na Universita della Svizzera italiana ve Švýcarsku. Tato práce popisuje implementaci klasifikačního nástroje pro detekci neznámého škodlivého softwaru, které by mohla nahradit současné řešení, založené na ručně určených vahách. Databáze použitá pro učení a testování byla poskytnuta antivirovou a bezpečnostní společností AVG Technologies. Pět různých klasifikátorů bylo srovnáno za účelem nalezení nejvhodnější metody k implementaci: naivní bayesovský klasifikátor, rozhodovací stromy, algoritmus RandomForrest, neuronové sítě a support vector machine. Po několika experimentech byl vybrán naivní bayesovský klasifikátor. Implementovaná aplikace pokrývá všechny potřebné funkce: extrakci atributů, učení klasifikátoru a odhad jeho úspěšnosti a klasifikaci neznámých vzorků. Protože společnost AVG je ochotna tolerovat maximálně 1% falešně pozitivních klasifikací, úspěšnost implementovaného klasifikátoru je pouze 61,7 %, což je o méně než 1 % lepší než u současného řešení. Na druhou stranu, učící proces je plně automatizovaný a umožňuje rychlé přeučení (v průměru během 12 sekund pro 90 tisíc trénovacích vzorků.)cs
dc.description.abstractThis BSc Thesis was performed during a study stay at the Universita della Svizzera italiana, Swiss. This thesis describes the implementation of a classification tool for detection of unknown malware based on their behaviour which could replace current solution, based on manually chosen attributes'scores and a threshold. The database used for training and testing was provided by AVG Technologies company, which specializes in antivirus and security systems. Five different classifiers were compared in order to find the best one for implementation: Naive Bayes, a decision tree, RandomForrest, a neural net and a support vector machine. After series of experiments, the Naive Bayes classifier was selected. The implemented application covers all necessary steps: attribute extraction, training, estimation of the performance and classification of unknown samples. Because the company is willing to tolerate false positive rate of only 1% or less, the accuracy of the implemented classifier is only 61.7%, which is less than 1% better than the currently used approach. However it provides automation of the learning process and allows quick re-training (in average around 12 seconds for 90 thousand training samples).en
dc.description.markBcs
dc.identifier.citationWIGLASZ, M. Optimalizace heuristické analýzy spustitelných souborů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.cs
dc.identifier.other79153cs
dc.identifier.urihttp://hdl.handle.net/11012/55297
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectKlasifikacecs
dc.subjectdolování z datcs
dc.subjectstrojové učenícs
dc.subjectškodlivý softwarecs
dc.subjectantiviruscs
dc.subjectnaivní Bayescs
dc.subjectPython.cs
dc.subjectClassificationen
dc.subjectdata miningen
dc.subjectmachine learningen
dc.subjectmalicious softwareen
dc.subjectanti-virusen
dc.subjectNaive Bayesen
dc.subjectPython.en
dc.titleOptimalizace heuristické analýzy spustitelných souborůcs
dc.title.alternativeOptimization of Heuristic Analysis of Executable Filesen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2012-08-21cs
dcterms.modified2020-05-09-23:43:29cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79153en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 17:55:56en
sync.item.modts2025.01.15 23:59:05en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
720.25 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79153.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_79153.html
Collections