Optimalizace heuristické analýzy spustitelných souborů

Wiglasz, Michal

Optimalizace heuristické analýzy spustitelných souborů

but.committee	prof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Dr. Ing. Pavel Zemčík, dr. h. c. (místopředseda) Ing. Bohuslav Křena, Ph.D. (člen) doc. Ing. Ondřej Ryšavý, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " B ". Otázky u obhajoby: Nebylo by možné využít pro klasifikaci metodu Multi-Naive Bayes nebo kombinaci více klasifikačních metod?	cs
but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Hruška, Tomáš	cs
dc.contributor.author	Wiglasz, Michal	cs
dc.contributor.referee	Křoustek, Jakub	cs
dc.date.created	2012	cs
dc.description.abstract	Tato bakalářská práce byla vypracována v průběhu studijního pobytu na Universita della Svizzera italiana ve Švýcarsku. Tato práce popisuje implementaci klasifikačního nástroje pro detekci neznámého škodlivého softwaru, které by mohla nahradit současné řešení, založené na ručně určených vahách. Databáze použitá pro učení a testování byla poskytnuta antivirovou a bezpečnostní společností AVG Technologies. Pět různých klasifikátorů bylo srovnáno za účelem nalezení nejvhodnější metody k implementaci: naivní bayesovský klasifikátor, rozhodovací stromy, algoritmus RandomForrest, neuronové sítě a support vector machine. Po několika experimentech byl vybrán naivní bayesovský klasifikátor. Implementovaná aplikace pokrývá všechny potřebné funkce: extrakci atributů, učení klasifikátoru a odhad jeho úspěšnosti a klasifikaci neznámých vzorků. Protože společnost AVG je ochotna tolerovat maximálně 1% falešně pozitivních klasifikací, úspěšnost implementovaného klasifikátoru je pouze 61,7 %, což je o méně než 1 % lepší než u současného řešení. Na druhou stranu, učící proces je plně automatizovaný a umožňuje rychlé přeučení (v průměru během 12 sekund pro 90 tisíc trénovacích vzorků.)	cs
dc.description.abstract	This BSc Thesis was performed during a study stay at the Universita della Svizzera italiana, Swiss. This thesis describes the implementation of a classification tool for detection of unknown malware based on their behaviour which could replace current solution, based on manually chosen attributes'scores and a threshold. The database used for training and testing was provided by AVG Technologies company, which specializes in antivirus and security systems. Five different classifiers were compared in order to find the best one for implementation: Naive Bayes, a decision tree, RandomForrest, a neural net and a support vector machine. After series of experiments, the Naive Bayes classifier was selected. The implemented application covers all necessary steps: attribute extraction, training, estimation of the performance and classification of unknown samples. Because the company is willing to tolerate false positive rate of only 1% or less, the accuracy of the implemented classifier is only 61.7%, which is less than 1% better than the currently used approach. However it provides automation of the learning process and allows quick re-training (in average around 12 seconds for 90 thousand training samples).	en
dc.description.mark	B	cs
dc.identifier.citation	WIGLASZ, M. Optimalizace heuristické analýzy spustitelných souborů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.	cs
dc.identifier.other	79153	cs
dc.identifier.uri	http://hdl.handle.net/11012/55297
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	Klasifikace	cs
dc.subject	dolování z dat	cs
dc.subject	strojové učení	cs
dc.subject	škodlivý software	cs
dc.subject	antivirus	cs
dc.subject	naivní Bayes	cs
dc.subject	Python.	cs
dc.subject	Classification	en
dc.subject	data mining	en
dc.subject	machine learning	en
dc.subject	malicious software	en
dc.subject	anti-virus	en
dc.subject	Naive Bayes	en
dc.subject	Python.	en
dc.title	Optimalizace heuristické analýzy spustitelných souborů	cs
dc.title.alternative	Optimization of Heuristic Analysis of Executable Files	en
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2012-08-21	cs
dcterms.modified	2020-05-09-23:43:29	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	79153	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.18 17:55:56	en
sync.item.modts	2025.01.15 23:59:05	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 720.25 KB
Format:: Adobe Portable Document Format
Description:: final-thesis.pdf

Download

Name:: review_79153.html
Size:: 1.45 KB
Format:: Hypertext Markup Language
Description:: file review_79153.html

Download

Collections

2012