Optimalizace heuristické analýzy spustitelných souborů
but.committee | prof. Ing. Lukáš Sekanina, Ph.D. (předseda) prof. Dr. Ing. Pavel Zemčík, dr. h. c. (místopředseda) Ing. Bohuslav Křena, Ph.D. (člen) doc. Ing. Ondřej Ryšavý, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " B ". Otázky u obhajoby: Nebylo by možné využít pro klasifikaci metodu Multi-Naive Bayes nebo kombinaci více klasifikačních metod? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hruška, Tomáš | cs |
dc.contributor.author | Wiglasz, Michal | cs |
dc.contributor.referee | Křoustek, Jakub | cs |
dc.date.created | 2012 | cs |
dc.description.abstract | Tato bakalářská práce byla vypracována v průběhu studijního pobytu na Universita della Svizzera italiana ve Švýcarsku. Tato práce popisuje implementaci klasifikačního nástroje pro detekci neznámého škodlivého softwaru, které by mohla nahradit současné řešení, založené na ručně určených vahách. Databáze použitá pro učení a testování byla poskytnuta antivirovou a bezpečnostní společností AVG Technologies. Pět různých klasifikátorů bylo srovnáno za účelem nalezení nejvhodnější metody k implementaci: naivní bayesovský klasifikátor, rozhodovací stromy, algoritmus RandomForrest, neuronové sítě a support vector machine. Po několika experimentech byl vybrán naivní bayesovský klasifikátor. Implementovaná aplikace pokrývá všechny potřebné funkce: extrakci atributů, učení klasifikátoru a odhad jeho úspěšnosti a klasifikaci neznámých vzorků. Protože společnost AVG je ochotna tolerovat maximálně 1% falešně pozitivních klasifikací, úspěšnost implementovaného klasifikátoru je pouze 61,7 %, což je o méně než 1 % lepší než u současného řešení. Na druhou stranu, učící proces je plně automatizovaný a umožňuje rychlé přeučení (v průměru během 12 sekund pro 90 tisíc trénovacích vzorků.) | cs |
dc.description.abstract | This BSc Thesis was performed during a study stay at the Universita della Svizzera italiana, Swiss. This thesis describes the implementation of a classification tool for detection of unknown malware based on their behaviour which could replace current solution, based on manually chosen attributes'scores and a threshold. The database used for training and testing was provided by AVG Technologies company, which specializes in antivirus and security systems. Five different classifiers were compared in order to find the best one for implementation: Naive Bayes, a decision tree, RandomForrest, a neural net and a support vector machine. After series of experiments, the Naive Bayes classifier was selected. The implemented application covers all necessary steps: attribute extraction, training, estimation of the performance and classification of unknown samples. Because the company is willing to tolerate false positive rate of only 1% or less, the accuracy of the implemented classifier is only 61.7%, which is less than 1% better than the currently used approach. However it provides automation of the learning process and allows quick re-training (in average around 12 seconds for 90 thousand training samples). | en |
dc.description.mark | B | cs |
dc.identifier.citation | WIGLASZ, M. Optimalizace heuristické analýzy spustitelných souborů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012. | cs |
dc.identifier.other | 79153 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/55297 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Klasifikace | cs |
dc.subject | dolování z dat | cs |
dc.subject | strojové učení | cs |
dc.subject | škodlivý software | cs |
dc.subject | antivirus | cs |
dc.subject | naivní Bayes | cs |
dc.subject | Python. | cs |
dc.subject | Classification | en |
dc.subject | data mining | en |
dc.subject | machine learning | en |
dc.subject | malicious software | en |
dc.subject | anti-virus | en |
dc.subject | Naive Bayes | en |
dc.subject | Python. | en |
dc.title | Optimalizace heuristické analýzy spustitelných souborů | cs |
dc.title.alternative | Optimization of Heuristic Analysis of Executable Files | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2012-08-21 | cs |
dcterms.modified | 2020-05-09-23:43:29 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 79153 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 17:55:56 | en |
sync.item.modts | 2025.01.15 23:59:05 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |