Aplikace metody učení bez učitele na hledání podobných grafů
but.committee | prof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda) doc. RNDr. Jitka Kreslíková, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Mgr. Lukáš Holík, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen) Ing. Libor Polčák, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: V technické zprávě uvádíte, že dostupná data byla rozdělena na trénovací, testovací a validační datovou sadu. Jak přesně byly využity jednotlivé datové sady při tvorbě samoučících systémů? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie a umělá inteligence | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Křivka, Zbyněk | cs |
dc.contributor.author | Sabo, Jozef | cs |
dc.contributor.referee | Burgetová, Ivana | cs |
dc.date.created | 2021 | cs |
dc.description.abstract | Cieľom tejto diplomovej práce bolo v spolupráci s firmou Avast navrhnúť systém, ktorý dokáže dolovať znalosti z databázy grafov pomocou metód učenia bez učiteľa. Grafy, určené pre dolovanie, popisujú chovanie počítačových systémov a do databázy prichádzajú anonymne od používateľov softvérových produktov firmy. Grafom v databáze je možné priradiť jednu z dvoch tried: čistý graf alebo malware (škodlivý) graf. Úlohou navrhnutého samoučiacieho systému je nad grafovou databázou nájsť zhluky grafov, v ktorých sa triedy grafov nemiešajú. Zhluky grafov, v ktorých sa nachádza iba jedna trieda grafov, sa dajú interpretovať ako rôzne typy čistých alebo malware grafov a sú užitočným zdrojom ďalších analýz nad grafmi. Pre ohodnotenie kvality zhlukov bola navrhnutá vlastná metrika pomenovaná ako jednofarebnosť. Metrika hodnotí kvalitu zhlukov na základe toho ako veľmi sa v zhlukoch miešajú čisté a malware grafy. Najlepšie výsledky metrika dosiahla, keď boli vektorové reprezentácie grafov vytvorené modelom hlbokého učenia (variačným grafovým autoenkodérom s dvomi relačnými grafovými konvolučnými operátormi) a pre zhlukovanie nad vektormi bola použitá bezparametrická metóda MeanShift. | cs |
dc.description.abstract | Goal of this master's thesis was in cooperation with the company Avast to design a system, which can extract knowledge from a database of graphs. Graphs, used for data mining, describe behaviour of computer systems and they are anonymously inserted into the company's database from systems of the company's products users. Each graph in the database can be assigned with one of two labels: clean or malware (malicious) graph. The task of the proposed self-learning system is to find clusters of graphs in the graph database, in which the classes of graphs do not mix. Graph clusters with only one class of graphs can be interpreted as different types of clean or malware graphs and they are a useful source of further analysis on the graphs. To evaluate the quality of the clusters, a custom metric, named as monochromaticity, was designed. The metric evaluates the quality of the clusters based on how much clean and malware graphs are mixed in the clusters. The best results of the metric were obtained when vector representations of graphs were created by a deep learning model (variational graph autoencoder with two relation graph convolution operators) and the parameterless method MeanShift was used for clustering over vectors. | en |
dc.description.mark | C | cs |
dc.identifier.citation | SABO, J. Aplikace metody učení bez učitele na hledání podobných grafů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021. | cs |
dc.identifier.other | 136765 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/200141 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | graf | cs |
dc.subject | Avast | cs |
dc.subject | učenie bez učiteľa | cs |
dc.subject | zhlukovanie | cs |
dc.subject | detekcia komunít | cs |
dc.subject | vektorové reprezentácie uzlov | cs |
dc.subject | vektorové reprezentácie grafov | cs |
dc.subject | grafové neurónové siete | cs |
dc.subject | graph | en |
dc.subject | Avast | en |
dc.subject | unsupervised learning | en |
dc.subject | clustering | en |
dc.subject | communities detection | en |
dc.subject | node embeddings | en |
dc.subject | graph embeddings | en |
dc.subject | graph neural networks | en |
dc.title | Aplikace metody učení bez učitele na hledání podobných grafů | cs |
dc.title.alternative | Application of Unsupervised Learning Methods in Graph Similarity Search | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2021-06-23 | cs |
dcterms.modified | 2021-06-24-11:35:09 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 136765 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:33:13 | en |
sync.item.modts | 2025.01.15 19:51:23 | en |
thesis.discipline | Vývoj aplikací | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.12 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-23791_v.pdf
- Size:
- 86.07 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-23791_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-23791_o.pdf
- Size:
- 89.52 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-23791_o.pdf
Loading...
- Name:
- review_136765.html
- Size:
- 1.46 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_136765.html