Efektivní rozsáhlý sběr informací o doménových jménech

but.committeedoc. Ing. Richard Růžička, Ph.D., MBA (předseda) prof. Ing. Tomáš Vojnar, Ph.D. (člen) Ing. Tomáš Milet, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen) Ing. Jaroslav Dytrych, Ph.D. (člen) doc. Ing. Lukáš Burget, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných, např. ohledně propustnosti z pohledu počtu zpracovaných DNS jmen za sekundu či možností zrychlení prostřednictvím využití cache paměti. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázkyrozhodla práci hodnotit stupněm A - výborně.cs
but.jazykangličtina (English)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHranický, Radeken
dc.contributor.authorOndryáš, Ondřejen
dc.contributor.refereeJeřábek, Kamilen
dc.date.created2024cs
dc.description.abstractTato práce představuje programové řešení poskytující rychlý sběr dat a extrakci příznaků pro účely detekce škodlivých doménových jmen s využitím strojového učení. Představuje výzkumný projekt FETA DomainRadar, jehož cílem je vývoj systému pro vyhodnocování škodlivosti doménových jmen. Pojednává o různých zdrojích informací, které se v této úloze osvědčily. Upřesňuje návrh tohoto systému a prezentuje jeho klíčovou část pro sběr a zpracování dat, kterou lze použít pro pro vyhodnocování doménových jmen zachycených v reálném čase v sítích s velkým provozem, ale také pro efektivní sestavování rozsáhlých trénovacích datových sad. Systém na bázi platformy Apache Kafka je navržen tak, aby umožňoval nasazení v distribuovaném prostředí, a byl tak horizontálně škálovatelný. Provedené experimenty ukazují významný nárůst propustnosti systému při kooperaci několika instancí. Systém zvládl nasbírat data z osmi externích zdrojů pro 400 000 doménových jmen přibližně za 4 hodiny, čímž dosáhl průměrné propustnosti 28 doménových jmen za sekundu. Poté byl nasazen v akademické síti CESNET, kde bez obtíží sbíral a zpracovával data pro 9,56 doménových jmen za sekundu.en
dc.description.abstractThis thesis presents a software solution that provides fast data collection and feature extraction for the purpose of detecting malicious domain names using machine learning. It introduces the FETA DomainRadar research project targeted at developing a system for assessing domain name maliciousness. It discusses various sources of information that proved helpful for the task. It elaborates the system's design and presents its crucial component for collecting and processing data that can be used to evaluate domain names captured in monitored high-traffic networks in real time and to build large training datasets effectively. Based on Apache Kafka, the system is designed to allow horizontal scalability in distributed deployments, with experiments showing massive improvements in throughput when multiple instances cooperate. The system collected data from eight external sources for 400,000 domain names in about 4 hours, reaching the average throughput of 28 domain names per second. It was deployed in the CESNET academic network, where it steadily collected and processed data at 9.56 domain names per second.cs
dc.description.markAcs
dc.identifier.citationONDRYÁŠ, O. Efektivní rozsáhlý sběr informací o doménových jménech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.cs
dc.identifier.other154543cs
dc.identifier.urihttp://hdl.handle.net/11012/249598
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdoménové jménoen
dc.subjectDNSen
dc.subjectWHOISen
dc.subjectRDAPen
dc.subjectIPen
dc.subjectTLSen
dc.subjectcertifikátyen
dc.subjectreputační systémyen
dc.subjectNERDen
dc.subjectvelká dataen
dc.subjectsběr daten
dc.subjectApache Kafkaen
dc.subjectKafka Streamsen
dc.subjectdistribuované výpočtyen
dc.subjectphishingen
dc.subjectškodlivý obsahen
dc.subjectklasifikaceen
dc.subjectdetekceen
dc.subjectextrakce příznakůen
dc.subjectdomain namecs
dc.subjectDNScs
dc.subjectWHOIScs
dc.subjectRDAPcs
dc.subjectIPcs
dc.subjectTLScs
dc.subjectcertificatescs
dc.subjectreputation systemscs
dc.subjectNERDcs
dc.subjectbig datacs
dc.subjectdata collectioncs
dc.subjectApache Kafkacs
dc.subjectKafka Streamscs
dc.subjectdistributed computationcs
dc.subjectphishingcs
dc.subjectmalwarecs
dc.subjectclassificationcs
dc.subjectdetectioncs
dc.subjectfeature extractioncs
dc.titleEfektivní rozsáhlý sběr informací o doménových jménechen
dc.title.alternativeEfficient Large-scale Collection of Information Related to Domain Namescs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2024-08-28cs
dcterms.modified2024-08-28-12:22:39cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid154543en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:38:36en
sync.item.modts2025.01.15 20:17:07en
thesis.disciplinePočítačové sítěcs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
14.68 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_154543.html
Size:
10.98 KB
Format:
Hypertext Markup Language
Description:
file review_154543.html
Collections