Rozšíření nástroje DomainRadar pro detekci škodlivých doménových jmen na základě obsahu webové stránky

but.committeedoc. Ing. Petr Matoušek, Ph.D., M.A. (předseda) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Jan Pluskal, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHranický, Radeken
dc.contributor.authorMazhirinov, Alisheren
dc.contributor.refereeSetinský, Jiříen
dc.date.created2025cs
dc.description.abstractTato bakalářská práce pojednává o metodách detekce phishingových, škodlivých a benigních domén na základě analýzy textového obsahu jejich webových stránek. Hlavní důraz je kladen na využití TF-IDF (Term Frequency - Inverse Document Frequency), metody, která umožňuje určit význam slov v dokumentech na základě jejich frekvence v textu a inverzní frekvence v celém datovém korpusu. Studie ukazuje, že obsah webových stránek obsahuje užitečné textové prvky, které lze použít k automatické klasifikaci domén. Na základě těchto vlastností byly vyvinuty a natrénovány modely klasifikátorů, které dosáhly přesností téměř 90% oba. Použití TF-IDF v kombinaci s metodami strojového učení umožňuje efektivně identifikovat phishing a škodlivé zdroje a také je odlišit od bezpečných domén. Výsledky potvrzují vysoký přínos analýzy textu při řešení problémů kybernetické bezpečnosti a lze je využít k vytvoření automatizovaných systémů pro monitorování a ochranu uživatelů na internetu.en
dc.description.abstractThis thesis discusses methods for detecting phishing, malicious, and benign domains based on the analysis of the text content of their webpages. The main focus is on the use of TF-IDF (Term Frequency - Inverse Document Frequency), a method that allows determining the significance of words in documents based on their frequency in the text and inverse frequency in the entire data corpus. The study shows that the content of web pages contains useful text features that can be used to automatically classify domains. Based on these features, two classifier models were developed, trained and achieved accuracies of almost 90% for both The use of TF-IDF in combination with machine learning methods allows you to effectively identify phishing and malicious resources, as well as distinguish them from benign domains. The results confirm the high benefit of text analysis in solving cybersecurity problems and can be used to create automated systems for monitoring and protecting users on the internet.cs
dc.description.markCcs
dc.identifier.citationMAZHIRINOV, A. Rozšíření nástroje DomainRadar pro detekci škodlivých doménových jmen na základě obsahu webové stránky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other162580cs
dc.identifier.urihttp://hdl.handle.net/11012/254346
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectTF-IDFen
dc.subjectklasifikace textuen
dc.subjectstrojové učeníen
dc.subjectdetekce phishinguen
dc.subjectdetekce malwaruen
dc.subjectbezpečné webyen
dc.subjectanalýza obsahu webuen
dc.subjectextrakce znakůen
dc.subjectklasifikace dokumentůen
dc.subjectautomatický klasifikátoren
dc.subjectanalýza webových stráneken
dc.subjectklasifikace doménen
dc.subjectdatová sada.en
dc.subjectTF-IDFcs
dc.subjecttext classificationcs
dc.subjectmachine learningcs
dc.subjectphishing detectioncs
dc.subjectmalware detectioncs
dc.subjectbenign websitescs
dc.subjectweb content analysiscs
dc.subjectfeature extractioncs
dc.subjectdocument classificationcs
dc.subjectautomatic classifiercs
dc.subjectweb page analysiscs
dc.subjectdomain classificationcs
dc.subjectdata set.cs
dc.titleRozšíření nástroje DomainRadar pro detekci škodlivých doménových jmen na základě obsahu webové stránkyen
dc.title.alternativeDomainRadar Extension for Malicious Domain Name Detection using Web Page Contentscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-19cs
dcterms.modified2025-06-19-16:01:36cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid162580en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:58:52en
sync.item.modts2025.08.26 20:18:06en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
4.25 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_162580.html
Size:
10.66 KB
Format:
Hypertext Markup Language
Description:
file review_162580.html

Collections