Rozšíření nástroje DomainRadar pro detekci škodlivých doménových jmen na základě obsahu webové stránky

Mazhirinov, Alisher

Rozšíření nástroje DomainRadar pro detekci škodlivých doménových jmen na základě obsahu webové stránky

Files

final-thesis.pdf (4.25 MB)

review_162580.html (10.66 KB)

Authors

Mazhirinov, Alisher

Advisor

Hranický, Radek

Referee

Setinský, Jiří

Mark

C

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

Abstract

Tato bakalářská práce pojednává o metodách detekce phishingových, škodlivých a benigních domén na základě analýzy textového obsahu jejich webových stránek. Hlavní důraz je kladen na využití TF-IDF (Term Frequency - Inverse Document Frequency), metody, která umožňuje určit význam slov v dokumentech na základě jejich frekvence v textu a inverzní frekvence v celém datovém korpusu. Studie ukazuje, že obsah webových stránek obsahuje užitečné textové prvky, které lze použít k automatické klasifikaci domén. Na základě těchto vlastností byly vyvinuty a natrénovány modely klasifikátorů, které dosáhly přesností téměř 90% oba. Použití TF-IDF v kombinaci s metodami strojového učení umožňuje efektivně identifikovat phishing a škodlivé zdroje a také je odlišit od bezpečných domén. Výsledky potvrzují vysoký přínos analýzy textu při řešení problémů kybernetické bezpečnosti a lze je využít k vytvoření automatizovaných systémů pro monitorování a ochranu uživatelů na internetu.
This thesis discusses methods for detecting phishing, malicious, and benign domains based on the analysis of the text content of their webpages. The main focus is on the use of TF-IDF (Term Frequency - Inverse Document Frequency), a method that allows determining the significance of words in documents based on their frequency in the text and inverse frequency in the entire data corpus. The study shows that the content of web pages contains useful text features that can be used to automatically classify domains. Based on these features, two classifier models were developed, trained and achieved accuracies of almost 90% for both The use of TF-IDF in combination with machine learning methods allows you to effectively identify phishing and malicious resources, as well as distinguish them from benign domains. The results confirm the high benefit of text analysis in solving cybersecurity problems and can be used to create automated systems for monitoring and protecting users on the internet.

Citation

MAZHIRINOV, A. Rozšíření nástroje DomainRadar pro detekci škodlivých doménových jmen na základě obsahu webové stránky [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Language of document

en

Study field

Informační technologie

Comittee

doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Jan Pluskal, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen)

Date of acceptance

2025-06-19

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Result of defence

práce byla úspěšně obhájena

URI

http://hdl.handle.net/11012/254346

Collections

2025

Citace PRO

Full item page

Rozšíření nástroje DomainRadar pro detekci škodlivých doménových jmen na základě obsahu webové stránky

Files

Date

Authors

Advisor

Referee

Mark

Journal Title

Journal ISSN

Volume Title

Publisher

ORCID

Abstract

Description

Keywords

Citation

Document type

Document version

Date of access to the full text

Language of document

Study field

Comittee

Date of acceptance

Defence

Result of defence

DOI

URI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO