POLÓNI, P. Detekce phishingových stránek pomocí metod strojového učení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Student nejen splnil zadání, ale také nad jeho rámec implemetoval rozšíření pro webové prohlížeče, které staví na vytvořeném klasifikátoru. Oceňuji, že student vyzkoušel více klasifikačních metod a nakonec použil kombinaci tří nejlepších. Zohledňuji také skutečnost, že student postupoval takříkajíc "od nuly," kdy si vše, včetně obsáhlé sady trénovacích a testovacích dat, vytvořil svépomocí. Navrhuji hodnocení "A".
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Práce souvisí s řešeným projektem MV ČR FETA. Cílem bylo vytvořit klasifikátor pro detekci phishingových stránek. Zadání považuji za splněné v plném rozsahu. Na rozdíl od přístupu na bázi doménových jmen, který byl zkoumán v rámci projektu FETA, šel student vlastní cestou a zaměřil se na klasfikaci URL na základě obsahu HTML/DOM zkoumané stránky. Nad rámec zadání student také implementoval rozšíření pro webové prohlížeče, které vytvořený klasifikátor využívá. Zadání hodnotím jako náročnější, neboť vyžadovalo nemalé úsilí a také studium problematiky, která se na FIT na bakalářském studiu nevyučuje. | ||
Práce s literaturou | Student využil doporučené literatury a další relevantní zdroje si samostatně dohledal. Výběr literárních pramenů je relevantní řešenému tématu. Rozsah bibliografie je na bakalářskou práci nadprůměrný. | ||
Aktivita během řešení, konzultace, komunikace | Student byl během řešení aktivní, dohodnuté termíny dodržoval a na schůzky docházel připraven. Na konci zimního semestru měl hotovu nejen kompletní datovou sadu, ale také první funkční klasifikátor. V letním semestru pak klasifikátor dále vylepšoval a zahrnul jej do rozšíření pro detekci phishingu, které vytvořil. | ||
Aktivita při dokončování | Práce byla dokončena ve výrazném předstihu a její definitivní obsah byl se mnou důkladně konzultován. Mé připomínky student následně zapracoval. | ||
Publikační činnost, ocenění | Student zveřejnil výsledky své práce (klasifikátor + rozšíření) na portálu GitHub: https://github.com/PeterPoloni/phishingWebExt |
Student odvedl hodně práce. Připravil systém pro sběr dat zahrnující obsahy webových stránek. Data nasbíral a zanalyzoval. Na základě odborné literatury navrhl příznaky, které vyhodnotil v binární klasifikační úloze. Přestože jsou zde některé drobné nedostatky, práci hodnotím kladně.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Zadání bylo průměrně obtížné. Student potřeboval nasbírat větší množství dat a systematicky je zpracovat. Přitom musel současně nastudovat metody strojového učení a jejich aplikaci pro detekci phishingu. | ||
Rozsah splnění požadavků zadání | Zadání bylo splněno. Student dále rozšířil práci o praktické nasazení v podobě doplňku do prohlížeče, které využívá vyvinuté metody. | ||
Rozsah technické zprávy | Práce má přes 90 normostran, je informačně bohatá. | ||
Prezentační úroveň technické zprávy | 100 | Práce je dobře strukturovaná a prezentuje množství informací, které jsou prezentovány skrz množství diagramů, schémat a grafů. | |
Formální úprava technické zprávy | 85 | Jazyková i typografická stránka práce je až na drobnosti v pořádku. Student v práci používá Figures pro zobrazování rovnic, což na některých místech (např. str. 30 nebo str. 44) nepůsobí dobře. | |
Práce s literaturou | 75 | Student kromě odborných publikací využívá také větší množství internetových zdrojů, namísto původních odborných pramenů. | |
Realizační výstup | 100 | Realizační výstup je na dobré úrovni. Student dodal kód, který je nasaditelný, je vyhodnocený, zadání rozšířil o praktický doplněk do prohlížeče, využívající jeho řešení. | |
Využitelnost výsledků | Student demonstrativně ukázal metody, práce je využitelná, nasaditelná a použitelná. |
eVSKP id 153621