POUČ, P. Optimalizace klasifikačních modelů pro detekci maligních domén [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Hranický, Radek

Výsledky práce pana Pouče jsou přínosné a již nyní se používají v nástroji DomainRadar, který je vyvíjen na projektu FETA. Slabinou práce je struktura a prezentační úroveň technické zprávy, která má k dokonalosti daleko. Za běžných okolností bych práci hodnotil stupněm "C". S ohledem na vysoký přínos výsledků práce, silně nadprůměrnou aktivitu a publikační činnost, navrhuji hodnocení "B".

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Práce souvisí s projektem MV ČR FETA. Cílem bylo optimalizovat stávající klasifikátory maligních domén tak, aby došlo ke zvýšení jejich přesnosti, redukci falešně pozitivních výsledků apod. Téma bylo definováno poměrně volně a student si tak mohl sám zvolit způsob řešení. Pan Pouč korektně identifikoval problémy stávajících klasifikačních technik a navrhl hned několik způsobů optimalizace, které následně implementoval a experimentálně ověřil jejich přínos. Zadání považuji za splněné v plném rozsahu.
Práce s literaturou Student využil doporučené literatury a samostatně si dohledal mnoho dalších relevantních publikací. Celkově práce čítá 80 zdrojů, včetně řady seriózních vědeckých publikací.
Aktivita během řešení, konzultace, komunikace Aktivita studenta byla silně nadprůměrná. Na schůzky chodil připraven a termíny dodržoval bez větších obtíží. První přínosy práce byly hotovy již na konci zimního semestru, přičemž student v létě stávající postupy vylepšoval a zkoušel nové. V polovině akademického roku se pan Pouč navíc stal členem řešitelského týmu projektu FETA.
Aktivita při dokončování Práce byla dokončena v předstihu a byl tedy prostor ke konzultaci. Mé připomínky se týkaly především prezentační stránky a struktury práce, kdy autor nevhodně míchal teorii, existující stav a vlastní přínos. Velkou část připomínek naštěstí pan Pouč stihl zapracoval, ale bohužel ne všechny.
Publikační činnost, ocenění Pan Pouč zveřejnil zdrojové kódy realizačního výstupu své práce na portálu GitHub pod licencí MIT: https://github.com/surViVeCZ/Classification-Optimalization-Strategies Dále se jako spoluautor zapojil do tvorby odborného článku, který bude v brzké době poslán do vědeckého žurnálu Data in Brief.
Navrhovaná známka
B
Body
81

Posudek oponenta

Jeřábek, Kamil

Jedná se o složitější zadání, kdy student musel nastudovat danou problematiku a začlenit se do probíhající práce na výzkumném projektu. Student splnil zadání a byl schopen navrhnout, implementovat a ověřit postupy, které vylepší stávající řešení a bude možné na ně navázat v rámci projektu. Práce má praktický dopad. Textová část však velmi snižuje celkový dojem. Text je roztroušený, nelogicky spojený, objevují se v něm typografické i faktické chyby, nejasnosti a zbytečné pasáže. Práce na čtenáře působí zmatečně. Navrhuji známku D.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Jedná se o obtížnější zadání. Student musel nastudovat a zkombinovat problematiku síťové bezpečnosti, datové analýzy a strojového učení. Práce byla navíc vypracovávána v součinnosti s probíhajícím výzkumným projektem, do jehož soukolí se musel začlenit a navázat na existující práci a tu rozšířit.
Rozsah splnění požadavků zadání Zadání bylo splněno.
Rozsah technické zprávy Práce se pohybuje v horní oblasti rozmezí pro diplomovou práci.
Prezentační úroveň technické zprávy 50 Jednotlivé celky práce na sebe částečně navazují. Avšak to jak na sebe navazují působí na čtenáře velmi zmatečně, spolu související informace jsou roztroušeny průběžně po celé práci a komplikují tak jejich pochopení. Autor se na toto zřejmě snažil reagovat velkým množstvím vzájemného se odkazování na různé pasáže v textu. V práci chybí některé informace, nejsou dostatečně vysvětleny, nebo se zdají být spolu nesouvisející. Navíc se v práci objevují pasáže, které se zdají být naprosto zbytečné a přispívají ke zhoršené pochopitelnosti. V práci se objevují i faktické chyby.
Formální úprava technické zprávy 60 Práce je psána v anglickém jazyce, z jazykového hlediska je kvalita práce s drobnými výhradami v pořádku, nicméně je zde vidět rozdíl mezi první a zhoršenou kvalitou druhé části. V práci se vyskytují opakující se typografické chyby.
Práce s literaturou 65 Práce cituje hojné množství vědecké a odborné zdroje a spoustu online zdrojů z různých blogů a tutoriálů, které se však jeví jako relevantní pro téma práce. Některé odborné citované zdroje, zvláště uváděné v porovnání se jeví vzdáleně relevantní pro práci, řeší sice podobný problém, avšak nad jinými daty, což přidává na celkovém dojmu zmatenosti celé práce.
Realizační výstup 70 Výsledné programové řešení dosahuje adektvátní úrovně. Student při osobní schůzce demonstroval své řešení a byl schopen reagovat na všechny dotazy. Na získané výsledky je možné navázat a budou začleněny do softwarového výstupu v rámci probíhajícího grantu. Z technické dokumentace však není vždy zřejmé, zdali jsou prezentované výsledky porovnatelné a korektní. Například v závěru práce se objevují grafy zobrazující přesnosti nad trénovací částí datasetu a hodnoty se jeví jako ty, které jsou porovnávány.
Využitelnost výsledků Práce byla tvořena v rámci probíhajícího výzkumného projektu na fakultě. Na výsledky této práce je možné navázat a použít je k vylepšení výsledného řešení.
Navrhovaná známka
D
Body
61

Otázky

eVSKP id 154617