VORONTSOV, M. Shluková analýza šífrovaného provozu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Student zadání splnil. Byl průměrně aktivní. Porozumněl doméně, ve které se problém řešil, i metodologii shlukování. S větším úsilím a časovou dotací věřím, že by práci dotáhl do mnohem pěknější podoby. Proto navrhuji hodnocení C.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Zadání bylo náročnější, výzkumného charakteru. Student musel nastudovat oblast analýzy síťového provozu a shlukování. Zadání považuji za splněné. | ||
| Práce s literaturou | Student si literaturu vyhledával a konzultoval. | ||
| Aktivita během řešení, konzultace, komunikace | Aktivita během řešení byla větší až v letním semestru. Nicméně, student komunikoval a když bylo co konzultovat, tak konzultoval. | ||
| Aktivita při dokončování | Největší část práce se stihla v časovém tlaku při dokončování. Student dostal zpětnou vazbu na části finálního textu. | ||
| Publikační činnost, ocenění | Výsledky nebyly publikovány. Zadání považuji za jedno s publikačním potenciálem, nicméně některé důležité navržené/konzultované experimenty se v rámci práce nestihly. |
Bakalářská práce se věnuje aktuálnímu tématu shlukové analýzy šifrovaného síťového provozu. Autor prokázal schopnost práce s literaturou, analýzy reálných dat, návrhu a realizace metodiky i kritického zhodnocení výsledků. Práce je logicky strukturovaná, srozumitelně psaná a formálně bezchybná. Oceňuji důkladnou explorativní analýzu a systematický experimentální přístup. Přestože shlukování celého datasetu bylo náročné, dílčí výsledky ukazují částečnou použitelnost metod. Chybí mi více propracovaná diskuze či experimenty podkládající využitelnost výsledků. Práce splňuje požadavky na bakalářskou úroveň.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | Zadané téma mělo střední úroveň náročnosti. Požadovaný rozsah práce byl odpovídající zvolenému tématu a obsahoval potřebné prvky pro splnění zadání. Úkoly byly jasně stanovené, ale jejich realizace vyžadovala samostatnou práci a analytické myšlení. | ||
| Rozsah splnění požadavků zadání | Student částečně splnil požadavky zadání. Hlavní cíle byly dosaženy, ale některé dílčí úkoly nebyly plně rozvinuty nebo podrobně zpracovány. Přesto však student projevil schopnost orientovat se v problematice a aplikovat teoretické znalosti. | ||
| Rozsah technické zprávy | Hlavní text práce čítá 39 stran. Dle app.fit.vut.cz/normostrany práce vychází na 51 normostran. Rozsah je pod hranicí obvyklého rozmezí. | ||
| Prezentační úroveň technické zprávy | 89 | Práce má jasnou a logickou strukturu, která postupuje od teoretického úvodu, přes detailní explorativní analýzu dat, k návrhu vlastní metodiky, jejím experimentálním ověření až po závěrečné shrnutí. Jednotlivé kapitoly na sebe plynule a logicky navazují. Text je srozumitelný a dobře čitelný. Teoretická část poskytuje potřebný kontext pro pochopení problematiky. Praktická část s popisem experimentů je detailní. Práce je vhodně doplněna grafickými prvky a tabulkami, které efektivně ilustrují popisovanou problematiku a dosažené výsledky. | |
| Formální úprava technické zprávy | 85 | Práce je vysázena kvalitně. Formátování textu, nadpisů, odstavců, rovnic a seznamů je konzistentní v celé práci. Obrázky a tabulky jsou čitelné, mají jasné popisky a jsou v textu správně odkazovány. Jazyková stránka (angličtina) je na dobré úrovni, text je gramaticky správný a stylisticky odpovídá odborné práci, s minimem překlepů. | |
| Práce s literaturou | 85 | Autor pracuje s 19 literárními prameny, což zahrnuje relevantní RFC dokumenty, odborné články z konferencí a časopisů, a odkazy na datasety a softwarové knihovny. Výběr pramenů je relevantní k tématu práce (analýza síťového provozu, QUIC, shlukovací algoritmy, evaluace). Převzaté myšlenky a výsledky jsou v textu řádně označeny odkazy na literaturu. Citační etika je dodržena. | |
| Realizační výstup | 75 | Realizačním výstupem je implementace a evaluace shlukovacích metod (K-Means, HDBSCAN) pro analýzu šifrovaného síťového provozu. Validace a verifikace řešení probíhá pomocí zavedených metrik kvality shlukování (homogenita, NMI) a vizualizace (t-SNE, kontingenční matice). Funkčnost řešení je demonstrována prostřednictvím experimentů na reálném datasetu CESNET-QUIC22. Autor využil jazyk Python a standardní knihovny (Scikit-learn, pandas, matplotlib). | |
| Využitelnost výsledků | Práce má experimentální charakter a rozšiřuje poznatky o aplikovatelnosti shlukovacích algoritmů na moderní typ šifrovaného provozu. Ukazuje, že i bez přístupu k payloadu lze pomocí flow-level příznaků dosáhnout smysluplného shlukování, ale pouze pro menší, dobře definované sady aplikací. Pro výšší využitelnost by chtělo provést více experimentů a lépe definovat, které sady aplikací lze v prostoru příznaků oddělit. |
eVSKP id 165124