SEDLÁK, M. Distribuovaný nástroj pro extrakci informace ze síťových toků [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Žádník, Martin

Student se aktivně práci věnoval během celého školního roku. Rovněž prokázal samostatnost při řešení problému. Výsledek jeho práce bude uplatněn v produkčním nástroji. Vzhledem k tomu hodnotím práci studenta známkou A.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Diplomová práce navazuje na open-source nástroj IPFIXcol2. Cílem práce bylo navrhnout a implementovat knihovnu pro efektivní práci s dat o IP tocích. Zadání tak patří svým rozsahem k obtížnějším.
Práce s literaturou Student vyhledal relevantní zdroje, které využil pro řešení diplomové práce.
Aktivita během řešení, konzultace, komunikace Student byl aktivní po dobu celého roku, řešení práce průběžně konzultoval a na konzultace byl dobře připraven.
Aktivita při dokončování Obsah práce byl jak v průběhu tak i při dokončování dostatečně a včas konzultován.
Publikační činnost, ocenění Výsledek diplomové práce bude zveřejněn jako open-source součást kolektoru IPFIXcol2.
Navrhovaná známka
A
Body
90

Posudek oponenta

Grégr, Matěj

Diplomová práce představuje nástroj fdsdump, který umožňuje dotazování se nad daty uložených kolektorem IPFIXcol2. V rámci práce je prezentováno, že nástroj fdsdump je kompletně vytvořen v rámci této práce, ale z analýzy kódu vyplývá, že práce rozšiřuje nástroj fdsdump vytvořený Ing. Hutákem. Myslím si, že by v práci mělo být podrobněji diskutováno, jakou funkcionalitu měl nástroj před započetím této práce a k jakým konkrétním rozšířením v rámci práce došlo. Podrobněji by mohlo být také diskutováno testování a ověření korektnosti. Výsledný nástroj považuji za dále v praxi využitelný. Práci celkově hodnotím jako dobrou (C).

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Práce si klade za cíl vytvořit nástroj, který bude možné použít pro extrakci NetFlow/IPFIX záznamů z kolektoru IPFIXcol2 s důrazem na paralelizaci a efektivitu získávání dat. Optimalizace zaměřené na výkonnost a paralelizaci je obecně složité udělat správně. Z tohoto důvodu považuji zadání práce za obtížnější. 
Rozsah splnění požadavků zadání Zadání považuji obecně za splněné. Výhrady mám zejména k provedenému testování, které, zejména při distribuované variantě, považuji za nedostatečné. Chybí mi také výkonnostní srovnání s dalšími systémy, které zpracovávají NetFlow data. Možná rozšíření (bod 6) nejsou v práci příliš diskutována.
Rozsah technické zprávy
Prezentační úroveň technické zprávy 80 Práce je rozumně strukturovaná a kapitoly na sebe navazují.  Pro lepší pochopení dosažených výsledků by bylo ale vhodné rozšířit kapitolu testování. 
Formální úprava technické zprávy 70 K jazykové stránce práce nemám příliš výhrady. Práce je čitelná, bez větších gramatických prohřešků. Typograficky je práce kvalitní. Výhrady mám ale k obrázkům 3.3, 4.8 a 4.9 které, dle mého názoru, není nutné prezentovat na kompletně prázdné stránce.
Práce s literaturou 90 K práci s literaturou nemám výhrady. Práce cituje relevantní zdroje dle obvyklých zvyklostí.
Realizační výstup 60 Práce představuje nástroj fdsdump, který má být určen k paralelnímu zpracování IPFIX dat ve formátu používaném kolektorem IPFIXcol2. Zásadní problém vidím v tom, že dle zdrojových kódů byl tento nástroj vyvíjen již v předchozí práci Ing. Hutákem. Práce tedy staví na již vytvořeném nástroji, ale v práci to není nikterak zmíněno. Není také diskutován rozsah změn či funkcionality, která byla v nástroji fdsdump hotova před započetím práce. Z analýzy zdrojového kódu předpokládám, že došlo k vylepšení nástroje o zmíněné optimalizace (hastabulka, paralelizace výpočtu). Dle mého názoru by tyto informace měly být zmíněny v samotné práci. Ocenil bych také podrobnější kapitolu testování a verifikace. V rámci ověření korektnosti práce představuje pouze krátkou sekci 5.13, bez konkrétních výstupů. Chybí mi ověření, zda algoritmus pro agregaci položek dává korektní výsledky. Stejně tak postrádám jakékoliv výkonnostní porovnání s jinými kolektory.  
Využitelnost výsledků Výsledný vytvořený nástroj považuji za dále v praxi využitelný pro analýzu dat uložených kolektorem IPFIXcol2. V práci je zmíněno, že je nástroj již používán v praxi v projektech sdruzeni CESNET.
Navrhovaná známka
C
Body
70

Otázky

eVSKP id 148639