BALÁŽ, M. Přenesení extraktorů nástroje Plaso na platformu Apache Spark [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Rychlý, Marek

Student řešil práci se zaujetím, samostatně a aktivně, a své řešení průběžně konzultoval. Přístup studenta k řešení považuji za nadstandardní a navrhuji hodnotit práci stupněm velmi dobře (B) .

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem práce bylo umožnit a ověřit možnosti využítí nástroje pro extrakci dat Plaso v distribuovaném zpracování dat nad platformou Apache Spark. S výsledky jsem spokojen, student dle mého názoru navrhl vhodný způsob integrace zdrojů dat a extraktorů komplexního systému Plaso v úlohách Spark a úspěšně ověřil a změřil použitelnost řešení. Výsledek je možné využít pro další výzkum v oblasti forenzní analýzy dat.
Práce s literaturou Student samostatně vyhledal a nastudoval větší množství relevantní literatury. Ocěňuji zejména snahu se seznámit i s plaformami distribuovaného uložení a zpracování dat, které nebyly přímo vyžadovány v zadání (např. Ceph, Apache Flink aj.).
Aktivita během řešení, konzultace, komunikace Práce byla průběžně konzultována a student chodil na konzultace dobře připraven a s návrhy možných řešení případných problémů. Všechny termíny byly dodrženy.
Aktivita při dokončování Práce byla dokončena včas a technická zpráva i programové řešení byly konzultovány. Mé připomínky student řádně zapracoval.
Publikační činnost, ocenění Bez publikací či ocenění avšak s publikačním potenciálem. Programové řešení bylo zveřejněno jako open-source.
Navrhovaná známka
B
Body
85

Posudek oponenta

Burget, Radek

Ačkoliv technická zpráva je v některých aspektech poněkud nevyrovnaná a mám některé dílčí připomínky, v teoretické části je velmi detailně zpracována a celkově pan Baláž podle mého názoru předvedl výbornou inženýrskou práci. Detailně prostudoval poměrně složité existující řešení v podobě nástroje Plaso  a dostupné platformy pro zpracování velkých dat a navrhl technicky kvalitně zvládnuté řešení, které otestoval a zhodnotil. Přikláním se proto k hodnocení stupněm A.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Zadání předpokládalo z mého pohledu rozsáhlejší studium dvou rozdílných poměrně rozsáhlých oblastí: Bylo nutné se důkladně seznámit jak s architekturou a implementací nástroje Plaso a souvisejícími principy digitální forenzní analýzy, tak i s platformami pro distribuované zpracování rozsáhlých dat.
Rozsah splnění požadavků zadání Zadání považuji za splněné bez výhrad.
Rozsah technické zprávy Rozsah technické zprávy odpovídá rozmezí obvyklému pro diplomovou práci.
Prezentační úroveň technické zprávy 80 Technická zpráva obsahuje rozsáhlou a velmi detailně zpracovanou část věnovanou studiu související problematiky zahrnující forenzní analýzu i distribuované výpočetní platformy. O poznání stručnější je však kapitola zabývající se návrhem vlastního řešení. Zde postrádám zejména analýzu řešeného problému a formulaci konkrétních cílů, text bez varování přechází přímo k diagramům tříd a vysvětlování detailů řešení, aniž by bylo jasné, co tím autor sleduje. Na druhou stranu všechny potřebné informace jsou nakonec v práci obsaženy, většina detailů je vyjasněna v kapitole Implementace. Pozitivně hodnotím vyhodnocení výkonnosti vytvořeného řešení a experimenty s možnostmi jeho optimalizace.
Formální úprava technické zprávy 76 Po jazykové práce je práce kvalitní, rušivě působí jen častý anglický slovosled (např. "kompatibilita medzi HDFS súbormi a Plaso nástrojom"). Také k typografii mám jen drobné výhrady, zejména pokud jde o sazbu obrázků, které jsou velmi nesourodé pokud jde o rozlišení velikost písma.
Práce s literaturou 88 Seznam použité literatury je poměrně rozsáhlý, výběr zdrojů odpovídá tématu práce a jednotlivé zdroje jsou v práci pečlivě citovány.
Realizační výstup 96 Realizačním výstupem je rozšíření existujícího nástroje Plaso o třídy umožňující jeho integraci s platformami Apache Hadoop a Spark a podpůrné nástroje pro import vstupních dat, řízení procesu analýzy  a generování výsledků. Vytvořené řešení je technicky velmi pěkně navrženo i implementováno a autor rovněž velmi dobře zvládl experimentální ověření jeho funkčnosti a vyhodnocení výkonnosti.
Využitelnost výsledků Dosažené výsledky mohou být využity v dalším výzkumu v oblasti digitální forenzní analýzy nejen na FIT.
Navrhovaná známka
A
Body
90

Otázky

eVSKP id 140537