HRABOVSKÝ, J. Hledání slabých stránek Hyperscanu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Síč, Juraj

S prácou som spokojný, prehľad toho ako funguje Hyperscan bol kvalitne spracovaný a aj keď nástroj pre genovanie textu je zatiaľ skôr len v počiatočnej fáze, tak vzhľadom na náročnosť si myslím, že práca si zaslúži hodnotenie A .

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Tému považujem za náročnejšiu, bolo nutné si naštudovať komplexné matchovacie algoritmy, ktoré sú z veľkej časti nezdokumentované a na ich pochopenie trebalo prechádzať kód Hyperscanu. So zdokumentovaním týchto algoritmov som veľmi spokojný, myslím si, že sa bude dať použiť aj v iných projektoch. Navrhnutý nástroj na generovanie textu je zatiaľ len prototyp, ale vzhľadom k obtiažnosti a k tomu, že je to bakalarská práca si myslím, že je to dostatočný výstup práce.
Práce s literaturou Študent si materiál k práci vyhľadával skoro úplne samostatne. Používal vhodne zvolenú literatúru, ktorú kvalitne spracoval.
Aktivita během řešení, konzultace, komunikace Študent bol pri riešení aktívny, konzultácie sme mali pravidelne. Na konzultácie chodil pripravený.
Aktivita při dokončování Časť práce venovaná prehľadu algoritmov implementovaných v Hyperscane bola konzultovaná v dostatočnom predstihu. S časťou, ktorá sa venovala nástroju na generovanie textov, to bolo horšie, bola písaná na poslednú chvíľu.
Publikační činnost, ocenění Práca nebola publikovaná, ale je tu potenciál na kvalitný článok.
Navrhovaná známka
A
Body
90

Posudek oponenta

Vojnar, Tomáš

Přes výše uvedené nedostatky hodnotím práci stupněm B, a to s ohledem na vysokou náročnost zadání a na užitečnost výstupů práce pro další výzkum.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Obtížnost zadání hodnotím jako obzvlášť vysokou, protože zadání vyžadovalo pochopení velmi složitých algoritmů kombinujících pokročilé poznatky z teoretické informatiky s nízko-úrovňovým programováním, a to až na úrovni speciálních vektorových instrukcí. Konečně jednalo se o nastudování a zdokumentování principů, na kterých stojí v současnosti zřejmě světově nejvýkonnější nástroj pro vyhledávání dle regulárních výrazů HyperScan pocházející ze společnosti Intel, která do něj promítla mimo jiné i velmi hluboké znalosti pokročilých instrukcí svých procesorů. V některých případech bylo přitom nutno příslušné algoritmy nastudovat přímo ze zdrojového kódu, neboť nebyly nikdy předmětem publikace.  Vzhledem k tomu, že daná problematika mě velmi zajímá, nechal jsem si některé studentem nastudované přístupy použité v nástroji HyperScan osobně vysvětlit a musím konstatovat, že jsem se přitom dostal opakovaně na hranici svých mentálních kapacit.
Rozsah splnění požadavků zadání Práce zahrnovala nastudování a zdokumentování technik, které používá nástroj HyperScan, a dále implementaci nástroje, který by generoval texty, na kterých by HyperScan měl problémy při porovnávání se zadaným regulárním výrazem. Vytvořený nástroj měl být experimentálně vyhodnocen na vhodných regulárních výrazech a jeho schopnosti měly být srovnány s jinými generátory. Student se výrazně zaměřil zejména na studium a zdokumentování metod použitých v nástroji HyperScan. Implementoval rovněž požadovaných generátor problematických textů a vyhodnotil ho, i když vyhodnocení není příliš rozsáhlé. V práci tak ze zadání chybí pouze srovnání s jinými generátory. Tento nedostatek však považuji za nepodstatný vzhledem k tomu, že těžiště práce spatřuji právě v nastudování a zdokumentování metod používaných nástrojem HyperScan, které je velmi cenné pro další výzkum v této oblasti realizovaný ve skupině VeriFIT.
Rozsah technické zprávy Práce má obvyklý rozsah.
Prezentační úroveň technické zprávy 85 Práce má logickou strukturu,  jednotlivé části na sebe vhodně navazují. Části věnované popisu metod použitých v nástroji HyperScan jsou informačně bohaté. Části věnované vlastnímu generátoru problematických textů a zejména jeho vyhodnocení jsou kratší a mnohem méně informativní. Studentovi zde zřejmě již docházel dostupný čas. 
Formální úprava technické zprávy 80 Práce je psána anglicky, a to na solidní úrovni, byť s nezanedbatelným počtem drobnějších chyb. Typografická úroveň zprávy je velmi dobrá.
Práce s literaturou 95 Výběr studijních materiálů je velmi vhodný. Student prokázal schopnost nastudovat i velmi náročnou odbornou literaturu. Použité zdroje jsou patřičně citovány (byť na některých místech zůstaly v citacích chybové znaky).
Realizační výstup 80 Student implementoval požadovaný generátor textů problematických pro nástroj HyperScan. Jedná se evidentně o prototypové řešení a rovněž jeho vyhodnocení je minimalistické. Oceňuji nicméně, že se vůbec podařilo dosáhnout pozitivních výsledků, neboť nástroj HyperScan je opravdu velmi efektivní a je těžké vygenerovat texty, které jsou pro něj problematické.
Využitelnost výsledků Výsledky studentovy práce jsou dle mého názoru velmi užitečným materiálem pro další výzkum v oblasti efektivního vyhledávání dle regulárních výrazů a v oblasti identifikace (a následného zabránění) možných útoků na nástroje, které takové vyhledávání implementují (tzv. regular expression denial of service -- ReDoS).
Navrhovaná známka
B
Body
80

eVSKP id 155076