HRABOVSKÝ, J. Hledání slabých stránek Hyperscanu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
S prácou som spokojný, prehľad toho ako funguje Hyperscan bol kvalitne spracovaný a aj keď nástroj pre genovanie textu je zatiaľ skôr len v počiatočnej fáze, tak vzhľadom na náročnosť si myslím, že práca si zaslúži hodnotenie A .
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Tému považujem za náročnejšiu, bolo nutné si naštudovať komplexné matchovacie algoritmy, ktoré sú z veľkej časti nezdokumentované a na ich pochopenie trebalo prechádzať kód Hyperscanu. So zdokumentovaním týchto algoritmov som veľmi spokojný, myslím si, že sa bude dať použiť aj v iných projektoch. Navrhnutý nástroj na generovanie textu je zatiaľ len prototyp, ale vzhľadom k obtiažnosti a k tomu, že je to bakalarská práca si myslím, že je to dostatočný výstup práce. | ||
Práce s literaturou | Študent si materiál k práci vyhľadával skoro úplne samostatne. Používal vhodne zvolenú literatúru, ktorú kvalitne spracoval. | ||
Aktivita během řešení, konzultace, komunikace | Študent bol pri riešení aktívny, konzultácie sme mali pravidelne. Na konzultácie chodil pripravený. | ||
Aktivita při dokončování | Časť práce venovaná prehľadu algoritmov implementovaných v Hyperscane bola konzultovaná v dostatočnom predstihu. S časťou, ktorá sa venovala nástroju na generovanie textov, to bolo horšie, bola písaná na poslednú chvíľu. | ||
Publikační činnost, ocenění | Práca nebola publikovaná, ale je tu potenciál na kvalitný článok. |
Přes výše uvedené nedostatky hodnotím práci stupněm B, a to s ohledem na vysokou náročnost zadání a na užitečnost výstupů práce pro další výzkum.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Obtížnost zadání hodnotím jako obzvlášť vysokou, protože zadání vyžadovalo pochopení velmi složitých algoritmů kombinujících pokročilé poznatky z teoretické informatiky s nízko-úrovňovým programováním, a to až na úrovni speciálních vektorových instrukcí. Konečně jednalo se o nastudování a zdokumentování principů, na kterých stojí v současnosti zřejmě světově nejvýkonnější nástroj pro vyhledávání dle regulárních výrazů HyperScan pocházející ze společnosti Intel, která do něj promítla mimo jiné i velmi hluboké znalosti pokročilých instrukcí svých procesorů. V některých případech bylo přitom nutno příslušné algoritmy nastudovat přímo ze zdrojového kódu, neboť nebyly nikdy předmětem publikace. Vzhledem k tomu, že daná problematika mě velmi zajímá, nechal jsem si některé studentem nastudované přístupy použité v nástroji HyperScan osobně vysvětlit a musím konstatovat, že jsem se přitom dostal opakovaně na hranici svých mentálních kapacit. | ||
Rozsah splnění požadavků zadání | Práce zahrnovala nastudování a zdokumentování technik, které používá nástroj HyperScan, a dále implementaci nástroje, který by generoval texty, na kterých by HyperScan měl problémy při porovnávání se zadaným regulárním výrazem. Vytvořený nástroj měl být experimentálně vyhodnocen na vhodných regulárních výrazech a jeho schopnosti měly být srovnány s jinými generátory. Student se výrazně zaměřil zejména na studium a zdokumentování metod použitých v nástroji HyperScan. Implementoval rovněž požadovaných generátor problematických textů a vyhodnotil ho, i když vyhodnocení není příliš rozsáhlé. V práci tak ze zadání chybí pouze srovnání s jinými generátory. Tento nedostatek však považuji za nepodstatný vzhledem k tomu, že těžiště práce spatřuji právě v nastudování a zdokumentování metod používaných nástrojem HyperScan, které je velmi cenné pro další výzkum v této oblasti realizovaný ve skupině VeriFIT. | ||
Rozsah technické zprávy | Práce má obvyklý rozsah. | ||
Prezentační úroveň technické zprávy | 85 | Práce má logickou strukturu, jednotlivé části na sebe vhodně navazují. Části věnované popisu metod použitých v nástroji HyperScan jsou informačně bohaté. Části věnované vlastnímu generátoru problematických textů a zejména jeho vyhodnocení jsou kratší a mnohem méně informativní. Studentovi zde zřejmě již docházel dostupný čas. | |
Formální úprava technické zprávy | 80 | Práce je psána anglicky, a to na solidní úrovni, byť s nezanedbatelným počtem drobnějších chyb. Typografická úroveň zprávy je velmi dobrá. | |
Práce s literaturou | 95 | Výběr studijních materiálů je velmi vhodný. Student prokázal schopnost nastudovat i velmi náročnou odbornou literaturu. Použité zdroje jsou patřičně citovány (byť na některých místech zůstaly v citacích chybové znaky). | |
Realizační výstup | 80 | Student implementoval požadovaný generátor textů problematických pro nástroj HyperScan. Jedná se evidentně o prototypové řešení a rovněž jeho vyhodnocení je minimalistické. Oceňuji nicméně, že se vůbec podařilo dosáhnout pozitivních výsledků, neboť nástroj HyperScan je opravdu velmi efektivní a je těžké vygenerovat texty, které jsou pro něj problematické. | |
Využitelnost výsledků | Výsledky studentovy práce jsou dle mého názoru velmi užitečným materiálem pro další výzkum v oblasti efektivního vyhledávání dle regulárních výrazů a v oblasti identifikace (a následného zabránění) možných útoků na nástroje, které takové vyhledávání implementují (tzv. regular expression denial of service -- ReDoS). |
eVSKP id 155076