STEHLÍK, J. Vytvoření jazykového modelu pro nákladově efektivní detekci pojmenovaných entit v textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Z hlediska aktivity hodnotím práci studenta jako výbornou, řešení se intenzivně věnoval již před začátkem zimního semestru a vytvořil systém, který dosahuje požadované kvality výstupů. Firemní konzultant mluví o práci také v superlativech, systém by měl být brzy využíván v každodenním provozu.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Zadání bylo mírně obtížnější, neboť vyžadovalo prostudování nejmodernějších metod a postupů, založených na velkých jazykových modelech, a proniknutí do specifických požadavků firmy Avast/Gen Digital. Student začal na tématu intenzivně pracovat už před na začátku léta 2024, aktivně se zapojil do spolupráce s odborníky z firmy, podařilo se mu splnit jejich požadavky a vytvořit řešení, které bezprostředně využívají. S praktickým výstupem práce jsem plně spokojen a i podle vyjádření firemního konzultanta, pana Břetislava Šopíka, hodnotí firma splnění zadání a výsledky jako výborné. | ||
| Práce s literaturou | Student shromáždil a zpracoval množství relevantních a aktuálních odborných vědeckých článků, podařilo se mu udělat základní shrnutí a přehled stavu poznání v dané oblasti. | ||
| Aktivita během řešení, konzultace, komunikace | Aktivita během řešení byla příkladná, konzultace probíhaly pravidelně a byl vždy vidět posun v konkrétních oblastech zaměření. | ||
| Aktivita při dokončování | Text práce byl dokončen v určitém předstihu, k většině částí jsem byl schopen dát zpětnou vazbu, moje připomínky byly řádně začleněny. | ||
| Publikační činnost, ocenění | - |
Všechny body zadání byly splněny a autor navíc navrhl jednoduchou metodu založenou na pravidlech. Bylo provedeno množství experimentů, které porovnávaly úspěšnost i náklady. Místy by bylo vhodné text upravit, aby byl pro čtenáře srozumitelnější, celkově však práci hodnotím pozitivně.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | |||
| Rozsah splnění požadavků zadání | Všechny body zadání jsou splněny. | ||
| Rozsah technické zprávy | Technická zpráva je v obvyklém rozmezí a všechny části jsou vzhledem k tématu relevantní. | ||
| Prezentační úroveň technické zprávy | 80 | Kapitoly na sebe dobře logicky navazují a jsou obsahově relevantní. Místy je ovšem text hůře pochopitelný pro čtenáře nebo je mírně zavádějící. Například v kapitole 5 by bylo vhodné propojit text popisující data s vhodnou shrnující tabulkou. Sekce 2.2 opomíjí krok optimalizátoru. V rovnici 2.4 je uveden mylně index u vektoru z. | |
| Formální úprava technické zprávy | 90 | Text je na dobré typografické úrovni a obsahuje pouze malé množství překlepů. | |
| Práce s literaturou | 85 | Práce obsahuje relevantní zdroje a jsou většinou náležitě citovány, pouze u nástroje LangChain chybí citace a v sekci 3.2 by bylo vhodné uvést přímo zdroje k jednotlivým modelům. | |
| Realizační výstup | 90 | Práce byla převážně experimentálního charakteru. Doložené řešení je ve formě Jupyter Notebooků. Autor mimo konvenčních neurálních modelů vytvořil i jednoduchou nákladově efektivní metodu založenou na pravidlech. Přestože tato metoda nedosahovala dobrých výsledků, tak celkovou snahu hodnotím pozitivně. | |
| Využitelnost výsledků | Tato práce je přímo navázána na průmysl. Věřím, že získaná analýza ceny a úspěšnosti vybraných modelů bude přínosem pro firemní sektor. |
eVSKP id 161261