REIN, M. Automatická kategorizace a extrakce dat z webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Student při řešení demonstroval všechny kvality hodné řádného inženýra. Zadání bylo zcela splněno a dále rozšířeno i o fungující uživatelské rozhraní pro konfiguraci a interakci s vytvořeným řešením a jím prezentovanými výsledky. Odevzdanou práci tedy hodnotím stupněm A .
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Téma diplomové práce bylo vypsáno v návaznosti na studentův inovativní přístup k řešení kategorizace a extrakce dat z webových stránek. Cílem práce bylo navrhnout a implementovat aplikaci umožňující automatizovanou kategorizaci všeobecně textového obsahu (se zaměřením na webové stránky) do uživatelem specifikovaných kategorií. Zadání hodnotím jako obtížnější z nutnosti nastudovat rozsáhlejší teorii fungování jazykových modelů, jejich aplikace v praxi ale i technologie umožňující jejich efektivní nasazení a ovládání. Student mimo splnění zadání z vlastní iniciativy implementoval i grafické uživatelské rozhraní pro ovládání daného systému a vizuální reprezentaci výsledků. | ||
Práce s literaturou | Student se inspiroval doporučenou literaturou a dále byl velice aktivní a schopný při dohledávání vlastní relevantní literatury. Vybrané zdroje jsou aktuální a kvalitní – značné množství z nich jsou moderní vědecké plublikace zabývající se související problematikou. | ||
Aktivita během řešení, konzultace, komunikace | Student si proaktivně domlouval konzultace kdy potřeboval a nebo když chtěl prezentovat či diskutovat pokroky ve vytvářeném řešení a případném dalším směru vývoje. Na konzultacích student konzistentně demonstroval nejen hluboké porozumění problematiky ale i vlastní iniciativu v návrhu i realizace technického řešení a plánování své práce. | ||
Aktivita při dokončování | Student měl funkční prototyp řešení implementovaný již v letním semestru a celá práce byla dokončována ve značném předstihu. V čase před odevzdáním student dokončoval opravy posledních chyb a další drobné úpravy. Výsledná podoba práce byla včas konzultována. | ||
Publikační činnost, ocenění | Student se zúčastnil studentské konference Excel@FIT 2023 . |
Celkovo hodnotím prácu ako veľmi dobrú (B) - textová časť práce je kvalitne spracovaná, technické riešenie funkčné a pripravené na ďaľšie použitie, v stave a forme ktoré považujem nad rámec toho čo vyžaduje zadanie.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Zadanie považujem za náročnejšie, keďže bolo potreba aby sa študent oboznámil s nemalým počtom komplexných prístupov a metód využívaných pri strojovom učení a spracovávaní prirodzeného jazyka. | ||
Rozsah splnění požadavků zadání | Študent zadanie splnil bez výhrad, realizácia technického riešenia je nad rámec toho čo vyžaduje zadanie. | ||
Rozsah technické zprávy | Text práce je v obvyklom rozsahu. | ||
Prezentační úroveň technické zprávy | 85 | Práca je rozumne štruktúrovaná a obsah jednotlivých kapitol je pekne pochopiteľný. Obzvlášť kvalitne spracovanú hodnotím kapitolu 2 zaoberajúcu sa teóriou spracovania prirodzeného jazyka a strojovým učením, ktorá aj napriek komplexnosti tématiky a množstvu informácií nezahltí čitateľa. Náväznosť a štruktúra jednotlivých častí sa ku koncu práce mierne zhoršuje (po obsahovej stránke na kvalite neutrpela), no ako celok v tomto smere považujem prácu za nadpriemernú. | |
Formální úprava technické zprávy | 80 | Práca je písaná v angličtine a až na pár defektov (preklepy, nevhodne zvolené slovo) je po jazykovej aj štylistickej stránke kvalitná. K typografickej úprave nemám výhrady. | |
Práce s literaturou | 80 | Práca cituje zdroje relevantné k riešenej problematike v súlade s citačnými zvyklosťami. | |
Realizační výstup | 90 | Technické riešenie je funkčné a pripravené na nasadnie. Študent nad rámec samotného systému pre klasifikáciu a extrakciu implementoval distribuovanú webovú aplikáciu s prívetivým užívateľským rozhraním umožňujúcu tento systém ovládať. Študetom poskytnutý spôsob nasadenia a konfigurácie s ním spojené podporujú varianty pre výpočty na CPu, GPU aj Apple Silicon. | |
Využitelnost výsledků | Práca sa zameriava na oblasť temných trhovísk, kde je všeobecne problém s dostupnosťou datasetov, prístupom k dátam, nestabilnosťou prostredia (trhoviská neustále vznikajú a zanikajú) a ďalšími technickými obmedzeniami špecifickými pre temný web - aplikácia existujúcich riešení je teda často náročná, občas nemožná. Využiteľnosť riešenia teda primárne vidím v ďalšom výskume v tejto oblasti. |
eVSKP id 145581