SVÍTKOVÁ, V. Rozpoznání významných prvků v textu webových stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Burget, Radek

Studentka řešila svoji bakalářskou práci samostatně po celou dobu řešení. Drobné rezervy spatřuji v nižší konzultační aktivitě a v dokončování technické zprávy na poslední chvíli, celkově však výsledek odpovídá zadání a splňuje moje očekávání. Celkově proto hodnotím práci jako průměrnou a navruji hodnocení stupněm C.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem zadání bylo prozkoumat metody rozpoznávání pojmenovaných entit v textu a prozkoumat možnosti jejich aplikace na obsah webových stránek. Zadání považuji za obtížnější, protože webové stránky často neobsahují souvislý text, ale spíše úryvky a samostatné údaje, což může komplikovat nasazení běžně používaných metod. Zadání považuji za splněné a s výsledkem jsem spokojen.
Práce s literaturou Studentka si vyhledávala relevantní zdroje převážně samostatně, v menší míře využívala konzultací s vedoucím.
Aktivita během řešení, konzultace, komunikace Studentka pracovala po celou dobu řešení samostatně, své řešení se mnou konzultovala spíše v delších intervalech, ale vždy prezentovala znatelný pokrok v řešení a důležitá rozhodnutí se mnou diskutovala.
Aktivita při dokončování Práce byla dokončována poněkud ve spěchu, ale měl jsem možnost připomínkovat téměř finální verzi technické zprávy. Výsledný implementační výstup jsem neměl možnost příliš zkoumat. Jeho hlavním účelem však bylo získání experimentálních výsledků, které jsou v technické zprávě prezentovány.
Publikační činnost, ocenění
Navrhovaná známka
C
Body
78

Posudek oponenta

Hynek, Jiří

Studentka se zabývala netriviální problematikou. Vytkl bych nedostatečný popis praktické části. Výstupy řešící rozpoznávání produktů se nicméně jeví jako použitelné. Navrhuji hodnocení stupněm B .

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Cílem práce bylo natrénovat modely pro rozpoznávání pojmenovaných entit (konkrétně názvů knih a produktů) v textu webových stránek. Studentka prostudovala současné přístupy určené k tomu účelu a knihovnu jazyka Python (SpaCy). Následně provedla trénování osmi modelů v českém jazyce, které porovnala. Zadání hodnotím jako obtížnější. Považuji ho za splněné.
Rozsah splnění požadavků zadání
Rozsah technické zprávy
Prezentační úroveň technické zprávy 65 Teoretická část popisující rozpoznávání pojmenovaných entit a strukturování webových stránek působí dobrým dojmem. Popis praktické části je slabší. Chybí popis analýzy problému. Popis implementace je upozaděn a spojen s kapitolou popisující návrh. Principy implementovaných modelů jsou vysvětleny povrchně. Celkově tedy hodnotím jako mírně podprůměrné .
Formální úprava technické zprávy 70 Po formální stránce je práce na průměrné úrovni . Po jazykové stránce přijatelné, po typografické stránce obsahuje některé nedostatky (výčty, číslování výpisů). Pojmy nejsou v mnoha případech vhodně zvýrazněné.
Práce s literaturou 85 Studentka prostudovala dostatečné množství odborných zdrojů . Způsob odkazování se na zdroje v některých případech mohl být lepší .
Realizační výstup 75 Výstupy jsou na přijatelné úrovni . Řešení se skládá z 8 modelů implementovaných v jazyce Python a knihovně SpaCy. Rozpoznávání názvů projektů se oproti rozpoznávání názvů knih jeví lépe. Uvítal bych podrobnější soubor README dokumentující principy jednotlivých modelů.
Využitelnost výsledků Využití výsledku není v práci diskutováno . Usuzuji, že bude využito ve výzkumu vedoucího bakalářské práce v rámci nástroje FitLayout určeného pro analýzu webových stránek.
Navrhovaná známka
B
Body
80

Otázky

eVSKP id 147037