KŘIVÁNEK, J. Automatizovaná extrakce strukturovaných dat dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Kohút, Jan

V rámci letního semestru student odvedl velké množství práce. Jedná se zejména o natrénování většího množství různých detektorů a tvorbu unikátních datových sad. Důvodem průměrného hodnocení je zejména neaktivita v zimním semestru.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Práce se zabývá vývojem systému pro detekci a klasifikaci metadat dokumentů českých archivů. Téma je mírně náročnější z ohledem na nutnost přípravy vlastního datové sady z prostředí českých archivů. Student vyzkoušel základní principy pro detekci metadat. Poznatky budou využity pro vývoj systémů v rámci projektu Smart digilinka - Strojové učení pro digitalizaci tištěného dědictví.
Práce s literaturou Student se zejména zabýval řešením systému na základě nápadů vedoucího. Vlastní průzkum literatury v oblasti detekce metadat byl minimální.
Aktivita během řešení, konzultace, komunikace V rámci zimního semestru student nebyl aktivní. Jako důvod uvedl rodinné důvody. V rámci semestru letního student pravidelně konzultoval a aktivně pracoval na řešení práce.
Aktivita při dokončování Obsah práce byl průběžně konzultován, nicméně práce byla dokončena v posledních dnech před odevzdáním a definitivní obsah konzultován nebyl.
Publikační činnost, ocenění
Navrhovaná známka
C
Body
70

Posudek oponenta

Vaško, Marek

Práca  je dobre spracovaná a študent v nej demonštruje získané znalosti a jeho schopnosť experimentovať aj s vlastnými nápadmi na relevantných dátach a metrikách. Do istej miery sú v práci formálne nedostatky, ale tie závažne neovplyvňujú pochopiteľnosť a prínos práce. Celkovo prácu hodnotím známkou B.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Splnenie zadania vyžaduje znalosti spracovania obrazu, strojového učenia a počítačového videnia. Celkovo je to nad rámec bakalárskeho štúdijného programu, a teda ide o obtiažnejšie zadanie.
Rozsah splnění požadavků zadání
Rozsah technické zprávy Práca má celkovo 36 strán formátu A4, jednotlivé kapitoly obsahujú informácie, ktoré sú relevantné z pohľadu práce a vyhýbajú sa zbytočnému balastu.
Prezentační úroveň technické zprávy 85 Práca je ako celok dobre čiteľná, jednotlivé sekcie na seba nadväzujú a majú logickú štruktúru. V kapitolách študent prechádza oblasti, ktoré sú relevantné k problematike. Čo hodnotenie tejto časti znižuje, sú chýbajúce odkazy na obrázky alebo tabuľky z textu. Pri niektorých odkazoch v texte, na druhej strane, nie je poznať, či ide o obrázok, tabuľku alebo sekciu (hlavne v kapitole 4).
Formální úprava technické zprávy 75 Práca je z typografického hľadiska dobrá, avšak z jazykového hľadiska sa v práci vyskytli nesprávne formulované vety. V niektorých vetách chýba sloveso. Práca zároveň obsahuje relatívne dlhé vety (viď. úvod do kapitoly 2).
Práce s literaturou 85 Práca má celkovo 25 referencií, z toho cca 19 publikácií je priamo relevantných ku detekcii a extrakcii metadát. Z pohľadu formátu referencií, často chýba relevantná informácia ku konferencii alebo žurnálu, v ktorom bol článok publikovaný.  Študent s citáciami pracuje korektne a využíva state-of-the art prístupy na riešenie unikátneho problému. Menšia výhrada je nevyužitie citácii v sekcii 3.3, kde sú počtom len 2 a sekcia, ako celok, si ich vyžaduje viac.
Realizační výstup 85 Funkčnosť riešenia je demonštrovaná hlavne veľkým počtom experimentov, ktoré sú v technickej správe dostatočne zdokumentované. Zdrojové kódy sú prehľadné a prevzaté časti sú využívané v súlade s licenčnými podmienkami autorov. Zo zdrojových kódov nie je úplne jasné, ako výsledky zreplikovať alebo ako spustiť vytvorené systémy na iných dátach. Z tohto pohľadu chýba detailnejšia dokumentácia.
Využitelnost výsledků Práca je kompilačného charakteru. Riešenie je potenciálne využiteľné v praxi. Výsledky prezentujú relatívne dobrú presnosť pre extrakciu metadát z českých periodik a kníh, prínos práce je z tohto pohľadu značný.
Navrhovaná známka
B
Body
85

Otázky

eVSKP id 155520