KŘIVÁNEK, J. Automatizovaná extrakce strukturovaných dat dokumentů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
V rámci letního semestru student odvedl velké množství práce. Jedná se zejména o natrénování většího množství různých detektorů a tvorbu unikátních datových sad. Důvodem průměrného hodnocení je zejména neaktivita v zimním semestru.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Práce se zabývá vývojem systému pro detekci a klasifikaci metadat dokumentů českých archivů. Téma je mírně náročnější z ohledem na nutnost přípravy vlastního datové sady z prostředí českých archivů. Student vyzkoušel základní principy pro detekci metadat. Poznatky budou využity pro vývoj systémů v rámci projektu Smart digilinka - Strojové učení pro digitalizaci tištěného dědictví. | ||
Práce s literaturou | Student se zejména zabýval řešením systému na základě nápadů vedoucího. Vlastní průzkum literatury v oblasti detekce metadat byl minimální. | ||
Aktivita během řešení, konzultace, komunikace | V rámci zimního semestru student nebyl aktivní. Jako důvod uvedl rodinné důvody. V rámci semestru letního student pravidelně konzultoval a aktivně pracoval na řešení práce. | ||
Aktivita při dokončování | Obsah práce byl průběžně konzultován, nicméně práce byla dokončena v posledních dnech před odevzdáním a definitivní obsah konzultován nebyl. | ||
Publikační činnost, ocenění |
Práca je dobre spracovaná a študent v nej demonštruje získané znalosti a jeho schopnosť experimentovať aj s vlastnými nápadmi na relevantných dátach a metrikách. Do istej miery sú v práci formálne nedostatky, ale tie závažne neovplyvňujú pochopiteľnosť a prínos práce. Celkovo prácu hodnotím známkou B.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Splnenie zadania vyžaduje znalosti spracovania obrazu, strojového učenia a počítačového videnia. Celkovo je to nad rámec bakalárskeho štúdijného programu, a teda ide o obtiažnejšie zadanie. | ||
Rozsah splnění požadavků zadání | |||
Rozsah technické zprávy | Práca má celkovo 36 strán formátu A4, jednotlivé kapitoly obsahujú informácie, ktoré sú relevantné z pohľadu práce a vyhýbajú sa zbytočnému balastu. | ||
Prezentační úroveň technické zprávy | 85 | Práca je ako celok dobre čiteľná, jednotlivé sekcie na seba nadväzujú a majú logickú štruktúru. V kapitolách študent prechádza oblasti, ktoré sú relevantné k problematike. Čo hodnotenie tejto časti znižuje, sú chýbajúce odkazy na obrázky alebo tabuľky z textu. Pri niektorých odkazoch v texte, na druhej strane, nie je poznať, či ide o obrázok, tabuľku alebo sekciu (hlavne v kapitole 4). | |
Formální úprava technické zprávy | 75 | Práca je z typografického hľadiska dobrá, avšak z jazykového hľadiska sa v práci vyskytli nesprávne formulované vety. V niektorých vetách chýba sloveso. Práca zároveň obsahuje relatívne dlhé vety (viď. úvod do kapitoly 2). | |
Práce s literaturou | 85 | Práca má celkovo 25 referencií, z toho cca 19 publikácií je priamo relevantných ku detekcii a extrakcii metadát. Z pohľadu formátu referencií, často chýba relevantná informácia ku konferencii alebo žurnálu, v ktorom bol článok publikovaný. Študent s citáciami pracuje korektne a využíva state-of-the art prístupy na riešenie unikátneho problému. Menšia výhrada je nevyužitie citácii v sekcii 3.3, kde sú počtom len 2 a sekcia, ako celok, si ich vyžaduje viac. | |
Realizační výstup | 85 | Funkčnosť riešenia je demonštrovaná hlavne veľkým počtom experimentov, ktoré sú v technickej správe dostatočne zdokumentované. Zdrojové kódy sú prehľadné a prevzaté časti sú využívané v súlade s licenčnými podmienkami autorov. Zo zdrojových kódov nie je úplne jasné, ako výsledky zreplikovať alebo ako spustiť vytvorené systémy na iných dátach. Z tohto pohľadu chýba detailnejšia dokumentácia. | |
Využitelnost výsledků | Práca je kompilačného charakteru. Riešenie je potenciálne využiteľné v praxi. Výsledky prezentujú relatívne dobrú presnosť pre extrakciu metadát z českých periodik a kníh, prínos práce je z tohto pohľadu značný. |
eVSKP id 155520