KAŇKOVSKÝ, A. Sémantická analýza matričního záznamu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Posudky

Posudek vedoucího

Rozman, Jaroslav

S přístupem studenta a s jeho aktivitou během řešení jsem rozhodně spokojen. Výslednou práci plánujeme zakomponovat do našeho projektu DEMoS. Z těchto důvodů práci hodnotím stupněm B.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Cílem práce bylo na základě výsledků OCR programu použitého na matričních záznamech rozdělit rozpoznaná slova do jednotlivých kategorií (jméno, příjmení, povolání, obec, atd.) a uložit do databáze. Jedná se o zadání pro bakalářskou práci spíše obtížnější. Zadání bylo splněno a s výsledkem jsem spokojen.
Práce s literaturou Literatura, kterou si student obstarával samostatně, je vhodně zvolena.
Aktivita během řešení, konzultace, komunikace Student byl během řešení aktivní, na konzultace chodil pravidelně a připraven.
Aktivita při dokončování Práce byla dokončena v dostatečném předstihu a její obsah byl konzultován.
Publikační činnost, ocenění -
Navrhovaná známka
B
Body
85

Posudek oponenta

Zbořil, František

Jedná se o kvalitní realizační výstup a dobře zpracované téma, jehož kvalitu snižuje ne příliš dobře strukturovaná textová zpráva. Přesto hodnotím tuto práci nadprůměrným stupněm 'velmi dobře'.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Podstatou práce bylo sémantické zpracování textů v nakenovaných matrikách a naplnění tabulek podle těchto záznamů. Výsledkem pak měla být databáze záznamů uvedených v matrikách rozdělená podle kategorií 'jméno', 'přijmení', 'povolání' atd. K tomu byly použity existující nástroje pro rozpoznávání textů a vytvořeny a naučeny modely, které jednotlivé kategorie identifikovaly.
Rozsah splnění požadavků zadání
Rozsah technické zprávy Práce přesahuje padesát tištěných stran textu, což je pro bakalářskou práci mírně nad obvyklý rozsah.
Prezentační úroveň technické zprávy 60 Více než třetina textu pojednává o matrikách a jejich historii. Tato část je psána poutavě, ale s podstatou práce souvisí jen částečně. Až od strany 21 se text věnuje zpracování zadání.  Následný text popisuje vše podstatné, ale dle mého názoru se zde vyskytuje několik nepravostí. Zejména podstatu systémů, které jsou použity pro strojové zpracování textu, uvádí jen velmi stručně (kapitola 3, Návrh a impelemtace). Na straně 35 se hovoří o tom, že funkce main může nabývat tří stavů. Dále ale hovoří pouze o možných správných nebo nesprávných vstupech. Také nejsem příliš spokojen s pojmenování diagramů 3.1 a 4.3 coby stavových automatů. Podle mého názoru toto nejsou stavové automaty ve smyslu, v jakém je obvykle chápeme v našem oboru. Výsledky zpracování skenů mají být zapisovány do tabulek databáze. Struktura takových tabulek a databáze v textu není zmíněna, což považuji za chybu. V tabulce 5.8 v řádku narození jsou procentuální vyjádření správnosti a chybovosti podivné (netvoří dohromady 100%)
Formální úprava technické zprávy 80 Text je psán převážně čistě s jen minimem chyb - překlepů. Za rušívé považuji lehkovážné používání termínu pro trénování modelů (trénink, vytrénované modely, školení ...). Na straně 29 zbytečně používá anglický termín 'pipeline'. Některé obrázky, například obrázek 2.18, nejsou odkazovány a popsány.
Práce s literaturou 90 Literatura je volena vhodně k tématu práce a řádně citována. Nenalezl jsem žádné prohřešky proti citační etice.
Realizační výstup 90 Realizační výstup je funkční a splňuje zadání. Jeho správně fungování závisí na správném fungování systému Pero OCR a pro matriky, které jsou často špatně čitelné i pro zkušenější genealogy, je v současném stavu jistá chybovost pochopitelná.
Využitelnost výsledků Výsledky práce slouží k automatizovanému zpracování matrik. Pokud by byly výsledky v budoucnu pozvednuty na úroveň, kdy automatické zpracování záznamů bude ku prospěchu oproti ručnímu opisování záznamů do tabulek, došlo by k usnadnení této práce a uspíšení převodu matričních knih do digitální strukturované podoby.
Navrhovaná známka
B
Body
82

Otázky

eVSKP id 146893