BARTOŠÁK, M. Extrakce dat z dokumentů PDF [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Aktivitu pana Bartošáka hodnotím jako nadprůměrnou, zejména v letním semestru řešil svoji bakalářskou práci velmi aktivně a svědomitě a vše řádně konzultoval. Výsledkem je softwarový nástroj, který pravděpodobně najde praktické využití ve FN Brno. Navrhuji proto hodnocení stupněm B.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Cílem zadání byla tvorba softwarového nástroje pro extrakci dat z dokumentů ve formátu PDF, které představují výstup konkrétních lékařských přístrojů. Zadání považuji za průměrně náročné, obtížnější byl zejména návrh způsobu specifikace extrakční úlohy s ohledem na různé formáty dokumentů a budoucí rozšiřitelnost. Zadání považuji za splněné bez výhrad, výsledný nástroj je pro danou úlohu dobře použitelný. | ||
Práce s literaturou | Student využíval informace poskytnuté v rámci konzultací a samostatně vyhledával další relevantní zdroje. | ||
Aktivita během řešení, konzultace, komunikace | V zimním semestru byl student průměrně aktivní, v letním semestru se však řešení bakalářské práce věnoval velmi aktivně a jednotlivé kroky řešení často a důkladně konzultoval. | ||
Aktivita při dokončování | Práce byla dokončena v dostatečném předstihu. Podoba vytvořeného softwarového nástroje byla důkladně konzultována, stejně jako obsah technické zprávy. Mé připomínky student řádně zapracoval. | ||
Publikační činnost, ocenění |
Bakalářská práce se skládá z velmi kvalitního realizačního výstupu a průměrné technické zprávy. Proto navrhuji lehce nadprůměrné hodnocení B (velmi dobře).
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | Cílem bakalářské práce bylo nastudovat problematiku extrakce dat z PDF dokumentů a vytvořit aplikaci, která bude dle zadání extrahovat požadované položky z dokumentů obsahujících lékařská data. Zadání poskytovalo studentovi volnost v tom, jak do hloubky v rámci extrakce půjde a jak moc univerzální řešení vytvoří. | ||
Rozsah splnění požadavků zadání | Student zadání splnil a vytvořil řešení, které je univerzální, tj. není omezeno pouze na lékařské zaměření dokumentů, což lze považovat za rozšíření oproti původnímu zadání. | ||
Rozsah technické zprávy | Rozsah technické zprávy splňuje předepsané požadavky. | ||
Prezentační úroveň technické zprávy | 85 | Technická zpráva je srozumitelná, struktura kapitol je zvolena správně, stejně jako rozsahy jednotlivých kapitol. Nedostatky jsou méně závažného charakteru. Po uvedení všech knihoven pro práci s PDF dokumenty mi chybí zdůvodnění, proč byla použita práve knihovna PDF Box, navíc v této kapitole mohla být zmíněna knihovna Pdf2Dom, kterou student také využil. Dále v textu chybí zmínka o rozšiřitelnosti systému, ale pokud je jí myšlena možnost specifikovat nové úlohy extrakce, pak systém rozšiřitelný určitě je. | |
Formální úprava technické zprávy | 75 | Formální úprava technické zprávy je průmerná, zejména po jazykové stránce má řadu nedostatků, především několik pravopisných hrubek, kterých sice není mnoho, ale celkový dojem z práce snižují. Také po stránce stylistické je text průměrný. Typografická úroveň je až na pár drobností v pořádku. | |
Práce s literaturou | 80 | Seznam literatury obsahuje pouze 7 položek týkajících se formátu PDF dokumentů a knihoven pro zpracování PDF, což pokrývá věci, které si student měl nastudovat. Tyto zdroje jsou v textu odkazovány, k porušení citační etiky nedošlo. | |
Realizační výstup | 95 | Realizačním výstupem je plně funkční řešení pro extrakci dat z PDF na základě definice úlohy. Ta je definována pomocí jazyka Barty, který navrhl student, a díky němu jde o univerzální řešení, které není omezeno jen na lékařské dokumenty. | |
Využitelnost výsledků | Vytvořený program lze využít pro extrakci dat z PDF dokumentů různého zaměření, který jistě může najít uplatnění v lékařském prostředí, pro který byl vytvořen. Jedinou otázkou je, jestli běžný lékař se bude ochoten učit vytvářet definice úloh v jazyku Barty. |
eVSKP id 146957