BLAŽO, R. Automatické zpracování obsahu dokumentu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Student přispěl k vytvoření datasetu obsahů knih, jenž bude dále rozvíjen v rámci projektu Smart Digilinka zaměřeného na digitalizaci dokumentových metadat. Výsledkem práce jsou funkční systémy pro automatické generování elektronického obsahu knih, včetně vyhodnocení a srovnání různých metod.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Informace k zadání | Cílem práce bylo připravit dataset obsahů knih a vytvořit systém pro jejich automatickou detekci. Zadání považuji za mírně obtížnější. Student musel navrhnout a implementovat netriviální systém na zcela novém datasetu, takže lze práci označit za výzkumného charakteru. Výsledkem je systém, který automaticky zpracuje fotografie knihy a vytvoří její elektronický obsah. Systém i dataset budou dále rozšiřovány a udržovány v rámci projektu Smart Digilinka, který se zaměřuje na digitalizaci metadat dokumentů. | ||
| Práce s literaturou | Student nastudoval relevantní literaturu, která popisuje jak standardní přístupy, tak i metody strojového učení pro digitalizaci obsahů knih. | ||
| Aktivita během řešení, konzultace, komunikace | Student aktivně pracoval na řešení zadaného úkolu. Konzultace probíhaly pravidelně během prvního semestru, ve druhém semestru pak student pracoval z velké části samostatně. | ||
| Aktivita při dokončování | Práce byla dokončena na čas a konzultována byla její téměř finální podoba. | ||
| Publikační činnost, ocenění |
Student dokázal do hloubky nastudovat problematiku automatického zpracování obsahu dokumentu a vytvořil rozsáhlý systém s několika kroky a opravnými mechanizmy. Navíc student otestoval značné množství různých variant svého systému. Z experimentů vyplývá, že výsledný systém má potenciál pro využití v praxi. Práci nicméně drží zpět rozsah technické zprávy a nižší technická kvalita zdrojových kódů.
| Kritérium | Známka | Body | Slovní hodnocení |
|---|---|---|---|
| Náročnost zadání | Zadání vyžadovalo důkladný průzkum značného množství metod zpracování obsahu, včetně moderních technik založených na strojovém učení. Dále zadání vyžadovalo tvorbu vlastní datové sady. Zadání práce celkově považuji za mírně obtížnější. | ||
| Rozsah splnění požadavků zadání | Zadání bylo splněno bez výhrad. | ||
| Rozsah technické zprávy | Technická zpráva s dostatečnou rezervou splňuje minimální rozsah, nicméně je spíše kratší a velikostí nedosahuje obvyklého rozsahu. V práci se nachází několik pasáží, které by bylo vhodné popsat podrobněji. | ||
| Prezentační úroveň technické zprávy | 65 | Práce začíná úvodem do problematiky a rozborem tří hlavních přístupů ke zpracování obsahu. Následuje popis datové sady a návrh samotného řešení. Práce končí popisem experimentů a finálním shrnutím. Implementace je do jisté míry popsána v návrhu řešení a v kapitole o experimentech, ale nemá vlastní kapitolu s detailním popisem. To se pojí s celkovým spíše kratším rozsahem práce. Text práce je totiž v principu v pořádku: je velmi věcný a kvalitní. Všechny kapitoly na sebe rovněž dobře navazují. Nicméně některé části práce by zasloužilo popsat detailněji. Například by se hodily rozsáhlejší popisky obrázků nebo třeba bližší přiblížení řešené úlohy. Dále pak chybí detailnější popis použitých algoritmů (YOLO, GNN). Z menších nedostatků lze poté zmínit například vzorec na straně 8, kde je K definováno až o několik řádků níže či chybějící informace o rychlosti ve vyhodnocení experimentů. | |
| Formální úprava technické zprávy | 90 | Práce je z typografického hlediska velmi kvalitní a obsahuje pouze minimum překlepů a gramatických chyb. Všechny obrázky jsou relevantní a ve vysoké kvalitě. Drobné výhrady mám k občasnému míchání angličtiny a slovenštiny (v textu i převzatých obrázcích), výrazům typu "upsamplování", nadpisům tabulek umístěných až pod tabulkami. | |
| Práce s literaturou | 90 | Práce cituje celkem 28 zdrojů, z většiny vědeckých publikací. Použité zdroje jsou relevantní a jsou v textu správně použity i citovány. Nejsem si vědom porušení citační etiky. | |
| Realizační výstup | 85 | Student vytvořil novou datovou sadu a navrhl několikakrokové řešení pro automatické zpracování obsahu dokumentu založené na detekčním modelu YOLO a dalších moderních přístupech. Vícekrokový přístup byl reflektován i v experimentech, kde byly zhodnoceny různé varianty modelu YOLO, zpracování kapitol, OCR i systém jako celek. Nedostatek však vidím v technické kvalitě zdrojových kódů. I přes to, že obsahují základní testy hlavních skriptů, nejsou prakticky vůbec komentovány a delší skripty nejsou vhodně strukturovány. Dále nedává smysl mít v adresáři "utils" definice modelů, jako je GNN. | |
| Využitelnost výsledků | Výsledky ukazují, že vytvořené řešení má potenciál pro nasazení v praxi. Připravené rozšíření datové sady může být využito pro vývoj zcela nových systémů pro zpracování obsahu. |
eVSKP id 164606