Automatické zpracování obsahu dokumentu
Loading...
Date
Authors
Blažo, Richard
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Cieľom tejto práce je automatizovať získavanie informácií o obsahu kníh alebo dokumentov zo strán obsahov a textov, pre účely podpory digitalizácie. Pre tento cieľ je navrhnutý systém automatického spracovania dát, ktorý využíva rôzne metódy strojového učenia na identifikáciu a následnú extrakciu dát. Hlavným komponentom práce je detektor objektov YOLO, ktorý identifikuje prvky relevantné k obsahu v stranách dokumentu. Výsledkom je systém ktorý dokáže využiť strany dokumentu k vytvoreniu digitálnej štruktúry obsahu.
The goal of this thesis is to automate data collection about the table of contents of books or documents from their relevant pages, to support the digitalization effort. A system for automated processing of table of contents using various methods of machine learning is proposed. The main component of the system is YOLOv8, an object detection system, used to identify relevant information regarding the contents of the document. The resulting system can use the document pages to create a digital structure representing the document's table of contents.
The goal of this thesis is to automate data collection about the table of contents of books or documents from their relevant pages, to support the digitalization effort. A system for automated processing of table of contents using various methods of machine learning is proposed. The main component of the system is YOLOv8, an object detection system, used to identify relevant information regarding the contents of the document. The resulting system can use the document pages to create a digital structure representing the document's table of contents.
Description
Citation
BLAŽO, R. Automatické zpracování obsahu dokumentu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, Ph.D. (předseda)
Mgr. Kamil Malinka, Ph.D. (člen)
Ing. Miloš Musil, Ph.D. (člen)
Ing. Vladimír Veselý, Ph.D. (člen)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
Date of acceptance
2025-06-16
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
Result of defence
práce byla úspěšně obhájena
