Automatické zpracování obsahu dokumentu

Loading...
Thumbnail Image

Date

Authors

Blažo, Richard

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cieľom tejto práce je automatizovať získavanie informácií o obsahu kníh alebo dokumentov zo strán obsahov a textov, pre účely podpory digitalizácie. Pre tento cieľ je navrhnutý systém automatického spracovania dát, ktorý využíva rôzne metódy strojového učenia na identifikáciu a následnú extrakciu dát. Hlavným komponentom práce je detektor objektov YOLO, ktorý identifikuje prvky relevantné k obsahu v stranách dokumentu. Výsledkom je systém ktorý dokáže využiť strany dokumentu k vytvoreniu digitálnej štruktúry obsahu.
The goal of this thesis is to automate data collection about the table of contents of books or documents from their relevant pages, to support the digitalization effort. A system for automated processing of table of contents using various methods of machine learning is proposed. The main component of the system is YOLOv8, an object detection system, used to identify relevant information regarding the contents of the document. The resulting system can use the document pages to create a digital structure representing the document's table of contents.

Description

Citation

BLAŽO, R. Automatické zpracování obsahu dokumentu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

sk

Study field

Informační technologie

Comittee

doc. Ing. František Zbořil, Ph.D. (předseda) Mgr. Kamil Malinka, Ph.D. (člen) Ing. Miloš Musil, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen)

Date of acceptance

2025-06-16

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO