Automatické získání bibliografických údajů z dokumentu
Loading...
Date
Authors
Pařilová, Marie
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato práce se zabývá automatickou extrakcí bibliografických údajů z naskenovaných titulních stran historických knih s cílem usnadnit katalogizaci v knihovnách a archivech. Porovnávány jsou dva přístupy: detekční model YOLO v kombinaci s OCR a multimodální model LayoutLM, který integruje text, vizuální prvky a rozvržení stránky. Součástí řešení je také poloautomatický nástroj pro zarovnání anotací, jenž zrychluje přípravu trénovacích dat. Výstupem je strukturovaný JSON soubor s klíčovými bibliografickými prvky. Práce hodnotí přesnost a praktičnost obou přístupů.
This thesis focuses on the automatic extraction of bibliographic data from scanned title pages of mostly historical books, aiming to facilitate cataloging in libraries and archives. Two approaches are compared: a detection model based on YOLO combined with OCR, and a multimodal LayoutLM model that integrates text, visual features, and page layout. The work also includes a semi-automatic alignment tool designed to speed up the annotation of training data. The output is a structured JSON file containing key bibliographic elements. The thesis evaluates the accuracy and practical usability of both approaches.
This thesis focuses on the automatic extraction of bibliographic data from scanned title pages of mostly historical books, aiming to facilitate cataloging in libraries and archives. Two approaches are compared: a detection model based on YOLO combined with OCR, and a multimodal LayoutLM model that integrates text, visual features, and page layout. The work also includes a semi-automatic alignment tool designed to speed up the annotation of training data. The output is a structured JSON file containing key bibliographic elements. The thesis evaluates the accuracy and practical usability of both approaches.
Description
Keywords
automatická extrakce , bibliografická metadata , digitalizace , YOLO , OCR , LayoutLM , historické dokumenty , titulní strana , zpracování obrazu , strojové učení , automatic extraction , bibliographic metadata , digitization , YOLO , OCR , LayoutLM , historical documents , title page , image processing , machine learning
Citation
PAŘILOVÁ, M. Automatické získání bibliografických údajů z dokumentu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, Ph.D. (předseda)
Mgr. Kamil Malinka, Ph.D. (člen)
Ing. Miloš Musil, Ph.D. (člen)
Ing. Vladimír Veselý, Ph.D. (člen)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
Date of acceptance
2025-06-16
Defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B.
Result of defence
práce byla úspěšně obhájena
