Automatické získání bibliografických údajů z dokumentu

but.committeedoc. Ing. František Zbořil, Ph.D. (předseda) Mgr. Kamil Malinka, Ph.D. (člen) Ing. Miloš Musil, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKohút, Jancs
dc.contributor.authorPařilová, Mariecs
dc.contributor.refereeKostelník, Martincs
dc.date.created2025cs
dc.description.abstractTato práce se zabývá automatickou extrakcí bibliografických údajů z naskenovaných titulních stran historických knih s cílem usnadnit katalogizaci v knihovnách a archivech. Porovnávány jsou dva přístupy: detekční model YOLO v kombinaci s OCR a multimodální model LayoutLM, který integruje text, vizuální prvky a rozvržení stránky. Součástí řešení je také poloautomatický nástroj pro zarovnání anotací, jenž zrychluje přípravu trénovacích dat. Výstupem je strukturovaný JSON soubor s klíčovými bibliografickými prvky. Práce hodnotí přesnost a praktičnost obou přístupů.cs
dc.description.abstractThis thesis focuses on the automatic extraction of bibliographic data from scanned title pages of mostly historical books, aiming to facilitate cataloging in libraries and archives. Two approaches are compared: a detection model based on YOLO combined with OCR, and a multimodal LayoutLM model that integrates text, visual features, and page layout. The work also includes a semi-automatic alignment tool designed to speed up the annotation of training data. The output is a structured JSON file containing key bibliographic elements. The thesis evaluates the accuracy and practical usability of both approaches.en
dc.description.markBcs
dc.identifier.citationPAŘILOVÁ, M. Automatické získání bibliografických údajů z dokumentu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other164604cs
dc.identifier.urihttp://hdl.handle.net/11012/252810
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectautomatická extrakcecs
dc.subjectbibliografická metadatacs
dc.subjectdigitalizacecs
dc.subjectYOLOcs
dc.subjectOCRcs
dc.subjectLayoutLMcs
dc.subjecthistorické dokumentycs
dc.subjecttitulní stranacs
dc.subjectzpracování obrazucs
dc.subjectstrojové učenícs
dc.subjectautomatic extractionen
dc.subjectbibliographic metadataen
dc.subjectdigitizationen
dc.subjectYOLOen
dc.subjectOCRen
dc.subjectLayoutLMen
dc.subjecthistorical documentsen
dc.subjecttitle pageen
dc.subjectimage processingen
dc.subjectmachine learningen
dc.titleAutomatické získání bibliografických údajů z dokumentucs
dc.title.alternativeAutomated Extraction of Bibliographic Information From Documenten
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-16cs
dcterms.modified2025-06-16-14:36:08cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid164604en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:03:52en
sync.item.modts2025.08.26 19:55:00en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
6.32 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_164604.html
Size:
10.31 KB
Format:
Hypertext Markup Language
Description:
file review_164604.html

Collections