Automatické získání bibliografických údajů z dokumentu
| but.committee | doc. Ing. František Zbořil, Ph.D. (předseda) Mgr. Kamil Malinka, Ph.D. (člen) Ing. Miloš Musil, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen) | cs |
| but.defence | Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B. | cs |
| but.jazyk | čeština (Czech) | |
| but.program | Informační technologie | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Kohút, Jan | cs |
| dc.contributor.author | Pařilová, Marie | cs |
| dc.contributor.referee | Kostelník, Martin | cs |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Tato práce se zabývá automatickou extrakcí bibliografických údajů z naskenovaných titulních stran historických knih s cílem usnadnit katalogizaci v knihovnách a archivech. Porovnávány jsou dva přístupy: detekční model YOLO v kombinaci s OCR a multimodální model LayoutLM, který integruje text, vizuální prvky a rozvržení stránky. Součástí řešení je také poloautomatický nástroj pro zarovnání anotací, jenž zrychluje přípravu trénovacích dat. Výstupem je strukturovaný JSON soubor s klíčovými bibliografickými prvky. Práce hodnotí přesnost a praktičnost obou přístupů. | cs |
| dc.description.abstract | This thesis focuses on the automatic extraction of bibliographic data from scanned title pages of mostly historical books, aiming to facilitate cataloging in libraries and archives. Two approaches are compared: a detection model based on YOLO combined with OCR, and a multimodal LayoutLM model that integrates text, visual features, and page layout. The work also includes a semi-automatic alignment tool designed to speed up the annotation of training data. The output is a structured JSON file containing key bibliographic elements. The thesis evaluates the accuracy and practical usability of both approaches. | en |
| dc.description.mark | B | cs |
| dc.identifier.citation | PAŘILOVÁ, M. Automatické získání bibliografických údajů z dokumentu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 164604 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/252810 | |
| dc.language.iso | cs | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | automatická extrakce | cs |
| dc.subject | bibliografická metadata | cs |
| dc.subject | digitalizace | cs |
| dc.subject | YOLO | cs |
| dc.subject | OCR | cs |
| dc.subject | LayoutLM | cs |
| dc.subject | historické dokumenty | cs |
| dc.subject | titulní strana | cs |
| dc.subject | zpracování obrazu | cs |
| dc.subject | strojové učení | cs |
| dc.subject | automatic extraction | en |
| dc.subject | bibliographic metadata | en |
| dc.subject | digitization | en |
| dc.subject | YOLO | en |
| dc.subject | OCR | en |
| dc.subject | LayoutLM | en |
| dc.subject | historical documents | en |
| dc.subject | title page | en |
| dc.subject | image processing | en |
| dc.subject | machine learning | en |
| dc.title | Automatické získání bibliografických údajů z dokumentu | cs |
| dc.title.alternative | Automated Extraction of Bibliographic Information From Document | en |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-16 | cs |
| dcterms.modified | 2025-06-16-14:36:08 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 164604 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 23:03:52 | en |
| sync.item.modts | 2025.08.26 19:55:00 | en |
| thesis.discipline | Informační technologie | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
