Orbis Pictus: Zpřístupnění netextových dat z digitálních knihoven

dc.contributor.authorLehečka, Daliborcs
dc.contributor.authorJebavý, Filipcs
dc.contributor.authorKersch, Filipcs
dc.contributor.authorPavčík, Filipcs
dc.contributor.authorJana, Hrzinovács
dc.contributor.authorFremrová, Květacs
dc.contributor.authorKišš, Martincs
dc.contributor.authorLhoták, Martincs
dc.contributor.authorDvořáková, Martinacs
dc.contributor.authorBežová, Michaelacs
dc.contributor.authorHradiš, Michalcs
dc.contributor.authorŽabička, Petrcs
dc.contributor.authorJiroušek, Václavcs
dc.coverage.issue2cs
dc.coverage.volume2024cs
dc.date.accessioned2025-06-12T09:55:52Z
dc.date.available2025-06-12T09:55:52Z
dc.date.issued2024-10-25cs
dc.description.abstractÚčel - Projekt "Orbis Pictus - oživení knihy pro kulturní a kreativní odvětví" si klade za cíl zpřístupnit netextový obsah českých digitálních knihoven, který je ve srovnání s textovými daty obtížně dosažitelný a neprohledatelný. Tento článek přináší přehled plánovaných výstupů projektu s důrazem na klíčové výsledky dosažené v prvních dvou letech. Metody - Zpřístupnění netextových objektů v digitalizovaných dokumentech lze rozdělit na tři úlohy: detekci, popis a vyhledání. Identifikaci, lokalizaci a kategorizaci objektů zajistí nástroj AnnoPage, který umožní extrakci popisů objektů a jejich uložení ve standardizovaném formátu. V dalších fázích projektu naváže na AnnoPage nástroj PeopleGator, který identifikuje osoby na fotografiích či kresbách a umožní propojení dokumentů s vyobrazením stejné osoby a vytvoření databáze identifikovaných osob. Projekt bude zakončen softwarovým řešením integrujícím všechny vyvinuté nástroje. Výsledky - V prvních dvou letech projektu byla vytvořena metodika pro zpracování obrazových dokumentů. Ta popisuje způsob detekce netextových objektů, jejich rozdělení do 25 kategorií a zápis informací pomocí mezinárodních standardů, čímž pokládá základ pro nástroj AnnoPage. K detekci objektů je využíván detektor trénovaný na vlastní datové sadě. Detekované objekty jsou popsány pomocí vektorových reprezentací a textových popisů. Originalita/hodnota - Výstupy projektu budou integrovány do České digitální knihovny, což umožní využívání vyvinutých nástrojů širokému spektru knihoven, které platforma agreguje. Orbis Pictus je unikátní projekt v oblasti digital humanities díky rozsáhlému shromáždění netextových dat. Výsledky najdou uplatnění nejen v identifikaci objektů a metadat, ale i ve výzkumu a kulturním a kreativním průmyslu, kde mohou zpřístupněné objekty sloužit jako inspirace pro marketing, vzdělávání, gamifikaci nebo umělou inteligenci.cs
dc.description.abstractPurpose - The project "Book Revival for Cultural and Creative Sectors" aims to make the non-textual content of Czech digital libraries easily available, since it is now difficult to access and search compared to textual data. This article provides an overview of the planned outputs of the project, with an emphasis on the key results achieved in the first two years. Method - Accessing non-textual objects in digitized documents can be divided into three tasks: detection, description and retrieval. The identification, localization and categorization of objects will be provided by AnnoPage. This tool will allow extracting object descriptions and storing them in a standardized format. In the next phases of the project, AnnoPage will be followed by PeopleGator, which identifies people in photographs or drawings and allows linking documents depicting the same person and creating a database of identified people. At the project's conclusion, a software solution integrating all the developed tools will be provided. Results - In the first two years of the project, a methodology for processing image documents was developed. This methodology describes how to detect non-text objects, classify them into 25 categories and store this information using international standards, thus laying the foundation for the AnnoPage tool. A detector trained on a custom dataset is used to detect the objects. Detected objects are described using vector representations and textual descriptions. Originality/value - The outputs of the project will be integrated into the Czech Digital Library, which will enable a wide range of libraries aggregated by the platform to use the developed tools. Orbis Pictus is a unique project in the field of digital humanities due to its extensive collection of non-textual data. The results will find applications not only in object and metadata identification, but also in research and the cultural and creative industries, where the detected objects can serve as inspiration for marketing, education, gamification or artificial intelligence.en
dc.formattextcs
dc.format.extent22-31cs
dc.format.mimetypeapplication/pdfcs
dc.identifier.citationITlib. 2024, vol. 2024, issue 2, p. 22-31.en
dc.identifier.doi10.52036/1335793X.2024.2.22-31cs
dc.identifier.issn1336-0779cs
dc.identifier.orcid0000-0001-6853-0508cs
dc.identifier.orcid0000-0002-6364-129Xcs
dc.identifier.other197967cs
dc.identifier.researcheridG-9365-2016cs
dc.identifier.scopus23135162300cs
dc.identifier.urihttps://hdl.handle.net/11012/252167
dc.language.isocscs
dc.publisherSlovak Centre of Scientific and Technical Informationcs
dc.relation.ispartofITlibcs
dc.relation.urihttps://doi.org/10.52036/1335793X.2024.2.22-31cs
dc.rightsCreative Commons Attribution 4.0 Internationalcs
dc.rights.accessopenAccesscs
dc.rights.sherpahttp://www.sherpa.ac.uk/romeo/issn/1336-0779/cs
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/cs
dc.subjectdigital libraries
dc.subjectmachine learning
dc.subjectimage recognition
dc.subjectimage retrieval
dc.subjectcreative industries
dc.titleOrbis Pictus: Zpřístupnění netextových dat z digitálních knihovencs
dc.title.alternativeOrbis Pictus. Enhancing access to non-textual data in digital librariesen
dc.type.driverarticleen
dc.type.statusPeer-revieweden
dc.type.versionpublishedVersionen
eprints.grantNumberinfo:eu-repo/grantAgreement/MK0/DH/DH23P03OVV033cs
sync.item.dbidVAV-197967en
sync.item.dbtypeVAVen
sync.item.insts2025.06.12 11:55:52en
sync.item.modts2025.06.12 11:33:07en
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
2231_Kersch_et_al.pdf
Size:
295.06 KB
Format:
Adobe Portable Document Format
Description:
file 2231_Kersch_et_al.pdf