Semi-supervised učení pro rozpoznávání textu
Loading...
Date
Authors
Zárecký, Miroslav
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato práce se zabývá metodou semi-supervised učení neuronových sítí pro rozpoznání středověkých manuskript. Zvolenou semi-supervised metodou je pseudo-labeling v kombinaci s filtrováním na základě konfidence modelu, která byla aplikována na neuronovou síť architektury Transformer. Experimentálně byly ověřeny podmínky, kdy je tato metoda účinná, a bylo dosaženo pozitivních výsledků. Přínosem také může být vytvoření poměrně obsáhlé neanotované datová sady.
This thesis explores a semi-supervised learning method for neural networks aimed at the recognition of medieval manuscripts. The selected method combines pseudo-labeling with confidence-based filtering and is applied to a Transformer-based neural network architecture. The conditions under which this method is effective were verified experimentally, and positive results were achieved. Another contribution of this work is the creation of a relatively large unlabeled dataset.
This thesis explores a semi-supervised learning method for neural networks aimed at the recognition of medieval manuscripts. The selected method combines pseudo-labeling with confidence-based filtering and is applied to a Transformer-based neural network architecture. The conditions under which this method is effective were verified experimentally, and positive results were achieved. Another contribution of this work is the creation of a relatively large unlabeled dataset.
Description
Keywords
transformer , semi-supervised učení , metriky jistoty , rozpoznání textu , neanotovaná data , středověká manuskripta , historický text , pseudo-labeling , transformer , semi-supervised learning , confidence measures , text recognition , unannotated data , medieval manuscript , historical text , pseudo-labeling
Citation
ZÁRECKÝ, M. Semi-supervised učení pro rozpoznávání textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Ing. Adam Herout, Ph.D. (předseda)
Dr. Ing. Petr Peringer (člen)
Ing. Matěj Grégr, Ph.D. (člen)
Ing. Jaroslav Rozman, Ph.D. (člen)
Ing. Jiří Matoušek, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.
Result of defence
práce byla úspěšně obhájena
