Rozpoznávání textu pomocí hlubokých neuronových sítí

Loading...
Thumbnail Image
Date
Authors
Kavuliak, Daniel
ORCID
Mark
E
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cieľom tejto práce je zostrojiť model na rozpoznanie rukou písaných slov, ktorý bude používať non-autoregresívny dekóder. Tento typ dekóderu počíta predikcie znakov nezávisle na ostatných predikovaných znakoch, čo môže byť výhodné z hľadiska rýchlosti inferencie, ale kvalita predikcie je horšia. Motiváciou je navrhnúť non-autoregresívny dekóder, ktorý bude mať za úlohu spresňovať predikcie enkóderu. Úloha bola riešená pomocou dekóderov, ktoré predikcie enkóderu maskujú alebo čiastočne potláčajú informáciu kvôli využitiu informácie o nemaskovaných symboloch resp. využitiu informácie vstupnej sekvencie. Následne bola vykonaná séria experimentov, kde najlepší model dosiahol znakovej chybovosti 8.92 %. Zadanie ale nebolo splnené, pretože samotný enkóder dosiahol 6.38 %.
The aim of this work is to build a model for handwritten text recognition, which will use non-autoregressive decoder. This type of decoder calculates character predictions independently of other predicted characters, which can be advantageous in terms of inference speed, but the quality of the prediction is worse. The motivation is to design a non-autoregressive decoder, which will have the task of refining the encoder's predictions. The task was solved with the help of decoders, which mask the encoder's predictions or partially suppress the information due to the use of information about unmasked symbols or using input sequence information. Subsequently, a series of experiments was performed, where the best model reached a character error rate of 8.92 %. But the assignment was not fulfilled, because the encoder itself reached 6.38 %.
Description
Citation
KAVULIAK, D. Rozpoznávání textu pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Strojové učení
Comittee
doc. Ing. Lukáš Burget, Ph.D. (předseda) doc. Ing. Martin Čadík, Ph.D. (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. Tomáš Milet, Ph.D. (člen)
Date of acceptance
2023-06-16
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO