Rozpoznávání textu pomocí hlubokých neuronových sítí

Loading...
Thumbnail Image

Date

Authors

Kavuliak, Daniel

Mark

E

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cieľom tejto práce je zostrojiť model na rozpoznanie rukou písaných slov, ktorý bude používať non-autoregresívny dekóder. Tento typ dekóderu počíta predikcie znakov nezávisle na ostatných predikovaných znakoch, čo môže byť výhodné z hľadiska rýchlosti inferencie, ale kvalita predikcie je horšia. Motiváciou je navrhnúť non-autoregresívny dekóder, ktorý bude mať za úlohu spresňovať predikcie enkóderu. Úloha bola riešená pomocou dekóderov, ktoré predikcie enkóderu maskujú alebo čiastočne potláčajú informáciu kvôli využitiu informácie o nemaskovaných symboloch resp. využitiu informácie vstupnej sekvencie. Následne bola vykonaná séria experimentov, kde najlepší model dosiahol znakovej chybovosti 8.92 %. Zadanie ale nebolo splnené, pretože samotný enkóder dosiahol 6.38 %.
The aim of this work is to build a model for handwritten text recognition, which will use non-autoregressive decoder. This type of decoder calculates character predictions independently of other predicted characters, which can be advantageous in terms of inference speed, but the quality of the prediction is worse. The motivation is to design a non-autoregressive decoder, which will have the task of refining the encoder's predictions. The task was solved with the help of decoders, which mask the encoder's predictions or partially suppress the information due to the use of information about unmasked symbols or using input sequence information. Subsequently, a series of experiments was performed, where the best model reached a character error rate of 8.92 %. But the assignment was not fulfilled, because the encoder itself reached 6.38 %.

Description

Citation

KAVULIAK, D. Rozpoznávání textu pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Document type

Document version

Date of access to the full text

Language of document

sk

Study field

Strojové učení

Comittee

doc. Ing. Lukáš Burget, Ph.D. (předseda) doc. Ing. Martin Čadík, Ph.D. (člen) doc. Ing. Vladimír Janoušek, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) Ing. Tomáš Milet, Ph.D. (člen)

Date of acceptance

2023-06-16

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO