Zvyšování konzistence v datových sadách pro rozpoznávání textu
but.committee | prof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) Ing. Jaroslav Dytrych, Ph.D. (místopředseda) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Máte odhad skutečné chybovosti přepisů v použité datové sadě? Jak ovlivňuje detekci chybných přepisů fakt, že využíváte neuronovou síť, která byla na těchto přepisech trénována? Jestli to chápu dobře, výsledky Tabulky 6.3 jsou na řádcích již filtrovaných na rozdílnosti výstupů neuronové sítě vůči přepisům. Jak tento fakt ovlivňuje interpretaci těchto výsledků. | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Kišš, Martin | cs |
dc.contributor.author | Tvarožný, Matúš | cs |
dc.contributor.referee | Hradiš, Michal | cs |
dc.date.created | 2022 | cs |
dc.description.abstract | Táto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu. | cs |
dc.description.abstract | This work is concerned with increasing the consistency of datasets for text recognition. This paper describes the problems that cause the inconsistency and then presents solutions to eliminate it. The effect of the properties of the polygons defining the text line boundaries and hence how the modified version of the dataset, which is composed of ideal text line variants, affected the accuracy of the model is investigated. Further, the work focuses on detecting and then removing or modifying text lines whose ground truth transcription does not match the actual text they contain. Experimentation showed that removing the visual inconsistency on the training set did not have a significant effect on the trained model, but modifying the test set improved the OCR accuracy of the model by 1.1\% CER. By modifying the dataset so that it did not contain mutually inconsistent pairs of recognized text and the corresponding ground truth, the model improved by a maximum of only 0.2\% CER after re-training. The main finding of this work is, above all, the proven beneficial effect of removing inconsistencies on test suites, thanks to which it is possible to determine a more realistic error rate of the OCR model. | en |
dc.description.mark | C | cs |
dc.identifier.citation | TVAROŽNÝ, M. Zvyšování konzistence v datových sadách pro rozpoznávání textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022. | cs |
dc.identifier.other | 145320 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/207435 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | rozpoznávanie textu | cs |
dc.subject | OCR | cs |
dc.subject | HTR | cs |
dc.subject | neurónové siete | cs |
dc.subject | NN | cs |
dc.subject | konvolučné neurónové siete | cs |
dc.subject | CNN | cs |
dc.subject | rekurentné neurónové siete | cs |
dc.subject | RNN | cs |
dc.subject | sequence to sequence | cs |
dc.subject | se2seq | cs |
dc.subject | CTC | cs |
dc.subject | konzistencia | cs |
dc.subject | dátové sady | cs |
dc.subject | text recognition | en |
dc.subject | OCR | en |
dc.subject | HTR | en |
dc.subject | neural networks | en |
dc.subject | NN | en |
dc.subject | convolutional neural networks | en |
dc.subject | CNN | en |
dc.subject | recurrent neural networks | en |
dc.subject | RNN | en |
dc.subject | sequence to sequence | en |
dc.subject | se2seq | en |
dc.subject | CTC | en |
dc.subject | consistency | en |
dc.subject | datasets | en |
dc.title | Zvyšování konzistence v datových sadách pro rozpoznávání textu | cs |
dc.title.alternative | Improving Consistency in Text Recognition Datasets | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2022-06-14 | cs |
dcterms.modified | 2022-06-20-10:22:59 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 145320 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:43:43 | en |
sync.item.modts | 2025.01.17 12:16:32 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.82 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-25170_v.pdf
- Size:
- 86.21 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-25170_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-25170_o.pdf
- Size:
- 91.44 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-25170_o.pdf
Loading...
- Name:
- review_145320.html
- Size:
- 1.46 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_145320.html