Zvyšování konzistence v datových sadách pro rozpoznávání textu

but.committeeprof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. Mgr. Lukáš Holík, Ph.D. (člen) doc. Ing. Tomáš Martínek, Ph.D. (člen) Ing. Jaroslav Dytrych, Ph.D. (místopředseda) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Máte odhad skutečné chybovosti přepisů v použité datové sadě? Jak ovlivňuje detekci chybných přepisů fakt, že využíváte neuronovou síť, která byla na těchto přepisech trénována? Jestli to chápu dobře, výsledky Tabulky 6.3 jsou na řádcích již filtrovaných na rozdílnosti výstupů neuronové sítě vůči přepisům. Jak tento fakt ovlivňuje interpretaci těchto výsledků.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKišš, Martincs
dc.contributor.authorTvarožný, Matúšcs
dc.contributor.refereeHradiš, Michalcs
dc.date.created2022cs
dc.description.abstractTáto práca sa zaoberá zvyšovaním konzistencie dátových sád pre rozpoznávanie textu. V tejto práci sú popísane problémy, ktoré nekonzistenciu spôsobujú a následne sú predstavené riešenia na jej odstránenie. Skúmaný je vplyv vlastností polygónov definujúcich ohraničenie riadkov a teda to ako upravená verzia dátovej sady, ktorá je zložená z ideálnych variant riadkov ovplyvnila presnosť modelu. Ďalej sa práca zameriava na detekciu a následné odstránenie alebo upravenie riadkov, ktorých prepis ground truth nekorešponduje so skutočným textom, ktorý sa na nich nachádza. Experimentovaním sa ukázalo, že odstránenie vizuálnej nekonzistencie na trénovacej sade nemá zásadný vplyv na natrénovanosť modelu, za to poupravením testovacej sady sa presnosť OCR modelu zlepšila o 1.1\% CER. Upravením dátovej sady tak, aby neobsahovala navzájom nekonzistentné dvojice rozpoznávaného textu a príslušnej ground truth, sa model po opätovnom natrénovaní zlepšil maximálne len o 0.2\% CER. Hlavným zistením tejto práce je predovšetkým preukázaný priaznivý účinok odstránenia nekonzistencie na testovacích sadách, vďaka ktorému je možné zistiť reálnejšiu chybovosť OCR modelu.cs
dc.description.abstractThis work is concerned with increasing the consistency of datasets for text recognition. This paper describes the problems that cause the inconsistency and then presents solutions to eliminate it. The effect of the properties of the polygons defining the text line boundaries and hence how the modified version of the dataset, which is composed of ideal text line variants, affected the accuracy of the model is investigated. Further, the work focuses on detecting and then removing or modifying text lines whose ground truth transcription does not match the actual text they contain. Experimentation showed that removing the visual inconsistency on the training set did not have a significant effect on the trained model, but modifying the test set improved the OCR accuracy of the model by 1.1\% CER. By modifying the dataset so that it did not contain mutually inconsistent pairs of recognized text and the corresponding ground truth, the model improved by a maximum of only 0.2\% CER after re-training. The main finding of this work is, above all, the proven beneficial effect of removing inconsistencies on test suites, thanks to which it is possible to determine a more realistic error rate of the OCR model.en
dc.description.markCcs
dc.identifier.citationTVAROŽNÝ, M. Zvyšování konzistence v datových sadách pro rozpoznávání textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.cs
dc.identifier.other145320cs
dc.identifier.urihttp://hdl.handle.net/11012/207435
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávanie textucs
dc.subjectOCRcs
dc.subjectHTRcs
dc.subjectneurónové sietecs
dc.subjectNNcs
dc.subjectkonvolučné neurónové sietecs
dc.subjectCNNcs
dc.subjectrekurentné neurónové sietecs
dc.subjectRNNcs
dc.subjectsequence to sequencecs
dc.subjectse2seqcs
dc.subjectCTCcs
dc.subjectkonzistenciacs
dc.subjectdátové sadycs
dc.subjecttext recognitionen
dc.subjectOCRen
dc.subjectHTRen
dc.subjectneural networksen
dc.subjectNNen
dc.subjectconvolutional neural networksen
dc.subjectCNNen
dc.subjectrecurrent neural networksen
dc.subjectRNNen
dc.subjectsequence to sequenceen
dc.subjectse2seqen
dc.subjectCTCen
dc.subjectconsistencyen
dc.subjectdatasetsen
dc.titleZvyšování konzistence v datových sadách pro rozpoznávání textucs
dc.title.alternativeImproving Consistency in Text Recognition Datasetsen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2022-06-14cs
dcterms.modified2022-06-20-10:22:59cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid145320en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:43:43en
sync.item.modts2025.01.17 12:16:32en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.82 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-25170_v.pdf
Size:
86.21 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-25170_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-25170_o.pdf
Size:
91.44 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-25170_o.pdf
Loading...
Thumbnail Image
Name:
review_145320.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
file review_145320.html
Collections