Rozpoznávání textu pomocí konvolučních sítí

but.committeeprof. Dr. Ing. Jan Černocký (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) doc. Dr. Ing. Dušan Kolář (člen) Doc. RNDr. Pavel Matula, Ph.D. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm velmi dobře. Otázky u obhajoby: Aký je rozdiel medzi validačnou a testovacou sadou? Prečo ste vo svojich experimentoch používali validačnú sadu ako testovaciu sadu? Rozmýšlali ste o tom extrahovať text priamo z PDF súborov namiesto použitia OCR na vyrendrovaný text? Prečo ste sa rozhodli práve pre použitie OCR?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorCsóka, Pavelcs
dc.contributor.refereeBehúň, Kamilcs
dc.date.created2016cs
dc.description.abstractTato práce se zabývá tvorbou nových datových sad pro účely strojového učení rozpoznávání textu z fotografií a experimenty s konvolučními neuronovými sítěmi na těchto sadách. Popisuje architekturu konvolučních sítí, problémy rozpoznávání z fotografií a současné práce využívající tyto sítě. Dále tvorbu anotace datové sady fotografií stránek dokumentů, pořízených mobilními telefony, nazvané Mobile Page Photos. K anotaci je využit Tesseract OCR. Z této sady jsou vyříznutím znaků z fotografií vytvořeny dvě další. Jedná se o sady znaků dobře čitelných Mobile Nice Page Photos Characters a dobře i spatně až nečitelných Mobile Page Photos Characters, ve formátu datové sady číslic Street View House Numbers. S třemi vytvořenými modely konvolučních sítí jsou na datových sadách provedeny experimenty s rozpoznáváním textu, s jejichž pomocí je také odhadnuta chyba anotace.cs
dc.description.abstractThis thesis aims at creation of new datasets for text recognition machine learning tasks and experiments with convolutional neural networks on these datasets. It describes architecture of convolutional nets, difficulties of recognizing text from photographs and contemporary works using these networks. Next, creation of annotation, using Tesseract OCR, for dataset comprised from photos of document pages, taken by mobile phones, named Mobile Page Photos. From this dataset two additional are created by cropping characters out of its photos formatted as Street View House Numbers dataset. Dataset Mobile Nice Page Photos Characters contains readable characters and Mobile Page Photos Characters adds hardly readable and unreadable ones. Three models of convolutional nets are created and used for text recognition experiments on these datasets, which are also used for estimation of annotation error.en
dc.description.markBcs
dc.identifier.citationCSÓKA, P. Rozpoznávání textu pomocí konvolučních sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016.cs
dc.identifier.other96626cs
dc.identifier.urihttp://hdl.handle.net/11012/61794
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávání textu z fotografiícs
dc.subjectanotace datové sadycs
dc.subjecttvorba datové sadycs
dc.subjectkonvoluční neuronová síťcs
dc.subjectstrojové učenícs
dc.subjectCaffecs
dc.subjectTesseract OCRcs
dc.subjectStreet View House Numberscs
dc.subjectMobile Page Photoscs
dc.subjectMobile Page Photos Characterscs
dc.subjecttext recognition from photographsen
dc.subjectdataset annotationen
dc.subjectdataset creationen
dc.subjectconvolutional neural networken
dc.subjectmachine learningen
dc.subjectCaffeen
dc.subjectTesseract OCRen
dc.subjectStreet View House Numbersen
dc.subjectMobile Page Photosen
dc.subjectMobile Page Photos Charactersen
dc.titleRozpoznávání textu pomocí konvolučních sítícs
dc.title.alternativeOptical Character Recognition Using Convolutional Networksen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2016-06-17cs
dcterms.modified2020-05-10-16:12:47cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid96626en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:21:25en
sync.item.modts2025.01.15 21:43:56en
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
5.83 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-18980_v.pdf
Size:
86.07 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-18980_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-18980_o.pdf
Size:
95.23 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-18980_o.pdf
Loading...
Thumbnail Image
Name:
review_96626.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
file review_96626.html
Collections