Rozpoznávání textu pomocí konvolučních sítí
but.committee | prof. Dr. Ing. Jan Černocký (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) doc. Ing. Vítězslav Beran, Ph.D. (člen) doc. Dr. Ing. Dušan Kolář (člen) Doc. RNDr. Pavel Matula, Ph.D. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm velmi dobře. Otázky u obhajoby: Aký je rozdiel medzi validačnou a testovacou sadou? Prečo ste vo svojich experimentoch používali validačnú sadu ako testovaciu sadu? Rozmýšlali ste o tom extrahovať text priamo z PDF súborov namiesto použitia OCR na vyrendrovaný text? Prečo ste sa rozhodli práve pre použitie OCR? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hradiš, Michal | cs |
dc.contributor.author | Csóka, Pavel | cs |
dc.contributor.referee | Behúň, Kamil | cs |
dc.date.created | 2016 | cs |
dc.description.abstract | Tato práce se zabývá tvorbou nových datových sad pro účely strojového učení rozpoznávání textu z fotografií a experimenty s konvolučními neuronovými sítěmi na těchto sadách. Popisuje architekturu konvolučních sítí, problémy rozpoznávání z fotografií a současné práce využívající tyto sítě. Dále tvorbu anotace datové sady fotografií stránek dokumentů, pořízených mobilními telefony, nazvané Mobile Page Photos. K anotaci je využit Tesseract OCR. Z této sady jsou vyříznutím znaků z fotografií vytvořeny dvě další. Jedná se o sady znaků dobře čitelných Mobile Nice Page Photos Characters a dobře i spatně až nečitelných Mobile Page Photos Characters, ve formátu datové sady číslic Street View House Numbers. S třemi vytvořenými modely konvolučních sítí jsou na datových sadách provedeny experimenty s rozpoznáváním textu, s jejichž pomocí je také odhadnuta chyba anotace. | cs |
dc.description.abstract | This thesis aims at creation of new datasets for text recognition machine learning tasks and experiments with convolutional neural networks on these datasets. It describes architecture of convolutional nets, difficulties of recognizing text from photographs and contemporary works using these networks. Next, creation of annotation, using Tesseract OCR, for dataset comprised from photos of document pages, taken by mobile phones, named Mobile Page Photos. From this dataset two additional are created by cropping characters out of its photos formatted as Street View House Numbers dataset. Dataset Mobile Nice Page Photos Characters contains readable characters and Mobile Page Photos Characters adds hardly readable and unreadable ones. Three models of convolutional nets are created and used for text recognition experiments on these datasets, which are also used for estimation of annotation error. | en |
dc.description.mark | B | cs |
dc.identifier.citation | CSÓKA, P. Rozpoznávání textu pomocí konvolučních sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2016. | cs |
dc.identifier.other | 96626 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/61794 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | rozpoznávání textu z fotografií | cs |
dc.subject | anotace datové sady | cs |
dc.subject | tvorba datové sady | cs |
dc.subject | konvoluční neuronová síť | cs |
dc.subject | strojové učení | cs |
dc.subject | Caffe | cs |
dc.subject | Tesseract OCR | cs |
dc.subject | Street View House Numbers | cs |
dc.subject | Mobile Page Photos | cs |
dc.subject | Mobile Page Photos Characters | cs |
dc.subject | text recognition from photographs | en |
dc.subject | dataset annotation | en |
dc.subject | dataset creation | en |
dc.subject | convolutional neural network | en |
dc.subject | machine learning | en |
dc.subject | Caffe | en |
dc.subject | Tesseract OCR | en |
dc.subject | Street View House Numbers | en |
dc.subject | Mobile Page Photos | en |
dc.subject | Mobile Page Photos Characters | en |
dc.title | Rozpoznávání textu pomocí konvolučních sítí | cs |
dc.title.alternative | Optical Character Recognition Using Convolutional Networks | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2016-06-17 | cs |
dcterms.modified | 2020-05-10-16:12:47 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 96626 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:21:25 | en |
sync.item.modts | 2025.01.15 21:43:56 | en |
thesis.discipline | Počítačová grafika a multimédia | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 5.83 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-18980_v.pdf
- Size:
- 86.07 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-18980_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-18980_o.pdf
- Size:
- 95.23 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-18980_o.pdf
Loading...
- Name:
- review_96626.html
- Size:
- 1.44 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_96626.html