Rozpoznávání historických textů pomocí hlubokých neuronových sítí
but.committee | doc. Ing. František Zbořil, CSc. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) prof. Ing. Radomil Matoušek, Ph.D. (člen) Dr. Ing. Petr Peringer (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: V práci uvádíte (strana 37), že u některých znaků při rozpoznávání dochází k záměně nebo ke spojení. Nebylo by v takových případech možné využít znalosti o pravděpodobných slovech v textu a "vylepšit" tak rozpoznávání? Na základě Vašich výsledků úspěšnosti při rozpoznávání znaků (u=89%), lze odhadnout úspěšnost rozpoznání celých slov? (Je to prosté u^n, kde n je počet znaků, nebo je to jinak?) | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hradiš, Michal | cs |
dc.contributor.author | Kišš, Martin | cs |
dc.contributor.referee | Zemčík, Pavel | cs |
dc.date.created | 2018 | cs |
dc.description.abstract | Cílem této práce je vytvořit nástroj pro automatický přepis textu historických dokumentů. Práce je zaměřena především na rozpoznávání textů pocházejících z období novověku psané písmem zvané Fraktura. Problém je řešen pomocí nově navržených rekurentních konvolučních neuronových sítí a také pomocí sítě zvané Spatial Transformer Network. Součástí řešení je také implementovaný generátor umělých historických textů. Pomocí tohoto generátoru je vytvořena umělá datová sada, na níž je natrénována konvoluční neuronová síť pro rozpoznávání řádků. Tato síť je následně otestována na reálných historických řádcích textu, na kterých natrénovaná sít dosahuje úspešnosti až 89.0 % znakové přesnosti. Přínosem této práce je především nově navržená neuronová síť pro rozpoznávání řádků textu a implementovaný generátor umělých historických textů, s jehož pomocí je možné natrénovat neuronovou síť tak, aby zvládala rozpoznávat reálné historické řádky textu. | cs |
dc.description.abstract | The aim of this work is to create a tool for automatic transcription of historical documents. The work is mainly focused on the recognition of texts from the period of modern times written using font Fraktur. The problem is solved with a newly designed recurrent convolutional neural networks and a Spatial Transformer Network. Part of the solution is also an implemented generator of artificial historical texts. Using this generator, an artificial data set is created on which the convolutional neural network for line recognition is trained. This network is then tested on real historical lines of text on which the network achieves up to 89.0 % of character accuracy. The contribution of this work is primarily the newly designed neural network for text line recognition and the implemented artificial text generator, with which it is possible to train the neural network to recognize real historical lines of text. | en |
dc.description.mark | B | cs |
dc.identifier.citation | KIŠŠ, M. Rozpoznávání historických textů pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018. | cs |
dc.identifier.other | 114758 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/84895 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Přepis textu | cs |
dc.subject | OCR | cs |
dc.subject | historický text | cs |
dc.subject | rekurentní neuronové sítě | cs |
dc.subject | RNN | cs |
dc.subject | Spatial Transformer Network | cs |
dc.subject | STN | cs |
dc.subject | generátor umělé historické datové sady | cs |
dc.subject | Text recognition | en |
dc.subject | OCR | en |
dc.subject | historical text | en |
dc.subject | recurrent neural networks | en |
dc.subject | RNN | en |
dc.subject | Spatial Transformer Network | en |
dc.subject | STN | en |
dc.subject | artificial historical dataset generator | en |
dc.title | Rozpoznávání historických textů pomocí hlubokých neuronových sítí | cs |
dc.title.alternative | Convolutional Networks for Historic Text Recognition | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2018-06-18 | cs |
dcterms.modified | 2020-05-10-16:13:21 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 114758 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:26:38 | en |
sync.item.modts | 2025.01.15 22:22:00 | en |
thesis.discipline | Inteligentní systémy | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 5.83 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-20898_v.pdf
- Size:
- 86.05 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-20898_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-20898_o.pdf
- Size:
- 89.12 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-20898_o.pdf
Loading...
- Name:
- review_114758.html
- Size:
- 1.47 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_114758.html