Rozpoznávání historických textů pomocí hlubokých neuronových sítí
but.committee | prof. Ing. Adam Herout, Ph.D. (předseda) doc. Ing. Vladimír Drábek, CSc. (místopředseda) Ing. Jaroslav Rozman, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) doc. Ing. Michal Španěl, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: Jak by jste v práci využil dostupný jazykový model? Jaký má vliv konstanta 10000 na rovnice pozičního kódování 3.23? Jakými mechanismy je možné pracovat s proměnlivou délkou sekvencí? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Kišš, Martin | cs |
dc.contributor.author | Vešelíny, Peter | cs |
dc.contributor.referee | Kolář, Martin | cs |
dc.date.created | 2019 | cs |
dc.description.abstract | Táto práca sa zaoberá rozpoznávaním riadkov z historických textov. Historické texty pochádzajú z obdobia od 17. až 19 storočia a sú napísané pomocou fraktúry. Pri rozpoznávaní písma sa používa architektúra neurónovej siete zvaná sequence-to-sequence . Táto architektúra vychádza z modelu kodér-dekodér a používa mechanizmus attention . V rámci práce bola z textov, pochádzajúcich z archívu Deutsches Textarchiv , vytvorená dátová sada. Tento archív obsahuje 3 897 rôznych nemeckých diel, ku ktorým sú dostupné snímky strán a ich prepisy. Vytvorená dátová sada sa následne používa pri trénovaní a experimentovaní s neurónovou sieťou. V rámci experimentov sú skúmané rôzne modely konvolučných sietí, vplyv hyperparametrov siete a účinok pozičného kódovania na výsledky rozpoznávania. Výsledný model dokáže rozpoznať znaky s presnosťou 99,63 %. Prínosom tejto práce je spomínaná dátová sada a neurónová sieť, ktorá sa môže použivať pri rozpoznávaní historických dokumentov. | cs |
dc.description.abstract | This thesis deals with text line recognition of historical documents. Historical texts dating back to the 17th - 19th centuries are written in fraktur typeface. The character recognition problem is solved using neural network architecture called sequence-to-sequence . This architecture is based on encoder-decoder model and contains attention mechanism. In this thesis a dataset, from texts originated from German archiv called Deutsches Textarchiv , was created. This archive contains 3 897 different German books that have available transcripts and corresponding images of pages. The created dataset was used to train and experiment with the proposed neural network. During the experiments, several convolutional models, hyperparameters and the effects of positional embedding were investigated. The final tool can recognize characters with accuracy 99,63 %. The contribution of this work is the~mentioned dataset and neural network, which can be used to recognize historical documents. | en |
dc.description.mark | A | cs |
dc.identifier.citation | VEŠELÍNY, P. Rozpoznávání historických textů pomocí hlubokých neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019. | cs |
dc.identifier.other | 121913 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/180582 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | rozpoznávanie textu | cs |
dc.subject | historický text | cs |
dc.subject | neurónová sieť | cs |
dc.subject | OCR | cs |
dc.subject | konvolučná neurónová sieť | cs |
dc.subject | CNN | cs |
dc.subject | rekurentná neurónová sieť | cs |
dc.subject | RNN | cs |
dc.subject | seq2seq | cs |
dc.subject | kodér | cs |
dc.subject | dekodér | cs |
dc.subject | attention | cs |
dc.subject | text recognition | en |
dc.subject | historical text | en |
dc.subject | neural network | en |
dc.subject | OCR | en |
dc.subject | convolutional neural network | en |
dc.subject | CNN | en |
dc.subject | recurrent neural network | en |
dc.subject | RNN | en |
dc.subject | seq2seq | en |
dc.subject | encoder | en |
dc.subject | decoder | en |
dc.subject | attention | en |
dc.title | Rozpoznávání historických textů pomocí hlubokých neuronových sítí | cs |
dc.title.alternative | Convolutional Networks for Historic Text Recognition | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2019-06-13 | cs |
dcterms.modified | 2019-09-02-09:04:31 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 121913 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:26:49 | en |
sync.item.modts | 2025.01.15 17:00:25 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 11.25 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-21411_v.pdf
- Size:
- 85.82 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-21411_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-21411_o.pdf
- Size:
- 89.17 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-21411_o.pdf
Loading...
- Name:
- review_121913.html
- Size:
- 1.47 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_121913.html