Generativní neuronové sítě pro ručně psané písmo
but.committee | prof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Do trénování celého modelu pro generování písma je zapojená i OCR síť (označená jako "R"). Je tato síť předtrénovaná, nebo se trénuje od začátku (společně se zbytkem modelu)? Jak přesně probíhají jednotlivé iterace dekodéru v autoregresivní síti "S" (na obrázku 4.6 na straně 28)? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie a umělá inteligence | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Hradiš, Michal | cs |
dc.contributor.author | Ševčík, Pavel | cs |
dc.contributor.referee | Dobeš, Petr | cs |
dc.date.created | 2022 | cs |
dc.description.abstract | Cílem této práce bylo vytvořit model pro generování řádků ručně psaného písma. Model na základě očekávaného stylu a libovolně dlouhého textu vytváří odpovídají obrázek s písmem. Navržené řešení překonává existující přístupy v kvalitě generovaného písma a umožňuje generování jak samostatných slov, tak i řádků. Kombinuje vyhledávání příznaků pro jednotlivé symboly pomocí attention a jejich rozmístění na řádek pomocí vkládání mezer. Nový přístup umožňuje specifikovat pozice symbolů na řádku jemněji než celými čísly, a tak vytvářet plynulejší interpolace mezi různými styly. Na rozdíl od předchozího řešení tento přístup využívá Gaussův filtr pro rozšíření jednotlivých příznaků symbolů do blízkého okolí. Současně tento přístup otevírá množnost trénování modelu pro odhad pozic symbolů na řádku adversariální chybou (GAN). Navíc byly vytvořeny anotace horizontálních pozic symbolů na řádcích datové sady ručně psaného písma IAM. | cs |
dc.description.abstract | The aim of this study was to create a generative neural network for handwritten text lines. The model produces variable-sized images of handwritten text lines based on the expected style. The proposed method exceeds existing models in the image quality and can be used to generate both individual words and entire lines of handwritten text. It combines the use of the attention mechanism to extract the features for each character from the text query and their arranging on the line by inserting spaces between them. The new approach allows more granular control of the symbol positions on the line, which leads to smoother style interpolations. In contrast to the previous approach, the proposed method uses the Gaussian filter to spread the individual symbols features to the surrounding area. This approach also allows to train the model for symbols position predictions using the adversarial loss (GAN). In addition, annotations of symbol horizontal positions on the lines of the IAM dataset of handwritten text have been created. | en |
dc.description.mark | A | cs |
dc.identifier.citation | ŠEVČÍK, P. Generativní neuronové sítě pro ručně psané písmo [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022. | cs |
dc.identifier.other | 145455 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/207854 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Příprava trénovacích dat | cs |
dc.subject | ručně psané písmo | cs |
dc.subject | generativní neuronové sítě | cs |
dc.subject | GAN | cs |
dc.subject | AdaIN | cs |
dc.subject | Transformer | cs |
dc.subject | Generating training data | en |
dc.subject | handwritten text | en |
dc.subject | generative neural networks | en |
dc.subject | GAN | en |
dc.subject | AdaIN | en |
dc.subject | Transformer | en |
dc.title | Generativní neuronové sítě pro ručně psané písmo | cs |
dc.title.alternative | Generative Neural Networks for Handwritten Text | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2022-06-21 | cs |
dcterms.modified | 2022-06-23-09:13:57 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 145455 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:35:37 | en |
sync.item.modts | 2025.01.15 22:30:22 | en |
thesis.discipline | Strojové učení | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 10.82 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-24871_v.pdf
- Size:
- 86.06 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-24871_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-24871_o.pdf
- Size:
- 88.77 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-24871_o.pdf
Loading...
- Name:
- review_145455.html
- Size:
- 1.45 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_145455.html