Generativní neuronové sítě pro ručně psané písmo

but.committeeprof. Dr. Ing. Jan Černocký (předseda) doc. Ing. Lukáš Burget, Ph.D. (místopředseda) doc. RNDr. Milan Češka, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Jaroslav Rozman, Ph.D. (člen) doc. Ing. František Zbořil, CSc. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Do trénování celého modelu pro generování písma je zapojená i OCR síť (označená jako "R"). Je tato síť předtrénovaná, nebo se trénuje od začátku (společně se zbytkem modelu)? Jak přesně probíhají jednotlivé iterace dekodéru v autoregresivní síti "S" (na obrázku 4.6 na straně 28)?cs
but.jazykčeština (Czech)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorHradiš, Michalcs
dc.contributor.authorŠevčík, Pavelcs
dc.contributor.refereeDobeš, Petrcs
dc.date.created2022cs
dc.description.abstractCílem této práce bylo vytvořit model pro generování řádků ručně psaného písma. Model na základě očekávaného stylu a libovolně dlouhého textu vytváří odpovídají obrázek s písmem. Navržené řešení překonává existující přístupy v kvalitě generovaného písma a umožňuje generování jak samostatných slov, tak i řádků. Kombinuje vyhledávání příznaků pro jednotlivé symboly pomocí attention a jejich rozmístění na řádek pomocí vkládání mezer. Nový přístup umožňuje specifikovat pozice symbolů na řádku jemněji než celými čísly, a tak vytvářet plynulejší interpolace mezi různými styly. Na rozdíl od předchozího řešení tento přístup využívá Gaussův filtr pro rozšíření jednotlivých příznaků symbolů do blízkého okolí. Současně tento přístup otevírá množnost trénování modelu pro odhad pozic symbolů na řádku adversariální chybou (GAN). Navíc byly vytvořeny anotace horizontálních pozic symbolů na řádcích datové sady ručně psaného písma IAM.cs
dc.description.abstractThe aim of this study was to create a generative neural network for handwritten text lines. The model produces variable-sized images of handwritten text lines based on the expected style. The proposed method exceeds existing models in the image quality and can be used to generate both individual words and entire lines of handwritten text. It combines the use of the attention mechanism to extract the features for each character from the text query and their arranging on the line by inserting spaces between them. The new approach allows more granular control of the symbol positions on the line, which leads to smoother style interpolations. In contrast to the previous approach, the proposed method uses the Gaussian filter to spread the individual symbols features to the surrounding area. This approach also allows to train the model for symbols position predictions using the adversarial loss (GAN). In addition, annotations of symbol horizontal positions on the lines of the IAM dataset of handwritten text have been created.en
dc.description.markAcs
dc.identifier.citationŠEVČÍK, P. Generativní neuronové sítě pro ručně psané písmo [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.cs
dc.identifier.other145455cs
dc.identifier.urihttp://hdl.handle.net/11012/207854
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectPříprava trénovacích datcs
dc.subjectručně psané písmocs
dc.subjectgenerativní neuronové sítěcs
dc.subjectGANcs
dc.subjectAdaINcs
dc.subjectTransformercs
dc.subjectGenerating training dataen
dc.subjecthandwritten texten
dc.subjectgenerative neural networksen
dc.subjectGANen
dc.subjectAdaINen
dc.subjectTransformeren
dc.titleGenerativní neuronové sítě pro ručně psané písmocs
dc.title.alternativeGenerative Neural Networks for Handwritten Texten
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2022-06-21cs
dcterms.modified2022-06-23-09:13:57cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid145455en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:35:37en
sync.item.modts2025.01.15 22:30:22en
thesis.disciplineStrojové učenícs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
10.82 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-24871_v.pdf
Size:
86.06 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-24871_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-24871_o.pdf
Size:
88.77 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-24871_o.pdf
Loading...
Thumbnail Image
Name:
review_145455.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_145455.html
Collections