Extrakce informací z formulářů pomocí neuronových sítí

but.committeeprof. Ing. Adam Herout, Ph.D. (předseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. Mgr. Adam Rogalewicz, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorKostelník, Martinen
dc.contributor.authorKaska, Karelen
dc.contributor.refereeKohút, Janen
dc.date.created2025cs
dc.description.abstractCílem této bakalářské práce bylo prozkoumat možnost extrakce informací z formulářů s pomocí neuronových sítí. Práce začíná pokrytím teorie o zpracování přirozeného jazyka. Poté následuje přehled extrakce informací a popis rozpoznávání pojmenovaných entit. Na to dále navazuje představení datových sad, které jsou relevantní pro formuláře. V implementační části je popsán proces vytváření nové datové sady formulářů. Také je popsána příprava skriptů pro doladění modelů pro rozpoznávání pojmenovaných entit. Doladěné modely obsahují pouze textové modely jako například Czert, stejně jako modely s ohledem na rozvržení textu na straně jako například LiLT. Konečná kapitola obsahuje část s experimenty, která obsahuje experimenty s modely laděné pro rozpoznávání pojmenovaných entit na formulářích.en
dc.description.abstractThe goal of this bachelor's thesis was to explore the possibility of information extraction from form-like documents using neural networks. The work starts by covering the theory of natural language representation. Then comes an overview of information extraction and the description of Named Entity Recognition. After that follows an introduction to existing datasets that are relevant to forms. In the implementation part, the process of creating a new form dataset is laid out. The preparation of the scripts for fine-tuning the models for named entity recognition is also described. The fine-tuned models include text-only models such as Czert as well as layout-aware models such as LiLT. In the end comes the experimental part, which includes experimenting with the Named Entity Recognition fine-tuned models on forms.cs
dc.description.markCcs
dc.identifier.citationKASKA, K. Extrakce informací z formulářů pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other164602cs
dc.identifier.urihttp://hdl.handle.net/11012/252809
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectBERTen
dc.subjectextrakce informacíen
dc.subjectRozpoznávání pojmenovaných entiten
dc.subjecttransformersen
dc.subjectNER dataseten
dc.subjectCzerten
dc.subjectRobeczechen
dc.subjectUmělá inteligenceen
dc.subjectBERTcs
dc.subjectInformation Extractioncs
dc.subjectNamed Entity Recognitioncs
dc.subjectTransformerscs
dc.subjectNER Datasetcs
dc.subjectCzertcs
dc.subjectRobeczechcs
dc.subjectArtificial intelligencecs
dc.titleExtrakce informací z formulářů pomocí neuronových sítíen
dc.title.alternativeInformation Extraction from Form-like Documentscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-16cs
dcterms.modified2025-08-20-11:57:48cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid164602en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:03:50en
sync.item.modts2025.08.26 20:01:43en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
15 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_164602.html
Size:
10.09 KB
Format:
Hypertext Markup Language
Description:
file review_164602.html

Collections