Analýza obsahu dokumentů pomocí grafových neuronových sítí

Loading...
Thumbnail Image
Date
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
V tejto práci sa zameriaveme na analýzu dokumentov pomocou grafových neuronových sietí. Na začiatok si predstavíme ako tieto grafove konvolučné siete fungujú a predstavíme si koncept na základe ktorého sa dajú naimplementovať. Ďalej rozoberieme súčasné riešenia ktoré sa zaoberajú semantickým označovaním entít v skenovaných dokumentoch, čo je aj cieľom tejto práce. Následne si predstavíme navrh riešenie ktoré by malo riešiť túto problematiku spolu s ďaľším problémom na ktorý sa chceme zamariať v tejto práci a tým je výber textových entít z dokumentov pomocou aktívneho učenia. Postupne si predstavíme ako bolo toto riešenie implementované a aké nástroje sme pritom použili. Pred koncom si predstavíme dataset ktorý sme annotovali pre vyhodnotenie a tréning našeho riešenia. Na záver si predstavíme výsledky tejto práce, porovnáme vysledky s ostatnými prístupmi ktoré sa zamerievajú na podobný problém a ešte vyhodnotíme ako náš model zvládol extrakciu informácii pomocou aktívneho učenia.
In this thesis we use for graph neural networks for document analysis. In the beggining we introduce how these graph convolutional networks work and also we introduce concept which is used for their implementation. Next, we explain current solution that solves semantic labeling of text entities in scanned documents, what is also same as the goal of this thesis. In following chapter we present solution which should be used for the mentioned problem as well as another problem which is extraction of specific data using active learning. Gradually, we explain how this solution was implemented and what tools we have used. Before ending, we show our dataset, we have annotated and we meant to use for evaluation and training of our solution. In the end, we present results of this thesis, compare our model with others and also evaluate how our model was able to extract specified data using active learning.
Description
Citation
PATRIK, N. Analýza obsahu dokumentů pomocí grafových neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Bioinformatika a biocomputing
Comittee
prof. Ing. Lukáš Sekanina, Ph.D. (předseda) doc. Ing. Zdeněk Vašíček, Ph.D. (člen) Ing. Ondřej Lengál, Ph.D. (člen) doc. Ing. Jiří Jaroš, Ph.D. (člen) Ing. Ivana Burgetová, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen)
Date of acceptance
2023-06-19
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO