Grafové neuronové sítě pro analýzu rozložení stránek
Loading...
Date
Authors
Otčenáš, Matej
ORCID
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cieľom tejto práce je experimentálne otestovať silu grafových neurónových sietí pri komplexnej analýze rozloženia dokumentov. Z pohľadu typov dokumentov sú cieľom predovšetkým novinové články a historické spisy, ako napríklad ručne písané knihy alebo stredoveké manuskripty. Tie sa totižto vyznačujú komplexnosťou svojho rozloženia, nemajú pevne danú štruktúru alebo je samotný text veľmi členitý. Práca sa zaoberá vytvorením vhodných datasetov, ktoré slúžia na natrénovanie a otestovanie prístupu pre globálne zoradenie postupnosti čítania riadkov stránky a pridelením jednej z množiny zadefinovaných tried každému riadku. Predmetom skúmania je taktiež vytvorenie vhodnej reprezentácie grafu, ktorý bude zachytávať vzťahy medzi jednotlivými komponentami na stránke a zvolením vhodnej grafovej neurónovej siete s príslušnými parametrami. Na záver sú jednotlivé prístupy vyhodnotené a porovnané na viacerých metrikách vhodných pre danú problematiku a zistenia zosumarizované s diskusiou o možných vylepšeniach a limitáciach.
The aim of this work is to experimentally test the power of graph neural networks in the comprehensive analysis of document layout. In terms of document types, the focus is primarily on newspaper articles and historical writings, such as handwritten books or medieval manuscripts. These are characterized by the complexity of their layout, lacking a fixed structure or having highly segmented text. The work deals with the creation of suitable datasets for training and testing an approach for globally ordering the sequence of reading lines on a page and assigning each line to one of the defined classes. The research also involves creating an appropriate representation of a graph that captures relationships between individual components on the page and selecting a suitable graph neural network with the appropriate parameters. Finally, the different approaches are evaluated and compared on multiple metrics suitable for the given problem, and the findings are summarized with a discussion on possible enhancements and limitations.
The aim of this work is to experimentally test the power of graph neural networks in the comprehensive analysis of document layout. In terms of document types, the focus is primarily on newspaper articles and historical writings, such as handwritten books or medieval manuscripts. These are characterized by the complexity of their layout, lacking a fixed structure or having highly segmented text. The work deals with the creation of suitable datasets for training and testing an approach for globally ordering the sequence of reading lines on a page and assigning each line to one of the defined classes. The research also involves creating an appropriate representation of a graph that captures relationships between individual components on the page and selecting a suitable graph neural network with the appropriate parameters. Finally, the different approaches are evaluated and compared on multiple metrics suitable for the given problem, and the findings are summarized with a discussion on possible enhancements and limitations.
Description
Citation
OTČENÁŠ, M. Grafové neuronové sítě pro analýzu rozložení stránek [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Strojové učení
Comittee
doc. Ing. Lukáš Burget, Ph.D. (předseda)
doc. RNDr. Pavel Smrž, Ph.D. (člen)
Ing. Zbyněk Křivka, Ph.D. (člen)
doc. Ing. František Zbořil, Ph.D. (člen)
Ing. František Grézl, Ph.D. (člen)
Ing. Vojtěch Mrázek, Ph.D. (člen)
Date of acceptance
2024-06-19
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení