Analýza rozložení textu v historických dokumentech

Loading...
Thumbnail Image

Date

Authors

Palacková, Bianca

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Cieľom tejto diplomovej práce je navrhnúť a implementovať algoritmus na analýzu rozloženia textu v historických dokumentoch. Pri riešení tohto problému bola využitá neurónová sieť, konkrétne architektúra Faster-RCNN. Na trénovanie a otestovanie algortimu bol využitý dataset so 6 135 obrázkami dobových novín. V rámci práce boli natrénované 4 modely neurónových sietí: model na detekciu slov, nadpisov, textových regiónov a model detekujúci slová na základe ich polohy v riadku. Výstupy z týchto sietí boli vhodne spracované, s cieľom detekovať rozloženie textu na vstupnom obrázku. Na evaluáciu bola použitá upravená metrika F-score, na základe ktorej algoritmus dosiahol presnosť takmer 80 %.
The goal of this thesis is to design and implement algorithm for text layout analysis in historical documents. Neural network was used to solve this problem, specifically architecture Faster-RCNN. Dataset of 6 135 images with historical newspaper was used for training and testing. For purpose of the thesis four models of neural networks were trained: model for detection of words, headings, text regions and model for words detection based on position in line. Outputs from these models were processed in order to determine text layout in input image. A modified F-score metric was used for the evaluation. Based on this metric, the algorithm reached an accuracy almost 80 %.

Description

Citation

PALACKOVÁ, B. Analýza rozložení textu v historických dokumentech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Počítačové vidění

Comittee

prof. Dr. Ing. Jan Černocký (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) Ing. David Bařina, Ph.D. (člen) doc. Ing. Vítězslav Beran, Ph.D. (člen) Ing. Ondřej Lengál, Ph.D. (člen) prof. Dr. Ing. Pavel Zemčík, dr. h. c. (člen)

Date of acceptance

2021-06-24

Defence

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Detekce odstavců se trénuje a vyhodnocuje na celých snímcích? Jaké je rozlišení? Jak dobře systém funguje v porovnání s něčím existujícím (Transkribus, PERO, ABBYY, Tesseract)? Jak jsou velká slova vůči rozlišení výstupu backbone sítě? Využila jste předtrénovanou síť?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO