Online nástroj pro rozpoznávání tabulek v obrázcích
Loading...
Date
Authors
Inhliziian, Bohdan
ORCID
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cilem teto prace je resit problem rozpoznavani tabulek v obrazcich a prevest vyfocenou tabulku, nahranou na webove rozhrani, do XLSX souboru. Program je vytvoreny s durazem na jednoduchost v pouziti potencialnim uzivatelem. Pro detekce car byl pouzit algoritmus Probablistic Hough Transform a pomoci nastroju Tesseract byla provedena detekce textu v bunkach. Program byl umistneni na Amazon AWS a pristup k nemu webova aplikace dela pomoci API. Byl vytvoren vlastni algoritmus pro spojeni car do jedne cary a taky algoritmus pro odstraneni car, ktere nepatri do tabulky a chybne detekovanych car (text, sum). Vytvorene reseni poskytuje moznost uzivatelum, ktere rucne prepisuji data z tabulek v dokumentech, knihach, vyuzit program, ktery dela vsechno automaticky, je potreba jen nahrat foto do webove aplikace.
This work solves the problem of recognising the tables in the figures. The goal is to convert the table into an XLS file thought web application. For line detection we have used the Probablistic Hough Transform algorithm and Tesse- ract tool was used to detect text in cells. The program was stored to the Amazon AWS and accessed by the web app using the API. An algorithm for line merging has been created, as well as an algorithm for removing lines that do not belong to the table and removing wrong detected lines (text, noise). The solution provides users who manually overwrite data from tables in documents, books, use a program that does everything automatically, you only need to upload photos to a web application.
This work solves the problem of recognising the tables in the figures. The goal is to convert the table into an XLS file thought web application. For line detection we have used the Probablistic Hough Transform algorithm and Tesse- ract tool was used to detect text in cells. The program was stored to the Amazon AWS and accessed by the web app using the API. An algorithm for line merging has been created, as well as an algorithm for removing lines that do not belong to the table and removing wrong detected lines (text, noise). The solution provides users who manually overwrite data from tables in documents, books, use a program that does everything automatically, you only need to upload photos to a web application.
Description
Citation
INHLIZIIAN, B. Online nástroj pro rozpoznávání tabulek v obrázcích [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. Richard Růžička, Ph.D., MBA (předseda)
doc. Ing. Ondřej Ryšavý, Ph.D. (místopředseda)
Ing. Jaroslav Dytrych, Ph.D. (člen)
Ing. Bohuslav Křena, Ph.D. (člen)
doc. Ing. Michal Španěl, Ph.D. (člen)
Date of acceptance
2019-08-29
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Komise shledala, že předložená práce nedosahuje minimální úrovně požadované pro bakalářské práce. Komise se rozhodla hodnotit práci jako nevyhovující " F ". Otázky u obhajoby: Jak vypadá architektura neuronové sítě použité pro detekci rohů tabulky, jak jste měřil její úspěšnost? Jak je v aplikaci řešena situace, kdy je ve vstupním obrázku detekováno více míst pro jeden typ rohu, jako je tomu například na obrázku 4.4? Je v aplikaci řešena situace, kdy některý z rohů není vůbec detekován? Jak se aplikace zachová, pokud je na jednom obrázku více tabulek?
Result of defence
práce nebyla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení