Extrakce dat z dokumentů na základě analýzy rozložení

Loading...
Thumbnail Image

Date

Authors

Sedláček, Martin

Mark

D

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Diplomová práce se zabývá automatizovanou extrakcí dat z lékařských zpráv ve formátu PDF na základě analýzy rozložení dokumentu. Hlavním obsahem práce je uvedení čtenáře do problematiky extrakce dat, srovnávaní existujících nástrojů a představení návrhu a požadavků vyvíjeného nástroje, který bude založen nad aplikačním rámcem FitLayout. Práce dále popisuje samotnou implementaci nástroje v jazyce Java a komentuje výsledky, kterých nástroj dosáhl na reálných datech.
This thesis deals with automated data extraction from medical reports in PDF format based on document layout analysis. The main content of the thesis is an introduction to data extraction, a comparison of existing tools and a presentation of the design and requirements of the developed tool, which will be based on the FitLayout application framework. The thesis then describes the actual implementation of the tool in Java and comments on the results achieved by the tool on real data.

Description

Citation

SEDLÁČEK, M. Extrakce dat z dokumentů na základě analýzy rozložení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Informační systémy a databáze

Comittee

doc. Ing. Radek Burget, Ph.D. (předseda) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Šárka Květoňová, Ph.D. (člen)

Date of acceptance

2023-06-21

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO