Extrakce dat z dokumentů na základě analýzy rozložení

but.committeedoc. Ing. Radek Burget, Ph.D. (předseda) doc. Ing. Petr Matoušek, Ph.D., M.A. (člen) prof. RNDr. Alexandr Meduna, CSc. (člen) RNDr. Marek Rychlý, Ph.D. (člen) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Šárka Květoňová, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.cs
but.jazykčeština (Czech)
but.programInformační technologie a umělá inteligencecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBurget, Radekcs
dc.contributor.authorSedláček, Martincs
dc.contributor.refereeBartík, Vladimírcs
dc.date.accessioned2023-07-17T08:06:53Z
dc.date.available2023-07-17T08:06:53Z
dc.date.created2023cs
dc.description.abstractDiplomová práce se zabývá automatizovanou extrakcí dat z lékařských zpráv ve formátu PDF na základě analýzy rozložení dokumentu. Hlavním obsahem práce je uvedení čtenáře do problematiky extrakce dat, srovnávaní existujících nástrojů a představení návrhu a požadavků vyvíjeného nástroje, který bude založen nad aplikačním rámcem FitLayout. Práce dále popisuje samotnou implementaci nástroje v jazyce Java a komentuje výsledky, kterých nástroj dosáhl na reálných datech.cs
dc.description.abstractThis thesis deals with automated data extraction from medical reports in PDF format based on document layout analysis. The main content of the thesis is an introduction to data extraction, a comparison of existing tools and a presentation of the design and requirements of the developed tool, which will be based on the FitLayout application framework. The thesis then describes the actual implementation of the tool in Java and comments on the results achieved by the tool on real data.en
dc.description.markDcs
dc.identifier.citationSEDLÁČEK, M. Extrakce dat z dokumentů na základě analýzy rozložení [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2023.cs
dc.identifier.other146958cs
dc.identifier.urihttp://hdl.handle.net/11012/211935
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectPDFcs
dc.subjectextrakcecs
dc.subjectdatacs
dc.subjectFitLayoutcs
dc.subjectJavacs
dc.subjectSwingcs
dc.subjectFN Bnrocs
dc.subjectrozložení dokumentucs
dc.subjectzískávání datcs
dc.subjectPDFen
dc.subjectextractionen
dc.subjectdataen
dc.subjectFitLayouten
dc.subjectJavaen
dc.subjectSwingen
dc.subjectFN Brnoen
dc.subjectdocument layouten
dc.subjectlayout-baseden
dc.subjectdata extractionen
dc.titleExtrakce dat z dokumentů na základě analýzy rozloženícs
dc.title.alternativeLayout-based Data Extraction from Documentsen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2023-06-21cs
dcterms.modified2023-06-21-15:59:07cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid146958en
sync.item.dbtypeZPen
sync.item.insts2023.07.17 10:06:53en
sync.item.modts2023.07.17 09:36:14en
thesis.disciplineInformační systémy a databázecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
3.32 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_146958.html
Size:
10.15 KB
Format:
Hypertext Markup Language
Description:
review_146958.html
Collections