Využití získávání znalostí pro data z PDF souborů

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) doc. Ing. Michal Španěl, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponentky práce. Student následně odpověděl na otázky oponentky a na další otázky přítomných (účelu využití vytvořeného řešení v zadavatelské firmě a její spokojenosti, technických aspektů řešení, metod shlukové analýzy). Komise se na základě posudku oponentky, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře . Otázky u obhajoby: Proč jste pro extrakci dat z pdf dokumentů použil právě knihovnu pdfPlumber? Jaké jsou její výhody oproti jiným nástrojům?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimírcs
dc.contributor.authorDvořáček, Liborcs
dc.contributor.refereeBurgetová, Ivanacs
dc.date.created2021cs
dc.description.abstractBakalářská práce se zabývá extrakcí tabulek z digitálně vytvořených pdf a následným použitím získatých dat pro datovou analýzu. Použity jsou metody redukce dimenzí a shlukové analýzy. Hlavním obsahem je rozbor dostupných nástrojů pro extrakci dat v jazyce python, popis a porovnání použitých metod strojového učení a implementace aplikace, která všechna tato témata sdružuje do jednoho funkčního celku na adrese: http://extraktor.herokuapp.comcs
dc.description.abstractThis bachelor thesis deals with the extraction of tables from digitally created pdfs and the subsequent use of the obtained data for data analysis. Methods of dimension reduction and cluster analysis are used. The main content is an analysis of available tools for data extraction in the python language, a description and comparison of the used machine learning methods and implementation of an application that combines all these topics into one functional unit at: http://extraktor.herokuapp.comen
dc.description.markBcs
dc.identifier.citationDVOŘÁČEK, L. Využití získávání znalostí pro data z PDF souborů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other136668cs
dc.identifier.urihttp://hdl.handle.net/11012/199479
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdata miningcs
dc.subjectzískávání znalostícs
dc.subjectPythoncs
dc.subjectPDFcs
dc.subjectPCAcs
dc.subjectDendrogramcs
dc.subjectT-SNEcs
dc.subjectK-MEANScs
dc.subjectUMAPcs
dc.subjectredukce dimenzícs
dc.subjectvizualizace vícerozměrných datcs
dc.subjectshluková analýzacs
dc.subjectDashcs
dc.subjectPlotlycs
dc.subjectHerokucs
dc.subjectdata miningen
dc.subjectknowledge discoveryen
dc.subjectPythonen
dc.subjectPDFen
dc.subjectPCAen
dc.subjectDendrogramen
dc.subjectT-SNEen
dc.subjectK-MEANSen
dc.subjectUMAPen
dc.subjectdimensionality reductionen
dc.subjectvisualization of high-dimensional datasetsen
dc.subjectcluster analysisen
dc.subjectDashen
dc.subjectPlotlyen
dc.subjectHerokuen
dc.titleVyužití získávání znalostí pro data z PDF souborůcs
dc.title.alternativeUse of Knowledge Discovery for Data from PDF Filesen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2021-06-18cs
dcterms.modified2021-06-19-12:16:50cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid136668en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:37:59en
sync.item.modts2025.01.17 13:35:23en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.54 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23895_v.pdf
Size:
86.06 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-23895_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23895_o.pdf
Size:
88.58 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-23895_o.pdf
Loading...
Thumbnail Image
Name:
review_136668.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
file review_136668.html
Collections