Využití získávání znalostí pro data z PDF souborů
but.committee | doc. Dr. Ing. Dušan Kolář (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) doc. Ing. Michal Španěl, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponentky práce. Student následně odpověděl na otázky oponentky a na další otázky přítomných (účelu využití vytvořeného řešení v zadavatelské firmě a její spokojenosti, technických aspektů řešení, metod shlukové analýzy). Komise se na základě posudku oponentky, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře . Otázky u obhajoby: Proč jste pro extrakci dat z pdf dokumentů použil právě knihovnu pdfPlumber? Jaké jsou její výhody oproti jiným nástrojům? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Bartík, Vladimír | cs |
dc.contributor.author | Dvořáček, Libor | cs |
dc.contributor.referee | Burgetová, Ivana | cs |
dc.date.created | 2021 | cs |
dc.description.abstract | Bakalářská práce se zabývá extrakcí tabulek z digitálně vytvořených pdf a následným použitím získatých dat pro datovou analýzu. Použity jsou metody redukce dimenzí a shlukové analýzy. Hlavním obsahem je rozbor dostupných nástrojů pro extrakci dat v jazyce python, popis a porovnání použitých metod strojového učení a implementace aplikace, která všechna tato témata sdružuje do jednoho funkčního celku na adrese: http://extraktor.herokuapp.com | cs |
dc.description.abstract | This bachelor thesis deals with the extraction of tables from digitally created pdfs and the subsequent use of the obtained data for data analysis. Methods of dimension reduction and cluster analysis are used. The main content is an analysis of available tools for data extraction in the python language, a description and comparison of the used machine learning methods and implementation of an application that combines all these topics into one functional unit at: http://extraktor.herokuapp.com | en |
dc.description.mark | B | cs |
dc.identifier.citation | DVOŘÁČEK, L. Využití získávání znalostí pro data z PDF souborů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021. | cs |
dc.identifier.other | 136668 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/199479 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | data mining | cs |
dc.subject | získávání znalostí | cs |
dc.subject | Python | cs |
dc.subject | cs | |
dc.subject | PCA | cs |
dc.subject | Dendrogram | cs |
dc.subject | T-SNE | cs |
dc.subject | K-MEANS | cs |
dc.subject | UMAP | cs |
dc.subject | redukce dimenzí | cs |
dc.subject | vizualizace vícerozměrných dat | cs |
dc.subject | shluková analýza | cs |
dc.subject | Dash | cs |
dc.subject | Plotly | cs |
dc.subject | Heroku | cs |
dc.subject | data mining | en |
dc.subject | knowledge discovery | en |
dc.subject | Python | en |
dc.subject | en | |
dc.subject | PCA | en |
dc.subject | Dendrogram | en |
dc.subject | T-SNE | en |
dc.subject | K-MEANS | en |
dc.subject | UMAP | en |
dc.subject | dimensionality reduction | en |
dc.subject | visualization of high-dimensional datasets | en |
dc.subject | cluster analysis | en |
dc.subject | Dash | en |
dc.subject | Plotly | en |
dc.subject | Heroku | en |
dc.title | Využití získávání znalostí pro data z PDF souborů | cs |
dc.title.alternative | Use of Knowledge Discovery for Data from PDF Files | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2021-06-18 | cs |
dcterms.modified | 2021-06-19-12:16:50 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 136668 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:37:59 | en |
sync.item.modts | 2025.01.17 13:35:23 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 1.54 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-23895_v.pdf
- Size:
- 86.06 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-23895_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-23895_o.pdf
- Size:
- 88.58 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-23895_o.pdf
Loading...
- Name:
- review_136668.html
- Size:
- 1.46 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_136668.html