Statistická analýza dat z PDF souborů
but.committee | doc. Dr. Ing. Dušan Kolář (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) doc. Ing. Michal Španěl, Ph.D. (člen) | cs |
but.defence | Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázku oponenta a na další otázky přítomných (ohledně identifikace tabulek v PDF souborech a extrakce informací, zpracování informací z pohledu regulárních jazyků). Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře . Otázky u obhajoby: Pokud uživatel vybere ručně část pdf dokumentu, která obsahuje tabulku, jaká nastavení se potom použijí pro vlastní extrakci dat? | cs |
but.jazyk | slovenština (Slovak) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Bartík, Vladimír | sk |
dc.contributor.author | Oltmanová, Kristína | sk |
dc.contributor.referee | Burgetová, Ivana | sk |
dc.date.created | 2021 | cs |
dc.description.abstract | Táto práca sa zaoberá problematikou získavania dát z tabuliek dokumentov vo formáte PDF a ich následnou analýzou s využitím štatistických nástrojov. Cieľom práce je demonštrovať proces získania, spracovania a vyhodnocovania dát na dopredu stanovenej vzorke dokumentov typu PDF, ktoré z hľadiska programového spracovania tvoria konečnú množinu podskupín so spoločnými vlastnosťami. Práca najskôr predstavuje základy spracovania PDF súborov a základné matematické princípy, ktoré sú potrebné k zhodnoteniu štatistických parametrov získaných dát. Získané teoretické princípy sú následne uvedené do praxe a do programovej podoby v programovacom jazyku Python. Výsledná webová aplikácia je naprogramovaná s využitím knižnice Flask a je použiteľná na lokálnom serveri. | sk |
dc.description.abstract | This thesis is concerning the process of data extraction from tables from documents in PDF format and their subsequent analysis with the exploitation of statistical methods. The goal of this thesis is to demonstrate the process of obtaining, processing and analyzing data from PDF files, which, in consideration of their program processing, create a finite number of subgroups with common characteristics. Firstly, the reader will become acquainted with the fundamentals of PDF file processing and basic mathematical principles that are required in order to statistically evaluate given data. Obtained theoretical principles are then applied to practical use and programming form in the Python programming language. The resulting web application is programmed using the Flask Python library and is usable on a local server. | en |
dc.description.mark | B | cs |
dc.identifier.citation | OLTMANOVÁ, K. Statistická analýza dat z PDF souborů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021. | cs |
dc.identifier.other | 136664 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/199475 | |
dc.language.iso | sk | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | regulačný diagram | sk |
dc.subject | štatistická regulácia procesu | sk |
dc.subject | Shewhartov regulačný diagram | sk |
dc.subject | Hotellingov regulačný diagram | sk |
dc.subject | index spôsobilosti procesu | sk |
dc.subject | extrakcia tabuliek z PDF | sk |
dc.subject | štatistická analýza | sk |
dc.subject | Python | sk |
dc.subject | Flask | sk |
dc.subject | webová aplikácia | sk |
dc.subject | control chart | en |
dc.subject | statistical process control | en |
dc.subject | Shewhart control chart | en |
dc.subject | Hotelling control chart | en |
dc.subject | process capability index | en |
dc.subject | PDF table extraction | en |
dc.subject | statistical analysis | en |
dc.subject | Python | en |
dc.subject | Flask | en |
dc.subject | web application | en |
dc.title | Statistická analýza dat z PDF souborů | sk |
dc.title.alternative | Statistical Analysis of Data from PDF Files | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2021-06-18 | cs |
dcterms.modified | 2021-06-19-12:16:50 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 136664 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:37:54 | en |
sync.item.modts | 2025.01.17 15:07:08 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 1.81 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-23695_v.pdf
- Size:
- 86.12 KB
- Format:
- Adobe Portable Document Format
- Description:
- file Posudek-Vedouci prace-23695_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-23695_o.pdf
- Size:
- 88.61 KB
- Format:
- Adobe Portable Document Format
- Description:
- file Posudek-Oponent prace-23695_o.pdf
Loading...
- Name:
- review_136664.html
- Size:
- 1.44 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_136664.html