Statistická analýza dat z PDF souborů

but.committeedoc. Dr. Ing. Dušan Kolář (předseda) doc. Dr. Ing. Otto Fučík (místopředseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) doc. Ing. Michal Španěl, Ph.D. (člen)cs
but.defenceStudentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázku oponenta a na další otázky přítomných (ohledně identifikace tabulek v PDF souborech a extrakce informací, zpracování informací z pohledu regulárních jazyků). Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře . Otázky u obhajoby: Pokud uživatel vybere ručně část pdf dokumentu, která obsahuje tabulku, jaká nastavení se potom použijí pro vlastní extrakci dat?cs
but.jazykslovenština (Slovak)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBartík, Vladimírsk
dc.contributor.authorOltmanová, Kristínask
dc.contributor.refereeBurgetová, Ivanask
dc.date.created2021cs
dc.description.abstractTáto práca sa zaoberá problematikou získavania dát z tabuliek dokumentov vo formáte PDF a ich následnou analýzou s využitím štatistických nástrojov. Cieľom práce je demonštrovať proces získania, spracovania a vyhodnocovania dát na dopredu stanovenej vzorke dokumentov typu PDF, ktoré z hľadiska programového spracovania tvoria konečnú množinu podskupín so spoločnými vlastnosťami. Práca najskôr predstavuje základy spracovania PDF súborov a základné matematické princípy, ktoré sú potrebné k zhodnoteniu štatistických parametrov získaných dát. Získané teoretické princípy sú následne uvedené do praxe a do programovej podoby v programovacom jazyku Python. Výsledná webová aplikácia je naprogramovaná s využitím knižnice Flask a je použiteľná na lokálnom serveri.sk
dc.description.abstractThis thesis is concerning the process of data extraction from tables from documents in PDF format and their subsequent analysis with the exploitation of statistical methods. The goal of this thesis is to demonstrate the process of obtaining, processing and analyzing data from PDF files, which, in consideration of their program processing, create a finite number of subgroups with common characteristics. Firstly, the reader will become acquainted with the fundamentals of PDF file processing and basic mathematical principles that are required in order to statistically evaluate given data. Obtained theoretical principles are then applied to practical use and programming form in the Python programming language. The resulting web application is programmed using the Flask Python library and is usable on a local server.en
dc.description.markBcs
dc.identifier.citationOLTMANOVÁ, K. Statistická analýza dat z PDF souborů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other136664cs
dc.identifier.urihttp://hdl.handle.net/11012/199475
dc.language.isoskcs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectregulačný diagramsk
dc.subjectštatistická regulácia procesusk
dc.subjectShewhartov regulačný diagramsk
dc.subjectHotellingov regulačný diagramsk
dc.subjectindex spôsobilosti procesusk
dc.subjectextrakcia tabuliek z PDFsk
dc.subjectštatistická analýzask
dc.subjectPythonsk
dc.subjectFlasksk
dc.subjectwebová aplikáciask
dc.subjectcontrol charten
dc.subjectstatistical process controlen
dc.subjectShewhart control charten
dc.subjectHotelling control charten
dc.subjectprocess capability indexen
dc.subjectPDF table extractionen
dc.subjectstatistical analysisen
dc.subjectPythonen
dc.subjectFlasken
dc.subjectweb applicationen
dc.titleStatistická analýza dat z PDF souborůsk
dc.title.alternativeStatistical Analysis of Data from PDF Filesen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2021-06-18cs
dcterms.modified2021-06-19-12:16:50cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid136664en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:37:54en
sync.item.modts2025.01.17 15:07:08en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.81 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-23695_v.pdf
Size:
86.12 KB
Format:
Adobe Portable Document Format
Description:
file Posudek-Vedouci prace-23695_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-23695_o.pdf
Size:
88.61 KB
Format:
Adobe Portable Document Format
Description:
file Posudek-Oponent prace-23695_o.pdf
Loading...
Thumbnail Image
Name:
review_136664.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
file review_136664.html
Collections