Dolování z dat v jazyce Python
but.committee | doc. Dr. Ing. Petr Hanáček (předseda) prof. Ing. Miroslav Švéda, CSc. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) Ing. Zbyněk Křivka, Ph.D. (člen) Ing. Vladimír Veselý, Ph.D. (člen) doc. Ing. Václav Zeman, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázku oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " C ". Otázky u obhajoby: Podle jakých kritérií jste volil data pro případové studie? Uvažoval jste i o jiných? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Zendulka, Jaroslav | cs |
dc.contributor.author | Šenovský, Jakub | cs |
dc.contributor.referee | Bartík, Vladimír | cs |
dc.date.created | 2017 | cs |
dc.description.abstract | Cílem této práce bylo seznámení se s jednotlivými fázemi získávání znalostí z dat, s podporou programovacích jazyků Python a R v oblasti dolování dat a demonstrace jejich použití na dvou případových studiích. Následným krokem bylo porovnání těchto jazyků z hlediska dolování dat. Je zde popsaná fáze předzpracování dat a dolovací algoritmy pro klasifikaci, predikci a shlukování. Představeny zde byly významné knihovny pro jazyky Python a R. V první případové studii byla demonstrována práce s časovými řadami pomocí ARIMA modelu a neuronových sítí s ověřením přesnosti pomocí střední kvadratické chyby. V druhé případové studii byla popsaná klasifikace výsledků fotbalových zápasů pomocí k - nejbližších sousedů, Bayesova klasifikátoru, náhodného lesu a logické regrese. Přesnost klasifikace byla zobrazena pomocí skóre přesnosti a konfúzní matice. Práci uzavírá zhodnocení výsledků a návrhy pro budoucí vylepšení jednotlivých modelů. | cs |
dc.description.abstract | The main goal of this thesis was to get acquainted with the phases of data mining, with the support of the programming languages Python and R in the field of data mining and demonstration of their use in two case studies. The comparison of these languages in the field of data mining is also included. The data preprocessing phase and the mining algorithms for classification, prediction and clustering are described here. There are illustrated the most significant libraries for Python and R. In the first case study, work with time series was demonstrated using the ARIMA model and Neural Networks with precision verification using a Mean Square Error. In the second case study, the results of football matches are classificated using the K - Nearest Neighbors, Bayes Classifier, Random Forest and Logical Regression. The precision of the classification is displayed using Accuracy Score and Confusion Matrix. The work is concluded with the evaluation of the achived results and suggestions for the future improvement of the individual models. | en |
dc.description.mark | C | cs |
dc.identifier.citation | ŠENOVSKÝ, J. Dolování z dat v jazyce Python [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2017. | cs |
dc.identifier.other | 106449 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/69589 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Získávání znalostí | cs |
dc.subject | Python | cs |
dc.subject | R | cs |
dc.subject | předzpracování dat | cs |
dc.subject | shlukování | cs |
dc.subject | predikce | cs |
dc.subject | klasifikace | cs |
dc.subject | případové studie | cs |
dc.subject | ARIMA | cs |
dc.subject | porovnání Python a R | cs |
dc.subject | Bayes | cs |
dc.subject | knn. | cs |
dc.subject | Data mining | en |
dc.subject | Python | en |
dc.subject | R | en |
dc.subject | Data Preprocessing | en |
dc.subject | Clustering | en |
dc.subject | Prediction | en |
dc.subject | Classification | en |
dc.subject | Case studies | en |
dc.subject | ARIMA | en |
dc.subject | comparison Python and R | en |
dc.subject | Bayes | en |
dc.subject | knn. | en |
dc.title | Dolování z dat v jazyce Python | cs |
dc.title.alternative | Data Mining with Python | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2017-06-21 | cs |
dcterms.modified | 2020-05-10-16:13:07 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 106449 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:25:47 | en |
sync.item.modts | 2025.01.17 14:03:41 | en |
thesis.discipline | Bezpečnost informačních technologií | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav informačních systémů | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.81 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-20060_v.pdf
- Size:
- 86.07 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-20060_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-20060_o.pdf
- Size:
- 88.2 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-20060_o.pdf
Loading...
- Name:
- review_106449.html
- Size:
- 1.43 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_106449.html