Data Mining in Small Business

Loading...
Thumbnail Image
Date
ORCID
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato práce si klade za cíl vyhodnotit techniky získávání znalostí pro využití v prostředí malého podnikání. Po prozkoumání dat a konzultace s doménovymi experty byly vybrány dvě úlohy: analyza nákupního košíku a predikce prodejů. Pro analyzu nákupního košíku byl využit algoritmus Relim pro vyhledávání častych itemsetů a metriky určující zajímavost asociačních pravidel. Pro úlohu predikce prodejů byl implementován dekompoziční model, SARIMA, MARS a neuronové sítě s časovym oknem. Modely byly vyhodnoceny. Pomocí optimalizace hyper-parametrů bylo dosaženo přijatelnych vysledků. Oproti předpokladům nedošlo při dodání dat o počasí a využití nelineárních modelů ke zlepšení oproti SARIMA. Predikce byla implementována jako služba na straně serveru pro testování v produkčním prostředí.
This thesis has as an objective to evaluate techniques of data mining for use in small business. By examining data and consultations with domain experts, two approaches were chosen: market basket analysis and sales forecasting. For market basket analysis, Relim algorithm together with metrics measuring interestingness of association rules. For prediction task, decompostion model, SARIMA, MARS and time-lagged neural network models were implemented. Acceptable results were obtained by hyper-parameter optimization. In contrast to expectation, additional weather data and use of non-linear model did not improve accurancy above SARIMA model. Forecasting was implemented as a backend service for testing in production.
Description
Citation
SABOVČIK, F. Data Mining in Small Business [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2018.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Matematické metody v informačních technologiích
Comittee
prof. Ing. Tomáš Vojnar, Ph.D. (předseda) prof. RNDr. Alexandr Meduna, CSc. (místopředseda) doc. Mgr. Jaroslav Hrdina, Ph.D. (člen) Ing. Martin Hrubý, Ph.D. (člen) RNDr. Marek Rychlý, Ph.D. (člen) doc. Ing. František Zbořil, Ph.D. (člen)
Date of acceptance
2018-06-15
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D. Otázky u obhajoby: Který z vytvořených modelů dosahoval nejlepších výsledků? Lze doporučit jeden konkrétní model pro všechny testované podniky, nebo pro různé podniky jsou nejvhodnější různé modely?
Result of defence
práce byla úspěšně obhájena
Document licence
Přístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 3 roku/let
DOI
Collections
Citace PRO