Získávání znalostí z datových skladů
Loading...
Date
Authors
Pumprla, Ondřej
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Diplomová práce se zabývá principy procesu získávání znalostí se zaměřením na asociační pravidla. Je vybudován teoretický aparát obecného popisu a principů tvorby datových skladů. Na základě těchto teoretických poznatků je implementována aplikace pro získávání asociačních pravidel. Aplikace očekává data buď v transakční nebo multidimenzionální podobě ve schématu hvězdy. Implementované algoritmy na hledání frekventovaných množin jsou Apriori a FP-strom. Systém umožňuje variantní nastavení parametrů dolování a byly provedeny ověřovací výkonnostní testy. Z pohledu podpory hledání asociačních pravidel se výsledná aplikace jeví robustnější než existující porovnávané systémy SAS a Oracle Data Miner.
This Master's thesis deals with the principles of the data mining process, especially with the mining of association rules. The theoretical apparatus of general description and principles of the data warehouse creation is set. On the basis of this theoretical knowledge, the application for the association rules mining is implemented. The application requires the data in the transactional form or the multidimensional data organized in the Star schema. The implemented algorithms for finding of the frequent patterns are Apriori and FP-tree. The system allows the variant setting of parameters for mining process. Also, the validation tests and efficiency proofs were accomplished. From the point of view of the association rules searching support, the resultant application is more applicable and robust than the existing compared systems SAS Miner and Oracle Data Miner.
This Master's thesis deals with the principles of the data mining process, especially with the mining of association rules. The theoretical apparatus of general description and principles of the data warehouse creation is set. On the basis of this theoretical knowledge, the application for the association rules mining is implemented. The application requires the data in the transactional form or the multidimensional data organized in the Star schema. The implemented algorithms for finding of the frequent patterns are Apriori and FP-tree. The system allows the variant setting of parameters for mining process. Also, the validation tests and efficiency proofs were accomplished. From the point of view of the association rules searching support, the resultant application is more applicable and robust than the existing compared systems SAS Miner and Oracle Data Miner.
Description
Keywords
Získávání znalostí, Dolování dat, Datový sklad, OLAP, Multidimenzionální model, Datové schéma hvězdy, ETL proces, Oracle Warehouse Builder 11 g, Frekventované množiny, Asociační pravidla, Apriori, FP-strom, Knowledge discovery, Data mining, Data Warehouse, OLAP, Multidimensional model, Star schema, ETL, Oracle Warehouse Builder 11 g, Frequent Patterns, Association rules, Apriori, FP-tree
Citation
PUMPRLA, O. Získávání znalostí z datových skladů [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační systémy
Comittee
Date of acceptance
Defence
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení