Příprava cvičení pro dolování znalostí z báze dat - klasifikace a predikce

Loading...
Thumbnail Image

Date

Authors

Martiník, Jan

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Diplomová práce na téma "Příprava cvičení pro dolování znalostí z báze dat - klasifikace a predikce" pojednává o nejčastěji používaných metodách klasifikace a predikce. Mezi metody klasifikace byly zahrnuty asociační pravidla, Bayesovské klasifikace, genetické algoritmy, metoda nejbližšího souseda, neuronové sítě a rozhodovací stromy. Metody predikce obsahují lineární a nelineární regresi. V práci je podrobně shrnuta problematika rozhodovacích stromů a je zde detailně popsán algoritmus pro tvorbu rozhodovacího stromu včetně jednotlivých vývojových diagramů. Navržený algoritmus pro tvorbu rozhodovacího stromu je testován dvěma testy prostřednictvím dat stažených z internetových stránek. Výsledky jsou vzájemně porovnány a jsou popsány rozdíly mezi oběma implementacemi. Práce je napsaná tak, aby čtenář po jejím přečtení získal představu o jednotlivých metodách a postupech při dolování znalostí z báze dat, jejich výhodách, nevýhodách a problematice, která je s nimi úzce spjatá.
My master's thesis on the topic of "Design of exercises for data mining - Classification and prediction" deals with the most frequently used methods classification and prediction. There are association rules, Bayesian classification, genetic algorithms, the nearest method neighbor, neural network and decision trees on the classification. There are linear and non-linear prediction on the prediction. This work also contains a summary of detail the issue of decision trees and a detailed algorithm for creating the decision tree, including development of individual diagrams. The proposed algorithm for creating the decision tree is tested through two tests of data dowloaded from Internet. The results are mutually compared and described differences between the two implementations. The work is written in a way that would provide the reader with a notion of the individual methods and techniques for data mining, their advantages, disadvantages and some of the issues that directly relate to this topic.

Description

Citation

MARTINÍK, J. Příprava cvičení pro dolování znalostí z báze dat - klasifikace a predikce [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2009.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Telekomunikační a informační technika

Comittee

doc. Ing. Ivan Rampl, CSc. (předseda) doc. Ing. Martin Medvecký, Ph.D. (místopředseda) doc. Ing. Anna Přibilová, Ph.D. (člen) Ing. Ladislav Káňa (člen) doc. Ing. Radim Burget, Ph.D. (člen) doc. Ing. Jiří Schimmel, Ph.D. (člen) prof. Ing. Jaroslav Koton, Ph.D. (člen)

Date of acceptance

2009-06-09

Defence

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO