Srovnání heuristických a konvenčních statistických metod v data miningu

Loading...
Thumbnail Image

Date

Authors

Bitara, Matúš

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta strojního inženýrství

ORCID

Abstract

Táto práca sa zaoberá porovnaním konvenčných a heuristických metód v data miningu používaných na binárnu klasifikáciu. V teoretickej časti sú popísané štyri rôzne modely. Klasifikácia modelov je demonštrovaná na jednoduchých príkladoch. V praktickej časti sú modely porovnané na reálnych dátach. Táto časť obsahuje aj čistenie dát, odstránenie odľahlých hodnôt, dve rôzne transformácie a redukciu dimenzie. V poslednej časti sú popísané metódy používané na testovanie kvality modelu.
The thesis deals with the comparison of conventional and heuristic methods in data mining used for binary classification. In the theoretical part, four different models are described. Model classification is demonstrated on simple examples. In the practical part, models are compared on real data. This part also consists of data cleaning, outliers removal, two different transformations and dimension reduction. In the last part methods used to quality testing of models are described.

Description

Citation

BITARA, M. Srovnání heuristických a konvenčních statistických metod v data miningu [online]. Brno: Vysoké učení technické v Brně. Fakulta strojního inženýrství. 2019.

Document type

Document version

Date of access to the full text

Language of document

sk

Study field

Matematické inženýrství

Comittee

prof. RNDr. Zdeněk Pospíšil, Dr. (předseda) prof. RNDr. Jan Franců, CSc. (místopředseda) doc. Mgr. Jaroslav Hrdina, Ph.D. (člen) doc. RNDr. Libor Žák, Ph.D. (člen) doc. RNDr. Libor Čermák, CSc. (člen)

Date of acceptance

2019-06-10

Defence

Diplomant seznámil komisi s diplomovou prací a odpověděl na dvě otázky oponenta diplomové práce, docenta Žáka, který byl přítomen u obhajoby. Další otázky položili během obhajoby členové komise: Prof. Pospíšil: Uvažoval jste korelace? Byla to živá data? Doc. Hrdina: Zkoušel jste neuronové sítě? Proč jste zvolil Python? Prof. Franců: Která metoda je více citlivá na chyby měření?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO