Klasifikační framework
Loading...
Date
Authors
Koroncziová, Dominika
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cílem této práce je návrh a implementace klasifikačního software postaveného na knihovně RapidMiner. Výsledná aplikace bude sdružovat nejpoužívanější algoritmy a procesy implementované v RapidMineru do jednoduchého použitelného programu. Součástí nároků na aplikaci je jednoduché rozhraní pro ovládání z příkazové řádky, stejně jako grafické rozhraní zjednodušující nastavení více parametrů. Aplikace má také umožňovat tvorbu samostatných jednoúčelových programů, sloužících na opakovanou klasifikaci s použitím předem natrénovaného modelu. Nad rámec původního zadání je implementována i práce s textovými daty z Wikipedie, jejich stáhnutí a předzpracování a následné použití jako trénovacích dat. Text práce se zabývá postupně jednotlivými algoritmy a popisem kvalifikačních algoritmů, jejich vlastnostmi a použitím, a popisuje návrh a implementaci systému. V rámci práce byla vykonána i sada několika testů pro ověření výkonu a funkcionality aplikace. Jejich výsledky jsou shrnuty v závěru práce.
The goal of this work is the design and implementation of a machine learning software, based on the RapidMiner library. The finished application integrates the most commonly used algorithms and processes implemented in RapidMiner into an easily usable program. The application contains a simple command line interface, as well as a graphic interface to simplify selection of multiple parameters. The program also provides a tool to create standalone programs, that can be used for classification with a pre-trained model. On top of the original requirements the possibility to work with textual data from Wikipedia was also implemented, providing a tool for downloading and preprocessing of the data in order to use them as training input. This text focuses on the specifics of the algorithms and classifiers used and on their features and uses, and describes the design and implementation of the system. As part of this work, several tests were run in order to validate the efficiency and functionality of the program. The test results are included at the end of the thesis.
The goal of this work is the design and implementation of a machine learning software, based on the RapidMiner library. The finished application integrates the most commonly used algorithms and processes implemented in RapidMiner into an easily usable program. The application contains a simple command line interface, as well as a graphic interface to simplify selection of multiple parameters. The program also provides a tool to create standalone programs, that can be used for classification with a pre-trained model. On top of the original requirements the possibility to work with textual data from Wikipedia was also implemented, providing a tool for downloading and preprocessing of the data in order to use them as training input. This text focuses on the specifics of the algorithms and classifiers used and on their features and uses, and describes the design and implementation of the system. As part of this work, several tests were run in order to validate the efficiency and functionality of the program. The test results are included at the end of the thesis.
Description
Keywords
RapidMiner, strojové učenie, spracovanie textov, klasifikátory, tf-idf, SVM, neurónové siete, k-najbližších susedov, Naive Bayes, krížová validácia, Java, Swing, RapidMiner, machine learning, text processing, classifiers, tf-idf, SVM, neural networks, k-nearest neighbors, Naive Bayes, cross-validation, Java, Swing
Citation
KORONCZIOVÁ, D. Klasifikační framework [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2014.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Ing. Miroslav Švéda, CSc. (předseda)
doc. RNDr. Jitka Kreslíková, CSc. (místopředseda)
doc. Ing. Vítězslav Beran, Ph.D. (člen)
doc. Ing. Michal Bidlo, Ph.D. (člen)
Ing. Bohuslav Křena, Ph.D. (člen)
Date of acceptance
2014-08-25
Defence
Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: Podle čeho jste vybírala algoritmy, které jste do Vašeho frameworku zařadila? V kapitole 6 uvádíte, že jste pro testování nepoužila datovou sadu z Wikipedie kvůli tomu, že na ní klasifikátory lehce dosahovaly úspěšnosti téměř 100 %. Můžete prosím komisi tento experiment detailněji popsat a uvést nějaké příklady?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení