Programovací jazyk Scala a jeho využití pro analýzu dat
Loading...
Date
Authors
Kohout, Tomáš
ORCID
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Tato práce se zabývá porovnáním jazyka Scala s ostatními běžně používanými jazyky pro analýzu dat. Tyto jazyky se porovnávají z hlediska manipulace a zobrazení dat, strojvého učení a souběžného zpracování. Z tohoto porovnání následně vyplynou silné a slabé stránky jazyka Scala. Silné stránky jsou demonstrovány na implementované aplikaci pro kategorizaci e-mailů.
This thesis deals with comparing the Scala programming language with other commonly used languages for data analysis. These languages are evaluated on the basis of the following categories: data manipulation and visualization, machine learning and concurent processing capabilities. The evaluation then shows the strengths and weaknesses of Scala. The strengths will be demonstrated on application for email categorization.
This thesis deals with comparing the Scala programming language with other commonly used languages for data analysis. These languages are evaluated on the basis of the following categories: data manipulation and visualization, machine learning and concurent processing capabilities. The evaluation then shows the strengths and weaknesses of Scala. The strengths will be demonstrated on application for email categorization.
Description
Keywords
Scala, Multinomiální naivní Bayes, Support Vector Machines, Metoda nejbližších sousedů, AdaBoost, model aktérů, předzpracování textu, klasifikace textu, souběžné zpracování, zobrazení dat, manipulace s daty, strojové učení, Scala, Multinimial naive Bayes, Support Vector Machines, k nearest neighbors, AdaBoost, actor model, text preprocessing, text classification, concurrent processing, data visualization, data manipulation, machine learning
Citation
KOHOUT, T. Programovací jazyk Scala a jeho využití pro analýzu dat [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2019.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Ing. Tomáš Hruška, CSc. (předseda)
doc. RNDr. Jitka Kreslíková, CSc. (místopředseda)
doc. Ing. Michal Bidlo, Ph.D. (člen)
doc. RNDr. Milan Češka, Ph.D. (člen)
Ing. Igor Szőke, Ph.D. (člen)
Date of acceptance
2019-06-12
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Uvažoval jste o využití váhovacích metod (nepř. TF-IDF) ve vaši práci? Popište stručně, jak pracuje knihovna SymSpell pro opravu pravopisných chyb v textu. Proveďte stručné shrnutí hlavních výhod jazyka Scala oproti Pythonu nebo R.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení