Analýza postojů českých a slovenských uživatelů na základě dat ze sociálních sítí a webových diskusí
Loading...
Date
Authors
Sojka, Matěj
ORCID
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Díky digitalizaci se šíření názorů v populaci za poslední dobu razantně zrychlilo, nicméně potřeba jim porozumět se nezměnila. Cílem této práce je vytvořit systém pro automatické stahování dat ze sociálních sítí a webových diskuzí a analyzování názorů v českém a slovenském jazyce. Systém disponuje webovým rozhraním pro vizualizaci výsledků a konfiguraci analýzy dat. Systém umí uživateli nabídnout témata, která se podle něj v datech vyskytují, a klasifikovat příspěvky podle uživatelem definovaných názorů.
Thanks to digitalization, the spread of opinions in the population has accelerated sharply in the recent years, however the need to understand them has not changed. The goal of this thesis was to create a system for automatic data collection from social media and web discussions and sentiment analysis in Czech and Slovak language. The system has a web interface for visualizing results and configuring data analysis. The system is capable of offering topics to the user that it considers to occur in the selected data and group posts based on user-defined opinions.
Thanks to digitalization, the spread of opinions in the population has accelerated sharply in the recent years, however the need to understand them has not changed. The goal of this thesis was to create a system for automatic data collection from social media and web discussions and sentiment analysis in Czech and Slovak language. The system has a web interface for visualizing results and configuring data analysis. The system is capable of offering topics to the user that it considers to occur in the selected data and group posts based on user-defined opinions.
Description
Keywords
analýza sentimentu, zpracování přirozeného jazyka, extrakce dat z webu, aplikační rozhraní sociálních sítí, klasifikace, Latetní Dirichletova alokace, Random forest, fastText, sentiment analysis, natural language processing, web scraping, social network application interface, classification, Latent Dirichlet allocation, Random forest, fastText
Citation
SOJKA, M. Analýza postojů českých a slovenských uživatelů na základě dat ze sociálních sítí a webových diskusí [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
prof. Dr. Ing. Pavel Zemčík, dr. h. c. (předseda)
prof. Ing. Jan M. Honzík, CSc. (místopředseda)
doc. Ing. Jiří Jaroš, Ph.D. (člen)
Ing. Filip Orság, Ph.D. (člen)
doc. Ing. Michal Španěl, Ph.D. (člen)
Date of acceptance
2021-08-25
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Zvažoval jste použití moderních modelů založených na transformer architektuře ve své práci? Bylo by možné názory získávat automaticky tak, aby je uživatelé nemuseli sami definovat? Proč jste při experimentech nevybíral datové vzorky pro trénovací/testovací sadu náhodně? Co znamenají pojmy přesnost, výtěžnost a f1-score? Mohl byste komisi objasnit výsledky porovnání přístupů, které jste používal?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení