Metody strojového učení ve zpracování přirozeného jazyka

but.committeedoc. Ing. František Zbořil, CSc. (předseda) prof. Ing. Martin Drahanský, Ph.D. (místopředseda) Ing. Vladimír Bartík, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) Ing. Josef Strnadel, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C (dobře). Otázky u obhajoby: Proč jste ve své práci kategorizoval dokumenty jen do kategorií "pozitivní", "negativní" a nepřidal jste i kategorii "neutrální"? Datové sady jste vytvářel buď ručně, kde to není problém přidat, a nebo jste je uměle vytvářel z procentních bodů, kde by také nebyl problém tuto kategorii dodělat. V kapitole 5.1.1 o použití naivního Bayesova klasifikátoru píšete, že je možné zanedbat apriorní pravděpodobnost. Můžete komisi objasnit jak jste to myslel?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorSmrž, Pavelcs
dc.contributor.authorVodička, Jancs
dc.contributor.refereeOtrusina, Lubomírcs
dc.date.accessioned2022-06-13T22:53:00Z
dc.date.available2022-06-14cs
dc.date.available2022-06-13T22:53:00Z
dc.date.created2012cs
dc.description.abstractBakalářská práce se zajímá hodnocením sentimentu textu v českém jazyce za pomocí metod strojového učení, hlavně za použití naivního bayesovského klasifikátoru. Členění probíhá do dvou kategorií - pozitivní, negativní zprávy.  Jako datové zdroje pro automatické vytvoření korpusu jsou použity zprávy ze sociální sítě Twitter, zbožového porovnávače Heuréka, filmové databáze ČSFD a restauračního portálu Scuk. Jsou porovnány z hlediska výkonnosti při hodnocení sentimentu. Následně je sestavena výsledná tréninková sada, která je použita při hodnocení zpráv z Twitteru v téměř reálném čase.cs
dc.description.abstractBachelor's thesis deals with sentiment analysis using machine learning methods, mainly naive bayes classifier. Input text can be classified as positive or negative message. There are used several data sources for create of automatic annotated corpus - social network Twitter, price comparator Heureka, movie database ČSFD and restaurant portal Scuk. These sources are compared in terms of performance in assessing the sentiment. Consequently, the final training dataset is created and used at almost real-time Twitter sentiment analysis.en
dc.description.markCcs
dc.identifier.citationVODIČKA, J. Metody strojového učení ve zpracování přirozeného jazyka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.cs
dc.identifier.other78715cs
dc.identifier.urihttp://hdl.handle.net/11012/55221
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsPřístup k plnému textu prostřednictvím internetu byl licenční smlouvou omezen na dobu 10 roku/letcs
dc.subjectStrojové učenícs
dc.subjectnaivní bayesovský klasifikátorcs
dc.subjecthodnocení sentimentucs
dc.subjectdolování názorůcs
dc.subjectTwittercs
dc.subjectMachine learningen
dc.subjectnaive Bayes classifieren
dc.subjectsentiment analysisen
dc.subjectopinion miningen
dc.subjectTwitteren
dc.titleMetody strojového učení ve zpracování přirozeného jazykacs
dc.title.alternativeMachine-Learning Methods in Natural Language Processingen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2012-06-14cs
dcterms.modified2020-05-09-23:42:58cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid78715en
sync.item.dbtypeZPen
sync.item.insts2022.06.14 00:53:00en
sync.item.modts2022.06.14 00:14:06en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
review_78715.html
Size:
1.46 KB
Format:
Hypertext Markup Language
Description:
review_78715.html
Collections