Nové metody zpracování textu pro klasifikaci emocí

Loading...
Thumbnail Image

Date

Authors

Onderka, Jakub

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato diplomová práce se zabývá možnostmi extrakce emocí z textu, konkrétně strojovými metodami bez učitele. Podrobněji jsou popsány metody sémantického modelování LSA, pLSA a LDA. Byla vytvořena implementace metody LDA v jazyce Java, která byla použita pro emocionální klasifikaci 860 česky psaných dokumentů do šesti odlišných emocí. Maximální přesnost při optimalizaci parametrů modelu byla 24 %.
This master’s thesis is about a method for sentimental analysis, especially machine learning methods without teacher. In detail are described method for semantic modeling LSA, pLSA a LDA. It was created a LDA implementation in Java language, which was used to emotional classification of 860 Czech documents to six different emotional categories. Maximal accuracy was 24 % if optimized parameters was used.

Description

Citation

ONDERKA, J. Nové metody zpracování textu pro klasifikaci emocí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2015.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Telekomunikační a informační technika

Comittee

prof. Ing. Jiří Mišurec, CSc. (předseda) doc. Ing. Miloš Orgoň, Ph.D. (místopředseda) Ing. Tomáš Zeman, Ph.D. (člen) Ing. Michal Olšák, Ph.D. (člen) Ing. Milan Šimek, Ph.D. (člen) doc. Ing. Petr Mlýnek, Ph.D. (člen)

Date of acceptance

2015-06-11

Defence

Objasněte princip fungování algoritmu SVM a v čem spočívá hlavní výhoda oproti například neuronové síti? Jaké další přední algoritmy učení bez učitele znáte? Proč jsou výsledky algoritmu horší ve srovnání s jinými přístupy? Jak z obyčejného textu získáte emoci?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO