Rozpoznávání emocí v česky psaných textech

but.committeeprof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Robert Vích, DrSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Jaromír Hrad, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen) Ing. Peter Stančík (člen)cs
but.defenceVysvětlete platnost vztahu (4.2). - Metodika určování důležitosti dokumentu prostřednictvím vektorového modelu. Domníváte se, že lze úspěšně identifikovat a klasifikovat ironii? Jakou strukturu a vlastnosti musí mít hodnoticí systém? - Klasifikace by byla možná např. pomocí databáze vzorů pro ironické texty. F-skóre pro jednotlivé třídy dosahuje v průměru asi 87 % úspěšnosti klasifikace. V čem vidíte cestu zvýšení úspěšnosti klasifikace? Lze využít i jiné klasifikátory než metodu SVM? - Je možné použít lepší trénovací množinu, sofistikovanější lemmatizaci, SVM s jinými jádry.cs
but.jazykčeština (Czech)
but.programElektrotechnika, elektronika, komunikační a řídicí technikacs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorBurget, Radimcs
dc.contributor.authorČervenec, Radekcs
dc.contributor.refereeSmékal, Zdeněkcs
dc.date.created2011cs
dc.description.abstractDíky rozvoji informačních a komunikačních technologií v posledních letech došlo k velkému nárůstu množství informací, které denně vznikají ve formě elektronických dokumentů. Třídění a zpracování informací se stalo pro člověka velmi obtížné, a proto vzrůstá obliba systémů automatického dolování znalostí z textu. Zajímavou podoblastí jsou systémy pro analýzu sentimentu a automatického rozpoznání emocí v textech, které mají potencionálně široké uplatnění. V rámci této práce byl navržen a implementován systém využívající technik dolování znalostí z textu za účelem rozpoznávání emocí v česky psaných textech a bylo provedeno zhodnocení jeho úspěšnosti. Protože je systém postaven převážně na metodě strojového učení, byla navrhnuta a vytvořena trénovací množina, která byla posléze použita k vytvoření modelu klasifikátoru pomocí algoritmu podpůrných vektorů (SVM). Pro potřeby zpřesnění výsledků klasifikace textových dokumentů do předem definovaných emočních tříd, jsou do systému integrovány další prvky, jako např.: lexikální databáze, lemmatizátor a odvozený slovník klíčových slov. Součástí práce je také zhodnocení několika přístupů ke klasifikaci s různými modifikacemi navrženého systému.cs
dc.description.abstractWith advances in information and communication technologies over the past few years, the amount of information stored in the form of electronic text documents has been rapidly growing. Since the human abilities to effectively process and analyze large amounts of information are limited, there is an increasing demand for tools enabling to automatically analyze these documents and benefit from their emotional content. These kinds of systems have extensive applications. The purpose of this work is to design and implement a system for identifying expression of emotions in Czech texts. The proposed system is based mainly on machine learning methods and therefore design and creation of a training set is described as well. The training set is eventually utilized to create a model of classifier using the SVM. For the purpose of improving classification results, additional components were integrated into the system, such as lexical database, lemmatizer or derived keyword dictionary. The thesis also presents results of text documents classification into defined emotion classes and evaluates various approaches to categorization.en
dc.description.markAcs
dc.identifier.citationČERVENEC, R. Rozpoznávání emocí v česky psaných textech [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011.cs
dc.identifier.other39834cs
dc.identifier.urihttp://hdl.handle.net/11012/3781
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdolování znalostícs
dc.subjectgenetický algoritmuscs
dc.subjectkategorizacecs
dc.subjectklasifikacecs
dc.subjectlemmatizacecs
dc.subjectlemmatizátorcs
dc.subjectlexikální databázecs
dc.subjectrozpoznávání emocícs
dc.subjectstrojové učenícs
dc.subjectSVMcs
dc.subjecttrénovací množinacs
dc.subjectWordNetcs
dc.subjectannotated corpusen
dc.subjectcategorizationen
dc.subjectclassificationen
dc.subjectemotion detectionen
dc.subjectemotion recognitionen
dc.subjectfeature selectionen
dc.subjectgenetic algorithmen
dc.subjectlemmatizationen
dc.subjectlemmatizeren
dc.subjectlexical databaseen
dc.subjectmachine learningen
dc.subjectSVMen
dc.subjecttext miningen
dc.subjectWordNeten
dc.titleRozpoznávání emocí v česky psaných textechcs
dc.title.alternativeRecognition of emotions in Czech textsen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2011-06-08cs
dcterms.modified2011-07-15-10:45:17cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid39834en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 11:26:27en
sync.item.modts2025.01.17 13:04:27en
thesis.disciplineTelekomunikační a informační technikacs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.14 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_39834.html
Size:
6.13 KB
Format:
Hypertext Markup Language
Description:
file review_39834.html
License bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:
Collections