Multijazyková analýza emočního stavu mluvčího

Loading...
Thumbnail Image
Date
Authors
Rendek, Tomáš
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Práce se zabývá charakteristikou řečového signálu a úvodem vysvětluje proces tvorby řeči. Seznamuje s prozodickými rysy které doprovázejí řeč při vyjádření emocí. Dále jsme se zabývali základními vlastnostmi a parametry lidské řeči. Pro analýzu jsme použili program Praat. Vzhledem k tomu, že se jedná o nepříliš známý program, věnovali jsme popisu tohoto programu celou kapitolu v rámci této práce. Součásti práce je i popis dvou databází emoční řeči ve dvou jazycích: slovenštině a němčině, v obou případech se nejedná o spontánní řeč. Práce se dále zabývá konceptem neuronových sítí a jejich použití pro automatické rozpoznání emocí, kde bylo vypočteno na začátku soubor příznaků, ze kterých bylo na základě geometrické oddělenosti vybráno 12 nejlepších příznaků které se liší na základě pohlaví a na základě požitém jazyce. Vybrané příznaky byly později použity pro trénování neuronové sítě.
This work deals with the properties of the speech signal. At the beginning it introduces a process of generation of the speech. Then, it covers the prosodic features of the speech, which represent a related characteristic of emotions. It defines an emotion itself, as well as the basic features and parameters of the human speech. For the analysis we use the program called Praat. As it is an unknown program, we devote a part of the work to it, which acquaints us with its advantages. The next part of this paper comprises also two enclosed databases containing records of particular emotional states of human. These databases were created and collected for Slovak and German language. However, none of them contain spontaneous material. Next, the work concerns a concept of the neural networks. It regards it as a possible realization of recognizing of emotional characteristics. The initial analysis presents large number of gained features, out of which only the best twelve were selected on the basis of geometric separability. These features are distinct for both sexes, as well as for both nationalities. Consequently, they are used for training with a neural network. The work concludes by summarizing of the results discussing the successfulness with recognition of emotional states. It also gives possible reasons which lead to degradation of their successful classifying. The thesis contains a CD with all the partial and ultimate results, and files with records for Slovak and German language.
Description
Citation
RENDEK, T. Multijazyková analýza emočního stavu mluvčího [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2008.
Document type
Document version
Date of access to the full text
Language of document
sk
Study field
Teleinformatika
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Martin Vondra, Ph.D. (místopředseda) Ing. Jan Vlach, Ph.D. (člen) Ing. Martin Plšek, Ph.D. (člen) Ing. Petr Kovář, Ph.D. (člen) Ing. Milan Šimek, Ph.D. (člen)
Date of acceptance
2008-06-17
Defence
1. Proč jste při trénování sítě používal nejdříve příznak s nejhorší kvalitou a postupně jste přidával kvalitnější příznaky? Nebylo by vhodnější začít od nejkvalitnějšího, který zaručuje největší prostorové oddělení emočních tříd? 2. Kolik nahrávek bylo použito pro trénování neuronové sítě a kolik nahrávek bylo použito pro testování naučené klasifikace u jednotlivých skupin řečníků.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO