Vztah emocí a intonačních křivek

Loading...
Thumbnail Image
Date
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato práce se zabývá intonačními křivkami s jejími vztahy pro různé emoce. Kromě teoretického základu, který pojednává o tvorbě řeči, zpracování signálů a psychologického nastínění rozdělení emocí, obsahuje také tvorbu vlastní emotivní databáze realizované s profesionálními herci. Cílem této závěrečné práce je klasifikace signálu na základě emoce, kterou nahrávka má představovat. Těmito emocemi jsou hněv, radost, nuda a smutek. Klasifikace probíhala pomocí umělých neuronových sítí, konkrétně v aplikaci Classification Learner, kterou poskytuje programovací prostředí Matlab. Použité příznaky pro tuto metodu byly variace fundamentální frekvence a MFCC. Výsledky byly následně porovnány a zanalyzovány poslechovým testem. Tento test pomohl určit, zda jsou výsledky relevantní pro tuto problematiku. Maximální úspěšnost trénování sítě dosáhla přibližně 82 %, testování pak 75 %. Poslechové testy potvrdily, že výsledky odpovídají předpokládanému lidskému vnímání. Pro podrobnější a lepší vyhodnocení, by bylo zapotřebí větší a kvalitnější databáze.
This thesis deals with intonation curves and their relation to human emotions. Besides the theoretical part where you can learn about speech production, signal processing and psychological distribution of emotions, there is also a unique database recorded with the help of two professional actors. The main goal of this thesis is to classify created data using artificial neural networks into four classes. Those classes are anger, joy, boredom and sadness. The practical part was implemented in a programming platform called Matlab using Classification Learner app. Features used for this method were variations of fundamental frequency and MFCC. The results were compared with a listening survey so that it could be determined whether the results provided by neural network are relevant to some kind of a human factor. Success rate of the trained models reached 82 %, new data testing reached 75 %. Listening survey confirmed that the results correspond to the assumption of human perception. Better success rate would be accomplished by using a bigger set of higher quality data.
Description
Citation
GAVLASOVÁ, R. Vztah emocí a intonačních křivek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2022.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Jiří Přinosil, Ph.D. (místopředseda) Ing. Jaromír Mačák, Ph.D. (člen) prof. Ing. Jana Tučková, CSc., CSc. (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen)
Date of acceptance
2022-06-16
Defence
Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Studentka obhájila bakalářskou práci a odpověděla na otázky členů komise a oponenta. Otázky: 1) Na čem závisí volba počtu MFCC koeficientů? 2) Které parametry kromě frekvence základního tónu je možné uvažovat, aby se úroveň rozpoznání jednotlivých emocí zvýšila?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO