Akustická analýza emočně zabarvených vět u pacientů s Parkinsonovou nemocí
Loading...
Date
Authors
Gavlasová, Radka
ORCID
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato diplomová práce se zaměřuje na Parkinsonovu nemoc a její vliv na emoční projev v řeči. Cílem bylo provést rešerši literatury o akustické emoční analýze pacientů s PN a implementovat akustické parametry pro rozlišení zdravých a nemocných jedinců. Použitá databáze obsahovala nahrávky 100 pacientů s PN a 52 zdravých kontrol pro různé řečové úlohy. Pro tuto analýzu bylo vybráno 7 emočně zabarvených vět a 11 akustických parametrů, které byly implementovány v Pythonu. Ze statistické analýzy bylo zjištěno, že mezi nejvýznamnější parametry patří pauzy v řeči a variabilita intenzity. Pro klasifikaci byl použit algoritmus XGBoost s 10-násobnou stratifikovanou křížovou validací. Bylo implementováno celkem 10 modelů, které analyzovaly všechny úlohy dohromady i každou zvlášť. Optimalizace probíhala pomocí randomized search. Pro kombinaci všech úloh byla signifikantním parametrem variabilita intenzity, příp. tempo řeči. U jednotlivých řečových úloh se velmi projevovala variabilita intonace a formantových oblastí. Nejlepší model dosáhl 63% úspěšnosti (BACC) a 85% senzitivity. Výsledky naznačují, že emoční prozodie ovlivňuje klasifikaci, potvrzuje dosavadní poznatky a poukazuje na potřebu dalšího zkoumání v této oblasti.
This thesis focuses on Parkinson's disease and its effect on emotional expression in speech. The aim was to conduct a literature search on acoustic emotional analysis of PD patients and to implement acoustic parameters to distinguish between healthy and diseased individuals. The database used contained recordings of 100 patients with PD and 52 healthy controls for various speech tasks. For this analysis, 7 emotionally coloured sentences and 11 acoustic parameters were selected and implemented in Python. From the statistical analysis, it was found that the most significant parameters include pauses in speech and intensity variability. The XGBoost algorithm with 10-fold stratified cross-validation was used for classification. A total of 10 models were implemented to analyze all tasks together and each task separately. Optimization was performed using randomized search. For the combination of all tasks, the significant parameter was the variability in intensity or speech rate. For the individual speech tasks, variability in intonation and formant areas was highly significant. The best model achieved a 63% success rate (BACC) and 85% sensitivity. The results suggest that emotional prosody affects classification, confirming previous findings and pointing to the need for further investigation in this area.
This thesis focuses on Parkinson's disease and its effect on emotional expression in speech. The aim was to conduct a literature search on acoustic emotional analysis of PD patients and to implement acoustic parameters to distinguish between healthy and diseased individuals. The database used contained recordings of 100 patients with PD and 52 healthy controls for various speech tasks. For this analysis, 7 emotionally coloured sentences and 11 acoustic parameters were selected and implemented in Python. From the statistical analysis, it was found that the most significant parameters include pauses in speech and intensity variability. The XGBoost algorithm with 10-fold stratified cross-validation was used for classification. A total of 10 models were implemented to analyze all tasks together and each task separately. Optimization was performed using randomized search. For the combination of all tasks, the significant parameter was the variability in intensity or speech rate. For the individual speech tasks, variability in intonation and formant areas was highly significant. The best model achieved a 63% success rate (BACC) and 85% sensitivity. The results suggest that emotional prosody affects classification, confirming previous findings and pointing to the need for further investigation in this area.
Description
Citation
GAVLASOVÁ, R. Akustická analýza emočně zabarvených vět u pacientů s Parkinsonovou nemocí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
Doc.Ing.MgA. Ondřej Urban, Ph.D. (předseda)
doc. Ing. Kamil Říha, Ph.D. (místopředseda)
Ing. František Rund, Ph.D. (člen)
Mgr. Tomáš Staudek, Ph.D. (člen)
Ing. Matěj Ištvánek, Ph.D. (člen)
RNDr. Lubor Přikryl (člen)
doc. Ing. Petr Sysel, Ph.D. (člen)
Date of acceptance
2024-06-05
Defence
Studentka prezentovala výsledky své práce a komise byla seznámena s posudky.
Studentka obhájila diplomovou práci a odpověděla na otázky členů komise a oponenta.
Otázky:
Výsledky ukazují, že natrénované binární klasifikátory mají vyšší senzitivitu než specificitu. Byl tento rozdíl záměrný? Existuje způsob, jak tyto dvě metriky modelu vyvážit?
Kolik procent úspěšnosti dosahuje klasifikátor?
Proč je problém získat zdravé kontroly?
Byly v Pythonu použity vlastní knihovny?
Z jakých důvodů je obtížná detekce pauz?
Jak je možné navazovat na tuto práci?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení