Vývoj moderních akustických parametrů kvantifikujících hypokinetickou dysartrii

Loading...
Thumbnail Image
Date
Authors
Kowolowski, Alexander
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato práce se zabývá návrhem a testováním nových akustických parametrů pro zpracování dysprozodické řeči u pacientů trpících hypokinetickou dysartrií. V práci je uvedeno a otestováno 41 nových parametrů pro kvantifikaci prozodie, tzn. popisujících melodii, hlasitost, rytmus a tempo řeči. Nové parametry by se daly rozdělit do sedmi skupin. V rámci skupin se parametry liší především použitými statistickými veličinami. První čtyři skupiny jsou založeny na absolutních diferencích a kumulativních součtech základního kmitočtu a krátkodobé energie signálu. Pátá skupina obsahuje parametry založené na násobku základního kmitočtu a krátkodobé energie do jednoho globálního intonačního parametru. Šestá skupina obsahuje globální časové parametry, které jsou poměry konvenčních rytmických a konvenčních tempových parametrů. Poslední skupina pak obsahuje globální parametry pro kvantifikaci celé prozodie, což jsou poměry globálních intonačních a globálních časových parametrů. Všechny parametry byly testovány na české databázi řečníků s Parkinsonovou nemocí PARCZ. Pro jednotlivé parametry byly nejdříve vykresleny grafy hustoty pravděpodobnosti. Následně byla provedena korelační analýza s dostupnými medicínskými škálami, nejprve pro všechny, poté jen v rámci globálních parametrů. Dále byla provedena klasifikační a regresní analýza s novými parametry pomocí klasifikačních a regresních stromů. Tato analýza byla provedena nejdříve pro jednotlivé nové parametry, poté pro všechna data všech parametrů najednou, a nakonec byl proveden sekvenční výběr nejlepší kombinace parametrů pro danou problematiku. I když nevyšel jeden určitý parametr jako jasný favorit celé diplomové práce, bylo pár parametrů, které se mezi nejlépe vycházejícími objevovaly opakovaně, a také se u některých testů objevil trend, že mezi nejlepším a druhým nejlepším parametrem byl větší rozdíl než mezi jinými v pořadí, dalo by se tedy hovořit o parametrech, které byly pro danou analýzu mnohem lepší než ostatní testované. Konkrétní výsledky a diskuze jsou obsaženy v závěru.
This work deals with designing and testing of new acoustic features for analysis of dysprosodic speech occurring in hypokinetic dysarthria patients. 41 new features for dysprosody quantification (describing melody, loudness, rhythm and pace) are presented and tested in this work. New features can be divided into 7 groups. Inside the groups, features vary by the used statistical values. First four groups are based on absolute differences and cumulative sums of fundamental frequency and short-time energy of the signal. Fifth group contains features based on multiples of this fundamental frequency and short-time energy combined into one global intonation feature. Sixth group contains global time features, which are made of divisions between conventional rhythm and pace features. Last group contains global features for quantification of whole dysprosody, made of divisions between global intonation and global time features. All features were tested on Czech Parkinsonian speech database PARCZ. First, kernel density estimation was made and plotted for all features. Then correlation analysis with medicinal metadata was made, first for all the features, then for global features only. Next classification and regression analysis were made, using classification and regression trees algorithm (CART). This analysis was first made for all the features separately, then for all the data at once and eventually a sequential floating feature selection was made, to find out the best fitting combination of features for the current matter. Even though none of the features emerged as a universal best, there were a few features, that were appearing as one of the best repeatedly and also there was a trend that there was a bigger drop between the best and the second best feature, marking it as a much better feature for the given matter, than the rest of the tested. Results are included in the conclusion together with the discussion.
Description
Citation
KOWOLOWSKI, A. Vývoj moderních akustických parametrů kvantifikujících hypokinetickou dysartrii [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2019.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Audio inženýrství
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda) doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda) Ing. Jiří Přinosil, Ph.D. (člen) Ing. František Rund, Ph.D. (člen) MgA. et Mgr. Ondřej Jirásek, Ph.D. (člen) Mgr. Tomáš Staudek, Ph.D. (člen)
Date of acceptance
2019-06-04
Defence
Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Jaký je rozdíl mezi klasifikační a regresní analýzou?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO