Včasná diagnóza kognitivních poruch prostřednictvím akustické analýzy řeči
Loading...
Date
Authors
Kučera, Ondřej
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Poruchy řeči mohou být mezi prvními pozorovatelnými příznaky neurodegenerativních onemocnění. Tato diplomová práce se zabývá projevy mírné kognitivní poruchy, konkrétně mírnou kognitivní poruchou vedoucí k Alzheimerově nemoci (MCI-AD) a mírnou kognitivní poruchou s Lewyho tělísky (MCI-LB) v řeči v oblastech fonace, prozodie a artikulace. Cílem práce je vybrat a vyhodnotit akustické parametry, které by mohly jednotlivé skupiny onemocnění diferencovat. Dále pak natrénovat a vyhodnotit modely strojového učení pro jejich automatickou klasifikaci. Byla využita databáze nahrávek pacientů s výše zmíněnými onemocněními a zdravé kontrolní skupiny. Na základě rešerše byly vybrány akustické parametry pro výpočet. Pro vyhodnocení jsme využili Mann-Whitney U test s FDR korekcí a gradient boosting algoritmus XGBoost s Bayesovskou optimalizací hledání hyperparametrů. Jako nejvýznamnější parametry pro rozlišení jednotlivých skupin byly identifikovány relativní směrodatná odchylka základního tónu řeči, shimmer, tempo řeči a maximální doba fonace. Nejlepších skóre pro automatickou klasifikaci onemocnění jsme dosáhli u dvojice MCI-AD–MCI-LB a zdravá kontrolní skupina–MCI-LB, kde vyvážená přesnost dosáhla ~0,60. Naše výsledky naznačují že tato neurodegenerativní onemocnění lze diferencovat na základě řečových projevů.
Speech disorders may be among the first observable symptoms of neurodegenerative diseases. This thesis deals with the manifestations of mild cognitive impairment, specifically mild cognitive impairment leading to Alzheimer's disease (MCI-AD) and mild cognitive impairment with Lewy bodies (MCI-LB) in speech in the areas of phonation, prosody and articulation. The aim of the thesis is to select and evaluate acoustic parameters that could distinguish between the various disease groups. Then, to train and evaluate machine learning models for their automatic classification. A database of recordings of patients with the aforementioned diseases and a healthy control group was used. Based on research, acoustic parameters were selected for extraction. Mann-Whitney U test with FDR correction and gradient boosting algorithm XGBoost with Bayesian optimization of hyperparameter search were used for evaluation. Relative standard deviation of the fundamental speech tone, shimmer, pace rate and maximum phonation time were identified as the most important parameters for differentiating the groups. The best scores for automatic classification of the diseases were obtained in the pair MCI-AD-MCI-LB and healthy control group-MCI-LB, where the balanced accuracy reached ~0.60.
Speech disorders may be among the first observable symptoms of neurodegenerative diseases. This thesis deals with the manifestations of mild cognitive impairment, specifically mild cognitive impairment leading to Alzheimer's disease (MCI-AD) and mild cognitive impairment with Lewy bodies (MCI-LB) in speech in the areas of phonation, prosody and articulation. The aim of the thesis is to select and evaluate acoustic parameters that could distinguish between the various disease groups. Then, to train and evaluate machine learning models for their automatic classification. A database of recordings of patients with the aforementioned diseases and a healthy control group was used. Based on research, acoustic parameters were selected for extraction. Mann-Whitney U test with FDR correction and gradient boosting algorithm XGBoost with Bayesian optimization of hyperparameter search were used for evaluation. Relative standard deviation of the fundamental speech tone, shimmer, pace rate and maximum phonation time were identified as the most important parameters for differentiating the groups. The best scores for automatic classification of the diseases were obtained in the pair MCI-AD-MCI-LB and healthy control group-MCI-LB, where the balanced accuracy reached ~0.60.
Description
Keywords
Citation
KUČERA, O. Včasná diagnóza kognitivních poruch prostřednictvím akustické analýzy řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. Kamil Říha, Ph.D. (předseda)
Doc.Ing.MgA. Ondřej Urban, Ph.D. (místopředseda)
Ing. Petr Honzík, Ph.D. (člen)
Ing.MgA. Edgar Mojdl, Ph.D. (člen)
Ing. Matěj Ištvánek, Ph.D. (člen)
Date of acceptance
2025-06-12
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Prosím objasněte chybějící metodiku k odstranění zvukových nahrávek.
V diskusi zmiňujete, že významným parametrem byl parametr "PR_TSK7". Podle metodologie byla však nahrávka TSK7 pro některé vzorky vyřazena. Jak byly chybějící hodnoty nahrazeny při statistické a klasifikační analýze? Mohl tím být ovlivněn výsledek analýzy?
Proč byla zvolena nested cross-validace pro trénování modelu?
Student dostatečně vysvětlil otázky.
Result of defence
práce byla úspěšně obhájena
