Diferenční analýza multilingválního řečového korpusu pacientů s neurodegenerativními onemocněními
Loading...
Date
Authors
Kováč, Daniel
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Diplomová práce se zabývá automatizovanou diagnózou hypokinetické dysartrie v multilingválním řečovém korpusu. Jedná se o poruchu motorické realizace řeči vyskytující se u pacientů s neurodegenerativními onemocněními jako je například Parkinsonova nemoc. Automatizovaná diagnóza probíhá na základě akustické analýzy řeči a následným použitím matematických modelů. Tato metoda je na vzestupu díky její objektivitě a možné nezávislosti na národnosti. Cílem práce je zjistit, které akustické parametry mají vysokou diskriminační sílu a které jsou závislé na konkrétním jazyku mluvčího. K tom je využita statistická analýza parametrizovaných řečových úloh a následné modelování metodami strojového učení. Analýzy proběhly pro češtinu, americkou angličtinu, maďarštinu a všechny jazyky dohromady. Bylo zjištěno, že pouze některé parametry podporující diagnózu hypokinetické disartrie a jsou nezávislé na jazyku mluvčího. Nejlepší výsledky vykazuje parametr relF2SD a po něm parametr NST. Při klasifikaci mluvčích všech jazyků dohromady model dosauje přesnosti 59 % a senzitivity 72 %.
This diploma thesis focuses on the automated diagnosis of hypokinetic dysarthria in the multilingual speech corpus, which is a motor speech disorder that occurs in patients with neurodegenerative diseases such as Parkinson’s disease. The automatic speech recognition approach to diagnosis is based on the acoustic analysis of speech and subsequent use of mathematical models. The popularity of this method is on the rise due to its objectivity and the possibility of working simultaneously on different languages. The aim of this work is to find out which acoustic parameters have high discriminative power and are universal for multiple languages. To achieve this, a statistical analysis of parameterized speech tasks and subsequent modelling by machine learning methods was used. The analyses were performed for Czech, American English, Hungarian and all languages together. It was found that only some parameters enable the diagnosis of the hypokinetic disorder and are, at the same time, universal for multiple languages. The relF2SD parameter shows the best results, followed by the NST parameter. When classifying speakers of all the languages together, the model achieves accuracy of 59 % and sensitivity of 72 %.
This diploma thesis focuses on the automated diagnosis of hypokinetic dysarthria in the multilingual speech corpus, which is a motor speech disorder that occurs in patients with neurodegenerative diseases such as Parkinson’s disease. The automatic speech recognition approach to diagnosis is based on the acoustic analysis of speech and subsequent use of mathematical models. The popularity of this method is on the rise due to its objectivity and the possibility of working simultaneously on different languages. The aim of this work is to find out which acoustic parameters have high discriminative power and are universal for multiple languages. To achieve this, a statistical analysis of parameterized speech tasks and subsequent modelling by machine learning methods was used. The analyses were performed for Czech, American English, Hungarian and all languages together. It was found that only some parameters enable the diagnosis of the hypokinetic disorder and are, at the same time, universal for multiple languages. The relF2SD parameter shows the best results, followed by the NST parameter. When classifying speakers of all the languages together, the model achieves accuracy of 59 % and sensitivity of 72 %.
Description
Citation
KOVÁČ, D. Diferenční analýza multilingválního řečového korpusu pacientů s neurodegenerativními onemocněními [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Audio inženýrství
Comittee
doc. Ing. Kamil Říha, Ph.D. (předseda)
doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda)
Mgr. Tomáš Staudek, Ph.D. (člen)
PhDr. Aleš Dvořák (člen)
Dr. Ing. Libor Husník (člen)
Ing. Jaromír Mačák, Ph.D. (člen)
Date of acceptance
2020-06-18
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
Otázky oponenta:
- V 5. kapitole uvádíte několik violin grafů, ale bez interpretace. Vyberte jeden z těchto grafů a interpretujte ho. - Odpověděl dostatečně.
- Ve výsledcích své práce uvádíte parametr NST („Celková délka řečového signálu“) jako jeden ze dvou nejsignifikantnějších parametrů pro identifikaci hypokinetické dysartrie. Definujte ho. - Odpověděl dostatečně.
Otázky komise:
- Nebylo by vhodné provést následnou kontrolu "zdravých" subjektů po určité době? - Odpověděl dostatečně.
- Mohl by jste podrobněji popsat uvedený violin graf? - Odpověděl dostatečně.
Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení