De-identifikace řečníků postižených hypokinetickou dysartrií
Journal Title
Journal ISSN
Volume Title
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Tato práce se zabývá návrhem a realizací systému, který provádí de-identifikace řečových nahrávek pacientů postižených Parkinsonovou nemocí. V práci jsou popsány příčiny a projevy Parkinsonovy nemoci a vlivy hypokinetické dysartrie na řečový projev pacientů. Část práce je věnována řečovým příznakům popisujícím prozodii, podle pomocí kterých se dá hypokinetická dysartrie diagnostikovat z řeči. Dále se zabývá způsoby de-identifikace řeči a systémem na evaluaci výsledků pomocí rozeznávání řečníků a pacientů. De-identifikační systém využívá Normalizaci vokálního traktu (VTLN), evaluační systém využívá Gaussovy smíšené modely (GMM). Na testování byla využita databáze PARCZ, která obsahuje nahrávky řečových cvičení pacientů postižených Parkinsonovou nemocí a kontrolních řečníků.
This paper discuses design and implementation of a system that performs de-identification of speech recordings of patients suffering from Parkinson's disease. The paper describes causes and symptoms of Parkinson's disease and effects of hypokinetic dysarthria on speech. Part of the paper is devoted to speech features that can be used for diagnosing hypokinetic dysarthria from speech. It also describes ways of speech de-identification and system for evaluating results using recognition of speakers and patients. De-identification system uses vocal tract length normalization (VTLN) and evaluating system uses Gaussian mixture models (GMM). PARCZ database was used for testing. It contains recordings of speech of patients affected by Parkinson's disease and control speakers.
This paper discuses design and implementation of a system that performs de-identification of speech recordings of patients suffering from Parkinson's disease. The paper describes causes and symptoms of Parkinson's disease and effects of hypokinetic dysarthria on speech. Part of the paper is devoted to speech features that can be used for diagnosing hypokinetic dysarthria from speech. It also describes ways of speech de-identification and system for evaluating results using recognition of speakers and patients. De-identification system uses vocal tract length normalization (VTLN) and evaluating system uses Gaussian mixture models (GMM). PARCZ database was used for testing. It contains recordings of speech of patients affected by Parkinson's disease and control speakers.
De-identifikace řeči, Gaussovy smíšené modely, hypokinetická dysartrie, normalizace vokálního traktu, ochrana osobních informací, Parkinsonova nemoc, zpracování řeči., Gaussian mixture models, hypokinetic dysarthria, Parkinson's disease, protection of personal information, speech de-identification, speech processing, vocal tract length normalization.
KÁRNÍK, R. De-identifikace řečníků postižených hypokinetickou dysartrií [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.
Document type
Document version
Date of access to the full text
Language of document
Study field
Audio inženýrství
doc. Ing. Kamil Říha, Ph.D. (předseda)
MgA. Michal Indrák, Ph.D. (místopředseda)
Ing. Ladislav Káňa (člen)
Ing. Jiří Mekyska, Ph.D. (člen)
MgA. Lukáš Nábělek (člen)
Date of acceptance
Na straně 34 uvádíte vztah pro Matthewsův korelační koeficient. Může nastat případ, kdy ve jmenovateli bude výsledná hodnota 0? Pokud ano, co by to znamenalo?
Při segmentaci signálu bylo využito Hammingovo okno. Proč bylo použito právě toto okno? Bylo by možné využít okno von Hannovo, pravoúhlé nebo Blackmanovo?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení