Analýza reprodukovatelnosti a robustnosti akustických parametrů řeči a hlasu

Loading...
Thumbnail Image

Date

Authors

Kynčlová, Jiřina

Mark

D

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Vnější faktory, jako například šum či denní doba měření, mohou negativně ovlivnit výpočet akustických parametrů z řeči či hlasu. Tyto parametry jsou využívány pro detekci motorické patologie hlasového ústrojí nebo identifikaci kognitivních nedostatků testovaných osob. Pomocí měření zaměřených na zkoumání vlivu akustického pozadí, použitého technického vybavení a externích vlivů působících na mluvčího, byla pořízena sada nahrávek řeči. Z těchto nahrávek byly prostřednictvím skriptů v Pythonu vypočteny hodnoty vybraných akustických parametrů. Následně byly sledovány jejich změny v jednotlivých měřeních a hodnoty metrik byly porovnány pomocí základních statistických ukazatelů. Na základě těchto analýz byla v diskuzi posouzena jejich robustnost vůči zavádějícím faktorům. Robustnost prokázaly zejména parametry průměrná hodnota základní frekvence hlasu a Smoothed Cepstral Peak Prominence. Za relativně spolehlivé lze dále označit parametry Pitch Shift a Relative Standard Deviation of Energy, který kvantifikuje variabilitu hlasitosti řeči. Tyto metriky se jeví jako vhodné pro praktické využití v podmínkách, kde nelze plně eliminovat zavádějící faktory při nahrávání.
External factors, such as noise or daytime of measurement, can negatively affect the calculation of acoustic parameters from speech or voice. These parameters are used to detect motor pathology of the vocal tract or to identify cognitive deficiencies of the test subjects. Using measurements aimed at investigating the effect of the acoustic background, the used technical equipment and external influences on the speaker, a set of recordings of speech was made. From these recordings, the values of selected acoustic parameters were calculated using Python scripts. Subsequently, their changes in each measurement were monitored and the values of the metrics were compared using basic statistical indicators. Based on these analyses, the robustness to external misleading influences was discussed. In particular, the parameters mean voice fundamental frequency and Smoothed Cepstral Peak Prominence showed robustness. Furthermore, the parameters Pitch Shift and Relative Standard Deviation of Energy can be considered relatively reliable. These metrics appear to be suitable for practical use in conditions where external factors cannot be fully eliminated during recording.

Description

Citation

KYNČLOVÁ, J. Analýza reprodukovatelnosti a robustnosti akustických parametrů řeči a hlasu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

prof. Ing. Zdeněk Smékal, CSc. (předseda) MgA. Michal Indrák, Ph.D. (místopředseda) Ing. MgA. Jana Jelínková (člen) Ing. Ladislav Káňa (člen) Ing. Jan Dvořák, Ph.D. (člen)

Date of acceptance

2025-06-19

Defence

Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Proč jste se pro většinu měření rozhodla použít směrový mikrofon s kardioidní charakteristikou? Jaký vliv mohla mít směrovost mikrofonu a proximity efekt na měřené akustické parametry? Nemohlo právě toto zavést další proměnnou – tedy zavádějící faktor při analýze samotné robustnosti vůči zavádějícím faktorům? Ve své práci uvádíte jako jednu z limitací nízký počet mluvčích. Pokud byste měla možnost pracovat s výrazně větším vzorkem, jak byste upravila metodologii? Jaké statistické postupy by bylo možné nově využít? Otázky komise: Jaké jsou vlastnosti statistického testu ANOVA? Co myslíte pojmem "šum v místnosti"? Jaké má vlastnosti? Studentka obhájila diplomovou práci s výhradami a odpověděla na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO