Analýza reprodukovatelnosti a robustnosti akustických parametrů řeči a hlasu

but.committeeprof. Ing. Zdeněk Smékal, CSc. (předseda) MgA. Michal Indrák, Ph.D. (místopředseda) Ing. MgA. Jana Jelínková (člen) Ing. Ladislav Káňa (člen) Ing. Jan Dvořák, Ph.D. (člen)cs
but.defenceStudentka prezentovala výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Proč jste se pro většinu měření rozhodla použít směrový mikrofon s kardioidní charakteristikou? Jaký vliv mohla mít směrovost mikrofonu a proximity efekt na měřené akustické parametry? Nemohlo právě toto zavést další proměnnou – tedy zavádějící faktor při analýze samotné robustnosti vůči zavádějícím faktorům? Ve své práci uvádíte jako jednu z limitací nízký počet mluvčích. Pokud byste měla možnost pracovat s výrazně větším vzorkem, jak byste upravila metodologii? Jaké statistické postupy by bylo možné nově využít? Otázky komise: Jaké jsou vlastnosti statistického testu ANOVA? Co myslíte pojmem "šum v místnosti"? Jaké má vlastnosti? Studentka obhájila diplomovou práci s výhradami a odpověděla na otázky členů komise a oponenta.cs
but.jazykčeština (Czech)
but.programAudio inženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorNovotný, Kryštofcs
dc.contributor.authorKynčlová, Jiřinacs
dc.contributor.refereeKováč, Danielcs
dc.date.created2025cs
dc.description.abstractVnější faktory, jako například šum či denní doba měření, mohou negativně ovlivnit výpočet akustických parametrů z řeči či hlasu. Tyto parametry jsou využívány pro detekci motorické patologie hlasového ústrojí nebo identifikaci kognitivních nedostatků testovaných osob. Pomocí měření zaměřených na zkoumání vlivu akustického pozadí, použitého technického vybavení a externích vlivů působících na mluvčího, byla pořízena sada nahrávek řeči. Z těchto nahrávek byly prostřednictvím skriptů v Pythonu vypočteny hodnoty vybraných akustických parametrů. Následně byly sledovány jejich změny v jednotlivých měřeních a hodnoty metrik byly porovnány pomocí základních statistických ukazatelů. Na základě těchto analýz byla v diskuzi posouzena jejich robustnost vůči zavádějícím faktorům. Robustnost prokázaly zejména parametry průměrná hodnota základní frekvence hlasu a Smoothed Cepstral Peak Prominence. Za relativně spolehlivé lze dále označit parametry Pitch Shift a Relative Standard Deviation of Energy, který kvantifikuje variabilitu hlasitosti řeči. Tyto metriky se jeví jako vhodné pro praktické využití v podmínkách, kde nelze plně eliminovat zavádějící faktory při nahrávání.cs
dc.description.abstractExternal factors, such as noise or daytime of measurement, can negatively affect the calculation of acoustic parameters from speech or voice. These parameters are used to detect motor pathology of the vocal tract or to identify cognitive deficiencies of the test subjects. Using measurements aimed at investigating the effect of the acoustic background, the used technical equipment and external influences on the speaker, a set of recordings of speech was made. From these recordings, the values of selected acoustic parameters were calculated using Python scripts. Subsequently, their changes in each measurement were monitored and the values of the metrics were compared using basic statistical indicators. Based on these analyses, the robustness to external misleading influences was discussed. In particular, the parameters mean voice fundamental frequency and Smoothed Cepstral Peak Prominence showed robustness. Furthermore, the parameters Pitch Shift and Relative Standard Deviation of Energy can be considered relatively reliable. These metrics appear to be suitable for practical use in conditions where external factors cannot be fully eliminated during recording.en
dc.description.markDcs
dc.identifier.citationKYNČLOVÁ, J. Analýza reprodukovatelnosti a robustnosti akustických parametrů řeči a hlasu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.cs
dc.identifier.other167392cs
dc.identifier.urihttp://hdl.handle.net/11012/254315
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectakustická analýzacs
dc.subjectparametrizace řečics
dc.subjectzavádějící faktorycs
dc.subjectzpracování řečových signá-lůcs
dc.subjectacoustic analysisen
dc.subjectspeech parametrizationen
dc.subjectexternal factorsen
dc.subjectspeech signal processingen
dc.titleAnalýza reprodukovatelnosti a robustnosti akustických parametrů řeči a hlasucs
dc.title.alternativeAnalysis of reproducibility and robustness of speech and voice acoustic parametersen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-19cs
dcterms.modified2025-06-19-16:12:25cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid167392en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:01:56en
sync.item.modts2025.08.26 20:06:03en
thesis.disciplineZvuková produkce a nahrávánícs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.74 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
115.33 KB
Format:
Unknown data format
Description:
file appendix-1.zip
Loading...
Thumbnail Image
Name:
review_167392.html
Size:
6.68 KB
Format:
Hypertext Markup Language
Description:
file review_167392.html

Collections