Výpočet indexu srozumitelnosti řeči v Matlabu
Loading...
Date
Authors
Cieslar, Šimon
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Diplomová práce se zabývá výpočtem indexu srozumitelnosti řeči (STI) podle normy ČSN EN IEC 60268-16 a navazuje na existující implementaci zkrácené metody STIPA, publikovanou v práci [1]. Hlavním cílem je rozšíření softwarového nástroje vyvíjeného v prostředí MATLAB o přímou plnou metodu (Full STI), nepřímou metodu využívající impulsní odezvu, a vizualizaci mezivýsledků pro výukové účely. V rámci návrhu systému bylo realizováno generování testovacích signálů s intenzitní modulací v sedmi oktávových pásmech, výpočet modulačních indexů a efektivních poměrů signálu k šumu, jejich následná vážená kombinace do výsledného indexu STI a grafické znázornění klíčových parametrů – včetně funkce přenosu modulace (MTF), spektrogramů a kvalifikačních pásem. Správnost navrženého řešení byla ověřena praktickým měřením ve dvou poslechových pozicích v přednáškové učebně, přičemž výsledky byly porovnány s referenčními hodnotami certifikovaného měřicího analyzátoru a s výpočty na základě impulsní odezvy, získané pomocí specializovaného softwaru Room EQ Wizard (REW). Na první měřicí pozici dosahovaly všechny metody shodných výsledků v rámci normové nejistoty, zatímco na druhé pozici byly zaznamenány výraznější odchylky zejména u metody STIPA, což ukazuje její vyšší citlivost na specifické akustické podmínky. Výsledky naznačují, že vyvinutý MATLAB nástroj umožňuje výpočet indexu srozumitelnosti řeči podle více metod a poskytuje odpovídající výsledky alespoň v některých scénářích měření. Vzhledem k zaznamenaným rozdílům mezi jednotlivými přístupy se však doporučuje další ověřování ve více akustických prostředích, aby mohla být funkčnost nástroje komplexně validována.
This master’s thesis focuses on the calculation of the Speech Transmission Index (STI) according to the ČSN EN IEC 60268-16 standard and builds upon an existing implementation of the simplified STIPA method published in [1]. The main objective is to extend the MATLAB-based software tool to include the full direct STI method (Full STI), the indirect method using impulse response, and the visualization of intermediate results for educational purposes. As part of the system design, test signals with intensity modulation in seven octave bands were generated, modulation indices and effective signal-to-noise ratios were calculated, and their weighted combination was used to derive the final STI value. The tool also offers graphical representations of key parameters, including the Modulation Transfer Function (MTF), spectrograms, and STI qualification bands. The proposed solution was experimentally validated through measurements at two listening positions in a lecture hall. The results were compared with reference values obtained from a certified measurement analyzer and with STI values computed from impulse responses, which were acquired using the Room EQ Wizard (REW) software. At the first measurement position, all methods produced comparable results within the standard's measurement uncertainty; at the second position, more significant deviations were observed, particularly for the STIPA method, highlighting its greater sensitivity to specific acoustic conditions. The findings suggest that the developed MATLAB tool enables STI calculation using multiple methods and produces consistent results in selected measurement scenarios. However, due to the observed discrepancies, further validation in diverse acoustic environments is recommended to comprehensively verify the functionality of the tool.
This master’s thesis focuses on the calculation of the Speech Transmission Index (STI) according to the ČSN EN IEC 60268-16 standard and builds upon an existing implementation of the simplified STIPA method published in [1]. The main objective is to extend the MATLAB-based software tool to include the full direct STI method (Full STI), the indirect method using impulse response, and the visualization of intermediate results for educational purposes. As part of the system design, test signals with intensity modulation in seven octave bands were generated, modulation indices and effective signal-to-noise ratios were calculated, and their weighted combination was used to derive the final STI value. The tool also offers graphical representations of key parameters, including the Modulation Transfer Function (MTF), spectrograms, and STI qualification bands. The proposed solution was experimentally validated through measurements at two listening positions in a lecture hall. The results were compared with reference values obtained from a certified measurement analyzer and with STI values computed from impulse responses, which were acquired using the Room EQ Wizard (REW) software. At the first measurement position, all methods produced comparable results within the standard's measurement uncertainty; at the second position, more significant deviations were observed, particularly for the STIPA method, highlighting its greater sensitivity to specific acoustic conditions. The findings suggest that the developed MATLAB tool enables STI calculation using multiple methods and produces consistent results in selected measurement scenarios. However, due to the observed discrepancies, further validation in diverse acoustic environments is recommended to comprehensively verify the functionality of the tool.
Description
Citation
CIESLAR, Š. Výpočet indexu srozumitelnosti řeči v Matlabu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
prof. Mgr. Pavel Rajmic, Ph.D. (předseda)
doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda)
Ing. Václav Vencovský, Ph.D. (člen)
MgA. et Mgr. Ondřej Jirásek, Ph.D. (člen)
Ing. Václav Mach, Ph.D. (člen)
Date of acceptance
2025-06-12
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
otázky:
V kapitole 7.1.1 uvádíte, že v implementaci bylo využito na okrajích exponenciálně přelaďovaného harmonického signálu Hannovo okno délky 15 ms. Je tomu skutečně tak nebo byla využita jeho náběžná resp. sestupná hrana? Proč jste upřednostnil váhování budícího signálu před váhováním zaznamenaného signálu?
Vysvětlete výpočet funkce přenosu modulace u nepřímé metody a souvislost druhého člene rovnice s kompenzací hluku pozadí. Je možné použít měření impulsové odezvy prostoru při provozním hluku pozadí?
Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
