Porovnání metrik pro hodnocení úrovně poškození audio signálů
Loading...
Date
Authors
Matuška, Kryštof
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Tato bakalářská práce porovnává objektivní a subjektivní metriky pro hodnocení poškození audio signálů. Popisuje metody hodnocení založené na psychoakustických modelech a využívá vybrané metriky (PESQ, STOI, SNR, SDR, FAD), z nichž některé byly implementovány a jiné převzaty z dostupných knihoven. Tyto metriky jsou testovány na degradovaných datech z datových sad GTZAN a Mozilla Common Voice. Subjektivní hodnocení proběhlo formou poslechového testu s absolutním hodnocením. Výsledky ukazují míru shody mezi metrikami a vnímáním, a naznačují vhodnost metrik pro různé typy poškození.
This thesis compares objective and subjective metrics for evaluating audio signal degradation. It focuses on psychoacoustic-based methods and employs selected metrics (PESQ, STOI, SNR, SDR, FAD), some of which were implemented and others adapted from existing libraries. These metrics were tested on degraded GTZAN and Mozilla Common Voice data. Subjective evaluation was conducted using a listening test with an absolute category rating. Results show correlations between perception and metrics, highlighting their suitability for different degradation types.
This thesis compares objective and subjective metrics for evaluating audio signal degradation. It focuses on psychoacoustic-based methods and employs selected metrics (PESQ, STOI, SNR, SDR, FAD), some of which were implemented and others adapted from existing libraries. These metrics were tested on degraded GTZAN and Mozilla Common Voice data. Subjective evaluation was conducted using a listening test with an absolute category rating. Results show correlations between perception and metrics, highlighting their suitability for different degradation types.
Description
Keywords
audio signál , metriky poškození , psychoakustika , MUSHRA , ACR , PESQ , STOI , SDR , SNR , FAD , výpadky vzorků , ztráta fáze , saturace , kvantizace , audio signal , degradation metrics , psychoacoustics , MUSHRA , ACR , PESQ , STOI , SDR , SNR , FAD , dropout , phase loss , clipping , quantize
Citation
MATUŠKA, K. Porovnání metrik pro hodnocení úrovně poškození audio signálů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda)
doc. Ing. Jiří Schimmel, Ph.D. (člen)
doc. Ing. Petr Sysel, Ph.D. (místopředseda)
MgA. et Mgr. Ondřej Jirásek, Ph.D. (člen)
Ing. Ondřej Mokrý, Ph.D. (člen)
Date of acceptance
2025-08-28
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
otázky:
Pokládám obdobnou otázku jako v červnu 2025 (na obhajobě jsem nebyl): Ve vyhodnocení pomocí PESQ se pythonovská funkce pesq volá se vzorkovací frekvencí jakožto prvním parametrem. V dokumentaci se píše, že tato frekvence může být 8 nebo 16 kHz. Avšak já Vašemu kódu metrics.py rozumím tak, že v případě frekvence jiné než 8 nebo 16 kHz se signál nepřevzorkuje, což by mohlo vést k nesprávným výsledkům. Můžete se k tomu prosím vyjádřit?
Jaký statistický test jste při vyhodnocení výsledků používal?
Jaké nedostatkymá vaše použití MUSHRA testu?
Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
