Porovnání metrik pro hodnocení úrovně poškození audio signálů
Loading...
Date
Authors
Matuška, Kryštof
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Tato bakalářská práce porovnává objektivní a subjektivní metriky pro hodnocení poškození audio signálů. Popisuje metody hodnocení založené na psychoakustických modelech a využívá vybrané metriky (PESQ, STOI, SNR, SDR, FAD), z nichž některé byly implementovány a jiné převzaty z dostupných knihoven. Tyto metriky jsou testovány na degradovaných datech z GTZAN a Mozilla Common Voice. Subjektivní hodnocení proběhlo pomocí testu MUSHRA. Výsledky ukazují míru shody mezi metrikami a vnímáním, a naznačují vhodnost metrik pro různé typy poškození.
This thesis compares objective and subjective metrics for evaluating audio signal degradation. It focuses on psychoacoustic-based methods and employs selected metrics (PESQ, STOI, SNR, SDR, FAD), some of which were implemented and others adapted from existing libraries. These metrics were tested on degraded GTZAN and Mozilla Common Voice data. Subjective evaluation used the MUSHRA test. Results show correlations between perception and metrics, highlighting their suitability for different degradation types.
This thesis compares objective and subjective metrics for evaluating audio signal degradation. It focuses on psychoacoustic-based methods and employs selected metrics (PESQ, STOI, SNR, SDR, FAD), some of which were implemented and others adapted from existing libraries. These metrics were tested on degraded GTZAN and Mozilla Common Voice data. Subjective evaluation used the MUSHRA test. Results show correlations between perception and metrics, highlighting their suitability for different degradation types.
Description
Keywords
audio signál , metriky poškození , psychoakustika , MUSHRA , PESQ , STOI , SDR , SNR , FAD , výpadky vzorků , ztráta fáze , klipování , kvantizace , audio signal , degradation metrics , psychoacoustics , MUSHRA , PESQ , STOI , SDR , SNR , FAD , dropout , phase loss , clipping , quantize
Citation
MATUŠKA, K. Porovnání metrik pro hodnocení úrovně poškození audio signálů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. Kamil Říha, Ph.D. (předseda)
Ing.MgA. Edgar Mojdl, Ph.D. (místopředseda)
Ing. Štěpán Miklánek, Ph.D. (člen)
Ing. Ondřej Krajsa, Ph.D. (člen)
Ing. David Obořil (člen)
Date of acceptance
2025-06-19
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
Student neobhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta. Student projevil základní neznalosti v oblasti objektivních metrik poškození audiosignálu.
Otázky:
Namátkově jsem se podíval do kódu metrics.py. Pokud chápu dobře, u PESQ lze nastavit vzorkovací kmitočet na 8 nebo 16 kHz. Váš kód předpokládá, že si funkce PESQ v ostatních případech signál převzorkuje, což ale podle mě není pravda. Můžete se k tomu prosím vyjádřit?
Proč v obrázcích 7.1 až 7.5 chybí poškození typu time dropout?
Result of defence
práce nebyla úspěšně obhájena
