Porovnání metrik pro hodnocení úrovně poškození audio signálů

Loading...
Thumbnail Image

Date

Authors

Matuška, Kryštof

Mark

D

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato bakalářská práce porovnává objektivní a subjektivní metriky pro hodnocení poškození audio signálů. Popisuje metody hodnocení založené na psychoakustických modelech a využívá vybrané metriky (PESQ, STOI, SNR, SDR, FAD), z nichž některé byly implementovány a jiné převzaty z dostupných knihoven. Tyto metriky jsou testovány na degradovaných datech z datových sad GTZAN a Mozilla Common Voice. Subjektivní hodnocení proběhlo formou poslechového testu s absolutním hodnocením. Výsledky ukazují míru shody mezi metrikami a vnímáním, a naznačují vhodnost metrik pro různé typy poškození.
This thesis compares objective and subjective metrics for evaluating audio signal degradation. It focuses on psychoacoustic-based methods and employs selected metrics (PESQ, STOI, SNR, SDR, FAD), some of which were implemented and others adapted from existing libraries. These metrics were tested on degraded GTZAN and Mozilla Common Voice data. Subjective evaluation was conducted using a listening test with an absolute category rating. Results show correlations between perception and metrics, highlighting their suitability for different degradation types.

Description

Citation

MATUŠKA, K. Porovnání metrik pro hodnocení úrovně poškození audio signálů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

prof. Ing. Zdeněk Smékal, CSc. (předseda) doc. Ing. Jiří Schimmel, Ph.D. (člen) doc. Ing. Petr Sysel, Ph.D. (místopředseda) MgA. et Mgr. Ondřej Jirásek, Ph.D. (člen) Ing. Ondřej Mokrý, Ph.D. (člen)

Date of acceptance

2025-08-28

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. otázky: Pokládám obdobnou otázku jako v červnu 2025 (na obhajobě jsem nebyl): Ve vyhodnocení pomocí PESQ se pythonovská funkce pesq volá se vzorkovací frekvencí jakožto prvním parametrem. V dokumentaci se píše, že tato frekvence může být 8 nebo 16 kHz. Avšak já Vašemu kódu metrics.py rozumím tak, že v případě frekvence jiné než 8 nebo 16 kHz se signál nepřevzorkuje, což by mohlo vést k nesprávným výsledkům. Můžete se k tomu prosím vyjádřit? Jaký statistický test jste při vyhodnocení výsledků používal? Jaké nedostatkymá vaše použití MUSHRA testu? Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO