Porovnání metrik pro hodnocení úrovně poškození audio signálů

Loading...
Thumbnail Image

Date

Authors

Matuška, Kryštof

Mark

D

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato bakalářská práce porovnává objektivní a subjektivní metriky pro hodnocení poškození audio signálů. Popisuje metody hodnocení založené na psychoakustických modelech a využívá vybrané metriky (PESQ, STOI, SNR, SDR, FAD), z nichž některé byly implementovány a jiné převzaty z dostupných knihoven. Tyto metriky jsou testovány na degradovaných datech z GTZAN a Mozilla Common Voice. Subjektivní hodnocení proběhlo pomocí testu MUSHRA. Výsledky ukazují míru shody mezi metrikami a vnímáním, a naznačují vhodnost metrik pro různé typy poškození.
This thesis compares objective and subjective metrics for evaluating audio signal degradation. It focuses on psychoacoustic-based methods and employs selected metrics (PESQ, STOI, SNR, SDR, FAD), some of which were implemented and others adapted from existing libraries. These metrics were tested on degraded GTZAN and Mozilla Common Voice data. Subjective evaluation used the MUSHRA test. Results show correlations between perception and metrics, highlighting their suitability for different degradation types.

Description

Citation

MATUŠKA, K. Porovnání metrik pro hodnocení úrovně poškození audio signálů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

doc. Ing. Kamil Říha, Ph.D. (předseda) Ing.MgA. Edgar Mojdl, Ph.D. (místopředseda) Ing. Štěpán Miklánek, Ph.D. (člen) Ing. Ondřej Krajsa, Ph.D. (člen) Ing. David Obořil (člen)

Date of acceptance

2025-06-19

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student neobhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta. Student projevil základní neznalosti v oblasti objektivních metrik poškození audiosignálu. Otázky: Namátkově jsem se podíval do kódu metrics.py. Pokud chápu dobře, u PESQ lze nastavit vzorkovací kmitočet na 8 nebo 16 kHz. Váš kód předpokládá, že si funkce PESQ v ostatních případech signál převzorkuje, což ale podle mě není pravda. Můžete se k tomu prosím vyjádřit? Proč v obrázcích 7.1 až 7.5 chybí poškození typu time dropout?

Result of defence

práce nebyla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO