Zvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složku

Loading...
Thumbnail Image
Date
Authors
Fridrich, Ján
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Táto práca skúma novú metódu dekvantizácie audio signálov, teda metódu zvyšovania ich bitovej hĺbky. Navrhovaný prístup funguje na základe dekompozície signálu na transientnú a harmonickú zložku a ich spätným sčítaním, pričom dochádza k zníženiu kvantizačných artefaktov. Dekompozícia signálu je realizovaná pomocou zmiešaných noriem a~implementovaná v upravenom primal-dual algoritme. Práca začína prehľadom matematických základov digitálneho spracovania signálov, a to Krátkodobá Fourierova transformácia (STFT), kvantizácia a normy. Na to nadväzuje popis transientnej a harmonickej zložky a predstavenie dvoch rozdielnych metód na ich separáciu. Jedna z týchto metód, založená na zmiešaných normách, je implementovaná autormi článku [2] využitím primal-dual algoritmu. Hlavným zameraním tejto práce je úprava tohto algoritmu na zvyšovanie bitovej hĺbky. Matematická a algoritmická úprava je odvodená a porovnaná s pôvodnou formuláciou. Upravený algoritmus je implementovaný v programe Matlab a testovaný na audio databáze zloženej z rôznych signálov. Účinnosť navrhovaného algoritmu je vyhodnotená použitím objektívnych kritérií ako Signal-to-Distortion Ratio (SDR) a PEMO-Q sluchovým modelom ako aj subjektívnym názorom. Diskutovaný je aj vplyv parametrov a počet iterácií. Výsledky ukazujú, že aj keď navrhovaná metóda znižuje časť kvantizačných artefaktov, zároveň prináša do signálu iný typ skreslenia. Metóda je navyše výpočtovo náročná. Napriek tomu tento prístup prináša zaujímavý náhľad na význam transientnej a harmonickej zložky v kontexte dekvantizácie a necháva priestor pre budúce zlepšenie a optimalizáciu.
This thesis explores a novel approach to the dequantization of audio signals, or in other words, increasing their bit depth. The proposed approach functions by decomposing the signals into harmonic and transient components and summing these components back while reducing quantization artifacts. The decomposition is performed by mixed norms and implemented in an adapted primal-dual algorithm. The thesis begins with a review of the mathematical foundations of audio signal processing, specifically the Short-Time Fourier Transform (STFT), quantization, and norms. This is followed by a description of the transient and harmonic components and an explanation of two different methods to perform such separation. One of these methods, based on mixed norms, is implemented by the authors of \cite{2} using a primal-dual algorithm. The primary focus of this thesis is the adaptation of this primal-dual algorithm to perform the bit depth expansion. The mathematical and algorithmic adjustments are derived and compared to the original formulation. The adapted algorithm is implemented in Matlab and tested on an audio database composed of different signals. The performance of the proposed algorithm is evaluated using objective metrics such as Signal-to-Distortion Ratio (SDR) and the PEMO-Q auditory model, as well as subjective opinions. The impact of the parameters and the number of iterations are discussed. The results demonstrate that while the proposed method reduces some quantization artifacts, it also introduces new types of distortions and is computationally complex. Nevertheless, this approach provides interesting insight into the meaning of the transient and harmonic components in the context of dequantization and leaves room for future improvements and optimization.
Description
Citation
FRIDRICH, J. Zvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složku [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Zvuková produkce a nahrávání
Comittee
prof. Mgr. Pavel Rajmic, Ph.D. (předseda) RNDr. Lubor Přikryl (místopředseda) Ing. Kryštof Novotný (člen) MgA. Michal Indrák, Ph.D. (člen) Ing. Ondřej Krajsa, Ph.D. (člen)
Date of acceptance
2024-06-12
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta. Otázky: Proč je pro tranzientní a harmonickou složku použito jiné okno a jaký vliv má volba okna na výkon algoritmu? Jaká je výpočetní náročnost navrženého algoritmu ve srovnání s dekvantizací pomocí prosté l1 normy algoritmem Chambolle-Pock (CP), který používáte pro srovnání?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO