Zvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složku

but.committeeprof. Mgr. Pavel Rajmic, Ph.D. (předseda) RNDr. Lubor Přikryl (místopředseda) Ing. Kryštof Novotný (člen) MgA. Michal Indrák, Ph.D. (člen) Ing. Ondřej Krajsa, Ph.D. (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta. Otázky: Proč je pro tranzientní a harmonickou složku použito jiné okno a jaký vliv má volba okna na výkon algoritmu? Jaká je výpočetní náročnost navrženého algoritmu ve srovnání s dekvantizací pomocí prosté l1 normy algoritmem Chambolle-Pock (CP), který používáte pro srovnání?cs
but.jazykangličtina (English)
but.programAudio inženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorRajmic, Pavelen
dc.contributor.authorFridrich, Jánen
dc.contributor.refereeZáviška, Pavelen
dc.date.created2024cs
dc.description.abstractTáto práca skúma novú metódu dekvantizácie audio signálov, teda metódu zvyšovania ich bitovej hĺbky. Navrhovaný prístup funguje na základe dekompozície signálu na transientnú a harmonickú zložku a ich spätným sčítaním, pričom dochádza k zníženiu kvantizačných artefaktov. Dekompozícia signálu je realizovaná pomocou zmiešaných noriem a~implementovaná v upravenom primal-dual algoritme. Práca začína prehľadom matematických základov digitálneho spracovania signálov, a to Krátkodobá Fourierova transformácia (STFT), kvantizácia a normy. Na to nadväzuje popis transientnej a harmonickej zložky a predstavenie dvoch rozdielnych metód na ich separáciu. Jedna z týchto metód, založená na zmiešaných normách, je implementovaná autormi článku [2] využitím primal-dual algoritmu. Hlavným zameraním tejto práce je úprava tohto algoritmu na zvyšovanie bitovej hĺbky. Matematická a algoritmická úprava je odvodená a porovnaná s pôvodnou formuláciou. Upravený algoritmus je implementovaný v programe Matlab a testovaný na audio databáze zloženej z rôznych signálov. Účinnosť navrhovaného algoritmu je vyhodnotená použitím objektívnych kritérií ako Signal-to-Distortion Ratio (SDR) a PEMO-Q sluchovým modelom ako aj subjektívnym názorom. Diskutovaný je aj vplyv parametrov a počet iterácií. Výsledky ukazujú, že aj keď navrhovaná metóda znižuje časť kvantizačných artefaktov, zároveň prináša do signálu iný typ skreslenia. Metóda je navyše výpočtovo náročná. Napriek tomu tento prístup prináša zaujímavý náhľad na význam transientnej a harmonickej zložky v kontexte dekvantizácie a necháva priestor pre budúce zlepšenie a optimalizáciu.en
dc.description.abstractThis thesis explores a novel approach to the dequantization of audio signals, or in other words, increasing their bit depth. The proposed approach functions by decomposing the signals into harmonic and transient components and summing these components back while reducing quantization artifacts. The decomposition is performed by mixed norms and implemented in an adapted primal-dual algorithm. The thesis begins with a review of the mathematical foundations of audio signal processing, specifically the Short-Time Fourier Transform (STFT), quantization, and norms. This is followed by a description of the transient and harmonic components and an explanation of two different methods to perform such separation. One of these methods, based on mixed norms, is implemented by the authors of \cite{2} using a primal-dual algorithm. The primary focus of this thesis is the adaptation of this primal-dual algorithm to perform the bit depth expansion. The mathematical and algorithmic adjustments are derived and compared to the original formulation. The adapted algorithm is implemented in Matlab and tested on an audio database composed of different signals. The performance of the proposed algorithm is evaluated using objective metrics such as Signal-to-Distortion Ratio (SDR) and the PEMO-Q auditory model, as well as subjective opinions. The impact of the parameters and the number of iterations are discussed. The results demonstrate that while the proposed method reduces some quantization artifacts, it also introduces new types of distortions and is computationally complex. Nevertheless, this approach provides interesting insight into the meaning of the transient and harmonic components in the context of dequantization and leaves room for future improvements and optimization.cs
dc.description.markAcs
dc.identifier.citationFRIDRICH, J. Zvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složku [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.cs
dc.identifier.other159253cs
dc.identifier.urihttp://hdl.handle.net/11012/247356
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDekvantizáciaen
dc.subjectharmonický komponenten
dc.subjectprimal-dual algoritmusen
dc.subjectrozklad audiaen
dc.subjecttranzientný komponenten
dc.subjectzmiešané normyen
dc.subjectzvyšovanie bitovej hĺbky.en
dc.subjectAudio decompositioncs
dc.subjectbit depth expansioncs
dc.subjectdequantizationcs
dc.subjectharmonic componentcs
dc.subjectmixed normscs
dc.subjectprimal-dual algorithmcs
dc.subjecttransient component.cs
dc.titleZvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složkuen
dc.title.alternativeBit depth expansion in audio signals using separation of harmonic and transient componentscs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2024-06-12cs
dcterms.modified2024-06-13-07:54:10cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid159253en
sync.item.dbtypeZPen
sync.item.insts2025.03.17 17:21:40en
sync.item.modts2025.01.15 15:07:48en
thesis.disciplineZvuková produkce a nahrávánícs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
7.09 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
4.6 MB
Format:
Unknown data format
Description:
file appendix-1.zip
Loading...
Thumbnail Image
Name:
review_159253.html
Size:
5.35 KB
Format:
Hypertext Markup Language
Description:
file review_159253.html
Collections