Zvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složku
but.committee | prof. Mgr. Pavel Rajmic, Ph.D. (předseda) RNDr. Lubor Přikryl (místopředseda) Ing. Kryštof Novotný (člen) MgA. Michal Indrák, Ph.D. (člen) Ing. Ondřej Krajsa, Ph.D. (člen) | cs |
but.defence | Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta. Otázky: Proč je pro tranzientní a harmonickou složku použito jiné okno a jaký vliv má volba okna na výkon algoritmu? Jaká je výpočetní náročnost navrženého algoritmu ve srovnání s dekvantizací pomocí prosté l1 normy algoritmem Chambolle-Pock (CP), který používáte pro srovnání? | cs |
but.jazyk | angličtina (English) | |
but.program | Audio inženýrství | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Rajmic, Pavel | en |
dc.contributor.author | Fridrich, Ján | en |
dc.contributor.referee | Záviška, Pavel | en |
dc.date.created | 2024 | cs |
dc.description.abstract | Táto práca skúma novú metódu dekvantizácie audio signálov, teda metódu zvyšovania ich bitovej hĺbky. Navrhovaný prístup funguje na základe dekompozície signálu na transientnú a harmonickú zložku a ich spätným sčítaním, pričom dochádza k zníženiu kvantizačných artefaktov. Dekompozícia signálu je realizovaná pomocou zmiešaných noriem a~implementovaná v upravenom primal-dual algoritme. Práca začína prehľadom matematických základov digitálneho spracovania signálov, a to Krátkodobá Fourierova transformácia (STFT), kvantizácia a normy. Na to nadväzuje popis transientnej a harmonickej zložky a predstavenie dvoch rozdielnych metód na ich separáciu. Jedna z týchto metód, založená na zmiešaných normách, je implementovaná autormi článku [2] využitím primal-dual algoritmu. Hlavným zameraním tejto práce je úprava tohto algoritmu na zvyšovanie bitovej hĺbky. Matematická a algoritmická úprava je odvodená a porovnaná s pôvodnou formuláciou. Upravený algoritmus je implementovaný v programe Matlab a testovaný na audio databáze zloženej z rôznych signálov. Účinnosť navrhovaného algoritmu je vyhodnotená použitím objektívnych kritérií ako Signal-to-Distortion Ratio (SDR) a PEMO-Q sluchovým modelom ako aj subjektívnym názorom. Diskutovaný je aj vplyv parametrov a počet iterácií. Výsledky ukazujú, že aj keď navrhovaná metóda znižuje časť kvantizačných artefaktov, zároveň prináša do signálu iný typ skreslenia. Metóda je navyše výpočtovo náročná. Napriek tomu tento prístup prináša zaujímavý náhľad na význam transientnej a harmonickej zložky v kontexte dekvantizácie a necháva priestor pre budúce zlepšenie a optimalizáciu. | en |
dc.description.abstract | This thesis explores a novel approach to the dequantization of audio signals, or in other words, increasing their bit depth. The proposed approach functions by decomposing the signals into harmonic and transient components and summing these components back while reducing quantization artifacts. The decomposition is performed by mixed norms and implemented in an adapted primal-dual algorithm. The thesis begins with a review of the mathematical foundations of audio signal processing, specifically the Short-Time Fourier Transform (STFT), quantization, and norms. This is followed by a description of the transient and harmonic components and an explanation of two different methods to perform such separation. One of these methods, based on mixed norms, is implemented by the authors of \cite{2} using a primal-dual algorithm. The primary focus of this thesis is the adaptation of this primal-dual algorithm to perform the bit depth expansion. The mathematical and algorithmic adjustments are derived and compared to the original formulation. The adapted algorithm is implemented in Matlab and tested on an audio database composed of different signals. The performance of the proposed algorithm is evaluated using objective metrics such as Signal-to-Distortion Ratio (SDR) and the PEMO-Q auditory model, as well as subjective opinions. The impact of the parameters and the number of iterations are discussed. The results demonstrate that while the proposed method reduces some quantization artifacts, it also introduces new types of distortions and is computationally complex. Nevertheless, this approach provides interesting insight into the meaning of the transient and harmonic components in the context of dequantization and leaves room for future improvements and optimization. | cs |
dc.description.mark | A | cs |
dc.identifier.citation | FRIDRICH, J. Zvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složku [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024. | cs |
dc.identifier.other | 159253 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/247356 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Dekvantizácia | en |
dc.subject | harmonický komponent | en |
dc.subject | primal-dual algoritmus | en |
dc.subject | rozklad audia | en |
dc.subject | tranzientný komponent | en |
dc.subject | zmiešané normy | en |
dc.subject | zvyšovanie bitovej hĺbky. | en |
dc.subject | Audio decomposition | cs |
dc.subject | bit depth expansion | cs |
dc.subject | dequantization | cs |
dc.subject | harmonic component | cs |
dc.subject | mixed norms | cs |
dc.subject | primal-dual algorithm | cs |
dc.subject | transient component. | cs |
dc.title | Zvyšování bitové hloubky audia pomocí rozkladu na harmonickou a transientní složku | en |
dc.title.alternative | Bit depth expansion in audio signals using separation of harmonic and transient components | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-12 | cs |
dcterms.modified | 2024-06-13-07:54:10 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 159253 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.17 17:21:40 | en |
sync.item.modts | 2025.01.15 15:07:48 | en |
thesis.discipline | Zvuková produkce a nahrávání | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 7.09 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 4.6 MB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- review_159253.html
- Size:
- 5.35 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_159253.html