Rekonstrukce poškozených audio signálů pomocí deep unrolling

Loading...
Thumbnail Image
Date
Authors
Kment, František
ORCID
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Práce se zabývá problematikou restaurace audiosignálu pomocí tradičních optimalizačních metod v kombinaci s metodami deep unrolling. Byla formulována optimalizační úloha doplňování chybějících úseků audio signálu a byl zvolen a následně implementován proximální algoritmus FISTA. Dále byly implementovány 3 unrolled varianty algoritmu (Unrolled Fista Net), z nichž 2 byly dále optimalizovány pomocí testů na zvoleném testovacím datasetu a naučeny na datasetu Nsynth. Výsledky naučených sítí byly porovnány jak s konkurenčními metodami, tak s původní neučenou variantou algoritmu. Porovnáváno bylo pomocí objektivních metrik (MSE, SNR, PEAQ, PEMO-Q) a subjektivního poslechového testu.
The thesis deals with the problem of audio signal restoration using traditional optimization methods combined with deep unrolling methods. An optimization task for filling in missing sections of the audio signal was formulated, and the proximal algorithm FISTA was chosen and subsequently implemented. Furthermore, three unrolled variants of the algorithm (Unrolled Fista Net) were implemented, two of which were further optimized using tests on a selected test dataset and trained on the Nsynth dataset. The results of the trained networks were compared both with competing methods and the original untrained variant of the algorithm. The comparison was made using objective metrics (MSE, SNR, PEAQ, PEMO-Q) and a subjective listening test.
Description
Citation
KMENT, F. Rekonstrukce poškozených audio signálů pomocí deep unrolling [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (předseda) Ing. Miroslav Balík, Ph.D. (místopředseda) Ing. Matej Liska (člen) Ing. Václav Mach, Ph.D. (člen) Ing. Daniel Kováč (člen)
Date of acceptance
2024-06-12
Defence
Obhajoba závěrečné práce: Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. Otázky: Popište problematiku hardwarového omezení, kvůli kterému bylo nutné snížit počet použitých datových vzorků pro trénování modelů. Jakým způsobem proběhla optimalizace načítacího procesu, aby bylo možné efektivně pracovat s omezenými zdroji? Jaké klíčové faktory byly zváženy při určení optimálního počtu epoch, který je stanoven na 50? Můžete zdůvodnit, proč nedošlo k navýšení epoch na základě prezentovaných průběhů hodnot ztrátové funkce na trénovací a validační datové množině? Jak byl vytvořen dataset pro trénování modelu?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO