Rekonstrukce poškozených audio signálů pomocí deep unrolling

Loading...
Thumbnail Image

Date

Authors

Kment, František

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Práce se zabývá problematikou restaurace audiosignálu pomocí tradičních optimalizačních metod v kombinaci s metodami deep unrolling. Byla formulována optimalizační úloha doplňování chybějících úseků audio signálu a byl zvolen a následně implementován proximální algoritmus FISTA. Dále byly implementovány 3 unrolled varianty algoritmu (Unrolled Fista Net), z nichž 2 byly dále optimalizovány pomocí testů na zvoleném testovacím datasetu a naučeny na datasetu Nsynth. Výsledky naučených sítí byly porovnány jak s konkurenčními metodami, tak s původní neučenou variantou algoritmu. Porovnáváno bylo pomocí objektivních metrik (MSE, SNR, PEAQ, PEMO-Q) a subjektivního poslechového testu.
The thesis deals with the problem of audio signal restoration using traditional optimization methods combined with deep unrolling methods. An optimization task for filling in missing sections of the audio signal was formulated, and the proximal algorithm FISTA was chosen and subsequently implemented. Furthermore, three unrolled variants of the algorithm (Unrolled Fista Net) were implemented, two of which were further optimized using tests on a selected test dataset and trained on the Nsynth dataset. The results of the trained networks were compared both with competing methods and the original untrained variant of the algorithm. The comparison was made using objective metrics (MSE, SNR, PEAQ, PEMO-Q) and a subjective listening test.

Description

Citation

KMENT, F. Rekonstrukce poškozených audio signálů pomocí deep unrolling [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (předseda) Ing. Miroslav Balík, Ph.D. (místopředseda) Ing. Matej Liska (člen) Ing. Václav Mach, Ph.D. (člen) Ing. Daniel Kováč (člen)

Date of acceptance

2024-06-12

Defence

Obhajoba závěrečné práce: Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. Otázky: Popište problematiku hardwarového omezení, kvůli kterému bylo nutné snížit počet použitých datových vzorků pro trénování modelů. Jakým způsobem proběhla optimalizace načítacího procesu, aby bylo možné efektivně pracovat s omezenými zdroji? Jaké klíčové faktory byly zváženy při určení optimálního počtu epoch, který je stanoven na 50? Můžete zdůvodnit, proč nedošlo k navýšení epoch na základě prezentovaných průběhů hodnot ztrátové funkce na trénovací a validační datové množině? Jak byl vytvořen dataset pro trénování modelu?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO