Rekonstrukce poškozených audio signálů pomocí deep unrolling
but.committee | doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (předseda) Ing. Miroslav Balík, Ph.D. (místopředseda) Ing. Matej Liska (člen) Ing. Václav Mach, Ph.D. (člen) Ing. Daniel Kováč (člen) | cs |
but.defence | Obhajoba závěrečné práce: Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil bakalářskou práci s výhradami a odpověděl na otázky členů komise a oponenta. Otázky: Popište problematiku hardwarového omezení, kvůli kterému bylo nutné snížit počet použitých datových vzorků pro trénování modelů. Jakým způsobem proběhla optimalizace načítacího procesu, aby bylo možné efektivně pracovat s omezenými zdroji? Jaké klíčové faktory byly zváženy při určení optimálního počtu epoch, který je stanoven na 50? Můžete zdůvodnit, proč nedošlo k navýšení epoch na základě prezentovaných průběhů hodnot ztrátové funkce na trénovací a validační datové množině? Jak byl vytvořen dataset pro trénování modelu? | cs |
but.jazyk | čeština (Czech) | |
but.program | Audio inženýrství | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Mokrý, Ondřej | cs |
dc.contributor.author | Kment, František | cs |
dc.contributor.referee | Myška, Vojtěch | cs |
dc.date.created | 2024 | cs |
dc.description.abstract | Práce se zabývá problematikou restaurace audiosignálu pomocí tradičních optimalizačních metod v kombinaci s metodami deep unrolling. Byla formulována optimalizační úloha doplňování chybějících úseků audio signálu a byl zvolen a následně implementován proximální algoritmus FISTA. Dále byly implementovány 3 unrolled varianty algoritmu (Unrolled Fista Net), z nichž 2 byly dále optimalizovány pomocí testů na zvoleném testovacím datasetu a naučeny na datasetu Nsynth. Výsledky naučených sítí byly porovnány jak s konkurenčními metodami, tak s původní neučenou variantou algoritmu. Porovnáváno bylo pomocí objektivních metrik (MSE, SNR, PEAQ, PEMO-Q) a subjektivního poslechového testu. | cs |
dc.description.abstract | The thesis deals with the problem of audio signal restoration using traditional optimization methods combined with deep unrolling methods. An optimization task for filling in missing sections of the audio signal was formulated, and the proximal algorithm FISTA was chosen and subsequently implemented. Furthermore, three unrolled variants of the algorithm (Unrolled Fista Net) were implemented, two of which were further optimized using tests on a selected test dataset and trained on the Nsynth dataset. The results of the trained networks were compared both with competing methods and the original untrained variant of the algorithm. The comparison was made using objective metrics (MSE, SNR, PEAQ, PEMO-Q) and a subjective listening test. | en |
dc.description.mark | C | cs |
dc.identifier.citation | KMENT, F. Rekonstrukce poškozených audio signálů pomocí deep unrolling [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024. | cs |
dc.identifier.other | 159809 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/247410 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | audio signál | cs |
dc.subject | deep unrolling | cs |
dc.subject | inpainting | cs |
dc.subject | FISTA | cs |
dc.subject | neuronová síť | cs |
dc.subject | restaurace audio signálu | cs |
dc.subject | audio signal | en |
dc.subject | deep unrolling | en |
dc.subject | inpainting | en |
dc.subject | FISTA | en |
dc.subject | neural network | en |
dc.subject | audio signal restoration | en |
dc.title | Rekonstrukce poškozených audio signálů pomocí deep unrolling | cs |
dc.title.alternative | Reconstruction of corrupted audio signals using deep unrolling | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-12 | cs |
dcterms.modified | 2024-06-13-07:54:10 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 159809 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.17 17:22:23 | en |
sync.item.modts | 2025.01.15 23:41:08 | en |
thesis.discipline | Zvuková produkce a nahrávání | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 2.89 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 1.75 MB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- review_159809.html
- Size:
- 5.92 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_159809.html