Redukce šumu ve zvukovém signálu pomocí hlubokého učení
Loading...
Date
Authors
ORCID
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato práce se zabývá odstraňováním šumu v audio signálu za použití hlubokého učení. Jsou zde popsány základní typy neuronových sítí a jejich využití v této oblasti. Možnosti implementace neuronových sítí jsou otestovány v prostředí Matlab a Python. Následně je navržen model neuronové konvoluční sítě, podle kterého jsou realizovány čtyři různé architektury konvolučních sítí, které byly poté trénovány a testovány na různých typech šumů. Na základě těchto testů byla vybrána jedna architektura, která byla společně s~metodou redukce šumu využívající vlnkové transformace podrobena srovnávacímu testu na nahrávce řeči a poté na hudební nahrávce. Výsledky jsou vyhodnoceny jak pomocí objektivních metrik kvality zvuku tak pomocí neformálního poslechového testu. Neuronová síť dosáhla lepších výsledků dle všech použitých metrik a v poslechovém testu.
This thesis deals with noise removal in audio signal using deep learning. The basic types of neural networks and their use in audio signal processing are described. The possibilities of implementing neural networks are tested in Matlab and Python. Subsequently, a~convolutional neural network model is proposed, according to which four different convolutional network architectures are implemented and then trained and tested on different types of noise. Based on these tests, one architecture was selected and subjected to a comparative test on a speech recording and then on a music recording, together with a noise reduction method using wavelet transform. The results are evaluated using both objective sound quality metrics and an informal listening test. The neural network achieved better results according to all the metrics used as well as in the listening test.
This thesis deals with noise removal in audio signal using deep learning. The basic types of neural networks and their use in audio signal processing are described. The possibilities of implementing neural networks are tested in Matlab and Python. Subsequently, a~convolutional neural network model is proposed, according to which four different convolutional network architectures are implemented and then trained and tested on different types of noise. Based on these tests, one architecture was selected and subjected to a comparative test on a speech recording and then on a music recording, together with a noise reduction method using wavelet transform. The results are evaluated using both objective sound quality metrics and an informal listening test. The neural network achieved better results according to all the metrics used as well as in the listening test.
Description
Citation
PACAL, T. Redukce šumu ve zvukovém signálu pomocí hlubokého učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. Kamil Říha, Ph.D. (předseda)
Ing. Jana Jelínková (člen)
Ing. David Kubánek, Ph.D. (člen)
Ing. Matěj Ištvánek (člen)
Ing. Jiří Přinosil, Ph.D. (místopředseda)
Date of acceptance
2023-06-14
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
Otázky oponenta:
Pokud se používá pouze modulové spektrum, jak získáte zpět rekonstruovaný signál v časové oblasti (tzv. waveform)?
Proč jste použil na trénování výsledné sítě pro audio denoising pouze jednu epochu?
Jaký je princip metody denoisingu pomocí Waveletové transformace, kterou používáte pro srovnání?
Otázky komise:
Jak jste pracoval s datasetem, kolik nahrávek obsahoval? Popište parametry použité STFT.
Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení