Redukce šumu ve zvukovém signálu pomocí hlubokého učení

Tato práce se zabývá odstraňováním šumu v audio signálu za použití hlubokého učení. Jsou zde popsány základní typy neuronových sítí a jejich využití v této oblasti. Možnosti implementace neuronových sítí jsou otestovány v prostředí Matlab a Python. Následně je navržen model neuronové konvoluční sítě, podle kterého jsou realizovány čtyři různé architektury konvolučních sítí, které byly poté trénovány a testovány na různých typech šumů. Na základě těchto testů byla vybrána jedna architektura, která byla společně s~metodou redukce šumu využívající vlnkové transformace podrobena srovnávacímu testu na nahrávce řeči a poté na hudební nahrávce. Výsledky jsou vyhodnoceny jak pomocí objektivních metrik kvality zvuku tak pomocí neformálního poslechového testu. Neuronová síť dosáhla lepších výsledků dle všech použitých metrik a v poslechovém testu.
This thesis deals with noise removal in audio signal using deep learning. The basic types of neural networks and their use in audio signal processing are described. The possibilities of implementing neural networks are tested in Matlab and Python. Subsequently, a~convolutional neural network model is proposed, according to which four different convolutional network architectures are implemented and then trained and tested on different types of noise. Based on these tests, one architecture was selected and subjected to a comparative test on a speech recording and then on a music recording, together with a noise reduction method using wavelet transform. The results are evaluated using both objective sound quality metrics and an informal listening test. The neural network achieved better results according to all the metrics used as well as in the listening test.

Citation

PACAL, T. Redukce šumu ve zvukovém signálu pomocí hlubokého učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

doc. Ing. Kamil Říha, Ph.D. (předseda) Ing. MgA. Jana Jelínková (člen) doc. Ing. David Kubánek, Ph.D. (člen) Ing. Matěj Ištvánek, Ph.D. (člen) Ing. Jiří Přinosil, Ph.D. (místopředseda)

Date of acceptance

2023-06-14

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Pokud se používá pouze modulové spektrum, jak získáte zpět rekonstruovaný signál v časové oblasti (tzv. waveform)? Proč jste použil na trénování výsledné sítě pro audio denoising pouze jednu epochu? Jaký je princip metody denoisingu pomocí Waveletové transformace, kterou používáte pro srovnání? Otázky komise: Jak jste pracoval s datasetem, kolik nahrávek obsahoval? Popište parametry použité STFT. Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

Document licence

Standardní licenční smlouva - přístup k plnému textu bez omezení