Modelování zvukových signálů pomocí neuronových sítí

but.committeedoc. Ing. Kamil Říha, Ph.D. (předseda) doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda) MgA. Mgr. Ondřej Jirásek, Ph.D. (člen) Ing. Petr Honzík, Ph.D. (člen) doc. Ing. Petr Sysel, Ph.D. (člen) Mgr. Tomáš Staudek, Ph.D. (člen)cs
but.defenceStudentka prezentovala výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Čím můžete odůvodnit, že plně propojená síť dosáhla lepších výsledků než modernější TCN? (což nekoresponduje s poznatky nejnovějších studií) Kolik epoch jste zvolila při trénování a jak byl tento parametr vybrán? Hodí se některá z implementací pro zpracování v reálném čase? Studentka obhájila diplomovou práci a odpověděla na otázky členů komise a oponenta.cs
but.jazykangličtina (English)
but.programAudio inženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMiklánek, Štěpánen
dc.contributor.authorPešán, Micheleen
dc.contributor.refereeIštvánek, Matějen
dc.date.accessioned2021-06-11T06:55:04Z
dc.date.available2021-06-11T06:55:04Z
dc.date.created2021cs
dc.description.abstractNeuronové sítě vycházející z architektury WaveNet a sítě využívající rekurentní vrstvy jsou v současnosti používány jak pro syntézu lidské řeči, tak pro „black box“ modelování systémů pro úpravu akustického signálu – modulační efekty, nelineární zkreslovače apod. Úkolem studenta bude shrnout dosavadní poznatky o možnostech využití neuronových sítí při modelování akustických signálů. Student dále implementuje některý z modelů neuronových sítí v programovacím jazyce Python a využije jej pro natrénování a následnou simulaci libovolného efektu nebo systému pro úpravu akustického signálu. V rámci semestrální práce vypracujte teoretickou část práce, vytvořte zvukovou databázi pro trénování neuronové sítě a implementujte jednu ze struktur sítí pro modelování zvukového signálu. Neuronové sítě jsou v průběhu posledních let používány stále více, a to víceméně přes celé spektrum vědních oborů. Neuronové sítě založené na architektuře WaveNet a sítě využívající rekurentních vrstev se v současné době používají v celé řadě využití, zahrnující například syntézu lidské řeči, nebo napřklad při metodě "black-box" modelování akustických systémů, které upravují zvukový signál (modulačí efekty, nelineární zkreslovače, apod.). Tato akademická práce si dává za cíl poskytnout úvod do problematiky neuronových sítí, vysvětlit základní pojmy a mechanismy této problematiky. Popsat využití neuronových sítí v modelování akustických systémů a využít těchto poznatků k implementaci neuronových sítí za cílem modelování libovolného efektu nebo zařízení pro úpravu zvukového signálu.en
dc.description.abstractNeural networks based upon the WaveNet architecture and recurrent neural networks are nowadays used in human speech synthesis and other various tasks such as "black-box" modeling systems for acoustic signals alteration (modulation effects, non-linear distortion units, etc.). This work aims, to sum up existing methods of neural network use in acoustic signal modeling. Next, the student is to implement chosen model of neuron network Python and will train this architecture to perform a simulation of desirable sound effect or acoustic alteration system. The task for this semester is, to sum up existing knowledge concerning neural networks. Training database of sound samples and implementation of a sound modeling neural net is to be created as well. Through recent years, neural networks have been used more and more extensively across many science fields. Neural networks based upon the WaveNet architecture and recurrent neural networks are nowadays used in human speech synthesis and other various tasks such as "black-box" modeling systems for acoustic signals alteration (modulation effects, non-linear distortion units, etc.). This academic work provides a brief introduction to the neural network terminology and common practice, elaborates on several types of neural network types, the main focus on DeepMind's WaveNet. Furthermore describes and compares results of experimental implementation of WaveNet and other types of neural network in audio signal "black-box" modeling tasks.cs
dc.description.markBcs
dc.identifier.citationPEŠÁN, M. Modelování zvukových signálů pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.cs
dc.identifier.other133462cs
dc.identifier.urihttp://hdl.handle.net/11012/197100
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectmodelováníen
dc.subjectblack-boxen
dc.subjectWaveNeten
dc.subjecthluboké učeníen
dc.subjectneuronové sítěen
dc.subjectrekurentní neuronové sítěen
dc.subjectdopředné neuronové sítěen
dc.subjectnelineární zkresleníen
dc.subjectmodulační efektyen
dc.subjectmodelingcs
dc.subjectblack-boxcs
dc.subjectWaveNetcs
dc.subjectdeep learningcs
dc.subjectneural networkscs
dc.subjectrecurrent neural networkscs
dc.subjectfeedforward neural networkscs
dc.subjectnon-linear distortioncs
dc.subjectmodulation effectscs
dc.titleModelování zvukových signálů pomocí neuronových sítíen
dc.title.alternativeAudio signal modelling using neural networkscs
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2021-06-10cs
dcterms.modified2021-06-11-08:01:23cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid133462en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 18:11:29en
sync.item.modts2021.11.12 16:56:37en
thesis.disciplineZvuková produkce a nahrávánícs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
14.13 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
4.97 KB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_133462.html
Size:
5.55 KB
Format:
Hypertext Markup Language
Description:
review_133462.html
Collections