Reverzní inženýring mixáže pomocí neuronové sítě
Loading...
Date
Authors
Čermák, Jerguš
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Bakalárska práca sa zaoberá využitím algoritmov neurónovej siete za účelom zistenia parametrov signálových procesorov použitých pri mixáži zvukových stôp. V rámci práce sú prezentované lineárne signálové procesory \emph{Gain}, \emph{Pan}, \emph{Filter} a \emph{Reverb} umožňujúce úpravu zvukového signálu a vytvorenie stereofónneho mixu zvukovej nahrávky. Následne sú vďaka implementácií pomocou knižnice DDSP použité v zmysle vrstiev modelu neurónovej siete, ktorý je zameraný na predikciu parametrov použitých pri mixáži, za predpokladu znalosti vstupných stôp a cieľového mixu. V rámci práce boli vytvorené stereofónne mixy, ktorých parametre boli následne odhadované pomocou dvoch modelov neurónovej siete. Výsledky boli posudzované ako objektívnymi, tak subjektívnymi metódami (posluchovým testom).
This bachelor's thesis focuses on the use of neural network algorithms to determine the parameters of signal processors used in the mixing of audio tracks. The thesis presents linear signal processors such as \emph{Gain}, \emph{Pan}, \emph{Filter}, and \emph{Reverb}, which are commonly used to process audio signal and to produce a stereo mix of the audio recording. These processors are subsequently used within the neural network model as layers, implemented using the DDSP library, aimed at predicting the parameters used in the mix, given the knowledge of the input tracks and the target mix. Resultantly, stereo mixdowns were created, and their parameters were estimated using two neural network models. The results were evaluated using both objective measurements and subjective methods (listening test).
This bachelor's thesis focuses on the use of neural network algorithms to determine the parameters of signal processors used in the mixing of audio tracks. The thesis presents linear signal processors such as \emph{Gain}, \emph{Pan}, \emph{Filter}, and \emph{Reverb}, which are commonly used to process audio signal and to produce a stereo mix of the audio recording. These processors are subsequently used within the neural network model as layers, implemented using the DDSP library, aimed at predicting the parameters used in the mix, given the knowledge of the input tracks and the target mix. Resultantly, stereo mixdowns were created, and their parameters were estimated using two neural network models. The results were evaluated using both objective measurements and subjective methods (listening test).
Description
Citation
ČERMÁK, J. Reverzní inženýring mixáže pomocí neuronové sítě [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
prof. Mgr. Pavel Rajmic, Ph.D. (předseda)
RNDr. Lubor Přikryl (místopředseda)
Ing. Kryštof Novotný (člen)
MgA. Michal Indrák, Ph.D. (člen)
Ing. Ondřej Krajsa, Ph.D. (člen)
Date of acceptance
2024-06-12
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.
Otázky:
Můžete ilustrovat úspěšnost naučení ekvalizérů (grafickým) porovnáním naučených a cílových kmitočtových odezev?
Nakolik by byl možný reverzní inženýring mixu v případě, kdy by nebyly známé původní stopy?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení