Generování zvukových trénovacích dat pro neuronové sítě
Loading...
Date
Authors
Nizamutdinov, Artur
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
ORCID
Abstract
Tato bakalářská práce se zabývá generováním zvukových trénovacích dat pro neuronové sítě pomocí automatizovaného nastavování parametrů zvukových efektů. Cílem práce je implementovat nástroje v jazyce Python, které umožňují ovládání zvukových efektů prostřednictvím knihovny Pedalboard. Vytvořený systém umožňuje načíst libovolný zvukový efekt ve formátu VST nebo AU, generovat hodnoty jeho parametrů, zpracovat vstupní soubor a uložit výstupní zvukové soubory včetně informací o použitých nastaveních. Takto vzniklá datová sada slouží jako vstup pro trénování neuronových sítí. Součástí implementace jsou také nástroje pro měření vlastností zvukových efektů. Aplikace je doplněna základním grafickým uživatelským rozhraním.
This bachelor thesis focuses on the generation of audio training data for neural networks through automated parameter control of audio effects. The goal of the project is to implement tools in the Python programming language that enable the control of audio effects using the Pedalboard library. The developed system allows to load any audio effect in VST or AU format, generate parameter values, process an input audio file, and save output audio files along with information about the applied settings. The resulting dataset serves as input for training neural networks. The implementation also includes tools for measuring the properties of audio effects. The application is supplemented with a basic graphical user interface.
This bachelor thesis focuses on the generation of audio training data for neural networks through automated parameter control of audio effects. The goal of the project is to implement tools in the Python programming language that enable the control of audio effects using the Pedalboard library. The developed system allows to load any audio effect in VST or AU format, generate parameter values, process an input audio file, and save output audio files along with information about the applied settings. The resulting dataset serves as input for training neural networks. The implementation also includes tools for measuring the properties of audio effects. The application is supplemented with a basic graphical user interface.
Description
Keywords
Audio efekty , generování dat , neuronové sítě , Pedalboard , Python , trénovací data , VST , zásuvné moduly , zpracování zvuku. , Audio effects , audio processing , data generation , neural networks , Pedalboard , plugins , Python , training data , VST.
Citation
NIZAMUTDINOV, A. Generování zvukových trénovacích dat pro neuronové sítě [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková technika
Comittee
doc. Ing. Jiří Mekyska, Ph.D. (předseda)
doc. Ing. David Kubánek, Ph.D. (místopředseda)
Ing. Miroslav Balík, Ph.D. (člen)
Ing. Jiří Přinosil, Ph.D. (člen)
Ing. Zoltán Galáž, Ph.D. (člen)
Date of acceptance
2025-06-19
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky.
Otázky oponenta:
Dá se v rozhraní zvolit konečný počet (např. 100) náhodných nastavení pro kombinaci např. 3 zvolených parametrů efektu?
Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
