Strojové učení v audio efektech
but.committee | prof. Dr. Ing. Jan Černocký (předseda) Ing. Ivana Burgetová, Ph.D. (člen) Ing. Michal Hradiš, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) doc. RNDr. Dana Hliněná, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných, např. ohledně generování efektů z trénovací sady, množství generovaných efektů, v technické zprávě prezentovaného vyhodnocení výsledků a praktických důvodů pro nezvolení generativních modelů. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře. | cs |
but.jazyk | angličtina (English) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Černocký, Jan | en |
dc.contributor.author | Sychra, Jakub | en |
dc.contributor.referee | Mošner, Ladislav | en |
dc.date.created | 2024 | cs |
dc.description.abstract | Získávání hudebních efektů z mixovaných skladeb je složité téma, které vyžaduje znalosti jak v oblasti zpracování signálů, tak zkušenosti s audio inženýrstvím. Tato práce cílí na tvorbu systém, který by byl schopen identifikovat sekvence a parametry kytarových efektů z mixovaných skladeb. Trénovací data byla vytvořena za využití čistých kytarových zvuků z datasetu IDMT-SMT-Audio-Effects. Tyto data byla následně augmentována populárními kytarovými efekty (BitCrush, Chorus, Clipping, Compressor, Delay, Distortion, High-pass filter, Ladder filter, Low-pass filter, Limiter, Phaser a Reverb), které byly implementovány pomocí knihovny Pedalboard tvořící mezivrstvu mezi jazykem Python a standartními VST efekty. Samotný rozpoznávací systém je založený na architektuře VGGish, k níž jsou přidány klasifikační (přítomnost efektu) a regresní (parametry efektů) hlavy. Výkon modelu je hodnocen na základě přesnosti klasifikace a regrese, a také v neformálních poslechových testech. | en |
dc.description.abstract | Reverse engineering audio effects from mixed tracks is a complex topic requiring signal processing and music engineering experience. This work aims at creation of a system capable of identifying the sequence and parameters of guitar effects from a mixed audio track. Training data was created using clean guitar sounds from IDMT-SMT-Audio-Effects, augmented by known effects (BitCrush, Chorus, Clipping, Compressor, Delay, Distortion, High-pass filter, Ladder filter, Low-pass filter, Limiter, Phaser and Reverb), all implemented with a Python wrapper around standard VST effects. The system is based on VGGish neural network architecture with several classification (presence of effects) and regression (parameters of effects) heads. The performance of the algorithm is evaluated on classification and regression accuracy, as well as in informal listening tests. | cs |
dc.description.mark | B | cs |
dc.identifier.citation | SYCHRA, J. Strojové učení v audio efektech [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 155963 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/246598 | |
dc.language.iso | en | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | zvuk | en |
dc.subject | signál | en |
dc.subject | zvukový efekt | en |
dc.subject | kytara | en |
dc.subject | hudba | en |
dc.subject | separace zdrojů | en |
dc.subject | strojové učení | en |
dc.subject | neuronové sítě | en |
dc.subject | sound | cs |
dc.subject | signal | cs |
dc.subject | audio effect | cs |
dc.subject | guitar | cs |
dc.subject | music | cs |
dc.subject | source separation | cs |
dc.subject | machine learning | cs |
dc.subject | neural network | cs |
dc.title | Strojové učení v audio efektech | en |
dc.title.alternative | Machine learning in audio effects | cs |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-10 | cs |
dcterms.modified | 2024-06-17-08:45:19 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 155963 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 21:01:02 | en |
sync.item.modts | 2025.01.15 11:46:57 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 5.18 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.pdf
- Size:
- 3.3 MB
- Format:
- Adobe Portable Document Format
- Description:
- file appendix-1.pdf
Loading...
- Name:
- review_155963.html
- Size:
- 14.58 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_155963.html