Syntéza ruchů pomocí neuronových sítí
but.committee | doc. Ing. Jiří Schimmel, Ph.D. (předseda) doc. Ing. Petr Sysel, Ph.D. (místopředseda) MgA. Michal Indrák, Ph.D. (člen) Ing. MgA. Jana Jelínková (člen) Ing. Jaromír Mačák, Ph.D. (člen) | cs |
but.defence | Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci s výhradami a odpověděl na otázky členů komise a oponenta. Otázky oponenta: 1) Jak jste implementoval poslechový test MUSHRA? Odkud jste čerpal inspiraci/kód? 2) Co Vás vedlo k fixní hodnotě 10 a 20 tisíc epoch pro trénování modelů? V práci tvrdíte, že větší množství epoch by mělo zlepšit výsledky, ale rozdíly mezi modely uvedené v obrázcích 6.7 a 6.8 to nenaznačují. Jste si jistý, že větší množství epoch pomůže? Jakými způsoby byste v budoucnu byl schopen zajistit teoreticky lepší výsledky? 3) Zkuste natrénovat stejné modely ještě s větším množstvím epoch a sám porovnat subjektivní kvalitu výstupních zvuků. Dle Vašich informací o trénování uvedených sítí by to nemělo zabrat více než dva dny. Otázky komise: 1) Je možné do procesu učení integrovat modul s omezeným definičním oborem? | cs |
but.jazyk | čeština (Czech) | |
but.program | Audio inženýrství | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Miklánek, Štěpán | cs |
dc.contributor.author | Pospíšil, Tomáš | cs |
dc.contributor.referee | Ištvánek, Matěj | cs |
dc.date.accessioned | 2025-06-13T03:59:27Z | |
dc.date.available | 2025-06-13T03:59:27Z | |
dc.date.created | 2025 | cs |
dc.description.abstract | Tato práce zkoumá využití moderních technologií pro tvorbu zvukových ruchových efektů, konkrétně jejich syntézu pomocí neuronových sítí a metod diferencovatelného digitálního zpracování signálu (DDSP). Tato technologie umožňuje kombinaci tradičních zvukových procesů s pokročilým strojovým učením, díky čemuž mohou být implementovány modely schopné generovat nové realistické zvuky. Pro tyto účely byly využity architektury NoiseBandNet a DDSP. Součástí práce bylo vytvoření trénovacích datasetů, částečně za pomocí simulátoru BeamNG.drive, pomocí kterých byly natrénovány a otestovány modely a jejich výstupy byly porovnány na základě objektivních metrik i subjektivních poslechových testů. Samotná práce ukazuje potencíál technologie DDSP pro pokročilé aplikace v oblasti zvukové syntézy. | cs |
dc.description.abstract | This thesis explores the use of modern technologies for creating sound noise-like effects, specifically their synthesis using neural networks and methods of Differentiable Digital Signal Processing (DDSP). This technology enables the combination of traditional audio processing techniques with advanced machine learning, allowing the implementation of models capable of generating new realistic sounds. For this purpose, the architectures NoiseBandNet and DDSP were utilized. The work includes the creation of training datasets, partly generated using the BeamNG.drive simulator, which were used to train and test the models. Their outputs were evaluated based on objective metrics as well as subjective listening tests. The thesis demonstrates the potential of DDSP technology for advanced applications in the field of sound synthesis | en |
dc.description.mark | C | cs |
dc.identifier.citation | POSPÍŠIL, T. Syntéza ruchů pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025. | cs |
dc.identifier.other | 167243 | cs |
dc.identifier.uri | https://hdl.handle.net/11012/252315 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | neuronové sítě | cs |
dc.subject | DDSP | cs |
dc.subject | NoiseBandNet | cs |
dc.subject | zvuková syntéza | cs |
dc.subject | ruchové zvuky | cs |
dc.subject | digitální zpraco-vání signálu | cs |
dc.subject | hluboké učení | cs |
dc.subject | umělá inteligence | cs |
dc.subject | zvuky motoru | cs |
dc.subject | BeamNG.drive | cs |
dc.subject | neural networks | en |
dc.subject | DDSP | en |
dc.subject | NoiseBandNet | en |
dc.subject | sound synthesis | en |
dc.subject | noise-like sounds | en |
dc.subject | digital signal processing | en |
dc.subject | deep learning | en |
dc.subject | artificial inteligence | en |
dc.subject | engine sounds | en |
dc.subject | BeamNG.drive | en |
dc.title | Syntéza ruchů pomocí neuronových sítí | cs |
dc.title.alternative | Synthesis of Noise-Like Sounds Using Neural Networks | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.dateAccepted | 2025-06-12 | cs |
dcterms.modified | 2025-06-12-15:46:34 | cs |
eprints.affiliatedInstitution.faculty | Fakulta elektrotechniky a komunikačních technologií | cs |
sync.item.dbid | 167243 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.06.13 05:59:27 | en |
sync.item.modts | 2025.06.13 05:35:13 | en |
thesis.discipline | Zvuková produkce a nahrávání | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikací | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |
Files
Original bundle
1 - 3 of 3
Loading...
- Name:
- final-thesis.pdf
- Size:
- 12.09 MB
- Format:
- Adobe Portable Document Format
- Description:
- file final-thesis.pdf
Loading...
- Name:
- appendix-1.zip
- Size:
- 95.86 KB
- Format:
- Unknown data format
- Description:
- file appendix-1.zip
Loading...
- Name:
- review_167243.html
- Size:
- 8.35 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_167243.html