Detektor tempa hudebních nahrávek na bázi neuronové sítě

but.committeedoc. Ing. Kamil Říha, Ph.D. (předseda) doc. Ing. MgA. Mgr. Dan Dlouhý, Ph.D. (místopředseda) MgA. et Mgr. Ondřej Jirásek, Ph.D. (člen) Ing. Petr Honzík, Ph.D. (člen) doc. Ing. Petr Sysel, Ph.D. (člen) Mgr. Tomáš Staudek, Ph.D. (člen)cs
but.defenceStudent prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: Proč jste právě pro hodnocení detekčních systémů zvolil metody recall, precision, F-score, CML a AML? V kmitočtové oblasti je v diplomové práci používán mel-spektrogram, který je jednou z metod, jak zařadit vlastnosti lidského slyšení do analýzy signálu. Při zpracování řeči další alternativou je například použití percepční lineární predikce. Proč byl pro analýzu hudebního signálu zvolen právě mel-spektrogram a ne jiné zobrazení v kmitočtové oblasti? Jaký je rozdíl mezi významem pojmu bias, který je použit v oblasti neuronových sítí a například v teorii pravděpodobnosti? Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.cs
but.jazykčeština (Czech)
but.programAudio inženýrstvícs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorIštvánek, Matějcs
dc.contributor.authorSuchánek, Tomášcs
dc.contributor.refereeSmékal, Zdeněkcs
dc.date.created2021cs
dc.description.abstractDiplomová práce se zabývá systémy k detekci tempa a dob v hudebních nahrávkách, jejichž funkčnost je založena na neuronových sítích. Je zde popsána struktura těchto systémů a způsob zpracování signálu v jejich jednotlivých blocích. Pozornost je potom věnována především rekurentním a temporálním konvolučním sítím, které ze své podstaty detekci tempa a dob dokáží efektivně řešit. Vybrané metody, architektury sítí a jejich modifikace jsou pak implementovány v rámci uceleného detekčního systému, který je dále testován a vyhodnocen procesem křížové validace na žánrově rozmanitém datasetu. Z výsledků vyplývá, že systém s vlastní architekturou temporální konvoluční sítě dosahuje srovnatelných výsledků se zahraničními publikacemi – v rámci datasetu SMC se například projevil jako nejúspěšnější, naopak v případě jiných se nacházel mírně pod přesností state-of-the-art systémů, přičemž navržená síť si i přes zvýšenou vnitřní komplexnost zachovává nízkou výpočetní náročnost.cs
dc.description.abstractThis Master’s thesis deals with beat tracking systems, whose functionality is based on neural networks. It describes the structure of these systems and how the signal is processed in their individual blocks. Emphasis is then placed on recurrent and temporal convolutional networks, which by they nature can effectively detect tempo and beats in audio recordings. The selected methods, network architectures and their modifications are then implemented within a comprehensive detection system, which is further tested and evaluated through a cross-validation process on a genre-diverse data-set. The results show that the system, with proposed temporal convolutional network architecture, produces comparable results with foreign publications. For example, within the SMC dataset, it proved to be the most successful, on the contrary, in the case of other datasets it was slightly below the accuracy of state-of-the-art systems. In addition,the proposed network retains low computational complexity despite increased number of internal parameters.en
dc.description.markAcs
dc.identifier.citationSUCHÁNEK, T. Detektor tempa hudebních nahrávek na bázi neuronové sítě [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.cs
dc.identifier.other133472cs
dc.identifier.urihttp://hdl.handle.net/11012/197107
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDetekce tempa a dobcs
dc.subjectkonvoluční neuronové sítěcs
dc.subjectmel spektrogramcs
dc.subjectneuronové sítěcs
dc.subjectprav-děpodobnostní modelcs
dc.subjectrekurentní neuronové sítěcs
dc.subjectstrojové učenícs
dc.subjecttemporální konvolučníneuronové sítěcs
dc.subjectBeat trackingen
dc.subjectconvolutional neural networksen
dc.subjectmachine learningen
dc.subjectmel spectrogramen
dc.subjectneuralnetworksen
dc.subjectprobabilistic modelen
dc.subjectrecurrent neural networksen
dc.subjecttemporal convolutional neuralnetworksen
dc.titleDetektor tempa hudebních nahrávek na bázi neuronové sítěcs
dc.title.alternativeTempo detector based on a neural networken
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.dateAccepted2021-06-10cs
dcterms.modified2024-05-17-12:52:09cs
eprints.affiliatedInstitution.facultyFakulta elektrotechniky a komunikačních technologiícs
sync.item.dbid133472en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 14:28:43en
sync.item.modts2025.01.17 13:35:17en
thesis.disciplineZvuková produkce a nahrávánícs
thesis.grantorVysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. Ústav telekomunikacícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 3 of 3
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
7.22 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
appendix-1.zip
Size:
7.66 MB
Format:
zip
Description:
appendix-1.zip
Loading...
Thumbnail Image
Name:
review_133472.html
Size:
5.85 KB
Format:
Hypertext Markup Language
Description:
file review_133472.html
Collections