Počítačem komponovaná hudba
Loading...
Date
Authors
Pankuch, Adam
ORCID
Advisor
Referee
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
Abstract
Cieľom tejto práce je tvorba systému schopného generovať gitarové stopy. Tento problém pozostáva z dvoch hlavných častí: získanie trénovacieho datasetu a trénovanie vhodného deep learning modelu. Prvá časť tohto problému bola vyriešená sériou skriptov, ktoré vyfiltrovali a transformovali sadu skladieb s viacerými hudobnými nástrojmi z Guitar Pro formátu na sadu gitarových stôp vo formáte pianoroll. Druhá časť problému bola vyriešená natrénovaním niekoľkých konvolučných a rekurentných neurónových sietí na vytvorenom datasete gitarových stôp. Gitarové stopy generované týmito sieťami boli navzájom porovnané a ohodnotené. Hoci vygenerované stopy nie sú veľmi harmonické a príjemné na vypočutie, ukázujú, že konvolučné siete sú vhodnejšie na generovanie polyfónnej hudby v porovnaní s inými typmi neurónových sietí.
The goal of this thesis is to create a system, which is able to generate guitar tracks. This problem consists of two main parts: acquisition of a training dataset and training of a suitable deep learning model. The first part of the problem was solved by series of scripts which filter and transform a set of songs with many instruments in Guitar Pro format to a set of guitar tracks in pianoroll format. The second part of the problem was solved by training a few convolutional and recurrent neural networks on the created dataset of guitar tracks. Guitar tracks generated by these networks were compared to each other and evaluated. Although, the generated tracks are not very harmonic and pleasing to the ear, they show that convolutional networks are more suitable for generation of polyphonic music than other types of neural networks.
The goal of this thesis is to create a system, which is able to generate guitar tracks. This problem consists of two main parts: acquisition of a training dataset and training of a suitable deep learning model. The first part of the problem was solved by series of scripts which filter and transform a set of songs with many instruments in Guitar Pro format to a set of guitar tracks in pianoroll format. The second part of the problem was solved by training a few convolutional and recurrent neural networks on the created dataset of guitar tracks. Guitar tracks generated by these networks were compared to each other and evaluated. Although, the generated tracks are not very harmonic and pleasing to the ear, they show that convolutional networks are more suitable for generation of polyphonic music than other types of neural networks.
Description
Citation
PANKUCH, A. Počítačem komponovaná hudba [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2020.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Dr. Ing. Jan Černocký (předseda)
doc. Ing. Jiří Jaroš, Ph.D. (místopředseda)
doc. RNDr. Milan Češka, Ph.D. (člen)
Ing. Filip Orság, Ph.D. (člen)
RNDr. Marek Rychlý, Ph.D. (člen)
Date of acceptance
2020-07-10
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. Otázky u obhajoby: Selecting a length of 6 seconds for training samples does not reflect the structure of the measures and motif. Isn't this a problem of results achieved? The convolution core of the first CNN layer of size (5,1) (large third in music theory) cannot capture harmony properly. Isn't this a problem of results achieved? What is the main reason for CNN Stride's best result? Co znamená ve vaši práci přesnost? Co vlastně říká? Překrývají se trénovací vzorky? Snažíte se na základě datasetu opravdu vytvořit novou hudbu? Měl jste hudbu rozčleněnou na žánry? Čím se síť inicializuje? Dal se výstup poslouchat?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení