Rozpoznávání žánru populárních skladeb
Loading...
Date
Authors
Čižmár, Filip
Advisor
Referee
Mark
C
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Cieľom práce je zoznámiť sa s princípmi práce so zvukom v programovacom jazyku Python a s problematikou konvolučných neurónových sietí s cieľom tvorby webovej aplikácie schopnej rozpoznávať žáner nahranej skladby. V práci sú opísané princípy strojového učenia so zameraním na konvolučné neurónové siete. Zásadná časť práce je venovaná prieskumu dostupných datasetov pre účely získavania informácií z hudby. Ďalej je opísaný priebeh prípravy vybraného datasetu a transformácie zvukovej informácie do podoby spektrogramov pre učenie konvolučnej neurónovej siete. V rámci práce boli vytvorené dva modely schopné rozpoznávať žáner hudby. Prvý z nich je všeobecný a druhý so zameraním na podžánre elektronickej hudby. Výsledkom je webová aplikácia, ktorá po nahraní skladby zobrazí pravdepodobnosti zaradenia do jednotlivých žánrov.
The aim of this thesis is to get acquainted with the principles of working with sound in the Python programming language and with the issue of convolutional neural networks in order to create a web application capable of recognizing the genre of an uploaded song. The thesis describes the principles of machine learning with a focus on convolutional neural networks. A considerable part of this thesis is devoted to the research of available datasets created for the purpose of music information retrieval. Next, the process of preparation of the selected dataset and transformation of audio information into spectrograms for the learning of convolutional neural networks is described. Two models capable of recognizing the genre of music were created as a part of the thesis. First, for general, more popular genres and the second focuses on subgenres of electronic music. The result is a web application that, after a song is uploaded, displays the probabilities of classification into individual genres.
The aim of this thesis is to get acquainted with the principles of working with sound in the Python programming language and with the issue of convolutional neural networks in order to create a web application capable of recognizing the genre of an uploaded song. The thesis describes the principles of machine learning with a focus on convolutional neural networks. A considerable part of this thesis is devoted to the research of available datasets created for the purpose of music information retrieval. Next, the process of preparation of the selected dataset and transformation of audio information into spectrograms for the learning of convolutional neural networks is described. Two models capable of recognizing the genre of music were created as a part of the thesis. First, for general, more popular genres and the second focuses on subgenres of electronic music. The result is a web application that, after a song is uploaded, displays the probabilities of classification into individual genres.
Description
Keywords
Zvuk , hudba , žánre hudby , populárne skladby , elektronická hudba , Fourierove transformácie , spektrogramy , strojové učenie , neurónové siete , konvolučné neurónové siete. , Sound , music , music genres , popular songs , electronic music , Fourier transforms , spectrograms , machine learning , neural networks , convolutional neural networks.
Citation
ČIŽMÁR, F. Rozpoznávání žánru populárních skladeb [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2022.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Informační technologie
Comittee
doc. Ing. František Zbořil, Ph.D. (předseda)
doc. Mgr. Adam Rogalewicz, Ph.D. (místopředseda)
Ing. David Bařina, Ph.D. (člen)
Ing. Jiří Hynek, Ph.D. (člen)
Ing. Lukáš Kekely, Ph.D. (člen)
Date of acceptance
2022-06-15
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C. Otázky u obhajoby: Bylo by možné pro řešení problému použít i jiné mechanismy učení? Naznačte způsob organizace učení, aby systém umožnil interaktivní korekce výsledků klasifikace, zmíněné v bodu 7. Jak vypadala trénovací a testovací data pro neuronovou síť.
Result of defence
práce byla úspěšně obhájena
