Generování kytarových tabů ze signálu
Loading...
Date
Authors
Adamčík, Tobiáš
Advisor
Referee
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato práce se zaměřuje na problém automatické transkripce kytarové tabulatury z čistých audio záznamů, se specifickým důrazem na podladěné a vícestrunné elektrické kytary. Je navržena víceúlohová konvoluční neuronová síť nazvaná HeavyCNN, která současně predikuje výšku tónu, nástup tónu a aktivitu strun, přičemž explicitně zohledňuje ladění jako součást vstupu modelu. K jejímu trénování a testování byl vytvořen nový syntetický dataset o délce přes 61 hodin anotovaných kytarových nahrávek v různých nízkých laděních, generovaných pomocí VST nástrojů z Guitar Pro tabulatur. Systém zahrnuje robustní post-processing, který převádí predikce modelu na hratelnou tabulaturu optimalizováním přiřazení strun podle hratelnosti a fyzických omezení. Experimentální výsledky ukazují slibnou přesnost detekce not a přiřazení strun, což prokazuje potenciál modelu pro automatickou transkripci kytary v tvrdších hudebních žánrech.
This work addresses the problem of automatic guitar tablature transcription from raw audio recordings, with a specific focus on down-tuned and extended-range electric guitars. A multi-task convolutional neural network, named HeavyCNN, is proposed. It jointly predicts pitch, onset, and string activity, while explicitly incorporating the tuning as part of the model's input. To support its training and testing, a new synthetic dataset of over 61 hours of annotated guitar recordings in various dropped tunings was created, using VST-based audio rendering from Guitar Pro tablatures. The system includes a robust post-processing pipeline that converts model predictions into playable tablature by optimizing string assignments according to playability and physical constraints. Experimental results show promising accuracy in note detection and string assignment, demonstrating the model’s potential for advancing guitar transcription in heavier music genres.
This work addresses the problem of automatic guitar tablature transcription from raw audio recordings, with a specific focus on down-tuned and extended-range electric guitars. A multi-task convolutional neural network, named HeavyCNN, is proposed. It jointly predicts pitch, onset, and string activity, while explicitly incorporating the tuning as part of the model's input. To support its training and testing, a new synthetic dataset of over 61 hours of annotated guitar recordings in various dropped tunings was created, using VST-based audio rendering from Guitar Pro tablatures. The system includes a robust post-processing pipeline that converts model predictions into playable tablature by optimizing string assignments according to playability and physical constraints. Experimental results show promising accuracy in note detection and string assignment, demonstrating the model’s potential for advancing guitar transcription in heavier music genres.
Description
Keywords
Citation
ADAMČÍK, T. Generování kytarových tabů ze signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
prof. Ing. Adam Herout, Ph.D. (předseda)
Ing. Vladimír Bartík, Ph.D. (člen)
Ing. Michal Hradiš, Ph.D. (člen)
Ing. Josef Strnadel, Ph.D. (člen)
doc. Mgr. Adam Rogalewicz, Ph.D. (člen)
Date of acceptance
2025-06-16
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.
Result of defence
práce byla úspěšně obhájena
