ADAMČÍK, T. Generování kytarových tabů ze signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Posudky

Posudek vedoucího

Černocký, Jan

Hodnotím zodpovědný a kontinuální přístup k práci, slušné výsledky, psaní v angličtině a článek na Excel, děkuji za radostnou bakalářskou práci. V případě kvalitní presentace u státnicové komise doporučuji návrh práce na Cenu děkana.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadání bylo definováno studentem s hlubokým zájmem o hudbu, přepis hry na kytaru do notace a strojové učení (ML), zahrnovalo studium zpracování signálů, hudební teorie a netriviálních technik ML.
Práce s literaturou Student samostatně pracoval se zdroji, základem byly nové články a toolkity řešící přepis hudebního signálu do notace, tedy témata, která nejsou v bakalářském studiu pokryta standardními kursy, student na jejich základě dokázal přijít se značným objemem práce od simulace dat až po komplexní architekturu pro přepis různě naladěných kytar do tabulatur.
Aktivita během řešení, konzultace, komunikace Oceňuji příkladnou aktivitu, pravidelnou komunikaci a zodpovědnost, se kterou student k práci přistupoval, sledovat postup práce a pozitivní přístup k řešení netriviálních problémů i technických katastrof (včetně vyhořelého motherboardu počítače) bylo skutečné potěšení. Velmi kladně hodnotím pečlivý přístup k práci s daty (jak simulovanými, tak reálnými), která byla pro práci klíčová.
Aktivita při dokončování Práce byla dokončena včas, první verze nebyly zcela zdařilé, ale měl jsem možnost komentovat a student vzal v úvahu mé připomínky. S konečnou verzí, kde se mi studenta podařilo přesvědčit o nutnosti formálnějšího popisu, jsem spokojen.
Publikační činnost, ocenění Student je autorem článku na Excel s velmi pěknou prezentací. Doporučuji pokračování v práci a otevření hudební ML komunitě (open source nebo komerčně). Po dopracování práce podporuji i její publikaci na slušné signálové či hudebně-ML akci (ICASSP, ISMIR, atd).
Navrhovaná známka
A
Body
95

Posudek oponenta

Beran, Vítězslav

Based on his studies, Mr. Adamcik designed his own CNN architecture, combining two existing ones for pitch and used string classification of an atypically tuned guitar. He then supplemented this with a procedure for transcription into tablature, where he additionally observes the ergonomics of the human hand for the proposed transcription. He complemented the solution with a method for creating a synthetic dataset, which he also created. He demonstrated the ability to successfully deal with various obstacles arising from focusing on a non-typical variant of the problem. Apart from the weaker text part, the work is professionally demanding, and the result is functional and extensive. 

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání The automatic conversion of an audio signal into structured notation (tablature) using machine learning methods is a difficult task requiring knowledge beyond the scope of an undergraduate program.
Rozsah splnění požadavků zadání Compared to conventional automatic guitar transcription methods, the solution focuses on multi-string guitars and low tunings. The emphasis on ergonomics when transcribing to tablature using a search tree can be seen as a significant enhancement.
Rozsah technické zprávy
Prezentační úroveň technické zprávy 60 The text has a logical structure, but the scope of the chapters is somewhat unbalanced. Second-level subchapters would suffice for a text of this scope, as third-level ones are too brief or uneven. The equation defining STFT and the description of the parameters contain inaccuracies. The description of the CQT lacks a better description of the window W . The text could be supplemented with a sample spectrogram. Ch. 5.4 is not well conceived. Figures 5.5 and 5.6 are intended to show the behaviour of the author's proposed method for smoothing the prediction, but the differences are hardly visible. In general, the whole ch. 5, and especially ch. 5.8 on post-processing is difficult to understand from the text, especially the logic of tree creation and the control of ergonomics and other rules. A subsection on future work should be elsewhere than in the conclusion, which should already only briefly summarise the whole work.
Formální úprava technické zprávy 70 The typographical and linguistic quality of the work is quite good. However, the text contains some errors. A long hyphen often appears in the text instead of the normal hyphen. Figures are supplementary to the textual description and should be referred to in the text, especially when their location may be modified by the typesetting tool beyond the intended area. It would also be useful to number all equations, as the logic of selecting numbered equations is not apparent. Also, the author sometimes uses a different format for model or parameter names and other times does not, which would be helpful to have fixed in the text. Some figures are, instead of vector format, in low-resolution raster format.
Práce s literaturou 70 The study section draws on an extensive list of relevant scholarly articles that refer primarily to ML and CNN issues. Some theoretical sections do not refer to the study literature (e.g., FFT and STFT). Reference [7] is used only to reproduce the figure. The structure of the text combines the adopted knowledge and own suggestions, especially the chapter 5. It would be useful to separate this better.
Realizační výstup 90 The resulting realisation has several parts, is functional and larger in scale. It contains two datasets created by the author, recorded and synthetic, including the methodological procedure of their preparation and the necessary SW tools. Furthermore, it has its own HeavyCNN architecture, combining two existing ones, where each solves a different task (TabCNN and Basic Pitch). The last part of the solution then produces an entry in a specific guitar notation (tablature) from the output of the classification network (note onset, pitch and sounding strings). The methodological approach to these parts, including description and explanation, varies considerably in terms of quality of design and implementation (e.g. ch. 5.8.6). Although the source files have a reasonable logical structure, adding better comments, authorship, etc., and a more indicative description of the directory structure in the readme would be helpful. Considering the scope and non-triviality of the implemented procedures, the overall quality of the implementation output can be rated well above average.
Využitelnost výsledků The author uses existing CNN architectures, which he combines and trains into a new custom functional architecture. At the same time, he offers a procedure for creating a specific synthetic dataset. Both of these results are of interest for further applications.
Navrhovaná známka
B
Body
87

Otázky

eVSKP id 162013