KAPLAN, J. Analýza přesnosti automatického určení parametrů klavírních nahrávek [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.

Posudky

Posudek vedoucího

Ištvánek, Matěj

Student vypracoval bakalářskou práci se zaměřením na automatickou extrakci parametrů z klavírních nahrávek. Text je poměrně čtivý, ale někdy mu chybí odraz hlubšího porozumění problematiky. Některé pasáže jsou málo technicky přesné nebo z nich nevyznívá kontext vůči cílům práce. Text obsahuje ojedinělé typografické nedostatky, strukturován je logicky. Hlavním cílem byla analýza přesnosti automatických systémů. Student měl zadání stížené zaměřením na klavírní nahrávky. Většina analýzy proběhla až poslední měsíc, proto většina datasetů pochází ze syntetizovaného MIDI zápisu, což není vždy vhodné. Navíc množství detekčních systémů je značně limitované a pochází pouze z nejznámějších nástrojů v jazyce Python. Pod důkladnou analýzou bych si představoval lepší rozbor důvodů, proč některé detektory ve specifických případech selhávají a jiné jsou robustní. Na podrobnější testování ale studentovi nezbyl čas, většinu práce strávil nad psaním teoretické části a implementací základních věcí. Práce postrádá důkladnější rozbory, více detektorů a přesnější teoretickou část. Na druhou stranu, student byl během celého semestru velmi aktivní, zajímal se o problematiku a v poslední fázi výrazně zlepšil textovou část. Ocenil bych větší samostatnost při vypracování práce, pravidelné konzultace pro ujasnění postupu byly nutností. Cíle práce byly splněny, celkově hodnotím 79 body / C.

Navrhovaná známka
C
Body
79

Posudek oponenta

Miklánek, Štěpán

Student Josef Kaplan ve své závěrečné práci porovnává konvenční systémy pro extrakci parametrů z hudebních nahrávek se systémy, které jsou postavené na neuronových sítí. Z výsledků je patrné, že pro detekci začátků tónů, detekci dob, detekci taktů i detekci výšky tónů jsou nejlepší systémy na bázi hlubokého učení, konkrétně systémy z Python knihovny madmom. Tento výsledek se dá částečně očekávat, a tak je těžké posoudit, co je největší přínos práce. Je škoda, že student kromě knihovny madmom porovnává jen další dvě knihovny. V teoretické části jsou uvedeny další možnosti extrakce některých analyzovaných hudebních parametrů, a i samotný Sonic Visualizer nabízí zásuvné moduly pro detekci dob nebo začátků tónů. Samotné výsledky jsou prezentovány pomocí tabulek, kde jsou uvedené různé objektivní metriky. Zde bych si představoval, že budou „nejlepší“ hodnoty tučně zvýrazněné. Práce má poměrně dobrou strukturu, avšak je z některých pasáží patrné, že student příliš neporozuměl problematice, a tak jsou některé pojmy popsané poměrně zmatečně. Zvláštní je hlavně kapitola 2.3 o signálech, která z ničeho nic začíná popisem FFT. Naopak kapitoly, které se věnují hudební teorii jsou napsané poměrně dobře. Možná by také nebylo na škodu výstupy některých systémů (např. detekci dob) vyjádřit i vizuálně na kratším hudebním úseku. V práci se také objevují jazykové obraty, které moc nedávají smysl a čtenář se musí pouze domnívat, co některými formulacemi autor myslel. S přihlédnutím na zmíněné nedostatky uděluji práci hodnocení 78 bodů/C.

Navrhovaná známka
C
Body
78

Otázky

eVSKP id 151125