GUĽAS, M. Metody rozkladu hudebních signálů na harmonickou a transientní složku [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.
Práce se zabývá separací harmonické a transientní složky audio signálu moderní a perspektivní metodou využívající fázově korigované časově-frekvenční reprezentace signálu. Algoritmus je na základě literatury implementován a oproti stávající podobě je navržena a realizována alternativní strategie výpočtu fázové korekce. Ačkoliv úpravy explicitně zmiňované v zadání implementovány nebyly, považuji zadání za dostatečně splněné, byť v omezené míře (zmiňovaná úprava výpočtu fázové korekce je pouze malou úpravou základního algoritmu). Mohu ocenit, že student pracoval průběžně a pravidelně konzultoval, na druhou stranu samostatnost v práci byla poměrně omezená. Ačkoliv implementační stránka práce je na dobré úrovni, textová část práce značně zaostává. Text nemá dobrou strukturu (celá práce je ve dvou kapitolách) a postrádá propojení jednotlivých částí. Úvod je zbytečně široký a neslouží lepšímu pochopení dále popsaných algoritmů. Vyskytuje se nezavedené a typograficky nevhodné značení (např. medián v rovnici (1.21)), nejasné definice (např. mediánový filtr v (1.22) a (1.23), indexování matic v (1.26) a (1.27), operace s dvojicí vektorů v (1.45)). Obrázky jsou rastrové, popisky někdy nepřesné až chybné (např. na obr. 1.8 určitě není spektrogram). Rovnice (1.31) je ze zdroje špatně převzatá. Druhá kapitola obsahuje množství výpisů kódu, z nichž některé jsou vyloženě nadbytečné, jako např. import knihoven ve výpisu 2.1 nebo nastavení počátečních hodnot algoritmu ve výpisu 2.5 Prezentace výsledků není vhodně zvolená, neboť zejména rozdíly v hodnotách MSE jsou z tabulek těžko čitelné (viz např. tab. 2.2 na str. 35). S přihlédnutím ke všem aspektům práce ji celkově hodnotím 57 body.
Z mého pohledu má práce Mateje Guľase zásadní slabiny ve všech kategoriích, které níže vypisuji: Zadání: Zadání není úplně splněno. Kromě replikování algoritmu dle literatury měl student provést vlastní inovace. Struktura: Práce má pouze dvě hlavní kapitoly, teoretickou a praktickou, což vzhledem k množství témat považuji za poddimenzované. Obsah: Mnoho zbytečných témat, které se v práci nevyužívají a jenom nafukují teoretickou část. Části nejsou propojeny odkazy nebo komentářem, který by naznačoval, jak věci souvisejí; text působí jako proud různorodých informací indikující, že autor problematice příliš neporozuměl. Jazyk: Překlady anglických termínů jsou nesprávné (okamžitá fázovo korigovaná STFT), pojmy nepřesné (amplitudový signál, vyhladenie výkonu spektrogramu). Práce obsahuje překlepy (interčné, interačným). Typografie a grafická úprava: Typografická stránka práce je slabá, jak v běžném textu, tak v matematických vztazích a symbolech. Pouze obrázky 2.1 a 2.2 jsou vlastní, ostatní zkopírované z jiných zdrojů; všechny obrázky jsou bitmapové. Obrázky, které by demonstrovaly autorův postup či pomáhaly čtenáři k pochopení, chybí (např. spektrogramy harmonické/transientní komponenty). Práce s literaturou: Autor uvádí 9 zdrojů, znichž ani jeden není ten, podle kterého by bylo možné metodu HPSS ze zadání replikovat. Seznam zdrojů postrádá některé povinné informace. Značení: Některá značení nejsou vůbec definována (l21 norma, závorka s indexem plus, STFT s hvězdičkou). Daší poznámky: * Autor nepopisuje jakým způsobem vybral „ground truth“ signály. Signál elektrické kytary může obsahovat i perkusivní složku. * Testování a vyhodnocení zřejmě proběhlo na jediném signálu. * Výpisy kódu v textu ukazují podlemého názoru ty méně podstatné části implementace metod(y). Domnívám se, že je práce po opravení uvedených nedostatků a náležitém doplnění obhajitelná.
eVSKP id 159271