PEŠÁN, M. Modelování zvukových signálů pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Miklánek, Štěpán

Diplomová práce je psaná v angličtině a jazykově je na solidní úrovni, místy s gramatickými a typografickými chybami. Zadání bylo splněno a součástí výsledků je kromě objektivního hodnocení i poslechový test. Text práce jsem dostal k nahlédnutí poměrně těsně před odevzdáním a měl jsem k němu několik výhrad, které se týkaly hlavně formátování textu, nevhodně použitých znaků, nepřehledně vypracované sekce s výsledky a občasných teoretických nepřesností. Ve finální verzi práce byla potom většina nedostatků odstraněna, ale i po výrazné opravě se v práci místy objevují příliš krátké odstavce, překlepy a např. v tabulce s výsledky v příloze se objevuje dvojí formátování čísel. Je možná na škodu, že validační chyba nebyla vyjádřena unifikovanou objektivní metrikou, protože by se potom daly obě architektury neuronových sítí lépe porovnávat. Součástí teoretické části práce je i popis rekurentních neuronových sítí, pro modelování zvukového signálu ale použity nebyly. Výstup z kytarových efektů by měl být zapojen do nástrojového vstupu převodníku (s vysokou impedancí), v práci se píše, že byl výstup zaznamenán zapojením do linkového vstupu převodníku, což by znamenalo špatný postup. I přes vyjmenované nedostatky je tato diplomová práce na dobré úrovni a oceňuji hlavně vytvoření vlastní zvukové databáze pro trénování modelů. Celkově práci hodnotím 85 body / B.

Navrhovaná známka
B
Body
85

Posudek oponenta

Ištvánek, Matěj

Zadání práce bylo splněno. Pozitivně hodnotím vložení rozšířeného abstraktu do anglicky psané práce, nicméně tento abstrakt obsahuje mnoho chyb, nevhodně použitých výrazů a kostrbatých vět, což jeho úroveň snižuje. Zbytek textu vykazuje po formální stránce jen drobné chyby (chybějící čárky, nevhodné zalomení řádků ad.), překlepy a nedostatky (například obr. 3.3 je zbytečně malý a nečitelný, vzorec 4.1 špatně zapsaný apod.). Teoretická část uvádí do problematiky a cituje vhodné zdroje. Výhrady mám primárně ke 4. kapitole – v práci jsem nenašel odůvodnění, proč byly vybrány právě dvě zvolené architektury sítí, ani jejich finální nastavení. Předchozí kapitoly popisují různé parametry a volbu dílčích částí (například jak předcházet přetrénování), ale většina z nich není popsána při implementaci, tedy jaké parametry byly nakonec zvoleny. Stejně tak zde chybí srovnání výpočetní náročnosti (třeba doba učení pro jednu iteraci) obou sítí. Kapitola 5 by měla obsahovat srovnání se state-of-the-art systémy nebo alespoň tabulku s výčtem nejúspěšnějších systémů pro daný úkol. Oceňuji vlastní databázi a kvalitativní poslechový test (přestože 8 účastníků testu je pro validní výsledky málo). I přes výše popsané nedostatky je práce na dobré úrovni, celkově ji hodnotím 80 body / B.

Navrhovaná známka
B
Body
80

Otázky

eVSKP id 133462