KMENT, F. Rekonstrukce poškozených audio signálů pomocí deep unrolling [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Posudky

Posudek vedoucího

Mokrý, Ondřej

Obsahem práce je implementace iteračního algoritmu do podoby neuronové sítě a její naučení a otestování pro úlohu rekonstrukce chybějících vzorků audio signálu. Student práci vypracoval samostatně a pracoval průběžně. Zvolená parametrizace sítě je sice velmi jednoduchá, ale zadání splňuje. Práce je převážně na dobré jazykové úrovni, ve větší míře se ale vyskytují nedostatky typografické (např. sazba jednotek, desetinné tečky) a rastrové obrázky. Objevují se též neobvyklé termíny, zřejmě způsobené překladem z anglických zdrojů (např. „krok velikosti gradientu“). V úvodu třetí kapitoly (části 3.1, 3.2, z části i 3.3) postrádám reference. Některé definice působí nedokončeně (MSE na str. 42) nebo nejsou úplně správně (SNR na str. 41, které je však v implementaci správně, projekce v rovnici (3.14) není řádně definována). Překvapivým výsledkem práce je, že ačkoliv obě varianty sítě (tied, untied) vedou ke zlepšení kvality oproti výchozímu algoritmu, kvalita při použití menšího počtu parametrů (tied) je lepší než při více parametrech (untied). Důvěryhodnost výsledku je bohužel omezena vzhledem k obrázkům 4.2 až 4.7 (vývoj parametrů a ztrátové funkce v průběhu učení), které napovídají, že učení bylo ukončeno příliš brzy.

Navrhovaná známka
B
Body
80

Posudek oponenta

Myška, Vojtěch

Bakalářská práce se zabývá rekonstrukcí poškozených audio signálů pomocí přístupu kombinující klasické optimalizační algoritmy a hluboké učení. Deep unrolling je aplikován na algoritmu FISTA. Práce je členěna přehledně, nicméně po formální stránce je spíše podprůměrná. Některé části budí dojem, že byly dodělávány v časové tísni. Grafy a obrázky jsou v rastrové grafice, pro oddělení desetinného místa jsou použity tečky, jednoty nejsou od čísel odděleny mezerou, umístění Obr. 1.1 není vhodné a některé obrázky přetékají. Dále se v grafech vyskytují nelokalizované popisky os, viz Obr. 3.1 a Obr. 3.2. V práci je zmíněna implementace tří variant neuronové sítě. Detailněji jsou popsané pouze dvě základní varianty. Dle mého názoru chybí podrobnější diskuse nad možnými důvody špatných výsledků získaných pomocí UFN s prahováním řízeným konvolučními bloky. Dále je v sekci 4.3 uvedeno, že nebyly použity všechny dostupné datové vzorky. Uvedeným důvodem je HW limit výpočetní stanice. Toto omezení není více diskutováno a podobná situace se řeší například postupným načítáním vzorků. Optimalizace parametrů sítě byla provedena v 50 iteracích. Z prezentovaných výsledků je však patrné, že bylo trénování ukončeno předčasně, neboť není patrný negativní trend v podobě odchýlení průběhů hodnot ztrátové funkce na trénovací a validační datové množině. Dosažené výsledky jsou diskutovány, zadání práce je splněno. Vzhledem k výše zmíněným faktorům navrhuji hodnocení C/70b.

Navrhovaná známka
C
Body
70

Otázky

eVSKP id 159809