Posudky závěrečné kvalifikační práce

BORODÁČ, S. Audio declipping s využitím odhadu okamžité frekvence [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Posudek vedoucího

Rajmic, Pavel

Úkolem Bc. Samuela Borodáče bylo přizpůsobení metody PHAIN, známé z literatury, pro případ rekonstrukce tzv. saturovaného audiosignálu. Student se seznámil s problematikou, a přestože optimalizace nepatří k nejlehčím oborům, student pochopil principy a prostředky, na kterých stojí stávající metoda PHAIN. Tu pak vhodně pozměnil, aby řešila jinou úlohu a vše otestoval na své databázi audio nahrávek. Student pravidelně konzultoval, s menším výpadkem na začátku letního semestru. Student pracoval systematicky a k diplomové práci přistupoval zodpovědně. Přesto lze najít několik slabin, mezi které patří zejména nevysoká grafická kvalita textové části včetně zpracování obrázků.

Navrhovaná známka: B

Body: 80

Posudek oponenta

Mokrý, Ondřej

Diplomová práce se zabývá moderními metodami pro rekonstrukci saturovaných (klipovaných) vzorků audio signálu. Konkrétně je pro tento problém přizpůsobena metoda původně určená pro doplňování zcela ztracených vzorků. Metoda je popsána, implementována v prostředí Matlab a otestována na reálných hudebních nahrávkách se simulovaným poškozením. Text je spíše kratšího rozsahu, popisuje však většinu kroků podstatných pro odvození metody. Experimentální část je spíše omezená, zadání však považuji za splněné. Po jazykové stránce je text na dobré úrovni, literatura je dostatečně citována. Po grafické stránce je práce spíše na nižší úrovni, zejména bych vytknul použití rastrových obrázků (navíc v nízkém rozlišení) či nepřehledný obr. 6.5. Vzhledem k množství matematického zápisu mohl být volen vhodnější sázecí program. Ačkoliv práce neobsahuje zásadní chyby, vyskytuje se zde vyšší počet nejasností: – V úvodu části 1.3 je řečeno, že „jakékoliv řešení splňující podmínku prvního řádu je globálně optimální“, podmínka prvního řádu v části 1.2.1 však o žádném řešení nehovoří. – Subdiferenciál či Fenchelův konjugát na str. 15 nejsou definovány. – Na str. 18 je uvedena závislost frekvenčního rozlišení na délce okna, délka okna však není dříve definována. Navíc je uvedeno, že počet frekvenčních indexů je M = L (kde L je délka signálu), tedy na okně nezávisí. – Nepřesné jsou popisy maskovacího operátoru pod (2.4), popis použití časové derivace pod (2.7), popis prahování pod (2.19) (kladná hodnota komplexního čísla není definována), obrázek 3.2 množiny Gamma_clip (dle rovnice (3.3) je zobrazená množina prázdná). – Adjungovaný operátor ve (3.9) není definovaný správně, protože (DG)* = G*D*. – Je uvedeno, že hodnoty regularizačního parametru lambda jsou testovány a následně pevně zvoleny pro každou hodnotu vstupního SDR; nejsou však prezentovány žádné konkrétní výsledky v závislosti na volbě tohoto parametru. Za zmínku rovněž stojí hojné opakování již řečeného či redundantní definice, např. věta na konci úvodu, dvě věty pod (1.3), úvod 1.3.2, rovnice (3.2) pouze opakuje rovnici (2.3), rovnice (3.12) pouze opakuje rovnici (2.18). Ačkoliv se nejedná o faktické chyby, navozují tyto části pocit, že autor nemá přehled o celkovém textu a souvislostech. Vzhledem k velkému množství uvedených nedostatků hodnotím práci 60 body.

Navrhovaná známka: D

Body: 60

Otázky

Lze vysvětlit, proč je výpočetním čas pro 1 dB vstupního SDR nižší než pro 3 dB vstupního SDR (viz obr. 6.8)?
Při volbě parametrů tau a sigma se odvoláváte na splnění podmínky popsané v části 3.1.3. Jakým způsobem jste ve vašem případě určil normu operátoru K? Je tato norma konstantní v průběhu iterací algoritmu CP/PHADE?
V rovnici (3.9) je chybně popsán adjungovaný operátor (DG)*. Je jeho implementace v Matlabu v pořádku?