BORODÁČ, S. Audio declipping s využitím odhadu okamžité frekvence [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Posudky

Posudek vedoucího

Rajmic, Pavel

Úkolem Bc. Samuela Borodáče bylo přizpůsobení metody PHAIN, známé z literatury, pro případ rekonstrukce tzv. saturovaného audiosignálu. Student se seznámil s problematikou, a přestože optimalizace nepatří k nejlehčím oborům, student pochopil principy a prostředky, na kterých stojí stávající metoda PHAIN. Tu pak vhodně pozměnil, aby řešila jinou úlohu a vše otestoval na své databázi audio nahrávek. Student pravidelně konzultoval, s menším výpadkem na začátku letního semestru. Student pracoval systematicky a k diplomové práci přistupoval zodpovědně. Přesto lze najít několik slabin, mezi které patří zejména nevysoká grafická kvalita textové části včetně zpracování obrázků.

Navrhovaná známka
B
Body
80

Posudek oponenta

Mokrý, Ondřej

Diplomová práce se zabývá moderními metodami pro rekonstrukci saturovaných (klipovaných) vzorků audio signálu. Konkrétně je pro tento problém přizpůsobena metoda původně určená pro doplňování zcela ztracených vzorků. Metoda je popsána, implementována v prostředí Matlab a otestována na reálných hudebních nahrávkách se simulovaným poškozením. Text je spíše kratšího rozsahu, popisuje však většinu kroků podstatných pro odvození metody. Experimentální část je spíše omezená, zadání však považuji za splněné. Po jazykové stránce je text na dobré úrovni, literatura je dostatečně citována. Po grafické stránce je práce spíše na nižší úrovni, zejména bych vytknul použití rastrových obrázků (navíc v nízkém rozlišení) či nepřehledný obr. 6.5. Vzhledem k množství matematického zápisu mohl být volen vhodnější sázecí program. Ačkoliv práce neobsahuje zásadní chyby, vyskytuje se zde vyšší počet nejasností: – V úvodu části 1.3 je řečeno, že „jakékoliv řešení splňující podmínku prvního řádu je globálně optimální“, podmínka prvního řádu v části 1.2.1 však o žádném řešení nehovoří. – Subdiferenciál či Fenchelův konjugát na str. 15 nejsou definovány. – Na str. 18 je uvedena závislost frekvenčního rozlišení na délce okna, délka okna však není dříve definována. Navíc je uvedeno, že počet frekvenčních indexů je M = L (kde L je délka signálu), tedy na okně nezávisí. – Nepřesné jsou popisy maskovacího operátoru pod (2.4), popis použití časové derivace pod (2.7), popis prahování pod (2.19) (kladná hodnota komplexního čísla není definována), obrázek 3.2 množiny Gamma_clip (dle rovnice (3.3) je zobrazená množina prázdná). – Adjungovaný operátor ve (3.9) není definovaný správně, protože (DG)* = G*D*. – Je uvedeno, že hodnoty regularizačního parametru lambda jsou testovány a následně pevně zvoleny pro každou hodnotu vstupního SDR; nejsou však prezentovány žádné konkrétní výsledky v závislosti na volbě tohoto parametru. Za zmínku rovněž stojí hojné opakování již řečeného či redundantní definice, např. věta na konci úvodu, dvě věty pod (1.3), úvod 1.3.2, rovnice (3.2) pouze opakuje rovnici (2.3), rovnice (3.12) pouze opakuje rovnici (2.18). Ačkoliv se nejedná o faktické chyby, navozují tyto části pocit, že autor nemá přehled o celkovém textu a souvislostech. Vzhledem k velkému množství uvedených nedostatků hodnotím práci 60 body.

Navrhovaná známka
D
Body
60

Otázky

eVSKP id 167227