NIKOVÁ, K. Difuzní neurální model pro rekonstrukci poškozených audio signálů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Posudky

Posudek vedoucího

Mokrý, Ondřej

Práce se zabývá sestavením a naučením difúzního modelu pro rekonstrukci chybějícího úseku audio signálu. Oproti zadání se nejedná o modifikaci převzatého modelu, ale celá metodika difúzních procesů byla vystavěna od základu, a to včetně architektury použitého denoiseru. Z tohoto důvodu se tedy jedná spíše o ilustrační model cenný svým vhledem do problematiky. Ačkoliv tedy lze mít objektivní výhrady ke splnění zadání, zejména chybějící srovnání s referenčními metodami, považuji praktickou část práce za hodnotnou a doporučuji ji k obhajobě. Text práce je na dobré úrovni, místy se ale vyskytují jazykové chyby či nekonzistence značení (např. sazba vektorů v algoritmu 1). Struktura práce není ideální (celá práce je ve dvou kapitolách), v obsahu pak postrádám větší motivaci pro zvolenou architekturu denoiseru či numerické porovnání úspěšnosti navržených modelů, které mohlo být uvedeno i přes ilustrativní charakter experimentu. S přihlédnutím k průběžné činnosti a teoretické i praktické náročnosti tématu hodnotím práci 80 body.

Navrhovaná známka
B
Body
80

Posudek oponenta

Švento, Michal

Bakalárska práca sa zaoberá využitím difúznych generatívnych modelov na doplnenie chýbajúcich úsekov zvukového signálu. Práca má primeraný rozsah, avšak ciele sú splnené len čiastočne, hlavne kvôli chýbajúcemu porovnaniu a vyhodnoteniu vytvoreného modelu s inými dostupnými metódami. Práca s literatúrou je na dobrej úrovni. Formálne je text na priemernej úrovni a vyžadoval by lepšie členenie. Kapitoly sú zbytočne dlhé a neprehľadné, čo znižuje zrozumiteľnosť. Po jazykovej stránke obsahuje práca množstvo gramatických a typografických chýb. Na druhej strane možno vyzdvihnúť početné vektorové obrázky. V teoretickej časti sú miestami nepresnosti a nejasné tvrdenia (napr. strana 27, predposledný odstavec – nie je úplne jasné, ako prebieha trénovanie; rovnica 1.13 – nejasný rozdiel medzi signálom a spektrogramom). Praktická časť je na dobrej úrovni a študentka vyskúšala množstvo experimentov, ktoré hodnotila hlavne individuálnym posluchovým testom. Bohužiaľ, výsledky práce nepriniesli zlepšenie kvality nahrávok a chýba objektívne hodnotenie výsledkov pomocou dostupných metrík. Vzhľadom na uvedené skutočnosti hodnotím prácu 63 bodmi.

Navrhovaná známka
D
Body
63

Otázky

eVSKP id 159270