ŠVENTO, M. Rekonstrukce poškozených audiosignálů pomocí Plug-and-Play metody [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.

Posudky

Posudek vedoucího

Mokrý, Ondřej

Práce se zabývá moderními metodami rekonstrukce audio signálů poškozených aditivním šumem a výpadkem vzorků. Algoritmy byly dle zadání implementovány a otestovány a dosažené výsledky přináší vhled do současné problematiky kombinace neuronových sítí a tradičních postupů. Prezentace výsledků je dobrá, mohla však být ještě obohacena o statistické vyhodnocení. Oproti zadání nebyla natrénována vlastní neuronová síť. To bylo způsobeno netrivialitou a obsáhlostí tématu, a i přes svědomitou průběžnou práci studenta byl trénink vlastní sítě nad časové možnosti. Formální úprava textu je dobrá, místy se však vyskytují nekonzistence ve značení (např. množina Gama v rovnici (4.3), která značí jak množinu signálů, tak množinu indexů) a další drobné chyby. Rozsah práce není velký, ale považuji ho za dostatečný. Odborná literatura je dostatečně citována, seznam referencí však mohl být v jazyce práce. Oceňuji zejména grafickou úpravu práce a množství vlastních názorných ilustrací. I přes drobné nedostatky jsem byl s prací studenta spokojen a předloženou práci tudíž hodnotím 88 body.

Navrhovaná známka
B
Body
88

Posudek oponenta

Rajmic, Pavel

Diplomová práce Bc. Michala Šventa zkoumá využití metody tzv. plug-and-play pro rekonstrukci audio signálu, konkrétně se jedná o audio poškozené zašuměním a výpadkem vzorků. Ačkoliv nové metody nevyzněly ve srovnání s těmi klasickými úplně pozitivně, je třeba ocenit, že student udělal množství práce, musel vyřešit řadu problémů a zadání práce bylo splněno ve všech bodech. Práce se čte dobře, ale někde jsem se jako čtenář zasekával, zejména na místech, kde jsem očekával zevrubnější motivaci nebo vysvětlení nějakého postupu, ale v práci bylo jen několik stručných vět, ze kterých postup nešlo ihned pochopit. Občas se vyskytne překlep (např. Parsvall). V Závěru není konzistence mluvnických časů. Po grafické a typografické stránce je práce nadprůměrná. Student hodnotil výsledky objektivními kritérii jako STOI, PEAQ, ale z mého pohledu mohl doplnit ještě informaci o jeho subjektivním dojmu z poslechu – jestli odpovídal objektivnímu hodnocení. Konkrétnější poznámky: * Výhrady bych měl k matematickému značení. Např. skaláry jsou v některých případech značeny tučně, jindy netučně a kurzívou. Nebo značení skalárního součinu v (2.1), které je nejspíše převzato z Wikipedie a neodpovídá dalšímu textu (např. vztahu (2.2)). * Další matematické problémy jsou např. dělení nulou ve vztazích (1.3) a (4.5). * Myslím, že AI se nemusí omezovat jen na napodobování člověka (str. 27). * Nepochopil jsem tvrzení, že se používá „24 bitov pre digitálnu distribúciu hudby [7]“. Co je digitální distribuce hudby? Patří tam např. Spotify, Youtube? Navíc v knize [7] jsem informaci tohoto typu nenašel. * Název části 2.4.3 nepovažuji za zdařilý překlad. * „Ďalšou nevýhoda menit mieru učenia“. * Na str. 34 se mluví zcela samozřejmě o lokálním a o globálním minimu, ale tyto důležité termíny nebyly do té doby vůbec zavedeny ani diskutovány. * Text před (4.1) jsem nepochopil. „Zlepšenie“ čeho oproti čemu? A k čemu se vztahuje „potom“? Kromě toho mi připadne text příliš stručný, na to, že jde o klíčovou myšlenku, na které práce stojí. * V (4.2) nalevo chybí na jakou množinu projekce probíhá. * U citací s mnoha autory téhož díla, jako je [31] doporučuji použít „a kol.“

Navrhovaná známka
B
Body
83

Otázky

eVSKP id 151173