TOMEŠEK, J. Zpracování prostorového zvuku sférického mikrofonního pole [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2024.

Posudky

Posudek vedoucího

Liska, Matej

Student pracoval velmi aktivně a pravidelně konzultoval dosažené výsledky, zadání diplomové práce splnil. V práci je zpracován detailní rozbor problematiky snímání zvuku sférickým mikrofonním polem rozhraním TDM řízeného pomocí FPGA, ze kterého student vyvodil programové návrhy vlastních kódů a IP jader pro tento účel. Tyto kódy byly následně implementovány a v práci jsou popsány nastalé problémy a jejich řešení. Tvoření vysokofrekvenčních taktovacích signálů, získávaní vícekanálových zvukových signálů a zpracováni prostorového zvuku metodami jako je Beamforming nebo Ambisonie považuji za složitý problém, který pravděpodobně nemá vždy dokonalé řešení. Přesto se však studentovi podařilo tento problém velmi dobře zvládnout. V zhodnocení práce je nástroj úspěšně odsimulován a otestován, kde se podařilo zaznamenat zvuk ze 13-ti připojených mikrofonů na jedné lince, nepřipojení posledních 3 mikrofonů nebylo způsobeno touto prací. Kladně hodnotím i práci s literaturou. Po odborné stránce byly naplněny cíle práce a v některých aspektech práce překonala očekávání. Po formální stránce jsem nenalezl žádné nedostatky. Problematika je popsána podrobně a text práce je srozumitelně rozepsán včetně příloh.

Navrhovaná známka
A
Body
100

Posudek oponenta

Honzík,, Petr

Práce se zabývá zejména realizací zařízení pro přenos zvukových signálů z MEMS mikrofonů s výstupem TDM do hostujícího počítače a následným zpracováním těchto signálů. Primárním účelem je záznam a zpracování zvuku pomocí sférického mikrofonního pole. V teoretické části bylo stručně představeno základní dělení mikrofonních polí, dále byly rozvinuty metody pro zpracování signálů ze sférického pole, zejména směrové chování a ambisonie. Zásadní částí práce je popis implementace přenosu signálů z mikrofonů do počítače pomocí FPGA v jazyce VHDL. Dále je popsána funkce FTDI čipu pro USB přenos dat z FPGA do počítače, implementace komunikace čipu s FPGA i na straně počítače pomocí software Matlab. Nakonec je popsána aplikace v prostředí Matlab pro zpracování přijatých signálů (ambisonie a beamforming). Práce je poměrně obsáhlá (závěr na straně 70). Jednotlivá témata jsou logicky seřazena, jazykově je práce v pořádku, počet překlepů je nízký. Byly použity relevantní zdroje v souladu s normami, citační etika nebyla porušena. Všech bodů uvedených v pokynech pro vypracování bylo dosaženo, zadání tedy bylo splněno. Výtky jsou spíše formální, například: v sekci 2.1.1 je radiální prostorová souřadnice označena „r“ (bez kurzívy) a poloměr pole „r“ (kurzíva), což je riskantní, a následně v rovnici (2.26) je dle [21] poloměr značen „a“ a souřadnice „r“‘ (kurzíva), v rovnici (2.29) je „r“ (kurzíva) použito pro řád ambisonie, rovnice (1.1) se nezdá být v souladu s větou nad ní, besselovy funkce n-tého řádu jsou na některých místech popsány jako druhého řádu, charakteristická impedance v rovinné vlně na s. 26 je označena za akustickou (pokud by bylo nutné to upřesnit, byla by to specifická impedance) a má nesprávně uvedenou jednotku, symbol „M“ ve vzorci (3.3) je mocnina dvou ale nikoliv nutně počet mikrofonů, apod. Nicméně tyto formální nedostatky pouze mírně snižují srozumitelnost textu. Oponent by též ocenil například obrázky z osciloskopu ukazující funkční TDM komunikaci a případně i problémy popisované v sekci 5. Nicméně je třeba ocenit zprovoznění celého komunikačního řetězce od MEMS mikrofonů až po zpracování dat v počítači, zejména když oproti některým existujícím implementacím, které na straně počítače komunikují jako „Class compliant“ zvuková karta, byla zvolena cesta kompletně vlastní implementace, která je náročnější pro vytvoření aplikace v počítači, nicméně umožňuje větší kontrolu nad celým procesem přenosu dat.

Navrhovaná známka
A
Body
93

Otázky

eVSKP id 159303