MARŠÁL, M. Elektronický modul pro akustickou detekci [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2016.

Posudky

Posudek vedoucího

Havránek, Zdeněk

Diplomová práce navazovala na předchozí semestrální projekt a jejím cílem byl návrh a realizace akustického detekčního modulu pro zabezpečovací účely s prvky strojového učení. Pro úspěšné vypracování práce a realizaci modulu bylo nutné nastudovat jak metody strojového učení a výběru vhodných příznaků v získaných datech, tak i senzorickou základnu pro vlastní měření zvuku a v neposlední řadě i programování mikrokontroleru včetně implementace přenosu dat rozhraním Ethernet do počítače. Student dokázal samostatně nastudovat potřebné znalosti a prokázal i odpovídající odborné znalosti zejména při výběru vhodných příznaků a klasifikačních algoritmů strojového učení. Pracoval iniciativně a samostatně, řešenému problému věnoval dostatek času během celého semestru, dílčí výsledky pravidelně konzultoval. V průběhu řešení práce se musel vypořádat s komplikacemi při využití vývojového prostředí výrobce zvoleného mikrokontroleru, které nebylo vždy dostatečně popsané, nebo nebyly dostupné vhodné firmwarové stavební prvky. Řešil problémy zejména při rychlém sběru a zpracování digitálních dat z MEMS mikrofonu a jejich následný nepřerušený přenos komunikačním rozhraním Ethernet do vyhodnocovací jednotky (počítač). Kvůli identifikované těžkopádnosti vývojového prostředí ke zvolenému vývojovému kitu s mikrokotrolerem se dále nepokoušel o rozšíření systému o další moduly a jejich praktickou synchronizaci přes komunikační rozhraní pro prostorovou lokalizaci události. Výsledkem jeho práce je ale funkční modul pro identifikaci sady akustických událostí (zvuků) s vyhodnocením úspěšnosti jejich klasifikace, který vyhovuje požadavkům zadání. Cíle práce tedy považuji za splněné a jeho práci na projektu hodnotím stupněm B/85.

Navrhovaná známka
B
Body
85

Posudek oponenta

Klusáček, Jan

Cílem práce bylo navrhnout a realizovat modul pro detekci a klasifikaci zvuku. Celá práce je rozdělena do deseti kapitol.   První kapitola popisuje obecně potřebné části systému a rozvržení práce.   Druhá kapitola obsahuje rešerši dostupných mikrofonů se zaměřením na MEMS mikrofony. V této kapitole je stručně popsán princip fungování MEMS mikrofonů, jejich vlastnosti a možnosti jejich výstupů. Chybí však popis konkrétních modelů zvažovaných pro navrhované řešení, v kapitole 8.1. je přesto uvedeno že použitý mikrofon byl vybrán na základě rešerše.   Třetí kapitola popisuje formát dat přenášených z mikrofonu (PDM) a způsob práce s nimi (filtrování).   Ve čtvrté kapitole je stručně popsána použitá HW platforma a IDE.   Pátá kapitola nazvaná zpracování signálu popisuje jeden algoritmus používaný pro získání frekvenčních složek ze signálu (Goertzelův algoritmus).   Šestá kapitola obsahuje stručný ale dostatečný popis problematiky strojového učení a prostředí RapidMiner, použitého při návrhu použité metody.   V sedmé kapitole je popsáno rozhraní Ethernet a problematika synchronizace času za jeho pomoci.   Vlastní řešení je popsané v osmé kapitole. Rozsah této kapitoly je dostatečný. Některá rozhodnutí při návrhu však nejsou úplně ideální.   Velkou otázkou je možnost lokalizace zdroje zvuku za využití více modulů. V kapitole 8.9.1. Je popsán důvod proč není použita synchronizace času pomocí IEEE-1588. Za mnohem vetší problém však považuji celý způsob detekce událostí. Událost je detekována na bloku dat dlouhém 11.27ms (velikost daná velikostí DMA bloku), přičemž událost může být detekována v bloku jen pokud začne v první polovině tohoto bloku, v opačném případě je detekována až v dalším bloku (kap. 8.7.) a část signálu z předchozího bloku není využita. Pro přesné zaměření polohy by tedy bylo minimálně nutné zajistit synchronní spuštění DMA bloků. Další otázkou je, zda by shodný zvuk snímaný v různých místech spouštěl trigger (kap. 8.7.) v přesně stejném místě (vliv šumu apod.). Výpočet minimální vzdálenosti modulů pro použití lokalizace v kapitole 8.9.1. je příliš zjednodušený, jediný vliv který bere v úvahu je přesnost synchronizace času. Vypočtená vzdálenost je na první pohled extrémně malá (687m)   Určité problémy je možné najít také v oblasti klasifikace zvuku za pomoci strojového učení. Problémem je vynechání normalizace (kapitola 8.8.4.), která by v každém případě vedla ke zlepšení predikce (u k-NN). Předpokládám že minimálně na úrovni zpracování analogového signálu je prováděna normalizace frekvenčních složek pro potlačení vlivu různé hlasitosti, v práci to však není uvedeno. Také chybí podrobnější popis uvažovaných příznaků. Není uvedeno co je myšleno maximální frekvencí, lokální frekvencí, lokálním minimem apod. (kapitola 8.8.1). Naopak oceňuji přístup použitý pro výběr vhodných atributů použitých pro tvorbu modelu.   Práce obsahuje drobné chyby a nepřesné formulace. Například: popis Brute-force výběru (kap. 6.2.2.3 “kombinace všech příznaků“ vs “všechny kombinace příznaků“), nebo popis odhadu chyby modelu (kap. 6.4. "Výpočet chyby modelu se ale provadí na trénovacích datech", spravně však má být uvedeno na testovacích). Výhrady je možné mít také ke kvalitě některých obrázků (např. obr. 21 str. 29, obr. 34 str. 43).   Zadání práce vyžadovalo od studenta zorientovat se v několika oblastech (Snímání zvuku, mikrokontroléry, RTOS, strojové učení). Proto bych ji hodnotil jako nadprůměrně náročnou. Přes výše uvedené problémy je výsledkem funkční prototyp, který splňuje všechny body zadání a student prokázal inženýrské schopnosti. Práci doporučuji k obhajobě.

Navrhovaná známka
C
Body
79

Otázky

eVSKP id 94245