KÁČER, K. Automatická detekce štěkajících psů podle zvukového signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Posudky

Posudek vedoucího

Sigmund, Milan

Student se o svou bakalářskou práci zajímal hned od počátku, pracoval průběžně a intenzivně využíval konzultace. Vzhledem k pandemické situaci (covid-19) během celého akademického roku 2020-21, probíhaly veškeré konzultace pouze distančně. Zadání práce je z obsahového pohledu splněno, i když často dosti povrchně. Student vytvořil samostatně databázi nahrávek psího štěkotu a jiných zvuků. Vzhledem k limitaci objemu příloh v Informačním systému, nebyla databáze přiložena v plném rozsahu. Základním rysem celé práce je nedostatečný a nepřesný popis prováděné činnosti. Například místo přesného popisu tvorby vzorů autor uvádí „z databázy sa vytvára vzor, akýsi priemer koeficientov…”. Přitom celkový text práce je svým rozsahem velmi úsporný. Na druhou stranu, všeobecně známé věci jako je diskretizace analogového signálu nebylo nutné vůbec popisovat. Prováděné testy by měly být opakovatelné. V práci však není specifikováno, které nahrávky použil autor pro trénování systému a které pak pro testování systému. Kapitola „5.3 Vyhodnotenie“ v podstatě popisuje trénování. Výsledky z tabulky 5.3, které sloužily pro nalezení optimálních hodnot Treshold, jsou uvedeny v Závěru jako výsledky testování. Prezentované výsledky působí spíše dojmem, že pro malou skupinu nahrávek byly odladěny prahové hodnoty rozhodovacího algoritmu a získané výsledky pak považované za statistické vyhodnocení spolehlivosti detekce (což byl požadavek v zadání). Instrukce pro práci s programem (Kapitola 5.5) jsou pro potenciální uživatele nejasné. Bez bližší znalosti struktury vytvořeného programu a zběhlosti v MATLABu se zájemci asi nepodaří program správně používat. Není zřejmé, proč se ve skriptu callingmfc.m vyskytuje pojem „andrejbican“. V textu je řada překlepů a formálních chyb: - výchozí text semestrální práce nebyl všude aktualizovaný, např. konstatování v Závěru „V pokračovaní práce by som sa rád zameral na Mel Cepstrálne koeficienty…“ pozbývá platnost - stejná forma zobrazení výstupních hodnot se někde prezentuje jako tabulka (Tab. 5.1 a Tab. 5.2) a jinde jako obrázek (Obr. 5.1) - v textu chybí odkazy na použitou literaturu - na každém z obrázků 5.4 a 5.5 jsou vždy dvě spektrální obálky, význam druhé obálky není vysvětlený - seznam použité literatury není napsaný jednotným stylem - příklady některých překlepů: „Obr. 5.2: Porovnanie keoficientov” (str. 30), „Zvuky určené sprave…” (str. 34), atd. - na řadě míst nejsou sousední slova oddělena mezerou, což šlo vyhledat a opravit např. kontrolou textu ve WORDu. Některé výtky se opakují z posudku na semestrální práci, neboť chyby nebyly odstraněny. Předloženou bakalářskou práci pana Kamila Káčera hodnotím celkově 54 body.

Navrhovaná známka
E
Body
54

Posudek oponenta

Poměnková, Jitka

Předkládaná práce se zabývá problematikou zpracování zvukových signálů se zaměřením na detekci psího štěkotu. Student si kladl za cíl nejprve zpracovat rešerši dostupných databází a významných publikací k dané problematice. Následně vybrat tři metody pro detekci psího štěkotu, tyto naprogramovat a ověřit jeho účinnost při detekci na reálném signálu. Dále určit minimální délku zvukové nahrávky, aby byla detekce účinná. Jako další úkol si student stanovil vytvořit databázi zvukových nahrávek psího štěkotu při zohlednění různých parametrů (rasa, stáří, velikost psa), doplnit ji o simulovaný štěkot psa, ověřit účinnost navrženého detekčního algoritmu a výsledky statisticky vyhodnotit. Téma předložené práce je zajímavé, ale samotné zpracování práce je na slabé úrovni. Práce obsahuje řadu chyb, a to gramatických i stylistických, řadu nepřesností a nevhodně zvolených formulací. Student často používá nejasné termíny a zkratky dříve, než je vysvětlí nebo odkáže na relevantní zdroj. Citování literatury zcela chybí. Zápis vzorců a citování proměnných v textu neodpovídá matematickým standardům. V práci nejsou citované ani zdroje grafů; není jasné, které grafy jsou vlastní a které převzaté. Rovněž je u prezentovaných grafů mix českého a anglického jazyka. Obsah kapitoly 3.2. je zapsán dost zmateně. Popis detekčních algoritmů není dobře strukturovaný, v textu jsou skoky a chybí informace. Chybí zde logická struktura, popis algoritmu v jasné podobě a jasných krocích. Autor neodkazuje na metodickou část práce ani na použité matematické formule. Protože autor necituje v textu použitou literaturu, je obtížné zjistit, co vše je potřeba při detekci provést. Např. s. 20: „Za najväčší problém spomenutého algoritmu je nastavenie presných hodnôt Treshold. Tým že je potrebné nastaviť šesť hodnôt dochádza v niektorým prípadoch k nepresnostiam.“ Jak zjistím, že je potřeba nastavit právě šest hodnot? Při nastavování prahové hodnoty student uvádí, že postupoval metodou „pokus/omyl“ (s. 30). Tento postup je nedostačující. Vzhledem k tomu, že je prahová hodnota využívaná při testování, bylo by vhodné v práci podrobněji rozebrat jednak způsob testování a také stanovení prahové hodnoty. Za standartní se považuje hodnoceni klasifikace ROC křivkou, což v práci chybí. U předložené práce mohu konstatovat, že oproti zadání student neprovedl rešerši dostupných databází a významných publikací pojednávajících o analýze zvuků vydávaných zvířaty. V ostatních bodech zadání lze cíle považovat za splněné, byť na hraniční úrovni. Orientace v textu je obtížná, student necituje literaturu, a nelze tak dohledat doplňující informace. Podobně odkazování v rámci textu v souvislosti s aplikací analytických algoritmů je slabé. Textové zpracování je také slabé. Jako slabinu práce vidím neprůhledné nastavení prahové hodnoty a testování výsledků, kdy bez prezentace ROC křivek je posouzení účinnosti navrhovaného detektoru velmi obtížné. Z předložené práce se mi proto jeví velmi obtížné posoudit, zda student vytvořit program pro spolehlivou detekci, jak vyplývalo ze zadání. Předloženou práci proto hodnotím 50 body.

Navrhovaná známka
E
Body
50

Otázky

eVSKP id 133587