Detekce vybraných zvukových událostí v reálném prostředí

Loading...
Thumbnail Image
Date
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato práce se zabývá metodami pro rozpoznávání nebezpečných událostí, v tomto případě výstřelů, v reálném prostředí. Nejdříve byla vytvořena testovací a trénovací databáze zvuků ze zadané databáze MIVIA. V této databázi byly soubory obsaženy v šesti verzích odstupu užitečného signálu od šumu, takže následné testování vybraných metod probíhalo pro různě zašuměné soubory a bylo zjištěno, že některé metody jsou například přesnější u čistších nahrávek než jiné, ale už méně přesné u více zašuměných. Pro extrakci typických příznaků ze vstupního zvuku byla vždy použita metoda melovských kepstrálních koeficientů. V práci jsou na vytvořených databázích postupně testovány metody podpůrných vektorů a klasifikace spojením většího počtu slabých klasifikátorů. Tyto metody jsou poté dále optimalizovány, například využitím statistických veličin a po optimalizaci dosahují lepších výsledků, podle předpokladů. V rámci práce byly vytvořeny dva skripty, kde jeden vytváří trénovací databázi a na těchto datech natrénuje klasifikátor a druhý vytváří testovací databázi a vybraný klasifikátor na takto získaných testovacích datech otestuje a vypíše výsledky. Výsledky jsou v práci zpracovány pomocí tabulky záměn a je pro ně vypočteno několik poměrových veličin, jako je přesnost, citlivost, specifičnost a další. Tyto výsledky jsou vždy uvedeny v příslušné kapitole v tabulkách i sloupcových grafech a řádně okomentovány.
This work deals with methods for the detection of dangerous events, in this case gunshots, in a real environment. First of all, a testing and training database of sounds from the MIVIA database was created. In this database, the files were contained in six versions of signal-to-noise ratio, so the subsequent testing of the selected methods took place for the various shuffled files, and it was found that some methods are more accurate for cleaner recordings than others, but less accurate for more noisy ones. For the typical feature extraction from the input sound, the mel-frequency cepstral coefficients method was always used. In the thesis, the methods of support vector machines and ensemble of a number of weak classifiers are gradually tested on the created databases. These methods are then further optimized, for example by using statistical variables, and after optimization they achieve better results, as expected. In the work, two scripts were created, where one created a training database and on this data trained the classifier and the other created the test database, tested the selected classifier and obtained the results. The results are processed by confusion matrix and several proportional variables such as accuracy, sensitivity, specificity and others are calculated. These results are always listed in the relevant chapter of the thesis in the tables and column charts and are properly commented on.
Description
Citation
KOWOLOWSKI, A. Detekce vybraných zvukových událostí v reálném prostředí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Audio inženýrství
Comittee
prof. Ing. Zdeněk Smékal, CSc. (předseda) doc. Ing. Kamil Říha, Ph.D. (místopředseda) MgA. Michal Indrák, Ph.D. (člen) Ing. Ondřej Krajsa, Ph.D. (člen) Mgr. Jan Košulič (člen)
Date of acceptance
2017-06-21
Defence
Co jsou to konvoluční neuronové sítě a rekurentní neuronové sítě a jakým způsobem je lze využít pro problematiku analýzy audia?
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO