Analýza zvukových nahrávek pomocí hlubokého učení

Loading...
Thumbnail Image
Date
Authors
Kramář, Denis
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato diplomová práce se zabývá řešením problému audio-klasifikace zvuku těžby motorové pily v přirozeném prostředí s využitím převážně konvolučních neuronových sítí. Nejprve je probrána teorie týkající se grafické reprezentace zvukového signálu. Další část je věnována oblasti strojového učení. Ve třetí kapitole jsou prezentovány některé současné práce zabývající se touto problematikou. V rámci praktické části je představen použitý dataset a testované neuronové sítě. Dosažené výsledky testování jsou porovnány na základě dosažené úspěšnosti a pomocí křivek ROC. Robustnost představených řešení je ověřena pomocí navrženého detekčního programu a zhodnocena pomocí objektivních kritérií.
This master thesis deals with the problem of audio-classification of the chainsaw logging sound in natural environment using mainly convolutional neural networks. First, a theory of grafical representation of audio signal is discussed. Following part is devoted to the machine learning area. In third chapter, some of present works dealing with this problematics are given. Within the practical part, used dataset and tested neural networks are presented. Final resultes are compared by achieved accuracy and by ROC curves. The robustness of the presented solutions was tested by proposed detection program and evaluated using objective criteria.
Description
Citation
KRAMÁŘ, D. Analýza zvukových nahrávek pomocí hlubokého učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. Jiří Schimmel, Ph.D. (předseda) Doc.Ing.MgA. Ondřej Urban, Ph.D. (místopředseda) prof. Mgr. Pavel Rajmic, Ph.D. (člen) Dr. Ing. Libor Husník (člen) RNDr. Lubor Přikryl (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen)
Date of acceptance
2021-06-10
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: 1) Jaký význam má použití pouličních zvuků pro trénování algoritmu, který má být nasazen v lesním prostředí? 2) Jakou roli hraje hardwarová konfigurace aparátu, který bude použit ve finálním řešení, tedy zejména jakou roli hrají parametry použitého mikrofonu/mikrofonů nebo místo instalace? Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO