Analýza zvukových nahrávek pomocí hlubokého učení

Loading...
Thumbnail Image

Date

Authors

Kramář, Denis

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato diplomová práce se zabývá řešením problému audio-klasifikace zvuku těžby motorové pily v přirozeném prostředí s využitím převážně konvolučních neuronových sítí. Nejprve je probrána teorie týkající se grafické reprezentace zvukového signálu. Další část je věnována oblasti strojového učení. Ve třetí kapitole jsou prezentovány některé současné práce zabývající se touto problematikou. V rámci praktické části je představen použitý dataset a testované neuronové sítě. Dosažené výsledky testování jsou porovnány na základě dosažené úspěšnosti a pomocí křivek ROC. Robustnost představených řešení je ověřena pomocí navrženého detekčního programu a zhodnocena pomocí objektivních kritérií.
This master thesis deals with the problem of audio-classification of the chainsaw logging sound in natural environment using mainly convolutional neural networks. First, a theory of grafical representation of audio signal is discussed. Following part is devoted to the machine learning area. In third chapter, some of present works dealing with this problematics are given. Within the practical part, used dataset and tested neural networks are presented. Final resultes are compared by achieved accuracy and by ROC curves. The robustness of the presented solutions was tested by proposed detection program and evaluated using objective criteria.

Description

Citation

KRAMÁŘ, D. Analýza zvukových nahrávek pomocí hlubokého učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

doc. Ing. Jiří Schimmel, Ph.D. (předseda) Doc.Ing.MgA. Ondřej Urban, Ph.D. (místopředseda) prof. Mgr. Pavel Rajmic, Ph.D. (člen) Dr. Ing. Libor Husník (člen) RNDr. Lubor Přikryl (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen)

Date of acceptance

2021-06-10

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: 1) Jaký význam má použití pouličních zvuků pro trénování algoritmu, který má být nasazen v lesním prostředí? 2) Jakou roli hraje hardwarová konfigurace aparátu, který bude použit ve finálním řešení, tedy zejména jakou roli hrají parametry použitého mikrofonu/mikrofonů nebo místo instalace? Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO