Klasifikace zvuků pohybujících se objektů pomocí neuronových sítí

Loading...
Thumbnail Image

Date

Authors

Šíbl, Evžen

Mark

B

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Cílem práce bylo navrhnout a otestovat konvoluční neuronové sítě pro klasifikaci zvuků pohybujících se objektů. Modely byly trénovány pro binární i více třídní klasifikaci a následně převedeny do formátu TensorFlow Lite pro nasazení na Raspberry Pi. Byla provedena jejich optimalizace a porovnání s původními modely z hlediska úspěšnosti, výpočetní náročnosti a inference času. Výsledky potvrzují efektivitu zvoleného přístupu i v omezeném výpočetním prostředí.
The aim of this thesis was to design and evaluate convolutional neural networks for the classification of sounds produced by moving objects. The models were trained for both binary and multi-class classification and subsequently converted to TensorFlow Lite format for deployment on a Raspberry Pi. Optimization techniques were applied, and the models were compared to their original versions in terms of accuracy, computational demands, and inference time. The results confirm the effectiveness of the chosen approach even in resource-constrained environments.

Description

Citation

ŠÍBL, E. Klasifikace zvuků pohybujících se objektů pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

doc. Ing. Kamil Říha, Ph.D. (předseda) Doc.Ing.MgA. Ondřej Urban, Ph.D. (místopředseda) Ing. Petr Honzík, Ph.D. (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen) Ing. Matěj Ištvánek, Ph.D. (člen)

Date of acceptance

2025-06-12

Defence

Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Jak se model bude chovat, když se ve vstupních datech bude objevovat více druhů zvukových objektů zároveň (případ reálného nasazení)? Jaký byl důvod pro nenatrénování modelu s jiným datovým typem (např. int8)? Student dostatečně vysvětlil otázky.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO