Klasifikace zvuků pohybujících se objektů pomocí neuronových sítí

Loading...
Thumbnail Image
Date
Authors
Šíbl, Evžen
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Cílem práce bylo navrhnout a otestovat konvoluční neuronové sítě pro klasifikaci zvuků pohybujících se objektů. Modely byly trénovány pro binární i více třídní klasifikaci a následně převedeny do formátu TensorFlow Lite pro nasazení na Raspberry Pi. Byla provedena jejich optimalizace a porovnání s původními modely z hlediska úspěšnosti, výpočetní náročnosti a inference času. Výsledky potvrzují efektivitu zvoleného přístupu i v omezeném výpočetním prostředí.
The aim of this thesis was to design and evaluate convolutional neural networks for the classification of sounds produced by moving objects. The models were trained for both binary and multi-class classification and subsequently converted to TensorFlow Lite format for deployment on a Raspberry Pi. Optimization techniques were applied, and the models were compared to their original versions in terms of accuracy, computational demands, and inference time. The results confirm the effectiveness of the chosen approach even in resource-constrained environments.
Description
Citation
ŠÍBL, E. Klasifikace zvuků pohybujících se objektů pomocí neuronových sítí [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. Kamil Říha, Ph.D. (předseda) Doc.Ing.MgA. Ondřej Urban, Ph.D. (místopředseda) Ing. Petr Honzík, Ph.D. (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen) Ing. Matěj Ištvánek, Ph.D. (člen)
Date of acceptance
2025-06-12
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student prezentoval výsledky své práce a komise byla seznámena s posudky. Student obhájil diplomovou práci a odpověděl na otázky členů komise a oponenta. Jak se model bude chovat, když se ve vstupních datech bude objevovat více druhů zvukových objektů zároveň (případ reálného nasazení)? Jaký byl důvod pro nenatrénování modelu s jiným datovým typem (např. int8)? Student dostatečně vysvětlil otázky.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO