Identifikace známých segmentů ve zvukovém signálu pomocí strojového učení

Loading...
Thumbnail Image
Date
Authors
Pařízek, Radim
ORCID
Mark
B
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Bakalářská práce se věnuje návrhu systému pro identifikaci zvuků přírodního prostředí ve zvukovém záznamu. V práci jsou prozkoumány datasety a modely využívané pro tento typ úloh a je popsána jejich struktura. Byly navrhnuty systémy pro identifikaci zvuků v jedné vrstvě a ve dvou vrstvách pro sedm vybraných označení. Klasifikátor použitý pro tento systém byl vytvořen přetrénováním transformer modelu z platformy Hugging Face. Byly zhodnoceny výsledky dvou přístupů trénování a jednoho systému pro identifikaci.
The bachelor thesis deals with the design of a system for the identification of natural environmental sounds in audio recordings. The datasets and models used for this type of tasks are surveyed and their structure is described. A system for the identification of sounds in one layer and in two layers has been proposed for seven selected labels. The classifier used for this system was created by fine-tuning a transformer model from the Hugging Face platform. The results of two training approaches and one identification system were evaluated.
Description
Citation
PAŘÍZEK, R. Identifikace známých segmentů ve zvukovém signálu pomocí strojového učení [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. Kamil Říha, Ph.D. (předseda) Ing. MgA. Jana Jelínková (člen) doc. Ing. David Kubánek, Ph.D. (člen) Ing. Matěj Ištvánek, Ph.D. (člen) Ing. Jiří Přinosil, Ph.D. (místopředseda)
Date of acceptance
2023-06-14
Defence
Student prezentoval výsledky své práce a komise byla seznámena s posudky. Otázky oponenta: V práci uvádíte možnost provádět klasifikaci i trénování na procesorech s architekturou typu ARM. Jaké reálné aplikace by dle vás mohli tuto výhodu využít? V práci postrádám porovnání dosažených výsledků z výsledky jiných studií (state of the art). Můžete jej prosím uvést? Otázky komise: Proč jste použil jen 7 kategorií datasetu? Proč jste nevyužíval zpětnovazební síť podle zadání? Student obhájil bakalářskou práci a odpověděl na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO