Systémy pro určení rytmických struktur v hudebních nahrávkách

Loading...
Thumbnail Image
Date
Authors
Staňková, Karolína
ORCID
Mark
A
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií
Abstract
Tato diplomová práce se zabývá systémy pro detekci rytmických struktur hudebních nahrávek. Obor získávání informací z hudby (MIR) umožňuje zkoumat harmonické a tonální vlastnosti hudby, rytmus, tempo apod., a využívá se v akademické i komerční sféře. V oblasti detekce rytmických struktur se využívají různé algoritmy, nicméně dnes většina nových metod využívá neuronové sítě. Cílem této práce je shrnout dosavadní výsledky výzkumů systémů pro detekci hudebních dob a tempa v oboru MIR, popsat způsoby výpočtu a vyhodnocení parametrů hudebních nahrávek, a implementovat program, který umožní srovnání dostupných detekčních systémů. Výsledkem práce je program v jazyce Python, který využívá k detekci rytmické struktury testovacích nahrávek šest různých systémů. Výstupy algoritmů následně kontroluje podle zadané reference a pomocí několika hodnotících veličin dané systémy porovnává mezi sebou. K tomu využívá dvou databází hudebních nahrávek, jedné větší převzaté a jedné menší vytvořené v rámci této práce (včetně anotací, tedy referenčních časů dob pro jednotlivé nahrávky). Program též umožňuje zobrazení výsledků v grafech a přehrání libovolné nahrávky doplněné o stopu obsahující detekované časy dob.
This master thesis deals with systems for detecting rhythmic structures of music recordings. The field of Music Information Retrieval (MIR) allows us to examine the harmonic and tonal properties of music, rhythm, tempo, etc., and has uses in academic and commercial sphere. Various algorithms are used in the detection of rhythmic structures. However, today, most new methods use neural networks. This work aims to summarize the current research results of systems for detecting beats and tempo, to describe methods of calculating and evaluating the parameters of music recordings, and to implement a program that allows comparison of available detection systems. The result of the work is a script in the Python language, which uses six different systems to detect the rhythmic structure of test recordings. It then checks the outputs of the algorithms according to the given reference and compares the given systems with each other using several evaluation values. It uses two datasets as a reference—one of them is publicly available and the other was created by the author of this thesis (including annotations, i.e., reference beat times, for the sample recordings). The program allows user to see the results in graphs and play any of the sample recordings with detected beat times.
Description
Citation
STAŇKOVÁ, K. Systémy pro určení rytmických struktur v hudebních nahrávkách [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.
Document type
Document version
Date of access to the full text
Language of document
cs
Study field
Zvuková produkce a nahrávání
Comittee
doc. Ing. Jiří Schimmel, Ph.D. (předseda) Doc.Ing.MgA. Ondřej Urban, Ph.D. (místopředseda) prof. Mgr. Pavel Rajmic, Ph.D. (člen) Dr. Ing. Libor Husník (člen) RNDr. Lubor Přikryl (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen)
Date of acceptance
2021-06-10
Defence
Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Otázka oponenta: Zkraje kapitoly 6.3 se objevuje formulace „To je způsobeno velikostí používaného bufferu, která je 512x512 vzorků, tedy 6 s při vzorkovacím kmitočtu 6 s.“. Dává tato formulace smysl? Studentka obhájila diplomovou práci a odpověděla na otázky členů komise a oponenta.
Result of defence
práce byla úspěšně obhájena
Document licence
Standardní licenční smlouva - přístup k plnému textu bez omezení
DOI
Collections
Citace PRO