Systémy pro určení rytmických struktur v hudebních nahrávkách

Loading...
Thumbnail Image

Date

Authors

Staňková, Karolína

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

Tato diplomová práce se zabývá systémy pro detekci rytmických struktur hudebních nahrávek. Obor získávání informací z hudby (MIR) umožňuje zkoumat harmonické a tonální vlastnosti hudby, rytmus, tempo apod., a využívá se v akademické i komerční sféře. V oblasti detekce rytmických struktur se využívají různé algoritmy, nicméně dnes většina nových metod využívá neuronové sítě. Cílem této práce je shrnout dosavadní výsledky výzkumů systémů pro detekci hudebních dob a tempa v oboru MIR, popsat způsoby výpočtu a vyhodnocení parametrů hudebních nahrávek, a implementovat program, který umožní srovnání dostupných detekčních systémů. Výsledkem práce je program v jazyce Python, který využívá k detekci rytmické struktury testovacích nahrávek šest různých systémů. Výstupy algoritmů následně kontroluje podle zadané reference a pomocí několika hodnotících veličin dané systémy porovnává mezi sebou. K tomu využívá dvou databází hudebních nahrávek, jedné větší převzaté a jedné menší vytvořené v rámci této práce (včetně anotací, tedy referenčních časů dob pro jednotlivé nahrávky). Program též umožňuje zobrazení výsledků v grafech a přehrání libovolné nahrávky doplněné o stopu obsahující detekované časy dob.
This master thesis deals with systems for detecting rhythmic structures of music recordings. The field of Music Information Retrieval (MIR) allows us to examine the harmonic and tonal properties of music, rhythm, tempo, etc., and has uses in academic and commercial sphere. Various algorithms are used in the detection of rhythmic structures. However, today, most new methods use neural networks. This work aims to summarize the current research results of systems for detecting beats and tempo, to describe methods of calculating and evaluating the parameters of music recordings, and to implement a program that allows comparison of available detection systems. The result of the work is a script in the Python language, which uses six different systems to detect the rhythmic structure of test recordings. It then checks the outputs of the algorithms according to the given reference and compares the given systems with each other using several evaluation values. It uses two datasets as a reference—one of them is publicly available and the other was created by the author of this thesis (including annotations, i.e., reference beat times, for the sample recordings). The program allows user to see the results in graphs and play any of the sample recordings with detected beat times.

Description

Citation

STAŇKOVÁ, K. Systémy pro určení rytmických struktur v hudebních nahrávkách [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2021.

Document type

Document version

Date of access to the full text

Language of document

cs

Study field

Zvuková produkce a nahrávání

Comittee

doc. Ing. Jiří Schimmel, Ph.D. (předseda) Doc.Ing.MgA. Ondřej Urban, Ph.D. (místopředseda) prof. Mgr. Pavel Rajmic, Ph.D. (člen) Dr. Ing. Libor Husník (člen) RNDr. Lubor Přikryl (člen) Ing.MgA. Edgar Mojdl, Ph.D. (člen)

Date of acceptance

2021-06-10

Defence

Studentka prezentovala výsledky své práce a komise byla seznámena s posudky. Otázka oponenta: Zkraje kapitoly 6.3 se objevuje formulace „To je způsobeno velikostí používaného bufferu, která je 512x512 vzorků, tedy 6 s při vzorkovacím kmitočtu 6 s.“. Dává tato formulace smysl? Studentka obhájila diplomovou práci a odpověděla na otázky členů komise a oponenta.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO