MIKLÁNEK, Š. Porovnávání zvukových nahrávek za pomoci parametrů popisující barvu zvuku [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2017.

Posudky

Posudek vedoucího

Kiska, Tomáš

Student Štěpán Miklánek vypracoval práci zabývající se parametry popisující barvu zvuku hudebních nahrávek. V rámci této problematiky bylo nutné nastudovat oblast číslicového zpracování signálů, hudební teorie, strojového učení a také statistické analýzy. Předem mohu konstatovat, že bakalářská práce byla splněna nad rámec zadání a bylo dosaženo dobrých výsledků. Student pravidelně konzultoval své výsledky a zároveň přicházel s novými podměty jak v oblasti literatury, tak v rámci řešení samotné práce. V rámci výsledků byla navíc aplikována binární klasifikace a rozdělení databáze nahrávek na vznikající v Česku a tu ve světě. Jazyková úroveň je až na drobné nešikovné výrazy na dobré úrovni. Z celkového hlediska by samotná práce obstála i jako diplomová. Za výše uvedené důvody a výbornou spolupráci uděluji práci známku 100/A.

Navrhovaná známka
A
Body
100

Posudek oponenta

Schimmel, Jiří

Bakalářská práce se zabývá porovnáním zvukových nahrávek jedné skladby a jejich rozdělení do dvou skupin (české, světové) pomocí statistického zpracování informací o nahrávce získaných pomocí Music Information Retrieval Toolboxu pro Matlab. V úvodní části práce jsou popisovány základní informace, které lze o nahrávce získat, velká část textu je věnována parametrům rytmickým, dynamickým a melodickým. Některé parametry jsou nesprávně přisuzovány barvě zvuku, jiné kromě barvy souvisí i s výškou tónu. Na barvu zvuku mají samozřejmě vliv i přechodné děje na začátku a konci tónu, ty ale neodpovídají náběhu a poklesu, jejichž parametry jsou v práci popisovány – ty souvisí s interpretací, nikoliv s barvou zvuku. Počet průchodů nulou také nelze bez dalšího zkoumání ztotožňovat s barvou zvuku. V bakalářské práci je tato souvislost dokazována prací Gouyona, ta se ale týká pouze perkusivních zvuků. Použité mel-frekvenční kepstrální koeficienty jsou nejjednodušší aproximací sluchových filtrů, která se osvědčila při analýze řeči, v modelech sluchu pro analýzu hudby se ale používají jiné aproximace. Statistické zpracování parametrů je metodou „hrubé síly“, bez rozboru míry souvislosti jednotlivých parametrů s barvou zvuku. Práce měla začínat uvedením teorie barvy zvuku, na základě které by pak bylo posouzeno, jaké parametry MIR toolboxu lze do popisu barvy zvuku zařadit a které ne. Přes veškerou výše uvedenou kritiku se jedná o velmi dobrou práci a zadání bylo splněno. Porovnání skladeb z hlediska barvy je mnohem složitější problém než jejich porovnání z hlediska dynamiky a tempa a bakalářskou práci lze vnímat jako začátek dalšího výzkumu. Oceňuji kapitolu 6, která je jakýmsi state-of-the-art, což není v bakalářských pracích běžné. Škoda, že zde není zmíněna práce Výzkumného centra HAMU, která je podobná práci Claudie Fritz zmíněné v textu bakalářské práce. Z formálního hlediska je práce na velmi dobré úrovni, často ale schází větné čárky, jinde naopak nemají být, místy je patrný poněkud toporný překlad z angličtiny. Práce je dostatečně rozsáhlá, ale bylo by přínosnější se více věnovat parametrům, kterým je přisuzována souvislost s barvou zvuku, např. doplnit je rovnicemi výpočtu, na úkor parametrů rytmických a dynamických.

Navrhovaná známka
B
Body
85

Otázky

eVSKP id 101914