KŘUPKA, A. Moderní algoritmy posunu výšky základního tónu a jejich využití ve virtuálních hudebních nástrojích [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011.

Posudky

Posudek vedoucího

Trzos, Michal

Student se podrobně seznámil s problematikou posunu základního tónu realizovanou v časové i kmitočtové oblasti a aplikoval tuto znalost na vytvoření VST virtuálního nástroje typu sampler řízeného MIDI zprávami. Celé řešení práce je velmi komplexní a obsahuje součásti nad rámec zadání jako převzorkování použitých zvukových vzorků nebo zónování definované XML souborem. Během řešení student postupoval samostatně a pravidelně svůj konzultoval.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění zadání A 50/50
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) A 20/20
Formální zpracování práce A 20/20
Využití literatury A 10/10
Navrhovaná známka
A
Body
100

Posudek oponenta

Balík, Miroslav

Student se měl ve své diplomové práci zabývat moderními algoritmy posunu výšky základního tónu. K této skutečnosti bohužel nedošlo. Náplní práce je ve skutečnosti s jednou výjimkou ne příliš vhodně provedené srovnání poměrně starých metod nebo algoritmů a implementace jedné metody, kterou student převzal z jiné literatury, formou sampleru. Název je tedy vzhledem k náplni práce nevhodný. Název, který by práci odpovídal, by spíše zněl „Implementace sampleru periodických částí jednoduchých zvukových signálů ovládaný pomocí MIDI rozhraní“. Základní problém spatřuji v tom, že značná část práce je věnována rešeršnímu srovnání metod a algoritmů, u nichž jsou dlouho známé jejich špatné vlastnosti a student dospěl k závěrům, které jsou do značné míry jasné a dané principem metody. V této části práce bych spíš čekal kapitoly, které naznačí řešení problémů stávajících metod, které povedou k znatelnému a doložitelnému zlepšení. Žádnou „modernost“ v řešení této části práce nespatřuji. Popisované metody zpracovávající signál v časové oblasti budou vždy produkovat nevhodné zvukové artefakty, pokud nebude zpracováván periodický signál s tonálním obsahem, je tedy prakticky použitelný pouze pro jeden tón jednoho hudebního nástroje. Tohle odporuje příliš optimistickým očekáváním uvedeným v kapitole 2 pro značně univerzální použití těchto metod pro komplexnější hudební signály. Dále popsaná metoda v kmitočtové oblasti je taktéž nevhodná; fázový dekodér je velmi stará metoda, která byla primárně určena pro řečový signál, kde je rozhodující zachování srozumitelnosti lidské řeči. Zpracovaný signál je však v drtivé většině případů zkreslen tak, že není použitelný pro hudební signál a zachování jeho zvukové kvality. Nakonec byla implementována metoda PICOLA, která je převzata z jiné literatury. V zadání bylo požadováno srovnání implementovaných metod. Srovnání je provedeno pouze slovně v kapitole 5. Srovnání není provedeno pomocí žádných obvyklých testů, ani subjektivních, ani objektivních, nebyla generována databáze zpracovaných zvukových ukázek, které se v tomto případě standardně používají, např. EBU SQAM (Sound Quality Assessment Material). Ve srovnání není konkretizován důvod, proč byla zvolena metoda PICOLA (kapitola 5.2) a nebylo nijak doloženo v čem je vlastně lepší, než metody ostatní. I když slovní popis do značné míry odpovídá skutečnosti, nelze jej považovat za doložitelné srovnání. V dalších částech práce se student zabývá problematikou implementace zvolené metody formou sampleru s použitím technologie VST a MIDI a zabývá se také verzováním a dokumentací ke zdrojového kódu, což opět nijak nesouvisí s názvem práce, ale především s obecnými postupy programování. Na přiloženém CD jsou skripty a funkce v Matlabu, které jsou komentovány anglicky, není deklarováno jejich autorství. Zvukové ukázky obsahují jakési zvuky, které mají být použity pro jednotlivé metody a výstupní adresář se zpracovanými zvuky je prázdný! Bez zdlouhavého zpracování různých vstupních souborů s požadovaným různým posunutím výšky tónu není možné vůbec provést srovnání metod. Tohle je zcela nedostatečné a výstupní soubory měly být součástí přílohy s přehlednou analýzou výsledků metod pro různá posunutí. Implementovaný sampler opět vyžaduje složitější instalaci a zprovoznění. Vhodnější by byl soubor předem připravených zvukových ukázek. Prezentace výsledků tedy nebyla vhodně zvolena. Po formální stránce je práce na nadprůměrné úrovni, avšak student se nevyvaroval některých chyb, např. operace tg se nepíše kurzívou, v matematických zápisech vložených do textu nezřídka chybí mezera u relace =, proměnná z je komplexní, má se psát tlustě a šikmo, v grafech je použito nekonzistentní značení os, např. na obr. 3.8 jsou správně v závorkách uvedeny jednotky, avšak chybí funkční závislost u křivky grafu, naopak např. na obr. 3.13 je na ose y funkční závislost. Po stránce obsahové se zřídka vyskytují nějaké nedostatky, hned v 2. kapitole je uvedena nesprávná definice základní harmonické složky, kterou student definuje jako „fourierovskou složku o nejnižším absolutním kmitočtu ze všech složek obsažených ve spektru sledovaného zvuku“, což je c0 (nebo a0) a to je stejnosměrná složka.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Splnění požadavků zadání C 15/20
Odborná úroveň práce A 45/50
Interpretace výsledků a jejich diskuse E 10/20
Formální zpracování práce B 8/10
Navrhovaná známka
C
Body
78

eVSKP id 39927