REZEK, V. Rozpoznání a klasifikace emocí v hudbě a v řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2023.
Přístup studenta k řešení úkolů souvisejících s bakalářskou prací byl velice vágní. Na jednu stranu si cením jeho snahu o samostatnost při řešení této poměrně obtížné a časově náročné úlohy, na druhou stranu je zarážející jeho nezájem o odbornou konzultaci, která mohla, podle mého názoru velmi zlepšit vlastní práci i její hodnocení. Bakalářská práce byla časově i organizačně náročná. U nahrávek emocionální řeči se kvůli legálnosti nahrávek nejednalo o spontánní emocionální řeč, ale o hrané emoce, na kterých se podílelo 10 mluvčích obou pohlaví. Problém vidím v tom, že celá řečová databáze se skládala pouze z izolovaných slov, kde se emoce vyskytují velice málo. Chybí víceslovné promluvy. Hudební databáze je vytvořena mnohem profesionálněji. Pan Rezek si vybral 6 emocí v řečovém projevu, se kterými však nepracuje stále, ale tento počet emocí snižuje. Základem byly vztek, strach, štěstí, smutek, nuda a neutrální promluva. V části věnované hudebním nahrávkám se zaměřil na 5 emocí, oproti řečové databázi nesledoval vyjádření smutku v hudbě. Cílem práce byla klasifikace těchto emocí pomocí umělých neuronových sítí, konkrétně pomocí SOM, resp. KSOM (Kohonenových map). Pro natrénování a otestování získaných výsledků bylo použito, v souladu se zadáním, programové prostředí MATLAB, konkrétně toolbox Classification Learner. Práce má 64 stran členěných do 8 kapitol, které tvoří obsah, abstrakt, klíčová slova, seznam obrázků a soupis použitých publikačních pramenů. Teoretická část obsahuje 46 stran, praktická 17 stran. Seznam prostudovaných publikací (18) odpovídá požadavkům na tento typ závěrečné práce. Pan Rezek se velmi dobře vypořádal s předzpracováním získaných hudebních nahrávek, méně už s nahrávkami řečovými a s aplikacemi UNS. Problematice KSOM se věnoval pouze na 7 stránkách (podle zadání to měla být stěžejní část). Chybí zpracování pomocí vizualizace map, což je hlavní výhoda tohoto typu UNS. Úroveň celé bakalářské práce je podle mého soudu nevyvážená, a to jak z pohledu řešení zadaných úkolů, tak i způsobem prezentace. V práci se vyskytují drobné překlepy, které však nesnižují úroveň práce. K jazykové stránce mám ale dosti připomínek. Velmi často používá výrazy hodící se do beletrie, ale ne pro technické zprávy (např. pár stovek vzorků, oslnivé výsledky, data jsou předhazována, zcela ukradená hudba apod.). Pan Rezek konzultoval velmi sporadicky (pouze 2 elektronické kontakty) vlastní náplň práce, metody řešení, svoje dosažené výsledky. Bez vědomí vedoucí práce konzultoval s mně neznámým doktorandem, což podle mého mínění vedlo k velkým nepřesnostem, často i chybám v řešení jeho bakalářské práce (zejména v oblasti teorie a aplikací UNS). Svojí bakalářskou práci v konečném znění poslal 24. 5. 2022, jako vedoucí práce jsem neměla možnost bakalářskou práci pana Rezka vést, ani korigovat. Požadavky zadání byly splněny pouze částečně. Dosažené výsledky jsou, u hudební části, velmi zajímavé pro hudebníky. O části vztažené ke klasifikaci emocí v řeči to však říci nelze. Přes všechny nedostatky a výtky, které mám jak k obsahu a zpracování bakalářské práce, tak ke komunikaci se studentem, ji doporučuji k obhajobě. Budu však požadovat podrobnější vysvětlení nepřesností a chyb u části vztahující se ke klasifikaci emocí v řeči.
Bakalářská práce má 68 stran textu, je rozdělena do 8 kapitol včetně úvodu a závěru, obsahuje souhrn literatury, seznam symbolů a zkratek, další závěr a jednu přílohu. Zabývá se analýzou emocí řeči a hudby. Grafická úroveň práce není dobrá. Některé obrázky mají sotva rozpoznatelný popis (obr. 7.1, obr. 7.4, obr. 7.9), autor nevyužívá efektivně rozlohu stránky (jsou zde zbytečně prázdná místa) a nepoužívá správnou terminologii. Například si plete pojmy amplituda, intenzita, modul a výkonová spektrální hustota. Na obr. 4.3 je uvedena jednotka anglického termínu „magnitude“ s jednotkou dBV^2? V kapitole 4.3.4 popisuje lineární predikci velmi nestandardním způsobem. Jeho znalosti zpracování signálu jsou velmi špatné. Také jeho vyjadřování není mnohdy technické („hudba mu je zcela ukradená“, „neuron je takový kurýr rozvážející zásilky plné informací“, „parametrizace hudby mě dohnaly k mnohým nápadům“ apod.). Škoda, že jako muzikant nevyužil dobré příležitosti a nevěnoval se solidně zajímavému tématu vyjádření emocí v hudbě. Je zřejmé, že praktická část byla dosti pracná a časově náročná. Proto lze konstatovat, že základní zadání autor splnil.
eVSKP id 152876