GRANÁT, M. Objektivní metody pro hodnocení kvality audiosignálů [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2009.
Zadání bylo ve větší míře splněno, lze jedině vytknout, že vybrané metody pro hodnocení kvality audiosignálu byly v celku jednoduché. Chyběla implementace některé ze sofistikovanějších metod v grafickém prostředí Matlab. Ve formálním zpracování se vyskytují chyby, například zobrazené spektogramy mají převrácenou časovou a kmitočtovou osu, třetí osa (výkonová) není zobrazená vůbec. Student pracoval samostatně. Práci doporučuji k obhajobě a navrhuji známku 78B.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění zadání | B | 40/50 | |
Aktivita během řešení a zpracování práce (práce s literaturou, využívání konzultací, atd.) | C | 15/20 | |
Formální zpracování práce | C | 14/20 | |
Využití literatury | A | 9/10 |
Diplomová práce Michala Granáta pojednává o algoritmech pro hodnocení kvality audiosignálů. Práce je vhodně členěna na kapitoly a jejich části, informační obsah je podle mého názoru na bakalářské úrovni. Práce je psána přehledně a srozumitelně, z jazykové stránky je práce v pořádku až na několik překlepů (Cotriho orgán, Analysys, Measurment, likedhood). Grafické a typografické zpracování je obstojné. Na přiloženém CD jsou k dispozici kódy pro MATLAB a několik zvukových ukázek pro otestování. Vypracování takřka splňuje zadání práce, ale měl bych dvě výhrady: 1/Ačkoliv v textu je zmíněno několik metod, implementovány byly pouze dvě jednodušší a to ještě formou dvou nezávislých programů, což je nevhodné; stačilo udělat jedno rozhraní s přepinačem. 2/ Dále měl student zhodnotit schopnost implementovaných objektivních metod predikovat hodnocení subjektivní. Jeho zhodnocení je velice však povrchní: např. "...môžeme povedať len, že veľmi malé hodnoty WSSM výborně predikujú vysokú kvalitu skúmaného signálu. Naopak veľmi vysoké hodnoty WSSM nám napovedajú, že signál bude silne degradovaný..." V práci bych očekával implementaci více metod a s použitím detektoru řečové aktivity, jehož nepoužití velmi zkresluje některé výsledky (to autor naštěstí ví a dokázal to zdůvodnit). V části 2.1 mi vadí míchání termínů amplituda a výkon a zejména pochybná úloha amplitudy v komunikačních systémech. Slovo likelihood se překládá jako věrohodnost, ne podobnost (str. 22). V sumě v rovnici (3.20) vystupuje index i, který se ovšem ve sčítanci již neobjeví. Podobně v rovnici (3.18) pro index k. Student dále v textu míchá desetinné tečky a čárky. Uvádění času potřebného pro výpočet je u každé nahrávky nadbytečné, protože kvůli různé délce nahrávek jsou ta čísla nesrovnatelná. Význam by mělo vztáhnout tuto dobu např. k jedné sekundě zvukového záznamu. Uváděné spektrogramy mají oproti zvyku prohozené osy. Subjektivní experiment, který proběhl v rámci práce, je popsán velmi stručně a zřejmě nesplňoval tvrdá kritéria kvalitního měření, ale na druhou stranu je třeba uznat, že kvalitně připravený experiment včetně vyhodnocení by vystačil na samostatnou práci. Příloha A, která na 11 stranách obsahuje výpis kódů, je přebytečná. V Příloze B zase chybí popis, jaký SNR mají prezentované nahrávky. V práci není úplně jasné, kdy se autor zužuje pouze na řečové signály a kdy obecně na audio. Za největší slabinu práce považuji implementaci pouze dvou jednodušších metod a bohatší vyhodnocení výsledků. Chybí algoritmy PESQ, PSQM, což pokud správně chápu autora, se snaží v závěru Závěru omluvit tím, že "podrobné popisy algoritmov týchto štandardov nie sú však úplne prístupné". To však není pravda, např. PESQ je k dispozici volně včetně kódu a příkladů.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Splnění požadavků zadání | C | 15/20 | |
Odborná úroveň práce | D | 33/50 | |
Interpretace výsledků a jejich diskuse | D | 13/20 | |
Formální zpracování práce | A | 9/10 |
eVSKP id 21801