HRUŠOVSKÝ, E. Automatická klasifikace výslovnosti hlásky R [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2018.

Posudky

Posudek vedoucího

Harabiš, Vratislav

Student se ve své práci zabýval možnostmi klasifikace výslovnosti hlásky R. Práce byla vytvořená ve spolupráci s klinikou LOGO. Student k práci přistupoval spíše s nižší aktivitou. Konzultací příliš nevyužíval. To se bohužel projevilo i na výsledcích práce, kdy navržené řešení nedává příliš dobré výsledky. Pravidelnější konzultace by mohly vést na podrobnější analýzu příznaků a vylepšení rozpoznávacích schopností algoritmu. Nicméně kladně hodnotím, že si student zajistil na klinice LOGO dostatek nahrávek, které lze využít pro trénování i testování. Dosažené výsledky rovněž správně vyhodnotil. I přes uvedené nedostatky považuji zadání práce za převážně splněné.

Navrhovaná známka
D
Body
65

Posudek oponenta

Vičar, Tomáš

Diplomová práce se zabývá klasifikací správnosti výslovnosti hlásky „R“. V teoretické části práce je popsána tvorba řeči a poruchy výslovnosti, používané metody extrakce příznaků a používané klasifikátory. V praktické části jsou pak využity mel-frekvenční kepstrální koeficienty jako příznaky pro klasifikaci pomocí neuronové sítě. Ze stylistického hlediska nejsou dodrženy předepsané okraje stran, úvodní strana je černobílá a na straně 32 je použit odlišný formát písma. Popisy tabulek jsou umístěny pod tabulkami. Text v mnohých grafech je nečitelný a graf na obrázku 7.7 je nevhodně vykreslený spojitou křivkou. Rozdělení řazení kapitol je příliš podrobné a zcela nepřehledné, kde smysl některých kapitol není zřejmý (např. kapitoly 6.4.5 a 5.1.2). U mnohých rovnic chybí popis proměnných (1.1, 4.1, 4.3 a 5.18), nebo je tento popis chybný (5.2 a 6.4). Zcela nesmyslné je pak představení rovnic 6.7 a 6.18. Velmi nevhodné je také použití souhrnu citací až za celou kapitolou, což výrazně komplikuje hledání původních zdrojů, nehledaně na to, že mnohdy citovaný zdroj není vůbec využit jako v případě kapitol 6.1 a 6.2 (reference [3] a [22]). U mnohých převzatých obrázků chybí citace, kde nejsou ani součástí citací na konci kapitoly (např. obr. 5.2, 6.2 a 6.4). Chybí také odkazy na mnohé obrázky v textu. Práce obsahuje také celou řadu nepravdivých výroků a chybných popisů, které zřejmě značí výraznou neznalost autora. Autor zbytečně popisuje dobře známé věci jako je Fourierova transformace na úkor stručného popisu specifické problematiky, které je tak často zcela nesrozumitelná (např. kapitola 5.4). Část práce s výsledky je také velmi špatně srozumitelná, a tvoří ji pouze 16 stran ze 70 s velkým množstvím, často zbytečných, obrázků (zcela postrádám význam vložení obrázků 7.10, 7.16 a 7.19). Chybí shrnutí databáze dat a je pak nejasný smysl jednotlivých podkapitol výsledků. Velmi nevhodný je také popis jednotlivých skriptů namísto popisu metody samotné. Po praktické stránce je práce také velmi slabá, neboť velká část použitého kódu je převzatá, kde autor vytvořil pouze jednoduché předzpracování a naučil neuronovou síť s výchozím nastavením. Autor se nesnažil nijak optimalizovat nastavení extrakce příznaků ani nastavení neuronové sítě a nepokusil se využít jiné z popsaných příznaků či klasifikátorů. Sám autor popisuje dosažené výsledky jako nedostačující bez snahy o zlepšení nebo popisu možností zlepšení. Předpokládám, že část zadání 7 (kapitola 8) by měla využívat vytvořený klasifikátor, avšak autor uvádí pouze obecné logopedické rady pro procvičování výslovnosti hlásky „R“. Autor čerpá z velmi omezeného množství převážně české a zastaralé literatury. I přes uvedené nedostatky práci doporučuji k obhajobě a hodnotím stupněm E (57 bodů).

Navrhovaná známka
E
Body
57

Otázky

eVSKP id 110590