BÍLEK, Š. Automatický přepis řeči s podporou code switching [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Szőke, Igor

Celkově byl výkon studenta během řešení práce chabý. Došlo k velké ztrátě času a výsledek byl dokončen ve spěchu. Text práce nebyl konzultován.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Jedná se o průměrně obtížné zadání s dostatkem prostoru pro možné rozšíření. Zadání nebylo splněno podle představ vedoucího. Téma volně navazuje na výzkumné projekty skupiny Speech@FIT . S dosaženými výsledky spokojen nejsem. Práce studenta byla silně nevyvážená a značná aktivita byla až několik týdnů před odevzdáním. Tím chyběl čas potřebný pro řádnou analýzu výsledků a jejich reflektování v bodu 3 zadání. Taktéž došlo ke změně jazyků.
Práce s literaturou Student literaturu získával samostatně. Zdroje mu byly doporučovány na konzultacích.
Aktivita během řešení, konzultace, komunikace Aktivita během roku byla nízká. V zimě hrozilo neudělení zápočtu z důvodů skluzu (na konzultacích byl za zimní semestr jen 3x). Prohlášení studenta, že se v letním semestru bude tématu věnovat intenzivněji se nenaplnila. 3x konzultoval během února a začátku března. Další a velmi intenzivní konzultace byly až před odevzdáním v dubnu. Na konzultace chodil víceméně připravený, některá problematika se musela řešit opakovaně.
Aktivita při dokončování Dokončování a odevzdávání bylo v silném spěchu. Intenzivně jsme řešili experimenty a faktickou náplň práce. Na kontrolu textu nezbyl čas, tudíž nevím v jakém stavu byl text odevzdán.
Publikační činnost, ocenění Nejsou
Navrhovaná známka
E
Body
55

Posudek oponenta

Karafiát, Martin

Vzhledem k výše uvedeným poznámkám jsem nabyl dojmu, že ačkoliv se jedná o zajímavé téma, práce není dokončena jak po formální tak i technické stránce.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání
Rozsah splnění požadavků zadání Student měl za úkol se seznámit a pracovat s nástroji ESPnet2 a OpenAI model Whisper. V práci je bohužel použit Whisper. Experimentální část měla být provedena na jazycích: čestina, angličtina a vietnamština. Nicméně v práci je pouze angličtina a němčina.
Rozsah technické zprávy
Prezentační úroveň technické zprávy 55 Práce nabývá dojem, že byla napsána na poslední chvíli. Jednotlivé kapitoly jsou chaoticky organizovany. Napríklad v kapitole 2. jsou popsány neuronové sítě, pak způsoby učení, datasety a pak skok zpět na aktivační funkci, což je součást neuronové sítě (NN) a tedy má být popsána současně. Dále podkapitola code-switching, hlavní myšlenka této práce, je opět vložena mezi části NN v kapitole 2.
Formální úprava technické zprávy 30 V práci se vyskytuje obrovské množství pravopisných chyb a překlepů. Zda se že student to nejen po sobe nečetl, ale ani nepoužil zběžnou kontrolu pravopisu. V textu jsou časté překlepy “y” vs. “z”, Whipser vs. Whisper.... : Například: str.6 výykumný tým. Nebo opět strana 6. věta: ….začátcích nultých let…. nedává smysl (80tých?). Citace jsou zpravidla umístěné za větou misto součást věty: například str 13.: efektivně. [1].... sjednoceny. [15] str.12: použávají str.23: počeet str.25: … učení nastavenám ja jazyk…. výsledeky hypotéze vetčinou … Výčet chyb je samozřejmně mnohem větší...
Práce s literaturou 60 Hlavní prameny jsou korektně citovány.
Realizační výstup 40 Experimentální část je opět udělána na rychlo: Ve všech tabulkách i v textu chybí jednotky [%]. Ve všech tabulkách: Tesovací data místo Testovací …..   Nikde není popsán způsob ladění hyper-parametrů procesu trénování modelu. Předpokládám, že všude bylo použito stejné nastavení s pravděpodobně nízkým learning-rate. To by vysvětlovalo malé rozdíly ve výsledcích napříč celou částí (například tabulka 6.1-6.2). Mám tedy i pochybnosti o věrohodnosti výsledků.
Využitelnost výsledků Myšlenka práce, tedy umělé generování dat pro code-switching problém, je opravdu zajímavá. Líbilo se mi zpracování a analýza hledání podobných řečníků pro tvorbu vícejazyčných vět pomocí diarizace. Nicméně práce není plně dokončena. Dále nebyly zpracovány všechny prvky zadání (EspNet), tedy výstup je využitelný pouze částečně.
Navrhovaná známka
F
Body
49

Otázky

eVSKP id 156791