BÍLEK, Š. Automatický přepis řeči s podporou code switching [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Celkově byl výkon studenta během řešení práce chabý. Došlo k velké ztrátě času a výsledek byl dokončen ve spěchu. Text práce nebyl konzultován.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Jedná se o průměrně obtížné zadání s dostatkem prostoru pro možné rozšíření. Zadání nebylo splněno podle představ vedoucího. Téma volně navazuje na výzkumné projekty skupiny Speech@FIT . S dosaženými výsledky spokojen nejsem. Práce studenta byla silně nevyvážená a značná aktivita byla až několik týdnů před odevzdáním. Tím chyběl čas potřebný pro řádnou analýzu výsledků a jejich reflektování v bodu 3 zadání. Taktéž došlo ke změně jazyků. | ||
Práce s literaturou | Student literaturu získával samostatně. Zdroje mu byly doporučovány na konzultacích. | ||
Aktivita během řešení, konzultace, komunikace | Aktivita během roku byla nízká. V zimě hrozilo neudělení zápočtu z důvodů skluzu (na konzultacích byl za zimní semestr jen 3x). Prohlášení studenta, že se v letním semestru bude tématu věnovat intenzivněji se nenaplnila. 3x konzultoval během února a začátku března. Další a velmi intenzivní konzultace byly až před odevzdáním v dubnu. Na konzultace chodil víceméně připravený, některá problematika se musela řešit opakovaně. | ||
Aktivita při dokončování | Dokončování a odevzdávání bylo v silném spěchu. Intenzivně jsme řešili experimenty a faktickou náplň práce. Na kontrolu textu nezbyl čas, tudíž nevím v jakém stavu byl text odevzdán. | ||
Publikační činnost, ocenění | Nejsou |
Vzhledem k výše uvedeným poznámkám jsem nabyl dojmu, že ačkoliv se jedná o zajímavé téma, práce není dokončena jak po formální tak i technické stránce.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | |||
Rozsah splnění požadavků zadání | Student měl za úkol se seznámit a pracovat s nástroji ESPnet2 a OpenAI model Whisper. V práci je bohužel použit Whisper. Experimentální část měla být provedena na jazycích: čestina, angličtina a vietnamština. Nicméně v práci je pouze angličtina a němčina. | ||
Rozsah technické zprávy | |||
Prezentační úroveň technické zprávy | 55 | Práce nabývá dojem, že byla napsána na poslední chvíli. Jednotlivé kapitoly jsou chaoticky organizovany. Napríklad v kapitole 2. jsou popsány neuronové sítě, pak způsoby učení, datasety a pak skok zpět na aktivační funkci, což je součást neuronové sítě (NN) a tedy má být popsána současně. Dále podkapitola code-switching, hlavní myšlenka této práce, je opět vložena mezi části NN v kapitole 2. | |
Formální úprava technické zprávy | 30 | V práci se vyskytuje obrovské množství pravopisných chyb a překlepů. Zda se že student to nejen po sobe nečetl, ale ani nepoužil zběžnou kontrolu pravopisu. V textu jsou časté překlepy “y” vs. “z”, Whipser vs. Whisper.... : Například: str.6 výykumný tým. Nebo opět strana 6. věta: ….začátcích nultých let…. nedává smysl (80tých?). Citace jsou zpravidla umístěné za větou misto součást věty: například str 13.: efektivně. [1].... sjednoceny. [15] str.12: použávají str.23: počeet str.25: … učení nastavenám ja jazyk…. výsledeky hypotéze vetčinou … Výčet chyb je samozřejmně mnohem větší... | |
Práce s literaturou | 60 | Hlavní prameny jsou korektně citovány. | |
Realizační výstup | 40 | Experimentální část je opět udělána na rychlo: Ve všech tabulkách i v textu chybí jednotky [%]. Ve všech tabulkách: Tesovací data místo Testovací ….. Nikde není popsán způsob ladění hyper-parametrů procesu trénování modelu. Předpokládám, že všude bylo použito stejné nastavení s pravděpodobně nízkým learning-rate. To by vysvětlovalo malé rozdíly ve výsledcích napříč celou částí (například tabulka 6.1-6.2). Mám tedy i pochybnosti o věrohodnosti výsledků. | |
Využitelnost výsledků | Myšlenka práce, tedy umělé generování dat pro code-switching problém, je opravdu zajímavá. Líbilo se mi zpracování a analýza hledání podobných řečníků pro tvorbu vícejazyčných vět pomocí diarizace. Nicméně práce není plně dokončena. Dále nebyly zpracovány všechny prvky zadání (EspNet), tedy výstup je využitelný pouze částečně. |
eVSKP id 156791