NEVAŘILOVÁ, V. Automatický přepis řeči letecké komunikace do textu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Szőke, Igor

Průběh řešení projektu byl plynulý a studentce se podařilo dosáhnout zajímavých výsledků. Ty byly zveřejněny a je předpoklad, že na ně budeme v rámci výzkumu navazovat. Celkově se z pohledu vedoucího jedná o nadprůměrnou práci.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Jedná se o průměrně obtížné zadání s dostatkem prostoru pro možné rozšíření. Zadání bylo splněno. Téma volně navazuje na výzkumné projekty skupiny Speech@FIT a projektu ATCO2. S dosaženými výsledky jsem spokojen. Studentka byla schopna díky svým zkušenostem v letectví připravit cenný dataset, natrénovat a publikovat český rozpoznávač letecké komunikace.
Práce s literaturou Studentka literaturu získávala samostatně a aktivně.
Aktivita během řešení, konzultace, komunikace Studentka konzultovala pravidelně každých 14 dní. Byla vždy připravena a předvedla pokrok. S vedoucím detailně diskutovala další kroky.
Aktivita při dokončování Aktivita při dokončování byla poklidná, text byl dodán ke kontrole cca 2 týdny před odevzdáním. Bylo navrženo několik úprav struktury a jazyka. Po zapracování připomínek byl text ještě jednou zkontrolován vedoucím. Experimenty byly dokončeny v čas.
Publikační činnost, ocenění Práce byla publikována na Excel@FIT . Natrénované modely byly zveřejněny na platformě HuggingFace k volnému použití.
Navrhovaná známka
B
Body
88

Posudek oponenta

Veselý, Karel

Velmi pečlivě zpracovaná práce, s dobře využitelnými výstupy. Hodnotím tedy "A".

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Časově i znalostně náročná byla práce s daty (přepisy, příprava) i experimenty s dotrénováním ASR modelu Whisper pro českou leteckou komunikaci.
Rozsah splnění požadavků zadání Zadání bylo v plném rozsahu splněno.
Rozsah technické zprávy Práce je informačně bohatá, soustředí se na podstatné informace.
Prezentační úroveň technické zprávy 95 Prezentační úroveň je vysoká, kapitoly na sebe logicky navazují. "Letecké" části jsou výstižně popsány. Dále bych chtěl vyzdvihnout stručný a dobře srozumitelný popis architektury Transformer. Práce byla úspěšně prezentována na soutěži Excel.
Formální úprava technické zprávy 90 Práce je typograficky zdařilá a autorka používá bohatý slovník. Celkově se práce dobře čte.
Práce s literaturou 95 Práce bohatě cituje zejména vědecké člnánky, ale i příručku ŘLP.
Realizační výstup 90 Programový kód je přehledně rozdělený do složek a vhodně zdokumentovaný. Rozpoznávač byl předveden na osobní schůzce. Rozpoznávač zvládá i velmi rychlou řeč, typickou pro leteckou komunikaci.
Využitelnost výsledků Využitelné jsou výsledné ASR modely, které jsou veřejně dostupné na HuggingFace. Dále je interně využitelná vzniklá databáze přepsaných nahrávek.
Navrhovaná známka
A
Body
95

eVSKP id 150718