TRNOVSKÁ, E. Vícejazyčná datová sada hlasových deepfakes [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Malinka, Kamil

Při celkovém hodnocení nejvíce zohledňuji dopady výsledků práce, množství odvedené práce na tvorbě datasetu a experimentech a celkové zapojení studentky do realizovaného výzkumu. Studentka při řešení práce postupovala systematicky a velmi dobře si poradila s technickými překážkami. Výborně se také zorientovala v aktuálních vědeckých výsledcích, a hlavně úspěšně vytvořila kvalitní dataset, který umožní další výzkum v této oblasti. Dále kvalitně zrealizovala  a vyhodnotila navržené experimenty. Práce byla po celou dobu pravidelně konzultována, kvalita textu je na výborné úrovni. Pozitivně hodnotím i zpracování v angličtině a účast a zisk ocenění na Excel@FIT. Dávám komisi ke zvážení, zda tuto práci nenavrhnout na jedno z možných ocenění.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Jedná se o bakalářskou práci s výzkumným přesahem. Cílem bylo vytvořit nový dataset obsahující pravou a syntetickou řeč s takovými parametry, aby byl srovnatelný s dosud publikovanými datasety a zároveň umožnil výzkum zaměřený na detekci deepfakes v různých jazycích. Součástí práce byla i realizace vybraných experimentů nad vytvořeným datasetem. Práci hodnotím jako nadprůměrně obtížnou. Studentka splnil všechny body zadání. Detailně analyzovala existující datasety, navrhla parametry nového datasetu, který následně vytvořila. Výsledek je velmi robustní dataset, který je dále využitelný výzkumnou komunitou. Studentka dále navrhla dva experimenty, které následně samostatně realizovala a vyhodnotila.
Práce s literaturou Studentka aktivně vyhledávala relevantní dostupnou literaturu a vhodně ji začlenila do své práce. Vyzdvihuji schopnost obstarat si hůře dostupné datasety přímým kontaktováním autorů.
Aktivita během řešení, konzultace, komunikace Po celou dobu řešení jsme měli pravidelné schůzky, na kterých byly konzultovány dílčí kroky řešení a celkový směr práce. Studentka byla vždy výborně připravena. Byla velmi proaktivní, sama přicházela s konceptem dalšího postupu. 
Aktivita při dokončování Studentka obsah práce konzultovala průběžně a její definitivní obsah mi byl zaslán k připomínkování v dostatečném předstihu. Všechny mé připomínky k práci byly zapracovány. Přestože část komunikace probíhala plně online z důvodu ERASMUS výjezdu, na kvalitě výstupu se to nijak negativně neprojevilo.
Publikační činnost, ocenění Tato bakalářská práce navazuje na téma, které studentka řešila již v rámci projektové praxe. S výsledky z projektové praxe se pak zúčastnila Excel@FIT 2023 a její práce byla oceněna odborným panelem.  Dílčí výsledky bakalářské práce byly zpracovány do článku, který byl poslán na konference INTERSPEECH 2024 (core A). Článek byl zamítnut, nicméně plánujeme jeho obohacení a opětovné podání na vhodnou konferenci.
Navrhovaná známka
A
Body
100

Posudek oponenta

Reš, Jakub

Práce je na vysoké úrovni a přesahuje předpokládané vypracování bakalářské práce. Dílo má vědecký přínos a dosažené výsledky lze dále využít v aktuálně probíhajícím výzkumu.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání
Rozsah splnění požadavků zadání
Rozsah technické zprávy Ačkoliv práce obsahuje přibližně 50 normostran a nesplňuje tak obvyklé rozmezí, po obsahové stránce je zpráva úplná a vzhledem k rozsahu probírané tématiky působí stručnost jako vhodná volba.
Prezentační úroveň technické zprávy 90 Logická struktura zprávy je na vysoké úrovni. Kapitoly práce na sebe plynule navazují. Ojediněle práce obsahuje obtížně srozumitelné úseky, které působí rušivým dojmem a nutí čtenáře k opětovnému čtení.
Formální úprava technické zprávy 90 Po typografické a jazykové stránce je práce na velmi vysoké úrovni. Technická zpráva je psána v anglickém jazyce na akademické úrovni. Ojediněle se zde nachází drobné překlepy či nevhodně využitá slova.
Práce s literaturou 95 Studijní prameny využité v práci jsou převážně formátu vědeckých publikací. Jsou využity aktuální články na relevantní téma. Autor jasně oddělil vlastní práci od citovaných výsledků.
Realizační výstup 95 Realizační výstup bakalářské práce obsahuje vlastní skripty pro úpravy dat, popsané v technické zprávě, označené hlavičkou a komentáři popisujícími fungování částí programu. Mimo skripty obsahuje taktéž použité nástroje včetně úprav originálních zdrojových kódů, které byly použité pro generování syntetické části datové sady. Změny originálních zdrojových kódů jsou jasně odděleny přiloženými soubory s výstupem nástoje diff.
Využitelnost výsledků Výsledky jsou dále využitelné bez jakýchkoliv úprav pro vědecké účely. Práce má taktéž vysoký publikační potenciál, jelikož řeší aktuální a velmi relevantní problém v oblasti hlasové biometrie.
Navrhovaná známka
A
Body
95

Otázky

eVSKP id 154478