TRNOVSKÁ, E. Vícejazyčná datová sada hlasových deepfakes [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.
Při celkovém hodnocení nejvíce zohledňuji dopady výsledků práce, množství odvedené práce na tvorbě datasetu a experimentech a celkové zapojení studentky do realizovaného výzkumu. Studentka při řešení práce postupovala systematicky a velmi dobře si poradila s technickými překážkami. Výborně se také zorientovala v aktuálních vědeckých výsledcích, a hlavně úspěšně vytvořila kvalitní dataset, který umožní další výzkum v této oblasti. Dále kvalitně zrealizovala a vyhodnotila navržené experimenty. Práce byla po celou dobu pravidelně konzultována, kvalita textu je na výborné úrovni. Pozitivně hodnotím i zpracování v angličtině a účast a zisk ocenění na Excel@FIT. Dávám komisi ke zvážení, zda tuto práci nenavrhnout na jedno z možných ocenění.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Informace k zadání | Jedná se o bakalářskou práci s výzkumným přesahem. Cílem bylo vytvořit nový dataset obsahující pravou a syntetickou řeč s takovými parametry, aby byl srovnatelný s dosud publikovanými datasety a zároveň umožnil výzkum zaměřený na detekci deepfakes v různých jazycích. Součástí práce byla i realizace vybraných experimentů nad vytvořeným datasetem. Práci hodnotím jako nadprůměrně obtížnou. Studentka splnil všechny body zadání. Detailně analyzovala existující datasety, navrhla parametry nového datasetu, který následně vytvořila. Výsledek je velmi robustní dataset, který je dále využitelný výzkumnou komunitou. Studentka dále navrhla dva experimenty, které následně samostatně realizovala a vyhodnotila. | ||
Práce s literaturou | Studentka aktivně vyhledávala relevantní dostupnou literaturu a vhodně ji začlenila do své práce. Vyzdvihuji schopnost obstarat si hůře dostupné datasety přímým kontaktováním autorů. | ||
Aktivita během řešení, konzultace, komunikace | Po celou dobu řešení jsme měli pravidelné schůzky, na kterých byly konzultovány dílčí kroky řešení a celkový směr práce. Studentka byla vždy výborně připravena. Byla velmi proaktivní, sama přicházela s konceptem dalšího postupu. | ||
Aktivita při dokončování | Studentka obsah práce konzultovala průběžně a její definitivní obsah mi byl zaslán k připomínkování v dostatečném předstihu. Všechny mé připomínky k práci byly zapracovány. Přestože část komunikace probíhala plně online z důvodu ERASMUS výjezdu, na kvalitě výstupu se to nijak negativně neprojevilo. | ||
Publikační činnost, ocenění | Tato bakalářská práce navazuje na téma, které studentka řešila již v rámci projektové praxe. S výsledky z projektové praxe se pak zúčastnila Excel@FIT 2023 a její práce byla oceněna odborným panelem. Dílčí výsledky bakalářské práce byly zpracovány do článku, který byl poslán na konference INTERSPEECH 2024 (core A). Článek byl zamítnut, nicméně plánujeme jeho obohacení a opětovné podání na vhodnou konferenci. |
Práce je na vysoké úrovni a přesahuje předpokládané vypracování bakalářské práce. Dílo má vědecký přínos a dosažené výsledky lze dále využít v aktuálně probíhajícím výzkumu.
Kritérium | Známka | Body | Slovní hodnocení |
---|---|---|---|
Náročnost zadání | |||
Rozsah splnění požadavků zadání | |||
Rozsah technické zprávy | Ačkoliv práce obsahuje přibližně 50 normostran a nesplňuje tak obvyklé rozmezí, po obsahové stránce je zpráva úplná a vzhledem k rozsahu probírané tématiky působí stručnost jako vhodná volba. | ||
Prezentační úroveň technické zprávy | 90 | Logická struktura zprávy je na vysoké úrovni. Kapitoly práce na sebe plynule navazují. Ojediněle práce obsahuje obtížně srozumitelné úseky, které působí rušivým dojmem a nutí čtenáře k opětovnému čtení. | |
Formální úprava technické zprávy | 90 | Po typografické a jazykové stránce je práce na velmi vysoké úrovni. Technická zpráva je psána v anglickém jazyce na akademické úrovni. Ojediněle se zde nachází drobné překlepy či nevhodně využitá slova. | |
Práce s literaturou | 95 | Studijní prameny využité v práci jsou převážně formátu vědeckých publikací. Jsou využity aktuální články na relevantní téma. Autor jasně oddělil vlastní práci od citovaných výsledků. | |
Realizační výstup | 95 | Realizační výstup bakalářské práce obsahuje vlastní skripty pro úpravy dat, popsané v technické zprávě, označené hlavičkou a komentáři popisujícími fungování částí programu. Mimo skripty obsahuje taktéž použité nástroje včetně úprav originálních zdrojových kódů, které byly použité pro generování syntetické části datové sady. Změny originálních zdrojových kódů jsou jasně odděleny přiloženými soubory s výstupem nástoje diff. | |
Využitelnost výsledků | Výsledky jsou dále využitelné bez jakýchkoliv úprav pro vědecké účely. Práce má taktéž vysoký publikační potenciál, jelikož řeší aktuální a velmi relevantní problém v oblasti hlasové biometrie. |
eVSKP id 154478