ALAKAEV, K. Metody tvorby hlasových deepfakes v reálném čase [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Malinka, Kamil

Práce splnila všechny body zadání, kdy student dobře zvládl jednotlivé fáze. Kvalita textu je na dobré úrovni. Výsledná implementace je kreativně uchopená. Velmi dobře ukazuje, jak útočník dokáže ohýbat aktuální řešení ke své potřebě. Nástroj již byl použit v některých vzdělávacích kampaních v oblasti bezpečnostních dopadů deepfakes. Pozitivně hodnotím zpracování práce v angličtině. Škoda je, že student ještě nezvládl zapracovat i metody pro konverzi hlasu, nicméně to už by bylo hodně nad rámec zadání. 

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Jedná se o průměrně obtížnou práci výzkumného charakteru, která navazuje na výzkum v rámci skupiny Security@FIT. Práce měla několik cílů: zjistit aktuální možnosti nástrojů ohledně generování deepfake hlasu v reálném čase, analyzovat parametry, které jsou pro proces zásadní a na základě zjištění navrhnout a implementovat aplikaci, která se co nejvíce syntéze v reálném čase přiblíží. Součástí bylo i testování nástroje. Student splnil všechny body zadání v dobré kvalitě.
Práce s literaturou Student aktivně vyhledával relevantní dostupnou literaturu a vhodně ji začlenil do své práce.
Aktivita během řešení, konzultace, komunikace Student na práci začal pracovat již v rámci semestrálního projektu, který práci předcházel. Po celou dobu řešení práce jsme měli pravidelné schůzky, na kterých byly konzultovány dílčí kroky řešení a celkový směr práce. 
Aktivita při dokončování Student obsah práce konzultoval průběžně a její definitivní obsah mi byl zaslán k připomínkování v dostatečném předstihu. Všechny mé připomínky k práci byly zapracovány.
Publikační činnost, ocenění Student se zúčastnil Excel@FIT.
Navrhovaná známka
B
Body
80

Posudek oponenta

Pleško, Filip

Študent správne pracoval s existujúcov literatúrov, naštudoval problém a navrhol riešenie. Až na pár drobných formálnych nedostatkov v práci, ktoré už boli spomennuté, sa jedná o kvalitne vypracovanú prácu. Výsledky tejto práce je možé ďalej využiť.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Zadanie hodnotím ako náročnejšie, kedže na vytvorenie kvalitnej aplikácie bolo potrebné detailne pochopiť a upraviť aktuálne existujúce riešenia.
Rozsah splnění požadavků zadání Zadanie splneno v plnom rozsahu bez žiadnych výhrad.
Rozsah technické zprávy
Prezentační úroveň technické zprávy 85 Text je písaný zrozumiteľne, s dobre nadväzujúcimi sekciami na seba. Výhradu mám ku kapitole číslo 3. Príde mi nadbytočná, jej obsah mohol byť zahrnutý v samotnom úvode.
Formální úprava technické zprávy 90 Práca je písaná peknou angličtinou, ľahko čitateľná a zrozumiteľná. Menšia výhrada smeruje k tomu, ako autor referuje v práci sám seba. Jedná sa o oslovenie "The author did ...", čo potom znie, ako keby autor vykonal praktickú časť a teóriu písala tretia strana. Ďalšou chybou je, že práca obsahuje zadanie v CZ jazyku, aj napriek tomu že je písaná v angličtine.
Práce s literaturou 100 Študent si vyhľadal odbornú literatúru súvisiacu s prácou, ktorú následne správne citoval v texte.
Realizační výstup 95 Študent mi osobne odprezentoval funkčnú aplikáciu. Jedná sa o jednoduchú GUI aplikáciu s možnosťou vybrať model a vložiť text, z ktorého je vygenerovaný hlas. Veľkou výhodou tejto aplikácie je, že je možné zadávať text počas toho ako práve generuje hlas. V prípade že stíhame dostatočne rýchlo písať vstup, aplikácie generuje umelo vytvorený hlas v reálnom čase.
Využitelnost výsledků Práca správne identifikovala nedostatky existujúcich nástrojov pri tvorbe hlasových DeepFakes v reálnom čase. Tieto nedostatky boli odstránené, čím bolo rozšírené existujúce riešenie o možnosť kontinuálneho generovania hlasu. Takúto aplikáciu je ďalej možno využívať pre výskum a vzdelávanie v tejto oblasti.
Navrhovaná známka
A
Body
90

Otázky

eVSKP id 154458