SZTOLARIK, M. Tvorba nové deepfake datové sady [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.

Posudky

Posudek vedoucího

Firc, Anton

Student splnil všechny body zadání alespoň v minimálním rozsahu. Zadání bylo poněkud náročnější a vzhledem k práci s vícero pokročilými technologiemi bylo potřeba více konzultací k pohcopení a zpracování jednotlivých experimentů. Ve výsledku student naplnil požadované výstupy práce.

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Informace k zadání Zadání této bakalářské práce bylo poněkud náročnější a vyžadovalo vyšší míru samostatnosti. Student splnil všechny požadavky zadání alespoň v minimálním rozsahu.
Práce s literaturou Student zpracoval doporučenou literaturu a sám vyhledával a použil další relevantní zdroje.
Aktivita během řešení, konzultace, komunikace Komunikace probíhala pravidelně formou konzultací. Občas jsme se vraceli k již konzultovaným tématům a byla potřeba větší technická pomoc pro pokračování v práci.
Aktivita při dokončování Práce byla dokončena v dostatečném předstihu a všechny připomínky byly zapracovány.
Publikační činnost, ocenění Publikační činnost není známa.
Navrhovaná známka
C
Body
72

Posudek oponenta

Homoliak, Ivan

Prácu hodnotím stupňom B veľmi dobre keďže študent vytvoril realizačný výstup, ktorý je využiteľný vo výskume a testovaní deepfake detektorov reči. študent spracoval peknú technickú správu. Otázky k obhajobe: 1) Aké iné metriky je možné použiť na evaluáciu výkonnosti deepfake detektorov? 2) Aké sú možné dôvody prečo difúzne modely neboli efektívnejšie ako štandardné modely a aké sú možnosti ich ďalšieho vylepšenia?

Dílčí hodnocení
Kritérium Známka Body Slovní hodnocení
Náročnost zadání Cieľom zadania bolo otestovať možnosti použitia difúznych modelov pre tvorbu deepfake syntetizovanej reči.
Rozsah splnění požadavků zadání Zadanie bolo splnené vo všetkých bodoch.
Rozsah technické zprávy Bakalárska práca má približne 57 normostrán textu, po započítaní obrázkov je to 63.
Prezentační úroveň technické zprávy 90 Práca má primeraný počet kapitol, ktoré na seba nadväzujú a ich rozsahy sú prípustné. Text niekedy obsahuje informácie, ktoré sa zdajú byť irelevantné k téme práce a pôsobia rušivým dojmom. Príkladom je popis mnohých prístupov strojového učenia v sekcii 2.1. 
Formální úprava technické zprávy 80 Z jazykového a typografického hľadiska je práca na vysokej úrovni. Miestami sa vyskytujú nezrovnalosti medzi názvami obrázkov, tabuliek a ich odkazmi v texte. Na strane 7 je citácia nevhodne zalomená. Preklepy a pravopisné chyby sa vyskytujú v práci ojedinele. V úvode sa nesprávne referuje na kapitoly poradovými číslami a s malým počiatočným písmenom. Referencie na názvy obrázkov v anglickom texte sú tiež nesprávne malými počiatočnými písmenami.
Práce s literaturou 85 Práca obsahuje 43 referencií, no z toho je poznateľných len 5-6 publikovaných článkov alebo kapitol. Ak sú medzi nimi skryté ďalšie, tak to pre nekompletnosť bibliografických informácií nie je poznať. Ostatné referencie sú online charakteru.
Realizační výstup 85 V rámci práce bol vytvorený unikátny dataset. Návrh datasetu je založený na osvedčených postupoch. Testovanie sa tiež vykonávalo systematicky podľa štandardných postupov. V práci boli použité existujúce nástroje na syntézu reči a detekciu hlasových deepfake.   Metriky na hodnotenie výkonnosti nástroja na detekciu deepfakes možno neboli zvolené najvhodnejšie. Na testovanie technológie biometrickej identifikácie/overovania sa používajú metriky miery falošnej zhody/ miery falošnej nezhody. Táto skutočnosť však nepredstavuje zásadný problém pre výsledky tejto práce.
Využitelnost výsledků Výsledky práce sú použiteľné a môžu mať prínos vo výskume.
Navrhovaná známka
B
Body
89

eVSKP id 153353