Implementace detektoru deepfake řeči
Loading...
Date
Authors
Fiedler, Simon Tomáš
Advisor
Referee
Mark
D
Journal Title
Journal ISSN
Volume Title
Publisher
Vysoké učení technické v Brně. Fakulta informačních technologií
ORCID
Abstract
Tato bakalářská práce see zaměřuje na deepfake řeči a jejich detekci. Cílem bylo vytvořit detekční systém s použitelným uživatelským rozhraním a model vytvořeným pomocí stro- jové učení, který je schopen rozlišovat mezi reálnými a podvrženými nahrávkami. Data pro trénování tohoto modelu pocházejí z vícero datasetů, pro lepší generalizaci modelu. Každý audio soubor je transformován do Mel-spektrogramu a poté analyzován. Rozhraní systému bylo testováno s uživateli, aby byla zajištěna dobrá uživatelská zkušenost a použitelnost. Model byl testován na různých datasetech, na kterých model nebyl testován, aby se ukázalo, jak dobře bude pracovat s daty, která ještě nikdy neviděl.
This thesis deals with deepfake speech and its detection. The aim was to create a detection system with a functional user interface and a machine learning model, which is capable of distinguishing between spoofed and bona fide audio samples. The data used to train this model came from various datasets so as not to end up overfitting the model. Each audio file is transformed into a Mel-spectrogram for analysis. The frontend of the system was tested with users to ensure a good user experience and usability. The model was tested on various datasets different from the ones it was trained on to see how well it performs on never-before-seen data.
This thesis deals with deepfake speech and its detection. The aim was to create a detection system with a functional user interface and a machine learning model, which is capable of distinguishing between spoofed and bona fide audio samples. The data used to train this model came from various datasets so as not to end up overfitting the model. Each audio file is transformed into a Mel-spectrogram for analysis. The frontend of the system was tested with users to ensure a good user experience and usability. The model was tested on various datasets different from the ones it was trained on to see how well it performs on never-before-seen data.
Description
Keywords
Citation
FIEDLER, S. Implementace detektoru deepfake řeči [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.
Document type
Document version
Date of access to the full text
Language of document
en
Study field
Informační technologie
Comittee
doc. Ing. Ondřej Ryšavý, Ph.D. (předseda)
Ing. Tomáš Milet, Ph.D. (člen)
Ing. Marcela Zachariášová, Ph.D. (člen)
Ing. Filip Orság, Ph.D. (člen)
doc. RNDr. Dana Hliněná, Ph.D. (člen)
Date of acceptance
2025-06-18
Defence
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm D.
Result of defence
práce byla úspěšně obhájena
