Real-time generovanie video deepfakes

Loading...
Thumbnail Image

Date

Authors

Novosád, Denis

Mark

C

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta informačních technologií

ORCID

Abstract

Tato bakalářská práce zkoumá detekci deepfake obsahu v reálném čase pomocí dvou přístupů: automatizované detekce živosti prostřednictvím API FacePlugin a lidského vnímání během videohovorů. Deepfake technologie, založená na pokročilém strojovém učení, se stává stále realističtější a obtížněji odhalitelnou. Výzkum hodnotí výkonnost systému FacePlugin na datové sadě 1 200 snímků vysokého rozlišení generovaných nástrojem DeepFaceLive a analyzuje schopnosti lidí odhalit manipulaci při přirozené konverzaci přes video. Automatizovaný detekční systém vykázal nízkou úspěšnost: pouze 343 z 1 200 snímků (28,7 %) bylo správně klasifikováno. Chybovost při klasifikaci útoků (APCER) dosáhla 97,3 % a průměrná míra chyb (ACER) činila 71,2 %. V experimentu s účastníky správně odhalilo manipulaci pouze 8 z 30 osob (26,7 %) v experimentální skupině, zatímco v kontrolní skupině nevyjádřil podezření nikdo. Výsledky odhalují zásadní omezení jak algoritmických, tak lidských detekčních přístupů a zdůrazňují potřebu multimodálních a kontextově citlivých strategií, které kombinují časovou analýzu, behaviorální signály a vzdělávání uživatelů k účinnému rozpoznávání syntetických médií.
This bachelor’s thesis investigates the detection of real-time deepfake content using both an automated liveness detection API (FacePlugin) and human observation during live video calls. Deepfake technology, powered by advanced machine learning methods, is becoming increasingly realistic and difficult to detect. The research evaluates the performance of the FacePlugin system on a dataset of 1,200 high-resolution screenshots generated via DeepFaceLive, and analyzes human detection capabilities based on a structured experiment with 45 participants. The automated detection system demonstrated poor performance: only 343 out of 1,200 images (28.7%) were correctly classified, with an Attack Presentation Classification Error Rate (APCER) of 97.3% and an Average Classification Error Rate (ACER) of 71.2%. In the human experiment, just 8 out of 30 participants (26.7%) in the experimental group correctly identified the deepfake manipulation, while none in the control group reported suspicion. The results reveal significant limitations in both algorithmic and human detection approaches. They underscore the need for multimodal and context-aware strategies, combining temporal analysis, behavioral cues, and user education to effectively counter the growing threat of synthetic media.

Description

Citation

NOVOSÁD, D. Real-time generovanie video deepfakes [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.

Document type

Document version

Date of access to the full text

Language of document

en

Study field

Informační technologie

Comittee

doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Jan Pluskal, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen)

Date of acceptance

2025-06-19

Defence

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO