Tvorba nové deepfake datové sady

but.committeedoc. Dr. Ing. Otto Fučík (předseda) Mgr. Kamil Malinka, Ph.D. (člen) Ing. Vojtěch Mrázek, Ph.D. (člen) Ing. Libor Polčák, Ph.D. (člen) Ing. David Bařina, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorFirc, Antonen
dc.contributor.authorSztolarik, Marošen
dc.contributor.refereeHomoliak, Ivanen
dc.date.created2024cs
dc.description.abstractV posledných rokoch deepfake technológia postúpila do bodu kedy je schopná uveriteľne napodobniť ľudský hlas, čím predstavuje významné výzvy v rozslišovaní medzi skutočnými a syntetickými hlasmi. V tejto práci predstavujeme novú dátovú sadu obsahujúcu deepfake reč generovanú pomocou difúznych modelov. Táto dátová sada, vytvorená s pomocou dvoch sofistikovaných nástrojov pre prevod textu na reč, DiffSpeech a ProDiff, mieri poskytnúť náhľad do hrozby tieto nové nástroje predstavujú. Dve ďaľšie dátové sady sú vytvorené s viac vyspelými nástrojmi pre poskytnutie bodu porovnania. Potom sú všetky vygenerované vzorky analyzované dvomi deepfake detektormi pre priame porovnanie akú veľkú hrozbu každý nástroj predstavuje. Výsledky ukazujú, že aj keď nástroje ktoré využívajú difúzne modely predstavujú hrozbu, použitie difúznych modelov neposkytlo týmto nástrojom nijakú významnú výhodu vo vyhýbaní sa detekcii.en
dc.description.abstractIn the recent years, deepfake technology has advanced to a point where it can convincingly mimic human speech, posing significant challenges in distinguishing between real and synthetic voices. In this thesis, we introduce a novel dataset comprising speech deepfakes generated using diffusion models. This dataset, created with two sophisticated text-to-speech tools, DiffSpeech and ProDiff, aims to provide insight into the threat that these new tools pose. Two more datasets are created with more mature tools, Glow-TTS and Tacotron2, to provide a point of comparison. Then all the generated samples are analyzed through two deepfake detectors in order to provide a direct comparison into how much of a threat each tool is to these detectors. The results show that even though the tools utilizing the diffusion models are threatening, the use of diffusion models did not provide these tools any meaningful advantage in evading the detection.cs
dc.description.markBcs
dc.identifier.citationSZTOLARIK, M. Tvorba nové deepfake datové sady [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.cs
dc.identifier.other153353cs
dc.identifier.urihttp://hdl.handle.net/11012/248199
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectDifúzne modelyen
dc.subjectDeepfakeen
dc.subjectstrojové učenieen
dc.subjectprevod textu na rečen
dc.subjectLJSpeechen
dc.subjectDiffusion Modelscs
dc.subjectDeepfakecs
dc.subjectMachine learningcs
dc.subjectText-to-Speechcs
dc.subjectLJSpeechcs
dc.titleTvorba nové deepfake datové sadyen
dc.title.alternativeCreating Novel Deepfake Speech Datasetcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2024-06-14cs
dcterms.modified2024-06-17-08:45:56cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid153353en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 21:01:56en
sync.item.modts2025.01.15 16:48:31en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.93 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_153353.html
Size:
8.59 KB
Format:
Hypertext Markup Language
Description:
file review_153353.html
Collections