Pair dataset for evaluating differential-based deepfake speech detector

but.committeedoc. Ing. Petr Matoušek, Ph.D., M.A. (předseda) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Jan Pluskal, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorStaněk, Vojtěchen
dc.contributor.authorProkeš, Lukášen
dc.contributor.refereeZhang, Linen
dc.date.created2025cs
dc.description.abstractTato práce se zabývá rostoucí výzvou v oblasti detekce deepfake řeči prostřednictvím návrhu datové sady přizpůsobené diferenčním detekčním metodám, které porovnávají testovanou nahrávku s důvěryhodnou referenční nahrávkou téhož řečníka. Hlavním cílem je zjistit, zda použití párových nahrávek se shodným mluveným obsahem zlepšuje výkonnost detekce. Za tímto účelem byla vytvořena párová datová sada obsahující více než 100 000 nahrávek ve čtyřech jazycích od téměř 200 řečníků. Každá falešná nahrávka je spárována s reálnou nahrávkou téhož řečníka se stejným mluveným obsahem. Bylo vyhodnoceno několik detekčních systémů, včetně konvenčních modelů s jedním vstupem a diferenčních modelů. Výsledky ukazují, že diferenční detekce obecně překonává jednovstupové přístupy, zatímco shoda obsahu vede pouze k mírnému zlepšení, což naznačuje, že diferenční modely dobře generalizují i na nahrávkách s rozdílným mluveným obsahem stejného řečníka.en
dc.description.abstractThis thesis addresses the growing challenge of detecting speech deepfakes by proposing a dataset tailored to differential detection methods, which compare a test utterance with a trusted reference from the same speaker. The main objective is to determine whether using reference–test pairs with identical spoken content improves detection performance. To support this, a pair dataset was created, containing over 100,000 utterances across four languages and nearly 200 speakers. Each fake sample is paired with a real utterance from the same speaker and with identical spoken content. Several detection systems, including both traditional single-input and differential models, were evaluated. Results show that differential detection generally outperforms single-input baselines, while content alignment leads to only a modest improvement, indicating that differential models generalize well across utterances with different spoken content from the same speaker.cs
dc.description.markBcs
dc.identifier.citationPROKEŠ, L. Pair dataset for evaluating differential-based deepfake speech detector [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.cs
dc.identifier.other164806cs
dc.identifier.urihttp://hdl.handle.net/11012/254384
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectpárová datová sada řečien
dc.subjectdetekce deepfakeen
dc.subjectdiferenční detekceen
dc.subjectsyntetická řečen
dc.subjectpřevod textu na řečen
dc.subjectkonverze hlasuen
dc.subjectvyhodnocovací datová sadaen
dc.subjectpaired speech datasetcs
dc.subjectdeepfake detectioncs
dc.subjectdifferential detectioncs
dc.subjectsynthetic speechcs
dc.subjecttext-tospeechcs
dc.subjectvoice conversioncs
dc.subjectevaluation datasetcs
dc.titlePair dataset for evaluating differential-based deepfake speech detectoren
dc.title.alternativePair dataset for evaluating differential-based deepfake speech detectorcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2025-06-19cs
dcterms.modified2025-06-19-17:21:25cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid164806en
sync.item.dbtypeZPen
sync.item.insts2025.08.26 23:59:43en
sync.item.modts2025.08.26 20:23:10en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs

Files

Original bundle

Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
8.81 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_164806.html
Size:
12.06 KB
Format:
Hypertext Markup Language
Description:
file review_164806.html

Collections