Pair dataset for evaluating differential-based deepfake speech detector

Prokeš, Lukáš

Pair dataset for evaluating differential-based deepfake speech detector

but.committee	doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Jan Pluskal, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.	cs
but.jazyk	angličtina (English)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Staněk, Vojtěch	en
dc.contributor.author	Prokeš, Lukáš	en
dc.contributor.referee	Zhang, Lin	en
dc.date.created	2025	cs
dc.description.abstract	Tato práce se zabývá rostoucí výzvou v oblasti detekce deepfake řeči prostřednictvím návrhu datové sady přizpůsobené diferenčním detekčním metodám, které porovnávají testovanou nahrávku s důvěryhodnou referenční nahrávkou téhož řečníka. Hlavním cílem je zjistit, zda použití párových nahrávek se shodným mluveným obsahem zlepšuje výkonnost detekce. Za tímto účelem byla vytvořena párová datová sada obsahující více než 100 000 nahrávek ve čtyřech jazycích od téměř 200 řečníků. Každá falešná nahrávka je spárována s reálnou nahrávkou téhož řečníka se stejným mluveným obsahem. Bylo vyhodnoceno několik detekčních systémů, včetně konvenčních modelů s jedním vstupem a diferenčních modelů. Výsledky ukazují, že diferenční detekce obecně překonává jednovstupové přístupy, zatímco shoda obsahu vede pouze k mírnému zlepšení, což naznačuje, že diferenční modely dobře generalizují i na nahrávkách s rozdílným mluveným obsahem stejného řečníka.	en
dc.description.abstract	This thesis addresses the growing challenge of detecting speech deepfakes by proposing a dataset tailored to differential detection methods, which compare a test utterance with a trusted reference from the same speaker. The main objective is to determine whether using reference–test pairs with identical spoken content improves detection performance. To support this, a pair dataset was created, containing over 100,000 utterances across four languages and nearly 200 speakers. Each fake sample is paired with a real utterance from the same speaker and with identical spoken content. Several detection systems, including both traditional single-input and differential models, were evaluated. Results show that differential detection generally outperforms single-input baselines, while content alignment leads to only a modest improvement, indicating that differential models generalize well across utterances with different spoken content from the same speaker.	cs
dc.description.mark	B	cs
dc.identifier.citation	PROKEŠ, L. Pair dataset for evaluating differential-based deepfake speech detector [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025.	cs
dc.identifier.other	164806	cs
dc.identifier.uri	http://hdl.handle.net/11012/254384
dc.language.iso	en	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	párová datová sada řeči	en
dc.subject	detekce deepfake	en
dc.subject	diferenční detekce	en
dc.subject	syntetická řeč	en
dc.subject	převod textu na řeč	en
dc.subject	konverze hlasu	en
dc.subject	vyhodnocovací datová sada	en
dc.subject	paired speech dataset	cs
dc.subject	deepfake detection	cs
dc.subject	differential detection	cs
dc.subject	synthetic speech	cs
dc.subject	text-tospeech	cs
dc.subject	voice conversion	cs
dc.subject	evaluation dataset	cs
dc.title	Pair dataset for evaluating differential-based deepfake speech detector	en
dc.title.alternative	Pair dataset for evaluating differential-based deepfake speech detector	cs
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2025-06-19	cs
dcterms.modified	2025-06-19-17:21:25	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	164806	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.08.26 23:59:43	en
sync.item.modts	2025.08.26 20:23:10	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 8.81 MB
Format:: Adobe Portable Document Format
Description:: file final-thesis.pdf

Download

Name:: review_164806.html
Size:: 12.06 KB
Format:: Hypertext Markup Language
Description:: file review_164806.html

Download

Collections

2025