Pair dataset for evaluating differential-based deepfake speech detector
| but.committee | doc. Ing. Petr Matoušek, Ph.D., M.A. (předseda) Ing. Bohuslav Křena, Ph.D. (člen) Ing. Jan Pluskal, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Jiří Matoušek, Ph.D. (člen) | cs |
| but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. | cs |
| but.jazyk | angličtina (English) | |
| but.program | Informační technologie | cs |
| but.result | práce byla úspěšně obhájena | cs |
| dc.contributor.advisor | Staněk, Vojtěch | en |
| dc.contributor.author | Prokeš, Lukáš | en |
| dc.contributor.referee | Zhang, Lin | en |
| dc.date.created | 2025 | cs |
| dc.description.abstract | Tato práce se zabývá rostoucí výzvou v oblasti detekce deepfake řeči prostřednictvím návrhu datové sady přizpůsobené diferenčním detekčním metodám, které porovnávají testovanou nahrávku s důvěryhodnou referenční nahrávkou téhož řečníka. Hlavním cílem je zjistit, zda použití párových nahrávek se shodným mluveným obsahem zlepšuje výkonnost detekce. Za tímto účelem byla vytvořena párová datová sada obsahující více než 100 000 nahrávek ve čtyřech jazycích od téměř 200 řečníků. Každá falešná nahrávka je spárována s reálnou nahrávkou téhož řečníka se stejným mluveným obsahem. Bylo vyhodnoceno několik detekčních systémů, včetně konvenčních modelů s jedním vstupem a diferenčních modelů. Výsledky ukazují, že diferenční detekce obecně překonává jednovstupové přístupy, zatímco shoda obsahu vede pouze k mírnému zlepšení, což naznačuje, že diferenční modely dobře generalizují i na nahrávkách s rozdílným mluveným obsahem stejného řečníka. | en |
| dc.description.abstract | This thesis addresses the growing challenge of detecting speech deepfakes by proposing a dataset tailored to differential detection methods, which compare a test utterance with a trusted reference from the same speaker. The main objective is to determine whether using reference–test pairs with identical spoken content improves detection performance. To support this, a pair dataset was created, containing over 100,000 utterances across four languages and nearly 200 speakers. Each fake sample is paired with a real utterance from the same speaker and with identical spoken content. Several detection systems, including both traditional single-input and differential models, were evaluated. Results show that differential detection generally outperforms single-input baselines, while content alignment leads to only a modest improvement, indicating that differential models generalize well across utterances with different spoken content from the same speaker. | cs |
| dc.description.mark | B | cs |
| dc.identifier.citation | PROKEŠ, L. Pair dataset for evaluating differential-based deepfake speech detector [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2025. | cs |
| dc.identifier.other | 164806 | cs |
| dc.identifier.uri | http://hdl.handle.net/11012/254384 | |
| dc.language.iso | en | cs |
| dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
| dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
| dc.subject | párová datová sada řeči | en |
| dc.subject | detekce deepfake | en |
| dc.subject | diferenční detekce | en |
| dc.subject | syntetická řeč | en |
| dc.subject | převod textu na řeč | en |
| dc.subject | konverze hlasu | en |
| dc.subject | vyhodnocovací datová sada | en |
| dc.subject | paired speech dataset | cs |
| dc.subject | deepfake detection | cs |
| dc.subject | differential detection | cs |
| dc.subject | synthetic speech | cs |
| dc.subject | text-tospeech | cs |
| dc.subject | voice conversion | cs |
| dc.subject | evaluation dataset | cs |
| dc.title | Pair dataset for evaluating differential-based deepfake speech detector | en |
| dc.title.alternative | Pair dataset for evaluating differential-based deepfake speech detector | cs |
| dc.type | Text | cs |
| dc.type.driver | bachelorThesis | en |
| dc.type.evskp | bakalářská práce | cs |
| dcterms.dateAccepted | 2025-06-19 | cs |
| dcterms.modified | 2025-06-19-17:21:25 | cs |
| eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
| sync.item.dbid | 164806 | en |
| sync.item.dbtype | ZP | en |
| sync.item.insts | 2025.08.26 23:59:43 | en |
| sync.item.modts | 2025.08.26 20:23:10 | en |
| thesis.discipline | Informační technologie | cs |
| thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů | cs |
| thesis.level | Bakalářský | cs |
| thesis.name | Bc. | cs |
