Vyhodnocení kvality a dostupnosti zdrojů lidské řeči pro tvorbu deepfakes

Frič, Michal

Vyhodnocení kvality a dostupnosti zdrojů lidské řeči pro tvorbu deepfakes

but.committee	doc. Dr. Ing. Otto Fučík (předseda) Mgr. Kamil Malinka, Ph.D. (člen) Ing. Vojtěch Mrázek, Ph.D. (člen) Ing. Libor Polčák, Ph.D. (člen) Ing. David Bařina, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.	cs
but.jazyk	angličtina (English)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Firc, Anton	en
dc.contributor.author	Frič, Michal	en
dc.contributor.referee	Malinka, Kamil	en
dc.date.created	2024	cs
dc.description.abstract	Hlasové deepfaky, posúvané rýchlym vývojom v oblasti umelej inteligencie a strojového učenia, predstavujú technológiu s dvojitým potenciálom, prinášajúcu významné prínosy aj riziká. Tieto syntetické hlasové výstupy sú čím ďalej, tým viac realistické, a to vďaka jednoduchému prístupu k rozsiahlym množstvám ľudskej reči z rôznych zdrojov. Táto práca skúma vhodnosť týchto zdrojov pre tvorbu hlasových deepfakov. Identifikovali sme a hodnotili sme viaceré zdroje reči a vypracovali sme metodológie na posudzovanie ich kvality, dostupnosti, diverzity a frekvencie aktualizácií obsahu. Hodnotenie zahŕňalo aj analýzu vplyvu charakteristík zdrojov na kvalitu deepfakov a efektívnosť detekcie softvérom aj ľudskými hodnotiteľmi. Zistenia ukazujú, že všetky identifikované zdroje sú schopné poskytnúť dostatočne kvalitné nahrávky pre vytvorenie kvalitných, často nerozpoznateľných deepfakov. Súčasne poukazujú na konkrétne silné a slabé stránky (merané vlastnosti) jednotlivých zdrojov. Pri testovaní bola objavená anomália v detekčnom softvéri, ktorá umožňuje upraviť deepfaky tak, aby sa vyhli detekcii. Navyše bolo zistené, že menej ako 10 sekúnd ľudskej reči môže stačiť na vytvorenie kvalitného deepfaku, pričom dĺžka a kvalita vstupných nahrávok sú priamo spojené s kvalitou deepfaku.	en
dc.description.abstract	Voice deepfakes, powered by rapid advancements in artificial intelligence and machine learning, represent a dual-edge technology with significant benefits and risks. These synthetic voice outputs are increasingly realistic due to the easy access to vast amounts of digital speech data from various sources. This thesis analyses these sources’ suitability for creating convincing deepfakes. We identified and evaluated numerous speech sources and developed methodologies for assessing their quality, accessibility, diversity, and update frequency. The evaluation extended to analyzing the impact of source characteristics on deepfake quality and the effectiveness of detection by software and human evaluators. Findings indicate that all identified sources can provide sufficiently high-quality recordings to create high-quality deepfakes, often indistinguishable. Additionally, they highlight each source’s particular strengths and weaknesses (measured properties) grade. An anomaly in detection software was discovered, allowing deepfakes to be modified to evade detection. Furthermore, less than 10 seconds of human speech could suffice to create a high-quality deepfake, directly correlating the length and quality of input recordings to the fidelity of the output. The thesis concludes with a discussion of the risks associated with these sources and proposes measures for prevention and mitigation.	cs
dc.description.mark	A	cs
dc.identifier.citation	FRIČ, M. Vyhodnocení kvality a dostupnosti zdrojů lidské řeči pro tvorbu deepfakes [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.	cs
dc.identifier.other	150738	cs
dc.identifier.uri	http://hdl.handle.net/11012/248192
dc.language.iso	en	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	hlasové deepfakes	en
dc.subject	syntéza reči	en
dc.subject	strojové učenie	en
dc.subject	kvalita reči	en
dc.subject	získavanie reči	en
dc.subject	voice deepfakes	cs
dc.subject	voice synthesis	cs
dc.subject	machine learning	cs
dc.subject	speech quality	cs
dc.subject	speech obtaining	cs
dc.title	Vyhodnocení kvality a dostupnosti zdrojů lidské řeči pro tvorbu deepfakes	en
dc.title.alternative	Evaluation of Sources of Human Speech for Deepfake Creation	cs
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2024-06-14	cs
dcterms.modified	2024-06-17-08:45:25	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	150738	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.18 21:01:54	en
sync.item.modts	2025.01.15 11:32:37	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 1.89 MB
Format:: Adobe Portable Document Format
Description:: file final-thesis.pdf

Download

Name:: review_150738.html
Size:: 10.75 KB
Format:: Hypertext Markup Language
Description:: file review_150738.html

Download

Collections

2024