Metody tvorby hlasových deepfakes v reálném čase

Alakaev, Kambulat

Metody tvorby hlasových deepfakes v reálném čase

but.committee	doc. Ing. Ondřej Ryšavý, Ph.D. (předseda) Ing. Tomáš Milet, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) Ing. Matěj Grégr, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen)	cs
but.defence	Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. (Jaké jsou problémy s fungováním v reálném čase.) Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.	cs
but.jazyk	angličtina (English)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Malinka, Kamil	en
dc.contributor.author	Alakaev, Kambulat	en
dc.contributor.referee	Pleško, Filip	en
dc.date.created	2024	cs
dc.description.abstract	Tato práce zkoumá možnosti generování hlasových deepfake v reálném čase pomocí nástrojů s otevřeným zdrojovým kódem. Experimenty bylo zjištěno, že rychlost generování hlasových deepfakes je ovlivněna výpočetním výkonem zařízení, na kterých jsou nástroje pro tvorbu řeči spuštěny. Byl identifikován model hlubokého učení, který je schopen generovat řeč téměř v reálném čase. Omezení nástroje obsahujícího tento model však bránila kontinuálnímu zadávání vstupních dat pro generování v reálném čase. K řešení tohoto problému byl vyvinut program, který tato omezení překonává. Kvalita generovaných deepfakes byla hodnocena jak pomocí modelů pro detekci hlasových deepfake, tak pomocí online průzkumů na lidech. Výsledky ukázaly, že zatímco model dokázal oklamat detekční modely, nebyl úspěšný při oklamání lidí. Tento výzkum upozorňuje na dostupnost nástrojů pro syntézu hlasu s otevřeným zdrojovým kódem a na možnost jejich zneužití jednotlivci k podvodným účelům.	en
dc.description.abstract	This thesis explores the possibility of achieving real-time voice deepfake generation using open-source tools. Through experiments, it was discovered that the generation rate of voice deepfakes is affected by the computing power of the devices running the speech creation tools. A deep learning model was identified to be capable of generating speech in near real time. However, limitations in the tool containing this model prevented continuous input data for real-time generation. To address this, a program was developed to overcome these limitations. The quality of the generated deepfakes was evaluated using both voice deepfake detection models and human online surveys. The results revealed that while the model could deceive detection models, it was not successful in fooling humans. This research highlights the accessibility of open-source voice synthesis tools and the potential for their misuse by individuals for fraudulent purposes.	cs
dc.description.mark	B	cs
dc.identifier.citation	ALAKAEV, K. Metody tvorby hlasových deepfakes v reálném čase [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.	cs
dc.identifier.other	154458	cs
dc.identifier.uri	http://hdl.handle.net/11012/247469
dc.language.iso	en	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	deepfakes	en
dc.subject	hlasové deepfakes	en
dc.subject	biometrické systémy	en
dc.subject	syntéza hlasu v reálném čase	en
dc.subject	syntetická řeč	en
dc.subject	hluboké učení	en
dc.subject	kybernetická bezpečnost	en
dc.subject	převod textu na řeč	en
dc.subject	konverze hlasu	en
dc.subject	open-source deepfake nástroje	en
dc.subject	detekce hlasového deepfake	en
dc.subject	deepfakes	cs
dc.subject	voice deepfakes	cs
dc.subject	biometric systems	cs
dc.subject	realtime voice synthesis	cs
dc.subject	synthetic speech	cs
dc.subject	deep learning	cs
dc.subject	cybersecurity	cs
dc.subject	text-to-speech	cs
dc.subject	voice conversion	cs
dc.subject	open-source deepfake tools	cs
dc.subject	voice deepfake detection	cs
dc.title	Metody tvorby hlasových deepfakes v reálném čase	en
dc.title.alternative	Methods for Realtime Voice Deepfakes Creation	cs
dc.type	Text	cs
dc.type.driver	bachelorThesis	en
dc.type.evskp	bakalářská práce	cs
dcterms.dateAccepted	2024-06-12	cs
dcterms.modified	2024-06-17-08:45:41	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	154458	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.18 21:01:29	en
sync.item.modts	2025.01.15 23:08:55	en
thesis.discipline	Informační technologie	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémů	cs
thesis.level	Bakalářský	cs
thesis.name	Bc.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 1.11 MB
Format:: Adobe Portable Document Format
Description:: file final-thesis.pdf

Download

Name:: review_154458.html
Size:: 9.25 KB
Format:: Hypertext Markup Language
Description:: file review_154458.html

Download

Collections

2024