Metody tvorby hlasových deepfakes v reálném čase

but.committeedoc. Ing. Ondřej Ryšavý, Ph.D. (předseda) Ing. Tomáš Milet, Ph.D. (člen) Ing. Josef Strnadel, Ph.D. (člen) Ing. Matěj Grégr, Ph.D. (člen) Ing. Filip Orság, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. (Jaké jsou problémy s fungováním v reálném čase.) Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B.cs
but.jazykangličtina (English)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMalinka, Kamilen
dc.contributor.authorAlakaev, Kambulaten
dc.contributor.refereePleško, Filipen
dc.date.created2024cs
dc.description.abstractTato práce zkoumá možnosti generování hlasových deepfake v reálném čase pomocí nástrojů s otevřeným zdrojovým kódem. Experimenty bylo zjištěno, že rychlost generování hlasových deepfakes je ovlivněna výpočetním výkonem zařízení, na kterých jsou nástroje pro tvorbu řeči spuštěny. Byl identifikován model hlubokého učení, který je schopen generovat řeč téměř v reálném čase. Omezení nástroje obsahujícího tento model však bránila kontinuálnímu zadávání vstupních dat pro generování v reálném čase. K řešení tohoto problému byl vyvinut program, který tato omezení překonává. Kvalita generovaných deepfakes byla hodnocena jak pomocí modelů pro detekci hlasových deepfake, tak pomocí online průzkumů na lidech. Výsledky ukázaly, že zatímco model dokázal oklamat detekční modely, nebyl úspěšný při oklamání lidí. Tento výzkum upozorňuje na dostupnost nástrojů pro syntézu hlasu s otevřeným zdrojovým kódem a na možnost jejich zneužití jednotlivci k podvodným účelům.en
dc.description.abstractThis thesis explores the possibility of achieving real-time voice deepfake generation using open-source tools. Through experiments, it was discovered that the generation rate of voice deepfakes is affected by the computing power of the devices running the speech creation tools. A deep learning model was identified to be capable of generating speech in near real time. However, limitations in the tool containing this model prevented continuous input data for real-time generation. To address this, a program was developed to overcome these limitations. The quality of the generated deepfakes was evaluated using both voice deepfake detection models and human online surveys. The results revealed that while the model could deceive detection models, it was not successful in fooling humans. This research highlights the accessibility of open-source voice synthesis tools and the potential for their misuse by individuals for fraudulent purposes.cs
dc.description.markBcs
dc.identifier.citationALAKAEV, K. Metody tvorby hlasových deepfakes v reálném čase [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.cs
dc.identifier.other154458cs
dc.identifier.urihttp://hdl.handle.net/11012/247469
dc.language.isoencs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectdeepfakesen
dc.subjecthlasové deepfakesen
dc.subjectbiometrické systémyen
dc.subjectsyntéza hlasu v reálném časeen
dc.subjectsyntetická řečen
dc.subjecthluboké učeníen
dc.subjectkybernetická bezpečnosten
dc.subjectpřevod textu na řečen
dc.subjectkonverze hlasuen
dc.subjectopen-source deepfake nástrojeen
dc.subjectdetekce hlasového deepfakeen
dc.subjectdeepfakescs
dc.subjectvoice deepfakescs
dc.subjectbiometric systemscs
dc.subjectrealtime voice synthesiscs
dc.subjectsynthetic speechcs
dc.subjectdeep learningcs
dc.subjectcybersecuritycs
dc.subjecttext-to-speechcs
dc.subjectvoice conversioncs
dc.subjectopen-source deepfake toolscs
dc.subjectvoice deepfake detectioncs
dc.titleMetody tvorby hlasových deepfakes v reálném časeen
dc.title.alternativeMethods for Realtime Voice Deepfakes Creationcs
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2024-06-12cs
dcterms.modified2024-06-17-08:45:41cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid154458en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 21:01:29en
sync.item.modts2025.01.15 23:08:55en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav inteligentních systémůcs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.11 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_154458.html
Size:
9.25 KB
Format:
Hypertext Markup Language
Description:
file review_154458.html
Collections