Odhad obličeje z řečového signálu

but.committeeprof. Ing. Tomáš Hruška, CSc. (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: S jakými nároky (i časovými) je potřeba počítat při trénování modelů pro aplikaci a jak dlouho trvá testovací fáze pro jednoho mluvčího? Kdybyste pracoval na této práci ještě rok, co by byly další kroky, kterými byste zlepšil systém? Jakou databázi jste použil?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorPlchot, Oldřichcs
dc.contributor.authorKyjonka, Mojmírcs
dc.contributor.refereeMatějka, Pavelcs
dc.date.created2021cs
dc.description.abstractTato práce se zaobírá problematikou rekonstrukce obličeje na základě hlasu. V rámci této práce je prozkoumán současný stav této problematiky a následně je natrénován model pro generování obličeje z krátké audionahrávky. Natrénovaný model vychází z práce "Reconstructing faces from voices", jenž je založen na architektuře GAN. V této práci byly použity datasety VGGFace, VoxCeleb. Pro účely bakalářské práce byl vytvořen malý audiovizuální dataset česky mluvících osob. Práce je implementovaná pomocí skriptovacího jazyka Python s využitím knihovny PyTorch.cs
dc.description.abstractThis thesis deals with face reconstruction based on voice. The state of the art of this problem is investigated and model for such problem is trained. Model used in this thesis is based on the work "Reconstructing faces from voices" which architecture is based on Generative Adversarial Network (GAN). In this work, we used VGGFace and VoxCeleb datasets, and additionally, we created a small audiovisual dataset of Czech speakers. This work was implemented using the Python scripting language and PyTorch library.en
dc.description.markBcs
dc.identifier.citationKYJONKA, M. Odhad obličeje z řečového signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021.cs
dc.identifier.other137601cs
dc.identifier.urihttp://hdl.handle.net/11012/201115
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectRekonstrukce obličejecs
dc.subjectEmbeddingcs
dc.subjectGANcs
dc.subjectVoxCelebcs
dc.subjectVGGFacecs
dc.subjectNormalizace obličejecs
dc.subjectFace reconstructionen
dc.subjectEmbeddingen
dc.subjectGANen
dc.subjectVoxCeleben
dc.subjectVGGFaceen
dc.subjectFace normalizationen
dc.titleOdhad obličeje z řečového signálucs
dc.title.alternativeLearning the Face Behind a Voiceen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2021-08-24cs
dcterms.modified2022-08-24-21:52:01cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid137601en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 19:38:38en
sync.item.modts2025.01.17 09:48:25en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 4 of 4
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
6.14 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
Posudek-Vedouci prace-24006_v.pdf
Size:
86.28 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Vedouci prace-24006_v.pdf
Loading...
Thumbnail Image
Name:
Posudek-Oponent prace-24006_o.pdf
Size:
90.48 KB
Format:
Adobe Portable Document Format
Description:
Posudek-Oponent prace-24006_o.pdf
Loading...
Thumbnail Image
Name:
review_137601.html
Size:
1.43 KB
Format:
Hypertext Markup Language
Description:
file review_137601.html
Collections