Odhad obličeje z řečového signálu
but.committee | prof. Ing. Tomáš Hruška, CSc. (předseda) prof. Ing. Adam Herout, Ph.D. (místopředseda) doc. Ing. Michal Bidlo, Ph.D. (člen) Ing. František Grézl, Ph.D. (člen) Ing. Aleš Smrčka, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: S jakými nároky (i časovými) je potřeba počítat při trénování modelů pro aplikaci a jak dlouho trvá testovací fáze pro jednoho mluvčího? Kdybyste pracoval na této práci ještě rok, co by byly další kroky, kterými byste zlepšil systém? Jakou databázi jste použil? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Plchot, Oldřich | cs |
dc.contributor.author | Kyjonka, Mojmír | cs |
dc.contributor.referee | Matějka, Pavel | cs |
dc.date.created | 2021 | cs |
dc.description.abstract | Tato práce se zaobírá problematikou rekonstrukce obličeje na základě hlasu. V rámci této práce je prozkoumán současný stav této problematiky a následně je natrénován model pro generování obličeje z krátké audionahrávky. Natrénovaný model vychází z práce "Reconstructing faces from voices", jenž je založen na architektuře GAN. V této práci byly použity datasety VGGFace, VoxCeleb. Pro účely bakalářské práce byl vytvořen malý audiovizuální dataset česky mluvících osob. Práce je implementovaná pomocí skriptovacího jazyka Python s využitím knihovny PyTorch. | cs |
dc.description.abstract | This thesis deals with face reconstruction based on voice. The state of the art of this problem is investigated and model for such problem is trained. Model used in this thesis is based on the work "Reconstructing faces from voices" which architecture is based on Generative Adversarial Network (GAN). In this work, we used VGGFace and VoxCeleb datasets, and additionally, we created a small audiovisual dataset of Czech speakers. This work was implemented using the Python scripting language and PyTorch library. | en |
dc.description.mark | B | cs |
dc.identifier.citation | KYJONKA, M. Odhad obličeje z řečového signálu [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2021. | cs |
dc.identifier.other | 137601 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/201115 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | Rekonstrukce obličeje | cs |
dc.subject | Embedding | cs |
dc.subject | GAN | cs |
dc.subject | VoxCeleb | cs |
dc.subject | VGGFace | cs |
dc.subject | Normalizace obličeje | cs |
dc.subject | Face reconstruction | en |
dc.subject | Embedding | en |
dc.subject | GAN | en |
dc.subject | VoxCeleb | en |
dc.subject | VGGFace | en |
dc.subject | Face normalization | en |
dc.title | Odhad obličeje z řečového signálu | cs |
dc.title.alternative | Learning the Face Behind a Voice | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2021-08-24 | cs |
dcterms.modified | 2022-08-24-21:52:01 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 137601 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 19:38:38 | en |
sync.item.modts | 2025.01.17 09:48:25 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |
Files
Original bundle
1 - 4 of 4
Loading...
- Name:
- final-thesis.pdf
- Size:
- 6.14 MB
- Format:
- Adobe Portable Document Format
- Description:
- final-thesis.pdf
Loading...
- Name:
- Posudek-Vedouci prace-24006_v.pdf
- Size:
- 86.28 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Vedouci prace-24006_v.pdf
Loading...
- Name:
- Posudek-Oponent prace-24006_o.pdf
- Size:
- 90.48 KB
- Format:
- Adobe Portable Document Format
- Description:
- Posudek-Oponent prace-24006_o.pdf
Loading...
- Name:
- review_137601.html
- Size:
- 1.43 KB
- Format:
- Hypertext Markup Language
- Description:
- file review_137601.html