Audiovizuální rozpoznávání osoby
but.committee | prof. Dr. Ing. Jan Černocký (předseda) Ing. Ondřej Lengál, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) Ing. Radim Kocman, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A. | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Plchot, Oldřich | cs |
dc.contributor.author | Bahounek, Ondřej | cs |
dc.contributor.referee | Mošner, Ladislav | cs |
dc.date.created | 2024 | cs |
dc.description.abstract | Tahle práce se zabývá audiovizuální verifikací osoby ve videu nebo ze snímku obličeje a hlasové nahrávky. Modely využívají fúze hlasových a obličejových embeddingů. Modely přidělují váhy oběma modalitám, podle nichž kladou větší pozornost na jednu z nich. Výsledky modelů se vyznačují dobrou odolností proti poškození jedné z modalit. | cs |
dc.description.abstract | This work focuses on audiovisual verification of a person in a video or from a facial image and a voice recording. The models use a fusion of voice and face embeddings. The models assign weights to both modalities, allowing them to give more attention to one or the other. The results from these models demonstrate good resistance to the degradation of one of the modalities. | en |
dc.description.mark | A | cs |
dc.identifier.citation | BAHOUNEK, O. Audiovizuální rozpoznávání osoby [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024. | cs |
dc.identifier.other | 153223 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/247445 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | audiovizuální verifikace osoby | cs |
dc.subject | embeddingy | cs |
dc.subject | rozpoznání řečníka | cs |
dc.subject | rozpoznání tváře | cs |
dc.subject | fúze modalit | cs |
dc.subject | fúze embeddingů | cs |
dc.subject | WavLM | cs |
dc.subject | MHFA | cs |
dc.subject | Inception Resnet | cs |
dc.subject | audivisual person verification | en |
dc.subject | embeddings | en |
dc.subject | speaker recognition | en |
dc.subject | face recognition | en |
dc.subject | multi-modal fusion | en |
dc.subject | embedding fusion | en |
dc.subject | WavLM | en |
dc.subject | MHFA | en |
dc.subject | Inception Resnet | en |
dc.title | Audiovizuální rozpoznávání osoby | cs |
dc.title.alternative | Audiovisual person recognition | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2024-06-12 | cs |
dcterms.modified | 2024-06-17-08:45:55 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 153223 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 21:01:24 | en |
sync.item.modts | 2025.01.17 12:06:16 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |