Audiovizuální rozpoznávání osoby

but.committeeprof. Dr. Ing. Jan Černocký (předseda) Ing. Ondřej Lengál, Ph.D. (člen) doc. Ing. Peter Chudý, Ph.D., MBA (člen) Ing. Radim Kocman, Ph.D. (člen) doc. Ing. Michal Bidlo, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorPlchot, Oldřichcs
dc.contributor.authorBahounek, Ondřejcs
dc.contributor.refereeMošner, Ladislavcs
dc.date.created2024cs
dc.description.abstractTahle práce se zabývá audiovizuální verifikací osoby ve videu nebo ze snímku obličeje a hlasové nahrávky. Modely využívají fúze hlasových a obličejových embeddingů. Modely přidělují váhy oběma modalitám, podle nichž kladou větší pozornost na jednu z nich. Výsledky modelů se vyznačují dobrou odolností proti poškození jedné z modalit.cs
dc.description.abstractThis work focuses on audiovisual verification of a person in a video or from a facial image and a voice recording. The models use a fusion of voice and face embeddings. The models assign weights to both modalities, allowing them to give more attention to one or the other. The results from these models demonstrate good resistance to the degradation of one of the modalities.en
dc.description.markAcs
dc.identifier.citationBAHOUNEK, O. Audiovizuální rozpoznávání osoby [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2024.cs
dc.identifier.other153223cs
dc.identifier.urihttp://hdl.handle.net/11012/247445
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectaudiovizuální verifikace osobycs
dc.subjectembeddingycs
dc.subjectrozpoznání řečníkacs
dc.subjectrozpoznání tvářecs
dc.subjectfúze modalitcs
dc.subjectfúze embeddingůcs
dc.subjectWavLMcs
dc.subjectMHFAcs
dc.subjectInception Resnetcs
dc.subjectaudivisual person verificationen
dc.subjectembeddingsen
dc.subjectspeaker recognitionen
dc.subjectface recognitionen
dc.subjectmulti-modal fusionen
dc.subjectembedding fusionen
dc.subjectWavLMen
dc.subjectMHFAen
dc.subjectInception Resneten
dc.titleAudiovizuální rozpoznávání osobycs
dc.title.alternativeAudiovisual person recognitionen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2024-06-12cs
dcterms.modified2024-06-17-08:45:55cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid153223en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 21:01:24en
sync.item.modts2025.01.17 12:06:16en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
2.24 MB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_153223.html
Size:
17.16 KB
Format:
Hypertext Markup Language
Description:
file review_153223.html
Collections