Grafické a video příznaky v rozpoznávání mluvčího

but.committeeprof. Ing. Tomáš Vojnar, Ph.D. (předseda) prof. Dr. Ing. Jan Černocký (místopředseda) doc. Ing. Ondřej Ryšavý, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) Ing. Václav Šátek, Ph.D. (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: Uveďte a vysvětlete alespoň dva druhy normalizace skóre. Používáte UBM s 32 Gausovkami. Je to hodně nebo málo? Kolik je standardní počet pro reálný systém? V kapitole 4.2.2 uvádíte že používáte 250 mluvčích jako background sadu. Zkoušel jste jiný počet, jiný druh výběru než náhodný?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorČernocký, Jancs
dc.contributor.authorFér, Radekcs
dc.contributor.refereeMatějka, Pavelcs
dc.date.created2012cs
dc.description.abstractTato práce popisuje netradiční metodu rozpoznávání řečníka pomocí příznaků a alogoritmů používaných převážně v počítačovém vidění. V úvodu jsou shrnuty potřebné teoretické znalosti z oblasti počítačového rozpoznávání. Jako aplikace grafických příznaků v rozpoznávání řečníka jsou detailněji popsány již známé BBF příznaky. Tyto jsou vyhodnoceny nad standardními řečovými databázemi TIMIT a NIST SRE 2010. Experimentální výsledky jsou shrnuty a porovnány se standardními metodami. V závěru jsou jsou navrženy možné směry budoucí práce.cs
dc.description.abstractWe describe a non-traditional method for speaker recognition that uses features and algorithms used mainly for computer vision. Important theoretical knowledge of computer recognition is summarized first. The Boosted Binary Features are described and explored as an already proposed method, that has roots in computer vision. This method is evaluated on standard speaker recognition databases TIMIT and NIST SRE 2010. Experimental results are given and compared to standard methods. Possible directions for future work are proposed at the end.en
dc.description.markAcs
dc.identifier.citationFÉR, R. Grafické a video příznaky v rozpoznávání mluvčího [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012.cs
dc.identifier.other78918cs
dc.identifier.urihttp://hdl.handle.net/11012/55281
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávání mluvčíhocs
dc.subjectBoosted Binary Features (BBF)cs
dc.subjectboostingcs
dc.subjectlokální řečové příznakycs
dc.subjectspeaker recognitionen
dc.subjectBoosted Binary Features (BBF)en
dc.subjectboostingen
dc.subjectlocalized speech featuresen
dc.titleGrafické a video příznaky v rozpoznávání mluvčíhocs
dc.title.alternativeComputer Graphics and Video Features for Speaker Recognitionen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2012-06-14cs
dcterms.modified2020-05-09-23:43:17cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid78918en
sync.item.dbtypeZPen
sync.item.insts2025.03.18 17:55:43en
sync.item.modts2025.01.15 20:25:10en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
709.59 KB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_78918.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_78918.html
Collections