Grafické a video příznaky v rozpoznávání mluvčího
but.committee | prof. Ing. Tomáš Vojnar, Ph.D. (předseda) prof. Dr. Ing. Jan Černocký (místopředseda) doc. Ing. Ondřej Ryšavý, Ph.D. (člen) Ing. Igor Szőke, Ph.D. (člen) Ing. Václav Šátek, Ph.D. (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm " A ". Otázky u obhajoby: Uveďte a vysvětlete alespoň dva druhy normalizace skóre. Používáte UBM s 32 Gausovkami. Je to hodně nebo málo? Kolik je standardní počet pro reálný systém? V kapitole 4.2.2 uvádíte že používáte 250 mluvčích jako background sadu. Zkoušel jste jiný počet, jiný druh výběru než náhodný? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Černocký, Jan | cs |
dc.contributor.author | Fér, Radek | cs |
dc.contributor.referee | Matějka, Pavel | cs |
dc.date.created | 2012 | cs |
dc.description.abstract | Tato práce popisuje netradiční metodu rozpoznávání řečníka pomocí příznaků a alogoritmů používaných převážně v počítačovém vidění. V úvodu jsou shrnuty potřebné teoretické znalosti z oblasti počítačového rozpoznávání. Jako aplikace grafických příznaků v rozpoznávání řečníka jsou detailněji popsány již známé BBF příznaky. Tyto jsou vyhodnoceny nad standardními řečovými databázemi TIMIT a NIST SRE 2010. Experimentální výsledky jsou shrnuty a porovnány se standardními metodami. V závěru jsou jsou navrženy možné směry budoucí práce. | cs |
dc.description.abstract | We describe a non-traditional method for speaker recognition that uses features and algorithms used mainly for computer vision. Important theoretical knowledge of computer recognition is summarized first. The Boosted Binary Features are described and explored as an already proposed method, that has roots in computer vision. This method is evaluated on standard speaker recognition databases TIMIT and NIST SRE 2010. Experimental results are given and compared to standard methods. Possible directions for future work are proposed at the end. | en |
dc.description.mark | A | cs |
dc.identifier.citation | FÉR, R. Grafické a video příznaky v rozpoznávání mluvčího [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2012. | cs |
dc.identifier.other | 78918 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/55281 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | rozpoznávání mluvčího | cs |
dc.subject | Boosted Binary Features (BBF) | cs |
dc.subject | boosting | cs |
dc.subject | lokální řečové příznaky | cs |
dc.subject | speaker recognition | en |
dc.subject | Boosted Binary Features (BBF) | en |
dc.subject | boosting | en |
dc.subject | localized speech features | en |
dc.title | Grafické a video příznaky v rozpoznávání mluvčího | cs |
dc.title.alternative | Computer Graphics and Video Features for Speaker Recognition | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2012-06-14 | cs |
dcterms.modified | 2020-05-09-23:43:17 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 78918 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.18 17:55:43 | en |
sync.item.modts | 2025.01.15 20:25:10 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |