Textově závislé rozpoznávání mluvčího
but.committee | doc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen) Dr. Ing. Petr Peringer (člen) | cs |
but.defence | Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Proc si myslíte, že zvyšování počtu neuronu ve fúzi výsledek spíše zhoršuje? Jakou to má to souvislost se zhoršováním výsledků při zvyšování počtu Gaussových komponent v GMM? | cs |
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Matějka, Pavel | cs |
dc.contributor.author | Fux, Jan | cs |
dc.contributor.referee | Glembek, Ondřej | cs |
dc.date.accessioned | 2018-10-21T17:24:43Z | |
dc.date.available | 2018-10-21T17:24:43Z | |
dc.date.created | 2013 | cs |
dc.description.abstract | Cílem této bakalářské práce bylo navrhnout systém pro textově závislé rozpoznávání mluvčího. Bylo otestováno několik přístupů na databázi MIT, která obsahuje nahrávky průměrné délky 0,46s. Z otestovaných přístupů se jeví jako nejlepší kombinace systému DTW s využitím odhadu posteriorních pravděpodobností fonémů (posteriogramu) jako výstupu z Fonémového rozpoznávače, a akustického SID systému založeného na iVektorech a PLDA (Probabilistic Linear Component Analysis). Fúze těchto dvou systémů pomocí Neuronové sítě dosahuje nejlepších výsledků (EER) a to 17,84% pro ženy a 16,38% pro muže, což je relativní zlepšení 49,9% u žen a 54,2% u mužů oproti samostatnému akustickému rozpoznávání. | cs |
dc.description.abstract | The goal of this Bachelor's thesis was to design text dependent speaker recognition system. There were few systems tested for MIT database. This database contains recordings of 0.46s average length. Best case for recognition is to use a combination of DTW system using posterior probability estimation (posteriograms) as an output of Phoneme recognizer and acoustic SID system based on iVectors and PLDA (Probabilistic Linear Component Analysis). Fusion with Neural network gives the best results (EER). These are 17.84% EER for women and 16.38% for men. It's 49.9% relative improvement for women and 54.2% for men against acoustic recognition alone. | en |
dc.description.mark | B | cs |
dc.identifier.citation | FUX, J. Textově závislé rozpoznávání mluvčího [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013. | cs |
dc.identifier.other | 79538 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/55069 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | rozpoznávání mluvčího | cs |
dc.subject | DTW | cs |
dc.subject | foném | cs |
dc.subject | neuronová síť | cs |
dc.subject | GMM | cs |
dc.subject | rozpoznávání promluvy | cs |
dc.subject | fúze | cs |
dc.subject | DET křivka | cs |
dc.subject | EER | cs |
dc.subject | DCF | cs |
dc.subject | speaker recognition | en |
dc.subject | speaker verification | en |
dc.subject | DTW | en |
dc.subject | phoneme | en |
dc.subject | neural network | en |
dc.subject | GMM | en |
dc.subject | speech recognition | en |
dc.subject | fusion | en |
dc.subject | DET curve | en |
dc.subject | EER | en |
dc.subject | DCF | en |
dc.title | Textově závislé rozpoznávání mluvčího | cs |
dc.title.alternative | Text Dependent Speaker Verification | en |
dc.type | Text | cs |
dc.type.driver | bachelorThesis | en |
dc.type.evskp | bakalářská práce | cs |
dcterms.dateAccepted | 2013-06-10 | cs |
dcterms.modified | 2020-05-10-16:11:21 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 79538 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2021.11.12 16:00:58 | en |
sync.item.modts | 2021.11.12 14:59:32 | en |
thesis.discipline | Informační technologie | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Bakalářský | cs |
thesis.name | Bc. | cs |