Textově závislé rozpoznávání mluvčího

but.committeedoc. Dr. Ing. Jan Černocký (předseda) doc. Ing. Vladimír Janoušek, Ph.D. (místopředseda) Ing. Tomáš Martínek, Ph.D. (člen) Ing. Petr Matoušek, Ph.D., M.A. (člen) Dr. Ing. Petr Peringer (člen)cs
but.defenceStudent nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se pak seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm B. Otázky u obhajoby: Proc si myslíte, že zvyšování počtu neuronu ve fúzi výsledek spíše zhoršuje? Jakou to má to souvislost se zhoršováním výsledků při zvyšování počtu Gaussových komponent v GMM?cs
but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMatějka, Pavelcs
dc.contributor.authorFux, Jancs
dc.contributor.refereeGlembek, Ondřejcs
dc.date.accessioned2018-10-21T17:24:43Z
dc.date.available2018-10-21T17:24:43Z
dc.date.created2013cs
dc.description.abstractCílem této bakalářské práce bylo navrhnout systém pro textově závislé rozpoznávání mluvčího. Bylo otestováno několik přístupů na databázi MIT, která obsahuje nahrávky průměrné délky 0,46s. Z otestovaných přístupů se jeví jako nejlepší kombinace systému DTW s využitím odhadu posteriorních pravděpodobností fonémů (posteriogramu) jako výstupu z Fonémového rozpoznávače, a akustického SID systému založeného na iVektorech a PLDA (Probabilistic Linear Component Analysis). Fúze těchto dvou systémů pomocí Neuronové sítě dosahuje nejlepších výsledků (EER) a to 17,84% pro ženy a 16,38% pro muže, což je relativní zlepšení 49,9% u žen a 54,2% u mužů oproti samostatnému akustickému rozpoznávání.cs
dc.description.abstractThe goal of this Bachelor's thesis was to design text dependent speaker recognition system. There were few systems tested for MIT database. This database contains recordings of 0.46s average length. Best case for recognition is to use a combination of DTW system using posterior probability estimation (posteriograms) as an output of Phoneme recognizer and acoustic SID system based on iVectors and PLDA (Probabilistic Linear Component Analysis). Fusion with Neural network gives the best results (EER). These are 17.84% EER for women and 16.38% for men. It's 49.9% relative improvement for women and 54.2% for men against acoustic recognition alone.en
dc.description.markBcs
dc.identifier.citationFUX, J. Textově závislé rozpoznávání mluvčího [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. 2013.cs
dc.identifier.other79538cs
dc.identifier.urihttp://hdl.handle.net/11012/55069
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectrozpoznávání mluvčíhocs
dc.subjectDTWcs
dc.subjectfonémcs
dc.subjectneuronová síťcs
dc.subjectGMMcs
dc.subjectrozpoznávání promluvycs
dc.subjectfúzecs
dc.subjectDET křivkacs
dc.subjectEERcs
dc.subjectDCFcs
dc.subjectspeaker recognitionen
dc.subjectspeaker verificationen
dc.subjectDTWen
dc.subjectphonemeen
dc.subjectneural networken
dc.subjectGMMen
dc.subjectspeech recognitionen
dc.subjectfusionen
dc.subjectDET curveen
dc.subjectEERen
dc.subjectDCFen
dc.titleTextově závislé rozpoznávání mluvčíhocs
dc.title.alternativeText Dependent Speaker Verificationen
dc.typeTextcs
dc.type.driverbachelorThesisen
dc.type.evskpbakalářská prácecs
dcterms.dateAccepted2013-06-10cs
dcterms.modified2020-05-10-16:11:21cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid79538en
sync.item.dbtypeZPen
sync.item.insts2021.11.12 16:00:58en
sync.item.modts2021.11.12 14:59:32en
thesis.disciplineInformační technologiecs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelBakalářskýcs
thesis.nameBc.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
1.49 MB
Format:
Adobe Portable Document Format
Description:
final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_79538.html
Size:
1.44 KB
Format:
Hypertext Markup Language
Description:
review_79538.html
Collections