Modelování dynamiky prosodie pro rozpoznávání řečníka
but.jazyk | čeština (Czech) | |
but.program | Informační technologie | cs |
but.result | práce byla úspěšně obhájena | cs |
dc.contributor.advisor | Matějka, Pavel | cs |
dc.contributor.author | Jančík, Zdeněk | cs |
dc.contributor.referee | Fapšo, Michal | cs |
dc.date.created | cs | |
dc.description.abstract | V současných systémech pro rozpoznání mluvčího se zpravidla využívají krátkodobé akustické příznaky. Jiné příznaky se používají jen zřídka. V práci se zaměřím na prosodické příznaky získané z průběhu základního tónu a energie. Tyto příznaky modelují průběh základního tónu v jednotlivých fonémech nebo slabikách. Z literatury je známo, že systémy založené na prosodii neposkytují tak dobré výsledky jako akustické, ale spojením akustického systému a systému založeného na prosodii se dosáhne značného zlepšení výsledků. To ověřím spojením s akustickým systémem vyvinutým na VUT. Při experimentech použiji data z evaluací pořádaných Národním úřadem pro standardy a technologie (NIST). | cs |
dc.description.abstract | Most current automatic speaker recognition system extract speaker-depend features by looking at short-term spectral information. This approach ignores long-term information. I explored approach that use the fundamental frequency and energy trajectories for each speaker. This approach models prosody dynamics on single fonemes or syllables. It is known from literature that prosodic systems do not work as well the acoustic one but it improve the system when fusing. I verified this assumption by fusing my results with state of the art acoustic system from BUT. Data from standard evaluation campaigns organized by National Institute of Standarts and Technology are used for all experiments. | en |
dc.description.mark | A | cs |
dc.identifier.citation | JANČÍK, Z. Modelování dynamiky prosodie pro rozpoznávání řečníka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. . | cs |
dc.identifier.other | 25397 | cs |
dc.identifier.uri | http://hdl.handle.net/11012/53172 | |
dc.language.iso | cs | cs |
dc.publisher | Vysoké učení technické v Brně. Fakulta informačních technologií | cs |
dc.rights | Standardní licenční smlouva - přístup k plnému textu bez omezení | cs |
dc.subject | prosodie | cs |
dc.subject | základní tón | cs |
dc.subject | energie | cs |
dc.subject | identifikace mluvčího | cs |
dc.subject | ověření mluvčího | cs |
dc.subject | rozpoznání mluvčího | cs |
dc.subject | jazykový model | cs |
dc.subject | bigram | cs |
dc.subject | n-gram | cs |
dc.subject | prosody | en |
dc.subject | pitch | en |
dc.subject | energy | en |
dc.subject | speaker identification | en |
dc.subject | speaker validation | en |
dc.subject | speaker recognition | en |
dc.subject | language model | en |
dc.subject | bigram | en |
dc.subject | n-gram | en |
dc.title | Modelování dynamiky prosodie pro rozpoznávání řečníka | cs |
dc.title.alternative | Modelling Prosodic Dynamics for Speaker Recognition | en |
dc.type | Text | cs |
dc.type.driver | masterThesis | en |
dc.type.evskp | diplomová práce | cs |
dcterms.modified | 2020-05-09-23:40:55 | cs |
eprints.affiliatedInstitution.faculty | Fakulta informačních technologií | cs |
sync.item.dbid | 25397 | en |
sync.item.dbtype | ZP | en |
sync.item.insts | 2025.03.26 15:04:33 | en |
sync.item.modts | 2025.01.17 10:37:49 | en |
thesis.discipline | Počítačová grafika a multimédia | cs |
thesis.grantor | Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií | cs |
thesis.level | Inženýrský | cs |
thesis.name | Ing. | cs |