Modelování dynamiky prosodie pro rozpoznávání řečníka

Jančík, Zdeněk

Modelování dynamiky prosodie pro rozpoznávání řečníka

but.jazyk	čeština (Czech)
but.program	Informační technologie	cs
but.result	práce byla úspěšně obhájena	cs
dc.contributor.advisor	Matějka, Pavel	cs
dc.contributor.author	Jančík, Zdeněk	cs
dc.contributor.referee	Fapšo, Michal	cs
dc.date.created		cs
dc.description.abstract	V současných systémech pro rozpoznání mluvčího se zpravidla využívají krátkodobé akustické příznaky. Jiné příznaky se používají jen zřídka. V práci se zaměřím na prosodické příznaky získané z průběhu základního tónu a energie. Tyto příznaky modelují průběh základního tónu v jednotlivých fonémech nebo slabikách. Z literatury je známo, že systémy založené na prosodii neposkytují tak dobré výsledky jako akustické, ale spojením akustického systému a systému založeného na prosodii se dosáhne značného zlepšení výsledků. To ověřím spojením s akustickým systémem vyvinutým na VUT. Při experimentech použiji data z evaluací pořádaných Národním úřadem pro standardy a technologie (NIST).	cs
dc.description.abstract	Most current automatic speaker recognition system extract speaker-depend features by looking at short-term spectral information. This approach ignores long-term information. I explored approach that use the fundamental frequency and energy trajectories for each speaker. This approach models prosody dynamics on single fonemes or syllables. It is known from literature that prosodic systems do not work as well the acoustic one but it improve the system when fusing. I verified this assumption by fusing my results with state of the art acoustic system from BUT. Data from standard evaluation campaigns organized by National Institute of Standarts and Technology are used for all experiments.	en
dc.description.mark	A	cs
dc.identifier.citation	JANČÍK, Z. Modelování dynamiky prosodie pro rozpoznávání řečníka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .	cs
dc.identifier.other	25397	cs
dc.identifier.uri	http://hdl.handle.net/11012/53172
dc.language.iso	cs	cs
dc.publisher	Vysoké učení technické v Brně. Fakulta informačních technologií	cs
dc.rights	Standardní licenční smlouva - přístup k plnému textu bez omezení	cs
dc.subject	prosodie	cs
dc.subject	základní tón	cs
dc.subject	energie	cs
dc.subject	identifikace mluvčího	cs
dc.subject	ověření mluvčího	cs
dc.subject	rozpoznání mluvčího	cs
dc.subject	jazykový model	cs
dc.subject	bigram	cs
dc.subject	n-gram	cs
dc.subject	prosody	en
dc.subject	pitch	en
dc.subject	energy	en
dc.subject	speaker identification	en
dc.subject	speaker validation	en
dc.subject	speaker recognition	en
dc.subject	language model	en
dc.subject	bigram	en
dc.subject	n-gram	en
dc.title	Modelování dynamiky prosodie pro rozpoznávání řečníka	cs
dc.title.alternative	Modelling Prosodic Dynamics for Speaker Recognition	en
dc.type	Text	cs
dc.type.driver	masterThesis	en
dc.type.evskp	diplomová práce	cs
dcterms.modified	2020-05-09-23:40:55	cs
eprints.affiliatedInstitution.faculty	Fakulta informačních technologií	cs
sync.item.dbid	25397	en
sync.item.dbtype	ZP	en
sync.item.insts	2025.03.26 15:04:33	en
sync.item.modts	2025.01.17 10:37:49	en
thesis.discipline	Počítačová grafika a multimédia	cs
thesis.grantor	Vysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédií	cs
thesis.level	Inženýrský	cs
thesis.name	Ing.	cs

Files

Original bundle

Now showing 1 - 2 of 2

Name:: final-thesis.pdf
Size:: 579.2 KB
Format:: Adobe Portable Document Format
Description:: file final-thesis.pdf

Download

Name:: review_25397.html
Size:: 1.45 KB
Format:: Hypertext Markup Language
Description:: file review_25397.html

Download

Collections

2007