Modelování dynamiky prosodie pro rozpoznávání řečníka

but.jazykčeština (Czech)
but.programInformační technologiecs
but.resultpráce byla úspěšně obhájenacs
dc.contributor.advisorMatějka, Pavelcs
dc.contributor.authorJančík, Zdeněkcs
dc.contributor.refereeFapšo, Michalcs
dc.date.createdcs
dc.description.abstractV současných systémech pro rozpoznání mluvčího se zpravidla využívají krátkodobé akustické příznaky. Jiné příznaky se používají jen zřídka. V práci se zaměřím na prosodické příznaky získané z průběhu základního tónu a energie. Tyto příznaky modelují průběh základního tónu v jednotlivých fonémech nebo slabikách. Z literatury je známo, že systémy založené na prosodii neposkytují tak dobré výsledky jako akustické, ale spojením akustického systému a systému založeného na prosodii se dosáhne značného zlepšení výsledků. To ověřím spojením s akustickým systémem vyvinutým na VUT. Při experimentech použiji data z evaluací pořádaných Národním úřadem pro standardy a technologie (NIST).cs
dc.description.abstractMost current automatic speaker recognition system extract speaker-depend features by looking at short-term spectral information. This approach ignores long-term information. I explored approach that use the fundamental frequency and energy trajectories for each speaker. This approach models prosody dynamics on single fonemes or syllables. It is known from literature that prosodic systems do not work as well the acoustic one but it improve the system when fusing. I verified this assumption by fusing my results with state of the art acoustic system from BUT. Data from standard evaluation campaigns organized by National Institute of Standarts and Technology are used for all experiments.en
dc.description.markAcs
dc.identifier.citationJANČÍK, Z. Modelování dynamiky prosodie pro rozpoznávání řečníka [online]. Brno: Vysoké učení technické v Brně. Fakulta informačních technologií. .cs
dc.identifier.other25397cs
dc.identifier.urihttp://hdl.handle.net/11012/53172
dc.language.isocscs
dc.publisherVysoké učení technické v Brně. Fakulta informačních technologiícs
dc.rightsStandardní licenční smlouva - přístup k plnému textu bez omezenícs
dc.subjectprosodiecs
dc.subjectzákladní tóncs
dc.subjectenergiecs
dc.subjectidentifikace mluvčíhocs
dc.subjectověření mluvčíhocs
dc.subjectrozpoznání mluvčíhocs
dc.subjectjazykový modelcs
dc.subjectbigramcs
dc.subjectn-gramcs
dc.subjectprosodyen
dc.subjectpitchen
dc.subjectenergyen
dc.subjectspeaker identificationen
dc.subjectspeaker validationen
dc.subjectspeaker recognitionen
dc.subjectlanguage modelen
dc.subjectbigramen
dc.subjectn-gramen
dc.titleModelování dynamiky prosodie pro rozpoznávání řečníkacs
dc.title.alternativeModelling Prosodic Dynamics for Speaker Recognitionen
dc.typeTextcs
dc.type.drivermasterThesisen
dc.type.evskpdiplomová prácecs
dcterms.modified2020-05-09-23:40:55cs
eprints.affiliatedInstitution.facultyFakulta informačních technologiícs
sync.item.dbid25397en
sync.item.dbtypeZPen
sync.item.insts2025.03.26 15:04:33en
sync.item.modts2025.01.17 10:37:49en
thesis.disciplinePočítačová grafika a multimédiacs
thesis.grantorVysoké učení technické v Brně. Fakulta informačních technologií. Ústav počítačové grafiky a multimédiícs
thesis.levelInženýrskýcs
thesis.nameIng.cs
Files
Original bundle
Now showing 1 - 2 of 2
Loading...
Thumbnail Image
Name:
final-thesis.pdf
Size:
579.2 KB
Format:
Adobe Portable Document Format
Description:
file final-thesis.pdf
Loading...
Thumbnail Image
Name:
review_25397.html
Size:
1.45 KB
Format:
Hypertext Markup Language
Description:
file review_25397.html
Collections