Segmentace mluvčích s využitím statistických metod klasifikace

Loading...
Thumbnail Image

Date

Authors

Adamský, Aleš

Mark

A

Journal Title

Journal ISSN

Volume Title

Publisher

Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií

ORCID

Abstract

V práci sú podrobne vysvetlené a rozobraté pojmy reč a prozódia, ktoré predstavujú teoretické východiská pre segmentáciu hovoriacich. Rovnako je opísaný multimediálny anotačný nástroj Elan, použitý pre značkovanie databázy. Teoretická časť ďalej zdôrazňuje príznaky často používané pre spracovanie reči ako MFCC, PLP a LPC. Zaoberá sa najpopulárnejšími metódami segmentácie hovoriacich, z ktorých niektoré i popisuje. Praktická časť sa venuje implementácií metódy Bayesovho informačného kritéria do systému pre automatickú segmentáciu hovoriacich. Pre automatickú segmentáciu hovoriacich boli postupne použité viaceré príznaky. Výsledky testov boli vyhodnotené grafickou metódou ROC a jej kvantitatívnymi parametrami. Ako najvhodnejšie pre segmentáciu hovoriacich boli stanovené príznaky MFCC a HFCC.
The thesis discusses in detail some concepts of speech and prosody that can contribute to build a speech corpus for the speaker segmentation purpose. Moreover, the Elan multimedia annotator used for labeling is described. The theoretical part highlights some frequently used speech features such as MFCC, PLP and LPC and deals with currently most popular speech segmentation methods. Some classification algorithms are also mentioned. The practical part describes implementation of Bayesian information criterium algorithm in system for automatic speaker segmentation. For classification of speaker change point in speech, were used different speech features. The results of tests were evaluated by the graphic method of receiver operating characteristic (ROC) and his quantitative indices. As the best speech features for this system were provided MFCC and HFCC.

Description

Citation

ADAMSKÝ, A. Segmentace mluvčích s využitím statistických metod klasifikace [online]. Brno: Vysoké učení technické v Brně. Fakulta elektrotechniky a komunikačních technologií. 2011.

Document type

Document version

Date of access to the full text

Language of document

sk

Study field

Telekomunikační a informační technika

Comittee

prof. Ing. Zdeněk Smékal, CSc. (předseda) Ing. Robert Vích, DrSc. (místopředseda) doc. Ing. Otto Dostál, CSc. (člen) Ing. Jaromír Hrad, Ph.D. (člen) Ing. Jan Karásek, Ph.D. (člen) Ing. Hicham Atassi, Ph.D. (člen) Ing. Peter Stančík (člen)

Date of acceptance

2011-06-08

Defence

Vysvětlete pojem vzálenost od bodu [0,1] a jeho vliv na segmentaci signálu. - Pojem byl vysvětlen pomocí vzorce. Existuje vzájemná vazba mezi chybně segmentovanými úseky řeči napříč použitými příznaky? Jaký byl použit vzorkovací kmitočet?

Result of defence

práce byla úspěšně obhájena

DOI

Collections

Endorsement

Review

Supplemented By

Referenced By

Citace PRO